期刊名称:Revista Brasileira de Informática na Educação
印刷版ISSN:1414-5685
出版年度:2015
卷号:23
期号:3
页码:1
DOI:10.5753/rbie.2015.23.03.1
语种:Portuguese
出版社:Revista Brasileira de Informática na Educação
摘要:As altas taxas de reprovação e evasão de estudantes são frequentemente apontadas como dois dos principais obstáculos enfrentados na implementação e consolidação de cursos de Educação a Distância. A identificação com antecedência de estudantes em risco pode auxiliar de maneira decisiva o trabalho de professores e tutores que teriam a oportunidade de fornecer assistência personalizada a esses acadêmicos antes dos mesmos reprovarem ou evadirem de seus cursos. O presente trabalho descreve resultados da aplicação de técnicas de aprendizado de máquina nesta tarefa, utilizando como atributos unicamente contagens de interações. Os experimentos realizados demonstraram a viabilidade de utilizar apenas a quantidade de interações dos alunos para gerar predições razoavelmente precisas e que a introdução de atributos derivados das contagens (e.g. médias) é útil para previsões mais precisas quando a quantidade de dados é esparsa. Ainda, demonstrou-se também que as redes bayesianas se mostraram o modelo mais adequado entre os modelos testados e que é possível treinar o modelo utilizando diferentes fontes de exemplos, como entre turmas e entre semestres diferentes. A abordagem apresentada aqui é aplicável virtualmente a qualquer situação onde é possível contar interações de qualquer tipo, uma vez que não utiliza atributos específicos relacionados aos tipos de interação
其他摘要:The high students' failure and dropout rates are often pointed as two of the main obstacles for the implementation and consolidation of Distance Learning courses. The early identification of at risk students can decisively aid teachers and assistants. The present work describes results of the application of machine learning techniques to perform this task using only the count of interactions as attributes. The experiments demonstrated the feasibility of using only the counts of students interaction to generate reasonably accurate predictions, and that introducing attributes derived from the counts (e.g. means) is useful for more accurate predictions when data is sparse. Moreover, it was also demonstrated that Bayesian networks are adequate for the problem and that it is possible to train models in different sources of examples, such as between different groups and semesters. The present approach is virtually applicable in any scenario where it is possible to count interactions of any kind.
关键词:Predição de Evasão;Educação a Distância;Mineração de Dados;Machine learning;Predicting at-risk students;Distance Learning;Educational Data Mining