Trabalhando com modelo
LarLar > Notícias > Trabalhando com modelo

Trabalhando com modelo

Jul 21, 2023

Monodeep Mukherjee

Seguir

--

Ouvir

Compartilhar

Autor: Luca Scrucca, Mohammed Saqr, Sonsoles López-Pernas, Keefe Murphy

Resumo: A heterogeneidade tem sido um tema quente na literatura educacional recente. Vários apelos foram feitos para a adoção de métodos que capturem diferentes padrões ou subgrupos no comportamento ou funcionamento dos alunos. Assumir que existe um padrão médio que representa a totalidade das populações estudantis exige que o construto medido tenha o mesmo mecanismo causal, o mesmo padrão de desenvolvimento e afete os alunos exatamente da mesma maneira. Usando um método centrado na pessoa (modelo de mistura gaussiana finita ou análise de perfil latente), o presente tutorial mostra como descobrir a heterogeneidade nos dados de engajamento, identificando três clusters latentes ou não observados. Este capítulo oferece uma introdução ao clustering baseado em modelo que inclui os princípios dos métodos, um guia para escolha do número de clusters, avaliação dos resultados do clustering e um guia detalhado com código e um conjunto de dados da vida real. A discussão discorre sobre a interpretação dos resultados, as vantagens do agrupamento baseado em modelos, bem como como ele se compara a outros métodos.

2. Uma revisão sobre clustering baseado em modelo Bayesiano (arXiv)

Autora: Clara Grazian

Resumo: Clustering é uma tarefa importante em diversas áreas do conhecimento: medicina e epidemiologia, genômica, ciências ambientais, economia, ciências visuais, entre outras. As metodologias para realizar inferências sobre o número de clusters revelaram-se muitas vezes inconsistentes, e a introdução de uma estrutura de dependência entre os clusters implica dificuldades adicionais no processo de estimativa. Em um cenário Bayesiano, o agrupamento é realizado considerando a partição desconhecida como um objeto aleatório e definindo uma distribuição anterior sobre ela. Esta distribuição a priori pode ser induzida por modelos nas observações, ou definida diretamente para a partição. Vários resultados recentes, no entanto, mostraram as dificuldades em estimar consistentemente o número de clusters e, portanto, a partição. O próprio problema de resumir a distribuição posterior na partição permanece em aberto, dada a grande dimensão do espaço de partição. Este trabalho tem como objetivo revisar as abordagens bayesianas disponíveis na literatura para realização de clustering, apresentando vantagens e desvantagens de cada uma delas, a fim de sugerir futuras linhas de pesquisa.