Experimentos com classificadores, uso no currículo Lattes, limitações

Experimentos usando os algoritmos de classificação aprendidos e as heurísticas para tratamento das páginas do currículo Lattes dos professores do IME-USP. Logo descobriu-se um pré-requisito não cumprido: era necessário para uso dos algoritmos de aprendizado semi-automatizados uma massa de dados de treinamento já devidamente rotulada, como o que existe na coleção Reuters. Mesmo que fossem rotuladas todas as páginas do instituto, talvez não fosse atingido um número suficiente de exemplos para os algoritmos. Uma solução seria a ampliação do espaço de treinamento para todas as páginas de currículos do sistema Lattes, e não se restringir a apenas as páginas dos professores do IME-USP. Viu-se a necessidade de uma ontologia para o trato da informação sendo processada, tendo então contato com diversas ontologias de uso geral.



Fabio Braga de Oliveira 2004-12-09