Classificadores de texto para a Web

Os classificadores de textos estudados quase em sua totalidade eram direcionados para uso exclusivamente em documentos que não o hipertexto encontrado na web. Como tais não se utilizavam de estruturas encontradas em hipertextos que poderiam melhorar o desempenho na tarefa de classificação, como rótulos demarcando títulos, links, imagens, etc...Ao se conceder maior peso às palavras nestes rótulos, verificou-se empiricamente um ganho relativo a mesma tarefa de classificação sem o uso desta informação.

Um outro possível uso da rede de documentos web para auxílio na tarefa de classificação seria o grafo de associações entre documentos. O padrão de associação entre páginas pode ser usado como mais uma característica importante.



Fabio Braga de Oliveira 2004-12-09