Introdução


A análise de sentimentos refere-se à aplicação de algoritmos capazes de extrair conteúdo subjetivo de amostras de dados.

A proposta deste trabalho é resolver o problema de classificação de reviews de filmes da competição "Bag of Words Meets Bags of Popcorn" do Kaggle, por meio da análise de sentimentos, usando SVM e processamento de linguagem natural.


Objetivos


O objetivo do trabalho é implementar um kernel customizado para análise de sentimentos e, por meio do uso de SVM, classificar reviews de filmes quanto à sua polaridade.


Método


Para a implementação, será usada linguagem Python devido ao grande número de bibliotecas para processamento de linguagem, mineração de dados e SVM já existentes e que foram escritas ou são compatíveis com a linguagem.

Os dados serão preparados e submetidos aos algoritmos, colhendo os resultados de acurácia na classificação e tempo de execução.

Após os testes, uma análise comparativa será feita com os resultados obtidos.


Cronograma


  • Maio: Estudo da forma de estruturação dos textos e início da implementação
  • Junho: Estudo de possíveis algoritmos para a análise e de formas de exposição de resultados
  • Julho: Implementação de alguns algoritmos de análise
  • Agosto: Realização de testes com os algoritmos
  • Setembro: Início da escrita da monografia
  • Outubro: Análise dos dados obtidos com os testes
  • Novembro: Conclusão e entrega da monografia