MAC 499 - Monografia

Monografia

MAC-499




Aluna: Luiza Figueiredo Pagliari
Supervisor e Orientedor: Antônio Galves
Tipo de Trabalho: Iniciação Científica no projeto TIPAL, patrocinado de agosto/2002 até maio/2003 pelo CNPq




O projeto de Iniciação Científica

Este projeto iniciou-se em abril de 2002, sob a supervisão do professor Antônio Galves, do departamento de Estatística do IME, e está inserido no Projeto TIPAL. Mais precisamente, o presente projeto relaciona-se com os programas Vocale e sua versão simplificada, o Piccolo.

Com o objetivo de classificar as línguas em classes rítmicas, o Vocale e o Piccolo utilizam como critério de classificação os intervalos consonantais e vocálicos em arquivos de fala, calculando-se, para isso, a entropia relativa para cada coluna do espectrograma (veja mais informações na página do Vocale). O uso dessas ferramentas permite uma segmentação mais rápida e precisa (pois a mesma vinha sendo feita manualmente) e, portanto, evita-se possíveis erros humanos que a separação manual propiciava.

Para mais informações, visite o site do Vocale e veja esta apresentação de Jesus Garcia, um dos desenvolvedores iniciais do Vocale.

volta ao início


Primeira Parte: Aspectos Técnicos


Objetivo e Atividades realizadas

No início, o objetivo principal era montar um grande Banco de Dados com arquivos de fala em diversas línguas, de forma a expandir a análise estatística que já havia sido feita até então com um conjunto restrito de dados e em poucas línguas (a saber: Inglês, Holandês, Polonês, Espanhol, Catalão, Francês, Italiano e Japonês, em grande quantidade, além do Português Europeu e Português Brasileiro, com poucos dados coletados. Esses dados podem ser obtidos aqui).

Aproveitando o grande volume de dados disponíveis na Internet, partiu-se em busca de arquivos com sentenças ditas de forma clara, natural (o que excluía, por exemplo, pessoas cantando) e sem sons externos (ruídos, músicas de fundo, etc). Com estas restrições, os noticiários internacionais tornaram-se a maior fonte de dados dessa fase inicial do projeto.

No entanto, foram notadas diferenças consideráveis entre os espectrogramas dos arquivos disponíveis anteriormente (os quais haviam sido gravados em estúdio) e os dos arquivos dos noticiários, e o grupo de trabalho chegou à conclusão que essa diferença se devia ao fato dos dados disponíveis na Internet estarem, em sua maioria, em formatos comprimidos (provavelmente para um acesso mais rápido e menor espaço de armazenamento necessário), o que, conseqüntemente, "contaminava" os dados. Dessa forma, utilização desses arquivos para a expansão da base de dados do projeto ficou impossibilitada.

Com esse revés, os objetivos iniciais do meu projeto de Iniciação Cinetífica foram revistos e passei a lidar diretamente com o Piccolo. Para começar iniciei um refatoramento do programa -- desenvolvido inicialmente em Perl por Jesus Garcia --, de modo a torná-lo mais eficiente e claro. Ao mesmo tempo, desenvolvi uma Interface Gráfica* (figura 1) para o programa, a fim de que usuários familiarizados com o projeto mas leigos em relação à linguagem Perl pudessem utilizar o programa sem grandes dificuldades. Também foi desenvolvido um novo módulo para a visualização de gráficos com os resultados obtidos pelo programa (figura 2).

O passo seguinte foi unificar as versões existentes para todos os tipos de dados e expandir seu uso para diferentes Sistemas Operacionais, pois antes havia três versões, todas para Windows. A nova versão do Piccolo foi também extensamente comentada para facilitar seu entendimento por pessoas de fora do projeto ou por futuros novos membros que queiram dar continuidade ao desenvolvimento do programa.

Finalmente, nos últimos quatro meses, o manual de auxílio ao usuário (para que pessoas do mundo todo possam utilizar o programa e contribuir com dados para o projeto) foi finalizado. Além disso, os dados acústicos e os programas necessários para rodar o Piccolo forão reunidos em um CD-ROM e estão disponíveis na Internet.


volta ao início

Outras atividades já realizadas

  • Leitura dos artigos [1] e [2] (maio/2002);
  • Participação na VI Escola Brasileira de Probabilidade (agosto/2002) com o pôster Statistical Analysis and Identification of Rhythmic Classes on Big Speech Corpora, tendo também freqüentado o mini-curso Markov Models and Hidden Markov Models in Genome Analysis, ministrado por Bernard Prum;
  • Mini-curso de Cadeias de Markov Ocultas, ministrado por Suzi Camey (janeiro/2003);
  • Participação na VII Escola Brasileira de Probabilidade (agosto/2003) com o pôster Piccolo - A tool for the automatic annotation of vocalic and consonantal intervals;

volta ao início

Referências:

[1] Galves, A.; Garcia, J., Duarte, D., Galves, Ch. (2002) Sonority as a basis for rhythmic class discrimination, in Proceedings of the Speech Prosody 2002 conference (ISBN 2-9518233-0-4), 323-326, 2002. Pode ser obtido aqui.

[2] Ramus, F.; Nespor, M.; Mehler, J., 1999. Correlates of linguistic rhythm in the speech signal. Cognition, 73, 265-292.



volta ao início


Segunda Parte: Experiência Pessoal



Fazer Iniciação Científica em uma área diferente da Computação teve muitos pontos positivos e negativos. Foi muito interessante poder desenvolver uma ferramenta que aplicasse o que aprendi em Estocásticos -- matéria que gostei muito quando cursei -- e nas diversas matérias de MAC. Melhor ainda: poder aprofundar os conhecimentos adquiridos em uma área diferente da Computação. Ao mesmo tempo, o fato de eu não ser aluna de Estatística -- e, conseqüentemente, não ter cursado diversas matérias de Probabilidade e outras da área -- trouxe algumas dificuldades para eu poder entender melhor as coisas da Iniciação. Muitas vezes as explicações que eu recebia não podiam chegar muito a conceitos avançados porque me faltava a base, o que foi muito frustrante diversas vezes. Aliás, tenho que agradescer imensamente a todos do projeto que tiveram paciência para me explicar as coisas uma, duas, n vezes (com n>50 :o)), até que eu conseguisse entender as coisas.

Um outro ponto muito legal foi a participação em Escolas de Probabilidade e Simpósios de Iniciação Científica. Especialmente no primeiro caso, pude ter contato com idéias bastante avançadas de Probabilidade e conhecer pessoas de diferentes culturas, assim como ter as primeiras noções de como apresentar um trabalho e seus resultados para outras pessoas.

Disciplinas mais importantes para a Iniciação Científica

  • Todas as obrigatórias do MAE:
    • MAE0121, MAE0212 e MAE0228 (Introducao a Probabilidade e a Estatistica I e II, e Nocoes de Probabilidade e Processos Estocasticos, respectivamente);
  • Principalmente as introdutórias do MAC:
    • MAC0110, MAC0122, MAC0211, MAC0242 e MAC0323 (respectivamente Introdução à Computação, Princípios de Desenvolvimento de Algoritmos, Laboratório de Programação I e II e Estruturas de Dados).

volta ao início


* Agradeço especialmente ao professor Gubi pela ajuda e atenção nessa parte.