Versão preliminar da monografia

 

[.pdf]

Código

 

[.zip]

Atividades realizadas

 

No decorrer do primeiro semestre de 2012 (até o mês de maio) foram pesquisadas medidas de dependência, dentre as quais os coeficientes de Pearson e Spearman, a medida D de Hoeffding, o CIM, a correlação de distância e a medida de HHG foram selecionadas para o estudo comparativo.

Além disso, no primeiro semestre, estudei em mais detalhes o coeficiente de informação mútua e realizei simulações comparando os coeficientes de Pearson e Spearman, a medida D de Hoeffding e a correlação de distância. Para tal, estudei a ferramenta R, com a qual implementei as simulações, e foram revisados e estudados alguns tópicos de estatística, como teste de hipóteses, poder estatístico e curva ROC.

Durante o mês de julho e agosto dei continuidade às simulações com as medidas estudadas. Nesse período foram adicionadas mais duas medidas ao estudo: o coeficiente de Kendall e a informação mútua.

Em setembro, concluídas as simulações, comecei a processar dados de expressão gência de 441 amostras de adenocarcinomas. Os dados passaram por um processo de normalização (ainda sujeito a mudanças) e serão futuramente aplicados em testes de independência.

Próximas atividades

 

Os próximos passos são finalizar o estudo sobre os resultados das simulações e aplicar as medidas aos dados biológicos. Concluída a normalização dos dados, selecionaremos genes nos quais buscaremos associações a partir dos métodos estudados.

Paralelamente a essas atividades, o texto da monografia será aperfeiçoado e expandido. Posteriormente, serão desenvolvidos o pôster e a apresentação do trabalho.

Cronograma de atividades

 

Atividade Junho Julho Agosto Setembro Outubro Novembro
Estudo da medida de HHG OK
Simulações OK OK OK
Aplicações em dados biológicos Em andamento Em andamento Em andamento
Monografia Em andamento Em andamento
Criação do pôster e apresentação do trabalho X