Proposta

Aluna: Mina Cintho
Supervisor: Prof. Dr. João Eduardo Ferreira
Tema da Monografia: Classificação das mutações de vírus HIV



Introdução

        Pesquisas na área de bioinformática têm gerado quantidades significativas de dados. Um dos grandes desafios enfrentados atualmente é a análise e exploração destes dados. Em particular, este trabalho tratará de dados do HIV, vírus da imunodeficiência humana. Esse vírus está sujeito às mutações que geram variabilidade.

        Estudos têm sido realizados no sentido de verificar possíveis relações existentes entre a variabilidade e a capacidade de transmissão, patogenicidade e resposta a tratamentos [3]. Com a utilização de agentes antivirais no tratamento de doentes há seleção de mutantes resistentes à ação de drogas que fazem com que o tratamento seja ineficiente. Assim os vírus resistentes prevalecem, e não há resposta ao tratamento. Porém, ainda pode haver outras drogas existentes às quais os vírus são suscetíveis.

        Um dos caminhos para entender a relação mutação e drogas ministradas é a técnica de agrupamento [4]. A técnica de agrupamento é empregada em casos nos quais não há grande quantidade de informação prévia e existem poucas hipóteses sobre os dados. Os grupos resultantes do processo devem possuir padrões com propriedades em comum, ou seja, padrões similares, sendo que padrões de um grupo devem ser mais similares a padrões do mesmo grupo do que de grupos distintos.



Objetivo do trabalho

        Aplicando-se a técnica de agrupamento a sequências de DNA do vírus HIV de cada paciente, conjuntamente com as informações de drogas utilizadas para cada caso, observaremos se será possível classificar e agrupar o vírus em tipos e subtipos. Médicos e pesquisadores da área já intuem algum tipo de classificação, apenas com base em observações empíricas.

        Há uma grande variedade de métodos de agrupamento disponíveis, porém, não é possível prever qual destes métodos será o mais adequado para tal aplicação, portanto será necessário implementar diversos métodos e analisar os resultados comparando os grupos formados em cada método.

        Como não é possível ter certeza de que a informação que o paciente fornece sobre a medicação ministrada é verdadeira, a montagem dos grupos pode enfrentar alguns problemas como a existência de ruídos, ou seja, dados que podem alterar os resultados. Assim este trabalho objetiva implementar as técnicas de agrupamento mais relevantes com o objetivo de contribuir para compreensão da relação mutações e drogas em dados HIV.



Atividades já realizadas

        Desde a definição do supervisor, foi explorada a bibliografia básica para o conhecimento geral das técnicas de agrupamento e do vírus HIV, já dando início à escrita do texto para o desenvolvimento da monografia.

        Além dos conceitos gerais de agrupamento, foi estudado o método Vizinho mais próximo [6-7], implementado o algoritmo e a partir do resultado do algoritmo, foi construído o dendograma com os grupos formados.



Cronograma de atividades

JunhoJulhoAgostoSetembroOutubroNovembro
Elaboração do textoX X X X X X
Estudo dos métodosXXX
Implementação dos algoritmosXXXX
Preparação do pôster e da apresentaçãoX
Elaboração da parte subjetiva X
s Revisão e finalização da monografia X




Estrutura esperada da monografia

        1. Introdução
        2. Conceitos
             2.1. Mutações
             2.2. HIV e Resistência
             2.3. Sequenciamento e Análise
             2.4. Agrupamento
                     2.4.1 Métodos de agrupamento Hierárquicos
                         2.4.1.1 Métodos Aglomerativos Hierárquicos
                     2.4.2 Métodos de agrupamento Não-Hierárquicos
                         2.4.2.2 Método K-Médias
        3.Resultados
        4.Discussão
        5.Conclusões
        6.Parte Subjetiva
        7.Referências Bibliográficas


Referências Bibliográficas

[1] Baeten JM, Chohan B, Lavreys L, Chohan V, McClelland RS, Certain L, Mandaliya K, Jaoko W, Overbaugh J. (2007) HIV-1 subtype D infection is associated with faster disease progression than subtype A in spite of similar plasma HIV-1 loads. J Infect Dis;195:1177-80.

[2] Laeyendecker O, Li X, Arroyo M, McCutchan F et al.(2006) The Effect of HIV Subtype on Rapid Disease Progression in Rakai, 13th Conference on Retroviruses and Opportunistic Infections Uganda,(abstract no. 44LB).

[3] Kanki P.J., Donald J. Hamel, Jean-Louis Sankalé, Chung-cheng Hsieh, Ibou Thior, Francis Barin, Stephen A. Woodcock, Aïssatou Guèye-Ndiaye, Er Zhang, Monty Montano, Tidiane Siby, Richard Marlink, Ibrahima NDoye, Myron E. Essex, and Souleymane MBoup (1999) Human Immunodeciency Virus Type 1 Subtypes Dier in Disease Progression, Journal of Infectious Diseases Volume 179 Number 1.

[4] Jain, A. K., Murty, M. N., and Flynn, P. J., Data clustering: A review, ACM Computing Surveys 31, 264{323 (1999).

[5] Johnson, R.A., Wichern, D.W. (1982). Applied multivariate statistical analysis. Englewood Clis, NJ: Prentice-Hall.

[6] J.T. Tou and R.C. Gonzalez, Pattern Recognition Principles. Reading: Addison-Wesley, 1974.

[7] A.K. Jain and R.C. Dubes, Algorithms for Clustering Data. Prentice Hall, 1988.