Uma abordagem baseada em agrupamento hierárquico para análise filoproteômica de venenos de serpentes medidos por espectrometria de massas

Aluno: Guilherme Costa Vieira

Orientador: Marcelo da Silva Reis

Resumo

Serpentes utilizam seus venenos tanto para autodefesa quanto para obtenção de presas. Essas substâncias tratam-se na verdade de complexas misturas proteicas, que normalmente são estudadas através de técnicas como a proteômica baseada em espectrometria de massas (EM). Em trabalhos recentes, foram mostrados indícios de que os perfis proteômicos de serpentes do gênero Bothrops se correlacionam com a árvore filogenética desses mesmos organismos. Todavia, a superrepresentação de algumas espécies no banco de dados utilizado para identificação de proteínas após o ensaio de EM introduziu viés nesses resultados. Para mitigar isso, foi proposto em outro trabalho o uso de dados brutos de EM para construção de árvores filoproteômicas por inferência Bayesiana, utilizando como base matrizes de tempo de eluição por massa/carga. Todavia, a inferência Bayesiana de árvores filoproteômicas é um método computacionalmente intenso que limita a exploração de particionamento dos dados brutos. Neste projeto, desenvolvemos uma metodologia que utiliza os mesmos dados brutos de EM para gerar árvores filoproteômicas utilizando agrupamento hierárquico, uma técnica menos custosa computacionalmente. Para este fim, os dados brutos são particionados uniformemente e mapeados para vetores unidimensionais que posteriormente foram utilizados para construir hierarquias de grupos. Os dendrogramas gerados são validados com bootstrapping estatístico. Mostramos que o agrupamento hierárquico foi capaz de produzir resultados similares aos de trabalhos anteriores e que o uso de dados brutos de EM é uma técnica viável para análise filoproteômica.