Sobre análise genômica

Um ORF é uma seqüência de DNA que contém um conjunto contíguo de codons, cada um descrevendo um amino-ácido [2]. O programa getorf seleciona determinados ORFs de um genoma baseado no comprimento mínimo especificado pelo usuário.

Os programas Blast (Basic Local Alignment Search Tools) são um conjunto de algoritmos de comparação de seqüências utilizados para comparar uma seqüência com outras em um determinado banco de dados. Essas comparações são feitas par a par. A cada comparação é atribuída uma pontuação (score) que reflete o grau de similaridade entre as seqüências. Quanto mais alta a pontuação, maior é o grau de similaridade.

Para calcular o raw score são levados em consideração identidades, substituições e gaps. Bit score é o valor normalizado do raw score. Por isso, ele pode ser utilizado para comparar pontuações.

Identidade é um segmento no qual duas seqüências são invariantes. Uma substituição é a presença de bases diferentes em uma posição de um alinhamento.

Um gap é um espaço introduzido em um alinhamento para compensar inserções e remoções em uma seqüência com relação a outra. Os gaps inserem valores negativos no cálculo dos scores.

Em alinhamentos de amino-ácidos, as pontuações para identidades e substituições são dadas por matrizes de substituições. Essas matrizes contém as probabilidades de um amino-ácido mutar para outro. Tais valores foram calculados empiricamente, através da análise de extensas bases de dados.

Ricardo Nishikido Pereira 2004-12-06