Montando uma filogenia com dados moleculares provenientes do GenBank Milton Groppo
Por: LeandroBotelho • 15/11/2016 • Projeto de pesquisa • 1.916 Palavras (8 Páginas) • 473 Visualizações
Atividade prática: Montando uma filogenia com dados moleculares provenientes do GenBank
Milton Groppo
Criar uma árvore filogenética com dados moleculares envolve os seguintes passos:
1) Identificar uma proteína ou seqüência de DNA de interesse
2) Identificar outras seqüências que são relacionadas (homólogas) em diferentes organismos e obtê-las, ou por sequenciamento ou em um banco de dados eletrônico
3) Alinhar as seqüências (matriz de dados), nesse exercício, por método estático
4) Usar o alinhamento (matriz) para gerar a árvores ou árvores filogenética(s) - cladograma
Passos 1 e 2:
Utilizaremos a seqüência de rbcL para este exercício. Essa região do DNA do cloroplasto codifica para a subunidade maior da Rubisco (Ribulose Bifosfato Carboxilase), enzima responsável pela fixação do carbono proveniente do CO2 durante o processo fotossintético. É a seqüência mais utilizada em filogenia de plantas envolvendo dados moleculares, sendo mais utilizada em nível de grandes grupos (famílias ou acima). Tem tipicamente 1428 pb (pares de bases)
A seqüências serão obtidas do Genbank, bando de dados eletrônicos com seqüências, publicações, etc. (http://www.ncbi.nlm.nih.gov/genbank)
Em Search: escolha nucleotide
Em For: Magnolia rbcL, e então Go.
Serão exibidas todas as entradas para os critérios escolhidos. Entretanto, muitas vezes outras regiões também são mostradas. Escolha uma das seqüências que sejam de rbcL e clique sobre o código do Genbank (por ex.: AY008945, de Magnolia dealbata). Serão exibidas as informações sobre aquela seqüência (publicação, autores, tradução para aminoácidos, a seqüência em si, etc.). Para ser mais específico, utilize o código na busca (AY008945)
Para as nossas análises, devemos salvar a seqüência em um arquivo do tipo FASTA. Um arquivo nesse formato sempre começa com >, trazendo um cabeçalho com informações básicas da seqüência baixada e depois a seqüência em si. É um arquivo com poucas informações, mas ideal para o manejo subseqüente.
Para salvar o arquivo, em Display escolha FASTA e em Send to escolha File. Crie uma pasta para a seqüência (por exemplo: Arquivos_FASTA_exercício). Salve a seqüência nessa pasta, com um nome que você identifique depois (Magnolia_dealbata_rbcL_AY008945). Você pode abrir o arquivo em qualquer editor de texto (Word, Bloco de Notas ou WordPad).
Execute o mesmo procedimento para as espécies a seguir (use preferencialmente os cógidos do genbank listados:
Magnolia dealbata (Magnoliaceae, uma magnólia, angiospermas) - já baixado – código AY008945
Pinus nigra (Pinaceae, pinheiro-negro, uma gimnosperma) – DQ353733
Cycas revoluta (Cycadaceae, cycas de jardim, gimnosperma) – AF462411
Nymphaea odorata (Nymphaeaceae, ninféia, uma angiosperma) – M77034
Dicksonia thyrsopteroides (Dicksoniaceae, um parente do xaxim, pteridófita) – AM177345
Lycopodium vestitum (Lycopodiaceae, licopódio, pteridófita) – AJ133257
Laurus nobilis (Lauraceae, louro, angiosperma) – AF197593
Malpighia glabra (Malpighiaceae, acerola, angiosperma) – AB233900
Passo 3: Alinhamento
Depois de baixar as seqüências de uma mesma região, devemos proceder o alinhamento. Um alinhamento nada mais é do que uma hipótese de homologia entre os sítios (as posições) de uma região ou seqüência que se supõe homóloga, Existem basicamente dois tipos de alinhamento: o "estático" e o "dinâmico". Nas análises baseadas no primeiro, classicamente há uma divisão entre o alinhamento propriamente dito e a análise filogenética posterior. No segundo (dinâmico), a análise e o alinhamento são feitos simultaneamente, utilizando programas como o POY, por ex.
O alinhamento estático é considerado mais sensível à variação dos valores dos parâmetros escolhidos (seqüência inicial, penalidades por extensão ou inserção de gaps, etc.). Nesse exercício, utilizaremos o alinhamento estático, pois as seqüências de rbcL não apresentam problemas de indels (inserções ou deleções), sendo relativamente fácil de alinhar.
Alinhando as seqüências manualmente:
Utlizaremos o programa BioEdit, muito utilizado na edição de sequencias e com alguns recursos de alinhamento
Após abrir o programa clique em File>open. Escolha a pasta que salvou os arquivos, e depois em Cycas_revoluta_rbcL. O programa abrirá a sequencia. Note que do lado esquerdo está a identificação da sequencia, e do lado direito a seqüência. No lado esquerdo, edite a sequencia dando dois cliques no mouse (os cliques devem ser espaçados um pouco). O nome aparecerá em azul. Edite o nome (deixe apenas o gênero, Cycas, para facilitar) marcando com as teclas shift, as setas e delete.
Agora devemos colocar as outras seqüências. Clique em File>Import>sequence alignment file. Aparecerão as seqüências (para isso, vá em "All files", na opção "arquivos do tipo"). Dê um clique na sequencia seguinte ("Dicksonia thyrsopteroides"). Ela será exportada para a janela ativa, logo abaixo da seqüência de Cycas. Edite o nome da sequencia como em Cycas.
Agora podemos começar a alinhar as seqüências. Em mode (lado esquerdo, 2a linha) escolha "Edit"; ao lado surgirá uma régua com a opção "overwrite". Role para baixo e escolha "insert". Esses dois passos possibilitarão a edição das seqüências.
Para facilitar a visualização das seqüências, na terceira linha clique em "black-colored view mode". Os comandos desse grupo são utilizados para visualização das seqüências.
Na régua inferior, role até o final das seqüências. Você notará que a seqüência de Dicksonia é mais curta que a de Cycas. Isso porque muitas vezes as seqüências inteiras não são publicadas, ou por problemas no sequenciamento ou outros
...