TrabalhosGratuitos.com - Trabalhos, Monografias, Artigos, Exames, Resumos de livros, Dissertações
Pesquisar

Montando uma filogenia com dados moleculares provenientes do GenBank Milton Groppo

Por:   •  15/11/2016  •  Projeto de pesquisa  •  1.916 Palavras (8 Páginas)  •  473 Visualizações

Página 1 de 8

Atividade prática: Montando uma filogenia com dados moleculares provenientes do GenBank

Milton Groppo

Criar uma árvore filogenética com dados moleculares envolve os seguintes passos:

1) Identificar uma proteína ou seqüência de DNA de interesse

2) Identificar outras seqüências que são relacionadas (homólogas) em diferentes organismos e obtê-las, ou por sequenciamento ou em um banco de dados eletrônico

3) Alinhar as seqüências (matriz de dados), nesse exercício, por método estático

4) Usar o alinhamento (matriz) para gerar a árvores ou árvores filogenética(s) - cladograma

Passos 1 e 2:

Utilizaremos a seqüência de rbcL para este exercício. Essa região do DNA do cloroplasto codifica para a subunidade maior da Rubisco (Ribulose Bifosfato Carboxilase), enzima responsável pela fixação do carbono proveniente do CO2 durante o processo fotossintético. É a seqüência mais utilizada em filogenia de plantas envolvendo dados moleculares, sendo mais utilizada em nível de grandes grupos (famílias ou acima). Tem tipicamente 1428 pb (pares de bases)

A seqüências serão obtidas do Genbank, bando de dados eletrônicos com seqüências, publicações, etc. (http://www.ncbi.nlm.nih.gov/genbank)

Em Search: escolha nucleotide

Em For: Magnolia rbcL, e então Go.

Serão exibidas todas as entradas para os critérios escolhidos. Entretanto, muitas vezes outras regiões também são mostradas. Escolha uma das seqüências que sejam de rbcL e clique sobre o código do Genbank (por ex.: AY008945, de Magnolia dealbata). Serão exibidas as informações sobre aquela seqüência (publicação, autores, tradução para aminoácidos, a seqüência em si, etc.). Para ser mais específico, utilize o código na busca (AY008945)

Para as nossas análises, devemos salvar a seqüência em um arquivo do tipo FASTA. Um arquivo nesse formato sempre começa com >, trazendo um cabeçalho com informações básicas da seqüência baixada e depois a seqüência em si. É um arquivo com poucas informações, mas ideal para o manejo subseqüente.

Para salvar o arquivo, em Display escolha FASTA e em Send to escolha File. Crie uma pasta para a seqüência (por exemplo: Arquivos_FASTA_exercício). Salve a seqüência nessa pasta, com um nome que você identifique depois (Magnolia_dealbata_rbcL_AY008945). Você pode abrir o arquivo em qualquer editor de texto (Word, Bloco de Notas ou WordPad).

Execute o mesmo procedimento para as espécies a seguir (use preferencialmente os cógidos do genbank listados:

Magnolia dealbata (Magnoliaceae, uma magnólia, angiospermas) - já baixado – código AY008945

Pinus nigra (Pinaceae, pinheiro-negro, uma gimnosperma) – DQ353733

Cycas revoluta (Cycadaceae, cycas de jardim, gimnosperma) – AF462411

Nymphaea odorata (Nymphaeaceae, ninféia, uma angiosperma) – M77034

Dicksonia thyrsopteroides (Dicksoniaceae, um parente do xaxim, pteridófita) – AM177345

Lycopodium vestitum (Lycopodiaceae, licopódio, pteridófita) – AJ133257

Laurus nobilis (Lauraceae, louro, angiosperma) – AF197593

Malpighia glabra (Malpighiaceae, acerola, angiosperma) – AB233900

Passo 3: Alinhamento

Depois de baixar as seqüências de uma mesma região, devemos proceder o alinhamento. Um alinhamento nada mais é do que uma hipótese de homologia entre os sítios (as posições) de uma região ou seqüência que se supõe homóloga, Existem basicamente dois tipos de alinhamento: o "estático" e o "dinâmico". Nas análises baseadas no primeiro, classicamente há uma divisão entre o alinhamento propriamente dito e a análise filogenética posterior. No segundo (dinâmico), a análise e o alinhamento são feitos simultaneamente, utilizando programas como o POY, por ex.

O alinhamento estático é considerado mais sensível à variação dos valores dos parâmetros escolhidos (seqüência inicial, penalidades por extensão ou inserção de gaps, etc.). Nesse exercício, utilizaremos o alinhamento estático, pois as seqüências de rbcL não apresentam problemas de indels (inserções ou deleções), sendo relativamente fácil de alinhar.

Alinhando as seqüências manualmente:

Utlizaremos o programa BioEdit, muito utilizado na edição de sequencias e com alguns recursos de alinhamento

Após abrir o programa clique em File>open. Escolha a pasta que salvou os arquivos, e depois em Cycas_revoluta_rbcL. O programa abrirá a sequencia. Note que do lado esquerdo está a identificação da sequencia, e do lado direito a seqüência. No lado esquerdo, edite a sequencia dando dois cliques no mouse (os cliques devem ser espaçados um pouco). O nome aparecerá em azul. Edite o nome (deixe apenas o gênero, Cycas, para facilitar) marcando com as teclas shift, as setas e delete.

Agora devemos colocar as outras seqüências. Clique em File>Import>sequence alignment file. Aparecerão as seqüências (para isso, vá em "All files", na opção "arquivos do tipo"). Dê um clique na sequencia seguinte ("Dicksonia thyrsopteroides"). Ela será exportada para a janela ativa, logo abaixo da seqüência de Cycas. Edite o nome da sequencia como em Cycas.

Agora podemos começar a alinhar as seqüências. Em mode (lado esquerdo, 2a linha) escolha "Edit"; ao lado surgirá uma régua com a opção "overwrite". Role para baixo e escolha "insert". Esses dois passos possibilitarão a edição das seqüências.

Para facilitar a visualização das seqüências, na terceira linha clique em "black-colored view mode". Os comandos desse grupo são utilizados para visualização das seqüências.

Na régua inferior, role até o final das seqüências. Você notará que a seqüência de Dicksonia é mais curta que a de Cycas. Isso porque muitas vezes as seqüências inteiras não são publicadas, ou por problemas no sequenciamento ou outros

...

Baixar como (para membros premium)  txt (13.8 Kb)   pdf (103.1 Kb)   docx (16.9 Kb)  
Continuar por mais 7 páginas »
Disponível apenas no TrabalhosGratuitos.com