Aspectos Básicos Da Biologia Celular E Molecular
Ensaios: Aspectos Básicos Da Biologia Celular E Molecular. Pesquise 862.000+ trabalhos acadêmicosPor: Jheide • 25/9/2013 • 1.227 Palavras (5 Páginas) • 1.574 Visualizações
Aspectos Básicos da Biologia Celular e Molecular Entrega 23/01/2013 no DGE, sl 14
Nome: Jade Lorraine Argeri R.A.: 500127
• Questão 1
Descreva claramente as entradas e saídas do BLAST. O que são arquivos FASTA e PDB.
R: Para usar as ferramentas BLAST, existem formatos pré-definidos de entradas e saídas que as representações dos genes devem seguir. As bases nitrogenadas do DNA, como vimos, podem ser representadas em arquivos texto onde cada letra representa uma base, A (adenina), T (timina), G (guanina) ou C (citosina). Essas bases, tomadas três a três, formam os vinte aminoácidos usualmente encontrados nas proteínas, portanto, outra forma de representarmos o gene pode ser a forma traduzida em sequências de aminoácidos, e nesse caso cada letra representa um deles. Esse raciocínio aplica-se tanto ao formato de consulta quanto ao formato do banco. Os arquivos que representam as sequências de DNA ou proteínas das consultas e dos bancos de dados devem seguir o formato FASTA. O formato FASTA consiste em uma linha com o identificador do gene ou sequência, seguido de uma pequena descrição, que deve se iniciar com o símbolo > (maior que), sendo ambos opcionais, seguido da sequência em si. Recomenda-se que as linhas da sequência possuam no máximo 80 caracteres, o que também é opcional. Existem dois tipos de arquivo FASTA, um que representa a sequência por suas bases, ou seja, basicamente cada letra é um nucleotídeo, e outro que as bases já se apresentam convertidas em aminoácidos e cada letra representa um deles.
Complemento:
Os programas que compõem a família de aplicações BLAST estão encapsulados em um único programa executável, o blastall. E para usar cada um deles deve-se passar seu nome como argumento. Abaixo, descrevemos brevemente cada programa dessa família:
blastn - comparar uma sequência de nucleotídeos com o banco de dados de nucleotídeos.
blastp - comparar uma sequência de proteína com o banco de dados de proteínas, tem uma opção de procurar domínios conservados na proteína.
blastx - comparar uma sequência de nucleotídeos, traduzida em todas as 6 quadras abertas de leitura, com o banco de dados de proteínas.
tblastn - comparar uma sequência de proteína com o banco de dados de nucleotídeos traduzindo em todas as 6 quadras abertas de leitura.
tblastx - comparar uma sequência de nucleotídeos, traduzida em todas as 6 quadras abertas de leitura, com o banco de dados de nucleotídeos traduzindo em todas as 6 quadras abertas de leitura.
Programa Tipo de consulta Tipo de banco de dados
Blastn Nucleotídeo Nucleotídeo
Blastp Aminoácido Nucleotídeo
Blastx Nucleotídeo Aminoácido
Tblastn Aminoácido Aminoácido
Tblastx Nucleotídeo Nucleotídeo
Tabela I: Tipos de consulta do BLAST
• Questão 2 - Procurando um gene no GenBanck: http://www.ncbi.nlm.nih.gov/
Seqüência de nucleotídeos desconhecida:
ATT TGC TTC TGA CAC AAC TGT GTT CAC TAG CAA CCT CAA ACA GAC ACC ATG GTG CAC CTG ACT CCT GAG GAG AAG TCT GCC GTT ACT GCC CTG TGG GGC AAG GTG AAC GTG GAT GAA GTT GGT GGT GAG GCC CTG GGC AGG CTG CTG GTG GTC TAC CCT TGG ACC CAG AGG TTC TTT GAG TCC TTT GGG GAT CTG TCC ACT CCT GAT GCT GTT ATG GGC AAC CCT AAG GTG AAG GCT
Pede-se:
1. De que gene se trata?
R: Tipo de Gene (HBB - beta hemoglobina) para codificação de proteína, encontrado em Gorilas (max score mais elevado), seguindo a linhagem de evolução: Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Euarchontoglires; Primates; Haplorrhini; Catarrhini; Hominidae; Gorilla. Localizado no cromossomo 11, as globinas são proteínas heme que se ligam e transportam o oxigênio.
2. A que organismo pertence esta sequência?
R: Pelo Max Score mais elevado, o resultado aponta que pertence a organismo de Gorilas. Similaridades encontradas em menos escalas para organismos como: Chimpanzés e Homo Sapiens respectivamente.
3. Qual a similaridade?
R: A similaridade do gene varia entre 100%, entre os gorilas e os chimpanzés, 99% entre os humanos, há também similaridade com os genes de outros mamíferos como o golfinho (91%), o gado bovino (89%) e o javali (87%), entre outras espécies. Vemos similaridade congenes de outras espécies de animais como: Touro, Javali, Golfinhos e Coelho Europeu, mesmo sendo de espécies diferentes, mostram através do alinhamento, que os genes responsáveis pela proteína da hemoglobina, compartilham a mesma origem.
Accession: fornece os caracteres que identificam a sequência e a base de dados de onde ela foi tirada.
E-value (expect value): Valor de expectativa. Equivalente a probabilidade de o alinhamento ocorrer por acaso. Quanto mais próximo de zero, maior a chance de o alinhamento ter significado biológico.
Query cover: fornece a porcentagem de cobertura que a consulta apresenta. Os outros scores estão relacionados às formulas usadas para cálculo da proximidade entre a sequência dada e as sequências do banco de dados.
4. Que outras informações podem ser colocadas a esta sequência?
R: É possível escolher o tipo de banco de dados a ser comparado: humano, rato e outros em menor escala de armazenamento. Escolher ou excluir um tipo especifico de organismo a ser comparado. Definir os parâmetros e tipos de consulta a ser exibido no resultado, refinando assim as informações a serem analisadas e desejadas.
• Questão 3 - Comparação de seqüências de DNA de duas espécies: fragmento do gene do fator IX de coagulação. (Usar algoritmo CLUSTALW)
Fragmento do gene do fator IX de coagulação humano:
ATGCAGCGCGTGAACATGATCATGGCAGAATCACCAGGCCTCATCACCATCTGCCTTTTAGGATATCTACTCAGTGCTGAATGTACAGTTTTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCACGAGAAGTTTTTGAAAACACTGAAAGAACAACTGAATTTTGGAAGCAGTATGTTGATGGAGATCAGTGTGAGTCCAATCCATGTTTAAATGGCGGCAGTTGCAAGGATG
...