Armazenamento de Dados em Moléculas de DNA
Por: Gabriel Zurawski de Souza • 10/8/2022 • Resenha • 1.717 Palavras (7 Páginas) • 86 Visualizações
RESUMO
Armazenamento de Dados em Moléculas de DNA
Gabriel Zurawski de Souza
gabrielzds03@gmail.com Pontifícia Universidade Católica do RS
Porto Alegre, RS, Brasil
condicionam o desenvolvimento dessa tecnologia estão: a alta densi-
O presente trabalho busca apresentar os conceitos básicos para o compreendimento do estudo que busca usar moléculas de DNA (Ácido Desoxirribonucleico) como forma de armazenamento de dados, assim como já é feito hoje em dias por meio de dispositi- vos eletrônicos como: Discos Rígidos, Pendrives, SSDs (Solid-state drive), entre outros. Esse trabalho também apresentará alguns avan- ços na área e uma panorama da capacidade que essa tecnologia tem para superar em muito os já existentes métodos de armazenamento.
ACM Reference Format:
Gabriel Zurawski de Souza. 2022. Armazenamento de Dados em Moléculas de DNA. In Produção textual - Metodologia Científica - PUCRS 2022/1. ACM, New York, NY, USA, 3 pages. https://doi.org/10.1145/1122445.1122456
INTRODUÇÃO
Durante a década de 1970, havia uma enorme limitação na quanti- dade de dados que podia ser armazenado, compartilhado e trans- portado. Um disquete, por exemplo, também chamado de floppy disk, não armazenava mais do que 1,44Mb, o que forçava muitas vezes a utilização de diversos deles para compartilhar um único arquivo, vídeo ou programa. Anos mais tarde, com a chegada dos CDs e DVDs (que inicialmente armazenavam 700Mb) e Pendrives (que inicialmente armazenavam 8Mb, mas que hoje já se encontra na casa do 1Tb) a capacidade de armazenamento aumentou substan- cialmente. Porém, ainda assim continuava surgindo a necessidade de armazenar mais e mais dados e novas tecnologias cada vez mais avançadas surgiam para sanar essa carência, como por exemplo, discos Blu-ray (de até 100Gb de memória) e Discos Rígidos (que já chegam a 15Tb). Esse enorme e constante avanço prova o cresci- mento exponencial da quantidade de dados gerados que precisam ser armazenados. Contudo, com os serviços de nuvem, o Big Data e a necessidade do público de armazenar arquivos de maior qua- lidade gráfica: como jogos eletrônicos, filmes, fotos e vídeos em resoluções cada vez mais altas (4K e 8K), a tecnologia não vem mais conseguindo acompanhar esse crescimento.
Umas das formas mais estudadas hoje em dia para o armaze- namento de grandes quantidades de dados é o uso de moléculas de DNA (Ácido Desoxirribonucleico), umas das “mídias” de maior capacidade de armazenamento da natureza. Dentre os fatores que
[pic 1]
Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. Copyrights for components of this work owned by others than ACM must be honored. Abstracting with credit is permitted. To copy otherwise, or republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. Request permissions from permissions@acm.org.
Metodologia Científica, Semestre 2022/1„ Porto Alegre, RS
© 2022 Association for Computing Machinery. ACM ISBN 978-1-4503-9999-9/18/06. . . $15.00
https://doi.org/10.1145/1122445.1122456
dade de armazenamento (devido a grande capacidade das moléculas de DNA de serem condensadas), o baixo consumo de energia, e a longa vida útil dessas moléculas que superam os componentes eletrônicos já utilizados, além é claro das estruturas das cadeias de DNA formadas por bases nitrogenadas (Citosina, Guanina, Adenina e Timina) que se assemelham a forma binária como dados já são armazenados, baseados em 0 e 1.
METODOLOGIA
Os três artigos utilizados para a realização desse resumo foram sele- cionados pensando em: apresentar um panorama geral do assunto abordado, apresentar as capacidades que a tecnologia proveniente desse estudo podem vir a ter e exemplificar métodos que são atual- mente pesquisados na área para a viabilização dessa possível nova tecnologia.
A BIOBOLOGIA POR DE TRÁS
No ano de 1953, após diversos avanços no estudo de uma estrutura peculiar no núcleo de células humanas denominada DNA, James Watson e Francis Crick fizeram uma das últimas maiores descober- tas da biologia molecular, a estrutura em dupla hélice da cadeia de DNA, a qual proporciona maior compactação das cadeias, permi- tindo que se desenvolvam maiores e mais complexas e capazes de armazenar ainda mais informações genéticas.
Uma molécula de DNA pode ser entendida como uma longa cadeia formada por quatro tipos de bases nitrogenadas, que por sua vez formam pares: Adenina (A), Timina (T), Citosina (C) e Guanina(G), assim como mostra a figura 1.
Metodologia Científica, Semestre 2022/1„ Porto Alegre, RS Gabriel Zurawski de Souza
[pic 2]
Figura 1: Estrutura em dupla hélice com os bases nitrogena- das e seus respectivos pares.
Estima-se que uma molécula de DNA de massa unitária de cerca de 1021 bases poderia armazenar até 455 Eb de informação. Além disso, a durabilidade é outro ponto forte das moléculas de DNA. Pesquisas feitas hoje ainda são capazes de sequenciar genomas de até 180 milhões de anos encontrados em plantas fossilizadas. Logo, sua durabilidade é maior do que qualquer outro dispositivo já utilizado para armazenar dados, além de sua alta resistência à decomposição mesmo em ambientes de baixas e altas temperaturas.
Método de Armazenamento
O armazenamento e leitura de dados - que são inicialmente binários
- ocorre mediante 5 etapas: a codificação, a sintetização, a reação em cadeia da polimerase, o sequenciamento do DNA, e a decodificação.
A primeira etapa, a codificação, é a responsável por converter os números binários que constituem um dado - seja imagem, texto, vídeo, áudio, etc - em uma sequência de bases nitrogenadas que, na próxima etapa, serão sintetizadas e irão compor uma cadeia de DNA. Aqui entra a primeira área a ser melhor estudada: qual a melhor forma de se codificar a informação? Pois enquanto os números binários podem assumir apenas dois valores (0 ou 1) uma sequência de bases pode assumir até quatro valores (A, T, G e C) tornando assim a codificação menos restrita e com maiores possi- bilidades. Tomemos como exemplo duas maneiras de codificação para o mesmo caso: para a codificação da letra “e” que tem como número binário correspondente 01100101. Poderíamos utilizar ape- nas 2 bases nitrogenadas, uma para representar o 0 e outra para representar o 1. Por exemplo, usar A para representar 1 e T para representar 0. Nesse caso teríamos como resultado TAATTATA e assim um total de 8 espaços na cadeia de DNA seriam ocupados para guardar apenas uma letra. Por outro lado, poderíamos utilizar A para representar 00, T para representar 01, G para representar 10 e C para representar 11. Nesse caso teríamos como resultado TGTT, e assim um total de 4 espaços na cadeia de DNA seriam ocupados - a metade em comparação ao primeiro caso. Logo, através de relações matemáticas seria possível otimizar o uso de espaços utilizados nas cadeias de DNA, que dependeria também do tipo de informação a
...