Tecnologia Da Informaçao E Comunicaçao
Resenha: Tecnologia Da Informaçao E Comunicaçao. Pesquise 862.000+ trabalhos acadêmicosPor: patylaine2 • 15/9/2014 • Resenha • 1.983 Palavras (8 Páginas) • 203 Visualizações
TECNOLOGIA DA INFORMAÇAO E COMUNICAÇAO
RESUMO
Atualmente, o volume de informação gerado aumenta exponencialmente, sendo que uma
parcela significativa das informações encontra-se em formato textual. A partir desse formato é
possível extrair determinados conhecimentos. Entretanto, face ao grande volume de
informações disponíveis, seja na web ou mesmo nas organizações, tal tarefa constitui-se como
um desafio computacional. Superado os obstáculos, o conhecimento obtido através de
informações textuais pode ser utilizado na tomada de decisão com o intuito de gerar vantagem
competitiva. Um dos meios de se extrair conhecimento é através da utilização do processo de
Descoberta de Conhecimento em Bases de Dados e, no caso de informações textuais, através
do processo de Descoberta de Conhecimento em Textos. De maneira geral, os processos de
descoberta de conhecimento tradicionais são custosos quando aplicados em grandes coleções
de documentos, por exemplo, a web. Com este pressuposto é proposto neste trabalho uma
arquitetura para descoberta de conhecimento a partir de bases textuais almejando sua
utilização em grandes fontes de informação. Para atingir este objetivo, a proposta utiliza, além
da computação distribuída visando o aumento de desempenho, um modelo com base no
conceito de correlação rápida. A demonstração de viabilidade é realizada através de um
protótipo que implementa a arquitetura proposta. O protótipo tem a capacidade de gerar
informações que relacionam padrões textuais (termos) e de permitir uma visão da evolução
temporal em determinado domínio de problema. A aplicação do protótipo em um cenário
possibilitou demonstrar que a arquitetura proposta é capaz de obter resultados consistentes e
satisfatórios, tanto para o entendimento de determinado domínio, quanto para a análise de
grandes bases textuais.
Palavras-chave: Descoberta de Conhecimento; Bases Textuais; Correlação de Informação;
Computação Distribuída. ABSTRACT
Currently the amount of information increases exponentially in which a great portion of these
information is in textual format. From this format is possible to extract knowledge. However,
considering the huge volume of information available, either the web or even in organizations,
this task can be seen as a computational challenge. The knowledge acquired through textual
information, once overcome the obstacles, can be used in decision making process aiming to
generate competitive advantage. This can be done through Knowledge Discovery in Text. In
general, traditional knowledge discovery processes are expensive when applied to large
corpus, for instance, the web. Taken it into account is proposed in this work an architecture
for knowledge discovery from textual databases aiming its use in large sources of information.
Aiming to achieve the main objective this work focus on distributed computing in order to
increase performance and on a fast correlation based model. The feasibility is demonstrated
through a prototype implemented using the proposed architecture. The prototype has proved
the ability to extract information by
linking textual patterns (terms) and by allowing a
temporal view in a given domain. The application of the prototype in a scenario has
demonstrated that the proposed architecture is able to obtain consistent and satisfactory
results.
Keywords: Knowledge Discovery; Text Databases; Information Correlation; Distributed
Computing. LISTA DE FIGURAS
1. INTRODUÇÃO
A evolução das tecnologias da informação vem promovendo diversas mudanças na
sociedade em geral. Entre elas está a disponibilização de uma quantidade cada vez mais
crescente de informações, resultado principalmente do aumento da capacidade de
processamento e armazenamento. Este fenômeno torna-se cada vez mais evidente e vem
sendo observado por diversos estudiosos da área.
Em 2003 o mundo produzia entre um e dois exabytes de informação nova por ano, ou
seja, algo em torno de 250 megabytes para cada habitante na Terra (LYMAN; VARIAN,
2003). Um exabyte equivale a pouco mais de um bilhão de gigabytes. Estima-se que
documentos impressos, que eram o meio mais comum de informação textual há algumas
décadas, hoje representem apenas 0,003% da informação gerada anualmente (LYMAN;
VARIAN, 2003).
O suporte ao aumento de informação é possivel graças a evolução dos meios de
armazenamento magnéticos. Segundo Hilbert (2011), em 2000 os meios de armazenamento
magnéticos representavam 5% da capacidade mundial, saltando para 45% em 2007, e a
capacidade de armazenamento per capita que era de 2.866 megabytes em 1993, passou a ser
de 44.716 megabytes
...