TrabalhosGratuitos.com - Trabalhos, Monografias, Artigos, Exames, Resumos de livros, Dissertações
Pesquisar

Tecnologia Da Informaçao E Comunicaçao

Resenha: Tecnologia Da Informaçao E Comunicaçao. Pesquise 862.000+ trabalhos acadêmicos

Por:   •  15/9/2014  •  Resenha  •  1.983 Palavras (8 Páginas)  •  203 Visualizações

Página 1 de 8

TECNOLOGIA DA INFORMAÇAO E COMUNICAÇAO

RESUMO

Atualmente, o volume de informação gerado aumenta exponencialmente, sendo que uma

parcela significativa das informações encontra-se em formato textual. A partir desse formato é

possível extrair determinados conhecimentos. Entretanto, face ao grande volume de

informações disponíveis, seja na web ou mesmo nas organizações, tal tarefa constitui-se como

um desafio computacional. Superado os obstáculos, o conhecimento obtido através de

informações textuais pode ser utilizado na tomada de decisão com o intuito de gerar vantagem

competitiva. Um dos meios de se extrair conhecimento é através da utilização do processo de

Descoberta de Conhecimento em Bases de Dados e, no caso de informações textuais, através

do processo de Descoberta de Conhecimento em Textos. De maneira geral, os processos de

descoberta de conhecimento tradicionais são custosos quando aplicados em grandes coleções

de documentos, por exemplo, a web. Com este pressuposto é proposto neste trabalho uma

arquitetura para descoberta de conhecimento a partir de bases textuais almejando sua

utilização em grandes fontes de informação. Para atingir este objetivo, a proposta utiliza, além

da computação distribuída visando o aumento de desempenho, um modelo com base no

conceito de correlação rápida. A demonstração de viabilidade é realizada através de um

protótipo que implementa a arquitetura proposta. O protótipo tem a capacidade de gerar

informações que relacionam padrões textuais (termos) e de permitir uma visão da evolução

temporal em determinado domínio de problema. A aplicação do protótipo em um cenário

possibilitou demonstrar que a arquitetura proposta é capaz de obter resultados consistentes e

satisfatórios, tanto para o entendimento de determinado domínio, quanto para a análise de

grandes bases textuais.

Palavras-chave: Descoberta de Conhecimento; Bases Textuais; Correlação de Informação;

Computação Distribuída. ABSTRACT

Currently the amount of information increases exponentially in which a great portion of these

information is in textual format. From this format is possible to extract knowledge. However,

considering the huge volume of information available, either the web or even in organizations,

this task can be seen as a computational challenge. The knowledge acquired through textual

information, once overcome the obstacles, can be used in decision making process aiming to

generate competitive advantage. This can be done through Knowledge Discovery in Text. In

general, traditional knowledge discovery processes are expensive when applied to large

corpus, for instance, the web. Taken it into account is proposed in this work an architecture

for knowledge discovery from textual databases aiming its use in large sources of information.

Aiming to achieve the main objective this work focus on distributed computing in order to

increase performance and on a fast correlation based model. The feasibility is demonstrated

through a prototype implemented using the proposed architecture. The prototype has proved

the ability to extract information by

linking textual patterns (terms) and by allowing a

temporal view in a given domain. The application of the prototype in a scenario has

demonstrated that the proposed architecture is able to obtain consistent and satisfactory

results.

Keywords: Knowledge Discovery; Text Databases; Information Correlation; Distributed

Computing. LISTA DE FIGURAS

1. INTRODUÇÃO

A evolução das tecnologias da informação vem promovendo diversas mudanças na

sociedade em geral. Entre elas está a disponibilização de uma quantidade cada vez mais

crescente de informações, resultado principalmente do aumento da capacidade de

processamento e armazenamento. Este fenômeno torna-se cada vez mais evidente e vem

sendo observado por diversos estudiosos da área.

Em 2003 o mundo produzia entre um e dois exabytes de informação nova por ano, ou

seja, algo em torno de 250 megabytes para cada habitante na Terra (LYMAN; VARIAN,

2003). Um exabyte equivale a pouco mais de um bilhão de gigabytes. Estima-se que

documentos impressos, que eram o meio mais comum de informação textual há algumas

décadas, hoje representem apenas 0,003% da informação gerada anualmente (LYMAN;

VARIAN, 2003).

O suporte ao aumento de informação é possivel graças a evolução dos meios de

armazenamento magnéticos. Segundo Hilbert (2011), em 2000 os meios de armazenamento

magnéticos representavam 5% da capacidade mundial, saltando para 45% em 2007, e a

capacidade de armazenamento per capita que era de 2.866 megabytes em 1993, passou a ser

de 44.716 megabytes

...

Baixar como (para membros premium)  txt (14.3 Kb)  
Continuar por mais 7 páginas »
Disponível apenas no TrabalhosGratuitos.com