TrabalhosGratuitos.com - Trabalhos, Monografias, Artigos, Exames, Resumos de livros, Dissertações
Pesquisar

Uma Arquitetura Para Descoberta E Conhecimento (tcc)

Artigo: Uma Arquitetura Para Descoberta E Conhecimento (tcc). Pesquise 862.000+ trabalhos acadêmicos

Por:   •  30/3/2014  •  3.658 Palavras (15 Páginas)  •  654 Visualizações

Página 1 de 15

1. INTRODUÇÃO

A evolução das tecnologias da informação vem promovendo diversas mudanças na

sociedade em geral. Entre elas está a disponibilização de uma quantidade cada vez mais

crescente de informações, resultado principalmente do aumento da capacidade de

processamento e armazenamento. Este fenômeno torna-se cada vez mais evidente e vem

sendo observado por diversos estudiosos da área.

Em 2003 o mundo produzia entre um e dois exabytes de informação nova por ano, ou

seja, algo em torno de 250 megabytes para cada habitante na Terra (LYMAN; VARIAN,

2003). Um exabyte equivale a pouco mais de um bilhão de gigabytes. Estima-se que

documentos impressos, que eram o meio mais comum de informação textual há algumas

décadas, hoje representem apenas 0,003% da informação gerada anualmente (LYMAN;

VARIAN, 2003).

O suporte ao aumento de informação é possivel graças a evolução dos meios de

armazenamento magnéticos. Segundo Hilbert (2011), em 2000 os meios de armazenamento

magnéticos representavam 5% da capacidade mundial, saltando para 45% em 2007, e a

capacidade de armazenamento per capita que era de 2.866 megabytes em 1993, passou a ser

de 44.716 megabytes em 2007.

Parte considerável dessa informação encontra-se na forma de textos nos mais

diversos formatos. Desde a década de noventa estudos como os de Wilks e Catizone (1999) já

apontavam que 80% da informação encontrava-se na forma textual. A cada ano são

produzidos aproximadamente 968 mil livros, 80 mil revistas, 40 mil periódicos, bilhões de

documentos (LYMAN; VARIAN, 2003). Além das fontes já citadas, redes sociais, wikis, e

blogs também podem, e dependendo do foco de análise, devem ser consideradas como 16

importantes fontes de informação textual devido principalmente a sua dinamicidade. Weiss

(2005) afirma ainda que informações textuais em linguagem natural são importantes fontes de

informação, e que na maioria das vezes são ignoradas pelas organizações. “Se por um lado

essa situação propicia muitas oportunidades de uso dessa informação para a tomada de

decisão, por outro, lança muitos desafios em como armazenar, recuperar e transformar essa

informação em conhecimento” (BOVO, 2011).

Um dos objetivos da análise da informação é a possibilidade de gerar conhecimento.

Segundo Tuomi (1999) o caminho para o conhecimento é hierárquico, isto é, primeiramente

são produzidos os dados (simples fatos) e em seguida, quando estruturados, são transformados

em informação. A informação se torna conhecimento quando é interpretada, aplicada em um

contexto, ou quando se adiciona significado a mesma. O conhecimento nos possibilita

direcionar ações, tomar decisões, agir em determinadas situações (SCHREIBER et al., 2002).

Autores como Wilson (2002) e Alavi et al. (2001) afirmam que o conhecimento

envolve processos mentais, entendimento e aprendizagem, e como tal, reside somente na

mente das pessoas. Afirmam ainda que tudo aquilo que se utilize para expressar algo é

realizado por meio de mensagens, desse modo, não constitui conhecimento e sim informação.

Entretanto, outros autores consideram que o conhecimento pode ser explicitado (NONAKA;

TAKEUCHI, 1995; SCHREIBER et al., 2002). Para Gonçalves (2006), não o conhecimento

em si, mas redes de relacionamento, regras, padrões, tendências, entre outros, podem ser

explicitados e se constituem, portanto, em ativos de conhecimento. Esses ativos podem então,

através de ferramental adequado, serem descobertos visando auxiliar em processos de tomada

de decisão.

Entre as possibilidades de ferramental visando identificar tais ativos a partir das

informações geradas em determinado domínio encontram-se os processos de Descoberta de

Conhecimento em Bases de Dados (Knowledge Discovery in Database - KDD) e de

Descoberta de Conhecimento em Texto (Knowledge Discovery in Texts - KDT).

O processo de “KDD é o termo utilizado para promover a descoberta de

conhecimento em bases de dados, e assim identificar e descrever os relacionamentos

implícitos entre as informações nos bancos de dados em sistemas de uma organização”

(SILVA; ROVER, 2011). 17

Considerando o processo de KDT este é similar ao KDD, porém trabalha com um

corpus (coleção de documentos) em linguagem natural, buscando padrões e tendências,

classificando e comparando documentos (SILVA; ROVER, 2011). Apesar do objetivo em

comum, a descoberta de conhecimento, o KDT e o KDD, possuem diferenças importantes. A

principal delas refere-se ao tipo de informação uma vez que

...

Baixar como (para membros premium)  txt (24.7 Kb)  
Continuar por mais 14 páginas »
Disponível apenas no TrabalhosGratuitos.com