Uma Arquitetura Para Descoberta E Conhecimento (tcc)
Artigo: Uma Arquitetura Para Descoberta E Conhecimento (tcc). Pesquise 862.000+ trabalhos acadêmicosPor: 203040 • 30/3/2014 • 3.658 Palavras (15 Páginas) • 654 Visualizações
1. INTRODUÇÃO
A evolução das tecnologias da informação vem promovendo diversas mudanças na
sociedade em geral. Entre elas está a disponibilização de uma quantidade cada vez mais
crescente de informações, resultado principalmente do aumento da capacidade de
processamento e armazenamento. Este fenômeno torna-se cada vez mais evidente e vem
sendo observado por diversos estudiosos da área.
Em 2003 o mundo produzia entre um e dois exabytes de informação nova por ano, ou
seja, algo em torno de 250 megabytes para cada habitante na Terra (LYMAN; VARIAN,
2003). Um exabyte equivale a pouco mais de um bilhão de gigabytes. Estima-se que
documentos impressos, que eram o meio mais comum de informação textual há algumas
décadas, hoje representem apenas 0,003% da informação gerada anualmente (LYMAN;
VARIAN, 2003).
O suporte ao aumento de informação é possivel graças a evolução dos meios de
armazenamento magnéticos. Segundo Hilbert (2011), em 2000 os meios de armazenamento
magnéticos representavam 5% da capacidade mundial, saltando para 45% em 2007, e a
capacidade de armazenamento per capita que era de 2.866 megabytes em 1993, passou a ser
de 44.716 megabytes em 2007.
Parte considerável dessa informação encontra-se na forma de textos nos mais
diversos formatos. Desde a década de noventa estudos como os de Wilks e Catizone (1999) já
apontavam que 80% da informação encontrava-se na forma textual. A cada ano são
produzidos aproximadamente 968 mil livros, 80 mil revistas, 40 mil periódicos, bilhões de
documentos (LYMAN; VARIAN, 2003). Além das fontes já citadas, redes sociais, wikis, e
blogs também podem, e dependendo do foco de análise, devem ser consideradas como 16
importantes fontes de informação textual devido principalmente a sua dinamicidade. Weiss
(2005) afirma ainda que informações textuais em linguagem natural são importantes fontes de
informação, e que na maioria das vezes são ignoradas pelas organizações. “Se por um lado
essa situação propicia muitas oportunidades de uso dessa informação para a tomada de
decisão, por outro, lança muitos desafios em como armazenar, recuperar e transformar essa
informação em conhecimento” (BOVO, 2011).
Um dos objetivos da análise da informação é a possibilidade de gerar conhecimento.
Segundo Tuomi (1999) o caminho para o conhecimento é hierárquico, isto é, primeiramente
são produzidos os dados (simples fatos) e em seguida, quando estruturados, são transformados
em informação. A informação se torna conhecimento quando é interpretada, aplicada em um
contexto, ou quando se adiciona significado a mesma. O conhecimento nos possibilita
direcionar ações, tomar decisões, agir em determinadas situações (SCHREIBER et al., 2002).
Autores como Wilson (2002) e Alavi et al. (2001) afirmam que o conhecimento
envolve processos mentais, entendimento e aprendizagem, e como tal, reside somente na
mente das pessoas. Afirmam ainda que tudo aquilo que se utilize para expressar algo é
realizado por meio de mensagens, desse modo, não constitui conhecimento e sim informação.
Entretanto, outros autores consideram que o conhecimento pode ser explicitado (NONAKA;
TAKEUCHI, 1995; SCHREIBER et al., 2002). Para Gonçalves (2006), não o conhecimento
em si, mas redes de relacionamento, regras, padrões, tendências, entre outros, podem ser
explicitados e se constituem, portanto, em ativos de conhecimento. Esses ativos podem então,
através de ferramental adequado, serem descobertos visando auxiliar em processos de tomada
de decisão.
Entre as possibilidades de ferramental visando identificar tais ativos a partir das
informações geradas em determinado domínio encontram-se os processos de Descoberta de
Conhecimento em Bases de Dados (Knowledge Discovery in Database - KDD) e de
Descoberta de Conhecimento em Texto (Knowledge Discovery in Texts - KDT).
O processo de “KDD é o termo utilizado para promover a descoberta de
conhecimento em bases de dados, e assim identificar e descrever os relacionamentos
implícitos entre as informações nos bancos de dados em sistemas de uma organização”
(SILVA; ROVER, 2011). 17
Considerando o processo de KDT este é similar ao KDD, porém trabalha com um
corpus (coleção de documentos) em linguagem natural, buscando padrões e tendências,
classificando e comparando documentos (SILVA; ROVER, 2011). Apesar do objetivo em
comum, a descoberta de conhecimento, o KDT e o KDD, possuem diferenças importantes. A
principal delas refere-se ao tipo de informação uma vez que
...