Biblioteconomia, museologia e arquivologia
Por: LudmillaToledo • 9/9/2017 • Trabalho acadêmico • 3.255 Palavras (14 Páginas) • 263 Visualizações
Sistemas e Redes de Informação
1.1 Sistemas de Recuperação da Informação
A recuperação da informação consiste em encontrar a informação desejada em um armazém de informação ou base de dados (Meadows, 1992). Embora possa ter essa conotação mais ampla, na área de Biblioteconomia e Ciência da Informação a expressão tem sido usada para significar busca de literatura. Se a recuperação da informação consiste na busca de uma coleção de documentos para identificar aqueles que satisfazem uma determinada necessidade de informação, sistemas de recuperação da informação (SRIs) são aqueles sistemas criados para facilitar essa busca (Lancaster e Warner, 1993).
[O termo documento é usado no seu sentido mais amplo, não se restringindo apenas a textos, incluindo sons, imagens ou quaisquer outros objetos informativos. (Buckland, 1991)]
Embora a recuperação da informação não seja necessariamente uma atividade computacional, na prática, hoje, SRIs são automatizados. Exemplos de SRIs são catálogos de bibliotecas, bases de dados bibliográficos (como, aquelas disponibilizadas no Portal Capes: Library and Information Sciences Abstracts – LISA, Web of Science e outras), e motores de busca na internet (como, o Google). Normalmente os SRIs lidam com documentos que contêm principalmente texto, e esse é o seu grande desafio, já que devem se defrontar com a ambiguidade da palavra na recuperação da informação. Caracterizam-se também por lidarem com informações de natureza externa (versus informação interna a empresas e instituições), o que os diferencia de outros sistemas como os de informações gerenciais. Em sua definição mais ampla, SRIs pode, também, lidar apenas com o problema da recuperação textual. Um sistema de armazenamento e recuperação de desenhos de engenharia, por exemplo, seria também um SRI. Já um catálogo de fichas seria um exemplo de um SRI não automatizado.
Devido às vantagens e facilidades que os SRIs automatizados oferecem para busca de informação, seu uso tem se tornado cada vez mais comum. Esses sistemas oferecem maior número de pontos de acesso que os SRIs não automatizados, podendo-se, muitas vezes, pesquisar palavras-chave que aparecem em qualquer ponto do registro, inclusive no resumo e no texto completo, quando estes estão disponíveis. Além disso, permitem realizar pesquisas mais complexas, em que vários conceitos necessitam ser relacionados, pois pode-se combinar grande número de termos de busca com lógica booleana, de maneiras que não seriam possíveis nos SRIs impressos. Permitem também fazer, rapidamente, buscas abrangentes, cobrindo vários anos de publicações. Essas e outras facilidades representam uma grande economia de tempo para o usuário, permitindo que uma pesquisa que poderia tomar muitas horas de trabalho, se realizada manualmente, seja executada bem mais rapidamente, com o uso dos computadores.
1.2 O Funcionamento dos Sistemas de Recuperação da Informação
Um sistema de recuperação da informação pode ser representado como no diagrama a seguir, proposto por Lancaster (1979):
Diagrama 1: Funções de um sistema de recuperação da informação[pic 1]
A aquisição de documentos por um serviço de informação implica na existência de um critério de seleção, o qual, por sua vez, requer um conhecimento das necessidades de informação da comunidade à qual o serviço atende. Critérios para seleção de documentos incluem, por exemplo, assunto, tipo de documento, idioma, ou fonte. Uma vez adquiridos, os documentos são organizados e controlados para que possam ser identificados em resposta às consultas dos usuários. A indexação por assunto envolve a análise conceitual, ou análise de conteúdo, e a sua tradução para um vocabulário ou linguagem de indexação. Em alguns sistemas, isso implica no uso de um vocabulário controlado, ou seja, um conjunto limitado de termos que devem ser usados para representar o assunto de um documento. Esse vocabulário pode ser uma lista de cabeçalho de assunto, um esquema de classificação ou um tesaurus, por exemplo. A representação de assuntos do documento pode ser feita também através de um vocabulário não controlado, seja pelo uso de palavras ou frases que ocorrem no documento que está sendo indexado ou de termos escolhidos pelo indexador. Os temos usados pelo indexador, sejam eles provenientes de um vocabulário controlado ou não controlado, são chamados termos de indexação.
Uma vez terminado o processo de indexação, os documentos são arquivados em alguma forma de base de dados de documentos; e os registros contendo as representações dos documentos são colocados em uma outra base de dados, onde eles são organizados de forma que possam ser pesquisados. Em sistemas utilizando tecnologias anteriores, essa base de dados de representações de documentos poderia ter a forma, por exemplo, de um catálogo de fichas ou de um índice impresso. Hoje, ela toma a forma de uma base de dados eletrônica.
A base de dados de documentos e a base de dados das representações de documentos, hoje, já não são sempre distintas. Tornam-se cada vez mais comuns representações de documentos contendo não apenas termos de indexação, mas, também, resumos e, mais recentemente, tem se firmado a tendência das bases de dados conterem documentos em texto completo.
Do ponto de vista do usuário, os passos envolvidos no funcionamento de um SRI são semelhantes. As perguntas dos usuários passam por uma análise conceitual e são traduzidas para o vocabulário do sistema. Depois disso, é elaborada a estratégia de busca e formulada a expressão de busca, na qual os termos da busca são relacionados entre si através de operadores booleanos ou não booleanos. A estratégia de busca consiste em um plano para encontrar a informação desejada em que várias expressões de busca podem ser utilizadas. Através da expressão de busca, o sistema compara, então, as representações dos documentos com as das perguntas dos usuários. Na fase final, os documentos recuperados através da consulta ao sistema são apresentados ao usuário para que este julgue, então, sua relevância para as suas necessidades de informação. Pode ser que o usuário decida modificar a sua estratégia de busca com base nos documentos recuperados (feedback), reiniciando-se o processo.
1.3 A Pesquisa em Recuperação da Informação
As origens da pesquisa para avaliar e melhorar a performance de sistemas de recuperação da informação são encontradas em 1953, com a execução de testes, separadamente, na Grã-Bretanha e nos Estados Unidos, sobre o desempenho de um sistema de indexação então recém-lançado o controverso, o Uniterm, criado por Mortimer Taube. Esse sistema representava documentos por termos únicos retirados do título ou resumo, ao contrário de abordagens mais tradicionais para indexação por assunto. Os testes de avaliação foram executados pelo Armed Services Technical Information Agency (ASTIA), nos Estados Unidos (chamados de testes Uniterm e relatados por Gull, 1956), e pelo College of Aeronautics in Cranfield, no Reino Unido (chamados de “os testes Cranfield-Uniterm” e descritos por Thorne, 1955).
...