O Sistema de Recomendações, seguindo os padrões da web semântica
Por: brunoiossaqui • 4/3/2018 • Trabalho acadêmico • 8.228 Palavras (33 Páginas) • 212 Visualizações
UNIVERSIDADE ESTADUAL PAULISTA “JÚLIO DE MESQUITA FILHO”
FACULDADE DE CIÊNCIAS
CAMPUS DE BAURU - SP
BACHARELADO EM SISTEMAS DE INFORMAÇÃO
BRUNO GONÇALVES IOSSAQUI
MATHEUS FELIPE BARBOSA
DESENVOLVIMENTO DE UM SISTEMA DE CONSUMO DE DADOS DA WEB SEGUINDO OS PADRÕES DA WEB SEMÂNTICA
Bauru – SP
2016
BRUNO GONÇALVES IOSSAQUI
MATHEUS FELIPE BARBOSA
DESENVOLVIMENTO DE UM SITEMA DE CONSUMO DE DADOS DA WEB SEGUINDO OS PADRÕES DA WEB SEMÂNTICA
Trabalho de Conclusão de Curso apresentado ao Departamento de Computação da Faculdade de Ciências da Universidade Estadual Paulista – Campus de Bauru para obtenção de título de Bacharel em Sistemas de Informação.
Orientadora: Profa. Dra. Simone das Graças Domingues do Prado.
Bauru – SP
2016
RESUMO
A web semântica é um novo conceito da maneira com que é visto a internet, surgindo como maneira de trazer melhor interatividade e organização na forma da comunicação homem máquina na rede. Este projeto tem como finalidade apresentar algumas das mais importantes tecnologias usadas no momento em web semântica, iniciando com um estudo sobre o que vem a ser o Resource Description Framework (RDF), posteriormente uma análise da linguagem de consulta RDF chamada de Protocol and RDF Query Language (SPARQL), e por último um estudo do framework do Java chamado de Apache Jena, para que seja possível a comunicação da linguagem Java com os arquivos RDF através da linguagem SPARQL. Ao final, será mostrado uma aplicação para desktop com a utilização de todas essas tecnologias, conectada a um banco de dados poderoso localizado na internet com milhões de documentos a respeito dos mais variados assuntos, próprio para estudos em Web Semântica chamado DBpedia.
Palavras-chave: Web semântica; RDF; SPARQL; Apache Jena.
ABSTRACT
The Semantic Web is a new concept in the way that is seen internet, emerging as a way to bring better interactivity and organization in the form of man machine communication network. This project aims to present some of the most important technologies used at the time Semantic Web, starting with a study of what happens to be the Resource Description Framework (RDF), then an analysis of the query language RDF called Protocol and RDF Query language (SPARQL), and finally a Java framework of the study called Apache Jena, so that communication is possible the Java language with RDF files over the SPARQL language. Finally, an application desktop will be shown with the use of all these technologies, connected to a bank of powerful data located on the Internet with millions of documents about the most varied subjects, suitable for studies on Semantic Web called DBpedia .
Keywords: Web semântica; RDF; SPARQL; Apache Jena.
LISTA DE FIGURAS
Figura 1 - Sintaxe x Semântica 9
Figura 2 - Organização da web semântica 10
Figura 3 - Arquitetura do projeto 15
Figura 4 - Base de dados da DBpedia 17
Figura 5 – Grafo de uma tripla simples 19
Figura 6 – Grafo de uma tripla composta 20
Figura 7 - Grafo de um documento RDF 21
Figura 8 - Sintaxe do RDF 22
SUMÁRIO
1 INTRODUÇÃO 4
2 INTERNET 5
3 WEB 6
4 WEB SEMÂNTICA 8
5 ESTRUTURA DO PROJETO 15
6 BASE DE DADOS DA DBPEDIA 16
7 DOCUMENTO RDF 16
8 LINGUAGEM SPARQL 16
9 APACHE JENA 16
10 SISTEMA DE CONSUMO DE DADOS DA WEB – BANDAS MUSICAIS 16
Bibliografia 16
1 INTRODUÇÃO
Este trabalho tem como objetivo apresentar algumas tecnologias que auxiliam na construção de uma internet mais interativa e organizada, através da utilização de várias ferramentas e padrões de comunicação, mostrando que a internet vai muito além de trocas de arquivos e possui ainda um grande caminho a ser percorrido.
Durante esse trabalho será implementado um sistema em linguagem Java capaz de trazer informações das bandas musicais solicitadas pelo usuário do sistema como origem, ano de formação, estilos da banda musical, data de início da banda etc, junto a essas informações o sistema contará com um motor de recomendações inteligente que ajudará o usuário a encontrar o que procura.
O diferencial do software é que ele possui nada mais nada menos como banco de dados de consulta de informações, uma das maiores base de dados do mundo localizada na internet chamada de DBpedia, base de dados essa construída toda de acordo com as novas tecnologias de web semântica, para que novos estudos com essa base de dados possa nos dizer se realmente essas novas tecnologias é viável ou não futuramente, ou seja, tem potencial de trazer novas extensões a web que temos ou quem sabe até mesmo vir a substituí-la.
Para alcançar o objetivo desse projeto será de muita importância muito empenho e dedicação, pois a documentação e o material de pesquisa sobre o assunto é muito limitado até pelo fato de ser tudo muito recente ainda essas tecnologias estudadas nesse trabalho, quando encontrados apresentam barreiras muito comum de acesso, como estar o texto em outros idiomas, precisar de permissão de acesso à informação do autor do trabalho e até mesmo um alto custo para adquirir o material.
Os primeiros capítulos deste trabalho, traz uma visão rápida de conceitos do que é a internet, a web, e a web semântica, para tornar mais fácil a compreensão de tudo tratado nesse trabalho. Posteriormente, será realizado uma análise da arquitetura do projeto todo, contando com a ajuda de diagramas e ilustrações, que facilita muito o entendimento do todo. O último capítulo é destinado a parte prática do projeto, parte essa que será implementar o software de consumo de informações da web tendo como tema bandas musicais, unindo todas as tecnologias estudadas, demonstrando pontos positivos e negativos em se utilizar desses novos recursos em futuros projetos relacionados a web.
...