PageRank
Projeto de pesquisa: PageRank. Pesquise 862.000+ trabalhos acadêmicosPor: bruno.88 • 9/6/2014 • Projeto de pesquisa • 2.567 Palavras (11 Páginas) • 258 Visualizações
PAGERANK
ALUNOS:
1.INTRODUÇÃO
A quantidade de informação na web está crescendo rapidamente, assim como o número de novos usuários inexperientes na arte da pesquisa web. Motores de busca automatizados que dependem de palavra-chave correspondente geralmente retornam muitos assuntos de baixa qualidade. Para piorar a situação, alguns anunciantes tentam ganhar a atenção das pessoas por meio de medidas destinadas a enganar os motores de busca automatizados.O número de informações na Internet é tão grande e diversificada que é praticamente impossível encontrar tudo o que se precisa sem o uso de um mecanismo de busca. Existem ferramentas de busca muito boas na Internet, como o Altavista, oAlltheWeb, o Yahoo e o MSN. No entanto, o Google destaca-se por algumas boas razões.
Desta forma abordaremos no presente trabalho sobre a ferramenta de busca do Google mais conhecida, o PageRank, e que através desse algoritmo tem se buscado a melhoria da qualidade da pesquisa com o objetivo de se obter resultados mais eficientes e satisfatórios para os usuários da internet.
2.O QUE É O PAGE RANK
PageRank (PR) é uma métrica criado pelo Larry page e utilizada pelo Google dentro do seu algorítmo para entender a importância que um site, ou página, tem para ele (Google) frente a Internet. Ele foi desenvolvido em 1995 na Universidade de Stanford por Larry Page, daí vem o nome “Page” Rank.
Basicamente o PageRank é uma avaliação da relevância de uma determinada página. Essa relevância é divulgada ao público em uma escala de 0 a 10, através da Toolbar do Google. Apesar disto, sabemos através de patentes divulgadas, que internamente o Google considera este número com várias casas decimais, para facilitar o cálculo, além deste valor ser baseado em uma escala logarítmica, ou seja, a diferença entre 1 e 2 é muito menor do que 3 para 4. Suas propriedades são muito discutidas por especialistas em optimização dos motores de busca (SEO, sigla em inglês para searchengineoptimization).
Sites importantes, de alta qualidade recebem uma nota de avaliação maior, que o Google grava a cada busca feita. Naturalmente, uma página importante não significa nada se não combinar com a sua busca. Assim, o Google combina os resultados de alta qualidade com a busca que você está realizando para que o resultado seja o mais relevante possível. O Google pesquisa quantas vezes a palavra procurada aparece nas páginas e examina todo o aspecto delas (e conteúdo das páginas ligadas a ela) para determinar o melhor resultado para a sua busca.
Suas propriedades são muito discutidas por especialistas em optimização dos motores de busca (SEO, sigla em inglês parasearchengineoptimization).
O processo do PageRank foi patenteado pela Universidade de Stanford nos Estados Unidos sob o número 6.285.999.1Somente o nome PageRank é uma marca registrada do Google.
O Google tem os direitos de licença exclusivos sobre a patente de PageRank. A universidade de Stanford recebeu 1,8 milhão de ações do Google em troca do uso da patente. As ações foram vendidas em 2005 por 336 milhões de dólares .
2.1. Estrutura de Links da Internet
As páginas da Internet possuem links que apontam para outras páginas, conhecidos como forward links. Os links que apontam para uma determinada página são chamados de backlinks. Enquanto nem todos os backlinks de uma página são conhecidos, ao obter uma página da Internet é possível saber todos os forward links que ela possui. De maneira geral, páginas com um grande número de backlinks podem ser consideradas mais importantes do que aquelas com menos backlinks. A inovação do PageRank vem de casos em que acontagem de citações não reflete a noção de importância que os usuários estão procurando. Por exemplo, se uma página possui um link de um portal como o Yahoo para ela, mesmo que este seja o único backlink desta
página, é um backlink altamente importante. Esta página deve aparecer no ranking em uma posição mais alta do que outras páginas com muitos links porém de lugares obscuros. O PageRank é uma tentativa de aproximar a importância de uma página através da estrutura de links. Assim, o PageRank é definido da
seguinte maneira: uma página possui um ranking alto se a soma dos rankings de seus backlinks é alta. Esta definição serve tanto para o caso de uma página com muitos backlinks como para o caso de um página com
poucos backlinks muito importantes.
3.DESCRIÇÃO
PageRank pode ser considerado como um modelo de comportamento do utilizador. Assumimos um "surfista aleatório" que é dada uma página web de forma aleatória e mantém clicar em links, nunca bater "de volta", mas, eventualmente, fica entediado e começa em outra página aleatória. A probabilidade de que o surfista aleatória visita uma página é o seu PageRank. E, o fator de amortecimento é a probabilidade em cada página do "surfista aleatório" vai se cansar e solicitar outra página aleatória. Uma variação importante é adicionar apenas o factor de amortecimento para uma página única, ou um grupo de páginas. Isto permite a personalização e pode torná-lo quase impossível enganar deliberadamente o sistema, a fim de obter uma melhor classificação.Temos várias outras extensões para PageRank, mais uma vez ver .
O Google mantém uma lista de bilhões de páginas em ordem de importância, isto é, cada página tem sua importância na Web como um todo; esse Banco de Páginas mantém desde a página mais importante do mundo até a menos importante. Essa importância se dá pelo número de votos que uma página recebe. Um voto é um link em qualquer lugar da Web para aquela página. Votos de páginas mais importantes valem mais do que votos de páginas menos importantes.
Esse critério de ordenação das páginas, de acordo com várias pessoas, é bastante democrático, refletindo o que a "Web pensa" sobre determinado termo. Lembre-se que cerca de dez bilhões de páginas
...