Home seta Publicidade seta Sistemas de Busca Orgânica  
04-Dec-2008
Sistemas de Busca Orgânica PDF Imprimir E-mail
Classificação: / 0
FracoBom 
Escrito por SEO   
09-Aug-2004

Sistemas de Busca Orgânica

Google foi iniciado por dois estudantes PhD da Universidade_de_Stanford, Sergey Brin e Larry Page, e trouxe um novo conceito para avaliar páginas da web. Este conceito, chamado PageRank™, foi importante para o início da criação dos algoritmos do Google.

O PageRank™ trabalha principalmente com o fator link e usa a lógica deste sistema de ligação entre páginas como se tivesse o valor de um voto para a página em questão. O fato de uma página ser referenciada através de um link funciona de forma a validar a existência do site e dar um valor mais "digno" ao voto. O valor de cada link de referência varia diretamente baseado no PageRank da página que faz referência ao link e funciona de forma inversa no número de links de saídas de uma página.

Sistemas de Busca Orgânica

Google foi iniciado por dois estudantes PhD da Universidade_de_Stanford, Sergey Brin e Larry Page, e trouxe um novo conceito para avaliar páginas da web. Este conceito, chamado PageRank™, foi importante para o início da criação dos algoritmos do Google.

O PageRank™ trabalha principalmente com o fator link e usa a lógica deste sistema de ligação entre páginas como se tivesse o valor de um voto para a página em questão. O fato de uma página ser referenciada através de um link funciona de forma a validar a existência do site e dar um valor mais "digno" ao voto. O valor de cada link de referência varia diretamente baseado no PageRank da página que faz referência ao link e funciona de forma inversa no número de links de saídas de uma página.

Com ajuda de PageRank™, o Google provou ser muito eficiênte em oferecer resultados relevantes nas páginas de resultados e tornou-se o sistema de busca mais bem sucedido e popular.

Pelo motivo do sistema PageRank™ fazer a avaliação de websites através de fatores externos ou fora do controle de pessoas em particular, o Google sentiu que desta maneira poderia ser mais difícil de manipular a relevância de uma página.

No entanto, webmasters já tinham desenvolvido ferramentas para manipulação de link´s e esquemas para influenciar o sistema de busca Inktomi. Estes métodos provaram ser igualmente aplicáveis aos Algoritmos do Google. Muitos sites focalizaram suas ações em trocar, comprar, e vender links numa escala imensa. A confiança do PageRank no sistema de link como um voto de confiança para um valor da página foi subvertido como muitos webmasters procuraram vender links simplesmente para influenciar o Google em enviar mais tráfego, independentemente dos links serem realmente útil as visitantes humanos do site.

Para complicar a situação, o suporte-de-busca omitia o mapeamento de uma página web inteira para procurar as chamadas palavras-relacionadas nas páginas web, e uma página web contendo uma listagem do tipo dicionário ainda combinaria quase todas as buscas (exceto nomes especiais) alcançando alcançando um link-rank mais alto. Páginas de dicionários e links para esquemas podem distorcer severamente os resultados de uma página de resultados.

Já era tempo para o Google -- e outros motores de procura -- olharem para algo mais distante sobre os fatores fora de controle humano. Havia outras razões para desenvolver algoritmos mais inteligentes.

A Internet estava alcançando uma grande parcela de usuários não-técnicos, que geralmente não conheciam técnicas avançadas de pesquisa que os ajudassem a encontrar a informação que eles estavam buscando e além disso o volume e complexidade dos dados indexados tiveram um enorme crescimento em relação aos primórdios da Internet.

Alguns dos itens considerados no Algorítimo de Page Rank do google

* Idade do sítio(site)
* Há quanto tempo o domínio está registrado
* Idade do conteúdo
* Freqüência do conteúdo: regularidade com a qual novo conteúdo é adicionado
* Tamanho do texto: número de palavras acima de 200-250 (não afetava o Google em 2005)
* Idade do link e reputação do sítio que o aponta
* Standard on-site factors
* Negative scoring for on-site factors (for example, a dampening for websites with extensive keyword meta-tags indicative of having been optimized [^SEO-ed])
* Uniqueness of content
* Related terms used in content (the terms the search engine associates as being related to the main content of the page)
* Google Pagerank (Only used in Google's algorithm)
* External links, the anchor text in those external links and in the sites/pages containing those links
* Citations and research sources (indicating the content is of research quality)
* Stem-related terms in the search engine's database (finance/financing)
* Incoming backlinks and anchor text of incoming backlinks
* Negative scoring for some incoming backlinks (perhaps those coming from low value pages, reciprocated backlinks, etc.)
* Rate of acquisition of backlinks: too many too fast could indicate "unnatural" link buying activity
* Text surrounding outward links and incoming backlinks. A link following the words "Sponsored Links" could be ignored
* Use of "rel=nofollow" to suggest that the search engine should ignore the link
* Depth of document in site
* Metrics collected from other sources, such as monitoring how frequently users hit the back button when SERPs send them to a particular page
* Metrics collected from sources like the Google Toolbar, Google AdWords/Adsense programs, etc.
* Metrics collected in data-sharing arrangements with third parties (like providers of statistical programs used to monitor site traffic)
* Rate of removal of incoming links to the site
* Use of sub-domains, use of keywords in sub-domains and volume of content on sub-domains… and negative scoring for such activity
* Semantic connections of hosted documents
* Rate of document addition or change
* IP of hosting service and the number/quality of other sites hosted on that IP
* Other affiliations of linking site with the linked site (do they share an IP? have a common postal address on the "contact us" page?)
* Technical matters like use of 301 to redirect moved pages, showing a 404 server header rather than a 200 server header for pages that don't exist, proper use of robots.txt
* Hosting uptime
* Whether the site serves different content to different categories of users (cloaking)
* Broken outgoing links not rectified promptly
* Unsafe or illegal content
* Quality of HTML coding, presence of coding errors
* Actual click through rates observed by the search engines for listings displayed on their SERPs
* Hand ranking by humans of the most frequently accessed SERPs
Atualizado em ( 02-Sep-2007 )
 
< Anterior   Próximo >
Stats





Banners
Advertisement
Advertisement
Download
file icon Torne-se o alvo de seus clientes
(eBook)

file icon The Cluetrain Manifesto
(eBook)

file icon Passo a Passo: Como obter boas palavras chaves
(eBook)

News Letter

Assine nossa NewsLetter mensal "Marketing na Internet" GRATUITAMENTE e aprenda os segredos que as grandes empresas presentes na internet tem utilizado para promover sua presença na internet, isto tudo sem custo algum para você!

MAIS, Assine hoje e receba nosso exclusivo relatório "Passo a passo: Como obter boas Palavras-chaves"






Tag Clouds
ansiedade interrogat existentes considerado supremo criminal anunciante oferecer preventiva examinar detalhes apresentadas turismo declarar spamdexing confirmar utilizados concentrado maneira aumento interessada objetivo suspender extradi incluindo tamanho endomarketing efeitos internacionais primeiros

Joomla Modul

Social Bookmark
Add to: Mr. Wong Add to: Webnews Add to: Icio Add to: Oneview Add to: Yigg Add to: Linkarena Add to: Digg Add to: Del.icoi.us Add to: Reddit Add to: Simpy Add to: StumbleUpon Add to: Slashdot Add to: Netscape Add to: Furl Add to: Yahoo Add to: Blogmarks Add to: Diigo Add to: Technorati Add to: Newsvine Add to: Blinkbits Add to: Ma.Gnolia Add to: Smarking Add to: Netvouz Add to: Folkd Add to: Spurl Add to: Google Add to: Blinklist Information
Social Bookmarking