| Sistemas de Busca Orgânica |
|
|
|
| Escrito por SEO | |
| 09-Aug-2004 | |
Sistemas de Busca OrgânicaGoogle foi iniciado por dois estudantes PhD da Universidade_de_Stanford, Sergey Brin e Larry Page, e trouxe um novo conceito para avaliar páginas da web. Este conceito, chamado PageRank™, foi importante para o início da criação dos algoritmos do Google.O PageRank™ trabalha principalmente com o fator link e usa a lógica deste sistema de ligação entre páginas como se tivesse o valor de um voto para a página em questão. O fato de uma página ser referenciada através de um link funciona de forma a validar a existência do site e dar um valor mais "digno" ao voto. O valor de cada link de referência varia diretamente baseado no PageRank da página que faz referência ao link e funciona de forma inversa no número de links de saídas de uma página. Sistemas de Busca OrgânicaGoogle foi iniciado por dois estudantes PhD da Universidade_de_Stanford, Sergey Brin e Larry Page, e trouxe um novo conceito para avaliar páginas da web. Este conceito, chamado PageRank™, foi importante para o início da criação dos algoritmos do Google.O PageRank™ trabalha principalmente com o fator link e usa a lógica deste sistema de ligação entre páginas como se tivesse o valor de um voto para a página em questão. O fato de uma página ser referenciada através de um link funciona de forma a validar a existência do site e dar um valor mais "digno" ao voto. O valor de cada link de referência varia diretamente baseado no PageRank da página que faz referência ao link e funciona de forma inversa no número de links de saídas de uma página. Com ajuda de PageRank™, o Google provou ser muito eficiênte em oferecer resultados relevantes nas páginas de resultados e tornou-se o sistema de busca mais bem sucedido e popular. Pelo motivo do sistema PageRank™ fazer a avaliação de websites através de fatores externos ou fora do controle de pessoas em particular, o Google sentiu que desta maneira poderia ser mais difícil de manipular a relevância de uma página. No entanto, webmasters já tinham desenvolvido ferramentas para manipulação de link´s e esquemas para influenciar o sistema de busca Inktomi. Estes métodos provaram ser igualmente aplicáveis aos Algoritmos do Google. Muitos sites focalizaram suas ações em trocar, comprar, e vender links numa escala imensa. A confiança do PageRank no sistema de link como um voto de confiança para um valor da página foi subvertido como muitos webmasters procuraram vender links simplesmente para influenciar o Google em enviar mais tráfego, independentemente dos links serem realmente útil as visitantes humanos do site. Para complicar a situação, o suporte-de-busca omitia o mapeamento de uma página web inteira para procurar as chamadas palavras-relacionadas nas páginas web, e uma página web contendo uma listagem do tipo dicionário ainda combinaria quase todas as buscas (exceto nomes especiais) alcançando alcançando um link-rank mais alto. Páginas de dicionários e links para esquemas podem distorcer severamente os resultados de uma página de resultados. Já era tempo para o Google -- e outros motores de procura -- olharem para algo mais distante sobre os fatores fora de controle humano. Havia outras razões para desenvolver algoritmos mais inteligentes. A Internet estava alcançando uma grande parcela de usuários não-técnicos, que geralmente não conheciam técnicas avançadas de pesquisa que os ajudassem a encontrar a informação que eles estavam buscando e além disso o volume e complexidade dos dados indexados tiveram um enorme crescimento em relação aos primórdios da Internet. Alguns dos itens considerados no Algorítimo de Page Rank do google * Idade do sítio(site) * Há quanto tempo o domínio está registrado * Idade do conteúdo * Freqüência do conteúdo: regularidade com a qual novo conteúdo é adicionado * Tamanho do texto: número de palavras acima de 200-250 (não afetava o Google em 2005) * Idade do link e reputação do sítio que o aponta * Standard on-site factors * Negative scoring for on-site factors (for example, a dampening for websites with extensive keyword meta-tags indicative of having been optimized [^SEO-ed]) * Uniqueness of content * Related terms used in content (the terms the search engine associates as being related to the main content of the page) * Google Pagerank (Only used in Google's algorithm) * External links, the anchor text in those external links and in the sites/pages containing those links * Citations and research sources (indicating the content is of research quality) * Stem-related terms in the search engine's database (finance/financing) * Incoming backlinks and anchor text of incoming backlinks * Negative scoring for some incoming backlinks (perhaps those coming from low value pages, reciprocated backlinks, etc.) * Rate of acquisition of backlinks: too many too fast could indicate "unnatural" link buying activity * Text surrounding outward links and incoming backlinks. A link following the words "Sponsored Links" could be ignored * Use of "rel=nofollow" to suggest that the search engine should ignore the link * Depth of document in site * Metrics collected from other sources, such as monitoring how frequently users hit the back button when SERPs send them to a particular page * Metrics collected from sources like the Google Toolbar, Google AdWords/Adsense programs, etc. * Metrics collected in data-sharing arrangements with third parties (like providers of statistical programs used to monitor site traffic) * Rate of removal of incoming links to the site * Use of sub-domains, use of keywords in sub-domains and volume of content on sub-domains… and negative scoring for such activity * Semantic connections of hosted documents * Rate of document addition or change * IP of hosting service and the number/quality of other sites hosted on that IP * Other affiliations of linking site with the linked site (do they share an IP? have a common postal address on the "contact us" page?) * Technical matters like use of 301 to redirect moved pages, showing a 404 server header rather than a 200 server header for pages that don't exist, proper use of robots.txt * Hosting uptime * Whether the site serves different content to different categories of users (cloaking) * Broken outgoing links not rectified promptly * Unsafe or illegal content * Quality of HTML coding, presence of coding errors * Actual click through rates observed by the search engines for listings displayed on their SERPs * Hand ranking by humans of the most frequently accessed SERPs |
|
| Atualizado em ( 02-Sep-2007 ) |
| < Anterior | Próximo > |
|---|





