当您坐在电脑前使用 Google 搜索服务时,您会发现网络上所有的搜索结果,竟能在转瞬之间快速呈现在您的眼前。而 Google 是如何找到与您的查询内容相符的网页,又是如何决定搜索结果的顺序呢?

简单地说,您可以将搜索网络想像成在一大本书中进行查阅,书中提供了庞大的索引目录,可以告诉您所有资讯的确切位置。当您使用 Google 进行搜索时,我们的程式会查询索引以决定最相关的搜索结果,然后传回 (也就是“传送”) 给您。

传送搜索结果的三个主要程序如下:

检索

检索是指 Googlebot 发现可编入 Google 索引中的新网页或更新网页的程序。

我们使用大量电脑来抓取 (也就是“检索”) 网络上数十亿的网页,用来抓取网页的程式名为 Googlebot (又称为漫游器或自动寻检程式)。Googlebot 会使用一种演算程序,由计算机程序决定要检索的网站、检索频率,以及要从每个网站抓取多少网页。

Google 一开始会根据先前的检索程序所产生的网页网址清单,再结合网站管理员所提供的 Sitemap 资料,逐一检索各个网页。Googlebot 造访这些网站时,会侦测每个网页内的连结,并将这些连结新增到要检索的网页清单;任何新网站、现有网站的变更和无效连结都会被记录下来,用来更新 Google 的索引资料。

Google 不接受任何网站要求以付费方式增加其检索频率,并保证能够产生收益的 AdWords 服务将不会对搜索服务造成影响。

建立索引

Googlebot 会在检索程序完成后,将各个网页中所检索到字词及其位置编译成庞大的索引。此外,我们也会处理包括在关键内容标记和属性 (例如 TITLE 标记和 ALT 属性) 中的资讯。不过,Googlebot 虽然可以处理多种内容类型,但并非所有的内容类型,比方某些多媒体档案或动态网页的内容,就不在 Googlebot 的处理范围之内 。

传回结果

使用者输入查询字词时,我们的系统会搜索索引数据库,并找出符合的网页,再传回我们认为与使用者的查询内容最相关的结果。搜索关联性则取决于 200 多项因素,其中一项便是网页的 PageRank,而 PageRank 会根据其他外部网页连至某网页的连结量,来评估该网页的重要性。简单地说,每一个从其他网站连到您网页的连结都会提高您网站的 PageRank,不过每个连结的价值并不一致。在这方面,Google 致力于透过识别垃圾邮件连结和其他会对搜索结果带来负面影响的做法,以期改善使用体验。其中,最佳的连结类型是根据内容品质来提供的连结。

为了提高网站在搜索结果中的排名,请务必确认 Google 能够检索您的网站并正确建立索引。我们在《网站管理员指南》中列出了一些最佳做法,可协助您解决常见问题并提高网站的排名。

Google 的您是不是要查与 Google 自动完成功能会显示相关字词、常见拼字错误及热门查询,旨在协助使用者节省搜索时间。正如同 google.com.tw 产生搜索结果的运作机制,这些功能中使用的关键字也是透过网页检索器和搜索算法所产生的。我们只有在认为这些建议可以节省使用者时间的情况下,才会显示这些建议;如果某个网站因某个关键字而排名靠前,这是因为我们经过演算,确定该网站的内容与使用者的查询内容非常相关的缘故。

相关文章