谷歌搜索引擎是如何工作的?


    关于搜索引擎原理,以前的上海seo文章中都有提到,可能以前在写文章的过程,一些应该注意的地方没有特殊表明,但是我觉得如果你真正认真的阅读了文章,每篇文章都有其价值,今天主要描述下谷歌搜索引擎是如何对网页进行抓取、索引和提供搜索结果。
网页的抓取
    每个搜索引擎都是自己爬虫程序,谷歌的爬虫程序名字叫“Googlebot”,俗称谷歌机器人,爬行的路径是根据网页上的链接来进行展开,在对网页进行爬取的时候,该网页中的链接会以列表的形式进行记录,具体是什么样子的大家可以参考下“利用Lynx浏览器查看你的网站内容”,随着链接列表的更新,爬虫程序会慢慢发现更多新的网页,从而将发现的网页进行记录,如果网站中有某一个页面包含网站的绝大部分链接列表,而保持这个列表更新,这是不是就更有利于网页的收录,提高网站的收录两呢?
    编制索引
    通过爬虫程序的辛勤劳动,抓取了大量的网页信息,谷歌会将抓取到的所有字词和这些字词在网页中的位置都编入包含大量索引的索引列表中, 谷歌还会处理关键内容和一些属性中的信息,比如Title和Alt标签,但是,它只能处理部分类型的信息,比如像JS、flash、图片等信息还不能准确 是识别,但是随着谷歌的技术更新,它会慢慢尝试着去分析这些类型的信息,比如简单的JS文件,flash中的链接信息、图片的颜色及相似度。
    提供搜索结果
    当被抓取的信息被分配到索引列表中以后,接下来就是通过算法向用户提供与搜索关键词匹配的搜索结果了,这个过程也是众多SEO爱好者非常关注的了,当用户输入关键词并点击搜索后,谷歌会更具用户输入的文字或词语到索引库中进行查找相关信息,并按相关性对查询到的数据进行排序,再展示排序结果(搜索结果)。
    上面提到的相关性,根据谷歌至今的说法,一共由200多个因素来确定,其中包括PR值,这里的PR值主要是由链接来构成的,也就是我们经常说的内部 链接和外部链接。这些链接如何做,如何让我们的链接更加优秀(无论是对用户还是搜索引擎),博客以前有相关文章已经谈过,大家可以参考下。
    这里需要提醒的是,谷歌(百度也一样)的相关搜索、提示搜索和拼写建议,这些对我们进行网站长尾关键词和一些文字排版以及URL标准化或许有所帮助,有兴趣可以注意下。
    文章中部分文字进行了加粗,这些并非单为SEO而作,更多的是你应该更加注意这些加粗的文字及所表达的意思。
转载请注明:上海seo网址:www.tiantianseo.com

标签:搜索引擎优化  


2011年5月11日/上海SEO技巧/