陈华毅:搜索引擎是怎么运作的
今天,我跟大家说下,搜索引擎是怎么运作地,可能一些SEO人员知道怎么去优化网站,但是可能不知道SE到底是如何是运转的呢?下面我根大家讲解下:
简单地说有三个步骤:一,匹配搜索请求页面,排序,显示结果。
匹配搜索请求大家可能知道,不就是输入请求,然后上搜索引擎匹配你地搜索请求显示出结果呢,但是你们知道搜索是怎么匹配,而且为什么一些网页为什么排名靠前呢,这就是排序地问题了,下面我从基本说起。
首先,搜索引擎有个索引数据库,简称索引库,里面存了很多网页,然后蜘蛛开始就是从这些种目录下开始爬行,意思是从已有地网页爬行,然后读取代码地时候,如何发现有链接的话,蜘蛛就会顺着链接前进,然后发现所有地链接后,在返回读取网页,这样,蜘蛛就是从别人的网页发现你的网页,但是说明一点,不是所有发现地网页都会收录地,只是一部分,所以这也是为什么要做外链地原因了。
搜索引擎是怎么排序地呢?首先当你输入搜索请求的时候,这里我把搜索请求写为搜索项,然后搜索引擎就会索引库里面找你的相关地搜索项,进行匹配,例如你输入陈华毅,然后搜索引擎就会去查陈华毅这个搜索项,索引库里面地表格式是这样子地,例如陈华毅155593344433566……,一个搜索项后面带有很多编号,编号所代表地就是一个网页,然后网页里面有包含URL,标题,描述等等。从而找出结果显示出来。
但是为什么有些网页排名靠前呢,那这就是排序地问题了,首先,搜索引擎要着除关键字权重比较高地网站,就是与这个关键字密切相关地网站排名靠前,这里我就主要要讲几点了,1.关键字密度,也就是关键字地权重,一个网页如果里面包含多个关键字,那这个网页肯定是比较相关地啦,但是由于后面i出现了黑帽,就是作弊行为,所以现在搜索引擎已经把这密度控制再2%~8%地幅度内,要不超出可能当是作弊。2.关键字突出度,也就是人家一看你这个网页,你知道你这个网页是说什么地,从网页地头部标签,标题,关键字,描述,位置,字体大小,颜色来突出你这个关键字地重要性。3.链接,也就是内部链接和外部链接了,这里主要讲下外部链接,主要就是你去别人地网站留下自己网站地网址,这就是相等于别人投了你一票,票多了证明支持你地人多,你地威望权重也当然提高了,另外,留下网址地网站最好PR值好地网站,因为权威高地人投你地票才是最有权威地,而且网站之间最好有相关性,而且网址是文字链接,文字是关键字。4,结构,网站地结果最好是静态化,因为蜘蛛爬得是代码,喜欢爬HTML代码,而网站最好是DIV+CSS结果,不要太多表格布局嵌套,y少带有JS,FLASH,图片等等,图片要加上ALT属性,这是搜索引擎盲点,它看不到图片,只能看到说明。
这样搜素引擎在上面的种种条件相比之下,就知道哪个网页地权重高,关键字相关性高了,所以就进行排序,显示再搜索引擎结果页面地前面了。
就讲到这里,好累。
本文出自陈华毅新浪博客:http://blog.sina.com.cn/webmagic转载请注名出处谢谢。
- 最新评论