搜索引擎的原理有哪些?搜索引擎是怎样给网站排名的呢?我们知道,要做网站的seo优化工作之前,必须先了解一下搜索引擎原理,搞清楚搜索引擎的基本工作原理,这样才会更有利于seo工作的顺利进行,正所谓“工欲善其事必先利其器”。掌握了搜索引擎的工作原理,接下来的工作就更好的展开了。
那么搜索引擎的原理都有哪些呢?现在思源就给大家介绍几种。可能这些理论知识,有些人不屑一顾,但是,我认为理论性的东西虽然有些枯燥,但是对于我们理解seo优化中的某些问题还是有帮助的。好了,废话不多说了,开始进入我们的正题:
1.搜索引擎原理之一:搜素引擎爬行原理
搜索引擎爬行原理是怎么进行的呢?分为两步。
第一:搜索引擎机器人程序通过网页之间的连接部分昼夜的爬行来抓取信息;
第二:搜索引擎进入服务器空间时,第一时间查看robots.txt文件,如果robots.txt文件不存在,则返回404错误代码,但依然会继续爬行,如果定义了规则,则遵守索引。
因此,思源建议不管您做什么样的网站,网站必须有一个robots.txt文件,告诉蜘蛛那些页面不需要它来抓取。
———————————————————————————————————————-
2.搜索引擎原理之二:搜索引擎抓取数据原理
那么,我们了解了搜索引擎的爬行原理,那么搜索引擎是如何获取我们页面上的相关数据信息呢?
其实,搜索引擎抓取数据也是有两种方法来抓取的。第一种:深度优选抓取:是指搜索引擎顺着一条连接爬行,知道这条链接的尽头 像A->A1->A2->A3;第二:广度有限抓取:是指搜索引擎先把网页上的链接全部爬行一次,然后接着从每条链接爬行。
———————————————————————————————————————-
3.搜索引擎原理之三:搜索引擎收录原理
相信搜索引擎收录原理,大家都想急切的知道吧,我们网站上发表的每篇文章,我们都希望能够被搜索引擎快速收录,能够得到很好地排名,但是,搜索引擎不是人,它不能快速的分辨一篇文章的好坏,但是它是人开发出来的,它照样能读懂文章的内容,分辨出文章的好与坏。选择优秀的文章,给予收录。
那么搜索引擎是怎样判断文章内容的呢?主要从以下几个方面:
A:分析网页标题内容【通过网页标题内容找到已收录的数据作分析对照,确定网页是否有收录的必要性】
B:分析网页内容【通过H标签准确确定网页内容,分析第一段内容确定是否有收录必要性,然后分析每段内容新鲜度,内容优化是否过度,网页内容是否重复。】
C:排除无价值内容(去重复),收录【去除网页相同的内容,如:header,footer,cateogory重复部分,进一步确定网页的价值文章是原创,还是转载,最后根据网站权重确定是否收录】
———————————————————————————————————————-
4.搜索引擎原理之四:搜索引擎排名原理
搜索引擎是怎样对网站文章内容实行排名呢?主要从以下几方面来做:
A:数据处理【提取网页内容按标题、内容和链接关系进行分词割分成不同类别ID】
B:分析链接价值【把网页的内容进行字典对照分析不同分类ID的链接关系,初步确定不同类别ID的内容价值和重要性】
C:确定关键词排名【通过内容分类相关性计算,关键词价值计算,关键词密度计算,关键词位置距离计算,H,B,strong,em标签使用,链接关系分析,网站权重计算,最后确定不同类别ID的关键词排名】
———————————————————————————————————————
到这里,基本上搜索引擎的几个原理都讲到了,大家可以先了解一下,对比一下,自己的网站是否符合搜索引擎的规律。下面三条讲的都是关于搜索引擎的其他相关知识,可以了解一下。
5.搜索引擎核心算法
A:hits算法【97年提出hyperlink-induced topic search 越链接诱导主题搜索,主要包括两方面:导出链接之和,导入链接之和】
B:trustRank算法【信任指数即获得越权威的网站投票,那么被投票的网站具有高的信任指数,反之不成立;同时导出链接衰减,所以导出链接越多,信任指数就越低。】
C:HILLTOP算法【网站链接相关性,被链接与被链接的网站越相关,那么投票能力越强】
D:PR计算【PR(A)=(1-D)+D(PR(T1)C/(T1))+..+D(PR(In)C/(Tn))】
———————————————————————————————————————
6.搜索引擎常用函数
A:双引号【””代表完全匹配 “SEO实战”】
B:减号【SEO -实战 排除不包含的词,“-”前用空格分开】
C:site 【查询来自同一个域名的所有被收录文件数量】
D:inurl 【即包含在URL中,像:inurl:mzxchengliang】
E:allinurl 【同时处理多个查询 像:inurl:x inurl:X…N】
F:intitle【包含在标题中:intitle:SEO实战】
G:allintitle【allintitle:seo seo培训 seo实战】
H:filetype【用于搜索特定格式文件,主要支持:DOC,PDF XLS,PTF,PPT,ALL,HTML,PHP 像:查找SEO培训DOC文件 filetype:doc seo培训】
I:link【用于查找反向链接:domain:】
J:yahoo!反向链接查询【linkdomain:】
L:综合使用示例【inurl:gov intitle:seo培训】
———————————————————————————————————————–
7.搜索引擎网页显示原理
A:指令处理 intitle:”seo培训”
B:拼错矫正,如seo赔训矫正为seo培训
C:找到关键词所在分类
D:整合搜索触发
E:过滤规则网页
F:排名显示