搜索引擎的算法一直以来都是最核心的运营机密,很多SEO优化工作者也都是对搜索引擎算法停留在了解原理的基础之上,我们能做的就是在每一次搜索引擎更新算法的时候依据大量网站的搜索情况进行猜测。一个真正了解搜索引擎的SEO从业人员势必会让自己在优化的道路上左右逢源,为了更好的和搜索引擎对话,为了能够更好的对网站进行改善优化,SEO优化联盟建议大家要认认真真的去了解搜索引擎算法的工作原理并按照算法的特点来有针对的进行优化工作。
搜索引擎算法的存在一方面是为了能够为用户提供更准确的搜索结果,另一方面就是为了使SEO优化行业更加规范,避免那些使用作弊手段来欺骗搜索引擎的网站优化方法。算法最终目的是为了在用户使用搜索引擎搜索关键词的时候能够将与查询主题高度相关的一些网页集合展现出来,而目前基于查询的分析算法中主要分为两个大类,一个是谷歌的基于链接分析的Pagerank算法,另一个就是基于查询主题进行分析的Hits算法,这两种算法是目前搜索引擎使用最为广泛的算法,这两种算法各有各的特点,也各有各的缺点不足,那么作为SEO从业者我们该如何正确的去学习这两种算法来为自己的工作做准备呢?也许你会一脸茫然,但是你会在这篇文章中更好的对着两种算法进行了解。
谷歌的Pagerank算法的简单分析
1、Pagerank算法的核心思想:
注意谷歌Pagerank算法是基于随机冲浪模型的最好典范(巴斯光联)
拿出来单独解释,对于相互之间互相链接的网站我们通过分析可以知道,二者之间的pr值如果在没有出站链接的情况下只会互相传递,不会向外流失,久而久之
pr值就会慢慢积累越来越高,这对搜索引擎来说是不够友好的,所以在实际的pagerank算法中在计算的过程中是将这种闭环链接单独进行计算,同时也引
入了衰退因子(下文中的E(U)),防止pr值过多的积累,该算法的结构如下:
所以对这部分的权重计算公式可以简单的列举如下:
主要思想就是该部分网页的权重R'(u)等于相互链接的网页pr值R(v)与网站的出战链接数目N(v)进行迭代计算,同时引入衰退因子E(U)来现在权重的积累。
3、Pagerank算法的优缺点分析:
pagerank算法将互联网中大多数的网页通过基于链接来计算网页质量的方式进行排名,为搜索引擎用户提供较好的基于链接查询的搜索结果,同时该算法能够进行离线分析处理,大大缩短了搜索引擎用户的服务响应时间,因此就目前来说该算法是搜索引擎应用最好的算法,但是pagerank算法的缺点也是相当明显的,在上文中我们也进行了讨论,那就是该算法在初期的时候一直都是基于链接分析的,而一个网页上的链接包含很多:比如广告链接、功能链接、导航链接、以及多次重复的无效链接等等,这些链接都会被该算法计算在pr值传递之中,所以不能够对网页降噪之后在进行处理,同时,由于是基于链接分析,导致pagerank算法计算出来的搜索结果往往会偏离实际的搜索主题,也就是说该算法不能很好的基于主题查询,当我们在进行查询的时候,pagerank算法会自动将计算出来的主题相关网页连接到的不相关页面也集中起来,这就导致该出现的重要网页没有出现,而不该出现的与主题不相关的页面却出现了,这对整个用户来说都是不合理的。
以上是自己对谷歌搜索引擎Pagerank算法的一些简单认识,在实际操作过程中SEO优化联盟肯定会存在很多的不足以及错误,如果细心的你发现了,请你及时的和我联系。
标签:西部数码 谷歌 Pagerank 搜索引擎算法