“HillTop”论 - 探索Google排名新算法
我深信,在Google最近的更新中,不但运用了Google自身的页面等级和相关性算法,而且还结合使用了Hilltop算法用于精工调整页面等级的效果,只不过Hilltop算法可能已迥异于它最初的模样了。
3.2 什么是Hilltop算法?
对此算法有兴趣了解并想挖根究底的人可以看看克利须那。伯哈拉特当年所写的Hilltop论文及详细的Hilltop专利信息。但对我们大多数人来说,只要知道Hilltop算法到底是个什么东东就可以了。简单地说,页面等级决定一个网页的"权威性",而Hilltop(LocalScore)则决定匹配一查询条件的一个网页的"权威性"。
Bharat提出:在利用"页面等级"来寻找"权威"网页时,不应单恳览涤谥档拇笮±炊ǘ幔氐惴旁谒氩檠魈獾南喙匦陨希?即不但需要考虑网页的页面等级,还要考虑该网页的页面等级与查询主题的相关性是否相称。若一个网页只与查询主题只沾点边,那么即使其页面等级非常之高,对用户来说也是没有意义的。如此一来,于网页而言,那些来自于"相关主题"的文档的链接就更有意义了 (Bharat称这种"相关主题"文档为"专家文档"),一个网页的所有外部"专家文档"链接构成了该网页的"权威性值"。Hilltop算法的意义在于:相同主题网站之间的链接应比非相关网站的链接具有更高的价值。
Hilltop算法以如下方式计算一个网页的"权威值"(这只是极为简单的一个例子):
以该关键词进行一次普通查询找专家文档"文集"。"专家文档"的定义有严格标准,因该"文集"应是数量上易于管理的一组网页。
从返回的专家列表中把成员站点(见下注解*)和镜象站点去掉。
根据所获得的上述专家文档对其投票的数量和质量,网页被分配以一个“局部分数”(LocalScore)。然后按网页的“局部分数”进行排名。
*注解:成员站点指来自同一个域,或域相同而后缀不同的站点,如ibm.com,ibm.co.uk,ibm.co.jp等等,或指来自相邻的IP地址的站点 (前三位IP地址相同,形如64.129.220.xxx)
此外,若两个站点均为相同IP地址下的宿主,则认为其中一个是另外一个站点的成员站点。(即:若ww.abc.com www.ibm.com 均为相同IP地址下的宿主,则认 www.abc.com 是www.ibm.co.uk的成员站点)
Hilltop算法的一个极其重要的特征在于:若没有找到搜索引擎 认为数量足够的“专家文件”(要求至少需有两票),则该算法失效,即返回结果为零。换言之,对于高度明确化的查询条件(查询词语),Hilltop算法的结果很可能为“0”。这是该算法的一个独特特性。如此一来,造成了SEO一族中的大部分人都深信Google的确在用“商业词”过滤名单来过滤掉商业网站。
事实上,在Hilltop算法无法奏效时,将显示“旧”Google的搜索结果。这些查询条件的集合就是SEO一族所收集并称之为的“商业词名单”。这一效果无意中却提供了一个强有力的证据,表明Google确是采用了Hilltop算法。2003年11月15号,Google基于新算法的更新之后, 某分析家就指出:在进行查询时,若对某一查询条件加上一些“不包含”的无意义字符,如“car rental – ghjkl”,则Google将会显示以往(算法变化前)的搜索结果,而绕过所谓的“商业词”过滤名单。
- 相关文章
- 关于Google 的事实与谬识(摘自go..[12-04]
- Google给我们做网站的启示[12-04]
- Google双重列表(Double-Listing)..[12-04]
- Google所注册的域名大全[12-04]
- Google的PR值到底有多大价值?[12-04]
- Google网站登录的基本要求[12-04]
- 最新文章
- 关于Google 的事实与谬识(摘自go..[12-04]
- Google给我们做网站的启示[12-04]
- Google双重列表(Double-Listing)..[12-04]
- Google所注册的域名大全[12-04]
- Google的PR值到底有多大价值?[12-04]
- Google网站登录的基本要求[12-04]
