贝壳电子书 > 网络杂集电子书 > 搜索引擎优化魔法书 >

第52章

搜索引擎优化魔法书-第52章

小说: 搜索引擎优化魔法书 字数: 每页4000字

按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!






                 第四节 搜索引擎反作弊任重道远  



一、搜索垃圾永不会消失  



    在与搜索引擎与垃圾网站的长期斗争中,搜索引擎总是处于守势。这不仅因为搜索引擎 

公司真正考虑搜索结果相关性和排序的只有几个人,而互联网上整天琢磨怎么对付搜索引擎 

的有几十万网站管理员。更重要的是,制造一个或几十个甚至几百个作弊网页,只要将一个 

目标网页稍作改动即可实现,并可以不断进行类似复制,而搜索引擎甄别、删除却需要相当 

的时间。这种“以一当百”,以一个网站对付数以万计作弊网站的工作,对搜索引擎而言, 

是一个巨大的人力资源投入与成本投入。 

    目前,垃圾网站的新攻击方式和攻击热点,不断变化和推陈出新,spam 如蝗虫般涌来, 

搜索引擎也不断需要改变自己的应对策略。 

    这一斗争过程,已完全类同于互联网的病毒与反病毒。所不同的是,制造病毒的成本有 

时会更高些,它们往往需要很高的技术门槛。而制造垃圾网站的门槛却相当低,且制作方便。 



                                                                      第 178 页 


… Page 187…

搜索引擎优化魔法书 SEO Magic Book  浩维互动免费电子书 timev 



因此,作为搜索引擎,只能以最严厉的方式来应对作弊站点,尽量提高作弊后的后果严重性 

来提升作弊成本和风险。 

    但在搜索中,永远会有垃圾网站的存在,因为它每时每刻都在诞生。由于垃圾网站的成 

本与收入间的巨大差异,SEO spam 们还会勇往直前,前赴后继。而到目前为止,政府以及 

相关部门还没有对这种互联网上的“假冒伪劣”制定相应的法律制度来制约。但相信这一天 

一定会到来。 



二、搜索引擎反作弊的历程  



    乱世用重典,搜索引擎在与spam 的长期战争中总是处于不利地位。当然,从某种角度 

来说,几乎是 spam 在推动着搜索引擎的进步。 

    搜索引擎诞生的早期,搜索引擎们为了搜索结果能更准确,为了能把最相关的搜索结果 

排在前面,发明了meta   tag 。起初,meta   tag 是很好用的,那时候,诚实的webmaster 们如 

实地填写网站摘要,如实地列出跟他的网站最相关的关键词,搜索引擎们抓取、索引、检索 

这些诚实的meta tag,并作为搜索结果排序的重要依据,然后,是一段相安无事的甜蜜时光。 

    岁月迅速流逝,甜蜜时光挡不住资本的力量。“一旦有适当的利润,资本就大胆起来…… 

有 50%的利润,他就铤而走险;有 100%的利润,他就敢践踏一切人间法律;有 300%的利 

润,他就敢犯任何罪行,甚至冒绞首的危险。” 越来越多的网站开始追求收入追求pageview, 

它们开始欺骗搜索引擎,它们在meta tag 中塞进成堆的关键词,塞进跟自己的网站内容无关 

的但是流行的关键词。群众的力量是巨大的,搜索引擎的相关性被破坏了。 

    搜索引擎们对作弊者开始第一轮反击,但是无力的,它们的做法是:在排序时更多的依 

赖网页正文而不是meta tag 。 

    作弊者以进为退,开始第二轮攻击,他们在正文中大量使用与网页背景相同颜色的关键 

词,在image tags 中塞进关键词,在网页代码加入“看不见的注释”。 

    搜索引擎开始第二轮反击,它们找到了有效的方法来过滤这些看不见的文字,取得了小 

小的胜利。 

     “善良是善良者的墓志铭,卑鄙是卑鄙者的通行证”,作弊者眼见常规武器无效,开始 

利用搜索引擎的真诚。搜索引擎的 spider 是互联网上的谦谦君子,它们访问任何网站都会自 

报身份,并且查阅网站的访问规定,完全按照各网站的规矩来办事。于是,作弊者精心制作 

了两个网站,一个专供网友访问,一个专供搜索引擎访问,每当发现访问请求来自搜索引擎 

时,就返回专供搜索引擎看的能令搜索引擎满意的网页,而正常访问者只能看到另一个截然 

不同的网站。这种方法叫做cloaking。这第三轮攻击,作弊者大胜。 

    1998 年3 月 1 日,分别在AltaVista、Excite、HotBot、Infoseek、Lycos 搜索当时的热门 

词汇“Monica Lewinsky”,各搜索引擎首页居然分别有50%、30%、30%、10%、50%的搜 

索结果是spam。由此可见当时作弊者们猖獗至何等程度! 

    搜索引擎们,因为它们道德上的弱点,因为有些手段不愿用,所以无法完全辨别cloaking 

网站,也就无法完全对付作弊者。搜索引擎能做的只是严厉的惩罚被发现的 spam,以警告 

作弊者,发展到今天的结果是,所有的搜索引擎对它们认定的spam 行为,只有一种惩罚: 

永久屏蔽。 

    但是,严厉的惩罚从来只是无能者推卸责任的借口,而不能真正的改善状况。作弊者从 

来就不怕惩罚,当互联网狂潮来临,追求pageview 的作弊者们更是肆无忌惮。 

    无可奈何的搜索引擎,只有去寻找新的相关性排序依据,只有去寻找作弊者不能控制的 



                                                                      第 179 页 


… Page 188…

搜索引擎优化魔法书 SEO Magic Book  浩维互动免费电子书 timev 



排序依据,只有去网站以外寻找排序的依据,搜索引擎,真的别无选择。 

    于是,开始出现了超链分析,出现了Pagerank。一个网页,说它自己是什么,它就是什 

么吗?物以类聚,如果它说的是真的,那么指向这个网页的链接应该来自具有同类内容的网 

页,所以指向这个网页的链接可以被用来验证这个网页的相关性。 

    谁,最不可能出于贪婪而作弊?谁,最可能如实提供网页内容?是政府网站,和教育网 

站。所以,在超链分析中,gov 和edu 网站通常被赋予较高的排名,来自gov 和edu 的超链 

也有更高的价值。 

    但是PageRank 也带来了一些不请自来的错误排序因素:新站不如旧站,小站不如大站, 

专业站不如通俗站。一个新网站,一个小网站,一个专业网站,它的内容再好,因为不可能 

迅速得到大量的超链,所以无法得到合适的排名,即使它的内容是无与伦比的。而一个历史 

悠久的老网站、大网站、通俗网站,即使它已久不更新,或者内容远不如某些小网站,却可 

以获得很高的排名。 

    当超链分析刚出来时,SEO 界一片悲观论调,认为这是无法作弊的,SEO 业完蛋了(就 

像近期各搜索引擎纷纷收费,SEO  业更觉得自己前景惨淡,其实虽然搜索引擎排名市场的 

大头要给搜索引擎们,但 SEO 还是有钱赚的,毕竟,只有劳动模范有下岗的可能,从来没 

听说骗子会失业的),但是,道高一尺魔高一丈,很快SEO 们发现了对付超链分析的方法: 

做大量的网站,准备大量的链接,哪个客户出钱,所有的网页都给它一个链接。这种 SEO 

方法被称为link firm。这种方法刚出现时还算有效,不过很快就不行了,因为一个网站是否 

有大量来自内容不相干网页的链接,或者一个不是搜索引擎的网站给出大量不相干的链接还 

不难判断。而每当发现一个link firm,那些使用了该link firm 的网站就全部死翘翘。 

    一种搜索结果的排序算法,如果更多的是基于概念、主题、基于网页内容的质量,而不 

是网络上互相链来链去的超链的重要性,那么搜索结果的相关性在本质上会更好。 

    只是,让计算机学会理解和评价网页内容吗?好像还是很遥远的事情;花大量的人力一 

个个网页评估么?这肯定是亏本的商业行为,只有靠志愿者。ODP  庶几近之,但也只能点 

击,用关键词搜索时还是无法跟超链分析的结果相比。 



三、石头记录的 2005 年 SEO 作弊状况  



    2005 年已经过去了,对于许多 SEO 来说,注定不会是轻易被忘掉的记忆。 

    我希望通过对我自己2005 年工作经验的回顾来对中国的 SEO 进行一次回顾。如果读了 

之后,能对你的 SEO 事业有一点点提示作用的话,我那些用无数的痛苦和心血换来的经验, 

也算有有一点价值。 



    2005 年春节前后 那些疯狂的岁月 



    这是 SEO 疯狂和销帐的时刻,那时候,易赛诺,王者工作室,优构网络,联达网络, 

灿海网络等一连串如雷贯耳的名字,在网上无处不在;到处都是广告位出租的信息,到处搜 

索出来都是乱码……Google  的页面可以用惨不忍赌来形容。举个例子来说明,当时的 SEO 

有多嚣张吧。那时候我打了一个电话到北京的一个 SEO,问他排队机要多少钱,他说八千, 

然后问他稳定不稳定,那个人嚣张地说:“我这个词在网上一年多就从来没有从第一名掉 

过!”。 

    总之,SEO 也在Google 里也似乎无所不能,“led”,“电影”,“翻译”,“招聘” 

这些热门词前面照样充满着优化后的结果。那时候的优化手段就是作弊。疯狂地作弊,疯狂 



                                                                      第 180 页 


… Page 189…

搜索引擎优化魔法书 SEO Magic Book  浩维互动免费电子书 timev 



地发留言,疯狂地堆积关键词。那时候最搞笑的是 wiki  里经常会看到这样的留言:“如果 

你删除我的链接,我就删除你的!” 



    2005 年3 月26  日凌晨四点  Google 不再沉默 



    Google 终于不再沉默。大刀砍向了 SEO,对一大批著名的SEO 作弊站点进行了封杀。 

我记得那一天晚上我还象其他 SEO 一样在辛苦地工作过,我在查我自己的网站时,前一刻 

还被 Google 收录,突然就找不到,职业的敏感性是我意识到Google 算法更改了。我测试了 

许多 SEO 站点,包括那时候最流行的优化资源51,91i,都已经被Google 

惩罚。那一刻,我心情复杂,用文章Google 不再沉默记录了这一时刻。关于这次Google 的 

算法更新,这是最早的一篇消息,第二天新华网才有了类似的新闻。 

    那一夜,我感悟很深,至今再读起那些文字时,我依然显得有些激动。近一年后,经历 

Google 更多次算法变化后,我更坚信,那些原则依然适用。 

    51,91i 到今天依然被Google 惩罚,是Google 对这次算法留给我们的见证。 

    此后虽然 Google 也进行了几次小规模的删除行动,而且有认为干涉的嫌疑。但中国的 

SEO 基本还是我行我素,作弊者依旧是前赴后继。 

    时间依旧流逝,街市依旧太平…… 



    05 年4 月7 月 博客开始兴起 



    随着方兴东的摇

返回目录 上一页 下一页 回到顶部 0 0

你可能喜欢的