新闻动态基于内容作弊的垃圾网页

基于内容作弊的垃圾网页。查询症结词与网页相干度重要与查询词词频和查询词对应文档数目的倒数成正比,所以作弊者往往针对这两个身分入手制作垃圾网页。他们往往会遴选一些很热点的词汇以吸引用户的留意力,同时这些词汇对应的资本往往又是正规网站稀缺的,以包管查询词对应文档数目较少,例如“WIN10 免费下载”、“速度与豪情7 免费不雅看”等,将这些词汇在页面主体、题目和HTML头反复的堆砌,以包管查询词词频较年夜。这种作弊方法被称为症结词堆砌,不外如今主流的搜刮引擎几乎都能辨认单一应用这种方法制作的垃圾网页了。

还有一些垃圾网页制造者应用一些主动化对象将搜刮引擎搜刮返回成果中的摘要信息抓掏出来构成垃圾网页的内容,使得其在内容上与症结词有极高的相干度,到达诱骗的目标。不外跟着多半搜刮引擎禁用了被抓取功效后,这种作弊方法也不多见了。别的一种作弊方法就是垃圾网页制造者找一页具有正常内容的网页,将要作弊的症结词稀稀拉拉相对平均的混入搀杂个中,这种方法相对简略的症结词堆砌具有较年夜的困惑性,假如网平易近不细心浏览或者搜刮引擎没有语义辨认功效就很难辨认出来。

上面几种作弊方法对于骗取告白点击,骗取拜访流量比拟有效,然则对于一些自己以内容讹诈为目标的垃圾网页还不克不及完整到达目标,因为网平易近在受愚进来之后很快就会封闭或者分开网页。于是一种称为假装型垃圾网页的技巧应运而生。它是指垃圾网页的制作者经由过程技巧手腕分离为搜刮引擎和用户拜访的阅读器预备一个网页的两个版本。早期采用的技巧包含应用CSS将堆砌的症结词字号缩小、字体色彩透明或者与配景色彩一致等加以隐蔽。而如今重要经由过程内容调换、重定向跳转、Java Script剧本等技巧进行假装。

相關文章: