新闻动态基于内容作弊的垃圾网页

       基于内容作弊的垃圾网页。查询关键词与网页相关度主要与查询词词频和查询词对应文档数量的倒数成正比,所以作弊者往往针对这两个因素入手制造垃圾网页。他们往往会挑选一些很热门的词汇以吸引用户的注意力,同时这些词汇对应的资源往往又是正规网站稀缺的,以保证查询词对应文档数量较少,例如“WIN10 免费下载”、“速度与激情7 免费观看”等,将这些词汇在页面主体、标题和HTML头重复的堆砌,以保证查询词词频较大。这种作弊方式被称为关键词堆砌,不过现在主流的搜索引擎几乎都能识别单一使用这种方式制造的垃圾网页了。
新闻动态基于内容作弊的垃圾网页

       还有一些垃圾网页制作者利用一些自动化工具将搜索引擎搜索返回结果中的摘要信息抓取出来组成垃圾网页的内容,使得其在内容上与关键词有极高的相关度,达到欺骗的目的。不过随着多数搜索引擎禁用了被抓取功能后,这种作弊方式也不多见了。另外一种作弊方式就是垃圾网页制作者找一页具有正常内容的网页,将要作弊的关键词稀稀拉拉相对均匀的混入夹杂其中,这种方式相对简单的关键词堆砌具有较大的迷惑性,如果网民不仔细阅读或者搜索引擎没有语义识别功能就很难识别出来。
新闻动态基于内容作弊的垃圾网页

       上面几种作弊方式对于骗取广告点击,骗取访问流量比较有用,但是对于一些本身以内容欺诈为目的的垃圾网页还不能完全达到目的,因为网民在被骗进来之后很快就会关闭或者离开网页。于是一种称为伪装型垃圾网页的技术应运而生。它是指垃圾网页的制造者通过技术手段分别为搜索引擎和用户访问的浏览器准备一个网页的两个版本。早期采取的技术包括利用CSS将堆砌的关键词字号缩小、字体颜色透明或者与背景颜色一致等加以隐藏。而现在主要通过内容替换、重定向跳转、Java Script脚本等技术进行伪装。

新闻动态基于内容作弊的垃圾网页非原创文章,如若转载,请注明出处:https://web.embd.cn/5_4703.html