行业动态垃圾网页
平日我们找到一个网站的方法除了少量著名网站可以直接在阅读器地址栏中直接书写URL之外,还有一部门可能是经由过程导航网址或者珍藏夹来拜访,剩下的年夜部门网站现实上是经由过程搜刮引擎找到的。对于网站的所有者来说,若何让本身的网站被搜刮引擎搜到,而且排名前几页,从而带来年夜量的商机是须要死力力争的工作。本来网页内容质量越好,越受网平易近迎接的页面就越应当排在搜刮引擎成果页面的前面,然则有些网站则经由过程一些不道德的方法来手动或主动地制作一些网页,这些网页没有供给给用户任何有用的信息,仅仅是针对搜刮引擎进行诱骗,就在搜刮成果中获得了较高的排名,这种网页被称为垃圾网页。
垃圾网页的存在对用户、正当网站以及搜刮引擎都邑带来损害。对用户来说须要找到其想要的有效资本,然则垃圾网页供给的是杂乱无章的内容,从而造成了严重的干扰,带来了极差的用户体验。对正当网站来说垃圾网页的内容质量比本身的差,而搜刮排名反而在本身前面,这是极其不公正的。
对搜刮引擎来说,一方面垃圾网页带来的极差的用户体验会使其丧失一部门用户,另一方面垃圾网页会给搜刮引擎公司造成资本糟蹋,因为收集爬虫在存储、断定、过滤和处置垃圾网页时会消费年夜量的CPU、带宽、内存和磁盘资本。所以,对垃圾网页的研讨一向都是搜刮引擎所要重点存眷的问题。