Baidu spider抓取频次原则

Baidu spider依据上述网站设置的协定对站点页面进行抓取,然则弗成能做到对所有站点,视同仁,会综合斟酌站点现实情形肯定一个抓取配额,天天定量抓取站点内容.即我们常说的抓取频次,那么,百度搜刮引擎是依据什么指标来肯定对一个网站的抓取频次的呢,重要指标有以下4个:

(1)网站更新频率。更新快多来,更新慢少来,直接影响Baidu spider的来访频率。
(2)网站更新质量,更新频率进步了,仅仅是吸引了Baidu spider的留意,baidu spider对证量是有严厉请求的,假如网站天天更新出的年夜量内容都被Baidu spider剖断为低质页面,依然没有意义。
(3)连通度、网站应当平安稳固、对Baidu spider坚持通顺,经常给Baidu spider吃闭门羹可不是功德情。
(4)站点评价。百度搜刮引擎对每个站点都邑有一个评价,且这个评价会依据站点的情形赓续变更,是百度搜刮引擎对站点的一个基本打分(绝非外界所说的百度权重),是首度内部一个异常秘密的数据。站点评级从不自力应用,会合营其他因子和阈值一路配合影响网站的抓取和排序。
抓取频次间接决议着网站有若干页面有可能被建库收录,如斯主要的数值假如不相符站长预期.该若何调剂呢?百度站长平台供给了抓取频次对象(http://zhanzhang. baidu.com/pressure/index),并已完成多次进级。该对象除了供给抓取统计数据外,还供给“频次调剂”功效,网站扶植者依据现实情形向百度站长平台提出愿望Baidu spider增长来访或削减来访的要求,对象会依据站长的意愿和现实情形进行调剂。

相關文章: