精简代码降低搜索引擎提取文字内容难度

在搜刮引擎工作道理中,搜刮引擎预处置的第一步就是提取文字内容SEO人员应当尽量下降搜刮引擎提取文字内容的难度,也就是精简HTML代码,使真正的文字内容比例进步,尽量削减HTML格局代码“从某种意义上来说,格局代码对症结词来说都是噪声,精简代码就是进步信噪比常见的可以精简代码的处所如下。

(1)应用CSS界说文字字体、顏色、尺寸及页面排版,有许多网站既应用CSS,又在可见文字部门用style或font再界说一遍字体、尺寸等,这是完整没有需要的冗余代码。

(2)应用外部文件,将CSS和JavaScript放在外部文件中,页面HTML中只要放一行代码进行挪用就可以了,假如我们查看一些网站源文件,经常可以看到年夜片年夜片的CSS及JavaScript代码,并且JavaScript代码还经常出現在HTML最前面,这就使真正有效的文字部外被推到后面。

(3)削减或删除注释。代码中的注释只是给法式员或页面设计人员的提醒,对用户和搜刮引擎来说毫无感化,只能成为噪声。

(4)削减表格,尤其是嵌套表格。現在的网页年夜多应用CSS排版,表格应用年夜年夜削减。但有的时刻应用表格展示是必须的,也不必锐意完整避免,只要不涌现多层嵌套表格,发生年夜量无用代码就可以了。

这里解释一下文件年夜小限制。Google技巧指南曾经建议。HTML文件最好限制在100KB以下,页面上链接数在100个以下,百度今朝建议HTML文件不要跨越128KB。其实現在的搜刮引擎已经完整可以抓取年夜得多的文件,甚至两兆的文件也没有问题不外在可能的情形下,照样应当尽量使文件越小越好,固然搜刮引擎可以抓取很年夜的文件,但可能不索引全部文件,而只索引文件前面部门内容,平日,网站设计页面内容应当是集中同一的,索引前半部门就代表了文件内容主题。文件很年夜时,索引全部文件既没有需要也是很年夜的资本糟蹋。文件过年夜,再加上年夜量冗余格局代码,可能使本质内容被推到现实被索引的部门之外。

相關文章: