1:只有入链没有出链
很多网站技术人员认为出链太多的话会分散页面本身,所以在网站结构中一些重要页面上不设计出链,但是百度认为完善的网站结构应该像一张网,所有页面与其他页面都有可能会产生链接,蜘蛛抓取顾名思义就是蜘蛛会顺着一个页面遍历所以页面。只有入链而没有出链的结构对网站本身来说是不友好的。
2:错误的锚文本
搭建网站内链的作用不仅是页面权值传递和内部投票,搜索引擎还会通过锚文本辅助判断网页的内容,而错误的锚文本很有可能会误导索索引擎对于相关性的计算,对搜索排序产生负面影响。同时对于只能通过锚文本来判断是否要点击打开新网页的用户来说,也无疑是种伤害。
3:死循环链接
死循环链接是搜索引擎蜘蛛最郁闷的事情了,往往会把搜索引擎蜘蛛卡在一个角落中,无限的循环而走不出来,不仅白白浪费蜘蛛体力,也会占用网站大量爬取频率,造成有价值的网页抓取不全。比如万年历等非常实用的工具网站,很多时候这些工具你都可以无限的点击,每次点击都产生一个新的url,如果你没有屏蔽蜘蛛爬取这些内容,那么蜘蛛有可能会被带入到一个无限循环的境地,这样的做法对任何一个搜索引擎都是不友好的。
还有一种就是动态、带“?”号的url。这是由于动态网站的一个动态文件(如.php)可以产生上万个或者无数个链接,如果部分php文件内部又再次链向自己。蜘蛛进去就很难再爬出来。
4:链接404后不消除内链入口
网站页面404后,除了需要向站长平台提交外,应该尽量关闭其在网站内部的入口,一来死链对用户的伤害是极大的,二来避免令蜘蛛产生错觉,认为你网站死链严重。
5:无返回上级目录的链接
在制作网站时应该考虑到搜索引擎页面内容与首页的关系;同时对于用户来说,页面内容于首页的距离越长,用户平均访问的时间也就越久。