恒鑫信息

站在搜索引擎抓取的角度,探研网站收录的技巧

发布时间:2019-09-11 来源:上海网站建设

 

  网站收录是网站优化实战过程中,Z重要的环节之一。关于这方面的技术新闻,近乎饱和地充斥于网络中,但是几乎所有的新闻都是从网站自身的角度思考收录问题。笔者经过几年的网站优化实战,在思考搜索引擎抓取网页的方式中,总结了几个促进网站收录的技巧,在此分享,希望对大家有帮助。

  

25z

  通常情况下,大部分认为,网页不收录是网页质量差,原创度不够,或者外部链接少等原因,不能说是错的,这些只是网站管理员们单方面认为的表面现象,一种根据自己的网站优化实战知识推测的结果而已。传统的网站优化实战知识是从结果往上猜测原因,笔者认为,搜索引擎的抓取方式可以启发我们对网站收录规律的理解。

  首先、内容丰富的网站更受搜索引擎青睐

  网络上每天会出现成千上万的新页面,大站产生的新页面比小站多,搜索引擎抓取网页更倾向于网页多的大站,因为大型网站往往包含更多的页面,且质量比较高,搜索引擎则偏向于优先抓取和收录大站的页面。就是这样一个思路,提醒网站管理员们做网站优化要让网站中出现更多的内容,网页丰富则会引导搜索引擎频繁抓取和收录,这是做网站优化的一个长期规划思路。

  第二、入链多质量高的网页优先抓取和收录

  搜索引擎是通过网页之间的链接关系,发现并抓取互联网上的网页,众所周知,链接具有投票功能,投票越多的网页搜索引擎则会更加重视,优先抓取。google提出的pagerank算法,可以依据链接关系对网页进行评分,决定网页网址download顺序。所以,我们在网站优化实战中,如果出现网页收录,则可以适当增加高质量外部链接,这里要非常注意“高质量”三个字。换句话就是入口决定出口,如果搜索引擎在Hao123或者A5上面发现网站锚文本链接,比一个B2B网页锚文本链接更具有收录意义。

  第三、网页历史更新规律影响搜索引擎抓取频次

  搜索引擎的资源不是无穷的,他们也在尽Z大努力节约资源,同一个网站,spider会根据网站的规模和更新频次决定抓取次数,尽量用Z少的资源完成网站更新策略。搜索引擎会假设,过去频繁更新的网页,将来也会更新频繁。比方说,如果我们的网站在每天的晚上9点更新内容,经过一段时间的有规律更新,spider则会默认这个点来抓取内容,这样会提高搜索引擎的喜爱程度,网页更容易被抓取和收录。

  第四、用户体验策略对网站更新收录的影响

  Z近,笔者在优化网站时发现,更新了首页内容后网站排名会偶尔下降,快照莫名其妙地回档时,排名又恢复了。在仔细分析了baidu网站管理员平台的Keywords与流量后,我发现,在没有更改网站首页内容时,某一个Keywords有一定的点击量,更新内容后,点击量变少了,当快照后退时,排名又起来了。因此,笔者推测,baidu抓取和收录内容会适当的考虑用户体验,网站的点击量从侧面反映了用户体验。

  也就是说,搜索引擎会抓取和存储很多个网页快照,如果旧的网页快照更受用户喜欢,那么新的网页快照就不一定会被收录,因为搜索引擎始终要照顾用户体验。