织梦采集侠

网站采集

全面解析百度收录页面数量浮动变化原因

浏览次数: 发布时间:2016-07-19 09:52

在站长网站和站长论坛经常看到有人问“我的网站页面被百度收录后,过段时间又从百度消失了,这是为什么?”很多人也因为这个原因对百度非常抵触,今天就给大家讲解一下发生这个收录变化的原因:

  页面收录后消失的方式有两种:第一种是收录后第二天即从百度消失;第二种是收录一段时间后从百度消失。

  第一种情况比较好解释,这种情况往往出现在采集站,由于采集来的内容相似性比较高,百度收录后会对比比较后扔掉一些质量较差的网站页面,也就是权重较低的网站页面。除此之外服务器原因还有同服务网站被K也会出现这样的问题。

  第二种情况是今天要说的重点,站长朋友在用站长工具查询自己网站的时候会经常发现网站的百度收录数量减少,但是网站每天都会收录新的页面为什么反而会减少呢,下边来详细讲解这个情况的原因。

  既然说到百度收录页面变化我们就先说说百度收录页面的原理,百度收录共有4步:爬行和抓取——索引——搜索词处理——排序,经过这四步后在我们搜索的时候搜索引擎将这些展现在我们面前。我们能够控制的是爬行和抓取,做外链不但可以增加网站权重而且可以增加百度蜘蛛爬行次数,次数越多自然抓取的几率也就更高。之后是百度根据抓取的页面里关键词出现的位置、字体、颜色、加粗、斜体等相关信息做相应记录,然后是进行分词处理,最后是排序,对搜索词处理后,搜索引擎程序便开始工作,从索引数据库中找出所有包含搜索词的网页,并且根据排名算法计算出哪些网页应该排在前面,然后按照一定格式返回到“搜索”页面。

  百度收录页面也就是抓取网站的页面,百度会根据自己的一套策略来分辨这个页面对用户是否有用,并且对其评分,每爬取一次会做一次评分,当分数达到要求了百度就会收录,其中评分受网站权重的影响比较大,这也就是网站权重高的网站页面比较容易收录,就像希赛网,你发文章之后几分钟就会被百度收录,这就是网站赋予新页面的权重让其快速收录。如果一个站权重不是很高,当页面链接出现在首页的时候,传递给页面的权重比较多,百度评分满足收录要求对其收录了,由于网站不断更新,等页面离开网站首页后权重降低,评分无法满足百度收录要求,这样收录页面就会从百度消失,由于网站权重是不断提升的,页面的权重也会得到提升,最后满足收录评分要求被重新收录,这就是网站的百度收录数量会出现S型波动变化的原因。

相关报道:

前几天在这里发布了关于地方站的发展与经验总结。这几天我的站 llbst.com 也在运行中,在收集商家信息的时候也碰到了各方面的问题: 一:店铺现在对关心的就是现在免费收集,以后 更多

采集类的网站超来越多了,如果网站不能在短时间内获取得较多的流量的话,可能就会因为资金问题或这样或那样的问题而导至网站运营不下去而结关门大吉。但是同样是采集类的网站,有却能取得较庞大的流量而生存了下来,有的却关门大吉呢,其实要想让采集站能存 更多

    上一篇:新域名如何一收录就得到好的排名

    下一篇:没有了