为什么百度只收录首页

Spider在“百度与Google的收录门槛比较”一文中已经埋下了伏笔,以本站收录过程为例体会下百度收录网站时的谨小慎微。
SpiderSay.com在09年的最后一天开博,搭了趟09年的末班车。Spider每天还算辛勤劳作,不停地攀爬织网。Google对这一切早看在眼里,已经很早就肯定了劳动成果,每天Spider文章发布几分钟之内就收录了(没有安装sitemap插件)。可以以本文为例看下效果。

但是百度,直到观望了15天之后,才勉强把SpiderSay的首页挂在了网上。只有一个首页,内页还在观望中吧。查看IIS记录或者通过后台插件,可以看到百度其实比GoolgeBot造访的还勤快,但就是观望而已。挺可爱的家伙呵呵。今天的site结果依旧,见下图。

为什么有的网站百度只收录首页呢?这要分情况而论。
一种情况是像本站之类的新站,在百度的观察期内,可能大半个月甚至更长时间才只收录个首页。其实这已经算是得到百度肯定了,所要做的就是继续保持原创更新,千万不要对网站做大的整容手术。Spider从来不担心也不怀疑百度的收录机制。另外一种情况就糟糕了,如果百度发现你的网站存在作弊现象哪怕只是存在可疑点,小心了,已经收录很多的网页也可能会在一夜之间回到解放前。只剩一个首页算好的了,K的一个不剩也大有人在。这个时候,你所能够做的就只能是自我检讨了,从网站内容、SEO优化、内外链接、域名、IP、空间稳定性甚至备案情况等各方面仔细分析,检查到问题做出回应,然后漫长等待恢复收录……
当然,正规网站,百度的收录是迟早的事情。Spider估计本站再过十来天就会被百度放行,到时候再拿来对比讨论吧。
最新评论