网站是刚刚上线没到两个月,但是百度只收录了一个首页,为什么呢?很多站长在百度知道里面提问,为什会这样呢?百度为什么只收录我网站的首页呢? 从站整体看,字很密集给人的感觉也不是很好,相信用户体验应该也不会太好,据网上的一些资料显示百度对站点的收录把关是越来越严格了,他们现在多垃圾站点的收录可以检查的更加严格,开始我分析是网站采集的数据过多,没有原创性造成的百度收录很少,但是很多文章都是原创的,我想如果原创性的文字一般都很吸引蜘蛛的抓取的,那么这这个判断就不完全的。 从网站的频道路线转到列表页,以及最终页的过程查看了下,发现他的频道标题“手机短信内容查询 ”在源代码中根本就检查不到,这次是最后百度只收录他站首页不收录其它页面的最终原因。因为他站可能是使用了iframe框架或者JS调用的导航的url在搜索引擎中屏蔽了,这样搜索引擎是完全抓取不到他们的频道页面以及列表页,到最终页面,当然就不会收录其它页面了。
网站不收录原因 百度已经索引了但还未放出来排名 这个是因为百度对文章的收录需要审核时间,蜘蛛抓取成功索引内容录入数据库,需要经过二次审查是否为SPAM然后才放出参与排名,放出的时间与网站权重高低有着直接的关系,百度周期更新才放出收录是新站常见的现象。 下面说下URL对搜索引擎的影响: 还是拿这个站点说,他站的频道文字很长,因此他选择用的列表页的目录URL是相当长的全拼,这样也是对搜索引擎抓取是很不利的,一般在抓取URL地址最好控制在60个字母以内, 这只是列表页地址已经有30个字母,如果是最终页地址,还会在列表页后面继续延伸URL字母就会增长,所以在列表的地址时候就不能像他的那个站一样吧吧频道的url设置的超长,否则最终页URL肯定就超过了60个字母的极限,这个是都搜索引擎的抓取不好的。 解决办法: 1. 我们要做的就是保证定期定量的对网站内容进行更新。 2. 检查是否语法错误屏蔽了蜘蛛爬行,其中包括meta robots与nofollow等标签的的设置。 3. 应该保持文章的原创度,质量比数量更重要,最好是能每天定时更新让百度对你网站抓取也有守时的好习惯。 4. 针对首页、频道等各个重要页面做错误链接检查(可以观察谷歌站长工具的抓取错误),检查留言板、评论等网友互动功能的不良链接,避免与不良网站互链。 网站如果使用了静态页面转化对搜索引擎抓取是很友好的,这个页面相当是直接用site:去查收录是查不到的,在静态页面我们一般查收录直接把URL地址放到baidu搜索框中回车就可以看到结果,大家可以拿这个频道页面地址去site发现收录只有一个页面对吧!
页面所在本站地址: http://www.52-life.net/Nshow_reurl.asp?reurl=baidu_nourl |