寻找百度只收录首页的根源

现在有很多新的网站都是给百度收录了一个首页,有很多人都不是很清楚到底是怎么回事,很多站长在百度知道里面提问,为什会这样呢?百度为什么只收录我网站的首页呢?现在让我来说说吧。
  从站整体看,字很密集给人的感觉也不是很好,相信用户体验应该也不会太好,据网上的一些资料显示百度对站点的收录把关是越来越严格了,他们现在多垃圾站点的收录可以检查的更加严格,开始我分析是网站采集的数据过多,没有原创性造成的百度收录很少,但是很多文章都是原创的,我想如果原创性的文字一般都很吸引蜘蛛的抓取的,那么这这个判断就不完全的。
  从网站的频道路线转到列表页,以及最终页的过程查看了下,发现他的频道标题“手机短信内容查询 在源代码中根本就检查不到,这次是最后百度只收录他站首页不收录其它页面的最终原因。因为他站可能是使用了iframe框架或者JS调用的导航的url在搜索引擎中屏蔽了,这样搜索引擎是完全抓取不到他们的频道页面以及列表页,到最终页面,当然就不会收录其它页面了。
  最后我建议这个网友把对搜索引擎屏蔽的代码给改成正常的,符合搜索引擎抓取的程序,这个事实说明很多做开发的朋友,虽然他们对程序精通,但是往往会忽略到搜索引擎的爱好,有时候可能是为了程序的方便却弄巧成拙,让网站不能更好的被搜索引擎抓取。
  下面说下URL对搜索引擎的影响:
  还是拿这个站点说,他站的频道文字很长,因此他选择用的列表页的目录URL是相当长的全拼,这样也是对搜索引擎抓取是很不利的,一般在抓取URL地址最好控制在60个字母以内, 这只是列表页地址已经有30个字母,如果是最终页地址,还会在列表页后面继续延伸URL字母就会增长,所以在列表的地址时候就不能像他的那个站一样吧吧频道的url设置的超长,否则最终页URL肯定就超过了60个字母的极限,这个是都搜索引擎的抓取不好的。
  下面还有一种只收录一个页面的问题:
  例如合肥房产为例这页面其实是使用了静态页面转化对搜索引擎抓取是很友好的,这个页面相当是直接用site:去查收录是查不到的,在静态页面我们一般查收录直接把URL地址放到baidu搜索框中回车就可以看到结果,大家可以拿这个频道页面地址去site发现收录只有一个页面对吧!但是这个是使用了静态的转化,其实收录页面是相当可观的,大家可以打开这个房产频道,里面还包含了“租房频道,求租,日租等等小的类表这个租房列表的百度收录目前显示的3800000篇,数字是相对很大的,而且这个只是房产频道中的一个小类的收录,房产包含了很多这样的小类,加起来的收录才是房产静态地址的总收录数字,是相当可观。
  很多朋友做连接的时候都喜欢看收录越多越好,其实在这里大家可以思考下到底房产静态页面做连接好呢?好是类表中的链接的效果更好呢?呵呵 这里我就不多说了,大家可以自己判断的。
  大家可以看见,很多网站只收录一个页面,这种静态页面也是收录一个页面,但是意义完全不同的,在这里还有很多类似的站点只收录一个页面的情况,导航站一般收录篇数普遍是比资讯类型的收录少的,这个大家可以到时候评估下。
  以上都就是我的经验,希望读者们能够按照以上的说法去做,我相信你们的网站会给百度收录的跟多。

Tags: ,山西晋城网站建设,晋城在线网页学习,晋城企业智能建站