Google公司今天宣布,其Googlebot web信息采集系统将开始自动填写HTML表单,并记录反馈结果。

Google搜索引擎似乎在不顾一切的吞食来自互联网的数据,仅去年1年它就吞下了约100 Exabytes(1 Exabyte=1000000000 Gigabyte)的数据。之前Google并不触及大量的深层页面(也就是网站中被隐藏的内容,例如没有连接的页面,非文本的内容,或是动态内容返回的结果),但是从今天开始,Google将开始对这些页面进行检索。

据Google表示“对于文本框,我们的电脑会自动对网站上的表格进行填写,并会选择菜单,复选框,以及相应的按钮,然后索引有价值的HTML结果。”Google指出,对于动态表格所反馈的结果并不影响对网站的普通检索,排名或是其他的内容。并且Googlebot绝对会遵守robots.txt的规定不对禁止访问机器人访问的页面进行检索。

据估计,目前互联网上的深层页面要比目前公布的页面大几个数量级。而且有人指出,Google永远也不能把互联网上的所有内容都检索到,其Googlebot的爬行结果对于整个互联网来说只是管中窥豹。不过Google表示,对深层页面的索引只是为了找出更多动态页面之间的联系,而不仅仅是为了索引结果。

出处:驱动之家
原文:http://news.mydrivers.com/1/103/103462.htm

14 Comments, Comment or Ping

  1. 一段时间没有过来,老大的seo博客居然更新了这么多。。

  2. 好像好几天前就有这个消息了啊

  3. google要发飙了

  4. google强!

  5. 谷歌确实强悍

  6. 谷歌的技术比较好

  7. 谷歌,顶啊

  8. 百度什么时候能做到呢

  9. 刚发现是很早的文章啦,支持下。

  10. 谷歌就是厉害

  11. 谷歌这样的检索对SEO和网站是非常有帮助的啊,这样一些网站的层次比较深的,也可以得到抓取了。对于网站来讲,是好事。支持!

  12. google本来就是个大巨头吖,十分深层的东西都可以挖掘出来,厉害

Reply to “Googlebot开始检索网站深层内容”