如果说全中国能够再找出来一个搜索引擎能够与百度和谷歌分庭抗礼,那我觉得非腾讯的搜搜莫属。腾讯搜搜虽然目前使用google的技术,并且没有展开任何大规模的推广攻势,已经取得了3.5%的搜索引擎市场份额,仅次于百度和谷歌,这一点恐怕另搜狗十分汗颜。这个市场份额不管是从艾瑞和易观的市场调查,还是网站搜索引擎流量来源,都还是可信的。

记得前两个月有一次拜访Google中国总部的朋友,一起聊到搜搜,这位朋友说他们监测到腾讯搜搜的流量增长得相当迅猛,甚至可以用恐怖来形容。朋友打趣说搜搜可真够懒的,用了两年多的google技术,自己却不去开发。我想以马化腾的性格,不是搜搜不开发,而是悄悄一直在做只是还不敢拿出来见人,不到自己的技术能够拿得出手,搜搜一定不会轻易亮剑。这一点与微软刚拿出来见人的半成品“必硬”有着本质的区别。我试用过必应,微软的想法不错,但技术不是与google一个档次的,这样的烂搜索引擎我自然不会去使用。

去年底的时候,有互联网的业内专业评论家就透露过搜搜很快将推出自己核心技术的搜索引擎,只是到了现在还没见大的动静,只是见腾讯不断的在大量的招聘搜索引擎工程师。其实如果眼尖,完全能够发现一些搜搜真面目的蛛丝马迹的。如果我没猜错的话,其实搜搜早在去年就把这东西放在了首页的某个链接位置,那就是他的综合搜索。有消息灵通的人士在5月就在点石发布了一条小道消息,这则信息相信应该是真的。

看看搜搜自今年来的一些不引人注意的行为:

1、搜搜在09年1月份举办的征名活动,已经结束,不知道搜搜准备改成什么名字。

2、经常关注apache或者IIS日志的话,能够发现sosospider异常活跃,比baiduspider还要勇猛。这应该是soso大量在抓取网页数据了。

3、搜搜的大规模招聘行为,并且从百度挖来了据说很厉害的肖锦恒。当然还有去年马化腾放话招聘两三千人的人工搜索编辑。

4、搜搜在不经意间,已经悄然完成了图片、音乐、搜吧、问问、百科、新闻、视频、博客搜索的研发并正式推出,还有与爱帮合作的生活搜索。

5、alexa悄然爬升到了83位,在所有中文网站中排名11位。

难怪关于搜搜即将正式使用自己技术的小道消息这么多,原来搜搜已经显得底气十足。图片、音乐、搜吧之类的应用,没有大的技术含量,应该不会比百度差,但一个通用搜索引擎最关键的还是网页搜索技术,那么搜搜的搜索技术与谷歌和百度相比,到底怎么样呢?不试不知道,试了才能吓一跳。我们来看三者的对比(搜搜技术假定是http://zh.soso.com)。

1、搜索一个热门关键词“手机”,三个搜索引擎的结果对比:
谷歌的:
mobile_google
百度的:
mobile_baidu
搜搜的:
mobile_soso
通过以上结果,我们发现搜搜与谷歌有5个相同的结果,搜搜与百度同样有5个相同的结果,而百度与谷歌则只有2个相同的结果。

2、搜搜一个热门关键词“周杰伦”,三个搜索引擎的结果对比:
谷歌的
jay_google
百度的
jay_baidu
搜搜的
jay_soso
通过以上结果,我们发现搜搜与谷歌有5个相同的结果,搜搜与百度则有8个相同的结果,而百度与谷歌则也有6个相同的结果。。如果我们看搜搜的结果,我相信大家已经开始感觉到了寒意,因为我们看到搜搜的性格与百度似乎是一样的,喜欢将流量导给自己。

3、搜搜其他的一些关键词,搜搜的结果与百度和谷歌都有很大的相似性,这一点,很是佩服,搜搜仅仅花了两年时间,自己的技术就差不多赶上了google和百度。

4、只是,我无意中搜索zac,搜索乐思蜀,搜索小鹏,搜搜robin,搜索david yin等SEO届人士的时候,甚至搜索我自己,情况却很是悲观,让我感觉搜搜似乎是对SEO行业有“特殊待遇“的。

本来对犹抱琵琶半遮面的搜搜很是期待,可是到了最后,我却怎么也期待不起来。或许中文搜索世界里有百度和谷歌已经足够了吧。。。

作者:星箭
出处:星箭SEO博客
转载请注明出处并保留链接

最近一段时间似乎一直是百度大抢风头,又是百度日文正式版,又是进军C2C,现在还打起了IM软件的主意。但是互联网另一巨头腾讯却一直悄无声息,除了珊瑚虫那个官司让人还记得腾讯的存在之外,不知道腾讯在不声不响的做什么事情。不过也正好符合了老马的性格,低调稳重。

前面的是一堆屁话,接下来才是正题。不知道SEO同仁有没有发现一个现象。我最近观察weblog,发现了一个新的spider异常活跃,叫做Sosospider,从它的命名规则上来看,立即想到应该是腾讯soso的spider。日志上是这样写的:

124.115.0.19 - - [15/Mar/2008:00:31:14 -0700] "GET /seo-tech/baidu-utf8-url.html HTTP/1.1" 200 7379 "http://www.starow.net/seo-tech/baidu-utf8-url.html" "Sosospider+(+http://help.soso.com/webspider.htm)"

124.115.0.19 - - [15/Mar/2008:00:31:20 -0700] "GET /wp-content/plugins/coolcode/coolcode.js HTTP/1.1" 200 586 "http://www.starow.net/wp-content/plugins/coolcode/coolcode.js" "Sosospider+(+http://help.soso.com/webspider.htm)"

124.115.0.27 - - [15/Mar/2008:00:31:21 -0700] "GET /wp-content/themes/grid_focus_public/style.css HTTP/1.1" 200 7920 "http://www.starow.net/wp-content/themes/grid_focus_public/style.css" "Sosospider+(+http://help.soso.com/webspider.htm)"

这是三段最有意思的日志,从这上面看Sosospider不仅是爬网页,而且连js、css也顺便都爬了。观察3月15号的log,做了一下几个搜索引擎来爬的次数对比:
Baiduspider:5692次。Googlebot:118次。yahoo:685次。YodaoBot:301次。Sogou web spider:49次。Sosospider:2772次。

从爬网页的次数上来说,Sosospider仅仅次于百度,排在第二位。而我的博客页面总数也就不超过300页。可见Sosospider不可谓不疯狂。

目前腾讯的搜搜使用的google的技术,所以一直没见腾讯有特别大的动作去推广,但是搜搜目前的市场占有率可是跟雅虎差不多级别的。如果我没记错的话,腾讯搜搜与google之间的合作似乎是今年结束。相信腾讯早已投入了大量的人力物力去做自己的搜索技术研发,从Sosospider的疯狂抓取频率上来说,soso已经开始在大规模的往数据中心里充实内容了。我们再来看去年还没有的soso相关帮助页,一个是关于sosospider介绍的:http://help.soso.com/webspider.shtml或者http://help.soso.com/webspider.htm。还有一个值得关注的是,soso的站长指南已经比较详细了,充实了一些关于sosospider以及抓取相关的解答信息:
http://service.qq.com/cate/soso

看来腾讯搜搜抛弃google自己自立门户的时间应该不远了,百度推出IM软件进入即时通信,腾讯绝对会向搜索市场强力出击,今后的互联网格局又多了一个看点和变数,想必两位互联网巨头一定会带来精彩刺激的对攻战。期待早日见到腾讯搜搜自己搜索技术的庐山真面目:)

翻页