百度是不是最懂中文我不知道,但最近我发现百度确实只懂中文。偶然地我查阅了一下arXiv.org在百度中的收录情况:
百度:site:arxiv.org;只找到相关网页6篇。
而Google:site:arxiv.org;则找到1,730,000项。
是不是百度不索引国外的服务器呢?百度一下site:cn.arxiv.org(这个网站是arxiv.org的镜像,由中科院理论所维护),只找到可怜的1篇。我们知道搜索引擎索引网站是按照遍历网址的方式进行的,指向这个网站的连接越多则被索引的几率越大。arxiv.org的连接数在互联网上可谓多如牛毛,至少每一个大学图书馆都会连接。而百度对arxiv.org收录数量如此之少,只能说明百度从策略上完全放弃了英文搜索,说白了百度搜索的不是互联网,而是咱们中国人自己的局域网。
按照这个思路,我们很容易得到更多的例子:
百度:site:nytimes.com;只找到2,070篇。
百度:site:pubmedcentral.nih.gov;只找到2篇。
百度:site:nasa.gov;只找到2,830篇。
不论多么优秀的知识和文化遗产,不论多么棒的精神食粮,只要是英文,百度一律是视而不见的。
有很多声音:我们已离不开百度,但这些人肯定不包括百度的工程师们,也不包括李彦宏们。你能想象计算机工程师只看百度国学吗?同样你能想象李彦宏只读人民日报吗?当然不可能!
当然我写这个Blog并不是抱怨什么,毕竟收录哪些网站,收录到什么程度是百度自己的事。但我还是希望百度开始索引优秀的英文网站,比如arXiv.org。百度是青年大学生的首选搜索引擎,对于他们来说搜索引擎并不仅仅意味着娱乐和休闲,更意味着是获取知识进行研究的重要渠道。
没错,100个人眼里有100个搜索引擎,但很不幸在百度眼里,搜索引擎仅仅是获得网民眼球、流量和商业利益的赚钱工具。这当然也是中国网民的悲哀,即便在网络时代,大多数中国网民的精神生活也更象是100多年前的义和团时代。

转自 奇迹日记

Popularity: 11% [?]