Daily Archives: November 17, 2008

百谷虎山寨搜索引擎

上次说过了山寨版的 Google 音乐搜索,今天在豆瓣上又看到有人发现了一个更为强大的山寨版搜索引擎 – 百度, Google, 雅虎山寨搜索引擎,域名也挺有意思的: http://www.baigoohoo.com/

Photobucket

这个搜索引擎显然就是冲着山寨版来的,而制作的方法可能和山寨版 Google 音乐搜索类似,都是通过一个 Iframe 框架来包含进其他网页,这里被包含的就是百度, Google 中国和雅虎中国.不过我在 Firefox 和 Safari 下都没有尝试成功,可能只能在 IE 里使用.

另外我知道的山寨搜索引擎还有 http://www.googlebaidu.com/http://baidugoogle.net/ 大家不妨也都试一试,体会一下山寨版搜索引擎的强大.

不知道还会不会出现集 Google, 百度, Live, Yahoo, Ask 等众多搜索引擎于一身的山寨版.

如果你知道更多其他山寨版搜索引擎也欢迎在评论中指出,谢谢!

Google Docs 的市场份额到底有多少?

最近有很多关于 Google Docs 使用率和市场份额的报道, Matt Cutts 对一些互联网市场调查公司公布的数据做了分析,他的分析也能使我们对 Google Docs 的市场份额有更深的了解.

数据来源 #1: Compete(相关报道). Compete 估计在9月份一共有440万人访问 Google Docs, 根据他们的数据,这仅仅占美国网民总数的2.4%. Compete 的数据来源中有一部分是向国际互联网络服务供应商(ISP)购买的,但是没有透露哪个国际互联网络服务供应商向他们出售数据,所以这很难判断这些国际互联网络服务供应商的用户是互联网的新手还是有一定互联网技术的人,也很难了解这些用户是比较有钱的人还是低收入者.有其他数据服务机构(比如 Nielsen//NetRatings)表示 Google Docs 的用户中,高收入者以及比较懂得互联网技术的人较多.

数据来源 #2: ClickStream. 最近来自 ClickStream Technologies 的一份报告说,有1%的互联网用户使用 Google Docs. 说实话, Matt Cutts 觉得这个数字有点低了.所以他深入了解了他们是如何得到这数据的,并且发现了根据他们数据 Google Docs 使用率如此之低的原因. ClickStream 在报告中说:

“从2008年5月到11月, ClickStream Technologies 招募了2400名18岁以上的美国人,对他们进行了调查,让他们在电脑上安装了 ClickSight® …. 这些人都是通过市场调查公司招募来的,他们参加调查后都能获得现金和奖品的奖励.

- 根据他们自己的报告,样本人群里女性占65.5%,而男性占34.5%…

需要注意的是:

- 2,400 个用户并不是很多人.

- 比较懂电脑和比较富裕的人一般不太愿意同意受到上网点击的监控来获得一些现金和奖品.可以说大部分比较懂电脑的人都不会接受这个请求的.如果 Google Docs 的发部分用户真的是比较有钱而且懂电脑的话(事实上应该是这样的吧),那么在 ClickStream 的样本人群中 Google Docs 的用户本来就比较少.

- 65.5% 的女性使用者这个比例看起来有点高了. Matt Cutts 觉得和52%的女性互联网用户比较接近的比例会更有代表性.如果 ClickStream 的样本人群里有65%以上的女性用户(这甚至不在50%-59%这个范围之内),他们的数据里很有可能会有一些错误,比如招募来的用户所来自的网站受众并不能很好的代表整个互联网受众.

数据来源 #3: Wakoopa. Wakoopa 是一个 Web 2.0 的网站+客户端下载,让用户能跟踪并且分享使用的软件,并且最近也开始跟踪在线应用.而且使用 Wakoopa 的人群大多是比较了解电脑的人.下面是一些使用该服务的用户的数据:

Windows Explorer: 23,985 人
Finder: 6,254 人
23,985 + 6,254 = 30,239 位活跃用户

Word: 14,985 人
OpenOffice: 3,762 人
Google Docs: 1,516 人
Corel WordPerfect: 80 人

这并不是所有活跃用户, Matt Cutts 只是选取了两个使用这最多的单个系统独有的程序 Windows Explorer 和 Finder, 然后把这两者的数据加了起来作为一个样本,从而得出 30,239 位活跃用户.下面是一个 ClickStream 用户和 Wakoopa 用户同类办公软件的使用比例对比:

Application % of users (ClickStream) % of users (Wakoopa)
Word 51% 49.6%
OpenOffice 5% 12.4%
Google Docs 1% 5.0%
WordPerfect v.12 3% 0.3%

你也可以通过这个比例图看到:
Photobucket

(图表均来自 Matt Cutts 的原文)

根据 ClickStream 的数据,喜欢使用 WordPerfect 的人是喜欢使用 Google Docs 的用户数量的3倍,而 Wakoopa 的数据显示使用 Google Docs 的人是使用 WordPerfect 的人数的近20倍.

那到底谁比较可信呢?两组数据都有一些偏颇. Wakoopa 的数据来源的样本是 ClickStream 的十多倍,但是 Wakoopa 的用户大多是比较懂电脑的.如果你有一些朋友愿意参加有偿在线调查的话,你可能会觉得 ClickStream 的数字比较准确.如果你和那些更熟悉互联网的人一起,并且不认识用 WordPerfect 的人,你可能会更相信 Wakoopa 的数据.如果 ClickStream 公开它样本中 IE 和 Firefox/Chrome/Safari/Opera 用户的比例,这样就会让大家对它的样本有更多的了解.

正确的答案可能在来自 ClickStream 的1%和来自 Wakoopa 的5%之间.

Google Docs 在办公软件领域还处于劣势.但是 Google 那些对互联网有一定了解的用户还是很有潜力的,而且就像有人在 Matt Cutts 文章后的留言里指出, Google Docs 还有一个便于嵌入网页进行分享,发起投票的功能,这是传统办公软件所没有的.

Google 中国:中文用户每天比美国用户在搜索上浪费超过250万小时

这几天 Google 中国频频高调出现讨论关于搜索公正性的问题,今天 Google 黑板报也发表了一篇文章,文章主要讨论的是搜索的准确性,公正性,文章里讲到中文用户每天比美国用户在搜索上浪费超过250万小时(或者超过10万天)的时间.

美国用户在他们最常使用搜索引擎的搜索结果页面上,目光主要聚焦在搜索结果的“黄金三角区”,大概用时30秒,而中国用户的目光却 散落在整个页面,用时超过60秒,所谓“黄金三角区”对中文搜索居然毫无意义.这很重要的一个原因,是用户在原本的关键位置无法找到非广告内容所致,他们需要自己满屏地、甚至翻屏的辛苦寻找有用信息.合计起来,中文用户每天比美国用户在搜索上浪费超过250万小时(或者超过10万天)的时间.

Photobucket

(图片来自 Google 黑板报)

下面是我摘的几段原文(除了后面链接,其他粗体都是我加的),看来 Google 中国在搜索公正性方面的确花了不少力气:

Google 中国认为,这是在搜索的“公正性”与“准确性”两个不同层次的事情间偷换概念,我们认为中国搜索行业最需要做的、最紧迫的事情,就是正视公正性与客观性对中国搜索行业的根本性意义,没有搜索公正性,搜索的准确性就无从谈起.

在海洋般浩瀚的互联网世界里,任何搜索引擎都会受到垃圾乃至不良信息影响,然而这些垃圾或不良信息在不同的商业模式面前面临着两种不同的生存可能:一种是鬼鬼祟祟千方百计去骗取网民的注意力;一种是掏点小钱就能“漂白”身份登堂入室畅通无阻.对于搜索厂商而言,能否杜绝前者,只是技术问题;能否根除后者,则是价值观问题.就好比一个人,人可以有能力的不同,但所有人都必须堂堂正正.

1,垃圾信息和搜索公正是截然不同的两件事.
搜索公正性是负责任的搜索引擎公司对用户的一个承诺.搜索结果最终的公正排序,应当是以一定的算法系统对充满着庞大的人类智慧的网页和链接得出的运算结果,而不是出于一己利益人为干预和改变.打击垃圾信息的目的,是打击一些垃圾信息的发放者,避免他们企图通过不公平的作弊手段来操纵自己网站排名,让所有的用户受益于最佳的搜索质量.Google 中国处理垃圾信息的工作一直是中国搜索引擎里最好的,也是在 Google 全球所有搜索语言中保持领先的.

2,公正性是搜索的根本.
在搜索结果中混入广告、按照广告价码的高低来排序的方式,违背了搜索公正性的根本.如果一个搜索引擎收取好处,以广告的名义提高垃圾信息的排名,或者任意根据收费多少而主观决定何谓“搜索热点”,这势必将损害绝大多数网民的根本利益.网民使用搜索引擎是来寻找“答案”的,而非仅仅是“广告”,广告也许是“答案”的一部分,但绝不会是全部.

3,Google 中国呼吁所有的搜索引擎,加入 Google 中国、腾讯、雅虎的行列,作出下列承诺:
(1) 明确标识和区分广告及自然搜索结果,以免误导用户;
(2) 珍惜搜索结果页面的黄金区域,决不让第一页搜索结果全部为广告充斥,让中文用户彻底告别搜索从第二页开始的历史;
(3) 绝不滥用自身的市场地位,绝不以收费或变相收费的形式来改变或删除搜索结果.

Google 中国一直坚持的原则是:不人为干预搜索结果.

其它与公正性、搜索排名技术相关文章
谷歌排序的介绍:http://googlechinablog.com/2008/07/blog-post_21.html
谷歌排序背后的技术:http://googlechinablog.com/2008/07/blog-post_23.html
谈 Page Rank – Google 的民主表决式网页排名技术:http://googlechinablog.com/2006/02/page-rank-google.html

客观公正性是搜索行业的根本标准:http://googlechinablog.com/2008/04/blog-post_14.html
谷歌广告的成功利器:http://googlechinablog.com/2008/04/blog-post_16.html
说一说“谷歌资讯”的使用技巧与搜索行业“客观性”的基本原则:http://googlechinablog.com/2008/04/blog-post_07.html

找回 Google 完整的 Even More 界面

最近我发现在 Google 英文页面(www.google.com) 左上方链接栏里点击 More -> Even More 之后进入的页面上 Google 产品少了很多,就是会看到下面这个页面:
Photobucket

Google 中国以及其他本地化的 Google 页面上”更多”页面都显示正常.我曾经在 Blogoscoped 里提问但没有人回答,在豆瓣也看到有人提问,终于最后还是在 Blogoscoped 里找到了答案,原来是 Google 采用了地理定位技术的问题,让美国以外的用户不能通过默认链接访问完整的更多页面.

要解决这个问题你可以使用这个链接 http://www.google.com/intl/en_us/options/ 这样就能看到完整的页面了.