Google Chrome 日本宣传片花絮

不知道多少人记得 Google 日本在今年年初放出的一个 Chrome 宣传视频(在下面),今天我在豆瓣的 Google 小组看到 from b612 给出了一个有多张这个视频制作背后花絮的 Picasa 相册。一共有很多幅图片,下面是我选的几张:
Photobucket

Photobucket
Photobucket

视频:

Google Labs 新功能:新闻时间线和相似图片

Google 在2002年启用了 Google Labs,将一些仍在实验室中的功能(通常是员工用20%自由时间开发的)放到 Google Labs 里让用户试用,并且在 Google Labs 中的确诞生了很多优秀的 Google 产品,比如 iGoogle,Google News,Google Reader 等。

Google 官方博客报道,Google 已经启用了新的 Google Labs,并且增加了两个非常有意思的功能:新闻时间线相似图片

全新的 Google Labs:

Google 表示之所以重新规划自己的公开实验室是为了更好的刺激创新。Google 把这个服务从 Google App Engine 上移到了 www.googlelabs.com,同时也重新设计了新的 Google Labs 页面,让这个页面看起来更有趣些,同时也让用户能跟随产品的一步步发展。

如果你想要对 Google Labs 里的产品进行密切关注的话,你可以订阅 Google 官方提供的RSS信息源或者添加这个 iGoogle 小工具到自己的 iGoogle 主页。另外,你在 Google Labs 的新页面上还能看到这些产品的开发者,并且可以为产品打分。

新闻时间线(Google News Timeline)

在新闻时间线里,你可以把在 Google News 以及其他来源中搜索到的新闻按时间顺序显示,并且你可以很自由的对搜索结果进行缩放,拖拽或者更改来源。你还可以把时间限定在一天,一周,一年等,或者直接输入年份,比如1986年:
Photobucket

除了在显示搜索结果的用户体验上非常具有创新之外,搜索结果的来源也是这个按时间搜索新闻的一个特色。你可以搜索报纸,杂志,书籍,博客,甚至还可以搜索音乐和电影等信息,这些都可以在 Add More Queries(增加搜索词)中进行设定。

Google 推出这个新闻搜索其实并非一蹴而就,在用户体验上,其实 Google 为自己十周年而设立的网站上已经有类似应用;而时代杂志的封面则和去年收购 LIFE 杂志封面并推出其封面图片搜索有关。

相似图片(Similar Images):

Google 并不是第一个做相似图片搜索的,微软的 Live Search 也有相似图片搜索(我觉得在 Live Saerch 搜索图片的用户体验非常好),另外 Like.com 等网站也有相似图片搜索。

可能是由于近期发布的谷歌音乐有搜索相似歌曲的功能,Google 图片搜索也决定增加搜索相似图片的功能。因为有时候你输入的搜索关键可能会有不同的意思,比如苹果,它可能代表的是一种水果,也有可能是那个生产 iPhone 的公司,甚至是香港的一份报纸。如果你只搜索苹果,这些除了同叫“苹果”以外毫不相关的结果都会出现:
Photobucket

但是如果你只想要那种水果的图片的话,点击缩略图下方的“Similar images(相似图片)”就可以获得该类图片:
Photobucket

或者如果你想要那个生产 iPhone 的公司的CEO史蒂夫·乔布斯的图片也可以:
Photobucket

这无疑是一个很有意思的功能。但是如果你关注 Google 图片搜索的话,你会发现,相似图片的搜索似乎是水到渠成的一个功能。从08年下半年开始,Google 图片搜索就不断增加着新功能,而这些新功能往往都是可以对图片进行一定的限制,搜小搜索范围来提高图片的准确性。这些新功能包括对图片大小的限定,主色调的限定,甚至图片类型的限定等,以现在推出相似图片的搜索也是基于以前的努力。而且对于图片的深度分析也被用于 Google 刚刚发布的新版 CAPTCHA 人机验证技术里。

但是目前相似图片的搜索还不是很完善,尤其目前还没有加入 Picasa 和 Google Street View 里都用到的面部识别技术,因此在判断人的相似性的时候会闹出笑话,比如下面这张(大家都看得出来哪两个比较像吧):
Photobucket

推荐,如果你对长的相似的人感兴趣,我想你应该看看这些双胞胎们

Google 发布新人机验证技术 – 转动图片验证

Photobucket
CNET 报道,Google 最近发布一个白皮书(PDF),介绍了一项新的 CAPTCHA 技术来防止网络垃圾(Spam)。CAPTCHA 全称 Completely Automated Public Turing test to tell Computers and Humans Apart,中文为“全自动区分计算机和人类的图灵测试”。CAPTCHA 技术最常见的应该就是用户注册某服务或者留言的时候需要填写验证码。

但是现在的 CAPTCHA 技术比较容易被破解,据维基百科介绍,Yahoo 和 Google 的真人验证技术都曾被破解。现在 Google 开发出了一种更加难以被机器识别的验证技术,该技术会向用户显示一张图片,要求用户把图片旋转到正常的位置(比如图片是一个人的话,就要旋转到头在上脚在下)。

Google 对于验证图片的要求是:人可以轻松的识别出上下,计算机很难识别,而且这种图片要很容易生成且容易评估。Google 的做法是:首先收集大量的图片,然后用自动定位的检测器来定位这些图片;如果自动定位器能正确的把图片旋转到正常的位置,那就舍弃这部分图片;在剩下的图片里选取人类能够辨别出上下的图片,将这些图片应用到验证中。这种验证方法的好处是用户不需要输入任何东西(有时候手机上输入会不太方便),而且没有语言的限制。比如下图:

Photobucket
A 组里的图片是人和计算机都能识别的,因为图片里有人的脸,属于比较特殊的符号,计算机可以认出来(类似的还有文字,蓝天,绿草地等等)。B 组里的图片是只有人能识别的,因为图片里有很多元素,计算机很难一一识别综合分析出上下位置。C 组里的图片是人和计算机都无法识别的,因为图片里信息太少,没有正确的上下位置。

上面可以说是解决了 Google 要求里的前两步,即人可以轻松识别但计算机难以识别。第三个要求是最难的,于是 Google 又开发了很多识别图片的系统来确保这一点(详细可以看原PDF文件)。

下面是 Google 最初用于测试的6张图片:
Photobucket

其中1、3、4这几张图片用户都能很旋转到正确的上下位置,但是2、5、6则很难。其中的原因是有的图片本来就没有标准的上下位置,来看看用户转动2和3这两张照片的角度:

Photobucket
横轴表示测试者的编号(大约有500人参加),纵轴表示测试者转动图片的角度。可以看到,图2由于很难判断正确的位置,因此用户转动图片的角度很不一样;而图3由于有明确的上下位置,因此用户都能做出基本一致的判断。

最终 Google 开发出了一套用三张图片,让真人判断的正确率能达到84%而计算机的正确率只能达到0.009%的 CAPTCHA 系统。并且通过测试发现,68.75% 的用户喜欢通过旋转图片来进行验证,只有31.25%的用户希望输入验证码来验证。

当然,用图片的上下位置来分辨真人和计算机并不是解决 Spam 泛滥的最终方法。Google 的目标是能生成和网站内容匹配的图片来改善用户体验,同时生成的图片要确保有明显的上下位置关系。另外,Google 也可能采取对图片进行一定的扭曲或者使用3D图片来进一步防止机器对图片的识别。

Google Chrome 背后的天才

上个月《金融时报》网站发表了 Rob Minto 写的一篇人物特写,文章的主角是 Google Chrome V8引擎的开发者拉斯·巴克(Lars Bak)。今天 Li Zunlong 给我发来了他组织人翻译的中文版译文,译者为 Esther,由 pestwave 校对。如果你对 Chrome 开发背后的故事感兴趣的话,Wired 今年2月初发表的这篇文章也很适合。

Photobucket
(图片均来自《金融时报》网站)

奥尔胡斯(Aarhus)是丹麦第二大城市,也是日德兰半岛(Jutland)的非正式首府。在该市郊外5英里的地方,有一座改造过的农舍。里面有宽敞的木地板和拱形的顶(曾经是马厩的一部分),在距离DVD播放机不远的地方摆着一个大的棕色皮沙发。从外面看,这座房子看上去仍略显陈旧:粗糙的石子路,凹陷得小窗;但正是这里孕育了互联网未来的关键部分之一。

从哥本哈根开车到这里的路程比预期的更漫长,房子也很难找。房子的主人叫拉斯·巴克,是一个年轻的编程天才,他之所以把家安在这里是因为他非常不愿意让别人找到自己。他的阿尔萨斯牧羊犬,米奇,见到我们也有些受惊:主人把它看住之后我才敢下车。

那是丹麦寒冷十二月的一天。这地方比爱丁堡还靠北,但天色如同东英格兰沼泽地的一样,灰蒙蒙一片。我们握手的时候,巴克看上去很不自在,我觉得他好像压根不想让我靠近他的居所。不过,我们还是走进了放有棕色皮沙发的拱形顶房子里。现在这里是家庭影院,之前曾是他编程的办公室。温度只比外面稍高一点。我拿出笔记本的时候还在瑟瑟发抖。“好吧,您想了解些什么呢?”巴克发问了。我们有四个小时的采访时间。

拉斯·巴克并非家喻户晓的名字——至少这个拉斯·巴克不是。在丹麦还有一个拉斯·巴克更出名,那是一位职业自行车选手。但是这位巴克可比任何运动员对你生活的影响更加深远。他最近的计算机软件程序V8是Chrome浏览器(谷歌商业计划的关键)的一部分。

网页浏览器都不赚钱,无论是IE、Safari、还是火狐。那么,新浏览器对谷歌的重要性何在?为什么要投入时间和精力在免费产品上,而这些又不能给公司带来收入?答案不在浏览器本身,而在于它能访问的内容:也就是网络应用程序。这些才是给谷歌带来收入的东西。比如,该公司对Google文档寄予厚望,这是一套在线办公软件,和微软的当代企业工具桌面版Office程序(Word, Excel和PowerPoint)类似。但为了更好地体验获得这些程序和其他在线应用,用户需要更好的浏览器,以便更好地运行相关代码。我们很多人已经在使用网络程序了,比如Hotmail, Yahoo邮箱或Gmail,不过它们都相对简单,比起一般的桌面软件,它们的复杂性相形见绌。

浏览器已经无法处理日益复杂的网络应用。就好比是很多高性能的跑车跑在辙颠簸不平的路上一样。但是没有哪家跑车制造商会出钱修路,毕竟自己修路对手也会沾光,更不要提高昂的费用。软件开发的成本不高,但依然存在竞争问题。不过谷歌说它不在乎,它说:没有好的浏览器,大家伙儿都会遭殃。

通过网络访问复杂程序的能力被称为“云计算”,并且谷歌并非唯一一家声称领先的公司。即使微软,桌面应用软件和操作系统的代名词,也在跃跃欲试。史蒂夫·鲍尔默,微软的首席执行官,已经承诺研发“在互联网中运行的操作系统”——他称之为“视窗云”,不过要想真正实现云计算,必须改进浏览器。

恰在此时,巴克出现了。这个丹麦人首次在加州硅谷引起人们的注意是在1991年,那时他在Sun公司工作,后来成为业界最佳程序员之一。1994年,他离开Sun,帮助创建了Animorphic系统,该公司后来被Sun收购。再次回到Sun之后,巴克开发了后来成为Java HotSpot(行业标准计算系统之一)的程序。

可是2000年初,他却离开了计算机世界的核心,回到了丹麦,搬家是为了幸福生活,为了他的女儿们(他想让她们上丹麦语学校),为了自己的身心健康。美国的开发者社区工作很紧张,生活方式不健康。当巴克回到丹麦时,两个月之内他减了20斤(多亏了美国的阿式饮食疗法【Atkins diet】),而且再也没有反弹。

2002年,巴克在奥尔胡斯创建了一家名为OOVM的公司。2004年,他将公司卖给了一家瑞士公司Esmertec,然后又在该公司干了两年,帮助两个公司的融合。离开Esmertec时,他并不特别想找新项目:他有足够的钱养家糊口,也有各种打发时间的方式,包括粉刷农舍的计划。他估计得要一年时间。

然后Google的电话就来了。对于Google,巴克是不二选择——他编写了JavaScript引擎(Chrome的核心部分)。对于巴克,为Google工作就是 “小菜一碟”。“我不在乎当什么高级经理。我在乎的是推动技术边界。”巴克接受了这份工作,但不会回到加州。事实上他从没打算再次回加州——虽然谷歌的人性化办公室闻名远近,餐厅里的美食,还可以免费理发,巴克却宁可在家工作——离总部5000英里,相差9个时区。谷歌做好了“信任我的准备。他们知道我不会消磨时间。”重新装修农场的计划要搁置一下。“最后,”他说,“我只有14天的时间(粉刷)。涂料还留着呢。”

Photobucket

巴克在日德兰半岛的居家办公室,他和妻子,孩子还有宠物阿尔萨斯牧羊犬米奇住在一起

巴克开始工作,在现在是家庭影院的地方建立了办公室。农舍是围绕院子修的,家就在办公室对面。每天,他走过石子路到办公室,然后开始写代码。每天结束时,他又穿过院子,走回家,把工作彻底放下。在这些行走之间,他投入到浏览器开发中,有了这种浏览器,其他人就有更多机会做他所做的事:在家工作,与总部连接,所需要的全部工具就是互联网的力量。

巴克也许是个计算天才,但他是上大学之后才开始接触计算机的。“高中的计算机室又黑又臭,只有书呆子才去,”他说,“我喜欢运动。弹板跳水–特酷。我后来才成为书呆子的。”

在《局外人》中,Malcolm Gladwell探讨了天才和成功的本源,作者陈述了这样的观点,你需要苦练10000小时才能在所选择的领域里真正成功。我问巴克,你做足10000小时了么?我能看出来他觉得这压根不相关;他对此也不感兴趣。“我只是很高兴大器晚成”,他再次强调,“而不是年少就成名。”

也许是因为大器晚成,巴克从不热衷于传说中那种靠咖啡提神彻夜写编程代码的故事。不过这可能也缘于巴克精通的程序类型:“虚拟机”,这是计算机科学家Gerald Popek 和他的项目伙伴Robert Goldberg早在1970年代所探讨的一个想法。虚拟机器名副其实——真正机器的计算机世界版,能够在单机程序或整套程序上使用。Chrome浏览器属于后者。V8,巴克的虚拟机器,编辑不同程序通用的代码,以便减少冗余,让网络应用程序更快运行。

“虚拟机是头怪兽,”Bak说,“没有完美的解决方案,你只能为“最佳时机”进行优化。有很多技术含量在其中。这是个漫长的游戏,你玩不完的。

“工作量是恒定的,”他补充说,“所以我总要停下来吃饭。你可以有正常生活。”对巴克而言,这意味这家庭和隐私。工作/生活平衡的问题在谈话中一再冒出来——虽然他不反对美式生活,但显然他更喜欢丹麦的生活方式。“在美国,需要进取和格外自信。欧洲的生活方式则不然。而在美国,你能有晋升机会,能与技术发展保持同步。在欧洲,你就只能做办公室当经理,没有活可干。”通过在丹麦为谷歌工作,巴克意在一箭双雕,同时享受两个世界中最好的东西。

巴克将他的V8项目成为笑话:V8引擎就好像汽车镀铬发动机罩下面安装的那个东西 ——“而Google就那么酷——不论项目最初的名字是什么,以后不会改变。不会因适应市场营销而改变名字。”

从开展谷歌项目的第一天,巴克就征募了他以前的学生卡斯帕·伦德的帮助。伦德年轻也更外向,他同意来农舍上班。他还有其他作用——让巴克娱乐。伦德和他那竞争力很强的老板习惯于用乒乓和Wii网球来调剂工作。谁的乒乓能赢,我在想;巴克回答说:“问卡斯帕。”哦,那么卡斯帕能赢喽。“不是。”稍后,他透了口风:“他打得比我好,不过还是我赢。”他们的关系已经从师生变得更像同事,但又不完全是;有朋友把这比作巫师和学徒。

许多程序都是用以前的版本或相关代码创建的,但V8是白手起家——一片空白。后来当我在丹麦之旅中遇见伦德时,他很乐于强调这一点:“这是最纯粹的编码形式。”巴克显然有共识——在伦德说话的时候,他不停地微笑。

随着V8深入,项目扩展,巴克和伦德把编写代码从农舍搬到奥尔胡斯的一座大学,巴克在此任教。骑车需要30分钟,把通勤当作锻炼和巴克将工作和生活平衡的哲学不谋而合。

大学办公室虽然在距离上与加州山景Googleplex总部遥遥相隔,不过一看就是谷歌的风格。在进门的地方,五颜六色的椅子和小布袋到处都是,然后是两个主要房间,有10来个人在这里工作。不过没有餐厅,只有厨房,里面有坚果贩卖机,还有一冰箱的瓶装水和健怡可乐。巴克引入了无糖政策:“不是完全无糖——你可以从水果里得到自然糖分。不过没有巧克力,没有明目张胆的糖果而已。”

每个人愿意接受这里的管理制度,见证了办公室的忠诚度。好像所有人都骑自行车来上班,下午5点左右就离开。“我们开始的也早,累了还工作没有意义,所以我们就回家,”伦德说。这是两小时前巴克在他的农场上给我讲述的工作生涯的逐字描述。这令人心服口服。但和谷歌的人沟通怎么办?当巴克、伦德和其他成员在奥尔胡斯时间下午5点下班时,旧金山还不过早上9九点。他们是利用硅谷24小时工作的趋势吗,还是并不需要和总部保持联络?伦德说大多数时候用电子邮件就可以了。我采访的当天,在其他同事下班之后,巴克需要参加电话会议。他努力不把情绪流露出来,但很显然,他并不想参加。

编程可以是很单调的事情。虽然巴克和伦德紧密合作,但还是有种遗世独立的感觉。你写代码,测试,修改,再写,周而复始,直到你得到自己需要的。对于巴克,这很简单,也很隐蔽。然后,出于某种原因,外界就想进来干扰——想要认识你,想要了解你的工作。

巴克很看重自己的隐私。在家给他照相也让他明显不自在。但当我告诉他,把他的名字输入谷歌搜索引擎里,得到的都是一页又一页和他同名的自行车手,这肯定遮挡了他本该有的光彩,他耸耸肩,“我老了,不在乎别人说我什么。”

真正让他恼火的是大家误会他的工作——或按他的说法,“技术”。他举了一个例子,在有篇关于他的文章里,记者混淆了Java和JavaScript(前者是可以在线进入的独立程序,而后者是依靠浏览器的脚本语言)。对此我们都笑起来,在那么一瞬间,我觉得巴克和我有了默契。

世界以非同寻常的方式发现了Chrome。故事是通过谷歌早前发布的专门漫画传出去的——显然犯了个错误。公关忙成一团来支持这个消息,匆匆忙忙地举行了电话会议,发表博客日志解释到底发生了什么,随后又是新闻发布会,然后在Googleplex举办产品展示。

在群情激动地讨论为什么谷歌要发布新浏览器,泄密是不是有意而为之时,认真看漫画的人寥寥无几。虽然是由Scott McCloud(也算是漫画界的传奇人物)编撰的漫画,这可是艰难的工作。讨论的是Java Script (不是Java哟!),CPU和存储器漏洞——大多数都不想知道的计算细节。但是这漫画却显示了Chrome特性背后的思想理念,还有独立小组解决拼图各个部分的方式。巴克和伦德最初出现在第二页上,不过是到了大约三分之一的时候,在第13页,才有对“丹麦V8团队”的介绍,解释了这个“虚拟机器”的开发,不过没有提到为什么V8距离谷歌总部那么远,隔着大陆和海洋。

伦德和巴克喜欢这个漫画。在奥尔胡斯办公室里,整幅漫画都用相框框起,挂在墙上。“开始,我觉得这想法很怪异,”巴克说。“但是我意识到这太有才了。与其他白皮书相比,这要强10倍。大家都觉得这很有趣。”

我怀疑他们俩都喜欢它的原因是它平等地对待巴克和伦德——虽然与巴克相比,伦德可算是个大块头。“让我看上去像个15岁的男孩,”巴克说。他矜持地微笑了。

在刚推出的100天内,Chrome就已经吸引了一千万用户。虽然这个数字很震撼,可也只代表在线浏览器使用的百分之一。它还需要假以时日方能与火狐、IE及其他产品抗衡。去年12月,谷歌宣布Chrome已经结束研发或Beta(测试)阶段,准备在某些个人电脑上作为预选安装的浏览器发行。这样可以迅速增加用户数量。而且,欧洲委员会与微软就其IE浏览器如何并入视窗(Windows)操作系统所产生的反托拉斯战争以及其他纷争可能会给谷歌这样的竞争者占领市场的机会。

抛开法律和市场份额不说,技术挑战已经存在了。“微软不得不创建比V8更好的东西,”巴克说。很多技术观察家很怀疑他们能够在短时间内完成:在测试中,V8处理JavaScript的速度比最常见的IE浏览器要快56倍。“我们一开始就是高标准,”巴克说。随后谦虚地加了一句:“还算成功啦。”

即使Chrome漫画没有让巴克迅速成名,他的知名度在这几个月中也迅速增加。越来越多的人想了解Chrome背后的这个人。他宁可写虚拟机器,也不愿意管理奥尔胡斯办公室,而且他宁可做其他所有事情,而不是和记者谈话,可那是游戏的一部分,他接受了。话虽如此,他离Facebook的创建者马克·扎克伯格或比尔·盖兹还有很远的距离。我问,在漫画出来之后,你有没有收到粉丝的邮件?他笑了:“没。不过我也没有收到抱怨的邮件。”

背景知识介绍:浏览器大战

互联网在其短短历史中,已经看到各种浏览器的产生,但是主角只有四个:网景(Netscape)导航器,IE浏览器,火狐(Firefox)和Chrome。

说到普遍使用,网景浏览器是第一。每个人都用过导航器——部分原因是没有其他正儿八经的替代者——而且它用起来不错。然后是微软的IE浏览器,该产品是公司主导产品Windows操作系统的一部分,从而带动着它的增长。截止1998年,IE在使用方面已经取代了网景。

微软被指控违反了反托拉斯法,但那时已经太迟。IE控制了90%的市场份额,虽然有官司在身,时至今日,它还是以默认浏览器的身份安装在世界上绝大多数个人电脑上。网景被美国在线(AOL)收购了,在历经波折之后,于2007年停止研发。

要不是“开源”社区,事情到此就结束了。开源软件曾是(而且在某种程度上仍然是)微软之鞭。总裁史蒂夫·鲍尔默曾说Linux的开源操作系统是癌症。此类软件由软件开发者团队的人不断改善,他们这么做基本上是什么都不为。劳动果实通常都免费分发。1998年,网景将导航器的代码转换为名为Mozilla的开源项目——火狐正是从此演变而来的。

火狐占了IE市场份额的20%,而且仍在增长。它的众多属性——如分页浏览和读取设置——在其他产品如浏览器Opera上出现得其实还更早,但是得益于口碑相传、出色的市场营销和火狐的对于技术水平较高用户的吸引力,它已然成了IE最强劲的挑战者。而且,它是开源的,第三方开发者可以通过创建新应用程序扩展火狐的容量,让它更加强大。

在2008年谷歌推出Chrome之前,浏览器市场好像成了IE和火狐二者之间的竞争,当然也得提及以Mac为基础的Safari。

Chrome仍然只有百分之一的浏览器份额,但这会增长。有了拉斯·巴克的V8引擎,Chrome简直如虎添翼。该浏览器使用许多开源代码和开放标准,但也引入了一些重要的创新,如独立页面的使用。这听起来很无聊,但其实很至关重要。原因如下:通常,通过浏览器运行几个网络应用程序会导致崩溃。而且当一个浏览器页面崩溃时,整个程序都需要重启,其他页面上的工作或活动都会丢失。

Chrome的运作方式意味着任何浏览器的崩溃都仅限于当页,所以,如果你在一个页面上写邮件,而另一页面的视频崩溃了,你的邮件并不受影响。你可以把崩溃的页面关掉,继续工作。让浏览器以这样的方式工作——好像桌面一样——对于未来网络应用程序至关重要。

当然,Chrome的运行速度也很关键。为了网络应用程序能够成功,它们需要反应迅速,否则用户会郁闷。速度、稳定、安全——这些都是我们未来在线活动的关键方面。而浏览器则是大门。

谷歌音乐的前世今生 – 代号“M计划”

本文发表于《环球企业家》杂志(网站)2009年4月20日,欢迎购买和订阅。

今年3月底4月初的时候博客有一段时间没有更新,因为当时张亮正带着我一起准备这篇文章,当然最后的定稿基本上都是他写的。虽然现在已经有很多关于谷歌音乐的报道,但是这一篇报道将带你进入谷歌音乐团队,了解这款产品的前世今生。

—————————
长期被视为谷歌中国最大短板的音乐搜索反而被创造性地打造成了一款杀手级产品。除了李彦宏,它还可能让乔布斯头疼

代号“M计划”

文 本刊记者 张亮 朱旭冬
本文发表于《环球企业家》杂志 2009 年 4 月 20 日杂志

提问:一款完美的音乐产品应该是什么样子的?

“你一动念头,音乐就出来。”谷歌中国的产品经理洪锋慢条斯理的说。大概对这个答案仍不够满意,他随即补充了一句:“甚至不用动念头,自然就出来。”——这意味着,任何人在任何时刻可以获得最适合那个环境、时间与心情的音乐。

由意念控制隐藏在情境中的音乐?这听上去太不真实了。不过,倒也像科幻作家亚瑟·克拉克所言: “任何足够先进的技术均迹近魔法”。总有革命性技术以超乎想象力的方式改变世界,就像电力、飞机和搜索引擎。

某种意义上,2009年3月30日洪锋和他的团队所发布的谷歌音乐搜索第二版已经符合这一标准。当无数媒体将目光盯在台前的谷歌大中华区总裁李开复与来自百余家唱片公司高层合影言欢,并将此视为谷歌反击百度的最新武器,人们很容易忽视:这是一款至少在两个层面上超越现实的产品。

——谷歌与巨鲸网所获得的音乐资源,是完全免费、无版权保护(DRM)、可供下载的140余家唱片公司的完整曲库。这四个条件的全部满足,在全球范围内仍属首例。

——产品层面,它改变了人与音乐之间的距离。如果说搜索引擎降低了人找到信息的成本,社区网站把人与人之间的“六度分离”扁平化,谷歌音乐则前所未有的将一个人找到某一首歌的方法丰富化。你可以根据歌手、歌名、专辑名甚至一句歌词找到一首歌,也可以直接播放排行榜上的热门歌曲。不过,真正开创性的是这样两个功能:按照歌曲的节奏、声调、音色获得推荐,以及根据每首歌的音色获得相似歌曲。因其新鲜效果及实现技术的复杂性,它毋庸置疑的成为了谷歌入华以来最富雄心与想象力的作品。

而且,它有着异常丰富的扩展空间。虽然目前谷歌与唱片公司的合作协议仅局限于中国大陆,但即使唱片业也并不希望这一模式持续不变。“如果这在中国被证明是成功的模式,几年之后它没有被推广至全球我就会很惊讶了。”环球音乐亚太区副总裁Sandy Monteiro对《环球企业家》说。虽然没有人知道这究竟需要多久,但不妨想象,未来某天,这款来自中国的免费下载正版音乐服务进入美国市场,全球最大的付费数字音乐商店、苹果公司的iTunes究竟还有多少竞争力?

此前,在谷歌全球有不止一支团队试图开发音乐搜索,均在内部遭到否决:除了版权问题,谷歌的决策者们也从未被说服他们能在此领域超越同行。那么,最终这样一款产品,为什么能诞生于不以技术创新擅长,且版权保护效果不彰的中国?

请忘记那些高度概括的答案。和任何创新过程一样,它是复杂的、难以概括的。人们当然可以事后总结出天时、地利、人和等种种方便,但归根到底,它是一系列人的行为的结果:最不着边际的狂想、精心勾勒的合作方案、小心翼翼的内部沟通、将声音的物理特性转化为数学算法最终写成十余万行代码的辛苦工作,以及一些好运气……所有这些加在一起,最终完成了一次“不可能的任务”。

“或者”的暴政

谷歌中国需要一款音乐产品,从来并非秘密。

但同样显而易见的是,正常的商业逻辑下,搜索引擎和音乐界难以共生。这是完全背道而驰的两种商业模式:谷歌相信所有信息都有其价值、且它们应该以尽可能低的成本被找到,唱片业却认为有价值的信息是有限的,它们应该被小心保存,每使用一次就收一次费。当谷歌希望针对不同人的不同需求把隐藏于长尾中的信息挖掘出来,唱片产业则比拼着谁能找到全人类中一亿分之一的音乐天才。

倾向性的差异注定了双方的互动很容易伤害其中一方的利益。在中国,胜利者是百度。这家在中国拥有60%市场份额的搜索引擎有大约15%的点击指向了音乐搜索,而普通网民可以通过它找到海量的可供下载的免费音乐。唯一的问题是,它们几乎没有版权。唱片公司不能从这一持续活跃的行为中获利。这一度引发了双方颇多纠纷,但百度坚持表示,自己的搜索结果中提供的是网上已有的音乐链接,而非自己直接提供音乐下载,这帮助它有效规避了法律风险。

类似的诱惑,谷歌中国并非没有。2006年底,百度与国际唱片业协会的官司以前者胜诉收场,不久后谷歌又收购了带有版权麻烦的YouTube,这两件事的接连发生一度也让谷歌中国有人提出,是否可以做一款跟百度类似的产品?

可这没有成为最终选择。“英文有句话叫做Tyranny of the ‘or’,中文可以叫做‘或者的暴政’。意思是人很容易把自己框在一个二元对立的空间,或者做合法、收费的,或者做违法、免费的,只有两个选择。但我们不愿屈服于‘或者的暴政’,我们就要做既合法的又免费的音乐搜索。”李开复在接受《环球企业家》专访时说。

首先要解决的问题是,怎么将这种诚意传递过去?

网络业和唱片业之所以难以合作,除了立场上的根本差异,也有沟通上的障碍。双方操持的并非同一种话语体系,而强大的律师队伍为了维护各自利益的讨论更加速了谈判的不欢而散。

称得上机缘际会,2006年9月,时任谷歌中国首席战略官的郭去疾在旧时相识的介绍下,见到了由篮球明星姚明投资的巨鲸网创始人兼CEO陈戈。如果按照工程师的标准,陈戈口若悬河的风格不免让人担忧。但郭去疾很快发现了陈独特的一面: “他是一个‘传道士’一般的人物。你和他约好去他公司见面,如果迟到了,他会在公司门口一直等你;如果他给你写一封邮件没有得到回复,第二天他会同样礼貌的再写一封信,第三天还是如此。”

事后证明,陈戈的情商的确令人惊讶:整个谈判过程中,没有人见过他发脾气,无论承受何种压力,他永远能心平气和与你寻求共识。这让他恰到好处的成为了一块绝缘体,把唱片公司和谷歌之间的矛盾化解于无形。创办巨鲸网之前,陈创立过普莱音乐公司,曾给崔健组织演唱会、出唱片,这让他熟悉音乐圈的语言,足以扮演双方的“翻译”。而他和巨鲸网从未从事过盗版音乐下载,也能让他以“没有原罪”的姿态面对唱片业。

由此,在陈戈的介绍下,2006年11月、12月,次年1月,谷歌中国分别与索尼、环球、百代三家唱片公司初次接洽。那正是谷歌中国风雨飘摇时(请登陆gemag.com.cn查看2007年2月号文章《最长的一年》):不停被传闻即将黯然离职的李开复和他的团队在2007年1月明确了与巨鲸网合作的想法。

当然,李开复们的意愿,并不直接等同于谷歌的意愿。一个不可回避的现实是,如此级别的产品决策,谷歌中国必须向总部汇报,得到包括两名创始人及公司CEO的许可。

如何让一款在全球屡遭否定的产品意向得以通过?一如当时被舆论界低估,但日后显现效果的,谷歌中国富于“拐大弯”的沟通智慧:他们深知这并非一蹴而就的决策,便尽可能在中国区的授权范围内有所作为,并阶段性的对总部阐述这一推进的价值,在一次次的信息叠加中累积自己的信用。

第一步是让巨鲸成为谷歌中国的利益相关方。无疑,想在中国展开长期的音乐搜索业务,谷歌必须投资于巨鲸。当2007年2月,李开复和时任大中华区投资并购总监的宓群把这一投资意向上报到公司CEO埃里克·施密特,他们并没有冒失的把谷歌中国的音乐计划和盘托出,却只阐释了巨鲸的投资价值,并借此讲述了音乐服务对于中国用户的意义。一向对于中国事务就颇为支持的施密特很快便予通过。

真正将谷歌音乐作为一个项目报到公司两名创始人处,已是2007年11月。在此期间,谷歌中国参与此事的团队已经迅速积累起了一条陡峭的学习曲线:他们不仅想好了谷歌与巨鲸的的角色分工,更已将合作细分成六步——2008年8月发布的将音乐搜索结果以Onebox形式插入相关搜索结果中,和2009年3月30日发布的独立页面的搜索产品只是其中的第一、二步。

当时最大的说服挑战,是谷歌已经明确将全球战略方向定为搜索、广告和应用(Search,Ads,Apps),音乐产品似乎不应成为一个投入精力的领域。但李开复们的回答也相当有说服力:具体的音乐内容和产品都属于巨鲸,谷歌中国只是作为入口提供者,这就并不违背聚焦于搜索的战略,而且,在中国,如果没有音乐搜索,忠诚的谷歌用户也很容易流失。为留出转圜余地,他们甚至提出了一种折中方案:购买一个独立域名,比如m.cn,以此淡化谷歌中国的色彩。

这最终成为了谷歌中国的一个小小的传奇:创始人拉里·佩吉只问了一个问题,就和公司CEO施密特一起批准了此一项目,全程不过几分钟。

必然之奇迹

即使顺利过关,谷歌中国对于巨鲸的投资仍是异常谨慎的。宓群主导制定了一个极为细致的投资结构:总共数额不过几百万美元的投资被分为了四轮,巨鲸每签下一家重要的唱片公司才追加一轮投资。最终,陈戈证明了他的确是个合适之选:到2007年9月,他已经颇有效率的签下了索尼、环球和百代三家公司有 “数字版权管理”技术(DRM)限制的免费下载和免费的歌曲试听。

一些迄今未被披露的谈判细节足以证明当年谷歌中国对于与巨鲸合作的方案规划之巧妙。比如,为规避合作仓促结束的风险,巨鲸与唱片公司的协约不止于外界所主要谈及的广告分成。据一名知悉内情的人士称,巨鲸与每家唱片公司所签的合同都相当复杂。除了外界最常提及的广告分成模式,还有两个保底收入:每下载一首歌获得一次缴费,以及每年的保底收入。这两项费用均由巨鲸向唱片公司支付。

而且,那些有意合作的唱片公司可以在巨鲸网获得期权。这就将此前除了陈戈的人脉资源并无太多独到之处的巨鲸网推入了一个良性循环:一方面,唱片公司对巨鲸的产品有了较大耐心,另一方面,每增加一方股东,巨鲸就多了一分希望成为中国音乐市场的领跑者——如果它能在几年后真的主导此领域,财务回报注定不俗,这又给了唱片公司更多期待。

当然,没有什么推力比音乐界自身的观念改变更为重要。

因为获利渠道的多元化以及音乐数字化之后的易复制性,以往签下歌手,毕其功于一役出一张专辑获取一次回报的时代已经过去。成功的歌手更多依靠代言和演唱会获益,而出专辑更像阶段性的曝光与提供新鲜感的一种方式。这迫使唱片公司将自己的角色从音乐制作者更多的转向营销、推广、开发衍生产品等“造星”并试探商业模式上转移。

这正是谷歌、巨鲸的谈判团队切中要害之处。他们不停讲述这样一个理念:CD对于最忠诚的歌迷仍有市场,但对更多试图用音乐营销自己的明星,搜索引擎是最好的选择。而且,在传统模式中,围绕音乐开发衍生产品很可能是不经济的:多数歌手的歌迷非常分散,销售相关产品的成本就很高。但互联网却可以低成本的把某一类歌迷集合起来定向营销。

一个绝佳的案例是谷歌中国自身:在进入中国市场第二年,谷歌中国的收入已经达到1亿美元。想想看,这只是在2006年的中国拥有大约20%市场份额的谷歌。据陈戈称,2008年所有唱片公司在中国市场加起来收入不过五千万美元。

但一个障碍挥之不去:唱片公司的版权保护管理(DRM)。DRM的目的是防止消费者对他们买的媒体内容上进行非法拷贝,它可以限制正版音乐能够被拷贝几次,在几台设备上播放。但站在谷歌的角度上,提供有DRM的音乐,就意味着很多并不了解技术细节和版权保护详情的用户会经常感到不便,这是他们最不愿接受的。2007年10月,谷歌的产品部门明确表态,巨鲸必须获得没有DRM保护的使用授权。

这让原本希望在2008年3月发布的谷歌音乐一拖再拖。有当事人2007年10月到2008年4、5月称为这个项目的“黑暗时期”:没有人能够确保谷歌的愿望达成,陈戈也几乎无法承受这一压力。

有人建议由巨鲸自己开发一种附和DRM标准但不影响中国用户体验的版权保护方法,但这一擦边球方案对于一向讲究“不做恶”的谷歌仍有不小的风险,而被否决。另一个选择是只做一款流媒体播放,不提供下载的产品,但谷歌仍然担心下载功能的缺失是否会破坏用户体验,这一方案也由此作罢。

最终的转机发生于2008年5月10日,当巨鲸的陈戈和谷歌中国的郭去疾一起前往英国百代唱片的数字音乐部门,在曾经为甲壳虫、皇后乐队和U2们录制专辑的艾比路录音棚,对方负责人道出了一个惊人的消息:自己在一个多月多后即将失去这份工作。百代刚刚挖来了时任谷歌全球CIO的道格拉斯·梅瑞尔接替他——但是,即将离任者反而给出了承诺,一定在离职前把DRM取消。

这是一个非常富有意味的转折点:音乐界最后的大门终于敞开了,而开门人却是即将离职的守门人。

当百代做出改变,其它几家的跟进就成为了连锁反应。即使如此,当李开复最终说服拥有大约40%华语歌曲曲库的索尼加入这一阵营,已经是2009年初。

“能做成这件事,真的是个奇迹。”已经离开谷歌创业的郭去疾对本刊感慨到。从构思之初到跃过最后一道门槛,谷歌中国已经用了两年时间,期间,无论唱片公司还是谷歌都有不少参与者离职,但这都没有影响交易最终实现。

这是个历史的必然。但给这块沉重石头最后一下推力的,是将传统商业智慧抛之脑后的狂想。

集结号

2008年8月5日,谷歌中国办公楼,在一间名为“开心”的办公室里,人们很不开心。

这是谷歌音乐搜索第一版上线的时刻。自从2007年7月成立音乐开发组,它已经从一名工程师扩张成十人规模的开发团队,一个在谷歌内部堪称庞大的阵容。作为秘密武器存在,他们已经历了漫长而寂寞的等待期:特别是2008年3月以来,每个月都有可能发布产品,但每次又遭到延迟。这实在太令人沮丧了——如果奥运会之前还不能有所作为,他们就得在全国上下的兴奋中再熬上一个月。

按照计划,他们该在十点把产品放到网上,如果没有意外情况,就出去吃个午饭庆祝。

但“惊喜”很快到来:不仅中国用户能访问它,印度、纽约的用户也在网上反馈说,他们能用它下载歌曲。所有人当场“傻掉了”。按照协议,谷歌音乐只能中国用户才能访问,这是由每台电脑的IP地址识别的,现在却颠倒了过来。而这不仅会成为谷歌中国对外的一个笑柄,还可能让唱片业丧失对自己的信任。

不知所措中,他们把产品从网上拿下,一行行检查代码。网上已经开始流传谷歌音乐发布的消息,这一项目的主人们却不知道究竟多久才能正式发布。 “快的话,几十分钟,慢的话,十二小时。”当时身在上海的产品经理洪锋说。接下来的许多个小时里,他都只能坐在视频会议的镜头前,就像他的面孔被投射在墙上所隐喻的,一种巨大的无力感。

当他们把问题找到并解决——这产品跟公司的另一款产品的代码有所冲突——已经是晚上八点。

说这是一款命运多舛的作品,应不过为。谷歌音乐的前端技术负责人唐汀回忆说:“这个项目做了一年半,有无数个这种时刻,我们都可以说‘这太难了’、‘这不可能’。但最后我们就剩下了一种‘横’,较劲,一定要把它做出来。”

这是这个故事的另一侧面。当李开复、郭去疾、宓群们为了推开音乐界的方便之门而费尽心机时,一批工程师在修筑进入新的音乐世界的通道。在很长时间里,他们并不真正清楚这款产品究竟通向何方,无论它的命运还是功能取舍、介面设定,一切都并不清晰,或者说,有待创造。但这种不确定性,也正成就了谷歌音乐的惊喜感。

此项目的第一名参与者,是产品经理洪锋。郭去疾称,在项目尚处于空想阶段,洪锋是一个非常合适的讨论对象:他对事物有着朴素而深入的好奇。而当它的眉目稍微清晰,洪锋又是一个颇为讲求细节的人:做事之前想的很清楚,一旦认准方向,他会想方设法说服合作者,一步步打磨出他想要的效果。

“避免去做一款让用户不开心的产品是相对简单的。但是做一款让用户们‘不不开心’的产品,并不等于做出的产品能让他们开心。”洪锋对《环球企业家》说。他语速不快,常打比喻。这种喜欢将理念性话题以相对形象的方法表达出来的沟通方式,一定程度上与他从小学起学过多年美术有关。其产品理念也是如此。

当他想到把数以百万计乃至人类拥有的全部音乐数字化,他“看到”了一片海洋:身在其中,每首歌就像触手可及的一个气泡。

怎么让一个沉浮于大海某一角落的人抓住一个他真正想要的气泡?这个问题属于工程总监林斌及其工程师团队。

林斌喜欢讲自己加盟谷歌的故事。2006年9月,还在微软研究院工作的他在出差时遇到相识已久的李开复,随口问了一句:“你们为什么不做音乐搜索?”李很痛快的回答:“可以啊,你来做?”几个月后,林斌加盟。

没有爽约,到了谷歌,虽然很快就意识到了在这家公司做音乐产品有多难,林斌还是坚持把这个项目划在自己名下,甚至在立项之前,就跟李开复申请了专职于音乐产品开发的工程师名额。

林斌的坚持让三名初入谷歌的新兵被划入代号“Project M”(M计划)的音乐项目。性格活泼的杭州女孩汤萌芽和外表羞涩但极爱唱歌的中山大学毕业生邹振盛摸索着产品的呈现方式,而稳重、极富沟通耐心的赵启胜则专注于后端以及与巨鲸网的沟通、协作。因为尚未获得创始人许可,他们最初的三个月甚至没有进入编写代码的状态,连李开复事后回忆起来也笑称他们几人为“最可怜的工程师”。期间,林斌们还有太多的障碍需要去一一排清,为了不影响士气,尽可能以“报喜不报忧”方式与他们沟通。回顾当初,林斌仍然有些动容:“到今天我也很感激他们,那时候他们很清楚这个项目的不稳定性。”

当项目最终获得批准,当时正在谷歌中国做视频搜索产品的唐汀找到林斌,希望加入其中。之所以主动请缨,是因为成长于海外的他在申请派驻回中国时,本就希望参与一些富有中国特色的产品,而且,以前偶尔听到别人说中国不重视版权保护,也让他对此项目格外感兴趣。当唐汀带着高大的东北人韩准加入到这个团队,他们带来的是极度细心修改代码中错误的体力和耐力。

不过,这款产品还需要一个在科研层面带来突破的人。

2007年初,李开复去往谷歌纽约办公室出差,专门抽出时间做了一个关于谷歌中国的演讲,希望由此吸引更多一流工程师回国。会后,一个清秀的女生找到他。这个当时正在纽约办公室负责移动搜索质量的工程师名为胡宁,是李在卡内基梅隆的师妹,交谈不久,李就建议胡宁认识一下在北京负责移动搜索的林斌。

当林斌和胡宁终于在北京坐下来聊天,他惊讶的了解到,胡宁2004年在谷歌实习时就做过一款音乐搜索产品,而她博士的研究方向为音频信号处理和信息检索,与此恰好一脉相承。胡宁说,可以把科研领域的前沿成果放到谷歌音乐中来,并愿意为此搬回中国。

闻弦歌怎知雅意

当你获得了海量的音乐信息,你究竟有几种方式去处理它?

最简单的,是把自己变成一个庞大无匹的FTP,任何人都可以前来下载。但这就像一座无人管理的图书馆,只有当用户知道自己想读哪本书,它才是有价值的。

相对高级的方法是让电脑成为图书管理员:它通过之前做好的信息分类把类似的歌曲推送给听众。比如一家名为Pandora的公司,通过人力将音乐类别划分出400个标签,对每首歌进行标注。当你选中一首自己喜欢的歌曲,它会把同一标签下的歌曲逐一播放。但这就像一条单行道:在一个相对有限的曲库下,人做出的判别当然是准确而微妙的,可如果把曲库放大到百万级就难以为继。而且,每个人的口味总有不同,Pandora的方式却只能假设所有用户的审美是同一的。

那么,谷歌能不能教会计算机成为世界上最聪明的图书管理员呢?一方面,它能对不同音乐的特征了如指掌,另一方面,它又能针对用户做个性化推荐。

想做到这点,就必须让电脑学会很多原本只有人才有的常识。这一方向在初期显然不会像Pandora一样快而有效编制出一套推荐体系,但它的扩张性要好的多。

胡宁的工作,就是“教会电脑听歌”。与人类的“倾听”截然不同,胡宁需要先把音乐的物理特征还原成数字,由电脑对数字进行分析和类比。

比如,任何一个人都可以轻易识别出鼓和笛子的音色的差异,只要找到方法把这两种差异转化成数字——假设,鼓是2046,而笛子是1984——即使电脑没有耳朵,也可以将它们区分开来。而在一个成熟的算法下,那些音色接近的人也应该被标以类似的数字:王菲、爱尔兰乐队小红莓和冰岛歌手比约克,也许在最终数字上的差异只有0.1。

那么,想象一下,根据不同的音色,电脑是有可能给所有的音乐绘制出一张无限庞大的地图的。虽然电脑只是在计算时把彼此详尽的数据凑在一起,但还原成物理世界的歌曲,人们看到的就是钢琴曲集合在一起,吉他独奏凑在一起,声音粗砺的摇滚男声被划分到一个阵营……

当然,真实的计算过程并非如此简单。面对一首歌,胡宁先要把它还原成频谱,并以“百毫秒”为单位将它分割成数千个段落,从每个段落中提取出事先设定好的一百余个特征值。这大约相当于,其中的一段数十毫秒为一个鼓点,而另一段数十毫秒是一声镲,它们各自被总结成一个拥有100多个特征值的向量,这两个向量是不同的。一首歌由上千个这样的多维特征向量构成。那些向量重合度相对高的歌曲是相似的——这就像你在一个纸上画出上千个点,如果有另一张纸上也有一千多个点,且这两张纸重叠起来看,所有点的位置类似,你可以说这两张画很像。

这个想法已经非常有趣,但洪锋依然希望在这个程度上更进一步。刚刚做完谷歌财经的他问胡宁,有没有可能像股票查询一样,用户只要在一些标准上做些简单的选择,就能得到不同的结果?

洪锋的设想从投资者角度是非常直观的:你可以让电脑列出市盈率在6倍以下的公司,或利润率在30%以上的公司。但胡宁并不认同他的创意:音乐是没有市盈率和利润率的,用户怎么选择?

但洪锋并不愿轻易放弃这一想法,他前后用了两周时间说服胡宁,音乐的指标并不需要像市盈率一样清晰,但增加用户与音乐的互动性本身就是一个有趣的想法。

于是,在本已紧张的开发计划中,谷歌音乐第二版包含了两个方向的产品:一个是胡宁推动的相似歌曲,一个是洪锋构想的根据音乐特征挑歌。

和胡宁一起进入这一新方向的,是2008年7月底才加入谷歌的清华大学博士路羊。一直在学校里研究信号处理的他本以为加盟谷歌这家搜索引擎公司之后可以告别老本行,没想到不仅不能如愿,还在胡宁的要求下读了厚厚一摞论文,并时不时拿出数学书来进行研究。而林斌在拣选全球工程师资料时,又在苏黎世发现了一名学术背景和胡宁、路羊相似的工程师,亦邀请他越洋加盟。

光是找出几个通行于所有歌曲的标准,已非易事。如果让普通人来设定歌曲特征,人们很容易想到根据快歌、慢歌来加以区分。但在技术实现上,它却是一条弯路。

为采集相关数据,路羊和苏黎世的同事在电话会议上一起听着同一首歌一起在桌子上打拍子,前后处理了大概一千首歌的数据。可他们最终遇到了难以逾越的问题:那些配乐很弱的歌本来就很难找到清晰的节奏,有些歌曲则前后节奏不一,甚至,不同的人对于节奏的判断也是不同的。人耳极易辨识的快慢,电脑分辨起来却只有80%的正确率。虽然在学术上,这已经是个了不起的数字,但在现实应用中,这就意味着五首歌里有一首的快慢是明显误判的。在路羊的游说下,以节奏快慢为特征选歌被修改为了按照强烈或舒缓分类。

在另一条战线上,胡宁推进的相似歌曲同样困难重重:她很快做出了一款覆盖几千首歌的演示产品,效果极佳,但当她把数据量上升到几万首歌,质量又惨不忍睹,只好推倒重来。

问题的核心在于,在学校时,她只要对1000首歌这样量级的数据进行分析就可以发表论文了,但她这次面对的是数以十万计的歌曲。当你只对几千首歌进行分析、聚类时,大概设定几百个音色类别,就可以把它们相对有效的归类。但数十万首歌的音色差异就实在太大了:中国歌曲和外国歌曲的音色听上去差别有限,但体现在数字上却明显不同,而有的歌只是从头到尾一个人在讲话,这样的特例怎么考虑进去,也是一个挑战。

一下子把数据量扩大到十万级来开发产品是不可能的。胡宁和路羊只能选择一种最笨而有效的方式:每次在较小的数量级上进行实验,确定可行的办法,然后针对每次数量级的扩大所带来的问题对最初的特征值确定、聚类进行调整。这意味着,每次针对较小数量级的曲库写出有效的代码,不久之后要主动扔掉。据说这个过程中,丢弃的代码大约是留下的十倍。

直到电脑处理过5万首歌,这套系统才最终比较稳定。而此时,特征值的分类已经扩大到了4096种。这似乎是个注定属于谷歌的产品:对30万首歌做一次分析和聚类需要上千台计算机同时工作数十个小时,并非每家公司都可以运作。

**
在谷歌音乐第二版即将发布之前三周,李开复和洪锋终于可以将产品演示给公司CEO埃里克·施密特。据在场者回忆,富有产品经验,总能一阵见血看到问题的施密特这次在看过产品后,发出了疑问:“我的中国同事们,你们能不能告诉我,我该问点什么尖锐的问题?”

的确,对于今天的谷歌中国,这都是一款足以令人惊喜的产品。据说它完成第二版后已经有超过十万行代码,在谷歌内部也算规模很大的产品。

它将成为谷歌中国收复市场份额的一个杠杆?尚不能做出如此乐观的结论。一位熟悉谷歌的人士对《环球企业家》说,最令他担心的还并非接下来的广告收益状况——2009年糟糕的经济环境也许并不能给巨鲸和唱片公司们带来足够理想收入——更重要的是,谷歌在完成一款产品之后究竟能否以更大的力度把它完善、推广出去?在批评者看来,过去一年里,谷歌中国推出产品的节奏有了明显提升,但似乎总离引爆市场差了一口气。像2008年上半年发布的谷歌金山词霸,从定为上看无疑是款好产品,却在过去一年时间里渐无声息。

好消息是,在音乐产品上,从李开复到工程师,每个人都清楚当下的产品还有着很多的修缮余地:算法可以更精确,用户介面仍有bug等着修改,甚至,当谷歌音乐的排行榜成为音乐界的一个关键指标,必须有人编写防作弊功能……而且,别忘了,按照其最初的六步规划,谷歌和巨鲸应该在搜索产品完成后,还要广告产品、客户端播放器乃至社区服务有待开掘。

但无论如何,以改变游戏规则的方式补齐了与百度正面交锋的最后一块短板,让经历了三年半起落沉浮的本土化李开复终于可以坐下来,在网络上播放一首歌平静一下心情——而且,使用他自己的产品。