看到 Matt Cutts 在 Twitter 上发了一条消息说 iPhone 里的 Google 应用已经有了语音识别技术,并且表示自己已经用上了这个功能,而且这个功能非常不错,前景很好.他还给了一个纽约时报(New York Times)网站相关报道的链接.
据纽约时报报道,人们一直致力于使计算机能懂得人类的语言,现在 Google 公司已经在即将发布的 iPhone 版的 Google 应用里增加了复杂的语音识别技术.

(图片来自 NYT Google 的语音识别软件现在只能在 iPhone 里运行,但是 Google 计划让这个软件能在其他手机里也能使用.)
目前估计 Apple 将在美国时间周五把这个应用程序放到 iTunes Store 供用户免费下载使用.有了这个应用程序,用户就能把 iPhone 像打电话一样放到耳边,然后问问题了.用户可以问几乎所有问题,比如“最近的星巴克在哪里?”或者“珠穆朗玛峰有多高?”等.声音会先被转换成数字文件然后发送至 Google 的服务器, Google 的服务器会来判断用户说的话然后在 Google 的搜索引擎里完成搜索.如果无线网络比较快的话,搜索结果在几秒钟内就会显示出来.因为 iPhone 有定位功能,所以有时候搜索结果里会包含有当地的一些信息.
能使计算机识别任何人的任何话一直是人工智能研究专家所向往的目标,这也是使人机互动更为自然的一种方法.最近有一些具有类似功能的系统也开始进入商业市场了.
Yahoo 和 Microsoft 都已经提供手机的语音服务了. Microsoft 的 Tellme 服务会返回给用户一些特定目录下的信息,比如路线,地图,电影等. Yahoo 的语音服务 oneSearch 更灵活,但是没有 Google 提供那么准确. Google 的系统离完美还有很远的距里,有时返回的结果简直一塌糊涂. Google 执行官没有透露这个服务的准确率大概是多少,但是他们相信这项服务对那些不想在 iPhone 的触摸屏上打字来进行搜索的人来说已经足够准确了.
这项服务能帮用户推荐餐馆和之路,同时还能帮用户寻找在 iPhone 联系人里联系人,或者平息酒吧里的一场争论(此处翻译感谢 ZenoX 在评论中指正).
如果你询问“Noe Valley 最好的比萨店是哪一家?”返回的结果是位于旧金山的三家餐馆,每一家都有来自 Google 用户的标星和点评,并且有电话的路线的链接.
卡内基美隆大学(Carnegie Mellon University)研究人工智能的专家 Raj Reddy 是语音识别技术方面的先行者,他说 Google 在这个领域的优势在于它能储存和分析大量的数据:“不过他们现在如何介绍,识别的正确率在3到6个月期间会有很大的提高.”他还表示:“人们要意识到,机器的识别技术永远不可能达到完美,这一点很重要.问题是,他们能做到多好,多接近于完美?”
对 Google 来说,技术将至关重要. Google 的执行官说,基于地理位置的搜索能使附近的商业广告获得更好的点击率,而 Google 也能从他们身上获得更高的收入 – 当然,这项服务目前还不卖广告.
前 Microsoft 执行官, 现在领导 Google 移动业务的 Vic Gundotra 说:“我们一直在努力通过地理位置和语音服务来为广告主增加价值.”

(图片来自 NYT Vic Gundotra(右)和 Gummi Hafsteinsson.)
当然,这项新的 iPhone 搜索服务并不是 Google 提供的第一个语音服务.今年3月份的时候, Google 就推出了 GOOG-411 服务.这是一个目录信息服务,用户能通过该服务询问公司电话和地址的信息. Google 表示从这项服务中收集的用户体验和数据对他们开发现在这项在 iPhone 上的语音服务很有帮助.
有趣的是,这项服务的设计来自一位伦敦的 Google 员工,他发明了一个使用 iPhone 加速器(判断 iPhone 是如何被用户拿着的设备)的好方法,就是当人们把 iPhone 拿起来放到耳朵边上的时候,让 iPhone 进入”听”的状态.
Google 最近还发布了一份关于为机器翻译建立大的模型的报告,研究人员在里面写到,他们已经在这个系统实验了2兆的词语.
Recent Comments