Tag Archives: 语音识别

Google 语音搜索软件使用技巧

虽然比预计发布时间晚了几天,但是现在 Google 专门为 iPhone 打造的集成有语音搜索功能的 Google Mobile App 终于已经可以在 Apple Store 里下载了,对这款软件情有独钟的 Matt Cutts 马上在自己的博客上介绍了使用这款软件的九个小技巧(包括语音搜索的使用技巧和其他技巧):

1, 下载方法:访问 Apple Store 搜索 “Google Mobile App”,或者点击这个链接直接下载至电脑.如果你的 iPhone 上装有旧版的 Google Mobile App,你可能需要先把旧版卸载然后安装新版.

2, 如果你不是美国用户,这款软件中的语音识别功能是默认关闭的.你可以点击屏幕底部的 Setting 进入设置然后把滑块滑到 “ON” 即可.

3, 如果你把 iPhone 放到耳边了但是没有听到”baBUM”的一声(听到这个声音表示你可以开始讲话了),你可以把 iPhone 倒立正立的转换几次然后再放到耳边.有时候轻轻摇摇它能帮助 iPhone 让它知道你要开始进行语音搜索了.

4, 你能搜索的东西不只是 Google 的网页搜索.你可以试试搜一下 “daffodil pictures”(喇叭水仙花图片):
Photobucket
然后点击位于左上方的放大镜图标你就能看到会有其他搜索选项.默认的搜索是你在搜索 iPhone 和互联网的内容,但是你可以选择搜索地图,图片,新闻,购物或者维基百科:
Photobucket
点击图片,然后这个软件就会自动转到 “daffodil pictures” 的图片搜索结果:
Photobucket
5, 如果你想马上转换到屏幕键盘的话,你可以轻点两次位于屏幕底部的 “Search” 选项.

6, 用键盘搜索也很方便.随着你的输入,它会自动提示联系人,网页,之前的搜索和相关搜索关键词:
Photobucket
你看到屏幕中间的相关搜索词语提示了吗(黄色框是我加的)?你可以前后滑动他们来获得更多提示:
Photobucket
7, 在屏幕底部的 “Apps” 选项卡能使你方便的一步获得所有的 Google 服务包括 Google Apps 的服务:
Photobucket
8, 你可以在 Google Mobile App 里使用多个 Google Apps 帐号.在 Setting 选项卡里,点击 Domain(域名). 然后你就能添加多个域名了,用逗号把域名分开.

9, Google 已经发布了关于 Google Mobile App 的帮助文档,另外也还有一个 Google Mobile 的帮助论坛.

额外技巧 #1: 如果语音识别发生了很小的误差,你可以点击绿色的搜索框来获得类似搜索关键词.如果你说了一句 “background gradients in css” 然后得到了这个搜索结果:
Photobucket
注意搜索结果和你说的只有很小的误差,那就是它漏掉了你说的 “gradients” 中的 “s”. 这时你就能点击绿色搜索框并且找到正确的关键词:
Photobucket
看,第二个就是你原本想要搜索的关键词:)

额外技巧 #2: 如果你想知道你的小猫想和你说些什么,你可以开启这个语音识别软件然后放到小猫嘴边让它”喵”一下.这样 Google 就会把”喵”转换成正规的英语了.这个小技巧是 Sean Harding 想出来的.

Google 的 iPhone 版语音识别搜索软件推迟至周一发布

据 TechCrunch 报道,他们从一些知情人那里得到消息, Google 专门为 iPhone 打造的语音识别软件原本应该在美国时间周五就可以下载的,但是现在看来要到周一才能下载到了.

Google 一直都以为自己的这款软件能在周五登录 App Store(这很明显,因为他们把所有媒体的注意力都吸引过来了).但是他们周五的某个时候 Google 发现 Apple 不会再周五让这款软件进入 App Store 了, 尽管 Google 在本周早些时候已经提交了这款软件让 Apple 检测,而且 Apple 已经竖起了大拇指.有消息说 Apple 在检测这款软件的时候他们和 Apple 几乎没有直接的联系,只有在标准的 iPhone 开发者工具里看到过去几天他们的软件”正在检测中”的提示.

另外 TechCrunch 在稍早的时候还表示,其他搜索软件的提供者已经为自己的产品通过 Apple 的检测等了好几个月了,而 Apple 也没有给出任何解释.但是 Google 和 Apple 的关系非同一般, Google 的 CEO Eric Schmidt 甚至也是 Apple 董事会的成员.可能是有些事情不对劲,最有可能的是 Apple 因为某些原因发脾气了(Apple 对待媒体一直很奇怪).当然,另外的原因也可能是像谣言所说的一样, Apple 自己在开发某种搜索引擎.

但是如果 Google 开发的这款软件有下面这个演示视频中的一半好,那么 Google 在语音识别以及移动平台上已经做的非常出色了.同时,这款软件也会增加 iPhone 的销售 – 大大的增加.

Google 在通过哪个手机平台上 – iPhone 和他们自己的 Android – 发布这款软件上做出了决定.事实上,他们决定首先在 iPhone 上发布这款软件也显示出他们为使用者着想的意愿,很少有其他公司能做到这一点. Google 原本可以首先在 Android 上发布这款软件的,从而推动他们自己操作系统手机的销售.但是他们没有,其实 Apple 也应该对 Google 的做法表示欢迎.

下一次 Google 可能不会那么相信 Apple 了,但是可能也不会有很多人怪 Google.

Google 发布 iPhone 版语音识别搜索软件

看到 Matt Cutts 在 Twitter 上发了一条消息说 iPhone 里的 Google 应用已经有了语音识别技术,并且表示自己已经用上了这个功能,而且这个功能非常不错,前景很好.他还给了一个纽约时报(New York Times)网站相关报道的链接.

据纽约时报报道,人们一直致力于使计算机能懂得人类的语言,现在 Google 公司已经在即将发布的 iPhone 版的 Google 应用里增加了复杂的语音识别技术.
Photobucket
(图片来自 NYT Google 的语音识别软件现在只能在 iPhone 里运行,但是 Google 计划让这个软件能在其他手机里也能使用.)

目前估计 Apple 将在美国时间周五把这个应用程序放到 iTunes Store 供用户免费下载使用.有了这个应用程序,用户就能把 iPhone 像打电话一样放到耳边,然后问问题了.用户可以问几乎所有问题,比如“最近的星巴克在哪里?”或者“珠穆朗玛峰有多高?”等.声音会先被转换成数字文件然后发送至 Google 的服务器, Google 的服务器会来判断用户说的话然后在 Google 的搜索引擎里完成搜索.如果无线网络比较快的话,搜索结果在几秒钟内就会显示出来.因为 iPhone 有定位功能,所以有时候搜索结果里会包含有当地的一些信息.

能使计算机识别任何人的任何话一直是人工智能研究专家所向往的目标,这也是使人机互动更为自然的一种方法.最近有一些具有类似功能的系统也开始进入商业市场了.

Yahoo 和 Microsoft 都已经提供手机的语音服务了. Microsoft 的 Tellme 服务会返回给用户一些特定目录下的信息,比如路线,地图,电影等. Yahoo 的语音服务 oneSearch 更灵活,但是没有 Google 提供那么准确. Google 的系统离完美还有很远的距里,有时返回的结果简直一塌糊涂. Google 执行官没有透露这个服务的准确率大概是多少,但是他们相信这项服务对那些不想在 iPhone 的触摸屏上打字来进行搜索的人来说已经足够准确了.

这项服务能帮用户推荐餐馆和之路,同时还能帮用户寻找在 iPhone 联系人里联系人,或者平息酒吧里的一场争论(此处翻译感谢 ZenoX 在评论中指正).

如果你询问“Noe Valley 最好的比萨店是哪一家?”返回的结果是位于旧金山的三家餐馆,每一家都有来自 Google 用户的标星和点评,并且有电话的路线的链接.

卡内基美隆大学(Carnegie Mellon University)研究人工智能的专家 Raj Reddy 是语音识别技术方面的先行者,他说 Google 在这个领域的优势在于它能储存和分析大量的数据:“不过他们现在如何介绍,识别的正确率在3到6个月期间会有很大的提高.”他还表示:“人们要意识到,机器的识别技术永远不可能达到完美,这一点很重要.问题是,他们能做到多好,多接近于完美?”

对 Google 来说,技术将至关重要. Google 的执行官说,基于地理位置的搜索能使附近的商业广告获得更好的点击率,而 Google 也能从他们身上获得更高的收入 – 当然,这项服务目前还不卖广告.

前 Microsoft 执行官, 现在领导 Google 移动业务的 Vic Gundotra 说:“我们一直在努力通过地理位置和语音服务来为广告主增加价值.”
Photobucket
(图片来自 NYT Vic Gundotra(右)和 Gummi Hafsteinsson.)

当然,这项新的 iPhone 搜索服务并不是 Google 提供的第一个语音服务.今年3月份的时候, Google 就推出了 GOOG-411 服务.这是一个目录信息服务,用户能通过该服务询问公司电话和地址的信息. Google 表示从这项服务中收集的用户体验和数据对他们开发现在这项在 iPhone 上的语音服务很有帮助.

有趣的是,这项服务的设计来自一位伦敦的 Google 员工,他发明了一个使用 iPhone 加速器(判断 iPhone 是如何被用户拿着的设备)的好方法,就是当人们把 iPhone 拿起来放到耳朵边上的时候,让 iPhone 进入”听”的状态.

Google 最近还发布了一份关于为机器翻译建立大的模型的报告,研究人员在里面写到,他们已经在这个系统实验了2兆的词语.

Google Labs 新增语音搜索

Photobucket

最近 Gmail Labs 新增了很多功能,今天 Google Labs 也新增了一个实验产品 – Google 语音索引(Google Audio Indexing, 也叫做 GAudi). 大约在两个月前, Google 推出了一个 iGoogle 上的小工具,叫做 Google Election Video Search, 用户可以搜索 YouTube 政治家频道(Politicians channels)的视频中的语音内容.

现在,据 Google 官方博客报道, Google 在实验室中发布了 Google 语音搜索.这个网站能提供用户更多的功能,比如在视频中搜索和分享(但只能发送连接,无法嵌入视频),而且用户界面也改进了很多.

Photobucket

最方便的是,用户只要搜索一次,就能看到这个词语在视频中每次出现的位置,并且可以在选定的视频中再次进行搜索.

但是 Google Operating System 发现, Google 的语音识别技术还有待完善,因为有很多识别错误的现象,比如在 "Barack Obama on the 40th Anniversary of the Prague Spring" 这个视频中, "Czechoslovakia" 被错误的识别成了 "tech also but there", "free" 被错误的识别成了 "forty",其他也还有很多错误.

我觉得Google 语音索引这项功能目前还只是针对美国用户的,因为仅仅是政治家的视频可以进行此类搜索,当然,如果在大选期间这个搜索很受欢迎的话,也不排除 Google 会把这项技术运用到更多视频中,甚至开发其他语言的识别索引技术.

Tazti – 免费的语音命令软件

前几天在 Digital Inspiration 看到一款语音识别软件 Tazti (发音类似于 ‘tasty’) 的介绍,觉得很有意思. Tazti 是一款免费的语音识别软件,用这个软件你可以用语音命令来进行网页搜索,控制 iTunes, 浏览像 Facebook 和 MySpace 之类的社会化网络.目前只有 Vista 和 XP 版.

Tazti 在一定程度上可能不及 Dragon Naturally Speaking, 因为它没有听写功能.但是由于 Tazti 是完全免费的,所以也很容易吸引那些想一边上网有一边用手做其他事情的人(我觉得对残疾人来说应该会很方便的吧).

比如当你说 "search google" 或者 "search flickr" 的时候,它就会在你的浏览器中进行相应的搜索.你的下一个命令就会被认为是搜索的关键词.比如你继续说 "cars", 它就会在 Google 或 Flickr 里对这个关键词进行搜索.如果你要搜索一个不太寻常的关键词,可以说 "spell search google", 然后一个个拼写你要搜索的词.

Photobucket

你也可以为链接,软件,桌面文件创建无限的自定义语音命令.下面就是一个 Tazti 的演示视频:

和其他语音识别软件一样,你要对 Tazti 进行一定的训练让它来熟悉你的声音.如果有很多人都使用同一个电脑的话,每个人可以创建不同的帐号.有人表示这个软件对自定义的语音命令识别的非常好,但是对搜索命令似乎还有些不足.

Tazti 软件不是很大,63.5MB.但是由于我这个月的流量就快用完了(以前学校假期上网都不需要花费自己的流量的,就因为什么运动会,留下的人多了,竟然暑假都得花钱买流量,速度也一样慢),就没有下载试用,但看起来是个很有趣的东西.当然,一般来说这个软件是只支持英语的.