在月初 Build 大会上,微软的个人语音助手 Cortana 终于以 beta 版的身份走入大众视野。虽然分别属于两个不同的生态环境,但 Cortana 还是不可避免地与 Siri 形成了对抗——比如在汽车领域。
其实,CarPlay 与所谓的 Windows in the Car 之间的竞争,除了我所说的归根结底是 iOS 与 Windows Phone 之间的博弈外,还有一点就是 Siri 与 Cortana 的对抗。因为在车内场景中,语音控制是最安全、最快捷的操作方式,可以说直接影响了这两个「映射」的使用体验。
再者,像是 Siri,是完全可以以 Siri Eyes Free 的形式独立于 CarPlay 存在的。相信今后 Cortana 也会推出类似的语音识别解决方案——当然,这一定是基于 Windows Phone 系统的。现在可以肯定的是,Siri 与 Cortana 各自的表现,将直接影响到车主对 CarPlay 与 Windows in the Car 的选择,进而影响到对 iOS 与 Windows Phone 的选择。
长远的来看,CarPlay 与 Windows in the Car 或许会脱离「映射」成为一个独立的车载系统,这时候 Siri 或是 Cortana 的作用就更加重要了。因为一旦成了车载系统,就意味着 CarPlay 等有机会读取到汽车的 CAN 总线数据,届时通过 Siri 来控制车窗升降不是什么难事。
那么 Siri 与 Cortana 孰优孰劣呢?我们先从技术层面对比下:
1)搜索引擎方面,Siri 与 Cortana 目前使用的都是微软的 Bing;
2)语音识别技术,Siri 的供应商是 Nuance,而 Cortana 则是依靠微软在 2007 年收购的 Tellme 建立起来的;
3)支持的系统/设备,Siri 支持 iOS/iPhone 4S+设备,Siri Eyes Free 支持车内互联;Cortana 支持 Windows Phone 8.1/Windows/Xbox One 等平台。
可以看到,搜索引擎上,Siri 与 Cortana 是一样的。在 iOS7 之前,Siri 用的是 Google,而 iOS7 则换到了 Bing。这里面苹果与 Google 的一些「恩怨」可以写成另一篇文章了,在此不做赘述。关键问题是,我个人认为搜索质量上 Google 显然是胜于 Bing 的,这对于 Siri 来说其实是一种「退步」。不过,通过 Siri 发出的搜索指令一般不会太复杂,所以 Bing 完全可以胜任。
至于语音识别(ASR),这其实才是 Siri 与 Cortana 较量的核心。Nuance 对大家来说并不陌生,这是目前全球最大的 ASR 软件供应商;除了 Siri 外,福特 SYNC 系统的语音识别采用的就是 Nuance 的引擎。
而微软所使用的 Tellme 技术,与 Nuance 相比在实力上还是要相差很多。不过,结合微软自己强大的云处理能力,以及 Satori 词条库,Cortana 在实际演示中的表现并不输给 Siri。
2013 年,收购 Nuance 未果的苹果买下了另外一家从事 ASR 技术的公司——Novauris。不过这件事在本月初才被媒体挖掘出来。此举的战略意义很明显,就是为了与微软形成抗衡。对苹果来说,一直依赖 Nuance 的授权是不行的,Siri 一定要有自己独家的语音识别引擎。这笔收购案,就是苹果在语音识别引擎上所花费的重金之一。
微软有了 Tellme,苹果有了 Novauris,各家在语音识别技术以及专利上至少都有一定的筹码了。但有一点让苹果处于弱势,那就是苹果没有自己的搜索引擎,它只能调用 Google、Bing 或是其他搜索引擎的 API。
另外,微软与 Google Now(Android 平台上的语音识别)均采用了「预知」式的设计,即在用户需要查询之前就把结果反馈出来。比如,在飞机降落后主动为你提醒酒店的位置。当然,这需要一定的机器学习过程。然而 Siri 目前还没有这样的设计,但相信今后也会加入其中。
刚才提到了 Google Now。现在来看,CarPlay、Windows in the Car 以及 OAA,分别对应的语音技术是 Siri、Cortana,以及 Google Now。大家或许会问 Google Now 在车内语音方面会对苹果、微软构成挑战吗?我的答案是:将来 Google Now 一定会出现在 Android 的「映射」中,但与 Siri 或 Cortana 对抗,还差得远。
智能化的未来,是不需要太多的介入就自动帮用户完成需要的事情。在汽车这种狭小空间内,必然要求更少的互动。试问同一个问题,谁会在回家之前反复回答「带我回家,经过不收费路口,寻找最快路径」还是在下班时自动给出下班路线,导航时根据情况自动调整?上下文预测正是省去大量互动环节的重要一环。识别精准度上,能拿出手的都不会差很多,反而是针对特定情景的优化才是更重要的。「有专利就会赢」的思路,是时候抛弃了。通知中心,下拉刷新,不必多提了吧?人都喜欢遇到一点就通,心有灵犀的人。这篇文章,对未来的感知,还差得远。
智能化的未来,是不需要太多的介入就自动帮
路过,赞一个
一触即发
说得对 支持