科大讯飞加入汽车生态战局 飞鱼 OS 有多少机会?

· Nov 10, 2018 333

十几年专攻语音方向,科大讯飞在语音交互上的技术成果也成了他们在车机操作系统上的优势。最近他们在做什么呢? GeekCar 和科大讯飞智能汽车事业部总经理刘俊峰、科大讯飞智能汽车事业部高级产品经理汪华锋聊了一下,发现他们正忙于飞鱼 OS 的商业化落地、多模态交互方式的研发和更新,以及建立一个去中心化的生态系统…… 在建立服务生态智能体系上面,他们向行业开放自己的 AI 能力、硬件平台接口、飞鱼 OS 运营组建,已经和 40 多家合作伙伴进行了深度合作。 产品战略布局:软硬分离 先了解一下科大讯飞的汽车业务。去年起,他们把产品阵列凝聚成为下面三个: 1)飞鱼的智能语音套件系统, 它在车上更多表现称为是一个语音助理; 2)飞鱼的智能车机系统, 现在搭载它并实现量产的有六个车厂的近 10 款车型: 3)小飞鱼, 这是科大讯飞基于同样的操作系统、同样的平台面向后装做的智能硬件。 刘俊峰透露,现在在营收上,科大讯飞的前装产品和服务占比达到 90%,后装约占 10%。「 这一定程度上也因为我们的后装产品上市较晚,去年 8 月发布的。」 他说。 科大讯飞智能汽车事业部总经理刘俊峰 按照他的预计,在智能语音系统的量产规模上,今年年底科大讯飞将达到 1500 万台前装的装配量,今年整体的出货量将超过 400 万台。 飞鱼 OS 是什么? 它是科大讯飞今年 5 月在深圳发布的语音操作系统架构,最近科大讯飞将这个系统架构和汽车的使用场景结合,和他们相应的汽车后台服务整合成了一个新的 iflyos AUTO 版本。 汪华锋告诉我们,为了满足不同客户的需求,科大讯飞将飞鱼 OS 拆分为两个层级:LITE 版和 PLUS 版。PLUS 版比 LITE 版在整个系统里面做得更深入,更深度地定制系统的 framework 层,甚至一些 hal,kernel 层的部分模块。 科大讯飞智能汽车事业部高级产品经理汪华锋 同时,科大讯飞在系统底层也做了参考设计和优化,为行业带来架构多元的能力:每一家车厂都有它自己的「 云」,在这种情况下科大讯飞通过他们云端的开放将更多的「 云」 融合。具体来说,目前飞鱼 OS 接入了高德导航、QQ 音乐以及美团的一些生活服务,把这些多种生态平台里的服务聚合起来,给用户提供更多元的服务。 这种「 双层级+多生态」 的模式让飞鱼 OS 本身建立起了「 软硬分离」 的能力。这也是他们提出的一种方案,计划将实行。 「 软硬分离」 方案指的是,客户可以不使用科大讯飞的硬件,而只买他们的软件服务。其实这种灵活性服务,一定程度上也让软件技术优势明显的科大讯飞,在硬件产品较为成熟的市场里有了更多生存和发展空间。 反之,客户买科大讯飞的硬件服务,用别人的软件应该也可以…… 怎么构建软件服务的差异性? 刘俊峰讲了一下他所了解的车厂遇到过的问题: 有的车厂在向智能化转型的路上,一开始软件开发是找外包,之后再自己做的,这时他们往往难以真正从软件服务的角度出发让自己的产品在这方面形成能支撑品牌的亮点; 更可怜的是现在很多互联网厂商在投入汽车智能化生态过程之中,因为前述问题往往不得不配置一些定制性的、差异化的,必须要满足工程交付标准的割裂的版本。 因此,他提出了给行业的三点建议: 1)车型平台化之后需要接口的平台化。」 因为这个决定着我们跟汽车怎么样的打招呼,决定着这种语言是不是通的。」 2)硬件平台的设计标准化。 这对操作系统是一个考验,平台设计的标准化决定了生态合作伙伴能否把自己最好、最新的服务迭代在硬件上。 3)构建真正有差异化的汽车品牌的生态和服务系统。 刘俊峰认为这个生态和服务系统里不光是吃喝玩乐、娱购游,还包括你的服务、汽车 4S 店的维修、保养提醒、保险提醒、你的配件、你的电商体系。 「 每个环节都应该是一个车厂最重要的个性,而所有这一切都需要内部管理体系来支撑。如果没有能够因时而变的项目管理体系,我认为在软件这方面,产品的验证体系和产品的评审周期是很难建立的。」 刘俊峰说。 另外,在语音交互同质化不可避免的当下,刘俊峰指出这方面的差异化则应该体现在服务的用户不同上。 「 唤醒词的差异化不是核心差异化,真正的差异化是语音交互的有情感的表达。例如一个小型 SUV 和一个偏商用化的中大型 SUV,它们的交互应该是差异化的,这种差异也该符合车厂对用户群的定义。」 他表示。 聚焦于人:多模态交互 科大讯飞在汽车方面一直走在一个垂直方向,他们以前和现在最聚焦和关注的一点是如何「 理解人」,这里的人指的是汽车上的服务主体,他有可能是司机,也可能是乘客。 刘俊峰介绍称,最新版的飞鱼 OS 更关注交互的质量,关注核心技术,能够给人的体验的变化,关注它的服务链条,关注虚拟助理是不是有情感,关注传感器,关注算法融合。 科大讯飞主要对飞鱼 OS 做了三点更新: 1)多模态交互。 这种交互方式行业内已经提出了很长时间,但是应用效果却并不算好,刘俊峰认为,这其中主要原因之一是当各种技术在整合为多模态交互功能时,没有形成标准化。 现在科大讯飞把自己的语音、图像技术以及他们合作伙伴的能力相结合,整合入飞鱼 OS。现在飞鱼 OS 包含语音合成、声源定位、窄带波束、声纹识别、智能打断、语音唤醒、语音识别、自然语言理解、听歌识曲等组合核心技术,让机器做到更像人的交互方式。 2)多乘客交互(多音区交互方案)。 这是科大讯飞在行业内首次提出的交互方式,他们也是最早把这种技术落地量产车上的。 多乘客交互也叫做多音区方案,它主要考虑的是随着汽车智能化和自动驾驶技术的发展,车内将有更大空间,并且车内的娱乐服务需求会增加,因此满足解放了双手的驾驶员、各个位置的乘客的需求都将是车内服务的关键。 实际上科大讯飞的这个多音区方案已经在蔚来汽车里已经实现了第一步:它能将车内空间里的不同乘客进行区分,知道你坐在后排的左边还是右边。 「 未来还可以做得更好,比如说在同一个时间几个人同时说出不同的指令,机器仍然可以分辨出来去执行相应的动作,每个动作互不影响。同时结合这样的能力我们还可以为不同乘客量身定制更多的专属服务。」 刘俊峰说。 可以试想,以后无论你坐在车上哪个位置,都可以用「 打开车窗」 四个字,让汽车自动打开你身边的那个车窗。 3)情感化交互。 蔚来 ES8 上搭载的 NOMI 就是结合了科大讯飞的人工智能技术打造的智能助理,它的拟人交互表现几乎引爆了整个行业的关注。 刘俊峰指出,NOMI 其实就是从人的需求角度出发设计的产品,未来人机交互也一定会更加类人,更加情感化。「 我们也希望通过我们的技术和产品,为每一个人都提供属于他自己的这样一个 AI 虚拟助理。」 从技术角度看,科大讯飞为了让汽车能听会说、察言观色,增强了汽车听、说、看三个维度的能力。听的部分在声纹识别和降噪模块的基础上增加了多音区能力;说的部分,在技能平台、AIUI 的基础上,增加了 XTTS 和音效;看的部分,在 360 的基础上,他们增加了人脸识别和疲劳识别能力。 去中心化的生态系统 服务车主早已不单单指满足车内用户的需求了,现在无论是供应商、车厂、各种汽车服务平台也都在延展、布局和汽车相关的整个生态。科大讯飞也不例外,他们表示要建立一个去中心化的生态系统。 什么叫去中心化? 在一个生态系统里,语音的交互和车内的智能体验少不了和各种生态伙伴的合作。刘俊峰认为,过去很多车厂一直都是采取单边合作——一个车厂找一个 Tier 1 供应商解决所有问题,但是这种情况已经开始变化,并且现在的趋势是一个车厂找多个供应商去一起解决一个问题。这就是去中心化。 他表示,大概十年前,如果一个你想和车厂沟通新技术的更新等问题,中间的硬件集成商往往非常不开心,因为这个过程里他们很难及时地应对新技术融合、集成、量产、上市。现在这个过程翻篇了,在多边合作里,不管是软件企业、硬件企业还是互联网生态厂商都可以充分和主机厂沟通。 在未来的生态里,一方面软件的迭代速度比硬件更快,另一方面软件的整个性能要求可能会决定硬件的架构,以及整个系统架构的模式,因此刘俊峰还提出了一个有趣的观点: 未来类似 BBA … 继续阅读