一辆智能汽车是否名副其实?是初级智能、中级智能,还是高级智能?与通过语音可以实现的功能的多与少,有直接关系。语音交互技术迭代非常快,现在市面上已经出现在最新一代。对于最新一代的语音交互,不同企业有不同命名,“自然语音”“混合语音”“全场景语音”……不一而足。那么,最新一代的语音交互效果如何?是否已经达成“无障碍对话”?我们近日测试了一番。

语音交互技术,购买or自研?
我们先后测试两套新的语音交互系统,同时也是目前市面上语音交互截然不同的两种类型:第一套的技术支持来自科大讯飞,测试车型是雪佛兰的新探界者。第二套是小鹏汽车在供应商提供一定技术支持基础上,自己再进一步研发的一套语音交互系统,搭载在小鹏P7上。简而言之,一种是供应商提供,另外一种是自研。
科大讯飞这套系统相信很多人并不陌生,除了新探界者之外,还出现在很多新车上。这套系统最大优势在于,语音识别准确,语义执行也相当迅速,能够智能识别断句,并具备学习功能。小鹏汽车的语音交互系统目前只在小鹏P7一款车型上使用,未来还会拓展到小鹏汽车旗下的更多车型上。小鹏汽车将这套语音交互命名为“全场景语音”,其优点在于可以控制许多不影响车辆安全的车机功能,比如底盘模式选择、关闭后排空调出风口、打开和关闭车窗等。
为什么小鹏汽车不直接采用科大讯飞,而要采取自研?小鹏汽车产品规划部副总经理江卫忠告诉我们,假如用挖矿比喻,如向铁匠铺购买铁锹,他们会卖给你,也可以卖给别人,那会造成所有人的效率都一致,没有不同。“我们选择不向铁匠铺买铁锹,选择自己造,可能造出来是一把铁锹,也可能造出来是一台挖掘机”。
在此之前,找供应商直接购买,成本低,功能全,配套服务好。但在我们体验过自研的语音交互系统之后,发现自研似乎更贴近于日常使用习惯,能更高效率的与汽车的其他系统互动,进而发挥“1+1>2”的效果。当然,此次测试,自研系统的领先优势还不是那么明显。但假如自研系统能够继续保持这样迭代进化的速度,显然会进一步构建自己的核心竞争力。
连续对话能显著提升沟通效率
新一代语音交互都支持“连续对话”。所谓“连续对话”,就是激活系统之后,在一定时间范围内,可以连续下达指令,而不需要重新激活。多长时间,不同车型有不同的设定,有30秒,也有3分钟。此次测试的两套系统都支持“连续对话”,可以在一次连续对话中,将你需要实现的功能,连续的下达,让系统连续识别并执行。
测试中,我们连续下达包括“导航”、“美食点推荐”、“天气查询”、“听歌”和“空调”等一连串指令。两套系统都能够准确执行,执行堪称迅速:通常是指令一说完,等不到零点几秒,系统便开始执行。使用过程中,卡顿感是基本上消失不见,但仍然没有完全达到“人与人”之间的即时互动的效果——还是要稍微有点耐心。

识别准确率取决于用户表述的“含金量”。“含金量”越大,表述清晰、准确,识别的准确率就越高。我们在测试小鹏P7的“全场景语音”系统时发现:语音交互过程中,首选用“短句”,“短句”的识别率越高;其次是尽量用普通话,系统识别普通话的速度要比方言高一些;再次,连续对话当中,如果发现错误,不用等待系统执行完毕,直接下达下一条指令;最后,不用担心其他人突然插话,系统会锁定激活的那个人的声音,全程只认这个人下达的指令。
必须承认,新一代语音交互系统还做不到100%识别率。有时候,要实现某一功能,要反复或者换着不同表述方式来下达指令。但有一点可以肯定,随着使用时间越长,随着你逐渐了解系统的“脾气”,你的命令被执行的效率也会越高。
还有一个问题,使用多年之后的旧车能否通过OTA升级,搭载新一代的语音交互系统。得到的回复是:不可以。原因很简单,旧车没有允许新一代语音交互的环境和土壤,旧车的芯片算力可能不足以支撑复杂的计算。他们的潜台词是,换车吧。
试驾总结:
测试结束之后,我们得出这样的结论:相比上一代,新一代的语音交互确实更加好用、高效和便捷。用户无需刻意的去记住关键词,可以用比较自然的对话方式,连续下达不同的命令。我们发现,新系统对于提升行车安全也有很大帮助:在行驶过程中,驾驶员无需再低头去点击大屏幕,也无需去找功能键——用语音下达命令的时候,实现都不用离开前方,手也无需离开方向盘。在人与车交互的诸多技术路线当中,语音交互会不会成为最后的赢家,现在还不能下结论,但该技术的进化,确实让我们感受到科技带来的便捷。
广州日报全媒体文字记者 周伟力
广州日报全媒体图片记者 周伟力
广州日报全媒体编辑 钟达文