平台及产品

按用户体验平台分类

Cerence xUI™

通过混合智能体化AI提升

车载语音辅助水平

Cerence Assistant

每一次出行都能体验到顶尖的自然语音助理功能

按产品分类

AI智能体

借助专用AI智能体拓展语音体验

CaLLM™以及生成式AI应用

借助大语言模型（LLMs）与生成式AI的强大能力，提升用户交互体验

音频AI

AI强化音频与降噪处理实现清晰纯净的音质

语音输入与输出

通过自然语音交互带来栩栩如生的类人化交流

客户案例

了解更多

开发者平台

使用强大的API和SDK打造定制化的语音解决方案

行业

按行业分类

车载解决方案

借助AI驱动的交互，重构驾驶体验

卡车解决方案

AI驱动的语音辅助实现更智能的运输

两轮车平台

为骑行者提供免提、语音激活的辅助功能

其他行业

将语音AI引入日常环境与体验中

其他行业

将语音AI引入日常环境与体验中

了解更多

服务

专业服务

用户体验服务

集成

定制

质量保证

新闻

赛轮思AI新闻

所有文章

新闻动态

微信文章

媒体报道

投资者

关于赛轮思AI

关于赛轮思AI

关于我们

招聘

可持续发展

经销商合作伙伴

VOICE22 | 从传统语音助手到智能座舱AI助理的进化之路

2022年12月23日

微信文章

VOICE22 | 从传统语音助手到智能座舱AI助理的进化之路

原创 Cerence China 赛轮思 12月23日

“

传统的语音助手需要你提出请求，然后它才会做出响应，但它正变得越来越聪明，升级成为坐在你旁边的副驾驶，先你所求，贴心的为你主动提供建议。

近日，赛轮思UX总监Adam Emfield在VOICE22上与attn.live CEO Ian Utile，分享了主动式AI和更先进的对话式AI将如何革新驾驶体验。

以下是VOICE22｜FIRSIDE CHAT的节录内容：

对话式AI、语音AI担任汽车副驾驶的角色，你对此有什么见解？

大家理解的传统语音助手，只能被动地执行语音指令，通常情况是你先提出需求，然后它才会做出响应。但它正在进化，并且变得越来越智能。我们更愿意用“副驾驶”来形容我们期待的助理，它知道你想做什么，它明白你需要什么；而且，它还了解你周围发生的事情，以至于它不是被动的等待你发出指令，而是知你所想，主动提供建议，甚至为给你提供最佳的过滤结果或最佳答案。由于它对你无所不知，它就像是坐在你旁边的副驾驶一样。

主动式语音交互是什么？这在赛轮思开发的汽车应用中扮演什么角色？

我们可以看看语音指令的演变过程，以汽车中的指令和控制为例，早期只是使用语音进行电话拨号，到后来使用语音来导航，到更进一步是使用自然语言理解（NLU），例如帮助我们寻找最近的咖啡馆。当赛轮思研发主动式AI时，首先考虑的是它应该在什么时机采取主动。它需要先了解周围发生的情况后，才说 “Hey，我们应该做一些什么事情”，或者“我可以为你做一些事情”，而不是等待你的指令。显然这才是语音助理全新的 “打开方式”，而且它们在这个方面的能力越来越强。

现在有哪些在汽车中应用主动式AI的案例？预计未来将会有更多应用？

我认为安全是最重要的应用场景，市场上也表达了同样或类似的期望。举个例子，前面有一条湿滑的路，语音助理会主动说：“前面的路很滑，大约还有一英里，我们何不绕过这条路，走其他路去目的地？”或者可以沿路继续走，说“Hey，你的车速有点太快了，也许可以慢下来”。安全是人们对助理突然发出的语音提示表现能够较早、较容易接受的应用场景。除此之外，语音助理确实还可以做更多的事情，例如帮助你提高生产力，使旅程更舒适，或以其他方式为你带来更丰富的体验，只要你知道如何正确地使用它。

预计一般消费者什么时候可以驾驶那些使用Cerence技术的汽车，以获得安全、便利和生产力的体验？

我们在2022CES上展示了部分的创新技术，例如停车用例和安全用例，虽然这些应用场景处于早期开发阶段，但对驾驶者来说已经十分实用。我们预计2023年落地的新车将部署部分创新技术。这将是一个演变过程，我们会循序渐进的推出这些技术，消费者的心智模型上要从传统模式转变到积极主动的语音助理是一个很大的突破，所以我们希望小步快跑，续步推进。大家会在明年看到初期的版本，然后它将会井喷式发展。

为什么需要较长的开发时间才可以为消费者提供这些新技术？

这与更广泛的语音行业有关，不仅仅是在汽车领域，智能语音已经渗透在人们生活的每个角落，并成为人机交互的重要方式。在汽车里，它可以帮助我在驾驶时候更安全；在家里，它给我播放音乐，提供食谱和设置定时器。显然，语音技术应用为日常生活带来积极的影响。当我们再次回到副驾驶的概念时，人们真正的心智模式是开始思考它真的可以为我服务，也许它可以发挥更大的作用，而我们已看到人们开始接受机器首先发起对话的交互方式。大概在2019年，用户研究显示可行，也许这是一个发展方向。但当时我认为这些期望、整个行业的演变，和人们看待语音的方式均没有准备好。但现在，我们正处于一个可以将战略、技术和用户期望完美融合的重要时刻。

有些人会认为积极主动的语音助理是帮助，但也有一部分人会认为它是干扰。你在这两个观点之间如何取得平衡？

这是很难做到的，因为部分情况下会因人而异。我们采取的方法是，在测试这些新技术，试图获取适用于最广泛群体的方式。首先，安全是一个很好的例子，虽然如此，还必须做出妥协。我们通过多次测试，对一些功能进行原型设计，希望发现它们的干扰性，继而调整设计以降低干扰性，或寻找更合适的时机。第二件事是要确保它能够了解个别用户的情况，而不仅仅是基于普遍用户的需求。你可以选择助理的主动和健谈程度，但它随着时间的推移而学习，包括从你的行为和习惯中学习，从你的面部表情到语气，以及你的反应。我们把所有这些数据结合起来，实际上是让它更有效的学习和适应你，务求调教助理至一个正确的、适合你的主动水平，并试图确保它不会太具干扰性。

*以上内容源自VOICE22 Summit，文中提到的商标均为其各自所有者的资产。