-
赛轮思开创行业先河的汽车大语言模型CaLLM™收获首批汽车制造商客户
Cerence Inc.(NASDAQ: CRNC),AI for a world in motion,今日宣布作为赛轮新一代车载计算平台的基础,其汽车大语言模型CaLLM™ (Cerence Automotive Large Language Model)已初露头角。
2024-03-21
-
赛轮思委任Daniel Tempesta 为首席财务官
Cerence Inc.(NASDAQ: CRNC),AI for a world in motion,今日宣布任命Daniel Tempesta为新任首席财务官(CFO),其任职将于2024 年 3 月 18 日生效。
2024-03-04
-
赛轮思和斯柯达利用 Cerence Chat Pro 提升智能车载体验
Cerence Inc.(NASDAQ: CRNC),AI for a world in motion,今日宣布将为大众汽车集团旗下品牌斯柯达(Škoda)部署生成式人工智能应用。
2024-01-16
-
长城汽车携手赛轮思打造更强大车载语音交互体验,助力全球市场扩张
Cerence Inc.(NASDAQ: CRNC),AI for a world in motion,今日宣布中国头部SUV、皮卡和电动汽车制造商长城汽车(GWM),已选择赛轮思为其全球车型提供增强的车载体验。
2024-01-10
微信文章
从语音到多模态交互,智能座舱进化之路
原创 Cerence China 赛轮思 9月17日
我们认为最打动用户的车载体验就是尽可能接近人与人之间互动的体验:一种多感官、对话式的体验,包括了由语音、视线及手势构成的多模态交互。
智能座舱市场
随着5G技术应用对智能网联汽车发展的推动作用,汽车座舱已进入高度智能化,消费者对智能座舱的青睐程度越来越高。从用户购买决策的关键因素来看,根据IHS Markit最新的调研结果,座舱智能科技配置水平是仅次于安全配置的第二大类关键要素。其重要性程度已超过动力、空间与价格等传统购车关键要素,反映出座舱智能科技已成为用户购车的重要考量。
IHS Markit 预计到2030年,全球汽车智能座舱的市场规模将达到681亿美元。届时,国内的市场规模也将超过1,600亿元;中国在全球市场的份额将从当前的23%上升到37%左右,是全球最主要的智能座舱市场。目前中国市场座舱智能配置水平的新车渗透率约为48.8%,到2025年预计可以超过75%,均高于全球市场的装配率水平, 以期满足中国日益增长的座舱智能配置需求。
根据《智能网联汽车技术路线图2.0》,到2025年自动驾驶网联汽车才会实现大规模应用。而目前汽车手机互联映射模式存在影响驾驶安全、车辆数据控制受限、服务更新等问题,智能化的车机系统才是未来智能网联汽车的发展方向。因此智能网联汽车短期的发展重点会在于提升车内互联的用户使用体验。
智能座舱发展趋势
语音交互是智能网联汽车人机交互的基础,自然语音理解技术、人工智能技术、大数据技术、生物技术等将使得车机更加懂得和了解用户,实现更加人性化、自然的交互体验。这些创新技术,尤其是基于手势的交互,就是为了提升车载体验,并创造一个安全、高效、愉悦的环境——这是目前、L3级别及以上自动驾驶汽车及未来车载体验的核心所在。另外,多音区语音识别技术和声纹验证技术也将帮助构建智能主动式的对话交互体验。
在不影响行车的情况下,驾驶者可以通过语音结合视线跟踪、手势识别、增强现实等技术,将人、车连接在一起,像在挡风玻璃用户界面进行基于手势的交互。例如,驾驶者可以使用手势来移动、选择在挡风玻璃上显示的部件,进行分段式路线导航、音乐播放、查询天气等操作。或驾驶者使用抓取-投掷手势并结合凝视的方式,将导航窗口部件移动至乘客面前的挡风玻璃处,这样乘客就可以扮演“副驾驶”的角色。驾驶者也可以使用点击手势暂停和继续播放音乐,或者播放下一首曲目。
▲感知算法——基本分类
领先的智能人机交互系统包括宝马iDrive、奔驰MBUX、奥迪MMI和福特SYNC 等在座舱智能化过程中,已集成了Cerence Drive——最快、最强大、最智能的移动出行AI助理平台,让其车主率先体验创新的多模态交互。
创新技术开创崭新的多模态交互体验
超越语音之外
Cerence Look 2.0提供了一种崭新的、自然交互方式,让驾驶者与车辆周围环境直接互动,结合新颖的环境重建、现有的硬件和汽车传感器数据来传递有关驾驶者途经的兴趣点信息。从此,车载助理将变身为一个直观、见多识广的出行伴侣,它对驾驶者在旅途中遇到的所有事物了如指掌。例如,当你看到一个景点,你只需要说“这是什么” 或“告诉我左侧建筑物的更多信息”。或当你看到一家餐厅时,可以向助理询问餐厅的营业时间,甚至可以要求它预定餐厅。助理将为你提供所有需的信息,以及交待必要程序。
值得一提的是,Cerence Look已率先应用在梅赛德斯-奔驰新一代MBUX的全新“Mercedes Travel Knowledge”功能上,通过视线识别一栋建筑物,获取旅途中所需的信息,从而创造了一种更快捷、更高效的交互方式。Cerence Look 是一个超级智能的新产品,让语音助理功能得到极大的提升,不但将驾乘者与车外周围环境连接在一起,这项技术还可以应用到车内所有区域,实现驾乘者与汽车全方位互动。当你看到通知警示灯,只需向助理请求帮助或询问更多的细节。Cerence Look使驾驶者、乘客与汽车的互动比以往任何时候更简单容易,并对其汽车加深理解。
语音增强技术
在智能汽车发展初期,大部分车企以智能座舱及辅助驾驶先行。如今,智能座舱正在不断进化,车辆要想完全实现“智能”状态,就需要做到全场景智能。这意味着,系统能够识别每位乘客的位置与身份,从而提供定制化的服务和个性化的交互,让车内的驾驶者及每个乘客都能获得精准的语音交互体验。随着对车载内容和功能的需求不断增加,这个命题会变得更加复杂。
这就是Cerence开发Audio AI 解决方案的原因,它可以提升车内所有人的车载体验,而不仅仅是驾驶者。Cerence提供一套完整解决方案,攻克了车载语音识别的难题,实现车内语音交互环境优化,并可以按需为驾驶者和乘客定制座舱内的“私人”音区。这些并不是未来概念,多音区智能已经被部署在道路上一些最智能的车辆上了。
梅赛德斯-奔驰V级和2021新款的凯迪拉克凯雷德车型将配备新一代车内通信系统,以及My MBUX新一代智能人机交互系统已实现全座位语音识别新功能,全面提升车内乘客之间的交互体验,并让驾驶者避免分心的行为。
多音区智能(Multi-Zone Intelligence)
作为Cerence Audio AI套件的一部分,多座位语音识别结合Cerence 语音信号增强技术,使车内的每个人都可以与车载助理互动,而无需担心干扰或受到行车噪声影响。基于DNN的噪声抑制和声音干扰,支持更高级别的多音区语音识别和免提通信,为用户带来了全新的免提电话体验,多音区语音识别可以支持多达8个分区和30个麦克风使用。它还配备多达16个可配置输出通道,具有灵活的音区选择和多音区仲裁功能,可同时支持Cerence助理和多个第三方助手。
除了与车载助理互动之外,多音区智能还为驾驶者在路上接听电话提供了理想的解决方案。结合超定向和自适应波束形成技术,实现对来自其他音区的干扰语音的完美抑制。此外,即使在进行通话中也可以随时启用或关闭音区功能,为用户带来了全新的车载通信体验。通过以下的技术,Cerence 创造了更先进的智能座舱体验:
信号处理技术(SSE)
这是一项音频信号增强技术,可以将车内噪音从麦克风中删除,保留清晰、准确的语音信号。无论你是在免提通话,与语音助理对话,还是与车内其他乘客交谈,通过使用 Cerence先进的语音识别和自然语言理解引擎,均可实现一流的通信和语音体验。
SSE还支持乘客在座舱设定多个分区,实现分区个性化交互和多人同时交互,以及车控体验。例如:
-
驾驶者设定了 “私有音区”,便可以让他/她在不被其他乘客干扰的情况下接听电话。
-
后排乘客只需说“摇下我的车窗”,车辆就会知道该摇下哪扇车窗。
新一代车内通信系统(ICC)
ICC通过麦克风列阵获取驾驶者的语音信号,对其进行处理后,语音信号瞬间通过后排扬声器播放。驾驶者可以安全、清晰地与车内其他乘客进行交流。这样,不但提升了与乘客的语音交互体验,并减低驾驶者的认知分心。
总而言之,这些创新技术均以用户为中心,将实现汽车座舱的智能化进一步提升。从此,车内语音交互可以从信息娱乐向车辆控制延伸,还有将车外信息带入车里, 帮助获取车外兴趣点的信息。更进一步,从被动交互到主动交互,并根据乘客的情绪和个人状态进行主动感知,让座舱更智能、更安全和更个性化,全面提升智能网联汽车的用户体验。
*文章的部分图片及内容分别来自于:
IHS Markit 公众账号(IHSMarkitAutomotive)及戴姆勒集团官方网站,所有商标均为所有者的资产。
相关文章
移动世界的最新新闻和观点洞察,了解最新资讯。