5G时代即将到来! 对于汽车用户来说,5G究竟意味着什么呢?
微信文章
5G时代即将到来! 对于汽车用户来说,5G究竟意味着什么呢?
原创 Cerence China 赛轮思 12月5日

根据国际电信联盟的定义,未来5G有以下三种最重要的应用场景:
-
高可用的低延时连接:可用于自动驾驶。
-
增强的移动宽带:这些非常高吞吐的移动宽带,可以为用户车内的信息娱乐系统提供丰富的内容、视频、音乐等网络资源。
-
万物互联:基于5G的物联网,可以上传车内的各种传感器数据,包括V2X的数据交互。
在5G时代,边缘计算和云计算需要做一定的融合。这样的融合是为了保证更可靠,更有效,更人性化的用户体验。
自动驾驶将给车内交互带来巨大变化
在5G时代,汽车行业出现最显著的变化可能就是自动驾驶的到来。而自动驾驶将给车内交互带来巨大变化。

随着自动驾驶技术的不断推进,车内的交互方式已经从传统的语音识别,发展到现今的NLU(自然语言理解),而在未来会更多地着重情感计算。使用的场景也不仅仅是兴趣点搜索或听听音乐,车内各种传感器的数据交互及融合,可以提供多模态的交互。同时,未来还可以实现更多个性化应用场景。
正是因为这样的变化,Cerence着重于AI移动助理的研究。而AI移动助理一定是需要依靠边缘计算和AI云计算,以及这两种计算相互融合。
AI与生俱来的互联汽车
我们认为在未来,互联汽车和自动驾驶汽车,在走下生产线的那一刻起,就如同发动机一样,就会拥有人工智能。而移动助理将是未来互联汽车,自动驾驶汽车及共享汽车上最核心的应用。
在5G时代,车内的各种传感器,各种交互方式,如当今相比需要有一定的提升。在这一背景下,如何使移动助理能够提供更人性化的交互呢?
我们认为可能要从以下方面去做一些研究和探索:
-
会话式AI
-
混合式架构
-
机器学习
-
上下文推理
-
智能仲裁
-
车内多用户云智能
未来的移动助理,我们认为一定会融合智能交互技术,提供快捷、可靠和人性化的用户体验。而这一切都要建立在AI边缘计算,AI云计算,以及二者融合的基础之上。

正深入研究的技术
目前Cerence正在深入研究的,首先是智能交互技术,包括ASR(自动语音识别),NLU(自然语言理解),Dialog(对话),TTS(语音合成)技术。基于这些技术,我们通过大数据分析,可以在车内提供个性化的交互。同时,凭借上下文理解引擎,交互的内容可以适应不断变化的场景,做到更人性化的交互,提高用户的满意度。此外,我们将各种车内传感器的数据,摄像头的数据、语音的数据,进行融合,提供多模态的交互。
即将量产的技术
技术研究的最终目的都是为了应用。如何能够将我们的技术,在短时间内,能够落地到所有的OEMs和Tier 1的产品当中,丰富用户车内的使用体验,也是Cerence关注的焦点。即将量产的技术包括:
需要注意的是,此技术是纯声学的方案,同时是一个纯软件的方案。不需要添加任何硬件,只需使用一套车内现有的麦克风,就可以轻松部署。
Cerence的智能语音技术包括两个部分,一是包括语音识别技术和自然语义理解技术。 Cerence新的引擎,在未来1-2年内,将在国内实现量产。

同语音识别引擎解决方案相同,Cerence TTS交互解决方案也能匹配车内规模不同的计算资源。此外,Cerence可以还原音损录音的TTS服务。并且基于新的深度学习技术,我们会提供新的TTS服务。
这方面的一个例子,是不久前Cerence全球首发的车载语音克隆技术。我们提供了从录音到音频处理,一直到推送的完整闭环环节的解决方案。用户可以使用手机录取自己或者亲朋好友的声音,通过Cerence云端TTS技术,将它转化成语音包,推送到本地。之后再进行人机交互时,在车内听到的就是你熟悉的声音,能够为用户提供更加温馨的人性化体验。
将以上三种智能交互技术结合,Cerence设计了众多以用户实际使用场景为导向的解决方案,以切实提高用户的使用体验。

未来即将落地的技术包括:100%无按键的交互,和汽车对话不在需要任何按键,不再需要任何唤醒词,直言所需就可以完成任务,使人机交互变得更加便捷、更加高效,更加简单。此外,还包括已经实现的情感AI计算,眼动跟踪,视线识别等多模态交互。Cerence将继续努力将已经实现的场景和技术与量产车型结合,使用户能够尽快享受到5G时代车载黑科技所带来的全新体验。

微信文章
探索更多
未来出行体验