其他分享
首页 > 其他分享> > 重新定义车载语音交互:服务“全家人”的“自由对话”

重新定义车载语音交互:服务“全家人”的“自由对话”

作者:互联网

车载智能语音已经成为了日常用车非常重要的高频功能之一,但当前绝大多数语音交互系统的使用感受,其实并不愉悦。

其中,大多数车载智能语音系统谈“听得清”、“听得懂”尚显得差强人意,更谈不上能够顺畅的自由“对话”和“互动”。

被诟病的较多的问题,主要在于:

一是需要一遍又一遍的唤醒系统,还往往需要等到语音系统完整复述完并且处理完上个指令后,驾驶员才能开口提其他需求,太考验人们的耐心;二是说出指令需要刻意记住关键词才能成功识别,太考验记忆力。

又或者是一个人开口,其他人都需要“闭嘴”,这是因为语音系统很容易受到其他语音干扰。如果一旦有“熊孩子”在一旁“捣乱”,往往会导致语音系统无法正常识别指令。

几天前,理想汽车正式发布了其智能语音系统“理想同学”2.2版本,重点针对上述痛点进行了改善。该公司相关负责人表示,新版本的核心目标是:服务“全家人”的“自由对话”。

重新定义车载语音交互:服务“全家人”的“自由对话”

一、“理想同学”2.2版本解决哪些痛点?

2.2版本的“理想同学”主要升级了四个方面的功能,包括连续对话、可见即可说、四音区锁定、跨音区上下文对话。

1、连续对话

理想同学2.2版本可以支持单次唤醒后的连续指令下达。在上一个指令成功执行后,智能语音系统有20秒的时间,来等待乘客发出下一个指令。

这样的好处就是,用户在需要连续操作时,不再需要一遍一遍的重复“理想同学”来再次唤醒系统。

除了以上,连续对话功能还有一个特点在于支持随时插话,而不需要耐心静待系统完成上一条指令之后再开口,系统会自动录入指令队列,然后按照顺序执行。

比如,你可以连续下达“空调调到20度”、“打开音乐”,“打开后排座椅通风”等等多个指令而无需间歇等待,让语音功能操作变得便捷而高效。

除了这些,理想同学令人印象深刻的还有一点在于“无效文本拒识”功能。在智能语音开启过程中,即便有其他人插话和交谈,理想同学能够“聪明”地识别到哪些是需要执行的指令,哪些是车内的交谈内容。

重新定义车载语音交互:服务“全家人”的“自由对话”

2、可见即可说

用户在使用理想同学控制某个APP时,乘客不用再刻意记住指令、关键词这类触发语,只要看到屏幕上所显示的菜单栏写着什么就说什么,系统可以自动识别并执行。

当然,这需要理想的智能语音系统与外部应用APP深度绑定和开发,目前首批支持的应用包括QQ音乐、喜马拉雅、蓝牙电话、车辆中心。

值得一提的是,考虑到安全因素,车辆中心里有关驾驶的设定并不支持非主驾区域的语音控制,也就是说这部分内容只能由驾驶员控制。

3、四音区锁定

在理想ONE已经实现了全车多音区均能进行智能语音对话外,理想同学2.2版本对全车多音区应用再次做了精细化的体验升级:支持除主驾之外任意一个音区的识别关闭。

作为一辆家庭用车尤其家有多个小朋友,往往会出现对语音控制的“话语权”争抢,尤其是有些“熊孩子”的故意捣乱,往往会影响家长的正常使用。

这个时候,主驾驶只要说“关闭后音区”、“不要听副驾驶”等指令,就可以关闭相应位置的语音识别,避免熊孩子捣乱。

重新定义车载语音交互:服务“全家人”的“自由对话”

4、跨音区上下文对话

当前,智能语音被诟病死板的场景之一在于同一个功能指令下的重复啰嗦,更在于不同驾驶位的人员明明是类似的需求,不仅需要主驾多次唤醒语音助手,还需要针对不同座位来重复同样的指令,来完成不同区域的调整。

而理想同学2.2针对这些场景有了升级,可以针对上条指令内容进行上下文关联对话,并对其他座位上的乘客需求进行调整。

比如,针对空调、座椅、车窗等调整,第一次如果不满意,就可以再次说再大点/冷点,温度调到XX度,风量调到XX档等;

主驾调好后,可以说“副驾也是”等一键同步到其他座椅位置;并且在相同的指令语境下,其他座椅位置的乘客,也可以唤醒理想同学后,说“我也要”。

发布会结束后,我们对理想同学2.2版本进行了体验。整体感受来看,理想同学的四音区应答能力非常好,连续对话、可见可说,以及跨音区的上下文对话能力都已经能做到,已经优于市面上大多数语音交互的体验,相信OTA升级后的理想同学将成为理想ONE的核心卖点之一。

重新定义车载语音交互:服务“全家人”的“自由对话”

二、自研能力是关键优势之一

本次智能语音系统“理想同学”2.2版本只是理想汽车2021年OTA升级计划的一部分。按照计划,这套智能语音系统在今年将陆续启动FOTA2.1、FOTA2.2、FOTA2.3三个阶段的产品升级。

随着2021款理想ONE上市,FOTA2.1正式推出,搭载了自研的理想同学引擎,底层能力替换为地平线 + 思必驰 + 微软,增加四音区锁定和唤醒打断功能,并可实现语音控制动力模式、驾驶模式;

如今FOTA2.2版本的升级也主要是早期规划部分,包括自由对话、连续对话、想说就说、无效文本拒识、可见即可说&可想即可说、跨音乐上下文对话、 HIFI 级情感化语音合成。

官方显示,OTA2.2版本更新将于9月15日前陆续开启推送。

接下来的FOTA2.3升级则包括四音区副驾屏语音系统、可见即可说 II 期、多应用控制及仲裁策略、视频应用接入、全车媒体应用接入。

在此之前,理想ONE采用的是第三方供应商提供的智能语音系统,随着自研理想同学语音引擎上线,底层能力也被替换,理想智能语音功能不仅体现出极大地个性化,针对当前语音交互的痛点来实现优化升级。

这背后,是车企对深度自研的需求与能力体现。

对车企来说,只有 “深度自研”才能拥有不受制于供应商的开放能力和主导权,有了更大的发挥空间,来更加灵活实现属于品牌自身特色的差异化与个性化,并能快速拓展引入功能和场景细化,实现跨垂类生态和语音控制场景全链条的逐步打通。

在供应商提供底层技术和基础框架的基础上,其他的大部分,如交互架构搭建、操作系统、上层的功能开发和应用等将由主机厂自我研发实现。当前来看,几家头部新势力企业都倾向于自研模式。

重新定义车载语音交互:服务“全家人”的“自由对话”

在本次发布会上,理想汽车还推出了基于车载应用生态的应用中心,对于接入的应用,理想汽车制定了一定的标准和要求。

首先,理想汽车和第三方公司共同定制专属理想汽车的车载App,接入的应用统一实现符合理想车机系统风格的UI设计。其次,接入的应用要与理想车机系统做深度融合,比如需要全方面支持语音控制,需要符合理想汽车的交互逻辑。

这样第三方应用可以更好地适配理想ONE的显示屏以及车机系统,界面效果、系统流畅性、使用感受都会大幅提升。目前这类第三方的应用程序增加到了9个。

理想汽车与其他新势力的显著区别有两点,一是走增程路线,另外是只卖一款车,一个配置,一种价格。

重新定义车载语音交互:服务“全家人”的“自由对话”

一直以来,理想汽车强调的都是用户体验,更舒适、更愉悦的空间, 而智能座舱、智能语音等均是理想汽车主打的核心技能之一。

2021款理想ONE标配全栈自研的理想AD高级辅助驾驶系统,在原有的 Level 2级别辅助驾驶基础上,升级NOA导航辅助驾驶的能力。

该系统计划在9月份升级,配合高精地图的覆盖,新增导航辅助驾驶、虚实线识别、锥筒识别、限速识别。在第四季度新增车辆朝向识别、停止线识别、斑马线识别、地面标识识别、城市路口增强、信号灯提醒、离车泊入、一键泊出。

此前,理想汽车设定的销量目标是单月突破一万台。5月25日新款(2021款) 理想ONE上市后,6-8月都保持了连续高增长的态势。

数据显示,8月份理想ONE交付量已经达到9433辆,同比增幅高达248%。目前来看,距离目标仅一步之遥。

标签:同学,音区,理想,车载,全家人,对话,指令,语音,交互
来源: https://blog.csdn.net/GGAI_AI/article/details/120323707