国家无线电监测中心检测中心

当前位置：首页--行业新闻

语音交互渐成车载标配，下一步怎么走？

目前，车载用户对智能车载的接受程度已是越来越高，而人机交互技术无疑能让车载更加智能。来自相关调研机构的数据显示，在消费者最感兴趣、最实用的智能车载功能里面，语音交互已经排到了第二位，仅次于被盗车辆定位之后。另外，在一些车载设备里，包括智能车机、智能后视镜、行车记录仪、HUB和车载音箱等产品里，人机语音交互已无处不在。

“实际上，在智能车载系统1.0到3.0的迭代更新过程中，人机语音交互的作用和重要性已经越来越得到车主的认可。”思必驰信息科技有限公司的副总裁雷雄国认为，在车载领域，人机语音交互已成为车载设备的标配。

语音交互需攻克三大难点

不过，值得注意的是，车载语音在应用的过程中尚有一些难点需要去攻克。

雷雄国指出，首先是驾车环境下的噪音干扰。在驾车环境里，人与车载硬件的距离在0.3-1m以内。在近场距离里，存在各种噪音干扰、声音反射和混合，加大了机器对自然人声的辨识难度。“能够在车载的环境下，把噪声问题解决掉是人机交互第一步的基础。解决这个问题的方向包括：在出现错误时，允许纠正打断；对一些车载噪声以及环境噪声的抑制自适应；车设备在播放音乐或声音的时候，能够随时打断它等。”他说。

其次是智能交互。实际上，在交互的过程中，很多的语音控制依然要结合手动操作，这给用户的体验非常不好。“全自然语言交互、完全解放双手，是用户的核心诉求，也是车载生态蓬勃的根本。” 雷雄国称，这其实更多的包括人工智能的核心技术引进，包括跟车内业务的整合，使得车内的人机语音交互能达到更好的用户体验，这里面就包括对于语音的理解，以及人机多人的交互对话，基于任务式的深度的交互理解。

三是更贴合用户需求的产品设计。这包括ID设计；麦克、喇叭等硬件结构布局；硬件的问题只会通过软件体验的不足来体现；用户体验逻辑；语音交互与后端服务的结合，进行系统优化。“其实技术的发展达到一定阶段后，需要上下游合作伙伴一起来针对车联网产品进行多方位、多层次的结合与设计。”他举例称，在车载语音交互里面比较重要的一块是回声消除，包括唤醒打断，这实际上需要考虑麦克风与喇叭的一些结构设计，产品也需要在这一块做些配合。再比如，语音技术怎样与业务结合，怎样与导航结合，怎样把第三方的音乐资源对接得更加地紧密、无缝，这里面也需要投入大量的产品设计以及开发，才能把用户体验做到极致。

“语音交互只是手段，不是目的。交互的目的，是为了让机器更好地完成任务。因此，后端的第三方服务显得更为重要。”雷雄国称，在车载语音交互技术上，思必驰与上下游合作伙伴进行了整合，把导航、电台、个人社交、周边搜索、音乐等与车主相关的第三方服务整合在一起。他直言，打造一个在车的环境下能够实现全程真正解放双手的交互模式，这是非常重要的。

多模态交互是发展方向

“从交互的角度来看，语音仅仅是占人机交互其中的一个环节，在接下来的车载智能化的过程中，我们希望看到更多交互技术与语音结合在一块的，包括体感、手势、图象等一系列的人工智能的技术能够迅速进入到车内，即多模态交互。”雷雄国如是说。

思必驰是国内一家专注于智能硬件领域的语音公司，主要面向智能硬件三个垂直领域：智能车载、智能家居和智能机器人，提供自然语言交互解决方案。其中，车载在思必驰整体的业务中所占比重最大，其次是家居。思必驰市场总监龙梦竹在接受国际电子商情采访时表示，思必驰在智能车载领域侧重于后装市场，这部分的市场份额大概占40%的比例。从具体的应用市场来看，在智能后视镜市场估计占60%左右的市场份额。龙梦竹还透露，在车载前装市场，思必驰目前已进入前装车厂的测试阶段，合作的互联网汽车包括小鹏、智车优行等。

目前，思必驰能提供的语音技术包括语音识别、语音合成、语音识别++、语义理解和智能对话等。雷雄国称，当前语义理解和智能对话已慢慢在研究使用阶段，未来多模态的交互是很重要的一个方向，如语音与手势、图象识别等第三方的交互融合。另外一个方向就是与核心技术往云端移植，因为现在大部分的技术在云端，IoT发展起来之后，很多端上面会有云交互的需求，因此整个核心技术往端上移植也是一个大的方向。而人工智能是最重要的，人工智能与大数据融合，对大数据进行分析，这也是未来人工智能与语音的发展方向。

雷雄国透露，思必驰的研发方向与核心就在于人工智能。在多模态交互方面，思必驰也在与第三方合作推动。“我们做过手势识别、图象识别、虹膜识别、体感识别等与语音技术结合的多模态交互。”雷雄国称，未来一定是从单一的输入输出互动形式向多模态交互发展，从被动服务向主动式服务及智能服务方向发展。

时间：2016-06-08

友情链接