目前,车载用户对智能车载的接受程度已是越来越高,而人机交互技术无疑能让车载更加智能。来自相关调研机构的数据显示,在消费者最感兴趣、最实用的智能车载功能里面,语音交互已经排到了第二位,仅次于被盗车辆定位之后。另外,在一些车载设备里,包括智能车机、智能后视镜、行车记录仪、HUB和车载音箱等产品里,人机语音交互已无处不在。
“实际上,在智能车载系统1.0到3.0的迭代更新过程中,人机语音交互的作用和重要性已经越来越得到车主的认可。”思必驰信息科技有限公司的副总裁雷雄国认为,在车载领域,人机语音交互已成为车载设备的标配。
语音交互需攻克三大难点
不过,值得注意的是,车载语音在应用的过程中尚有一些难点需要去攻克。
雷雄国指出,首先是驾车环境下的噪音干扰。在驾车环境里,人与车载硬件的距离在0.3-1m以内。在近场距离里,存在各种噪音干扰、声音反射和混合,加大了机器对自然人声的辨识难度。“能够在车载的环境下,把噪声问题解决掉是人机交互第一步的基础。解决这个问题的方向包括:在出现错误时,允许纠正打断;对一些车载噪声以及环境噪声的抑制自适应;车设备在播放音乐或声音的时候,能够随时打断它等。”他说。
其次是智能交互。实际上,在交互的过程中,很多的语音控制依然要结合手动操作,这给用户的体验非常不好。“全自然语言交互、完全解放双手,是用户的核心诉求,也是车载生态蓬勃的根本。” 雷雄国称,这其实更多的包括人工智能的核心技术引进,包括跟车内业务的整合,使得车内的人机语音交互能达到更好的用户体验,这里面就包括对于语音的理解,以及人机多人的交互对话,基于任务式的深度的交互理解。
三是更贴合用户需求的产品设计。这包括ID设计;麦克、喇叭等硬件结构布局;硬件的问题只会通过软件体验的不足来体现;用户体验逻辑;语音交互与后端服务的结合,进行系统优化。“其实技术的发展达到一定阶段后,需要上下游合作伙伴一起来针对车联网产品进行多方位、多层次的结合与设计。”他举例称,在车载语音交互里面比较重要的一块是回声消除,包括唤醒打断,这实际上需要考虑麦克风与喇叭的一些结构设计,产品也需要在这一块做些配合。再比如,语音技术怎样与业务结合,怎样与导航结合,怎样把第三方的音乐资源对接得更加地紧密、无缝,这里面也需要投入大量的产品设计以及开发,才能把用户体验做到极致。
“语音交互只是手段,不是目的。交互的目的,是为了让机器更好地完成任务。因此,后端的第三方服务显得更为重要。”雷雄国称,在车载语音交互技术上,思必驰与上下游合作伙伴进行了整合,把导航、电台、个人社交、周边搜索、音乐等与车主相关的第三方服务整合在一起。他直言,打造一个在车的环境下能够实现全程真正解放双手的交互模式,这是非常重要的。
多模态交互是发展方向
“从交互的角度来看,语音仅仅是占人机交互其中的一个环节,在接下来的车载智能化的过程中,我们希望看到更多交互技术与语音结合在一块的,包括体感、手势、图象等一系列的人工智能的技术能够迅速进入到车内,即多模态交互。”雷雄国如是说。
思必驰是国内一家专注于智能硬件领域的语音公司,主要面向智能硬件三个垂直领域:智能车载、智能家居和智能机器人,提供自然语言交互解决方案。其中,车载在思必驰整体的业务中所占比重最大 ,其次是家居。思必驰市场总监龙梦竹在接受国际电子商情采访时表示,思必驰在智能车载领域侧重于后装市场,这部分的市场份额大概占40%的比例。从具体的应用市场来看,在智能后视镜市场估计占60%左右的市场份额。龙梦竹还透露,在车载前装市场,思必驰目前已进入前装车厂的测试阶段,合作的互联网汽车包括小鹏、智车优行等。
目前,思必驰能提供的语音技术包括语音识别、语音合成、语音识别++、语义理解和智能对话等。雷雄国称,当前语义理解和智能对话已慢慢在研究使用阶段,未来多模态的交互是很重要的一个方向,如语音与手势、图象识别等第三方的交互融合。另外一个方向就是与核心技术往云端移植,因为现在大部分的技术在云端,IoT发展起来之后,很多端上面会有云交互的需求,因此整个核心技术往端上移植也是一个大的方向。而人工智能是最重要的,人工智能与大数据融合,对大数据进行分析,这也是未来人工智能与语音的发展方向。
雷雄国透露,思必驰的研发方向与核心就在于人工智能。在多模态交互方面,思必驰也在与第三方合作推动。“我们做过手势识别、图象识别、虹膜识别、体感识别等与语音技术结合的多模态交互。”雷雄国称,未来一定是从单一的输入输出互动形式向多模态交互发展,从被动服务向主动式服务及智能服务方向发展。