人工智能已经成为了全领域的新趋势,无论是天天能看到的新闻头条APP,还是我们生产中所接触的机器,都在不断地提升智能化。而在汽车产业中,除了生产线上能够提升效率的代替劳动密集型工作的机械智能化之外,最贴近我们生活的,就是车载系统的智能体验。其中语音识别是最关键的一环,它就是人工智能的起点、源头,懂得理解驾驶者的意图,才能更好地进行服务。
有人说语音识别其实并不难,现在的主流车型已经把语音识别做得很高端了。但其实在实际使用中,无法连续对话、无法识别有效指令、无脑识别内容等等,都是很困扰车主使用智能化的问题。目前来看,人工智能没有天花板,可做的东西还有很多很多。作为走在智能化道路上的先驱,小鹏汽车推出的Xmart OS 2.1.0版本的全新系统,作用全球首创全系统功能覆盖、全球首创全场景连续对话、全球首创语音形象&技能等能力,最大程度上解决用户车载交互需求。豆哥通过实际场景的试驾,发现小鹏的新系统真的把语音识别玩上了天:
连续对话
小鹏Xmart OS能够持续倾听无须重复唤醒,每25秒最多达10个指令。意思是,在唤醒了小P之后,能够连续不间断地识别有关指令和非指令的语音,比如说,跟小P说“打开车窗”,P7会执行动作,接着车主还能继续跟同行人员进行交流,小P会自动识别和理解车主的语音内容,而说到“我想听周杰伦的歌”,小P又会自动打开音乐库里的相关音乐进行播放,实现连续对话。在豆哥看来,连续对话背后还展示了更多的小P的高精度语义理解能力。
语义打断
语音对话中,有效指令可随时打断小P进行下一个步骤。同样是体现出语音识别的高精度,意思是,在与小P的对话中,比如说,“今天的天气几度?”,在小P进行回答的过程中,再发出一个指令“那北京的呢?”,小P会立马识别并理解车主在询问“北京的温度是几度?”,会立马切换到回答北京的温度。如果是换着其他的车机系统,需要不断地发出启动指令,比如说“你好,XX”,并且无法结合上下文的问题进行回答。语义打断功能很方便,而背后能够看出小P的语音高精度识别能力以及上下文人性化理解能力。
语义拒识
小P倾听时,不是对小P说的指令,小P不会执行。在平常的使用中,很多车机系统都会识别到很多无意义的内容,然后会回答“不好意思,我暂时还不会这个功能”,表面上看是语音识别的能力有限,实际上是对于内容是的识别能力太差。语义拒识,其实是对语义内容的甄别能力,哪些是对小P有用的,哪些是无意义的内容,是需要大量的数据进行训练,小P这一次做的更加完善。
可见即可说
屏幕上显示的文字内容,只要对小P发出相应的指令,就能直接执行。比如说,车主想听音乐,小P听到指令会打开酷狗,在酷狗里会有“经典老歌”的歌单,车主只要说出“我想听“经典老歌”的歌单”,小P会自识别屏幕中显示的“经典歌单”。也就是系统显示屏上显示的内容,都能直接执行。有别于其他的固定识别语音的能力,小P能够灵活应对各类场景,智能化很高。
通过以上四点的体验,解决了上文所提及的现有车机系统中的问题,而深入之后能看到,小P系统语音的高精度识别能力,语义识别分析能力,能够更明确地认知车主的意图,不误解、不曲解,并能迅速反应,着实给到车主不一样的惊喜。已买到P7和G3i的车主朋友们,只要点击升级就可体验到以上的智能化系统,还不赶紧试试?