AI技术或许是工业4.0时代的核心,而AI概念自推出以来已历经多年,进步到底有多少?智能家居的大范围推广就是一个非常明显的印证,但是在所有硬件背后,必须要有最为核心的那一步,即人机交互,简单来说就是对机器说出指令,让机器听懂人话是一切的前提。这个指令在某种意义上就是如今各种输入法,因为从文字到语音,输入法将主导人机交互,尽管如今的输入法依然仅仅只是在手机端,不过未来的输入法一定会出现在各种智能场景中,即人机交互。
作为国内较早布局AI领域的厂商,百度在输入法方面也投入了很多AI技术,显然百度清晰地认识到输入法对于未来各类对话场景的强烈需求。笔者近期也体验了一下最新的百度输入法,坦率地说,在全面了解和使用了百度输入法之后,笔者承认许多功能足以让你事半功倍。
如今的百度输入法已经进入官方定义的“AI全感官输入2.0”时代,除了普通的键盘输入之外,还增加了语音输入、手写输入、表情输入(AR表情)、动作输入(凌空手写)等多种输入方式,交互的方式相当丰富。由于功能确实太多,笔者会挑选一些个人觉得比较有趣有意义的功能来分享,一起来看看吧!
语音输入:多种输入模式,离线语音是亮点
坦率地说,笔者认为语音输入已经是如今AI领域的必争之地,各类录音笔设备不断推陈出新,而背后的资源库(或者说云技术)是核心,百度输入法的语音输入包括普通话、多种方言、中英日韩互译等,还支持长文本输入以及轻声识别。
以上是笔者尝试的多语言的输入,简单的语句基本没有问题,笔者使用的一周多时间内,错误的几率挺低,即便笔者还略带口音。
长文本输入方面,笔者尝试了下,中文输入几乎没有错误,只有标点符号位置不对,整体影响不大。
百度输入法还支持离线语音,不过我试了下目前只支持普通话离线语音或者中英自由说,上图就是简单实测结果,整体来说离线语音效果还是不错的,虽然当下和未来场景中没有网络的情况是较为少见的,但是考虑到一些极端场景,离线语音资源包的实用性会显得极为有用。
离线中英自由说的状态下,百度输入法的界面右下角还会出现“离线语音”的提示。
轻声识别在不方便语音的场景下可以使用,例如:公司会议期间;跟对方说比较“隐私”的话题;公司午休,怕打扰别人休息等,实测了下效果不错,基本上也没有出现错误情况,也就是标点符号应用的不正确,可能是因为语气停顿时间过长问题。
此外,语音输入还支持斗图模式,对于喜欢时尚的年轻人而言,合适的图片会提示聊天的趣味性,上图就是笔者尝试的语音输入之后显示的斗图,是否比较有趣?
语音助手:语音输入的媒介
语音助手是人机交互的一个媒介,或者说是用户对话的对象,亦或者可以定义为用户意愿的执行者。毫无疑问,当一个听话且办事准确快速的“管家”出现,用户的心想之事就能更快实现。百度输入的语音助手是“小度小度”,通过小度可以进行文本修改和撤销等,例如上图将“九点”改成“八点”。
另外,修改后的文字还会以“蓝色”提示。
事实上,语音助手在当下市场中并不少见,但是在输入法中加入语音助手确实相当有趣且有用,正如笔者文初所述,虽然如今输入法最多的使用场景是智能手机,不过在未来市场中,输入法一定会出现在各种其他场景里,彼时语音助手就是一个非常重要的媒介,百度全面布局AI的意图已经相当明显。
智能预测:高效提高输入效率
智能预测是一个小功能,但是笔者认为这个功能相当有用,可以提高文字输入效率。关于这一功能的实际使用,笔者尝试了购物和游戏两个场景,比如游戏中输入“我开大”,百度输入法会智能预测“你们就上啊”。
而在购物场景中,输入“请问”会智能预测“发什么快递”,总之各类智能预测对于输入有很明显的帮助。不过,目前智能预测仅支持文字输入,期待后续语音输入也可以支持智能预测。
百度输入法AI时代折射未来
AI时代已经全面降临,而AI技术带来的一些商用功能已经显著改善着普通消费者的生活,百度输入法就是其中之一,AI赋能的优势相当明显,简化输入方式、优化输入效果、甚至智能预测输入,多重功能之下,输入会变得更加简单快捷。然而,这只是百度布局AI的冰山一角,未来百度还会将AI技术更多地投入市场,各位小伙伴会期待哪些突破呢?