人工智能在语音助手、人脸识别等方面的应用越来越普及,而人机交互的智能应用已经落地到更多的细分领域,如智能录音笔、机器人服务等,这一趋势将随着5G时代的到来成为新风口。近日,记者获悉,继AI录音笔 C1 之后,搜狗又推出了升级版AI录音笔C1 Pro,争抢千亿智能硬件市常
据悉,除继续增强录音转文字的准确率以及同声传译实时共享等原有功能外,搜狗AI录音笔C1 Pro又增加了WIFI快传功能,是市面上首款支持WIFI和蓝牙双传输模式的AI录音笔,不断升级迭代录音笔产品正是搜狗积极发展AI智能硬件业务的缩影。
在业内人士看来,基于搜狗输入法以及巨大的搜索用户数量,搜狗以录音笔为切入口参与到智能硬件、智能语音市场领域,将有机会实现人机智能交互方面的颠覆创新。此举不仅拉动整个行业迈入人工智能时代,也为搜狗自身的业务找到了新的增长点。未来,智能交互应用落地细分领域,将成为一大创新趋势。
人工智能加持 突破传统录音笔功能单一瓶颈
除受替代品冲击外,一直以来传统录音笔都存在着功能单一、录音清晰度不高、操作复杂、续航时间短、无法实时检查录音状态等问题,并且产品创新只限于外观改造、扩容等方面,没有突破单一录音功能的瓶颈,使得该行业产品销量增长有限。随着人工智能时代的到来,技术加持下的录音笔行业或将迎来新机遇。
公开数据显示,2017年我国录音笔行业出货量为431.97万台,同比增长仅为0.03%,2018年出货量与2017年基本持平。2015年至2018年,我国录音笔行业产量年均复合增长率为-1.58%,市场仍然呈现供大于求的局面。
面对这种生存态势,众多录音笔厂商也在寻求创新突破。记者从电商平台搜狗旗舰店获悉,最新款搜狗AI录音笔C1 Pro于12月12日正式对外发售,该产品能够提供32GB本地存储+云端存储,录音时间长、待机时长分别可达210小时、40天,其0.3米、2米内录音转文字识别准确率达97%、94%。
据了解,今年3月,基于语言为核心的AI战略,搜狗推出了以语音识别、转写和翻译为核心诉求的智能录音笔C1,已经斩获多个主流电商平台单品总销量第一。
与前代搜狗录音笔C1相比,除具备高清录音、录音转文字、同声传译三大基础功能外,C1 Pro新增WiFi快速传输功能,支持WIFI/蓝牙双传输模式,1小时的录音内容通过WIFI传输仅需1分钟左右。
不仅如此,该产品还新增定制化大尺寸麦克孔设计,叠加搜狗自研AI SmartVoice数字降噪算法,增强了目标声源拾音效果且精准降噪,满足会议、课堂等场景下的使用。同时,其机身新增正面麦克风指示灯,讲话声音过大或靠麦克风太近时会亮起红灯提示。
值得一提的是,在以人工智能技术改造录音笔的同时,近期搜狗还与爱国者、纽曼、索尼录音笔、万城集团联合成立AI创新联盟,对外开放其转写、云端存储等服务,帮助市场上90%的录音笔接入搜狗听写服务,进化为AI录音笔。
易观研究中心分析师何文倩认为,目前市面上做包含智能录音笔在内的语音类智能硬件的企业在语音技术上的差距很小,最终影响用户使用效果的因素,还是麦克风远场收音、语料库的丰富程度等。改进麦克风设计,让录音笔在不同场景都可对噪音进行优化,实现深度精准降噪,并有效提升录音转写准确率。
在业内人士看来,智能录音笔解决了普通录音笔功能单一、易被手机取代等痛点,同时在人工智能时代的背景下,也成为了AI落地应用场景的代表性产品之一。预计未来5年的时间里,满足消费者更多需求的人工智能录音笔,将会带动行业呈现反弹的态势。
布局智能硬件 培育物联网时代新增长点
今年,5G在全国正式实现商用,信息交互的效率得到大幅度提升,智能硬件产品也将迎来爆发式增长。据艾瑞咨询数据预计,2022年全球消费级IoT硬件(智能家居、穿戴设备)销售额将达到1.55万亿美元。在此新趋势下,苹果、微软、谷歌以及阿里、腾讯、百度等国内外企业纷纷入局竞争,在智能录音笔、智能音箱、VR眼镜等智能硬件产品上不断推新。
事实上,近几年搜狗也在不断地发展AI智能硬件业务。搜狗CEO王小川曾在内部信中写到,未来搜狗的战略将围绕AI投入更多资金,强化以语言为核心的AI技术的积累和探索,做AI赋能的创新智能硬件产品,帮助用户在更多场景表达和获取信息。
公开信息显示,搜狗目前主要的AI硬件有搜狗翻译宝Pro和搜狗AI录音笔。另外,搜狗还陆续了推出了AI合成主播等,而这些产品都离不开AI技术的支撑。
在王小川看来,现在人类进入的人工智能时代,并不是互联网、移动互联网时代的延续,而是要让互联网、移动互联网、产业互联网或者IoT,都能够升级成为智能的一部分,让人工智能不仅是一个时代的主题,而是一个高效的工作工具。
搜狗公司AI交互技术中心总经理王砚峰也曾表示,智能硬件是整个搜狗的战略重心之一,随着移动互联网时代逐渐向IoT时代进军,智能硬件已经成为抢占用户入口的最重要渠道,搜狗将会在可穿戴、车载、客厅场景内应用更多自主研发的智能硬件。
财报显示,2017年财年期间,搜狗搜索业务占总营收比例为88%,到2018年第三季度开始,搜索业务的营收占比超过了90%。而今年第三季度,其他收入同比增长25.4%至2666万美元。根据财报披露,搜狗公司其他收入同比增长,主要是由于智能硬件产品销售收入的增加。
互联网分析师丁道师分析认为,搜狗在人工智能方面,搜索和输入法业务让其拥有技术和数据方面优势。双十一期间,搜狗录音笔在天猫旗舰店销量同比增长1500%,京东自营旗舰店同比增长960%,这说明市场潜力很大,需求并没有被满足,因此未来应让新产品更快的落地应用,然后在过程中不断完善。
智能语音市场将破千亿交互应用加速落地
当手机广泛应用的触控或者更古老的物理按键式交互无法满足交互新需求时,基于AI的语音助手成为了智能手机的标配。据Research and Markets研究报告显示,全球语音市场规模将达191.7亿美元,折合人民币约1400亿元。
事实上,智能语音是人工智能技术的重要组成部分,包括语音识别、语义理解、自然语言处理、语音交互等。而伴随着物联网的发展和5G时代的到来,使用范围更广、使用方式更友好的智能语音或将成为下一代人机交互的发展方向。
目前,智能语音技术在整个产业链中起到了承接的作用,并在智能家居、可穿戴设备、机器人等行业落地。除智能录音笔外,搜狗还有诸多人机交互方面的探索,搜狗分身技术正是其中典型代表。
据了解,搜狗“分身”技术是搜狗自主创新的AI多模态合成技术,仅基于少量音视频数据,即可快速迁移生成AI分身模型,并展现出媲美真人的信息传达效果。早在2018年11月,搜狗就基于此技术推出了全球第一个全仿真智能虚拟主持人“AI合成主播”。
关于语音交互技术能否突破当前局面,王砚峰认为,不管是手机还是智能音箱的语音交互,都是朝着人机交互方向发展。未来,智能硬件产品都可以通过视觉观察周围的环境,从中提取信息并在交互的过程当中表达出来。
在互联网分析师刘鸣看来,语境理解能力对于录音转写的准确度影响很大,而5G有助于语音类智能硬件更好地理解语境。除此之外,基于5G技术的落地应用,搜狗等公司研发的智能语音产品将给用户提供更好的反馈信息,以及更准确搜索的结果。
在业内人士看来,基于搜狗输入法和搜索,搜狗积累了大量有效数据,这是其在AI时代最宝贵的财富。将人工智能技术应用于录音笔,拉动整个行业迈入人工智能时代。