近日,竹间智能科技(上海)有限公司(下称“竹间智能”)正式宣布完成1亿元人民币C+轮战略融资。本轮融资由申能诚毅、广发信德、朗玛峰资本合投,老股东中华开发金控再次追投,而本次融资距离竹间智能上次融资时间相隔不过半年。
也就是说,在6个月内,作为一家以NLP技术为核心,打造标准化平台产品并率先上云的创业公司竹间智能,已经成功累计获得3亿元人民币的融资。
那么,竹间智能怎么就能在短时间内屡受资本市场青,连续拿下两轮融资的呢?
竹间智能由前微软(亚洲)互联网工程院副院长简仁贤于2015年创办,是国内少数具有语音、语义、图像全场景多模态人机交互技术的企业。
其以自然语言处理(NLP)、知识工程、计算机视觉、多模态情感计算、深度学习等AI技术为基础,为企业提供一站式人工智能标准平台产品及解决方案,助力企业实现智能化转型。
而竹间智能近6年来深耕的NLP正是人工智能的重要技术领域,也是目前人工智能产业最难攻克的技术之一。
图丨竹间智能创始人兼CEO简仁贤
用NLP打破“人工智障魔咒”,准确率是硬道理
我们经常看到#人工智能有多智障# 、#人工智障图鉴# 等词条频频被怼上热搜。专家口中的人工智能会在10年内代替人类,电影里面的人工智能正在密谋接管世界,可现实生活中的人工智能,却答非所问、指鹿为马。究其根本原因,无非是技术不过关。从NLP的角度来讲,技术的深度、广度,直接决定了人工智能是否具有完备的语言理解功能以及理解后输出的话语到底能否达到真正的智能。大家所碰到的“人工智障”更多是披着人工智能外皮的“假AI”,这样的“假AI”大多采用“关键字”、“死模板“,无法实现对内容的真正理解。
简单点理解,NLP让人与计算机之间以自然语言进行有效沟通、通信。要实现人机交流,就需要彼此“懂”,而NLP就担当了搭建机器语言与人类语言之间沟通桥梁的重任。
早期的语言处理系统,如SHRDLU,当它们处于一个有限的“积木世界”,运用有限的词汇表会话时,可以工作得相当好。但是,一旦把这个系统拓展到充满了含糊与不确定性的现实世界中,问题也就随之而来。
打个比方,“我们把香蕉给猩猩,因为它们饿了”和“我们把香蕉给猩猩,因为它们熟透了”有同样的结构。但是代词“它们”在第一句中指的是“猩猩”,在第二句中指的是“香蕉”。也就是说,如果人工智能不能像人一样理解猩猩和香蕉的属性,就根本无法领会句子的真正意图,从而落实行动。
所以说,面对人工智能的背后“是否真正懂了”的NLP技术时,竹间智能显然成了深藏功与名的“扫地僧”。
早期,竹间智能深耕了短文本NLP能力,研发了包括Bot Factory对话式AI平台和AICC+(AI Contact & Collaborate)等产品,并在围绕情感对话交互,电话机器人、智能客服、语音助手等领域积累下大量技术和经验后,逐步扩展至机器阅读、知识工程等长文本领域,通过Gemini认知认识工程平台应用于知识图谱自动构建、文本审核、对比,智能推荐、搜索等等,极大地满足了企业对于NLP技术更广更深的需求。这些,都是竹间智能通过数百个标杆客户的应用场景落地积累,形成了高度标准化的NLP相关产品与解决方案。
其中极具代表性的正是竹间智能在2021年新推出的以NLP长文本为基础的认知知识工程平台产品“Gemini Cognitive Cloud”。Gemini Cognitive Cloud帮助企业处理海量的文本数据,产生知识,形成用来推理和分析的结构化知识图谱,发挥应用价值。
其中,Gemini Studio流程自动化平台,像个”管家“,业务人员可以用无代码拖拉拽方式自动化构建知识图谱,既可以是应用到特定场景业务的知识图谱,也可以是通用的行业知识图谱。同时,这些知识图谱也可以用来进行业务推理和洞察以及行业的分析。
而Gemini KM更像是“仓库”,它能用来管理企业海量的非结构化文档。文档经由Gemini KM智能知识库的采编流程进入到智能知识库管理系统可以直接进入Gemini Studio,自动构建成可推理的知识图谱后,再将此用于Bot Factory 的对话机器人中,形成端到端的知识链,二者之间相辅相成,产生知识自动化应用的全栈式闭环。
以某大型石油国有企业的文本抽取和查重项目为例,在高举数字化转型大旗的今天,该企业就遇到了难题,一个看似不是问题的问题,却造成了大量人力、时间的浪费。
据悉,该企业有2700多份历史项目文档,而且每年还在以400到500份的数量增加,企业一开始依赖人工进行报告查重,因此不仅对人员专业技术要求较高,而且造成了人工查询效率低下和漏查比例大等问题。所以,如何避免新文档与历史文档重复,避免耗费巨大人力查重,成为该企业的“刚需”。
基于这一需求,竹间智能为该企业部署了基于Gemini平台的解决方案。之前,每100份新增项目文档就需要两个人花三个月时间去完成比对查重。而现在,运用了竹间智能的Gemini认知知识推理平台后,每份新文档的查重仅需要12秒,效率瞬间提升上千倍,有效解决了审漏、审错等问题,流程自动化效率提升50%,信息搜索效率提升80%,并直接带来了运营效率的提升,整体每年人力成本节省200万元。
而且,这些产品在发挥其真正所用价值和作用时,极大程度地保证了准确率。要知道,失去了准确率的人工智能,终究会成为网友口中的“人工智障”。
当然,也只有准确率的提升、耗时骤减、效率提高,才真的带来了人的解放、生产力的解放、让时间更有价值。
竹间智能创始人兼CEO简仁贤就表示:“目前,市场上公认准确率达不到85%是不达标的。但是,我们产品冷启动期就可以达到85%的准确率,加上我们内置循环自学习功能,在实际业务中准确率可以达到92%~95%,而且还在继续提高,所以,随着对于业务解决量的增加,我们的准确率还会更高。”
也正是这样高的“准确率”,竹间智能才有了在业内各类AI应用落地难、AI企业融资趋冷、上市受阻时,还能被资本发现并选择的“底气”。竹间智能对此表示。“市场应该掌握在自己手里,好的产品,总是不乏吸引力的。”
竹间云及一键部署,低运营才能规模化
据悉,竹间智能本轮融资后,将进一步开展“All-In-Cloud”云化策略,以NLP技术为核心所有标准产品全部云化,并推出竹间云。
竹间的“这朵云”中包括了机器人工厂云(Bot Factory Cloud)、AICC+云 (AICC+ Cloud)、认知及知识工程云(Gemini Cognitive Cloud)及NLP云(NLP Cloud)。并致力于将人工智能NLP产品云化,为企业客户带来低代码、低运营的企业智能化软件服务。
举例来讲,如果说微软的 Office 是企业办公的标准软件,用户可以使用其产生大量的结构化与半结构化数据及文档。那么竹间云 Emotibot Cloud 就是企业业务和服务的操作系统。
应用竹间智能自身优势的NLP技术进行充分阅读和处理上述的非结构化数据,形成用来推理和分析的结构化知识图谱,并且还可以处理各式各类的文档,如Word、PPT、Excel、PDF、图片、视频、语音等等。
其中还有“外挂”神器,也是产品的核心特色 “一键部署”。用户只需轻点一下按钮,一个可以支持数百个甚至数千个机器人平台即可迅速完成创建。并同时满足企业公有云、私有云以及混合云的多种部署要求,支持华为云、腾讯云、阿里云、中国电子云、紫光云、Microsoft Azure,AWS等多家云厂商。
面对系统安全问题的日益凸显,不少企业的系统有了“本土化”的需求,因此,竹间云平台也可以支持国产CPU、服务器、操作系统及数据库平台,如海思、麒麟、openGauss、宝兰德BES等。毕竟让企业系统国产化,具备自主研发和维护的能力才是中国人工智能实现弯道超车的必要条件之一。
本轮投资方广发信德项目负责人杨昌泓先生认为:“竹间智能坚持自主研发底层NLP技术,结合高度标准化的产品,大大提升了企业效率,并且通过产品云化一起建立了新的壁垒”。申能诚毅投资总监刘先生则认为:“竹间智能的语义技术和标准化的NLP产品是同类AI企业里的佼佼者。”朗玛峰资本高级合伙人吕宁博先生表示:“竹间智能已经形成了多个标准化平台型的企业级产品,高效的工程化和交付能力获得多个行业上百家标杆客户认可。”
随着数据量的大幅增加,数据和文档的存储和应用已成为业内共同需要面对的问题。据估计,我国每天可产生2.5万亿字节的数据,以神经元计算,相当于2.5亿个人类大脑的海量数据。这些数据、文档又该如何被有效应用?
面对如此庞大的数据体、知识体,人工智能的云化之路似乎已成定局。
根据市场研究机构IDC的数据显示,2020年全球AI硬件、软件和服务产生的收入已达到1565亿美元,比2019年增长12.3%。相关专家预测,在未来11年,人工智能将为全球创造15.7万亿美元的净增量GDP。
其中,AI“语言”虽然得到了长足发展,但人类语言仍是一项独特且深邃的难题,亦是AI技术所面对的最为艰巨的挑战之一。简仁贤就表示,“这是一个不断打磨沉淀的过程,不可能一蹴而就。”
如果说,云是未来的“土地”,大数据是“树木”,人工智能是树木腐化后变成的“石油”。那么,可挖掘“石油”的“NLP泵”什么时候才能尽善尽美呢?相信竹间智能值得期待!
文:达尼亚 / 数据猿