“我们作为技术公司,技术必须保持一流水准,对技术的发展方向我们不能踩错点。”
“对于技术型的创业者来说,一定要走出技术本身。创业我们不能‘成于技术又败于技术’,因为技术在整个商业链条里只占三分之一。”
云知声智能科技股份有限公司董事长兼CTO梁家恩
2022年11月底,ChatGPT的横空出世震撼世界。虽然一直在关注GPT的学术论文和研发动态,但真正看到机器对人类抛出的问题应答如流,云知声智能科技股份有限公司董事长兼CTO梁家恩仍然有刷新认知的感觉。他意识到这是自己研究人工智能25年来行业里最大的技术突破,重要程度超越了当年深度学习霸榜ImageNet和AlphaGo打败李世石。
半年后的2023年5月,云知声“山海大模型”发布,并展示出了语言生成、语言理解、知识问答、逻辑推理等通用能力。云知声表示,未来将以山海大模型为基础,打造MaaS(模型即应用)模式的解决方案,增强物联、医疗等行业能力,目标是山海大模型年内通用能力比肩ChatGPT,并在医疗、物联、教育等多个垂直领域能力超越GPT-4。
人工智能独角兽企业云知声成立于2012年,以智能语音识别、自然语言理解、知识图谱等全栈AI技术为核心,面向智慧物联与智慧医疗两大领域提供以对话式AI技术为基础的产品服务与综合解决方案。梁家恩为云知声创始人、董事长兼CTO,模式识别国家重点实验室专委会委员。2019年开始,梁家恩带领云知声科研团队多次参与国家重点研发计划“科技创新2030”新一代人工智能重大项目,并以全球首款面向物联网的人工智能芯片研发技术获得了“吴文俊人工智能科技进步奖”,大规模知识图谱的医疗行业应用获北京市科技进步一等奖。近日,上海长三角商业创新研究院与复旦大学管理学院联合主办的知新工程“三尺讲台计划”中,以云知声的企业发展作为了实战案例样本。梁家恩表示,“我们认为通用人工智能的时代已经到来了。”
大模型打开了10倍以上商业天花板
ChatGPT的出现,让梁家恩意识到,“大模型+大数据”的威力在过去被低估了。无监督预训练大模型通过指令调优和人工反馈强化之后表现出的通用智能潜力,较之以往出现了重大的范式变化,是云知声此次下定决心攻克大模型的关键。
“过去10年,所有的智能系统都要先定义一个特定的目标,再去收集足够的相应数据来优化模型和解决问题,现在你已经无需定义一个特定的目标了,机器可以通过无监督预训练学习到足够强的语言和知识,从而在少量样例情况下学会解决各种问题,并与人类规范对齐。”梁家恩表示,“大模型的框架已经改变了一种范式,所以我们不能还停留在过去的框架思考问题,技术框架必须做迁移,这是我们下定决心做大模型的关键点。”
梁家恩介绍,山海大模型希望能先构建通用大模型的强大基础能力,然后将其应用在云知声专长的医疗、物联等特定的行业场景中,提升大模型的严谨度,让其能够有效解决行业问题。
梁家恩举例介绍,过去AI用于医疗场景时,只能等医生写完病历后审核病历里面有没有问题,用于给保险理赔时判断用药和操作规范,审核报销和保单等,这在计算机领域属于判决式的问题;也有医疗版语音病历录入,但只能医生说什么写什么。有了大模型框架之后,这个领域就能拥有生成式的能力。类似于自动生成会议纪要,并为纪要自动做摘要和翻译的功能一样,医生只需输入很少内容,比如病人的血压值,后面的东西AI就可以自动补全。在医生和患者对话的过程中,大模型就可以自动提取有效信息,并自动生成病历。
“大模型应用在行业之后,产品的智商会更高,灵活度更强,也能做很多过去做不了的事情,帮我们释放更多受限于技术的潜在用户需求,”梁家恩感慨道,“大模型为我们打开了商业天花板至少10倍到百倍的空间。”
从技术到产品规模化十年探索
“今天我们有资格说自己能追上大模型的浪潮,也是因为2016年看见AlphaGo的时候,我就觉得大计算一定是未来的趋势了。”梁家恩向澎湃科技表示“技术肯定是我们的根据地,我们作为技术公司,技术必须保持一流水准,对技术的发展方向我们不能踩错点。”
云知声最初是一个算法团队,但为了让产品能够规模化落地,逐步涉足硬件和芯片。之后为了解决行业性问题,把技术能力拓展到知识图谱和超算平台。梁家恩表示,“这些都是超出我们最初的能力范围的,但我们必须去做,这不是我们主观给自己增加难度,而是客观上就需要把链条补齐,才能有效解决行业问题。”
入局研发大模型并不是云知声第一次做出的重大战略抉择。2012年刚创业时,云知声便在To B(企业服务)和To C(消费者服务)的赛道抉择之间,选择了To B,从此为行业伙伴打造智能化产品和解决方案。梁家恩发现,语音交互放在手机上,不砸钱推广就没人会用,活跃度不足2%,但放在智能电视上,不需要推广活跃度就可以保持在30%-40%。
物联网的产品化并不容易,应用场景差异很大。梁家恩介绍,云知声的语音交互在手机上做的已经不错,所以他一开始觉得用于空调的语音交互两个月就能完成。但实际上,把设备放在三五米之外,噪音和信噪比的差别很大。“我们一方面要扩展麦克风阵列的能力去降噪,另一方面还需要成本可控,”梁家恩表示,“这里面前后磨了我们一两年的时间,才达到可量产的软硬一体远场交互方案。”物联时代的到来,意味着联网能力提升,交互成本降低,于是云知声开始布局“云端芯”战略,希望能够接入更多的设备、用户和场景,也面临更复杂的应用问题。随着业务的发展,公司需要构建完整的智慧物联解决方案,自主研发智能交互专用芯片,以降低规模化拓展的成本。
2016年,云知声团队意识到,光把智能交互问题解决,还不足以构建足够的商业空间,需要真正解决行业深层问题,才有更大商业价值。于是,开始构建超算平台和行业知识图谱,并在医疗垂直领域解决业务深层问题,“医疗是我们见过的最严肃的应用场景,知识密度非常高,如果能拿下这一领域,对我们的技术来说也是一个制高点的掌握。”
项目成功了之后能不能规模化,同样也是云知声面临的一大问题。梁家恩介绍,“我们在做医院的时候,第一、第二家医院做的都还可以,但如果迁移到不同的医院,就会遇到差异化问题。不同医院的底层系统都不一样,关注的业务重点也不一样,医院水平层次各异,有的是综合医院,有的是专科医院,这些都是都会影响我们规模化的关键点。”
在对技术推崇之余,梁家恩同时也强调了产品化的重要性,他表示,“产品化能力才是商业上能不能规模化的关键。大家不会为技术买单的,只会为产品买单,技术是我们的根基,但我们也会把我们的技术优势通过工程优化和应用抽象,转化为产品优势。”
创业不能“成于技术又败于技术”
梁家恩本科毕业于中国科技大学,在中科院自动化所获得模式识别与智能系统专业博士学位后,留所负责语音识别核心技术研发及其产业化,在国家863语音识别核心技术评测中多次获第一名,并带领团队在广电、安全、教育等领域实现智能语音技术的产业化应用。
“我一直希望能够学以致用,把学的知识能在产业里面应用起来,而不只是发一些论文,做一些评测。”对这段经历,梁家恩这样表示。
2008至2010年在中科院工作期间,梁家恩所做的最大的语音识别项目是成功将机器评分应用到了江苏省全省和浙江省温州市的中考英语口语考试之中。梁家恩介绍,这是国内第一个能大规模应用的AI评分场景,覆盖了百万级的考生。项目很有影响力,也贴近民用,适合市场化。但在当时的中科院体系中,这个项目很难商业化,因此2010年梁家恩便从中科院跳槽去了盛大创新院,随后又离开盛大开始创业。
虽然已经创业十余年,但梁家恩还是一直以“理工男”和“技术人”自居,他向澎湃科技表示:“我的兴趣爱好还是一直在技术上面,通过技术创新解决产业关键问题是我最大的追求。我们4个创始人都是AI领域博士,现在只有我继续坚守AI技术研发,其他合伙人都已经转型,去解决AI技术产业化闭环上的各种业务问题,共同打通商业化闭环。”
“对于技术型的创业者来说,一定要走出技术本身。”对于创业以来的转变,梁家恩表示,“创业我们不能‘成于技术又败于技术’,因为技术在整个商业链条里只占三分之一。所以,首先要在思维模式上把技术放到整个商业闭环的逻辑里去考虑,从而去布局我们的整个技术、产品和商业化体系,不能只考虑技术环节的局部优化。第二就是在复杂的商业闭环中,需要考虑更多人的因素,包括内部和外部的人,人理顺事情才能理顺。AI技术的商业化闭环链条是特别长的,需要大家统一目标,明确职责,有效求同存异和分工协作。”