AI大模型正在给高度复杂且保守的核电行业带来新变革。
近日在无锡举行的首届山水东路科创谷创新合作论坛期间,中国广核集团福建宁德核电有限公司(下称宁德核电)人工智能实验室负责人王澍向澎湃新闻介绍,该公司于今年3月发布的“锦书”核工业大语言模型,是目前在全球范围内参数量最大的核工业预训练大语言模型,主要具有AI讲师、知识库管理、人才管理和人因预测四个方面的功能,预计在2025年年底投入生产领域普遍应用。
公开报道显示,“锦书”大语言模型拥有中国最大的核工业大模型语料库,训练语料超过20亿token,涵盖了核运行、核物理、核燃料、水化学十余类通用核工业语料以及规程、系统设计书、经验反馈单等十余种工作文件语料。“锦书”旨在探索利用AI大模型解决核电行业面临的各种挑战,如知识管理不足、低脑力劳动过多、安全分析能力有待增强等。
此外,宁德核电团队首次开发出适用于核工业的专属Nuclear-embedding-v1-base-cn词向量模型和Nuclear-reranker-v1-base-cn模型,在由50万条向量数据构建的nuclear benchmark数据集上展示了卓越的性能,top1召回率超过88%,top2召回率超91%,top5召回率超过95%。
核电厂的生产现场涉及36万种不同类型的设备,基本同时运作。与此同时,核电行业奉行“凡是没有被证明安全的,一律认为不安全”的安全观。如果AI大模型能在如此严苛的场景中被验证可行,其经验将为该技术在其他工业领域的应用带来极大的借鉴意义。
“机器比人更可靠”,这句核电运行安全谚语背后的现实是,人因失误长期以来被视为影响核电站安全效能的决定性因素之一。不光核电,军事装备、航空航天等复杂工业系统领域也一直高度重视人因研究,并制定了相关标准规范。
王澍称,大模型的出现,使核电企业探索“人因预防”到“人因预测”成为可能。传统的人因失误预防方法主要依赖于事后分析和规则制定,随着大数据和人工智能技术的迅速发展,核电站安全管理有望迈入一个新时代从被动的事后应对转变为前瞻性的风险预测,实现人因预防到人因预测。
核电数字化探索,离不开产学研协作。
王澍向澎湃新闻表示,目前,实现科研成果产业化、“打通从实验室到市场的最后一公里”,主要存在两个痛点。
第一个痛点是技术成熟度的理解偏差。高校和科研院所往往根据一项科研成果在实验室环境下的表现判断技术是否成熟。但在业界看来,科研成果到实际商业应用的落地需经过进一步中介实验的验证,这一环节的缺失导致科研成果和商业应用的落地之间存在鸿沟。
第二个痛点是双向人才机制的缺位。行业内长期存在着“理性人”假设,即认为科研人员能够完全听懂业界人员的需求。但在实际操作中,既懂工业又懂新技术人才的缺失,使得学界与业界的沟通过程并不通畅。建立“双向奔赴”的人才机制迫在眉睫。
为此,宁德核电与浙江大学理顺合作机制,推出了核工业大语言模型“锦书”。
在反复磨合中,宁德核电探索出一条高效的产学研合作之路:由企业来把控专业团队的组成,促进科研人员和企业技术人员的交流;建立由企业主导的产学研关系,院所与企业在前期的研发过程中进行对接,从企业需求出发定制个性化研发方案;与上海技术交易所合作,打造开放性的科研平台,充分整合社会资源。
王澍认为,此次论坛将在人才培养和知识产权确权确价两方面为“新质研究”转化为“新质生产力”提供助力。一方面,AI大模型在核电等垂直领域的应用需要大量复合型人才,而复合型人才的培养对一家企业来讲成本过大。无锡市委和上海技术交易所协同搭建的资源交流平台有助于节约人才引进成本,促进AI大模型在全核电行业的推广。
另一方面,论坛还有助于实现知识产权的确权确价,实现多方共赢。王澍认为,AI大模型这一技术具有特殊性,不仅技术前沿,且在企业间具有可复制性。此次论坛基于区域科技的发展制定相匹配的制度,有利于“锦书”大语言模型在核电发电企业自身获利的同时向全产业推广,实现各方互利共赢。