一、AI数据:产业生态圈
中游厂商提供数据开发与治理服务,助力AI应用高效落地
AI基础数据服务与数据治理产业链结构为:1)上游:数据源与数据产能;2)中游:数据产品开发工具与管理服务;3) 下游:人工智能应用。处于中游的两类服务商中,AI基础数据服务商使用数据采集与标注工具处理图片、语音、文本等非 结构化数据,面向AI的数据治理服务商则负责使用数据治理的各组件管治多源异构数据,使其形成数据资产,从而提高数据质量。二者处理后的数据可直接为下游的AI训练所用,使AI应用落地能够省时省力。
二、数智融合产业带来多元厂商参与
数据治理与AI应用开展交汇融合,厂商参与更加丰富多元
依托于数据与AI模型的紧密关联,数据治理与AI应用产品已逐步开展交汇融合,展现“由数据治理到开发AI应用平台/产品”与“AI应用平台/产品开发到面向AI的数据治理”的两路发展方向:1)数据治理厂商在积累数据经验与AI模型理解后,为实现业务拓展而将领域从数据层延伸至AI应用及平台开发层;2)从事AI应用及平台开发的AI厂商,也会在数据治理经验不断丰富的背景下,着手向底层开展面向AI的数据治理业务,依托于自身AI技术与业务理解,让面向AI的数据源更加契合AI应用模型要求以提升模型拟合效果。因此,面向AI的数据治理从业者不仅仅为数据治理厂商,更包括众多AI企业,参与者更加丰富多元。
三、数智产业生态圈的受益节奏
三方阵营厂商构建行业竞合格局
AI应用的加速落地带来的大量数据治理需求,吸引众多厂商参与其中。从行业厂商类型来看,主要包括咨询公司、数据服务相关提供商和人工智能产品提供商三类。各类厂商根据自身业务特点和切入方式获得差异化的竞争优势,而由于面向人工智能的数据治理服务的参与立足点丰富,厂商之间可能基于同类业务展开竞争,同时在差异化领域进行合作,形成竞争与合作高度共存的行业格局。
四、数智产业生态圈的参与立足点
“智”为面向人工智能的数据治理服务的核心立足点
面向人工智能的数据治理服务常包含于数据服务、平台能力和数据产品三类采购形式中。
第一类,数据服务即以单独的数据治理产品形式出现,但由于面向人工智能的数据治理尚未发展出成熟独立的产品模式,因此以该类形式出现的业务涉及较少。市面上大多数据治理服务仍以传统数据治理的形式存在,对于已搭建AI中台或AI应用较为广泛的智能化转型先行企业,会在数据治理产品采购方案中添加对支持AI应用数据的治理需求;
第二类,数据平台,主要包括大数据平台、数据中台、数据仓库和AI能力平台等项目。大体量大数据平台、数据中台和数仓项目多会包含AI应用体系建设,从而涵盖部分对应的AI数据治理服务。另外AI平台/中台可沉淀面向AI的数据治理能力,将其标准化后纳入平台模块和产品项目中;
第三类,数据产品,范围限定在应用AI算法的数据产品,可划分为机器学习产品、自然语言理解产品和知识图谱三类AI产品。
为保证AI算法模型的优质运行效果,更好地提供预测、决策、推荐和风控等产品功能,需要对算法模型的训练原料,即支持AI应用的底层数据,进行针对性优化治理。如今AI产品需求旺盛,AI开发平台陆续推进AI产品的规模化落地,且AI数据治理效果与最终平台产品交付效果紧密相连,AI应用驱动成为面向人工智能的数据治理服务的核心立足点。
五、面向人工智能的数据治理:行业规模
2021年市场规模约为40亿元,预计五年后规模突破百亿
从数智产业圈的参与立足点出发,艾瑞提取测算了大数据平台、数据中台、AI应用与数据治理服务的项目中与AI应用相关的数据治理规模并加总而得,2021年中国面向人工智能的数据治理规模约为40亿元。受数据平台服务、数据治理服务和AI应用建设的需求推动影响,面向人工智能的数据治理规模将持续上升,2026年规模突破百亿达105亿元,2021-2026CAGR=21.3%。2021年,中国的数据治理市场规模约为121亿元。作为数据服务的基础工作,数据治理规模将保持上扬态势,预计2026年市场规模达到294亿元,2021-2026 CAGR=19.5%。从发展曲线来看,数据治理与面向人工智能的数据治理规模增长均处于良性区间,共同巩固相关治理产业生态圈的向好形势。
六、面向人工智能的数据治理:时机路径
契合客户的数据基础和AI应用需求的多元化选择
从数据基础的维度划分,可将企业分为数据原生企业与非数据原生企业。数据原生企业以互联网为代表的数据原生企业,在设立之初则以数字世界为中心构建,生成以软件和数据平台为核心的数字世界入口。该类企业往往不需要信息化、数字化转型,所要做的即为让数据共享流通的规范式管理。非数据原生企业成立之初以物理世界构建,围绕生产、流通、服务等具体的经济活动展开,天然缺乏以软件和数据平台为核心的数字世界入口。为了更好挖掘自身企业数据价值,非数字原生往往需要进行企业的数字化转型,需通过数字化转型程度与数据治理阶段判断非数据原生企业的数据基础优劣。最终,结合企业数据基础与AI应用需求为面向人工智能的数据治理的体系搭建提供契合路径,完成企业数据体系的进一步升级。