随着人工智能时代的到来,我们越来越依赖AI,从智能机器人到无人码头,从自动驾驶到智慧医疗,都在告诉我们AI应用时代的大幕已经开启。
包括中国在内的世界主要国家都已经把人工智能作为国家战略的一部分,这也标志着未来的智能化趋势势不可挡,但工程院院士李国杰在不久前发表的评论性文章中可观的说:“目前,我国的大学和企业的人工智能实验室大多遇到顶天顶不了、立地又落不下去的困境”。
人工智能关键要素包括算法、算力、数据。如华为、阿里等都在积极布局智能计算,国内以芯片研发为核心的公司也不在少数,智能框架就更不用说。超强的算力,高效的算法成为巨头们必备的实力标签,且资本对于算力赛道更加青睐,相比之下作为AI技术的基础,数据相较于算法研究、算力模型搭建等AI领域的其他工种,似乎一直以来都是略显低调甚至低视的存在。
有数据却不能直接用
目前人工智能的商业化落地,需要大量经过标注处理的相关数据做算法支撑,数据决定了AI的落地速度,可以说数据的数量和质量在AI的发展中是不言而喻的。
但对于人工智能来讲,并不是所有的数据都是有价值的,采集回来的原始数据,往往需要经过清洗、标注、审核、质检后才能应用到人工智能的算法中,其中数据标注(审核)工作是将最原始数据变成算法可用数据的关键步骤,关乎着整个AI产业的基础。在这样的背景下,数据标注与审核行业快速发展起来。
海量数据到AI数据的“距离”
数据服务行业涵盖了数据采集、清洗、存储、标注、训练、模型评估、仿真、数据安全等多个领域,其中,数据标注与审核是机器感知世界的原点。
自动驾驶、医学诊断、智慧交通......AI技术的最终场景应用是集合了众多场景中的AI数据,这背后无一不需要优质有效的AI数据,只有数据越准确,人工智能的应用落地才会有越多的可能性。