【编者按】本文整理自零点有数董事长袁岳博士基于零点有数在算法领域上的探索,在“2020世界人工智能大会”上的发言。
今天我不仅是讲算法,而是讲算法的产业化。如今人工智能已经构成了一个巨大的产业,人工智能领域中间产生了领先企业、配套企业、跟随企业、应用企业。在人工智能的三个要素中,数据行业已经构成了行业化,有规模的企业和规模的投入,我们讲的大数据、数据源领域实际上就是指以数据源为核心开展的开发工作,上海是比较早在政务领域开展数据整理、汇融、开发、开放的地区,在商业领域中,上海拥有大量的互联网企业,尤其是互联网服务企业,所以在大数据的应用开发方面也走在了前面。算力也形成了一个规模的行业,但是算法在今天得到的重视程度依然不够,还没有真正行业化的发展。今天我们探讨的算法,的确在整个人工智能行业中间是一个非常重要、值得强调的因素。
算法本身不是很新鲜的东西,但算法决定了我们的商业机会和成败。从人的学习过程中可以看出最早的学习是从模仿开始,然后人会形成独立的想法,有了想法之后便开始实践,其中一些好的做法反复实践构成了经验,经验进行抽象可以建模变成模型,模型进一步构建为一个可以自动化计算的软件化模式,就构成了算法。人类从一个小孩去学习到最后脑子很灵光,看到一个东西马上就能反应出来的过程,其实就是自动化的算法,无论从个体成长还是文明发展的角度来说,本身是一个很自然的过程。
算法告诉我们为了解决一个问题,可以把过去的经验、模式、做法变成一系列指令,使你不需要按照传统的工作模式去做。举例来说,我们如何让3000家连锁店都能做到最好的100家的做法,我们把最优秀的100家连锁店好的做法数据化,然后把数据应用起来,把100家的优秀做法变成指令,让另外3000家门店在不需要学习、不需要培训的情况下,直接按照指令行使就可以达到中等以上的经营水平。它用算法来进行管理,是以智能指令为特点的。
算力也非常重要。因为有巨大数据量的时候,如果用传统的方式计算运行,服务器是转不动的,机器学习以上海为例,有几万个群众打进“12345”的电话,当我们需要把热线数据知识图谱化,让机器去学习的时候,机器可以24小时进行学习,但是我们传统的服务器转不动,一定要在云端用云计算的方法才可以带动计算,所以算力非常重要。但是解决算力的最终目的是为了达到我们的目标,无论是工业领域、政务领域还是商业领域,算法才是我们人的应用目的。
算法听起来很悬,算法到底是什么样的东西?首先,算法的分布模式:算法将来的载体不光是我们想象的那样,好像是一个看不见的公式,没错,它现在是一个公式,它现在既可以放在网络端,也可以放在设备里,也可以放在互联网或者是物联网里面,比如机器人里面就嵌入了算法的硬件,所以算法是可以分布在各个不同的载体上的。其次,算法应用的领域非常广泛。从行业上来说非常广,另外从微观生活、中观生活和宏观生活当中都有算法的存在,比如上海推的政务一网通办。将来每一个领域都将有一串算法来解决这个领域的问题。
算法大致可以分成三层:基础算法、通用算法和行业算法。基础算法是从大量的网络开发经验中间提炼出来的,所以一些互联网公司贡献得非常多。在这个基础上开发通用算法,比如人脸识别。然后在基础算法和通用算法的模块中间,针对某个领域的特点问题开发垂直的行业应用。比如现在因为疫情原因,加上上海到处搞传感器探头,小偷就很难做生意了,于是小偷转行去做诈骗,所以诈骗是增长最多的违法犯罪活动,以前四到五个月才会出现一波新的诈骗形式,但是现在几天就可以出来一种新的诈骗方式,我们要通过算法反诈骗,新型诈骗方式在网上一旦冒头,就能快速识别、快速干预。把技术运用在解决一个特定问题上,这就是行业算法的发展。目前来说,行业算法是目前我们最有机会大规模发展的领域。
算法到底是什么神奇的东西呢?其实算法也不神奇,一个老警察要退休了,他抓罪犯的方法就随着他一起退休了,但是他有很棒的经验,这种经验你让他总结出来,就能够作为算法构建的基础,能够开发出很多东西。把他总结出来的经验和技术实现的能力,两相结合构成了模型,而我们通过数据训练集不断地优化,最后形成算法。从这个意义上来说,算法就是业务经验和技术实现的整合,很多普通人都可以去实现。
一个智能化领域是如何构成的?无论是政务、城市运行、警务还是产业,下面可以细分成更多的垂直领域,警察可以分很多警种,每个领域中间有很多具体的场景,这就是一个社会的样子。比如未来在工业领域中间,控制机器人或者生产流程等等,每个领域都会有大量的垂直应用算法的使用,这就是未来数字社会的样子,我们感知的就是机器智能在算法中间的表现。
当然,我们今天讲的信息技术的时候,无论是什么技术,无论是硬的、软的还是新型网、新型设备,基本上都是以算法的高地作为核心。算法不仅仅重要,还有明显的优劣。美国在四年以前通过了算法责任法,就是说你说这个算法很棒,那就用这个算法,结果搞砸了,那算谁的?某一个领域可以有大量的算法,实际上用不同的算法产生的成效是不同的,你要对你推荐的算法负责,所以有算法责任。在英国议会中间也通过了算法治理的法案,对算法的开发、算法的应用、算法的责任提出了明确的要求。
今天很多地方会建设人工智能产业,会推动云计算的发展、大数据的发展,但是很少有地方讲我们要推动算法的发展,而且没有相关政策,也没有专项的资金投入,算法领域中间也没有真正的人才。构建算法产业就说明我们要围绕算法有专门的奖项来让你们知道,它是人工智能上的明珠,让算法有足够的亮度;为了吸引人们成为算法领域的创业者,要有算法孵化器;算法应用者联盟各个领域都会用,因为只有有应用场景才能转化为算法;一些研究者或有经验的人要能够进行分享,要建立算法的政策丛,从人才政策、投资政策、税收政策等等培养真正搞算法的人才;大学讲大数据课、计算机课,基本上没有算法课,我们希望有讲基础算法的课程。
最后,算法的八大命题,算法应该干什么?
第一,在数字新基建达到了当前水平后,算法水平已然成为智能经济的瓶颈与突破关键,算法是最具备凝聚活跃技术创造力、逻辑构造力、经验洞察力的创新领域;
第二,算法来源于想法尤是活跃的好想法,但算法作用于做法尤其是持续的最好做法。
第三,数据与算力取决于掌握核心资源的巨头,而算法则可能有丰富多彩的创造者。
第四,算法有优劣,优质算法等于业务技术逻辑和强大开发能力的组合,并在持续的训练应用中优化。
第五,算法将数据完成了优化的逻辑处理,具有自动化应用的最大优势,从而内置于系统,赋予工作系统以更新的能量。
第六,重视知识图谱的价值,借助于知识计算引擎,知识图谱的持续开发使应用算法具有机器学习与深度学习的垂直提升能力。
第七,算法池的大小和算法配置高低,显示出了智能化生产力和管理力的水平高低。和人工智能水平的真正高低就看有多少算法,有多少高智商人才的道理是一样的。
第八,丰富应用算法将赋予政务和商业以更大的活力,并因此而建立优化和创造新通用算法和新基础算法的条件。目前,国内对通用算法和基础算法做出的创新贡献很小,我们的方法跟我们很多其他领域的路径一样,将来真正地前进和突破是在应用中间有更丰富的场景和更多的应用,然后我们就会发现过去的某些应用算法和基础算法是不够的,从而激励我们在那两个领域中间进行创造和累积资源的可能性。
作者:零点有数董事长袁岳博士