深度学习是人工智能领域里的一个研究方向,主要是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息,对诸如文字,图像和声音等数据的解释有很大帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。
但深度学习领域一直都存在算法黑箱问题,即算法的设计者并不清楚模型是如何得出结论和预测的,设计者无法对这个结果进行解释和负责。
深度学习的另一个问题是容易被数据“噪音”干扰。只要在对抗网络里加入一些“噪音”,可能就会让计算模型出错。典型的例子是,当自动驾驶算法的训练数据存在被恶意添加了“噪音”(编注:噪音指的是人类无法察觉却能够对算法进行干扰的数据)后,可能会将STOP标志识别错误,从而导致车祸。
算法黑箱、模型不安全易被干扰,这些目前人工智能领域里存在的问题,都向研究者提出了一个问题:未来,我们该向如何发展人工智能技术,从而使AI可以迎来二次曲线增长?
清华人工智能研究院院长、中国科学院院士张钹以及他带领的学生们给出的答案是:第三代人工智能技术。
近日,在北京举行的“2020第三代人工智能产业论坛暨瑞莱智慧RealAI战略发布会”上,张钹接受了澎湃新闻(www.thepaper.cn)的采访,他认为要解决现在人工智能在落地应用中遇到的问题,就需要打破现有的理论,迈向第三代人工智能。
在今年上海举行的世界人工智能大会期间,张钹对第三代人工智能做出过这样的解释:第一代知识驱动的 AI 利用知识、算法和算力 3 个要素构造 AI;第二代数据驱动的AI 利用数据、算法与算力 3 个要素构造 AI。由于第一、二代AI只是从一个侧面模拟人类的智能行为,因此存在各自的局限性,不可能触及人类真正的智能。
基于此,张钹提出了出第三代人工智能的发展路径是融合第一代的知识驱动和第二代的数据驱动的人工智能, 利用知识、数据、算法和算力 4 个要素, 建立新的可解释和鲁棒(音译自“robust”,学术上即一个系统或组织有抵御或克服不利条件的能力)的AI理论与方法,发展安全、可信、可靠和可扩展的AI技术。
发展第三代AI技术中美处在同一起跑线
在张钹看来,基于第三代人工智能理论发展的AI技术,会让中国和美国处在同一起跑线上,甚至随着发展会处在领先位置。
早在2015年,张钹院士就曾提出发展“第三代人工智能”的理念。2018 年,清华大学设立人工智能研究院,张钹担任新研究院的院长,聘请图灵奖得主姚期智院士作为学术委员会主任。2019年,清华大学宣布成立人工智能研究院基础理论研究中心,聘任清华大学计算机系长聘教授朱军为研究中心主任。
新设立的基础理论研究中心的任务是着眼于当前人工智能理论和方法的不足,以克服当前人工智能的技术局限为宗旨,以期建立鲁棒(robust,指系统健壮、强壮;鲁棒性是系统在异常情况下生存的关键)、可理解、数据高效和安全的第三代人工智能基础理论和方法体系。
除了在基础理论研究上,推进第三代人工智能发展外,在2018年,由张钹、朱军(担任首席科学家的瑞莱智慧(RealAI)作为产学研技术公司从清华大学人工智能研究院孵化成立。根据瑞莱智慧的官方介绍,公司就是以第三代人工智能技术为依托,克服一般深度学习存在的诸多缺点,从根本上增强人工智能的可靠性、可信性以及安全性。
相比之下,美国第三代人工智能技术的发展主要依赖于DARPA部门(美国国防高级研究计划局)。2018年,由DARPA宣布启动AI Next项目。
项目发布时,DARPA在其网站上介绍,从上世纪90年代开始,DARPA帮助引领了AI机器学习技术的第二次浪潮,该技术从大量数据中创建了统计模式识别器。DARPA对自然语言理解、问题解决、导航和感知技术的资助,发明了自动驾驶汽车、个人助理和近乎自然的假肢,还有大量重要的、有价值的军事和商业应用。然而,第二代人工智能技术依赖于大量高质量的训练数据,不能适应不断变化的条件,提供有限的性能保证,无法向用户解释其结果。未来第三代AI技术可能会极大地改变军事任务规划,科学家可利用机器开展研究,人类可与机器互动。
DARPA还给出了AI Next项目的重点,即发展新能力、高可靠性AI、对抗性AI、高性能AI、下一代AI以及人工智能探索计划。
这几点与张钹提出的发展安全、可信、可靠和可扩展AI技术不谋而合。
“所以我们为什么强调第三代人工智能有一个非常重要的因素就是,这个是我们国家历史上第一次遇到跟别人站在同一起跑线上,发展第三代人工智能,国外跟我们一样。”张钹告诉澎湃新闻。
国内AI企业同质化
胡润发布的2019年全球人工智能行业独角兽企业排行榜中,前40名企业中,中国占了15家,美国占了20家企业。
在采访中,张钹认为这份榜单也说明了现在人工智能技术在落地过程中遇到的问题。从数量上看,中美两国之间的AI独角兽企业差距不大。但是如果仔细研究榜单上的公司,会发现,中国AI企业的同质化明显。
“这是不好的。你用同样的技术,去做同样的应用场景,那就说明这个技术大家都会有,大家都会的技术用到大家都能想到的市场,肯定竞争非常激烈。”张钹说。
另外,由于第二代人工智能技术限制,目前国内的AI技术应用场景有限,同时还可能会有安全问题。
不安全体现在两个方面,一是数据,二是算法。“一个隐私保护,一个知识产权,用户的人脸数据凭什么给一家公司用,怎么用,数据都被公司收走,是否会造成不公平竞争,这些都是需要思考和治理的。”张钹说。
再者,由于测试环境的脆弱性,很多算法在真实环境中,都极易被攻击。在自动驾驶领域里,系统就很容易被攻击和欺骗。
这样的现状,也就为第三代人工智能技术提供了发展前景。张钹认为,未来,一个算法可以被解释,人们能了解机器做出预测的原因,且设计者有手段能阻止他人的攻击。只有那样,人工智能技术才会迎来更好的产业发展。
目前,由清华孵化的瑞莱智慧就在朝这样的方向探索。经过两年的发展,瑞莱智慧近期对外交出了成绩单,发布了两款最新AI产品:隐私保护机器学习平台RealSecure和人工智能安全平台RealSafe2.0 版本,前者是基于安全多方计算、联邦学习、匿踪查询等技术打造的数据安全共享基础设施,通过打通数据孤岛,解决企业机构数据合作过程中的数据安全风险和隐私泄露问题,后者是一套针对AI系统的防火墙与杀毒软件,支持检测对抗样本攻击、模型后门攻击等新型安全漏洞,提供模型安全测评及防御的端到端解决方案,大幅提升AI系统的安全性。
最后,张钹在采访中也提到了人才的培养,他认为人工智能产业要进一步发展,必须是发展具有创新能力的AI人才。 “国内人才的平均水平,比如清华,不管是本科、研究生平均水平都很高,但最高水平跟人家差的太远了。我们的人才培养中,没出过爱因斯坦,也没出过图灵。这是我们未来需要思考的。”张钹说。