近日,中国工程院院士、之江实验室人工智能领域首席科学家潘云鹤作为通讯作者,分别在《自然》子刊《机器智能》和《工程》杂志上发表题为《中国迈向新一代人工智能》和《人工智能多重知识表达》的文章。
Nature子刊Machine Intelligence发表潘云鹤院士作为通讯作者文章
《中国迈向新一代人工智能》一文全景扫描了中国新一代人工智能发展规划(20152030)的形成过程和主要内容,重点描述了中国新一代人工智能在基础研究、技术发展、人才教育和伦理道德等方面面临的挑战,同时认为新一代人工智能将会搭建起中国人工智能生态发展的蓝图。
“未来5年,人工智能的重点是突破基础理论研究,推动技术与应用达到世界先进水平。”潘云鹤院士认为,“目前,在大学、政府和产业之间正在形成一种协作创新体系,以推动新一代人工智能发展。”
文章指出,人工智能是犹如内燃机一样的“使能”技术,具有赋能其他技术的潜力。新一代人工智能将在互联网消费、自主驾驶、智能医疗和智能物联等四个方面发挥突出的赋能作用。随着数字化过程更为标准以及大规模医疗数据不断涌现,医生和人工智能研究人员之间的密切合作将把人工智能辅助系统引入临床工作流程,成为医生的重要辅助工具,并最终改善患者管理。物联网对话式人工智能将成为现实,对话概念将从基于语音扩展到多模态(跨媒体),能够同时处理语音数据和视觉信息的智能算法将广泛应用于各种形式的硬件中……“这些‘不可能’都将随着人工智能的不断深化研究而变成‘可能’。”潘云鹤院士说。
Engineering期刊6月发表潘云鹤院士文章
在《人工智能多重知识表达》一文中,潘云鹤院士提出,在AI 2.0时代,知识存在三种表达,包括知识的言语表达、知识的形象表达和知识的深度神经网络表达。其中知识的言语表达的特点在于使用符号数据,结构清晰,语义可理解,知识可推理,其典型例子如语义网络,知识图谱等。知识的形象表达的特点在于适用于图形、动画等形状、空间、运动的数据,知识的结构清晰,语义可解释,知识可推演,其典型如视觉知识等。知识的深度神经网络表达的特点在于适用于图像、音频等非结构化数据的分类与识别,其典型例子如DNN、CNN等。潘云鹤院士提出了由知识图谱、视觉知识和深层神经网络等构成的人工智能三重知识表达机制,它们彼此相互衔接、相互支持,从而有利于知识表达与推理等智能计算的可解释性,可推演性和可迁移性的实现。人工智能的这三种表达是针对人类记忆中的三种不同内容,其中知识图谱对应语义的记忆内容;视觉知识对应情景的记忆内容;深度神经网络对应感觉的记忆内容。
以上知识图谱以猫为例展示了三重知识表达之间的相互联系与支持关系:视觉知识表达了猫的形体、结构和动作等等时空特征;深度神经网络表达了对所提供的猫的正负样本图像判别的一种抽象。其实,当猫的图像符合其某种系统要求时(如同猫的不同观察视角),这些图像也可以重建为视觉知识。视觉知识可以通过变换(几何投影、动作变换等)生成各种猫的图像供DNN学习。通过视觉知识与知识图谱联系,可推知,因为猫、虎、豹同属猫科动物,所以具有类似的形体、结构与动作。因此,猫的视觉知识可通过合适的修改而形成虎、豹的视觉知识,这就以容易理解的方式实现了迁移学习的功能,也为小数据下的知识学习(如少样本、零样本学习)的小数据与模型的通用化打开了一扇大门。