人工智能未来的创新方向是什么?
在9月1日举行的2022世界人工智能大会科学前沿全体会议上,中国工程院院士、浙江大学教授潘云鹤在演讲时指出,大数据和跨媒体智能、跨媒体知识表达相结合,将是人工智能第四次创新方向。
潘云鹤是在做《人工智能的走向:知识的登台与升级》主题演讲时说这番话的。他说,回忆60年来人工智能的主流核心技术,已经创新了三次。
2022年9月1日,上海,2022世界人工智能大会科学前沿全体会议,中国工程院院士、浙江大学教授潘云鹤在演讲。澎湃新闻记者 俞凯 图
第一阶段:最早的人工智能大概在上世纪50、60年代,是规则和逻辑驱动的人工智能。
第二阶段:到了上世纪60、70年代,人工智能进化到了知识和推理驱动的人工智能,知识不但使用逻辑,而且使用比逻辑更加广泛的人类经验。
第三阶段:知识工程很快被深度神经网络替代,原因是那时候的知识表达都是字符型的,那时候的人工智能只能处理符号型的人工智能,只能把人类的符号知识、语言知识进行表达。这就留下了一大块空白,这块空白刚好由深度神经网络进行替代,因此,深度神经网络在视觉识别、听觉识别、文字识别、多媒体人工智能方面得到了极大的突破。但是,也产生了很多缺点,这就是现在大家正在讲的不可解释、不可以迁移使用,而且大量需要标识化的数据。
所以潘云鹤认为,大数据和跨媒体智能、跨媒体知识表达相结合,将是人工智能第四次创新方向,这个方向是数据和知识双轮驱动的人工智能。而且这其中开路先锋的,很可能就是视觉知识、文字知识等其他知识的多重知识表达,而且对视觉的对象要进行理解和识别,第一要识别,第二要分析,第三要进行模拟。
潘云鹤说,跨媒体人工智能、多媒体人工智能的应用,不仅仅将用于图像识别,而且将用于视觉生成。这次大会讨论的中心问题“元宇宙”,实际上不仅要有大量的设备识别,还要有大量的视觉生成。元宇宙的本质,是建立在互联网上可以体验的虚拟世界,元宇宙是在人的世界中从两元空间转向三元空间,三元空间可以把物理世界和人的社会投射到信息空间中,这就是元宇宙的重要基矗因此,全世界都纷纷转向重视元宇宙的发展,像英国、欧盟、美国等地的各大公司都在探索中。
元宇宙一方面要模拟物理世界,一方面要模拟人类社会,而其中的难点是“数字人”。表面上,“数字人”是有数字化外形的虚拟人,不但要表现人的外观、人的动作、人的感知认知能力,而且还要表现人的个性化数据。因此,本身是一个人的跨媒体知识表达。大家都已经看到了“数字人”有各种各样的应用,比如说数字主播、虚拟社交、智慧诊疗、人体工学。
“视觉知识多重知识表达、视觉理解和NDD相结合,将生成双轮驱动的人工智能大潮。估计在未来的人工智能发展中将成为主流的发展方向。因此,要记住,大数据、大模型固然很重要,但是大知识同样很重要,要在大知识中提早布局,并且取得快速推进。”潘云鹤给出了自己的建议。