智东西(公众号:zhidxcom)
编译| 铭滟
编辑 | 徐珊
WAIC 2023世界人工智能大会最近在上海圆满落幕。在这场国内最高规格人工智能领域峰会上,11位重磅嘉宾从不同角度分享了对中国人工智能领域的观察与判断。
在大会的巅峰对话环节中,商汤科技董事长兼CEO徐立与图灵奖得主、上海期智研究院院长姚期智、清华大学交叉信息研究院助理教授袁洋、清华大学交叉信息研究院助理教授、Moonshot AI创始人杨植麟、DragGAN第一作者、南洋理工大学计算机科学与工程学院助理教授潘新钢,就人工智能的发展与突破,进行了精彩的探讨,包括大模型核心理论研究突破、多模态对大模型的优化、安全可控的算法进路以及对比分析已有案例等。
一、姚期智:中国科学家助力人工智能强化学习
图灵奖得主、上海期智研究院院长姚期智表示,中国的科学家在AI的发展上做了很多突破性贡献。清华大学交叉信息研究院助理教授高阳在一年多前做出了非常重要的算法突破贡献,使得强化学习的时间进程加快数百倍。他的研究不仅是一项应用进步,也为算法研究作出了理论贡献。因此,他的研究受到了国际广泛关注。
他认为在ChatGPT之后,人工智能研究的下一个重要目标就是拥有视觉、听觉等多种感知能力的机器人,并能在不同的环境中自主学习各种新技能。而高阳的技术突破,则是将机器人的学习速度提高了数百倍,使机器人在几个小时内就能做到。
这不单单解决了机器人学习的实用问题,也是理论贡献。姚期智表示,在过去六七年内,人工智能的高层研究者曾就人工智能强化学习路线是否正确的议题展开争论。而高阳的研究突破,则是将这个天平倾向了另一边。我们对人工智能的完善,还有很长的路要走。
二、袁洋:对多模态的理解应基于解决具体行业的具体问题
在交叉学科的大模型应用方面,清华大学交叉信息研究院助理教授袁洋表示,对多模态的理解应当基于解决具体行业的具体问题。例如文本到图片的生成,生成的图片不是用户想要的表现,用户需要用鼠标对其进行修改。而这个鼠标的拖动,就是新的模态。用户在用新的输入把自己想要表达的内容告诉大模型,并让它能够理解。这种多模态的输入在应用中非常重要。
所以在具体行业内,大模型的训练应当聚焦于行业内最核心的问题,找到解决核心问题所需的数据。这就是模态的补全。在此基础上,做好模态对齐与模态补齐后,袁洋认为,大模型可以有更强大的能力,来解决更核心的交叉领域的问题。
三、杨植麟:对通用大模型问题的解决应回归更本质的层面
清华大学交叉信息研究院助理教授、Moonshot AI创始人杨植麟则表示,现有大模型还有很多未解决的问题,比如,安全性,可控性,避免产生幻觉和编造不存在的问题,以及大模型无法像科学家一样创造。他认为,当针对通用模型思考这些问题时,不应当头痛医头,而应当举一反三,思考这些问题底层的共通问题是什么,回归更本质的层面来解决。
四、潘新钢:Moonshot和GAN未来或可优势互补
DragGAN第一作者、南洋理工大学计算机科学与工程学院助理教授潘新钢则基于生成模型的框架以及优化目标的不同,比较了两个AI绘图软件Moonshot和GAN的差异。第一是性能与效率,在生成过程中,扩散模型迭代式计算需要的更多的训练时间和更大的计算开销。所以,图像生成性能更高。潘新钢认为扩散模型的上限高于GAN,质量优势更明显,应用前景更广。但对于性能和计算开销有限制的特定情形下,GAN仍是妥协的选择。
第二是GAN和扩散模型的映射,扩散模型对于图像内容的影响表现为较为随机,不具有结构化,GAN可以有效编辑图像中的属性,例如动物姿态等。在这一方面,后续如何拓展扩散模型的问题也值得探索。
第三是生成空间的连续性,设计时扩散模型的图像空间较为不连续,GAN的图像控件则比较流畅自然。未来将这两个模型进行优势互补是非常有趣的研究话题。
五、未来大语言模型的领域方向
关于大模型在垂直领域的发展,姚期智认为,基于大模型的语言能力,未来可以将更多的文书工作交给机器来完成。袁洋则基于其专业背景和大模型基于预训练范式的判断,认为大模型在医疗关系中可能会比人类和机器做得更好,表示更看好智能医疗方向。杨植麟则倾向于个人使用方向。比如人可以给AI提供上下文,人看到的所有东西AI通过录屏也可以看到等。潘新钢认为今后视频和三维内容生成前景很大,可以帮助创意工作者等创造更高质量的内容。
以上是巅峰对话内容的完整整理,除此之外,本届WAIC 2023世界人工智能大会期间,特斯拉创始人、CEO埃隆马斯克(Elon Musk)、香港中文大学教授汤晓鸥,华为轮值董事长胡厚,微软全球资深副总裁、微软大中华区董事长兼首席执行官侯阳博士,图灵奖2018年得主、Meta AI基础人工智能研究(FAIR)团队首席AI科学家杨立昆(Yann LeCun),地平线创始人兼CEO余凯分别分享了对人工智能领域的观察与思考。
结语:人工智能领域的未来将向“人脑”方向发展
此次WAIC带来的不仅是各家大模型的集会,也是人工智能研究领域新老血液的交汇。人工智能领域的研究涵盖了多个学科,包括计算机科学、数据分析与统计、硬件和软件工程、语言学、神经科学,甚至哲学和心理学。因此目前对于人工智能未来发展方向的探讨并未形成统一观点。
但无论是通用人工智能,还是机器人人工智能,各个人工智能概念或将向“人脑”甚至“人类”的方向发展。这意味着人工智能的目标不仅是模仿人类的行为,更要真正理解人类思维、情感和行为等复杂抽象概念。对于这些复杂抽象概念的分析,除了计算机科学和数据分析之外,或许还会涉及到脑科学领域,以及更深层的哲学与心理学等问题。