编者按:近日,首都科技领军人才、东方通科技首席科学家谢耘在通州全球发展论坛(2025年春季)“DeepSeek中国人工智能、跳跃式发展与全球2050目标”主题研讨会上发言指出,未来大模型应聚焦边界明确的问题领域,避免处理无限开放性问题,同时需以理性态度看待AI发展,而不是用感性的期望想象,代替理性的分析认识。现将其发言实录发布如下:
大模型的基础是什么?
我从科学的角度讲一下对于大模型的看法。大模型的基础是什么?讲一下这两个核心的基础。因为一个东西的基础,决定其能做什么,能走多远,所以我们还要理解它的基础。大模型核心的基础是基于文字符号的统计,它是对文字符号做统计来做各种各样的事情的,这是它的核心基础。通过统计来发现文字符号之间概率的关系,借助这个概率关系生成你需要的东西。简单讲一下统计,统计的方法在科学中属于一种相对平凡的方法,为什么说是相对平凡的方法?它是一个就事论事的方法,没有办法超越统计的样本,去谈别的事情。它做不到,这是统计原理上根本的限制。举一个最简单的例子,当年开普勒通过统计行星围绕太阳运行的数据,发现了行星轨道的特点。但是,他不可能通过统计,去发现两个质量相同的星体相互运动的规律。不可能统计出来,因为没包含在那个数据里。他更不可能,通过统计产生超越数据的洞察。比如行星围绕太阳转是万有引力决定的,他通过这个数据统计没有办法推出万有引力定律,所以万有引力定律最后是牛顿提出来的。牛顿不是用统计的方法,其实这是一种洞察的能力。对于洞察我们没有办法详细解释,所以我们说一个苹果砸到牛顿的脑袋上,让他发现了万有引力定律,这种深刻的洞察没有办法通过统计发现。所以统计是科学中一种相对平凡的方法。人工智能开始并不是依赖统计,而是试过很多其它的方法,结果发现只有统计最好用。所以现在人工智能使用统计这个平凡的方法是没办法的办法。大模型的第二个基础是什么?这是被谈论的更少的一个话题,其实这个更本质,大模型本质是一种现代工匠技艺。为什么说是一种工匠技艺?因为它没有背后的科学原理,人类现在没有关于智能的科学理论。所以人工智能现在都是工匠性的实验方法,为什么DeepSeek搞出一个东西大家很惊讶?就是因为这是一个工匠的东西。如果你有新的想法,你也可以搞出新的东西来,并不是某一个理论告诉你一定会怎么样,不存在这个理论。所以这是大模型,是人工智能非常本质的一件事情,它是现代工匠技艺。有很多朋友不理解这件事情,说用了那么复杂的数学,你怎么说它是工匠?对不起,数学只是个工具,用了再复杂的数学,也不等于是科学。为什么说它是现代工匠技艺?就是因为用了大量的数学,和传统的工匠技艺不一样,只是后者用手,这是第二个核心的基础。这两个基础决定了它能做什么,不能做什么,也决定了未来能发展到哪里,以及以什么形式去发展。现代工匠技艺有几个特点:
一是有很大的盲目性,因为没有科学理论做指导;二是有很大的不确定性,新的方法可能突然出现取代已有的;三是工匠技艺和有现代科学理论支撑的技术发展相比,它可能走不太远,这是历史的经验告诉我们的;四是工匠技艺严重地依赖经验和悟性,是个经验的东西。关于人工智能,美国兰德公司1965年就有一个报告,讲了一个非常核心的观点,就是人工智能是一种现代炼金术,没有科学的理论在支撑,这个结论到今天依然是成立的,这个领域依然如此。报告里面一个很形象的话送给大家,你不能因为爬到了一个很高的树上,就觉得自己离登月这个目标更近了。这是1965年的报告,大家有兴趣可以查,网上能找到这份报告。
大模型与人的异同
大家现在在讲大模型有理解能力,大模型的理解是基于字符的统计形成的,它和人基于意义的理解是不一样的,底层逻辑完全不同。这样两种东西产生的结果会有重叠的地方,但是注定不完全一样,这两个机制是不等价的。所以大模型产生幻觉是必然的,幻觉只是站在人的角度去说,对于大模型来讲,这就是它非常正常的输出。因为按照它底层的机制,就会产生这些东西。所以它的理解和我们的理解在结果上有重叠的部分,但是不等价,一定有很多不一样的地方。关于逻辑,现在很多人问大模型的逻辑能力,大模型底层没有逻辑,还是基于概率统计的。他基于概率统计输出的东西,从逻辑角度,和我们的逻辑可以重合,但是依然是不等价的。你用再多的数据训练,这两个也不可能等价,因为底层机制不一样,这个不是数据决定的,这是底层机制决定的。很多人说大模型会犯错误,人也会犯错误,这有什么了不起的?这两个犯的错误不一样。人犯的错误某种程度上是可预测的。比如说王院长,在他的领域里面他谈的东西不可能出基本概念的错误,否则王院长不可能当院长,在国际上做这么多讲座。人的错误当他达到一定水平,有些错误不会犯。高水平的人依然会犯错误,但是不会犯基本的错误。但大模型不是,大模型无法预测会犯什么类型的错误。就是因为底层的机制不一样,它不是按照我们的理解去看这个事情。国际上有很多测试,发现你再增加数据,它依然会在很基本的问题上犯错,所以它出错和人出错的性质不一样。我清华的一个朋友问我大模型能不能展示出智慧?我说你要首先定义什么是智慧,你没定义智慧没法谈会不会有智慧。
未来的发展
最后讲一下未来的发展,人工智能的科学原理会不会有突破?我个人对于这个事情不看好。原因就是人类最聪明的一批大脑,研究智能科学已经研究了上百年,到今天没有突破。科学界对大脑,对意识的一个基本结论就是,人类一公斤多重的大脑是现代科学最深的一个黑洞。所以你说未来会有突破,这个会很难,我觉得希望不是太大。工匠技艺可以走多远,这个不太好预测,但是它会出现很低效率的发展,工匠技艺在盲目地摸索,这里有很大的偶然性。工匠技艺创新的模式可能是孤狼式的,因为没有科学理论的指导,让大家都按照一个方向走。有可能今天DeepSeek用了一个低成本的方式做,有可能过两天一个人用完全不同的方式做出一个新的东西来,这完全是有可能的。所以这个领域的创新其实恰恰应该鼓励大家不要沿着一个潮流去走,而是应该鼓励多方向去探索。未来人工智能,包括大模型的发展,我个人认为以问题边界受限的领域应用为主可能会更好。因为一旦开放,问题就不受限了,可以有一个无穷的问题。你用有限的学习样本的统计去解决无穷的问题,这是有问题的。所以用有限的统计方法,还应该去解决有限、受限的问题,我觉得这是最好的方式。最后一个建议,面对人工智能大模型的发展,我们还是要用科学的态度去面对,而不是用感性的期望和自己的想象来解释这里的事情。现在这个问题比较严重,我觉得还是要用理性的态度去面对这件事情。人类整个历史其实说明一个很重要的问题,就是理性导致我们走到今天。科学就是一个理性的产物,没有理性我们是走不到今天的,所以我们往未来看,我想可能还是应该强调科学的理性去面对这件事情,用科学负责任的态度去发展使用人工智能技术。谢谢大家!