心理学是通用人工智能最好的脚注。
撰文 刘凯(渤海大学教育科学学院、华中师范大学心理学院)
现在,随手翻阅任何心理学和人工智能的教材,都很难从学科内容上窥探出二者存在何种关联。但事实上,若论对人工智能研究的影响,大概没有哪门学科能够与心理学相媲美。从人工智能创立之初的纽厄尔(Allen Newell)、西蒙(Herbert A. Simon)及尼尔森(Nils J. Nilsson),到中期的安德森(John Anderson)、霍金斯(Jeff Hawkins)、巴赫(Joscha Bach),再到近期的辛顿(Geoffrey Hinton)、马库斯(Gary Marcus),这些人工智能的翘楚不是心理学家就是具有心理学背景。在推动人工智能进步的过程中,心理学都在直接或间接地发挥着重要的作用。然而,在当前的语境下,二者的背离却无疑比其联系更为突出。
1、人工智能与心理学融合的“貌合神离”
在大数据基础上,深度学习和强化学习技术势如破竹,正引领着时下人工智能的热潮。一方面,相比于上世纪八十年代的浅层神经网络,深层神经网络不仅在图像、语音及自然语言处理等方面大放异彩,而且与人类大脑神经系统的多层结构更加相似;另一方面,强化学习通过与环境互动所获得的奖惩而调节系统权重结构,使主体在最大化期望奖励诱导下不断修订从状态到动作的映射策略,从而实现快速提升系统性能的目的。前者受到认知神经科学的启发,后者则与心理学中经典的行为主义范式如出一辙。更不必说,为了改进深度学习和强化学习技术而引入的注意力、长短时记忆等机制几乎是直接照搬了心理学术语,用心理学词汇和理论武装人工智能之势现已蔚然成风。
这并不奇怪,毕竟人工智能的核心目标就是研发愈加接近人类的高级的智能系统,而真正的智能也必然具有一定的心理活动。在这种情况下,公众对人工智能的期望水涨船高,人工智能“友善论”或“威胁论”的论调层出不穷,文学和影视作品则及时将其呈现到人们的眼前,仿佛类人智能机器人明天就会到来一般。
与此同时,人工智能产品也迅速地向心理学领域渗透。基于面部表情的情绪识别系统,基于大数据分析技术的舆情分析或自杀预警系统,基于GIS的大规模人群跟踪调查系统,基于VR技术的心理健康干预系统,基于行为特征的测谎系统等等。遗憾的是,琳琅满目的各色项目解决的只是心理学的应用问题,而对于心理学核心的理论问题却没有什么实质性的帮助。实际上,当前人工智能领域中主流的深度学习和强化学习与人脑和心理差距甚远。
首先,从构成单位上看,人脑的神经网络与深度神经网络非常不同,深度神经网络最小单元一般为同类的神经元,但人脑的神经元不仅类型众多、功能各异,而且神经元也不是最底层的加工单位;从网络结构上看,深度神经网络中大部分节点是等同的,但人脑不同的脑区甚至脑区内部,都可能存在很大的差别;从编码方式上看,人脑神经元虽然能够产生可表征为[0,1]的动作电位,却是通过动作电位的频率对信号进行编码的,而人工神经网络却不都是如此;从信息加工方向上看,深度神经网络最经典的训练方式为反向传播,但大脑中似乎不存在类似的反向传播机制。
其次,人的注意力和记忆系统具有很强的语义性加工导向,而深度学习中的注意力机制靠的是输入与当前上下文信息的统计映射而非语义理解。长短时记忆网络(LSTM)中的记忆和遗忘也与心理学中对应概念所指内容完全不同,比如长短时记忆网络中的遗忘是主动控制的,而人脑的遗忘过程却是在人们控制之外的自发性行为。有趣的是,人们往往越想遗忘就越忘不了。
再次,人类的学习过程远非刺激-反应这般简单。无数心理学和教育学证据指出,人类学习是非常复杂的行为,是内隐和外显两种方式有机的融合,是对环境主动的加工,也是新信息与已有经验不断动态建构的一种生态表现。然而,类似巴普洛夫的狗和斯金纳的鼠,在强化学习中要求对行为结果必须具有确定性的奖惩判断以巩固经验。但是,在真实的开放世界中,人脑中经验往往具有模糊性,甚至有时是对抗和矛盾的,难以清晰辨识好坏优劣。当然,教育心理学中行为主义范式的没落就是一例最好的证明。
因此,有人调侃道:总结近年人工智能进展,就是没有进展。虽说也有些言过其实,毕竟33亿个词汇、1亿个参数的Bert模型还是在NLP领域中令人眼前一亮,很多无人驾驶汽车也穿着“滑板鞋”在真实的路面不断“摩擦”,OpenAI则开启微软云计算这顿“最后的晚餐”。但这既与人类心理活动遥不可及,也依旧对微妙篡改的对抗数据束手无策,更未能添补神经网络模型在泛化性、可解释性上的理论黑洞。也便不难理解,MIT和IBM发布ObjectNet这一更加贴合现实的新图库,各路算法便像中了妖术一般折戟沙常
2、人工智能与心理学交叉的“主战场”──类脑智能
基于一个似乎不言自明的前提,有些人工智能研究者为自己设定了一个可行目标:既然人脑肯定有智能,那么只要能够在软件中复现或部分复现人脑,也一定能够实现或者部分实现智能。也就是说,智能源于生理结构,“模拟出类似人的大脑,机器才能产生真正的智能”。
于是,计算机与计算神经学在此携手汇合,并出现“类脑智能”的新分支,又因所需模拟尺度的差异分为局部和全脑两个不同的类别,前者往往是具有计算机功底的神经心理学家,通过构建小型计算模型来模拟和解释人类的心理问题,优点是针对性强、运算量孝开发难度低,缺点是模型的泛化性差且生态效度不高。国内代表性工作有华东师范大学心理学院郭秀艳教授的内隐学习模型及华南师范大学陈奇教授心理数量表征的计算模型。后者则聚集了具有神经心理学功底的计算机科学家,认为智能是整体涌现的功能,局部性的向下分解将失去智能特性。因此,这一学派学者从一开始就强调“全脑计算”,试图在全尺寸上整体仿真人脑。考虑到人脑生理的复杂性,模型的建立一般由易到难,大多从低等动物开始,然后由低等哺乳类动物向高等哺乳类动物过渡,最终实现对人脑系统的模拟。优点是通用性强、模型扩展性和泛化性强,缺点是开发、运行和维护难度大、成本高,同时模型的可解释力较弱。国内代表性工作是中科院计算所曾毅教授团队的鼠脑和猴脑模型,已经可以在猴脑模型控制下实现机械眼和机械臂对陌生物体识别和抓取的高效学习[1]。
螳螂大臂的锯齿和木工锯子如出一辙,鱼鳔和潜水艇的压载水舱也是异曲同工;然而,同样也很明显,蝙蝠的耳朵和雷达长相完全不同,人类通过捆扎翅膀并不能飞行,而最终制造出来飞机既没有羽毛,也没有翅膀的上下扇动。这说明,仿生是人类向自然求教、收获知识并改造世界的一条有效路径,却未必是唯一路径。因为飞行能力背后的依据是抽象的空气动力学,这种抽象能力的实现固然需要载体,但载体之间的差异可能非常大。
事实上,所有种类的能力在本质上都是抽象的。比如:生命是一种生存延续的能力,其载体既可是动物、植物、微生物,也可以是计算机病毒之类的虚拟人工生命形态。而人脑恰好是智能与生命两种能力的统一实现,因此脑科学的所有研究成果同时具有两种不同能力的成分,很难在纯粹的心理和纯粹的生理作用下划清边界。这便是人工智能视域下心理学和脑科学相关研究所面临的第一个难关:智能的能力和智能的载体之间耦合所产生的矛盾。因此,从某种意义上讲,“仿脑”有可能是“仿心”道路上最艰难、最曲折、最漫长的一条弯路。
其实,类脑并不等同于仿脑,仿脑只是类脑研究中的一个组成部分。类脑研究分为两个不同的导向:“仿生”和“仿心”。心理学家和计算机学家在其中又扮演着不同的角色:
“仿生”就是仿刻大脑的生理活动[2],是由计算机学家主导的,或者实现部分或整体的软件脑,或者制作含有某种认知功能的躯体机器人,甚至模拟神经递质系统而得到诸如情感之类的心理功能;
“仿心”则是描绘大脑的心智活动,这是由心理学家所主导的,用以解释人类认知的一般规律。
其中,一部分“仿心”学者特别强调认知中元规则的基元特点,他们认为:“理性”和“非理性”、“创新性”和“非创新性”、“意识性”和“无意识性”之间非但没有明晰的划分,而且从本质上看都是一致的。这样的理论有很多,代表性工作有奥尔松(Ohlsson)的深层学习假说、巴尔斯(Baars)的全局工作空间理论、迪昂(Dehaene)的全局神经元工作空间理论以及托诺尼(Tononi)的整合信息理论等。然而,二者优劣互补却毫不兼容“仿生”的操作性强、容易落地,但难以生成高级认知功能;“仿心”理论性强操作性差,系统很难落地实现。这一死局直到通用人工智能的壮大才出现了重要的转机。
3、通用人工智能类脑智能战场上的“突击队”
类脑智能另一种“仿心”的派别便是通用人工智能。通用人工智能认为存在一般性的智能能力,而其实现的载体也未必非得垒筑于血肉之躯,计算机软件系统同样可以具备这一能力。通用人工智能正是人工智能的原初意义和目标,但随着人工智能领域的曲折发展,“人工智能”一词现已逐渐偏离了最初的内涵,而被赋予了更为混杂的含义。为确保通用人工智能讨论的清晰性,有必要先对人工智能进行明确的限定和说明。
在常见讨论中,对人工智能内部的领域有三种区分方式[3]:第一种,分为计算智能、感知智能和认知智能三个领域;第二种,分为弱人工智能和强人工智能两块,而强人工智能也正是通用人工智能;第三种则分为专用人工智能和通用人工智能两块。第一种分类常见于行业演讲和报告中,既缺乏理论依据又具有误导性。实际上,所谓的计算智能和感知智能并不是真正意义的智能,但却错误地将智能实现分成三步,而且认为当前已经完成前两步即将走完最后一步,殊不知认知智能根本不是如此实现的。第二种则始于哲学讨论,“强弱”意指智能的真假之分,却被误读为智能的宽与窄之分,事实上,三种概念体系之间不存在等同关系。只有第三种分类──“专用人工智能”和“通用人工智能”才是真正符合和适合当下语境交流的正确概念分类,即:
人工智能(AI)= 专用人工智能(SAI)+ 通用人工智能(AGI)
人工智能本质上为类人智能,即追求设计和开发像人脑那样工作的软硬件系统。对于“智能”理解的差异,使人工智能分化为专用和通用两个不同分支。其实,专用和通用存在根本性差异:专用人工智能的目标是行为层面上“看起来像有智能”,通用人工智能关注系统从内在层面上“如何才能实现真正的智能”。专用人工智能先做后思,即开始并不深究智能也不对智能做清晰的定义,而是通过技术迭代渐进式地提升智能化的程度,分为符号主义、联结主义和行为主义三个学派。通用人工智能则认为智能的存在代表着可以被认知的理性原则,采取先思后做的路径。
实际上,通用人工智能内部也存在不同学说和派别。本文基于的“智能的一般理论”及其“非公理逻辑推理系统(NARS)”的工程实现,便是通用人工智能领域中一个具有代表性和影响力的方案。其对智能的工作定义为:智能就是在知识和资源相对不足的条件下主体的适应能力[4]。
智能绝非全知全能或定然比人更聪明。正是基于知识和资源相对不足的假设,而非某种预设的高深叵测的算法,NARS系统才“恰好”不但具有感知、运动等低层活动(配备机械躯体和传感器),也具有类似人脑的情感、记忆、推理、决策乃至自我意识等高级认知活动。同时,系统尤其强调经验的可塑性,以及经验与系统个性和自我发展的相互影响。然而,这些自生的高级认知活动是专用人工智能系统根本不具有的。一言以蔽之,那便是:能思考、有情感、有自我意识的智能系统已经存在。
4、通用人工智能与心理学融合的“貌离神合”
与专用人工智能和心理学之间的“貌合神离”正好相反,通用人工智能与心理学则是“貌离神合”。通用人工智能理论对心理学相关研究具有重要的推动作用,毕竟在思维层面上对人脑的运行机理、认知的基本机制、学习的基本机制以及精神疾病等问题的研究和探索,远比行为(行为实验、口头报告)和生理层面(眼动、脑电、肌电、fMRI等)来得更为直接和有效。
基于通用人工智能的基本假设,在认知科学框架内可得到如下基本理论假设:
1. 大脑的智力有先天和后天两种成分,先天遗传的是元水平的智能,后天养成的是经验水平的技能;
2. 先天与后天的结合使得大脑以任务加工系统的形式存在。经验系统具有耦合的内部结构,即记忆空间和加工空间是耦合的。由于知识和资源的相对不足,相关记忆通常不会全部参与认知加工;
3. 因受限于资源所导致的记忆和加工的矛盾,必然表现出并行和串行两种不同的处理方式,但背后却只有统一的、一种内在的元认知机制(NARS采用非公理逻辑实现了这种元认知,当然也存在其他形式);
4. 任务的加工和保持需要认知资源的投入,由于知识和资源的相对不足,任务的执行具有不同的优先等级;
5.任务与经验(记忆、知识)同源同形,认知加工表现出内涵和外延有机结合的整体性特征,核心实现方式并非基于概率,而是基于证据的度量。
理论的生命力突出表现在解决悖论的能力上,且不说NARS先天具备诸如演绎、归纳、归因、例示等与人类相一致的强弱推理的“理性”能力,更能够在“非理性”方面也表现出跟人类高度相似的特点。最显著的例子莫过于“合取谬误”了,现以心理学经典的Linda悖论为例进行说明:
给定如下背景信息,“Linda是一位31岁的单身女性,直率并且非常聪明。在大学期间,她主修哲学,对种族歧视问题和社会偏见非常关注,同时也参加过反核示威游行”。然后,要求被试基于这些信息对Linda的身份进行判断,哪种说法更能成立:
(A)Linda 是一名银行出纳员;
(B)Linda 是一名信奉女权主义的银行出纳员
被试不论老幼几乎都压倒性地选择了B,但从概率上看,很明显,两个事件共同发生的概率要低于其中任何一个单独事件,就是说“信奉女权主义的银行出纳员”只是“银行出纳员”中的一小部分,所以A应该比B可能性更高。但不论经济学家还是心理学家对这个结果都非常头疼,绝大多数心理学家试图在概率论和“非理性”心理活动之间进行调和。尽管相关学说和理论层出不穷,也仅仅能够合理地解释其中个别案例,局限性依旧突出。因此,人类思维的选择一次又一次被扣上“非理性”的帽子。
但是,如果换做NARS的理论视角,人们对于某个事物的判断源于对其的理解,而对事物的理解则是该事物在当前这个人经验体系中内涵性证据和外延性证据的总和。对于(A)而言,所有已知背景信息都与银行出纳没有直接关系,因此未能提供外延性证据;但对于(B)而言,背景信息给出的几乎都是美国女权主义者的典型描述,因此直接提供了许多内涵性证据。虽然概率论只承认外延性证据,这个题目却诱导人们做出内涵性判断,而这项实验结果的秘密就在于此。人脑的认知同时加工内涵和外延,但概率论却只是外延性的[5]。
因此,“错误的”和“非理性的”并不是人脑,而是概率论本身的局限。心理学诸多悖论实验所印证的不是人类的“非理性”,而恰恰是人类的“理性”。当前,专用人工智能以概率论为基石,甚至有人喊出“人工智能就是概率论”的口号,心理学亦受极大影响,值得学界高度警惕。
更进一步地,并非所有人对Linda问题都有一致的回答,相关研究发现“具有高认知能力的人”就能避免框架效应,而具有统计学背景的被试尤其突出,因为他们可以有意识地遵循概率论而拒斥内涵性证据。其实,在NARS系统中当然也可以复现这个结果,与之前普通人之间的差异仅在于是否具有概率框架的先验经验。貌似这只是一件无足轻重的小事,但实际上反映的却是人工智能视域下心理学和脑科学相关研究所面临的第二个难关:智能的能力和智能的内容之间耦合所产生的矛盾。
与人一样,通用人工智能系统并不能直接产品化,就像我们无法要求一个刚出生的婴儿去统计财务报表或进行天文学研究一样,需要后天的教育和培养过程才能让其掌握领域专长并像人一样地从事相关工作。这就意味着,仅有先天智能并不能够直接体现出主体的智力水平(或者只能够在种群层面上得以体现),只有充实和建构了主体经验这些智能的内容之后主体才能够在开放世界展现出智能的外在表现。
值得注意的是,已有心理学和脑科学的相关实验,既包含了智能的能力本身,又包含了智能的内容,但智能的内容对于每位被试都不完全一致,随机取样差异更大。因此,相关实验的结论反映了稳定的部分(如智能的能力及智能内容中共有的部分),从而使得结论达到统计学要求。但是,如果实验本身涉及被试智能内容中异质性的部分,那么心理学实验结果的重复就变得更加困难。这也是近年来心理学诸多研究成果因无法复现而被人诟病,并被批评“伪科学”的根本原因所在。
总之,通用人工智能的优势为人工打造出一个在思维层次上运行的类脑系统,具有与人类似的思维模式、决策机制等,这是对心智研究的理想仿真平台,其理论对心理学也具有重要的启发。反过来,心理学既是人类心智最直接的刻画,同时也是通用人工智能最好的脚注。
注:删减版发表于中国社会科学报2019年1月14日心理学专刊,本文则为文章原稿。
参考文献
[1] Zeng, Yi,Zhao, Yuxuan,Bai, Jun,et al. Toward Robot Self-Consciousness (II): Brain-Inspired Robot Bodily Self Model for Self-Recognition[J]. COGNITIVE COMPUTATION,2018,10(2):307-320.
[2] 黄铁军,余肇飞,刘怡俊.类脑机的思想与体系结构综述[J].计算机研究与发展,2019,56(06):1135-1148.
[3] 刘凯,隆舟,刘备备,王伟军,王培.何去何从?通用人工智能视域下未来的教师与教师的未来[J].武汉科技大学学报(社会科学版),2018,20(05):565-575.
[4] Pei Wang. On Defining Artificial Intelligence[J]. Journal of Artificial General Intelligence, 2019,10(2) 1-37.
[5] Wang P . Confidence as Higher Order Uncertainty[C].2nd International Symposium on Imprecise Probabilities and Their Applications, Ithaca, New York, 2001:352-361.
作者简介
刘凯,博士,渤海大学教育学院讲师,心理健康教育硕士生导师,华中师范大学心理学院博士后,研究方向为:通用人工智能、机器教育、计算精神病学。
特 别 提 示
1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。
2. 『返朴』开通了按月检索文章功能。关注公众号,回复四位数组成的年份+月份,如“1903”,可获取2019年3月的文章索引,以此类推。
版权说明:欢迎个人转发,任何形式的媒体或机构未经授权,不得转载和摘编。转载授权请在「返朴」微信公众号内联系后台。
《返朴》,科学家领航的好科普。国际著名物理学家文小刚与生物学家颜宁共同出任总编辑,与数十位不同领域一流学者组成的编委会一起,与你共同求索。