人工智能的新范式:基于行为的AI研究
李建会
一、经典人工智能研究及其遇到的问题
机器能够思维吗?1950年著名的计算机专家阿兰?图灵在《心灵》(Mind)杂志上发表了一篇划时代的论文:《计算机器和智能》。在这篇论文中,图灵认为,机器能不能思维的问题应当用问机器能否通过他设计的著名的“图灵测试”的问题来代替。如果机器能通过这个测试,就可以说机器具有思维。
图灵在这篇文章中的丰富想象和博学引起了人们对机器智能的极大兴趣。1956年,有十位数学家和逻辑学家在美国新罕布什尔州的达特茅斯学院举办一个夏季学术讨论会。他们的目标是确定智能的特性原则上可以用机器来模拟。与会人员中有约翰?麦卡锡(John McCarthy)、马文?明斯基(Marvin Minsky)、赫伯特?西蒙(Herbert Simon)和艾伦?纽厄尔(Allen Newell)。这四个人后来奠定了人工智能这门交叉学科的基石。
明斯基把人工智能定义为“让机器作本需要人的智能才能够做到的事情的一门科学”。也有人认为人工智能的目标是建造有用的智能系统并通过它们来理解人的智能。计算机诞生初期,主要被用来帮助人们进行数值计算,在这方面,计算机表现出卓越的能力。与此同时,人们也开始尝试用计算机进行下棋、翻译语言和定理证明等智能行为。在这方面,计算机也表现不凡。1976年,美国伊利诺斯大学的阿佩尔在三台计算机上用了1200小时,做出了200亿个逻辑判断,终于证明一百多年人们一直想证明而没能证明的四色定理。这一成果在世界上引起了轰动,它说明,在专门领域内,计算机的运算能力远远超过了人类。在这样的背景下,70年代后人工智能的研究从理论转向应用,出现了专家系统和知识工程两大热点。
70年代专家系统发展起来,在一系列不同的领域出现了许多不同的专家系统,如西蒙的学生爱德华?费根鲍姆与诺贝尔奖金获得者、遗传学家约舒亚?莱德伯格合作研制的可以作质谱分析来确定未知有机化合物结构的ENDRAL系统,斯坦福大学研究的医疗咨询系统MYCIN,匹兹堡大学研制的疾病诊断系统INTERNIST等。它们利用专门的知识库、相互关系和专门范畴的推理规则完成各自的工作。
由于专家系统的知识都是由人事先整理后输入计算机的,所以工作量非常巨大。这样,知识的获取就成为开发专家系统的瓶颈。计算机还远没有如人一样的自我归纳学习的能力,对高层次的智能虽已有近似专家的水平,但模拟低层次的智能,如听觉、视觉信息的识别还不如3岁小孩,对许多下意识的常识推理、不确定的知识和直觉思维无能为力。在这种背景下,知识工程应运而生。知识工程就是在把人类知识整体与计算机结合的基础上,研究知识的结构、分类、预测、存取、获得、传输、转换、管理、利用、增殖、学习和表示等问题。
然而,到了80年代,人工智能及与其相关的机器人制造遇到了前所未有的困难。人们发现,用单纯程序的形式表达人类专家所具备的知识远比想象中的要困难的多。所以,专家系统并没有像人们最初想象的那样成功。当然这并不是说专家系统停止了工作,许多专家系统现在仍然在使用中,但比预期的要少得多。并且这些使用中的专家系统往往都是在一些不太复杂的领域。
与人工智能相关的机器人制造的进展也没有像最初想象的那么迅速。1966年,明斯基和他在MIT的同事们认为,他们能够在一年内搞清楚视觉的工作机制。然而他们并没有成功。由此,明斯基等人认识到问题的复杂性。为了简化这个问题,他们转而试验设计可以用模块搭建房屋或搭建塔楼的机器人。出乎明斯基的预料的是,这个“微模块世界”的研究同样不顺利。机器人的视觉系统在辨别玩具模块时表现不佳;马达控制程序无法精确地放置玩具模块;机器人放置物体时显得非常笨拙。不过,他们的工作并不是一点成绩都没有。他们的工作表明,在简单的世界里,机器人可以翻译它所看到的东西,可以控制模块,甚至回答一些关于这些模块的问题。
MIT的研究者们曾经力图把他们从“模块世界”中获得的东西扩展到现实世界中,然而由于机器人研究总体上进展缓慢,所以研究经费的资助开始减少,结果使该计划没能进行下去。这些人认识到,智能远远不像他们最初想象的那么简单。“与期望的相反,微世界研究方法没有导向对一般智力问题的渐进解决(Crevier 1993: 114)。”
面对这些困难,一些专家认为,这主要与计算机的能力有关。他们相信,随着功能更强大的计算机的出现,计算机的智能将达到和超过人类。
另外一些专家则认为,人工智能和机器人研究遇到的困难说明,传统人工智能和机器人研究的方法存在着根本的缺陷。要想使人工智能和机器人研究有新的发展,必须有全新的研究思路。恰在这时,人工生命的研究兴起。人工生命为机器人研究提供了全新的思维方式。
二、基于行为的AI的兴起
传统的人工智能研究和机器人制造采取的是自上而下的研究方法,即研究者先确定一个复杂的高层认知任务,接着把这个任务分解为一系列子任务,然后构造实现这些任务的完整系统。这种研究事先要把相关知识存贮起来,然后利用计算机的大容量存储能力和快速计算能力对相关知识进行处理。所以,这种研究又被称为“以知识为基础的研究”。随着计算机的速度、能力和各种硬件能力的增强,传统的人工智能在一些专门领域取得了一些成功,比如在下棋方面,“深蓝”已经能够战胜国际象棋大师。但是“深蓝”下棋与人类下棋非常不同。人类象棋大师很多时候靠直觉移动棋子,而“深蓝”则依靠的是它快速计算能力,从成千上万的可能走法中搜索并挑选出一种。因此,以知识为基础的人工智能系统的智能与动物和人类的智能的意义并不相同。人类的智能,甚至动物在对外界环境反应过程中表现出来的智能要比已有的机器人所表现的智能要灵活和自然的多。所以,一些机器人专家开始考虑应当向大自然中的生物学习,看自然界中的生物是如何出色地完成机器人所无所适从的工作的。
从生物进化的角度看,人的智能并不是突然出现的,而是经历了一系列的中间发展阶段。这种发展可以从很多动物身上看出来。所以,一些机器人专家认为,对这些较低层的生物智能的认识可能帮助我们认识人类较高层次的思想是怎么组织的。因此,与传统的人工智能研究相反,新的方法采取自下而上的研究策略,把注意力集中在处在现实世界中可以自主地执行各种任务的物理系统,比如移动机器人上。
威尔逊(S. W. Wilson)可以说是较早进入这个领域的研究者之一。威尔逊认为,智能与生物体对生存的需求紧密相关。正是生存的动力不断界定自然界中的不同问题,从而使生物产生多样性。所以,威尔逊相信,只有从复制动物的智能开始,才能最终复制人的智能。因此,威尔逊在进行机器人研究时,把主要的目标定在制造能够躲避危险、寻找食物、能用动物的方式应付环境的机器人。威尔逊把他的人造生物起名“Animat”。威尔逊主持召开了数次关于Animat的国际研讨会,因此,Animat一词很快就在人工智能和人工生命领域流行开来。
布鲁克斯(Rodney Brooks)也是从80年代初期开始以全新的眼光来看待人工智能和机器人研究的学者。布鲁克斯在研究过程中发现,传统的逻辑程序在机器人的导航方面显得非常缓慢和笨拙,所以他打算能找到一种建造机器人的新方法。布鲁克斯认为,传统的机器人研究先假设真实的世界是静止的世界,当我们把这个静止的世界中的所有问题都解决了,再回到动态世界中研究它。但布鲁克斯一开始就假设世界是动态的,这样就可避免陷入无止境的运算中。布鲁克斯的目标是制造能够处理变化多端的日常事务的移动式机器人,所以,他一开始关注的就是机器人的行为。布鲁克斯认为,为了真实地检验智能观念,重要的是建构完整的能够在动态环境中使用真实的感官和外界发生相互作用的机器人。对外部世界进行完全表征的内部模型,即传统的人工智能模型,一方面很难建立起来,另一方面对机器人的行为并不必要。
基于这样的认识,布鲁克斯认为,新的研究应当强调以下几个方面(Brooks 1991):
(1) 现场化。机器人被放置在现实世界中,它们不处理抽象的描述,而是直接对其所处的外部世界作出反应。
(2) 实体化。机器人具有身体,用身体直接感受动态的外部世界。
(3) 智能化。这些机器人看上去应当表现出智能,但是智能并不只是来自它的计算引擎,而且也来自环境世界的情景、感应器内的信号转换以及机器人和环境的相互作用的情况。
(4) 突现性。机器人与其环境之间动态的相互作用以及机器人各部分之间的动态的相互作用可以突现出令人惊异的结构和功能。智能就是突现出来的一种结果。
80年代中后期兴起的这种新的人工智能研究思路,有人把它称为“自主Agent研究” (Autonomous Agent Research),也有人称之为“基于行为的AI”或“自下而上的AI”,以区别于经典的“基于知识的AI”,或“自上而下的AI”。也就是在这时,兰顿发起了首届人工生命的国际研讨会,宣布一门新的学科:人工生命的诞生。兰顿认为,人工生命的最终目标是建立具有智能的人工生命。但人工生命不是直接走向智能,而是先从研究低层生命开始。某种低层生命构件的存在提示我们寻找解决智能问题的新方法,从而有计划有逻辑地取代其它方法。可以看出,兰顿的感觉和威尔逊、布鲁克斯等人通过对相对简单的生物行为进行研究使机器人先具有低层次的智能的思想极为相似。正由于此,基于行为的人工智能研究与人工生命融合在一起,成为人工生命的一个重要组成部分。它们相互补充,相互推动:一方面,人工生命为基于行为的AI在科学上的合法性提供了一个新的理论基础和广阔的活动空间;另一方面,基于行为的AI也丰富了人工生命的研究,成为人工生命的一个重要组成部分。
三、自主机器人的包容结构
由于传统人工智能集中在“推理”上,所以,在建造机器人时,采取的是“感觉-建模-计划-行动”(sense-model-plan-act)框架。正如前面所说,早期的机器人都被放置在简单的人工世界中,它们感觉这个世界,然后思考它,努力建立关于这个世界的二维或三维的模型。接着,它们根据这些模型做出计划,并通过这种计划使机器人产生获得特定目标的行为。
但布鲁克斯认为,机器人从感觉到行动完全不必如此复杂,只需要两个步骤就可以:即感觉,然后行动。机器人感觉到某种东西,然后对这种感觉做出反应,完全没有必要有“构建模型”和“做出计划”两步。如何把这种思想变为现实呢?布鲁克斯把机器人的不同行为看作是紧密交织在一起的类似模块化的东西。机器人在给定时刻根据它的感官接受的信息的不同,选择适当的行为。本质上,机器人的行为类似一个巨大的有限状态自动机。关于机器人的环境和当前状态的信息将根据规则得到处理,这些规则并行地运行,而机器人的行为则从这些运行可能导致的一系列持续的活动中突现出来。
布鲁克斯认为,运用这些新的观念,新的机器人可以放弃传统人工智能范式所要求的那些复杂的计划、映射(mapping)和认知等内容。新的机器人具有许多在适当时候能够触发其行为的模块层。模块层的最顶端的行为模块可能是“探索”(explore)模块;靠它下面的是“行走”模块;接着可能是一组更低层次的由腿部感官输入决定的行为。与传统的自上而下的运作不同,布鲁克斯的机器人从最低层开始向上活动。
由于这些过程允许一种行为包容控制另外一种行为,比如,利用低层次的行为让机器人应付外部世界,利用高层行为让机器人寻求目标,因此,布鲁克斯把他的理论框架称之为“包容结构”。包容结构与传统人工智能的中心控制模式完全不同,具有如下几个特点:(1)没有关于外部世界的中心模型的位置;(2)机器人的知觉、中心处理和制动系统紧密联系在一起;(3)通过在已有的网络中增加新的更多的行为网络,可以增强系统的能力;(3)层次与层次之间没有高低之分;(4)各种行为并行起作用。布鲁克斯认为,这种包容结构可以避免传统人工智能研究框架的认知瓶颈,并且可以利用它建造能够突现出复杂结构的行为。他相信,利用这种包容结构,就不会有任何障碍阻止我们建造越来越聪明的机器人,包括人类水平的智力。
四、艾伦、赫伯特和根格斯
布鲁克斯以及他的实验室的研究人员利用这种包容结构设计了多个机器人,其中最早的是“艾伦”(Allen)。不过,艾伦最初的成功却主要是通过计算机模拟而不是通过实际的机器人制造。艾伦共有三个行为层。第一层用于避开障碍物,第二层用于随机游动,第三层用于朝远距离移动。艾伦可以沿着墙走,可以识别门口,但由于它的程序是在LISP机器上运行的,所以,艾伦并没有成为完全自主的机器人。
利用布鲁克斯的包容结构制造的第二个机器人叫做“赫伯特”(Herbert)(根据人工智能的先驱Herbert Simon的名字命名)。赫伯特的包容结构由24个松散连接的8比特处理器运行。赫伯特装配有30个帮助它躲避障碍物的红外线感应器。它依靠一个以激光为基础的视觉系统辨别物体。它还有一只用于抓东西的机械手。赫伯特可以根据它从感应器获得的信息在实验室中走动,可以沿着墙走,可以躲避障碍物,也可以从地上捡起苏打罐。
最能体现布鲁克斯机器人制造思想的是“根格斯”(Genghis)。根格斯是布鲁克斯实验室研究人员制造的一个类似蟑螂一样的六条腿“机器人”。它的身体是装有计算机芯片的金属底盘;它的腿是带有橡胶套的金属棒;它的头上有一排六个像灯一样的感应器;从它的胸部突出来两个硬的像胡须一样的电线。根格斯之所以如此命名,是因为它可以踩踏在别的物体上行走。虽然根格斯的六条腿可以协调一致向前走动,但它的每条腿都是独立控制的。每条腿都被赋予几种简单的行为规则,以便在不同情况下它们知道应当怎样移动。
在基本的行走行为被创造出来以后,布鲁克斯等人又开始为根格斯添加更多的感应器和行为层。其中一些感应器监控根格斯晃动时身体倾斜的角度,其它一些感应器跟踪腿在摆动中的力度的大小。根格斯利用从这些感应器得来的信息,又产生出一些新的行为,这些新的行为可以帮助它走得更好。在添加新的行为时,研究者并没有对原来的行为做什么修改。新的行为只是在条件需要的时候覆盖在基本的行为上。这些高层的行为在不需要的时候将不起作用。
根格斯的这种包容结构使它的能力大大增强。现在根格斯不仅可以在平坦的地面上行走,而且可以在高低不平的地面上行走,甚至可以在斜坡上行走,还可以翻越像电话号码本那样的障碍物。在这个过程中,没有人“告诉”根格斯在遇到像电话号码本、斜坡等特殊情况时,应当怎样移动,但它在遇到这些情况时可以很好找到解决问题的方法。根格斯的这些看似有智能的活动,实际上是从各种没有智能的活动中突现出来的。所以,根格斯的行为鲜明地体现了布鲁克斯的一个重要设计思想:复杂的智能行为是从简单的规则中“突现”出来的。根格斯从1990年一直到1997年,都是MIT移动机器人实验室的明星。后来,根格斯被有更好行为表现的机器动物——阿提拉代替。
五、考格:基于行为的人形机器人
布鲁克斯是在对传统人工智能的研究的批评中提出他的新见解的,所以,尽管他在机器昆虫(他也把它叫做robot)的研究方面取得了令人瞩目的成就,但他也遭到一些坚持传统研究方法的人工智能学者的反对。这些人论辩说,布鲁克斯所做的工作只不过是表明,模拟低等生物的智能是容易的,但这种模拟与人的智能是不相关的。布鲁克斯及其追随者给自己设定了较低的标准,因此,他们取得一些没有令人失望的结果并不令人惊异。这些人的言外之意就是说,传统人工智能研究没有进一步取得令人瞩目的成就,只不过是因为研究者为自己设定的目标太高。面对这种挑战,布鲁克斯开始思考运用他的方法制造类人机器人。他最新的研究项目“考格”(Cog)就是迎接这种挑战的尝试。
与布鲁克斯及其研究生们制造的机器昆虫类似,考格的智能也将是在直接与外部世界相互作用中表现出它的智能的。所不同的是,考格是具有类似人的外表的机器人。用布鲁克斯的话说,创造具有人的外形的机器人考格背后的一个假设是:类人智能需要机器人与外部世界有类似人的相互作用。具体地说,布鲁克斯认为,制造具有类人外表的机器人的原因有两个。首先,我们的身体形态对表征我们的内在思想和我们的语言是至关重要的。如果我们要制造一个具有人的智能的机器人,那么它就需要拥有一个类似人的身体,以便能够发展类似种类的表征。不过,因为我们制造的机器人身体只能是人的身体的粗糙的近似,所以,这样做时一定要注意把握住人类身体的本质方面,而不能只是模拟了人的身体的无关紧要的方面。其次,制造具有人的外观的机器人,人们就可以更自然地以人的方式与这样的机器人相互作用。因为人类的一个重要方面是与其它人类相互作用。如果机器人具有人的外观,那么,人与它的相互作用就会更容易和更自然。布鲁克斯等人已经观察到,只要类人机器人发出一点点类似人的信号,人们就会自然地进入到好像它就是人的相互作用模式。从这种相互作用中,我们可以得到很多人与机器人动态相互作用的事例。这些事例对积累制造具有类人智能的机器人的经验是至关重要的。
迄今为止,考格装配有躯干、胳膊、脖子以及装配有眼睛和耳朵的头部。躯干被放在一个能让它尽可能转动的座架上。身体的大部分装有给胳膊以动力的齿轮和随动系统。身体和胳膊用橡胶皮肤覆盖着。橡胶皮肤上装有感应器,这样可以让考格知道它的身体在干什么。考格的脖子可以转动,这可以使它看到它所感兴趣的东西。它的两个眼睛可以协调地移动,也可以伸缩和变焦。它的头部运用了一种与人类相似的可以自动地使头部保持平衡的前庭系统。考格也有一个大脑,但与传统的人工智能研究者运用的单一的序列处理器不同,考格运用多个并行的处理器,以使考格的大脑更自然一些。人的大脑工作起来就类似一个并行计算机,因为它在同一时间能够处理很多不同感官的信息。考格大脑的并行处理器将帮助它协调各个独立的组成部分的活动。脖子、头和眼睛的协调运动要求它有相当的并行处理能力。考格不同的感觉系统也要求有自己不同的处理系统。这与我们人类的感知觉系统是平行的。我们不同的感觉是紧密联系在一起的。各种感受,比如嗅觉、触觉、视觉、声音、味觉等,共同起作用,形成了我们对一事物的认识。考格的认知系统是从感觉开始的。布鲁克斯说,“我们从这种感觉水平开始建造类人机器人,所有的智能将建立在对感觉信息或从感觉中衍生出来的信息的计算的基础上(Brooks & Stein 1993: 4)。”
考格的研究仍在进行,它还没有腿,不能自由移动。也许是意识到复制人的智能的困难,布鲁克斯说,他并不打算让考格具有成人水平的智能,考格要是能够达到类似两岁儿童的智能,就可以了。布鲁克斯是不是又降低了自己的标准了呢?这次,布鲁克斯是否也能成功吗?