为了能更通俗易懂,可能会稍冗长一些。
AI要具备有和人一样的信息推理演算而达到预测的能力,那么必不可少的就是首先对物体/事件进行初始化定义,例如这个物体的名称、属性、作用等。 也可以说这是对现实对物体/事件的一种自然语言的描述。
那我们先谈下自然语言,首先说明下我这里对自然语言的定义吧,自然语言是指一切能描述现实世界物体 /事件的信息,例如声音(主要指口语)、符号(书写文字,包含全世界已有的文字,当然图像表示如在纸上画个苹果其实也属于符号表示,这里用符号来概括)。这里不管是声音还是符号等描述方式,都用信息来统括(这里可以说成口语信息、符号信息等。后面会提及)。
一个刚出生的小孩,名叫莉娜,她主要通人类五大感官去认知(视觉、听觉、嗅觉、味觉、触觉)这个世界,在没学会说话前, 她只有通过五感去初始认知现实世界,慢慢地当声带发育成熟,他们开始能发出更复杂的声音了,于是开始模仿大人说话,这时就真正的开始了他们真正用自然语言去认知或者说用自然语言描述定义现实物体/事件的旅程了。
如果莉娜出生在中国,我们会把苹果说成苹果(其实我应该用图像表示前面那个苹果会更直观),而出生在英国苹果就说成了apple,在俄国说成了 яблоня等。你会发现,其实一个物休当我们用符号去表示的时候,我们可以用非常非常多的不同符号去表示它。例如我们完全可以用纯数字来表示现有官方语言,像电脑底层用的 二进制交流通讯方式。如果再深入点去看,那就是电子信号的通讯交流方式了,而人的大脑内部其实也是以电通讯交流方式为主。
在莉娜三岁的时候,莉娜不小心把桌子上一个玻璃杯弄掉在地上了,杯子一下子打烂了,她吓哭了,这是她第一次打烂了杯子,她学会了杯子的叫法,但“打烂了”这个状态描述的词语并没有学会。这时他们母亲就过来安慰她“只是杯子打烂了,没事买个新的“。这里无意中就又传达给莉娜了对”打烂了“这个状态的语言定义描述,当然一般不会一下子学会,可能经历数次后才学会这个口语描述。这里再深入一点谈论,假如没有人教她口语或符号描述(这里开始提及信息,如果不明白可参考下第三段的信息定义),这里称为口语信息,那在她大脑储存的方式可能就只有一种,那就是原始图像信息。类似录像机一样,而人与人还无法直接用图像的传递来进行最直接的交流,所以只能声音为主的交流方式来传达信息,符号语言的出现得以让信息记录传承下来。不管是口语还是符号的描述,都是对图像信息的简易信息转换描述方式,为什么说是简易呢,因为一张图像的信息量是非常大的,不可能我在和你口述或书写一件过去的事件时用一张张图片来展示每一个细节,那样我就不是口述或书写了。图像信息是我们对世界认知的第一手信息,也是目前最为具体的信息。当然你可以通过听觉触觉等去认识这个世界,像一些动物,会通过声纳去辨别物体大小位置等,其实结果也会在大脑中形成图像,但却是模糊的。
当一个人看小说或一些文章时,大脑就会自动把符号信息转成图像信息,因为符号信息描述相对图像是简易的,信息转化的同时,一些细节就会不断的自动补充进去,这个就相当于想像一样。如果文章说一个长得很帅,清秀,长发等特征时,也没说是哪个人,这时大脑就会最搜索最符合这些特片的那个人的图像信息展示到你大脑中。因为每个人对物体/事件的描述定义都会有些偏差,所以同一篇文学故事对每一个产生的感想都会不一样,影响的要素主要是她的信息量大小和对物体/事件的描述定义的偏差大小,每个人信息的偏差主要就是因为每个人的经历不同了。相像一下,假如两个刚出生的健康小孩 放在两个封闭空房间里(都不接触其它任何人),然后给它灌输同样的信息,经过一段时间后,他们对同一事件的想法或反应会怎么样呢?我个人认为他们的想法和反应都会非常接近一样的。在现实社会中,两个经历非常相似的人,他们的性格或感想也是很接近一样的。
继续自然语言的探讨,前面说了图像是我们主要认知世界的原始信息(影像信息是一张张图像信息渐进变化的展示的效果,所以这里还是以图像信息探讨为主),声音、符号信息则是简易转换图像信息后另一种呈现方式。再说下信息的存储方式,最初的以符号记录信息,媒质以纸张为主。现在有声音图像的记录方式了,媒质如硬盘、u盘等,慢慢的变成以图像声音为主要存储方式了,因为图像记录方式能更直观的在大脑里展现,同时更能看到更多的细节,而如果用符号记录的事件,很多细节是无法一一记录的,这时大脑就会不自主的补充一些细节,这就无法更真实的还原原本要记录的信息了。这里简单说下存储媒质,人是以大脑这种生物活休来存储信息,大脑在提取信息后的呈现方式是图像;现在符号图像影像声音等信息存储方式基本都是科技产物的物体中。如果你仔细分析下就会发现,人类文明的诞生到现在,转换的信息变得越来越接近原始信息了,我们可以通过科技技术去探测人类无法用眼睛或耳捕抓到的信息,这使得我们对世界的原本信息有更深入的了解。
现在我们更深入点探讨自然语言,人类的智能(分初中高级智能,便于讨论)离不开交流,也就是信息交流和反馈,只有通过交流你才知道她他它是否具有智能,很多动物都只停留在初中级智能。而交流就需要有共识的信息交流方式,口语、符号就是人类的主要交流方式。而动作表情是最直接的图交流方式了,这里主要指不用通过转换成口语、符号后进入大脑再转换一次(<当然有很多在看书时会不自觉得将符号信息先转换成声音信息后再转换成图像,我差不多也算其中之一,这样做的后果就是直接影响到我们摄入信息和存储信息的效率了。当你把符号信息直接转成图像信息时,记忆速度会大大提升,方法就是尽量把一段字句词语快速用图像与之挂勾,即使是抽象类的字句词语,因为大脑最终呈现方式还是以图像为主,当符号和图像挂勾越多,速度越来越快,你也一样可以一目一行一目十行的方式读书了。>)。(<>)上注释写得长了点,纯属个人理解出来的方法,可以自己试练习下,改善下记忆效率。
再回到主题,交流是发现对方具备智能的基础方式,除此你也可以通过观察。说实话,什么是智能,相信大家对智能的定义都会有偏差,想具体了解它的定义可以去百度搜一下。我这里阐述下我对智能的理解和看法。我简单把智能分为三个阶段,初级智能,像平常见到的动物植物,他们具备基本的自我生存的能力,中级智能,像训练海脉、大猩猩等,大猩猩有时会使用简单的工具获取食物,他们具备更好的生存能力,人类,高级智能,具有思维能力,自我认知能力等。想像下,如果一个刚出生小孩放在空房间里,不接触任何人,只提供食物,可想而知结果他也只会像动物一样甚至比动物还差的生存能力,而只具备初级智能。这时你发觉智能是和信息(知识)息息相关的,当一个小刚生的小孩被狼抚养长大时,他会学到狼的生存技能等,然后再跟人接触,接收越来越多的和人类相关的信息时,他是可以慢慢纠正变回和人类一样的生存方式生存。但动物却做不到这样的转变,为什么?相信你也猜到答案了,因为身体构造的不同。那么智能的产生是有限制性的,那就是存储信息的媒质了,大脑独特的结构,大脑处理信息的方式,具备有归纳推理能力和演绎推理能力等。这都让我们具备了产和高级意识的基矗再简单说下自我意识,我相信所有正常的动物和人类都具有自我意识,只是对自我认识的多少不同而已,每个人对自己的认知都是不一样的,这是和个人经历都累积的信息不同而对自我认知定位产生不同。而动物的自多意识只停留在基本生存要求上,同是也是因为他们大脑结构不具备产生高级智能所需的信息处理能力。假如大象大脑和人类一样,相信大象也会有自己文明时代。(<人们很多时候处在迷茫的状态,接下来要做什么,然后又在想做什么,当一个人对自已认知和定位越清楚时,无形中他的目标也会越清楚,他很清楚自己想要得到什么,然后不断设立目标去得到他想要的,这时他就不会这么迷茫而浪费很多时间和精力去确定他想要什么。人类总是想追求快乐,但快乐在每个人的定义又不一样的,是的,我说定义,那你就可以理解成定义是可以随时改变的,一件原本很无聊的工作,当你用积极的方式去定义你的工作时,你就会没那么无聊了,同理,一件很简单但你觉得很痛苦的事,当你大脑把这一定义改写后,你就又新的看法了。当然,要改写我们旧有的信息观点不是一下子就能完成的,只有不断重复改写或者说不断用新的看法去替代旧有观点时,你就开始改变了>)。(<>)个人题外话,随想写下了。
现在我们开始讨论下智能和自然语言的关系了,相信以上的段落能更好的让你理解下面探讨。
我们知道智能是要有硬件基础的,暂且把大脑看成是硬件吧,智能是对信息处理能力的高低来决定智能是处于初级还是中级或高级。那么智能产生的关键就是信息的处理方式上了,人类大脑的特殊构造对信息处理的方式,我们会认为是高级智能的处理方式。那么高级人工智能产生的方法,我们就有两种方式去实现了,第一种制造出类似大脑这么精密构造的机器设备出来,然后再教他知识而产生高级智能,第二种就是模仿大脑信息处理方式,用编程的方式模拟大脑信息处理方式,再教他知识信息而产生高级智能。相信看到这里,可以猜想第一种实现方式以现有科技是还完成不了的,而通过第二种方式产生的初级智能应用是很广了,像工厂自动化设备等,但要达到高级智能还是有很长时间要走,整体现在的科技巨头更多都是投入到第二种实现方式。
我们重点探讨第二种实现方式,这时自然语言在这里就至关重要了,如果想让一个机器人,理解我们说的话,那最基本知识是必须具备的,如物体名称,状态名称等符号描述的知识库,可以说是符号和图像挂勾的整体知识库,和人类一样,例如当你听到苹果,大脑中就会浮现苹果的形像。当然这个知识库不是单纯的名词挂勾,还有像动作、状态的挂勾。当你问机器”玻璃杯掉在地上会怎么样?“,这时机器会答:”会摔破“。要能作出这样的应答,你必须教会他”摔破"这个词语和图像状态。这样反过来你你给他一个玻璃杯摔破的图片问机器玻璃杯怎么了(问玻璃杯现在的状态),然后机器可以搜索对应的符号描述“摔破了"。也就是说整个很多这种事件起初和结果信息都记录在你大脑中了,那么这就不算是推测,那什么样才是推理("推理"百度定义:是由一个或几个已知的判断(前提)推出新判断(结论)的过程,有直接推理、间接推理等)呢,比如有一个你没接触过的物体,掉在地上了,你会想可能会摔破可能不会摔破,当然这里你也可用任意你已知的答案来描述结果状态,这时你还会调用尽可能多信息,比如这个物休视觉感觉它材质像什么,密度等等,然后把所有可能的结果进一步缩小再给出的答案,这个过程就类似推理过程,那大脑所作的就是先搜询这个未知物休信息,如果没找到,就搜索类似信息,然后从类似信息中比较最接近未知物体相应答案。还有预测和推理类似的信息处理方式。这样看起来,现在的数据库都已经具备这样的能力了,那还缺什么呢?
写了二个多小时,先休息下,欢迎大家在发表下自己意见想法,在探讨二中我们继续深入讨论