这是鼎叔的第七十七篇原创文章。行业大牛和刚毕业的小白,都可以进来聊聊。
欢迎关注本公众号《敏捷测试转型》,星标收藏,大量原创思考文章陆续推出。
鼎叔的个人专著《无测试组织 - 测试团队的敏捷转型》,近期已由机械工业出版社出版发行 https://item.m.jd.com/product/14105386.html
,各大平台热销中,全书有 15 章,30 万字,350 页,干货满满,欢迎购买。

人工智能的思考本质,和人类大脑的思维原理高度相似。我们从大脑精神活动的 6 个层次的剖析,可以领会到机器是如何产生意识的。
本文观点参考《The Emotion Machine》,作者 Marvin Minsky,获得图灵奖的人工智能科学家。
PS:大晚上研究这种大脑意识的半哲学概念,真的很容易失眠图片图片

批评家资源和精神活动层级
常见的心理学词汇是很难表述人类大脑中的复杂过程的。人类大脑包含着复杂的机器装置,我们可以认为大脑由很多 “资源” 组成,每种主要的精神状态,如 “愤怒”,能激发一些资源,使其能够快速有力地做出反应;同时会压制让人更加谨慎的资源。

我们把同一类的资源集合称为 “批评家” 资源,部分批评家是与生俱来的本能激发,如愤怒、恐惧和饥饿。另外一些激活方法是后天成长学习得来的,这些情感状态被称为 “理性”。

情感是人们用以增强智能的思维方式。当我们能用多种思维方式表征某事物时,一旦遭受失败就可以切换其他的方式,多样性正是人与动物的主要区别。以此类推,人工智能的创建也要确保思维的多样性。
我们先从婴儿行为的机制,来看最简单的本能机是如何设计的。
一个本能机需要三种资源:条件识别途径(如眼睛,耳朵),反应规则(If-Then-Do 规则),动作执行肌肉群或神经。If-Do 规则就类似:如果觉得冷,就去找暖和的地方。当这些规则以某种方式组合时,就可以解释动物的多种行为。

结构复杂的机器的行为,只取决于不同零件及相连接零件的关系,和制成零件的材料无关(除了影响速度和力度外),大脑内部运作也如此。
大脑就是各种零件资源组成的统一体,每一种零件负责特定工作,如识别不同的模式,或监督不同行为,或传递目标计划,或存储大量知识。

当几种选择同时出现,即一些资源同时受到激活和压制,就导致 “喜忧参半” 的心理状态,就需要寻找一些方法处理相互竞争的矛盾。大脑便从低层次的思维机制中产生高层次的全新思维方式,排除矛盾,找到单一选择,体现了人类连续地、逐步地思考过程。这些思维过程到最后就发展成了我们自我模型的集合,孩子通过思维成长就能控制更多的新资源,直到可以对自己的动机和目的进行思考或表征出来。

所以,成人大脑的精神活动有六大层级,从低到高分别是:本能反应,后天反应,沉思,反思,自我反思,自我意识情感。被激活的资源能极大改变人的精神状态,有些甚至引发激活的连锁反应(大规模级联)。
弗洛伊德的 “超我,自我,本我” 思维理论,也对应着这些精神层级。

当 “自我意识” 进行目标反思时,我们非常有可能改变目标的优先级。价值观和目标的形成早期,受到我们所依恋的人的影响非常大,这个依恋对象就称为 “印刻者”。
如果我们想要某种东西,大脑就会处于积极的精神活动中,把当前目标拆解为子目标,通过成功机制巩固特定的资源联系,失败时也会压制联系。人们在学习时不仅学习制造联系的问题,也学习制造能被联系的结构,即思维的记忆和反思。

每个人至少拥有三种批评家,帮助人从错误中进行学习:
纠正性警告,corrector,宣称你正在做的事很危险,这时可能为时已晚。
外显抑制,suppressor,在你开始采取行动之前中断了。但它们需要花费一些时间,从而使你反应迟钝。
内隐束缚,censor,为防止想法产生而趁早行动。就像内存充足的机器通过识别错误思维方式的若干步骤,引导你以某些方式来思考如何规避。
人类的大部分智能来自不同批评家思维方式之间切换的能力。当一个人狂躁时,就可以关闭大部分 “批评家”,然后打开一部分批评家,用怀疑的心态来检查这些选项,最后选择一个看似可行的选项执行它,直到 “批评家” 抱怨 “你已经停止进步了” 为止。
每个批评家都会学习识别某些特殊类型的精神状态,一旦发生就试图激活一个资源集,在不同的精神层级上都会出现这种 “批评家 - 选择器” 结构。因此这些 “批评家” 必须得到控制,开启太多会导致一事无成,开启太少会导致丧失新追求。
当然,批评家直接关闭 “资源” 是非常危险的,比如 “饥饿” 很容易关闭就会导致轻易饿死。这是大脑进化为本能反应的方式,让生命能够更好的延续。

意识是什么
意识是一个大箩筐,囊括了各种不同的精神活动,导致我们很难定义它。
根据精神活动的六大层次,我们可以把大脑抽象成不同层次的脑,它们协同工作:
本能反应/后天反应 A 脑:从外部世界获取信号,并通过信号驱动肌肉。本能反应是 “与生俱来” 的,后天反应是对 If- >Do 规则的学习,比如动物看到马路上飞驰而来的汽车会闪避,就融合了两种反应。
沉思 B 脑:通过控制 A 脑的反应来影响外部世界,执行单一目标。每个目标就是一个 If+Do->Then 规则,如果飞驰来的汽车速度不快,我就冲过去;如果汽车速度快,我就退回马路边。任何一种行动链条都有瑕疵。
反思 C 脑:当 B 处理 A 时,C 反过来监督 B。就好像 C 是经理,传递一般性指导,B 是员工,做一个特定行动。C 会在事后回忆当时的决定,反思哪里可以改进。如:我觉得快速跑过马路是合理的,但我忽略了受伤的膝盖会拖慢我的速度。
自我反思 D 脑:之前的决策行动正确么?自我反思有助于我们制定更好的机制,形成新的思维方式。
自我意识 E 脑:我的行为遵守了自己的原则或理想么?

较高层次的大脑往往更喜欢连续性操作,会逐渐把复杂问题拆解为多个部分并关注其顺序。

我们不希望大脑演变成一个高度互联的网络,正如软件工程师不希望大型系统过于笨重一样,系统规模的增加如果快于设计的改进,就会产生严重的性能问题,升级时更会出现各种漏洞。
同时,大脑的思维又无法被观测,因为大脑的每一部分所做的工作都是其他部分不能观测的,如果任何一部分试图检查另一部分,对这部分的探讨可能改变其他部分的状态。这就有点像量子力学的测不准原理。
大部分精神活动并不会触发思考和反思,只有运行不顺利或者遇到障碍时才会启动高层次的思维活动,大脑中的 “故障探测器” 会激活其他高水平的过程,如:自我模型(朋友们怎么看我),系列化处理(按一定顺序处理),符号性描述(语义网络,这也是人比动物更能理解复杂事物的原因),近期记忆。

人类解决问题最有效的方法并非建立在大范围搜索的基础上,而是基于如何使用大量常识性知识来 “分割和克服” 面对的问题。
早期的人工智能视觉程序运行效果不佳,就是因为低层次的程序无法识别过多特征,也无法把特征组合成大的物体,比如一个动物的不同部位都有相同的花纹细节。AI 程序的改进策略就是自上而下,从高层次过程往下处理,“高层次” 描述会通过对熟悉物体的 “提醒” 来识别 “物体”,省掉不相关的细节。比如看到茶碟物体就能判断这里可能是厨房。

常识
计算机和 AI 犯过的错误成就了世人的无数笑柄,背后的主要原因就是现代程序不具备常识性知识,也没有明确的目标感,它不知道为什么要做这些事,也不会辨别是否达成了用户的预期。缺乏常识,也是计算机不会从经验中学习的原因。
很多常识背后的思维链条,比大牛们的精湛专业技能要复杂得多。
每个人获得了知识,可能只是碰巧掌握,也可能是显而易见的,因此想 “预测别人是否有共识” 的难度很大。一个非常简单的电话互动,可能涉及到很多不同的知识领域,需要海量的知识才能真正理解 “每个人都明白的事”,而每个人的词汇表达可能也有细微的差异。
那我们是否可以让 AI 程序从刚出生的儿童机开始模拟,不断学习,逐渐变得有常识呢?
实际上不太可能成功,因为学习避免常见错误是可行的,但不能从大量非常见错误中学习。
正如前面提到的:原有系统效率越高,系统相连的部位越多,系统的每个变化就会降低效率,导致找不到能改善自身的方式。除非我们把整个系统分成独立运作的各个部分(类似生物学的 “器官”),器官内部活动互不影响。
计算机系统和人脑的 “记忆” 会激发上万件事,把人们给淹没,导致无法获得当前需要的信息。
借鉴前面的高层次目标思路,为了让机器能够坚持 “目标管理”,1957 年出现的 “通用问题求解系统软件”,就是对当前和未来情况的描述进行比较的 “差分机”,锁定显著的差异点,利用设计好的算法来缩小差异,如何一个步骤使事情变得糟糕,系统会自动 “回滚”。这也是机器学习算法的雏形。(可惜软件团队没有继续增加 “反思” 等层级,让系统 “能停下来思考”)。

常识和专家的技能类似,就是不需要高层次思维参与,可以随时重复和使用的动作或者脚本。大脑神经科学提到了,经常使用的动作会让大脑细胞之间的突触产生更好的连接(良好的传导性)。当信号在大脑的低层次不断重复,高层次大脑就会被 “麻痹 “(视而不见),从而把资源更多用于追求自身的想法。
传统计算机不像人类擅长进行 “相似推理”,除非我们找到描述事物本质不同的方法,告诉计算机原始对象和类比对象之间的关系描述和差异描述,这个新发现也是我们强大的常识性过程之一。
从强化学习的角度来看待对机器的训练,我们通常从失败中学到的东西比从成功中学到的多,只奖励 “成功” 可能会导致死板(系统难以适应新的情况),带来不良副作用,因为替换某个运作良好的资源很可能会破坏其他过程的表现。同样道理,“快乐教育” 方式会妨碍孩子们的思维进步。

记忆和创造力
现代计算机出现之前的机器,只能胜任一种任务,而人类却不同,一旦陷入困境,就可以想出其他解决问题的方法。
人很少有全新的想法,却通常在已有的想法上修修补补,或把新想法和原有想法的一部分结合起来;人也能通过练习 “类比” 的方式,使用相同的结构完成不同的目的。人类和动物一样,通过不断重复形成新的长期记忆,每一条记忆都必须和一些链接相连,才能在相关的时候激活这条记忆。
当大脑学习 “IF- DO” 的规则时,它既不能太宽泛(太随意的规则难以实际应用),也不能太具体(无法适用于不完全相同的情况,这样的话就要记忆无数条具体规则)。
只记录解决问题的方法最多有利于解决相似问题,但如果记录下 “我们是如何发现解决方法的”,就有助于处理更广泛的问题。
因此,我们最终实现目标时,应该为高层次思维方法(如自我反思层)进行信用赋能,而不仅仅只存储答案,更要改进自己的策略,甚至把学习迁移到其他领域。
如何解释有的人是有创造力的天才,或者说,为什么他比其他人更智能?我们认为,原因并不是他能想出多少种想法,也是这些概念多么新颖,而是他们如何选择新的想法,能够尽可能延续思考和发展,他能够养成一种享受 “失败带来的不适” 的习惯。

人类大脑有着独一无二的能力,就是能把一个想法 “概念化”,为了创造并使用新的概念,我们必须使用存储在大脑网里的结构形式来表达这些新想法,这些概念互相关联,构成了 “知识”。
大脑表达事件的最常见方式,就是把它当成即时描述系列事件的脚本,而这也是计算机语义网络擅长的描述,一系列脚本就像一个传送框架,描述了本次事件旅程开始之前和之后的条件,包含了多个表达意思的槽,这些槽涵盖了大量我们称之为 “常识” 的知识,帮助人们无需询问就能获得答案。
大脑在解决问题时会同时激活两种资源集,一种用于当前的思考,另一种用于记忆,你可以把他们和其他资源相结合,用一个新知识线的形式存储起来,你就为新的思维方式创造出了新的选择器。

传统的机器学习确实能够学习做一些有用的事,但很少有机器能形成较高层次的反思思维方式,可能的原因是它们尝试用数字去表征知识,很难产生有表现力的解释。


↙↙↙阅读原文可查看相关链接,并与作者交流