通用智能的一些重要概念 – 邓范鑫——致力于变革未来的智能技术

本文粗浅地讨论我对一些重要概念的理解：记忆理解概念特征世界识别比较归纳预测激励推理视觉推理陌生事物新鲜感发现异常生成网络尝试想象动机目标驱动脑中图灵机盲源分离目标达成世界模型回忆注意力感知判断感觉世界feeling

记忆（Memory）——有很多子类型，比如短时记忆、长时记忆，情景记忆、陈述性记忆、程序性记忆等等，不一而足，记忆直接对应着连接关系与其权重，将0也看成权重的话，本质是权重对外界影响的落实。比如一个场景，连续的感觉输入包括相关概念的唤醒，也包括时间性感觉和概念，时间性的记忆由前后关系型连接建立，发生的事物、以及事物的空间和时间关系都影响着大量连接的权重，尤其是一过性场景能形成长期记忆，可能以来脑中的回放机制来加强记忆。短时记忆机制的已逝性和与长时记忆的可塑性，说明权重变化既是敏感的也是可加强的，有可能不同特性的连接用于不同的功能，有些连接比较迟钝，权重落实慢，需要反复刺激，有些权重落实快，增加快降低也快，可塑性太强，反复变化，不便于长期记忆。说到记忆，往往指的是我们意识能感知到的知识、概念、生活经历等等，但实际上类似于感觉初级皮层的功能形成与意识可感知的记忆形成本质都是权重落实问题。只是大脑很难意识到初级皮层的感念，初级皮层的权重形成也是倾向于统计上的落实。而记忆更倾向于一次性的权重落实，和反复单一刺激强调的权重落实。所以无论是情景记忆、程序性记忆，还是陈述性记忆，都是不同类型的输入建立关联的过程而已。回想是记忆落实和加强的重要手段，例如恐怖性经历会刺激本能反复回想该记忆，从而会终身难忘。难忘的记忆征用了较多的记忆资源，并且时常回放进行巩固，轻描淡写的记忆动用了较少的记忆资源，又很少回想，这些记忆资源慢慢被其他记忆所替代。

理解（Understanding）——不理解带来的便是困惑，自然环境下可能会不知所措，理解可以增强自信减少不安全感，人类追求理解是为了追求对世界的掌控，因而理解和困惑本身可能与旧脑有关。所以从智能科学的角度来讲，理解是为了储备逻辑知识，从而完成智能任务。“理解”本身是一个复杂的概念，理解可以解决陌生感和好奇心问题，当问题或概念得到一个解释集，哪怕不是科学的，都有可能达到理解的感受。理解的本质是将逻辑和概念得到无矛盾的符合逻辑的解答和解释。比如举一个简单的例子，比如看到一个陌生的动物，会问这是什么？当得知它的名字是鹧鸪，我们可能便停止追问，心中的疑惑便解除，而不是继续追问，他有什么习性、是不是一夫一妻、寿命是多少？命名是我们习得的一种发问习惯，也是语言逻辑的基础，所以遇到陌生物体时，会优先解决语言结构的基础问题，命名之后才能方便地进行语言组织和逻辑推理。但如果向一个远古时代的人展示计算机就不是一句话能说清楚了，但如果能进行类比也许一部分求知欲不强的人也能达成理解。所以不同人对一个事物的理解程度不一样，关键在于他内在逻辑模型的发问是否得到解决，比如你向一个人解释某种疾病的原因时，说是病毒入侵导致的身体损伤，将人体世界与战场进行关联便解除了他的困惑，达成了理解，他不太可能继续追问，病毒有意识么？怎么知道入侵？所以我们的精神世界有一个内部求知架构，满足架构需求的答案便达成理解，至于为什么一个后台的求知模型可以影响情绪？这就跟获得一个想要的玩具可以开心是一个问题。我们在讨论目标达成时涉及这个话题。

概念（Concept）—— 这里的概念被泛化到一切表示。特征也可以归属概念范畴，概念的属性，我们常称之为特征，我们将该特征也泛化成一个概念，而事实上有时它的确就是传统意义上的概念（比如颜色），统一用概念来代表一切表示，可以帮助我们理解大脑灵活的组合结构。无论是意识可感知还是不可感知，无论在高维还是低维，概念是一切关系的基础，有时概念也被称为实体（entity），概念与关系构成了智能的最重要的基石。通过学习获得概念，通过学习习得概念之间的关系，再运用概念和概念关系到现实生活。

识别（Recogonization）—— 是大脑对事物辨出的过程，即一个概念根据输入的特征概念得到其附属概念激活的过程，识别只是概念激活的一种，特指由感觉输入引发的偏具象类概念的激活，不包含联想激活、搜索激活、推理激活等直接激活路径，所以识别的特性是间接激活，是从低维概念特征中激活高维概念的过程，这些高维概念也往往是从这些低维概念中学习出来的，当然通过训练建立概念关联，也可以建立更加直接快速的激活过程，有的时候我们也看作是识别过程。一个激活是否被看作是识别，主要还是我们在观念里是否任何输入与被激活者之间是否有从属关系。

比较（Comparasion）—— 比较在脑中的实现原理是比较难探寻的。一个简单的模型是输入解构为事物概念+强度概念后，基于强度概念的比较来完成，因为同一个输入可以同时比较多个层面，比如大小、亮暗、远近、高低等等，但比较是如何发生的呢？我觉得方法不是单一的，有的是借助推理、有的是借助小脑，有的是借助类比。所以比较本身也是一个概念，可比较性多数是现实世界的事物变换性而来。

归纳（Induction）—— 归纳是一个逻辑过程，是演绎推理的反向过程，对于智能活动有重要作用，归纳的基本过程是这样的：两个概念具备相同的概念特征，而两个概念都另一个概念发生关系，则这个共同的概念特征便于另一个概念也发生关系，这种将两个或多个关系基于共有特征合并成一个关系的过程，就是归纳。归纳是建立和简化知识的过程，是不断提炼高维知识的过程，也是科学本身发展的基础，但归纳本身并不是符合科学原则的，所以人们很容易武断地将小量的观察共性归纳成所谓的“真理”。很多归纳总结发现是经历的一个相当长的时期和反复的刺激以及思考学习，直到新的更抽象的知识引起注意，所谓顿悟。注意之后的学习将新模式加入“模式库”，成为储备知识。当然有的时候太过明显注意即可发生，归纳的速度就很快。归纳本身也有元模式，这些元模式的学习可以帮助我们加快归纳。

预测（Prediction）—— 预测也常常用来定义智能，比如认为智能的目的就是预测。预测并不是脑中的一个机制，是大脑机制的目的，一个识别就是一个预测，理解的达成也是为了预测，动用更准确的知识进行逻辑推理，从而得出更准确的结论。我们的每一步熟练的动作，比如走回家中拿起钥匙，都进行了大量的预测，大脑学习并建立关于物理世界的空间知识，熟练的运动机制知道以多大的力气抓起物体，精准的识别让我们抓起了钥匙而不是充电器。

激励（Reward）—— 是智能体的源动力，没有激励，智能体便跟石头没有区别，无论是外在目标还是内在目标，目标的达成之时便是奖励的发放之日。但值得注意的是，目标达成和奖励不是两个东西。目标达成本身便是奖励。一些目标会导致我们产生愉悦，所以我们会认为这种目标达成是一种奖励。所以我们通常智能理论里面提到的激励应该融入到目标驱动框架。

推理（Reasoning） —— 推理实际上可以摆脱语言而存在，比如视觉推理、运动推理、逻辑推理，推理是问题求解的利器，大脑天生就是一个问题求解器，它尝试通过预测来求解问题，间接的关系无法直接预测，便借助推理来进行。逻辑推理中的归纳推理前面已经讨论，归纳推理主要在于发现新的更加抽象的知识，为建立更加简单易控的世界模型做准备，也利于发现事物的本质。演绎推理（Induction Reasoning）是从一般性命题推广出更多命题，比如三段论，A、B->C，其本质是得出不与A、B相矛盾的新命题，所以演绎的本质依然指向问题求解，通过保持不矛盾而得出的新结论是可以预测现实世界的，这才是矛盾本身解决的目的。矛盾不是天生的大脑能力，而是对现实世界事物关系的刻画。所有的推理都是基于这样的本质，归纳从科学上将是不科学的，在很多情况下很奏效，因为拥有共性的事物，所蕴含的外延关系往往持续有效。溯因推理、类比推理都是类似，是对各种事物关系的计算手段，通过关系计算得出新关系用来更有效的预测。这也是贝叶斯推理（Bayes Inference）理论非常现实有效的原因。推理的类型如此丰富，让我们怀疑大脑如何运用统一原理做事，我们不可能天生内置这些推理能力，这些推理能力都是世界运行逻辑在大脑的投影而已。掌握逻辑本身是需要学习的，但目标驱动本身不是。一个人可以天生不讲逻辑，但它要完成一件事，一定要付出动作，尽管错误的逻辑导致无法做出正确的动作而达成目标，推理的目的是提供预测准确度，已完成目标达成，才能行之有效。

新鲜感（Familarity）——陌生感（Novelity）、新鲜感指向的同一个事情，大脑对陌生事件的强烈关注。既然有陌生感，就有熟悉感，那么这种熟悉的感觉或陌生的感觉到底是什么呢？一些研究表明broadman 35和36区统称Perirhinal cortex(鼻周皮层)，掌管item memory（实体记忆）以及编码对实体的熟悉程度。该区域受损的小鼠会对熟悉的事物和陌生的事物抱有相同的探索兴趣度。item memory不同于source memory，source memory指的是真实的记忆场景，而item memory则是进行一定抽象后仍有一定具象性的记忆，这个过程和概念的学习是一样的，只不过是视觉场景下的概念学习特例而已。编码熟悉度是神奇的，而且是跨物种的，智能体可以根据熟悉度可以进行更有效的世界探索。异常和陌生有种莫名的关系，异常发生在预测失算的时候，当我们认为一个地方应该出现某件事物时，发现并没有出现，我们越确定应该有，就越觉得异常。两者的关系便是如此，我们越是熟悉的事物，会越觉得预测的把握大，而陌生事物的出现，让我们倍感异常。

异常（Exception）—— 负反馈机制的目的也是解决准确预测问题，让一切在掌控之中，所以意外事件或异常事件都是会严重引起注意的，既帮助重新预测，也帮助学习新情况。当一切都在掌控之中的时候，大脑就会比较悠闲，注意资源得到放松，比如一个开车新手甚至都不能跟其他人说话，而老手则可以自如地干很多事情。学习的目的是尽量消除异常事件，学习到的意外，要么以特例记忆，要么归纳后记忆，让新鲜事件在以后出现时变得可掌控，不再增耗注意资源。关于注意力的分配是一个十分庞大的议题。

尝试（Try）—— 在强化学习中随机化动作是一个十分重要的环节，大脑中的尝试相类似，但更加有效一些，更启发式一些。尝试、随机化动作是探索世界的核心，从最远古的海洋生物中便已存在。随机化提供了大量的新知识获取机会。也是大脑中世界模型建立的一个重要基础，甚至是最大基础，尤其婴儿期对于世界的认知便来源于大量的好奇心和尝试。

想象（Imagination）—— 本质上也是一种推理，给予一个前提不断推演后续的种种可能或者必然。

动机（Motivation）—— 目标驱动的核心概念。目标驱动是智能体解决问题的核心运动模式。

脑中图灵机（Turning Machine in Brain）—— 图灵机的核心组件是注意力和表，映射在脑中，是注意力和概念关系。其实本质是讨论注意力，之所以强调图灵机是因为这个议题特别值得讨论通用智能问题，以及用于类比。其实脑中图灵机也在目标驱动框架下运作，比如图灵机的状态决定注意的转移 => 状态决定采取的动作（该动作可以是注意的转移）。

世界模型（World Model）—— 大脑对世界的理解反应在脑中的世界模型里。构建世界模型，是大脑的主要任务之一，构建有效的世界模型，便可以进行准确的预测。模型本身也是推理和预测的基础。

盲源分离（Blind Source Separation）—— 是世界模型构建是否正确的检验机制。正确的盲源分离可以使人达成理解，不会出现异常，肯定世界模型的构建的正确性。

判断（Determination）—— 此事印证了越简单的事情越复杂。在计算机中相同判断是十分简单的，逻辑电路比较器承担了相等判断的职能。但脑中相同判断是如何发生的？我们知道相同的概念是如实发生的。识别过程中，相同的pattern有很多神经元来代表，但意识可感知层面并没有认为他们是相同的，但在高级脑区，相同的事物往往有相同的簇来代表。这些不同的概念神经元簇构成了庞大的特征库（感觉世界）。目标驱动中也涉及目标达成的相同目标物匹配问题。匹配是一个核心而且无法绕过的问题，一个简单的实现是核心机制中构造一个匹配器，比如将期待物与输入进行比较，比如一些动作目标达成的判断，物体的位置是否达到指定地点。匹配其实可以外延到各类关系的判断，比如可推理关系、比较关系（大小比较、远近比较），所以相等更多是关系的一种，但是否为该关系本身蕴含了一个能力就是“是否”判断，所以我们本质要探讨的是“是否”（通俗讲：就是这个感觉）判断机制以及如何参与到整个智能机制里。比如我们的目标是把杯子放到桌子上，杯子在桌子之上这个关系是可以被辨识出来的，辨识导致“之上”关系的概念被激活，“之上”概念与我们期望的“之上”关系是如何匹配上的呢？目标驱动机制一个简单例子里我们可以这样做，我们期待A，而A可以引发B，则我们将A作为输入，可以用一个输入导引网络来实现，一旦A激活，该网络可以引发B。这个实现方式需要进行更广泛的讨论，是通用智能的核心议题。