X-Brain: 大猫带你读“意识”巨著系列（一百）：对自身心智的错误洞察

·感受质能还原为虚拟机的功能活动吗?

还原论和功能主义的回应就是对“第一人称”解释的价值提出质疑，并认为感受质可以被第三人称的、功能性术语完全解释。如果人们能够详细说明一个其行为好像是体验到感受质、理解了意义、从“第一人称”视角运行等等的系统的体系结构，那么(他们声称)没有留下任何再需要解释的东西了。例如，斯洛曼和洛根(Slomanand Logan,1998)提出了一种其功能活动好像体验了许多不同种类感受质的体系结构的理论。例如，内省报告要求系统具有自我监督和自我控制的能力。他们指出，这类系统所产生的“报告”确实是关于虚拟机的状态或内部物理的和生理的状态，但对于斯洛曼和洛根来说，这同样适用于人类的"感受质"。由此可知：

被哲学家描述为"感受质"的现象，可以根据具有将注意力从环境中的事物转移到内部状态和程序的高层次控制机制来解释……这些内省机制可以解释孩子向妈妈描述疼痛位置及其品质的能力，或解释一个艺术家描绘事物看起来如何(而不是它们原本如何)的能力。能向我们(或人工行动者)通报其本身内部状态和过程的软件行动者可能需要类似的体系结构作为感受质的基础。

按照斯洛曼的观点，假定它有一个适当的体系结构，那就有充分的理由相信，这种机器可以坠入爱河。我们如何去确定适当的体系结构?"读读诗人、小说家还有剧作家关于爱情都写了什么",并问自己：“什么样的信息加工机制是先决条件”。斯洛曼指出，例如X与Y相爱意味着X的想法不断地吸引到Y。这需要反思、自我监控和自我控制的能力(并且，人们可能会再加上，焦点注意中的一个系统性偏好，它伴随着自我控制的迷失和聚焦其他事物的能力)。

发现能够模拟人类心智功能的体系结构，无疑对构建更有趣的机器而言是有用的，并且通过对这种体系结构进行分析，似乎会对我们了解人类心智的运作有益。功能分析也会告诉我们有关最接近人脑意识体验的加工形式的重要信息(例如，参阅第4章中有关信息传播的讨论)。然而，斯洛曼以及斯洛曼和洛根也希望阐述关于意识体验的本体论性质的某些基本东西。他们想证明，如果人的意识行为能够以功能概念进行解释，则意识的感受质就可以被还原为“虚拟机”中的“信息状态”。

正如斯洛曼和克瑞斯勒后来所说：

我们从一个试验性假设开始，也就是说，尽管单词“意识”没有明确的定义，它通常被用来指称人类和其他动物信息加工的一簇方面。在此基础上，通过设计、构建、分析和以(试图详细说明这个假设的)虚拟机的体系结构做实验，我们能够加强我们对这些方面可能是什么的理解。这个活动转而能帮助我们形成意识概念以及大量相关概念，比如“体验”、"感觉”、“感知”、"信任”、“欲求”、“享受”、“记忆”、“注意”和“学习”,有助于我们将它们看作依赖于一个心智作为信息加工虚拟机的内隐理论。

遵循这种策略，斯洛曼和克瑞斯勒把“感受质”问题和“他心”问题，转变为关于我们如何通达我们自己或他人的心智状态的问题，这里这类状态完全是用信息加工概念定义的。像这样重新定义，问题便变得容易了。例如，根据斯洛曼和克瑞斯勒的观点，"感受质"问题源于我们注意内部信息加工方面的能力的哲学讨论,并且这样的可能性内在于任何具有适当自我参照体系结构的系统中。一旦人们详细说明了该体系结构，他就已经解决了这个问题。他们还认为：

既通过至少在智能的被捕食的物种、捕食动物的物种和社会性物种中提供概念化他者心智状态的内置装置，也通过由(往往会产生好的设计的)自然选择过程“证明为合理的”选择，演化显然在任何人构想出“他心问题”之前就解决了该问题。

显然，一般来说，这种还原论策略类似于上面讨论的丹尼特的取消论策略。然而，就像之前一样，解释信息如何被通达或人类意识如何以第三人称的信息加工术语执行其他任务是一回事，而解释现象“感受质”的本质和功能又是另外一回事。如果感受质真的只是虚拟机中可通达信息的状态，那为什么它们似乎是主观的、私人的、颜色的、痛苦的等等?正如丹尼特明确描述的，毕竟机器中的信息状态是“客观的”、公众可理解的，并且本身不是颜色的或痛苦的。而且，鉴于具有主观的、第一人称的体验对一台机器的信息加工(纯粹按第三人称定义)没有什么区别，那么这类第一人称“似乎”(scemings)具有什么功能呢?如果它们真的不过是虚拟机中发现的各种信息状态，为什么演化为我们提供了这样一个(据说是)对自身心智的错误洞察?

·变调的感受质

鉴于对这些问题的哲学承诺的根深蒂固的本性，支持某一立场或其他立场的论证永远不可能是决定性的。但是，如果存在可将输入-输出的功能活动明确地从伴随的感受质中分离出来的第三人称实验证据呢?在20世纪70年代和80年代初，我进行了这样的实验，同时开发了一种给感官神经性耳聋者使用的频移助听器。感官神经性耳聋是由耳蜗和/或听觉神经毛细胞损坏引起的，这些细胞负责从耳蜗传送信号到脑听觉映射区。负责更高频率的神经元比那些较低频率的神经元更敏感且容易受损。因此，感官神经性耳聋通常有残余听力，仅限于较低的频率，并且无法听到在较高频率上的带有能量的语音，就如形成单词的开始和结束时的咝咝音和爆破音，sip,ship,chip,tip和pip。例如，当残余听力最多只能听到约1kHz的音频时，他们只能听到这些单词中的元音并且所有的单词听起来大致相同。扩大音量并没有帮助，因为这只能发送强度更大的高音频信号给神经回路，但却再也不能被传送到脑了。为了改善这个问题，我开发了一个频移助听器，它选择一个介于4kHz到8kHz的频率波段，那里包含了主要唑咝音和爆破音的能量组成部分，把频率降低到0赫兹至4kHz的范围内，并合成与放大这些变调的辅音，但已经处在残余听觉范围的低频的语音信号保持不变(例如，较低的元音共振峰)。

对于一个听力正常的人来说，大部分的变调辅音听起来像是原音的低频率版本。但这项技术也在感受质上产生了一些明显的变化。尤其是“sip”听起来更像是“ship”——并且原来的“ship”中的“sh”听起来甚至更像"shooshy"(更加像咝咝声),以致于它变得不像任何正常语音的声音，虽然很容易识别两个原始和变调版本的“s”。因为变调版本的"s"和“sh”还有类似的辅音，对于许多感音神经性耳聋的儿童都听得见，于是我们使用了这些声音，以协助他们在学习过程中可以清晰地发出这样的辅音，将模仿和听觉反馈结合起来。使用传统的变调语音说话训练方式，例如，要学习如何清晰地发出“s”音，孩子们不得不试着模仿语音治疗师直到他们发出与治疗师所发出声音相匹配的音。

为什么这会引起哲学的兴趣?使用低频滤波和振幅压缩相结合的方式，可以模拟各种形式残余听力范围内的低频率——并且，使用这种模拟方式，人们可以确信一个耳聋孩子听到的变调的声音是系统性的，且不同于一个听力正常的人听到的原始声音。例如，人们可以确信，一旦声音“s”被设备处理并且受到损坏的耳/脑系统的限制，它听起来更像一个“sh”的过滤版本。然而，这种变化对于语音训练来说，在感受质上没有区别。要教孩子说“s”,治疗师必须以正常方式发一个“s”音，即使这样，对孩子来说，治疗师所发出的声音听起来更像是一个“sh”。为了让孩子能成功模仿“s”,他或她也要以正常方式说出“s”音(把舌头的前端正好放在牙齿的后面，用口腔顶部，形成一个小缝隙),这样，再一次，当孩子听到一些像是“sh”的声音时，治疗师听到孩子发出一个“s”音。这同样适用于其他正常及变调的声音。为了发出一个正常的“sh”,由舌头隆起处和嘴巴口腔顶部形成的缝隙必须更靠后(向喉咙方向),不管人们听到的声音最后结果是一个正常的“sh”或者是原音的一个变调版本。

适用于言语生成的东西也同样适用于言语感知。通过对“s”与“sh”(比如"sip"与"ship"之间的不同)进行一般比较所发现的功能性区分，也可以通过变调版本的"s”与“sh"实现(假如残余听力范围足以用来进行辨别)。例如，如果听到变调版本“sip”的耳聋孩子被要求报告他们听到的是“sip”还是“ship”,他们会以正常的方法说出“sip”(即使那声音他们听起来更像是"ship")。简言之，在这种情境中，普通的和变调的语音声音的感受质，在功能上是没有区别的。事实上，如果没有关于变调是如何进行的额外信息，一个耳聋小孩可能永远不会知道，变调版本的“s”和"sh”与具备正常听力的人听到的版本有任何不同；同样的，一个正常听力的人，除非直到耳聋小孩装备有变调辅助设备，他们可能永远也不会知道孩子是在通过变调语音而不是正常语音的放大版本讲话。而这就是关键：如果功能相当的言语生成和言语感知能与不同的语音感受质相关联，那么必定存在一些这类无法被还原为言语感知和生成如何起作用的感受质之间的差异的东西——即感受质与输入-输出功能活动的一个清晰分离。

声明：脑医汇旗下神外资讯、神介资讯、神内资讯、脑医咨询、Ai Brain 所发表内容之知识产权为脑医汇及主办方、原作者等相关权利人所有。

投稿邮箱：NAOYIHUI@163.com

未经许可，禁止进行转载、摘编、复制、裁切、录制等。经许可授权使用，亦须注明来源。欢迎转发、分享。