index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html
![]()
本文探讨将范畴论应用于意识研究的潜力,旨在超越传统的“相关性工程”方法。文章首先回顾了以整合信息理论(IIT)为代表的意识神经科学近况,并简要介绍了范畴论的核心概念,特别是函子。接着,作者阐述了范畴论在理解意识“困难问题”、推进理论整合及利用解释性对偶方面的潜在益处。文章强调,发展意识的范畴化表征,特别是其现象学结构至关重要。最终,作者提出范畴论的应用前景不仅限于神经科学,还可扩展至计算机科学和人工智能领域,并重申了(现象)经验的首要性。
🧠 **范畴论的引入与核心概念**:文章提出,将范畴论这一数学工具应用于意识研究,可以超越仅关注神经系统本身的“相关性工程”。范畴论关注的是模式与关系,其核心概念如对象、态射、函子等,为理解意识的复杂结构提供了新的视角。特别是函子,作为连接不同范畴的桥梁,为跨领域推理提供了可能。
💡 **范畴论在意识研究中的潜在收益**:将范畴论应用于意识研究,有望在三个方面取得突破:一是更深入地理解意识的“困难问题”,即心物如何关联;二是推进对不同意识理论的整合,建立共享的形式化语言;三是利用“解释性对偶”,将复杂问题在不同领域间进行系统性转换与求解,例如将神经科学中的难题映射到现象学领域。
✨ **意识的范畴化表征与现象学结合**:文章强调,要实现范畴论在意识研究中的潜力,关键在于发展意识的范畴化表征,特别是其现象学结构。这需要将第一人称的现象学知识与第三人称的神经科学数据相结合,构建能够反映意识内容和结构的形式化模型,并认识到(现象)经验的首要性。
🚀 **超越神经科学的广阔应用前景**:范畴论对模式和关系的关注,使其应用前景不仅限于神经科学,还可以拓展到计算机科学和人工智能研究。特别是在探索人工智能意识的度量和本质时,范畴论提供了一种精确、可计算的框架,有助于超越行为主义的局限,并可能为理解人工意识提供新的路径。
原创 Robert Prentner 2025-11-04 15:14 上海

将范畴论应用于意识研究的潜力
本文讨论将范畴论应用于意识研究的潜力。作者首先回顾意识神经科学中的一项近期提案,以之阐明所谓“相关性工程”,并以整合信息理论(IIT)为例。随后简要介绍与范畴相关的技术预备,尤其是函子这一在当前讨论中承担主要概念重量的关键概念。接着考察该计划可能带来的收益——把握“困难问题”、推进理论整合和利用解释性对偶——并探讨后续研究的若干路径,强调需要更充分地发展意识的范畴化表征,尤其是其现象学结构。仅仅研究物理大脑并不足以更好地理解意识;相反,范畴式处理甚至提示了超出神经科学的应用前景,例如在计算机科学与人工智能研究中,同时也强调(现象)经验的首要性。
关键词:范畴论;现象学的数学化;意识的神经相关物;整合信息理论;理论整合;解释性对偶;有意识的人工智能(意识型 AI)。
Robert Prentner丨作者费啸天丨译者
论文题目:Category theory in consciousness science: going beyond the correlational project 论文地址:https://link.springer.com/article/10.1007/s11229-024-04718-5论文来源:Springer Nature
1. 引言
本文中作者将“相关性工程”理解为意识科学中的一类研究取向:它尝试将物理系统(尤其是大脑)的运作与意识相互对应。需要强调的是,多数支持者并不认为这意味着要指明某种潜在因果关系——相关并不等于因果;而且该取向本身也并不直接告诉我们形而上学的问题。相关性工程并不绑定于某一种具体理论(例如本文讨论的 IIT,或 GNW),而更像是一种(注1)方法论:聚焦于意识的神经底物,从而把形而上学问题暂时搁置。本文主张:若要在意识这一真正问题上取得实质进展——也就是如何把“心理”与“物理”关联起来(Atmanspacher & Prentner,2022)——就需要超越以往的路径。由于其形而上学中立性,范畴论提供了一个很有前景的数学工具。与相关性工程偏重“神经底物”不同,范畴论关注的是模式与关系。因此作者勾勒把这种思路用于意识研究的若干途径,具体而言:真正理解(而非仅仅罗列)心—物相关性、推进理论整合,并利用解释性对偶。“相关性工程”的早期范例由 Chalmers(1996)提出,并在 Chalmers(2004)中得到完善。为推动一种新的意识基础理论,人们主张:先确立并形式化“觉知”(以功能性、第三人称术语理解)与“意识”(以现象性、第一人称术语理解)之间的结构一致性;只有到最后一步,我们才应尝试对二者关系作出带有形而上学信息的判断。最初,人们曾推测“信息”可能是其背后的形而上学原则,并据此提出:脑状态与意识之间存在一种“非还原的从属(supervenience)”关系(Velmans,2009)。进一步、更加形而上学中立的做法,是把目标界定为寻找意识的神经相关物(NCC)(Chalmers,2000;Fink,2016;Koch 等,2016;Lepauvre 与 Melloni,2021):即哪一个最小的神经系统,其状态对任一意识体验是充分(但非必要)的?NCC 项目之所以卓有成效,一个原因在于它可从多种形而上学立场切入。与 Chalmers 早先提出的“结构一致性”不同,研究者可以专注于寻找 NCC,同时对“意识与大脑之间的底层关系”(例如是否可还原)保持不可知。这带来一个巨大优势:尽管在哲学立场上意见不一,大家仍能就共同的方法论达成一致。这种多立场共事至今仍可见其痕迹:例如在近期“对抗式协作”推动意识科学的出版物(如 Cogitate Consortium 等,2023)中,作者群涵盖了唯物主义、唯心主义、泛心论(或许还有更多)。然而,尽管这些努力可嘉,真正的“难题”(Chalmers,1996)依旧未被触及。或许,借助更为严格的数学形式化——尤其是范畴论(Lawvere 与 Schanuel,2009;Mac Lane,1998)——会有所帮助?但问题是:我们究竟如何以精确的(数学的)方式,把意识与物理系统(如大脑)的运作关联起来呢?Tsuchiya 与 Saigo(2021)提出了一套“基本配方”:把问题一分为二,先分别构建“大脑的范畴”(注2)与“意识的范畴”,然后再考虑它们如何关联。普遍看来,“大脑范畴”的构建虽然困难,但是可能的(例如依托已有、能刻画 NCC 的数学理论;见第 2 节);但“意识范畴”是否有意义仍存疑。第 3 节概述了需要迈出的首批概念步骤。即便迈出这些步伐,这两个范畴之间到底如何关联仍未明晰;更糟的是,并不明显这会实质性地超越传统方法(例如,相较于纯经验的 NCC 研究,我们的形式化努力能推进到什么程度?)。因此,作者在第 4 节提出三条可能的收益与进一步研究的路径:更好地把握意识的难题、整合(看似不相干的)理论,以及利用解释性对偶。在第 5 节,作者一方面强调需要继续推进范畴式取向(包括更细致地说明如何以范畴方式理解现有理论),另一方面明确要求:范畴化处理必须贴合(现象)意识本身。最后需要注意:意识科学若要从“范畴转向”中获益,似乎必须走出神经科学的狭窄边界;若涉及人工意识的研究,这一点尤为明显(注3)。注:1. 更具体地说:指寻找“意识的神经相关物”(NCC);定义见下文。2. 作者仅出于便于记忆的理由,将其作为“神经信息处理”这一范畴的简写。务必注意这里意义上的转换:作者主要讨论的是某些类型的信息处理或计算的范畴。这些事物——按该领域主流观点——恰好由神经系统实现这一事实并非本质,甚至可能分散对更重要观点的注意:所谓“大脑的范畴”不过是一个更一般的、形式性结构的一种可能实例。3. 正如这里强调的,范畴论关注的是模式与关系,而非实现这些东西的具体材料。由此自然推得,作者需要采取一个不那么以神经为中心的视角。
2. 以整合信息论为例
2.1 一次范畴化重述Tsuchiya 等(2016)在论文中引入范畴论来研究意识与大脑的关系,并以整合信息理论(IIT3.0)为例(Oizumi 等,2014;Tononi 等,2016)。依赖 IIT 的理由并非它就是关于(现象)意识的终极理论,而是因为在用数学结构刻画与意识相关的物理要素方面,IIT 是意识神经科学中相对最成熟的方案。(这里把“大脑的范畴”当作“神经信息处理之范畴”的简写,仅为便于记忆。请注意这里意义的转变:作者主要讨论的是某类信息处理/计算的范畴。它们在目前主流观点下恰好由神经系统实现,这一点并非本质,甚至可能遮蔽更普遍的信息——所谓“大脑的范畴”,只是一种更一般形式结构的一个可能实例。)如果 IIT 看起来像是“数学化意识科学的唯一可用选择”,这或许与其本身无关,而是竞争性理论的匮乏所致。事实上,范畴式做法可以推广到任何足够成熟、能够从与意识相关的大脑活动中导出数学结构的理论。关于 IIT 的范畴化处理,Kleiner 与 Tull(2021)以及 Tull 与 Kleiner(2021)也提出了各自方案。尤其是 Tull 与 Kleiner(2021)把重心从标准范畴论转向应用范畴论(Abramsky & Coecke,2008;Bradley,2018;Fong & Spivak,2019)。采取“应用”的一个直观理由在于:范畴论常被视为过于抽象、难以解决“现实问题”;事实上,范畴论还被戏称为“抽象的胡言”(Mac Lane,1997 的反讽记载)。一般来说,应用范畴论就是把范畴论工具用于纯数学之外。在此语境下采取应用范畴论,有助于更好(更简洁)地把握 IIT 自身的数学结构。例如聚焦“可整合性”(Coecke,2021)——即子过程的不同整合方式——这正位于 IIT 算法的核心,有助于更深入地理解该理论。沿此思路,应用范畴论将复杂系统的整合区分为顺序整合(∘)与并行整合(⊗)。在 Tull 与 Kleiner(2021)中,“可整合性”因此在更原则性地理解 IIT 的“最小信息割”等“把系统拆分为部分”的做法中发挥了重要作用。两种取径既有共通之处,也存在差异。关键差异在于:Tsuchiya 等认为 IIT 在意识与物理系统之间给出了某种良定义的关系(形式上接近“范畴等价”,这已是仅次于“范畴同构”的强假设);而 Tull 与 Kleiner(2021)则不认为“整合信息结构”与“意识”之间存在任何必然联系,最多只能建立若干或然的接触点。换个角度看,IIT 更像是一个在结构化空间之间提出联系的算法;至于这些空间为何如此、以及为何应当据此理解意识,并不真正属于 IIT 形式体系本身(注4)。不过,传统范畴论更关心的是普遍性(例如某个普遍构造是否存在),而非“可整合性”。由于 Tsuchiya 等(2016)的重心并非评估(或推广)IIT 的核心算法,而在于定义在物理态与心理态上的结构之间的关系,因此“可整合性”在他们(以及本文)的讨论中只是次要角色。由此可见,要在数学框架中理解心—物关系,IIT 只是具有代表性、而非唯一的方案。2.2 再谈“中央同一性”我们先回到 Oizumi 等(2014)与 Tononi 等(2016)中的 IIT“中央同一性”。核心主张有二:(i)在性质上,意识与物理系统中一个特殊的“原因-结果结构” (注5)同一,该结构由一组 ϕ 非零的机制构成;(ii)在数量上,意识可由与该结构相关联的整合信息 Φ 来度量,即它规定了系统中的最大整合信息。不过,IIT 支持者通常并不把这一定同理解为传统意义上的科学命题(例如直接以假说的方式瞄准两类经验事件——意识与脑活动——之间的规律)。他们的做法是:先罗列把握意识基本性质的“现象学公理”,再将这些公理转译为关于物理系统的“后设”,并对后设进行经验研究(如:满足后设的系统是否也与经验相关)。而在正统解读中,该理论的公理基础被视为不可动摇且不容置疑地为真(即表达关于意识之必要且充分的概念真理)。此外,针对“中央同一性”的任何经验性证据必须是间接的(不是直接检验公理,而是经由满足后设的物理系统)。因此,围绕 IIT 的批评很自然地集中在两个问题上:其一,IIT 是否可证伪(注6);其二,其公理基础是否真如“公理”在经典意义上所要求的那样自明。在该理论的最新迭代 IIT4.0 中,“中央同一性”被“解释性同一性”所取代(Haun 与 Tononi,2019;Ellia 等,2021;Tononi 等,2022;Albantakis 等,2023a,b),据称其本体论负担更轻;然而,针对上一迭代的若干反驳似乎对最新迭代同样适用(Signorelli 等,2022)。这正体现了 Tsuchiya 等(2016)与 IIT 正统文献在方法论上的关键差异:他们总体上同情 IIT,但并不一开始就(基于哲学论证)假定中央同一性为真(或更弱地,将其视为一种原则性的解释装置),也不采纳 IIT 那种“从(自明或不可反驳的)公理推进到关于物理系统的后设”的方法。相反,他们认为 IIT 仅仅规定了一种由神经系统实现的数学结构,而该结构需要以经验方式与意识建立联系。于是,IIT 首要的并非关于意识本身,而是关于与意识相关的物理系统(注7)。尽管如此,这些结构与意识之间仍可能存在系统性关系——而范畴论或许正提供了评估这种关系的合适工具。更一般地说,作者提出的问题是:如何理解某种“数学形式主义与意识”之间的同一(或其他关系)?评估这一关系的第一步,是假定意识可以通过某种具结构的实体来表征(暂且撇开本体论问题)。就此而论,IIT 所做的是:规定物理系统的因果—效果结构与该系统有意识经验的现象结构之间的关系。不同于正统 IIT 从“毋庸置疑的意识经验”出发,回推支撑它的物理结构,Tsuchiya 等(2016)询问的是:如何将两个可形式化的域——一边是物理系统,另一边是意识——关联起来。注:4. 至少在不跟随 IIT 支持者的路径时是如此——也就是不将理论建立在所谓“现象学公理”之上,且不把那些“后设”视为这些公理的唯一实现者(或物理模型)。5. 最初称为“最大不可约概念结构”(MICS),后来改称**“因果—效果结构”或物理系统的“Φ-结构”。6. 相关讨论与回应,可参 Doerig 等(2019)、Kleiner 与 Hoel(2021)、Merker 等(2022)。7. 在 IIT 支持者偏好的表述中,应将“相关的物理系统”改为“意识的物理基底”(PSC)。按照 IIT 的正统解读,“相关”这个概念太弱。既然“中央同一性”主张的是同一,IIT 就似乎在给出既必要又充分的条件,而不仅仅是一个“相关”。是否该说“相关”还是“同一”,取决于你是否接受那些公理,以及它们经由后设所得到的唯一化规定。从逻辑上讲,同一 ⇒ 相关,但相关 ⇏ 同一。因此,本文通篇采用较弱的“相关”概念更为妥当。更严格地说,“必要/充分条件”与“同一”之间仍有差别——这一点可用(高阶)范畴论中的不同“范畴等价”概念来说明,而且这些概念也适用于纯数学之外的语境。
3. 范畴论
3.1 范畴论基础此时,引入范畴论框架似乎顺理成章。一个范畴 C 是一种非常一般的数学实体:它由一组对象(用大写字母表示)以及对每一对对象之间的一组态射(用小写字母表示,有时也称为“箭头”)组成,并满足以下条件:1. Composition(复合)如果在 A 与 B 之间、以及在 B 与 C 之间都存在态射,则在 A 与 C 之间存在一个态射。2. Associativity(结合律)在态射复合中,先将 f 与 g 复合再与 h 复合,或先将 g 与 h 复合再与 f 复合,结果相同。3. Identity(恒等元)对每个对象 X,存在从 X 到其自身的恒等态射1X : X → X。恒等态射的存在有助于我们用关于关系的陈述来取代关于对象的陈述。恒等态射还必须满足:它能与范畴中的其他态射以一种特殊方式复合,作为复合的左/右单位。一个经典例子是集合范畴 Set:对象是集合,态射是这些集合之间的函数。另一个例子是拓扑空间范畴 Top:对象是拓扑空间,态射是它们之间的连续映射。在应用范畴论中,一个形象的例子是制作“蛋白霜派”(Fong 与 Spivak,2019)。配料(Ingredients)(对象)会依照菜谱在多个步骤(态射)中被逐步转化;这些过程又会复合(注 8),形成“制作蛋白霜派”的更大过程。在此,作者特别关注来自意识科学文献的例子。但在区分“大脑的范畴”与“意识的范畴”之前,先对分析心灵哲学中的一个著名例子作一次范畴化重述:机器状态功能主义(Putnam,1967)。在功能主义中,心理状态由输入、输出及其他状态之间的关系来界定。以自动售货机为例:可乐 50 美分(当年的价格!),机器只收 25 美分硬币。在某一状态(称“零状态”)下,一次投入两枚 25 美分,机器会出可乐并保持在零状态;然而若只投一枚 25 美分,机器不会出可乐而是转到“25 分状态”;再投一枚 25 美分,就会出可乐并回到零状态;若在 25 分状态下一次性投入两枚 25 美分,则会出可乐并保持在 25 分状态(注 9)。其图示如下:可以看到,这就定义了一个范畴(可称为 Fun):有两个对象(零状态与 25 分状态),它们之间的态射满足复合、结合与恒等。例如,就复合而言,“一次性投入两枚 25 分”等价于“先投一枚,再投一枚”。从图中也可直接看出它如何满足结合与恒等关系。与机器状态功能主义以纯关系定义心理状态的习惯做法类似,在范畴论中我们也可以这样理解对象。但是,心理状态真的能这样定义吗? 区分“机器状态功能主义”与更强的功能主义的一种方式,是对对象/态射施加进一步的约束。例如,若采纳心理功能主义(Levin,2021),就会要求态射指称心理学相关的函数。一个有趣的问题是:能否借助(高阶)范畴论充分刻画并甚至调和“角色功能主义”与“实现者功能主义”(McLaughlin,2006)之间的区分?然而,对各类功能主义的一个重要批评在于:它似乎无法解释心理状态的质性(相对于功能性)本质(Van Gulick,2022)。在功能主义中,心理状态被纯粹关系化地定义,因此缺乏所谓质性上的“内在”成分。或许我们可以做得更好:区分两个相关的范畴——一个属于大脑,一个属于意识(包含感质)——然后思考它们之间的关系。大脑的范畴。 对于如何将我们关于大脑的知识范畴化并无唯一正确方案,但文献中已经有若干提议。沿着 Ehresmann 与 Vanbremeersch(2007)的“记忆演化神经系统”,可以先考察一个神经图(如今可由成像数据重建)来表征某一时刻的神经系统,并从中构造满足上述约束的范畴 NEUR(见脚注 10)。具体而言(注10),神经图定义了穿过神经系统的路径,它们满足复合与结合;虽然“神经元 A 与 B 相连,B 与 C 相连”并不蕴含 A 与 C 直接相连,但从 A 到 C 存在突触路径。在该图景中,态射对应于带延迟的突触路径,它会改变所连神经元的激活态;所提出的复合需要尊重延迟时间;恒等态射对应于状态不变(因此“突触路径”的延迟为零)。来自意识研究的另一个例子是 IIT。在 IIT3.0(Oizumi 等,2014)中,多数例子不是以神经系统而是以逻辑门为单位:合适连线的一组逻辑门实现某种因果—效果结构。在经典理论(不同于量子理论)中,由于状态与对这些状态的操作都由同一类对象(逻辑门)实现,因此会出现一个含混(McQueen 等,2023)。而在量子理论中,从表面看,逻辑门本身并无“状态”,只有其输入与输出带有关联状态(注 11)。IIT 的基本算法旨在量化整合信息量:其前提是把一个系统与其“拆解版本”进行比较;只有当系统的(因果)信息处理超出该拆解版本时,才可将其与整合信息关联。Tull 与 Kleiner(2021)提议用范畴论使这一设定更精确,甚至推广到超出类神经系统的情形(这一直是 IIT 的重要主张,但也常遭批评)。相较之下,Tsuchiya 等(2016)主张用范畴论分析因果—效果结构之间的关系(例如相似性),本文余下部分亦将着重此点。意识的范畴。 在构造“大脑范畴”时我们已见到多重含混,而在意识的情形中这些困难更加突出。范畴论之所以是研究意识的一个启发性框架,部分原因在于:在范畴论里,对象由其与其他对象的关系完全刻画。这与我们关于感质(qualia)的多种直觉是一致的。例如,Tsuchiya 等(2016)假定:意识内容可以是范畴论的对象本身(“窄义的感质”,如我们面前杯子的红色),也可以是对象之间的关系(如我们面前两个杯子被体验到的“靠近”),或是更复杂的结构(如“广义的感质”:把对象及其关系的集合——例如“脸”——理解为任何一次经验的整体内容;Kanai 与 Tsuchiya,2012)。更一般地,理解范畴中对象角色的一种抽象方式是:把对象视为态射复合的接口。这也为与现象学建立可能的接触点提供了线索:我们意识中的内容可被理解为经验过程之间的媒介(Taguchi,2019)。按照一种受现象学启发的提案,这相当于一种“建构(constitution)”的行为(Gallagher 与 Zahavi,2008;Tsuchiya 等,2016)。但与“大脑”的例子不同,使该提案更难理解的一点在于,至少依传统现象学(Husserl,2012),所谓“建构”通常指:经验内容不是预先给定的对象,而是心智活动的产物。这指向了“大脑范畴”的一个重要约束:其中的态射需要反映功能(动力学)信息,而非纯粹的结构(静态)信息;仅仅存在突触连接在这里并不足够。3.2 范畴论的力量范畴论是一个非常一般的框架。这既是这种形式主义的优点,也是其缺点。一方面,几乎任何东西似乎都可以被解释为一个范畴(意识就是一个有趣且非平凡的例子!见注 12);另一方面,若真能找到一个几乎适配一切的通用图式,则可能什么特别有价值的话也没说出来。支持使用范畴论的一个理由在于不同领域之间的关系。更具体地说,范畴论提供了不同类型的系统性关系来刻画范畴之间在不同程度上的(非正式地讲)相似性。其中最弱的是“函子”的存在:即把一个范畴中的对象与态射变换到另一个范畴中的映射。函子必须满足下列条件:1. 把前一范畴中的对象映到后一范畴的对象:2. 如果在前一范畴中对象间存在态射:则在后一范畴中相应对象之间也存在态射:3. 该函子映射保持恒等与复合。回到先前的例子,F 可以是从 Top 到 Set 的函子,即: F:Top→Set. 在哲学中,一个作者刚刚提到的例子涉及角色功能主义与实现者功能主义之分:前者可由某个范畴Fun来刻画,而后者或许可等价为从 Fun到生理状态之某个函子的像。把这与 IIT 相关联的一种方式,是聚焦于 IIT 关于“因果—效果结构(大脑侧)”与“感质(意识侧)”之间“同一”的主张。一般地,两个域之间的函子关系远弱于“同一”(或同构)关系:若存在则(范畴)同构要求它们的复合等于恒等函子这是一种很强的关系。范畴论还给出了若干“中间层级”的相似性(如强/弱范畴等价(nLab authors,2022a))可供替代。在未加进一步约束时,仅有范畴之间存在一个函子仍然比较弱。尽管如此,函子式关系已经非常有用:它允许我们从一个域到达另一个域,在新域中进行推理,然后再推回原域。比如,在“大脑结构”与“现象结构”之间若存在函子关系,就可以在一域中求解难题,再将解(作必要变更)转移到另一域。Tsuchiya 等(2016)提到了布劳威尔不动点定理的例子。回忆该定理:任何从 中的圆盘到其自身的连续函数f: D2→ D2 至少有一个不动点:f(x0)=x0。可用“国家地图”来说明:总有至少一个点,其在地图上的位置恰好对应于该国家中的“真实”位置。不动点定理在几何本身内部出了名地难以证明;然而,几何对象与某些数的集合(即某些代数对象,称为基本群)之间存在函子式关系。当然,几何对象并不与这些数的集合同一,由几何对象所定义的结构也不与这些集合上的结构等价;但二者之间存在系统性映射。这使得我们可以在这些代数对象的范畴中通过推出不可能性来更容易地证明不动点定理。类似地,我们可以推测:即便只是由“意识与大脑之间的函子式关系”所表达的那种(仍然相当宽松的)类比,也足以对“意识经验的本性”(这个据称难以下断言的领域)导出有趣的陈述。意识研究中充满了难题,例如:“他人此刻意识到了什么?”或“自然界中哪些实体事实上具有任何意识?”我们也许会以为需要一整套完整的意识理论才能回答这些问题,但也可能一个弱得多的理论构造就足够了。仅“函子”这一概念就带来大量益处,因此作者主要将讨论限制在此(注13)。注:8. 有些态射是按顺序复合的,有些则是并行复合的。9. 显然,如果不投币,就什么也不会发生,机器保持原状态;此外,这台售货机是“只卖可乐”的。10. 更精确地说,NEUR 还包含不同时刻的神经系统状态(因此是演化的),以及在各步骤中定义的所有余极限(因此是层级的)。即“演化 + 层级记忆”。11. 在量子语境下,更合适的是把逻辑门看作态射。基于应用范畴论的视角也会如此处理:把“门”视为把输入变成输出的过程。神经元的情形亦同。12. 至少在我们不去证明自己的形式化确实满足范畴的全部要求时如此——而这件事有时相当不易。13. 范畴论中还有诸多概念,如(余)极限、纤维化、索引范畴或高阶范畴论。但此处作者不再展开,而是深化对函子关系的讨论。把范畴论应用到意识科学的一个风险,恰在于操之过急,在最基本概念尚未厘清前就往前推进。有些概念(例如自然变换)在我们寻找“正确结构”时至关重要(文献中已有相关讨论,见如 Northoff et al., 2019 或 Tsuchiya & Saigo, 2021),但本文不涉及细节。
4. 可能的收益
本节作者概述将范畴论用于意识研究可能带来的一些收益。其首项几乎没有争议,可被视为寻找意识的神经相关物(NCC)的一部分(或其自然延续)。但作者也需要开展超越相关性工程的研究。这将引出两条进一步的潜在研究路径,而在这些路径上,范畴论似乎尤其有前景。因此,以下两个小节将带有更多探索性/推测性的性质。4.1 范畴论与意识的神经相关物NCC 被定义为:“对任何一个特定的有意识体验而言,共同构成充分条件的最小神经机制”(Koch 等,2016)。在过去 30 年里,寻找 NCC 一直是意识研究中最有用、也最成功的路径。然而,尽管进展显著,我们对 NCC 的真正理解仍未到来:这些相关物究竟表达了什么?这些相关性为什么成立?应当如何在范畴论框架下思考意识的神经相关物?如果我们能够把第三人称方法(如脑成像)导出的数学结构,和第一人称方法(如经数学化的现象学)得到的结构都表述为范畴,就可以寻找这些范畴之间的函子式关系。可以想见,大脑并不同一于意识,由脑活动抽取出来的抽象数学结构本身也不可能与意识同一(抽象结构怎么可能与意识同一呢?)。相反,大脑的抽象数学结构可以在范畴意义上,与一种刻画有意识体验重要方面(如其“现象结构”,Van Gulick,2022;Kleiner,2024)的结构建立关系。首要问题是:相似/差异关系能否在跨范畴映射中被保持?也即,是否存在一个函子,使得(并满足上一节所列的其他要求)。回忆函子的一个性质:若在范畴之间存在函子,且在中对象之间存在可逆态射,则在中相应对象之间也存在可逆态射。因此,如果我们把“相似性”解释为范畴内存在可逆态射,那么范畴之间的相似性结构就必须被保持。为了更明确地写出“可逆态射在函子下被保持”,可用下面两行:同构的判定可等价写成“存在逆态射”,并可直接通过 F 映射过去:
反过来,要使成立,例如还需要存在一个逆函子。这类函子的存在是范畴同构以及较弱的范畴等价(如,及其反向)的必要条件;若做不到,同构等关系就不成立。那么,有没有经验性方式来判断此类函子是否存在,以及它们可能是什么样子?幸运的是(原则上)可以用神经心理学与心理物理学中的常规实践来处理该问题。1)相同刺激、不同体验。 意识研究中的“对比法”(Baars,2005;Lepauvre 与 Melloni,2021)主张固定刺激,观察当有意识知觉在“看见/未看见”间变化时的神经变化。这在原则上有助于为特定内容识别神经相关物;不过,由于多重混淆因素与误导性的定位方法(Signorelli 等,2021a;Lepauvre 与 Melloni,2021),情况并不总是那么直截了当。若能把脑活动记录铸成数学形式(例如导出 IIT 的因果—效果结构),便可检验:“大脑范畴”中相同或高度相似的对象,是否会对应到不同或很不相似的有意识体验。2)不同刺激、相同体验。 反过来也可考察:非常不同的物理刺激是否对应相同的知觉体验,例如利用知觉同像(metamers)现象(Freeman 与 Simoncelli,2011)——不同物理刺激却关联到同一个知觉体验。在两种情形中,都可能出现这样的情况:在一个范畴(大脑/意识)里,某些对象被视为相同/相似,但在相应的另一个范畴里却不是。这将反驳存在函子的主张,从而(至少在该具体情形中)反驳“脑活动的数学表征(如 IIT 的因果—效果结构)与意识体验同一”的主张。此外,这些现象未必与刺激本身有关(例如,可保持刺激不变却观察到脑活动/体验的变化;或改变刺激却发现大致相同的脑活动/体验)。类似的问题在心理物理学文献中早已被讨论(并在关于“性质空间(quality spaces)”的哲学文献中更系统地展开:Clark,1993;Rosenthal,2010;Lee,2021;Lyre,2022)。二者的差别在于,范畴化处理可适用于一切足够可形式化的、关于意识体验的关系——不局限于心理物理学,例如现象学中的“意向性自我—世界结构”(Smith,2018;Prentner,2024)。性质空间主要聚焦于被表征的外界属性(例如由感觉系统表征的特征),而范畴论的描写范围更广,还包括研究体验之间的相互作用,甚至研究导致某一体验形成的过程本身。对照例:在嗅觉的性质空间里(Young 等,2014),某些(无意识的)气味体验之间的属性与关系是据其可辨别性来表征的,而体验之间可能的相互作用并不属于该形式主义。尽管 Tsuchiya 等(2016)的工作中也未明确纳入这一点,但似乎不存在原则性障碍。范畴论的力量之一,正是能谈论“关系之间的关系”,例如借助高阶范畴论(nLab authors,2022b)。但是,即便真的在最基本的“1-范畴”层面找到如 IIT 所预测的函子式关系,这是否就构成了“同一”的证据?并不。 我们既没有证明总能找到满足的逆函子,也没有论证在意识问题上除了数学结构之外没有其他因素是相关的——这与 Chalmers(2002)的“结构—动力学论证”有关。因此,检验域间是否存在函子,仍属于 NCC 项目(或其自然延伸):以更系统的方式去发现相关物。同时,这也意味着可以把一域中的某些问题转译成另一域的问题。这种办法已在科学中被证明行之有效(上文以不动点定理为例)。不过,从 Tsuchiya 等(2016)的取径还能推出一个更重要的点:相关性是意识科学的经验材料,而相关性终究需要被解释(Atmanspacher 与 Prentner,2022)。意识的神经相关物本身并非理论,但对其进行严格的形式化很有帮助——这是实际检验某一理论对错的前提。因此,作者赞同 Tsuchiya 等(2016)的主张:IIT 的“核心同一性”既不应被视为不证自明的真理,也不应被视为可经由“从(自明的)公理到后设的唯一路径”加以辩护的命题,而应被(而且可以被!)经验性地审视。(注14)那么,为得到这个结论,我们是否必须动用范畴论的形式装置?或许不必,但范畴论的优势之一,确实在于它能把这些问题显性化。4.2 理论整合可以尝试把范畴化处理应用到一系列意识研究理论上,期望对它们进行系统整合(例如,除 IIT 外,还包括“时空意识理论”(Northoff 等,2019,2020;Northoff 与 Zilio,2022)或“有意识代理理论”(Hoffman 与 Prakash,2014;Fields 等,2018;Prentner,2021;Hoffman 等,2023))。范畴论可用来建立不同理论之间共享的(形式化的)词汇表,避免“各说各话”。对尚处于早期(不成熟)阶段的领域——例如意识研究——这比过早划定学派边界更合适。另一种(相关)策略,是直接用范畴论为意识本身重建一个研究框架。这不应被看作又一个“意识理论”(Wiese,2020),而更像是当前诸理论的一个“整合枢纽”。上述理论的拥护者在心灵哲学立场上差异很大:有物理主义、唯心主义,以及多种非还原取向。像范畴论这样的形式化处理有助于跨越这些形而上学壕沟。这与胡塞尔早期主张的尽可能对形而上学问题进行“括号化”(Yoshimi,2014)一致。进一步说,它能更清楚地区分先验取向(注15)与反实在论的本体论主张(如经验唯心论)。通过这种方式,在意识研究中引入范畴论有望确立一个形而上学中立的研究计划,超越传统本体论的教条化。4.3 利用解释性对偶这种形而上学中立(但形式化、或许也有些“异端”)的研究计划还能带来什么?受物理学启发的一个例子是以“对偶”为纲的解释——在两个研究域之间进行系统的变换,并常常往返翻译。一个有趣的问题是:能否在意识与脑活动之间界定一种对偶?过往论文提出,范畴化处理的一大好处,是有望把关于意识的难题转移到更可处理的神经科学领域中求解。更进一步地,按照一种“基于约束的方法论”(Signorelli 等,2022),我们甚至可能将神经科学中的一些棘手问题翻译成(数学化的)现象学语言来解决。不过,术语本身也可能引人误解。“对偶”这个概念在哲学、数学、物理等不同语境中被频繁使用。在哲学里,“对偶”通常指关于互补的认知方式的(相当一般的)命题。一个范例是中国古代的“阴阳”观:现实由相互矛盾的对立统一构成,并在此间取得均衡。在数学中,“对偶”有多种形式,用法通常更为严格。一个例子涉及映射 f: A×B→C 。一种表征性对偶允许我们借助从 B 到 C 的映射来对 A 作出陈述,反之亦然(Corfield,2017)。在范畴论里,或许最一般的对偶刻画涉及一对“伴随函子”的存在(nLab authors,2024)。在物理学中,“对偶”的定义相较数学更为宽松,因此澄清所指的“对偶”类型尤为重要。“对偶”可以指代相当不同的事物:例如量子力学早期的“波粒二象性”;又如早在量子力学之前就有的“高斯定律”:通过封闭曲面的电通量与该体积内的净电荷成正比(不取决于电荷的空间分布细节)。而更现代的例子是AdS/CFT 对偶,联系了弦论与共形量子场论(Maldacena,1999;Rickles,2013)。作者在此借鉴的例子,是一个相关猜想:时空区域间的距离与其边界上相关系统的纠缠熵成反比(Ryu 与 Takayanagi,2006;Van Raamsdonk,2010;Ney,2021)。在意识科学中,作者设想采取类似思路。譬如,IIT中存在大量几乎不可计算的问题(如通过评估系统与其划分之间的距离来选择最小信息割)。若能把这些问题系统地变换成关于现象关系的(更简单的)问题,可能会带动整个领域取得重大进展。然而,仅仅指出存在函子式关系还远远不够;我们需要更具体:一个域中的实体(如距离)究竟如何对应到另一个域中的实体(如意识中的一种关系)?注:14. IIT 能告诉你:满足其后设的物理系统是否与经验相关。但这并不推出这些系统在更哲学的意义上(表达必然性)是“真的有意识”——这与经验意义(表达或然性)不同。15. 胡塞尔式的现象学通常被认为采纳这种先验取向(Zahavi,2017);关于 IIT 的先验阐释,参见 Chis-Ciure(2022)。
5. 结论与展望
仅用范畴论,充其量只能讲高层的故事;低层的故事必须借助具体理论来叙述,并参考现有架构。一旦真正着手某个具体模型,许多繁琐细节是无法绕过的。与此同时也要记住:好的高层描述应当能凸显与问题相关的关键特征,从而对大量无关细节进行抽象。如何在细节充分与抽象到位之间取得平衡,是很难的。范畴论前景可期,但需要谨慎使用。本文在第 2 节以 IIT 为例作了简要讨论;需要再强调的是,这一思路并不特指 IIT,任何数学上足够成熟的意识理论都可以嵌入到一个范畴框架中。反过来说,这也许表明:意识科学的理论化工作目前仍不够成熟。除了少数看起来可以做范畴化处理的理论(本文讨论了 IIT,也简述了“时空意识理论”与“有意识代理理论”)之外,多数理论的成熟度还不足以让范畴论的应用变得非常“有启发”。不过,这不应被理解为范畴论自身的问题(不是那种“抽象的胡言”),而是这些理论的不足。如果你认为意识中有些方面需要关系性取向来把握(例如要给出感质的科学说明),那么引入范畴论就是顺理成章的。更一般地说,待整合的理论起点可以各不相同,甚至不必只聚焦于大脑。用范畴论来研究心—物相关性,未必限于“意识的神经科学”;它也可以应用到任何足够可数学化的领域,比如生物学或计算机科学。作者确信有些类型的神经系统(尤其是类人脑的)与有意识体验相关;但一旦离开这些系统,我们的把握就会降低。在谈到 AI 系统时尤其如此:AI 意识的正确度量是什么?是主观报告吗?这很容易被伪造。是行为吗?只要给 AI 配备合适的传感器和效应器,构造人工知觉—行动环路,这也很容易被工程化。至于 Butlin 等(2023)提出的“合适的功能”标准?问题在于“功能”往往界定不足、带有试探性。范畴论可以让这些想法更精确(见第 3 节),而且还可能像第 4 节所示,导出具体的预测。但这种思路真的适合用来思考意识吗?对 IIT 的一个批评,正是其对现象学本身的处理(Merker 等,2022;Singhal 等,2022)。毕竟,我们关于现象体验最系统的知识来自哲学中的现象学传统(如胡塞尔学派:Smith,2018;Husserl,2012;Gallagher 与 Zahavi,2008)。要构建“意识的范畴”,很可能需要大量借助“现象学的数学化”研究(Petitot 等,1999;Yoshimi,2007;Marbach,2009;Prentner,2024;Taguchi 与 Saigo,2023);并且,可以合理推测,相关取向(Yoshimi,2016;Rudrauf 等,2017;Prentner,2019;Signorelli 等,2021b;List,2023;Ramstead 等,2023;Kleiner,2024),以及关于感质的数学表征(Stanley,1999;Kleiner,2020;Tsuchiya 与 Saigo,2021;Resende,2022)的工作,都有可能统一于一个框架之内。不过,就目前而言,能否把这些想法翻译成一种形式语言,在意识科学中仍研究不足。如果我们能从第一(人称)原则出发,建立一种范畴化的意识表征,它就能对“意识的神经基础”的模型形成强约束。在第 3 节讨论“意识范畴”的构建时作者已遇到一个思路:如果“意识范畴”中的态射要体现现象学中的“建构(constitution)”,那么“大脑范畴”里纯结构(解剖)性质的关系就应当被排除。鉴于作者始终强调整合性——而意识科学最需要的正是对各个模型的整合(Wiese,2020;Signorelli 等,2021a;Northoff 与 Zilio,2022)——作者认为范畴论很适合把数学理论与受哲学/心理学启发的处理结合起来。因此,尽管作者认为“为有意识经验构建范畴”这一项目远非易事,但作者也有信心:至少意识的某些方面可以以这种方式形式化。更具体地,如果你还关心把意识科学应用到人工智能,第一步应当是提出一种可转译到计算架构上的意识的基础数学表征。本文已经讨论了朝这个方向迈出的若干起步,同时也承认在搭建这一项目时第一人称视角的普遍作用。现在该进入实施阶段了。译者简介Mac Lane, S. (1997). Categories for the Working Mathematician. Springer.
Abramsky, S., & Coecke, B. (2008). Categorical quantum mechanics.Fong, B., & Spivak, D. (2019). Seven Sketches in Compositionality.Coecke, B. (2021). Compositionality: The Guiding Principle of Applied Category Theory.Oizumi, M., Albantakis, L., & Tononi, G. (2014). From the phenomenology to the mechanisms of consciousness: Integrated Information Theory 3.0.Tononi, G., Boly, M., Massimini, M., & Koch, C. (2016). Integrated information theory: from consciousness to its physical substrate.Haun, A., & Tononi, G. (2019). Why does space feel the way it does? (IIT 4.0)Tsuchiya, N., Taguchi, S., & Saigo, H. (2016). Using category theory to assess the relationship between consciousness and physical reality.
Kleiner, J., & Tull, S. (2021). Mathematical models of consciousness.Tull, S., & Kleiner, J. (2021). A categorical foundation for integrated information theory.Husserl, E. (2012). Ideas.Gallagher, S., & Zahavi, D. (2008). The Phenomenological Mind.Smith, D. W. (2018). Husserl.Chalmers, D. (2002). Consciousness and its place in nature.Signorelli, C. et al. (2022). Critiques of IIT.Van Gulick, R. (2022).
Qualia and functionalism.从神经元放电到自我意识的涌现,意识是人类最稀松平常的主观体验,也始终是科学中最迷人的问题。在“我是谁”的终极追问下,当我们深入意识的机制与机理,会发现更值得深思的是,无论是神经机制的功能整合、信息的跨脑区传递,还是现象意识的主观性质,不同层面的问题都在共同指向一个核心挑战:物理过程如何产生主观体验?功能计算如何关联现象感受?局部神经活动又如何整合为统一的意识?而要回答这些问题的并不简单,它可能会挑战我们对世界和实在,乃至科学方法本身的理解。为了对意识问题进行系统探讨,集智俱乐部联合来自哲学、认知神经科学、计算机科学、复杂科学领域的研究者共同发起「意识科学读书会」,跨越理论与实证、功能与现象、生物与人工的视角,全面深入研讨意识这一现象本身。重点探讨当代主流意识理论的核心主张与分歧,神经机制与主观体验之间的桥梁,以及AI意识、脑机接口等技术如何重塑人类意识主体的边界与文明的未来。
推荐阅读
1. “完美的圈”——一个基于主动推理的意识统一理论
2. 意识智能体:大模型的下一个进化方向?——计算意识理论综述II
3. 通用人工智能的黎明:计算视角的意识理论综述
4. 涌现动力学如何用来分析复杂系统? | 新课上线
5. 集智学园精品课程免费开放,解锁系统科学与 AI 新世界
6. 高考分数只是张入场券,你的科研冒险在这里启航!
7. 重整化群与非线性物理,寻找复杂系统跨尺度的分析方法丨新课发布
点击“阅读原文”,报名读书会
阅读原文
跳转微信打开