原创 关国业 2025-11-04 15:14 上海
从一个细胞到一个生命,寻找发育精准性的物理法则
导语
从一个细胞,到拥有数以亿计细胞的复杂生命体,发育生物学追问的是:生命究竟如何以高度精准的方式实现自我构建?当线虫这样一个简单的生命,能精确控制每个细胞的命运与位置时,人类和小鼠却能够在完全无外界引导的条件下,自发地构建身体结构。生命的这种“算法”究竟是什么?它背后有哪些物理学原理和机制?本期我们访谈了哈佛大学的丹娜法伯癌症研究院的生物物理学家关国业,围绕从模式生物到复杂个体的理解路径,探讨细胞形态数据、虚拟生命模型如何推动跨学科研究,以及这些探索将如何帮助我们更好地理解生命本身。
关国业丨受访者
集智俱乐部|整理
目录
发育生物学要回答哪些核心问题?
什么是生命的发育“算法”?
为什么线虫是一个重要研究对象?
模式生物的研究成果,能否迁移到对人发育过程的理解?
生物的发育过程还有多少未知?
发育生物学怎样融合不同学科?
哪些方向可能最先突破?
形态学数据的价值和难点是什么?
形态学数据如何融入现有研究?
如何看待“虚拟细胞”这个方向?
从模式生物到复杂个体的理解之路
从模式生物到复杂个体的理解之路
Q1:发育生物学要回答哪些核心问题?
:如何将一个低复杂度、单信息结构的个体,发展成为一个细胞数量高达亿万量级、高复杂度、高信息度的个体?我认为,这正是发育生物学所要研究的科学问题。这个科学问题不仅属于生物学范畴,也涉及物理学、信息学的范畴。生命最重要的一个特质在于,它是高度可重复的。例如,人类在怀孕之后,并不需要进行特殊的干预,这一颗细胞发展到那么多细胞,它一定会长出大脑、心脏、肺脏,而肺脏更是呈现出精准的不对称结构,一边为两叶,另一边为三叶。此外,下方还有贯穿整个个体的消化道。我们可以想象,从一个细胞发展到亿万个细胞,这个过程体现出极高的精准性。这种精准性究竟如何实现,便是一个值得深入研究的科学问题。
Q2:什么是生命的发育“算法”?
:所谓的“算法”,我认为包含两个层面的含义。
第一个层面非常重要,我们千万不要忘记:所有这些细胞本质上所拥有的那套算法是完全相同的。因为它们都来源于同一个初始细胞。只是在算法运作的过程中,可能会激发出不同的状态,但它本身的那套程序、那套脚本是一致的。因此,我认为这一层意义上的算法极为关键。
第二个层面,是当单个细胞分化为多个细胞之后,问题就变成了一个“多体问题”。如何控制这个多体系统的那一套算法,也就是这些细胞之间如何相互作用、如何识别彼此的位置、是否需要传递信息、又如何进行调控的这一整套机制,构成了第二重意义上的算法。换句话说,这是一种关于细胞之间相互作用并形成更高复杂度的算法。
Q3:为什么线虫是一个重要研究对象?
:线虫是一种非常罕见的、在发育精准性上达到单细胞水平的物种。在英文中我们将其称为恒细胞性(eutelic)生物,“eutelic”这一概念实际上已有一百年历史了。所谓恒细胞性,是指当线虫发育成个体时,它的体细胞数量是恒定的,始终精确地保持在一千多个细胞,一个也不多,一个也不少。如果进一步追踪线虫的发育过程,我们会发现,不仅它最终的体细胞总数是固定的,其每个组织和器官所包含的细胞数也都是固定的。因此,线虫代表了生物学甚至物理学的一种极限,它能够在发育过程中实现单细胞水平的精准控制。
所以研究线虫实际上就是把发育精准性这个科学问题,推向了一个最具挑战的高度。正是由于线虫的发育精准度极高,直接以它为研究对象,我们至少能够明确,发育机制所能达到的精准控制程度究竟有多高,并且知道这种控制能够精确到单个细胞的级别。这也是我一直非常钟爱线虫的原因。
Q4:模式生物的研究成果,能否迁移到对人发育过程的理解?
:我博士期间的研究对象是线虫。线虫是最为广泛使用的模式动物之一,我在线虫上做了很多工作,包括如何重构它细胞级别的发育数据,以及能否利用物理学模型去重建现实中观察到的发育过程。研究者使用线虫、果蝇等模式动物的原因在于,这些动物都具有人类类似的组织器官,例如神经、皮肤和肌肉等。此外,它们也会经历一些非常相似且保守的发育过程,例如对称性破缺,发育出头部和尾部,以及身体的左和右、背和腹等结构。这些过程在不同复杂度的动物中具有高度相似性。
然而,尽管存在高度的相似性,也确实有越来越多的研究发现,人类或高等哺乳动物与模式动物(如线虫、果蝇)存在显著的差异。我来美国之前,并不清楚这种差异究竟有多大。但来到美国后,我亲自着手进行实验,通过在体外培养人类胚胎干细胞来进行探索。这些干细胞最初的状态是完全相同的,没有任何不对称性。我们把约400个干细胞放置到一个圆形的小坑中,以观察这些细胞的后续变化。令人意外的是,我们发现,这400个细胞组成的细胞团不需要我们进行任何干扰,就可以自发地产生头和尾,并出现类似婴儿的脊椎弯曲结构。这种脊椎弯曲结构,在网上随意搜索人类、小鼠或斑马鱼的胚胎发育视频都可以看到。我们在实验室只需三天,就能重现这个结构。
然而,以往研究的模式动物,如线虫、果蝇或者斑马鱼,它们并不具备在没有外界方向性因素刺激的条件下,自发产生身体方向的能力。比如线虫,其体轴方向由精子进入卵子的入射点决定;果蝇则在卵子内部,本身就具有大量不均匀分布于头端和尾端的分子,决定了其发育方向。而人类和小鼠则不依赖于这些外部信息便能自发地产生这种方向性,这一点十分神奇。也就是说,以往的模式动物或低复杂度的动物不具备这种能力,它们十分依赖外界的信息告诉其如何发育,而人类和小鼠却可以自主产生身体的结构与方向。
此外,我还有一位好朋友,他也在国内做教授,同时也喜欢创作科幻小说。他曾经提出一种设想,这种自发产生方向性的特性是否意味着人类可能是外星人在太空中创造的物种,因为太空中缺乏重力和方向性,而人类却能够自行产生头尾结构。我举这个例子是想说明,虽然不同复杂度的动物之间在发育过程中有极大的相似性,但直接研究人类及其细胞依然是非常必要的,因为人类细胞具备许多独特的物理属性和生物属性,这些特性在其他模式生物中不存在,也无法获得。
Q5:生物的发育过程还有多少未知?
:我相信关于这个问题,不同的科学家——无论是从事发育生物学、生物学研究,还是物理学、计算机学研究的人士——都会有不同的看法。因为我本人的经历是博士期间从事线虫的研究,目前则研究小鼠和人类,因此,我个人认为,我们当前对发育的了解实际上是非常肤浅的。虽然我们已经掌握了大量的信息,也挖掘出了许多机制,但未知的部分仍然非常庞大。我甚至认为,未知的内容远比已知的要多。
举一个具体的例子:我们测量了许多发育过程中的信息,比如我最近发表的工作中测量了细胞的形态。在线虫的发育过程中,细胞会呈现怎样的形态,它要向哪个方向移动,它将发育成何种组织或器官,这些信息都可以被定量测量和观察出来。然而,我们知道这些信息,并不意味着我们就能理解或明白:为什么细胞要变成这样的形态,它为什么能够变成这样的形态,以及它为什么能在空间上组成特定的结构?这些问题,我们未必能够真正解答。
从科学和物理学的角度来看,理查德·费曼曾经提出过一个非常经典的观点,“我不能创造的,我就无法理解。(What I cannot create, I do not understand)” 如果我们用这个标准来衡量发育生物学,就会发现大部分的发育过程,我们是无法人工重现或创造的。目前,我们拥有大量高质量的信息和机制积累,但这些信息和机制究竟如何相互作用、为什么它们能够保持高度的精准性,以及它们究竟占据了所有发育运行机制的百分之多少?我认为,这些都是亟待回答的重要问题。
跨学科研究与最可能的突破
跨学科研究与最可能的突破
Q6:发育生物学怎样融合不同学科?
:这是一个非常重要的问题,因为它涉及不同的学科、不同的技术路径以及科学家不同的背景。我在从事线虫研究时,一开始也是数据驱动的方式,后来逐渐意识到发育过程的精准性不仅是一个生物学问题,也涉及物理学问题,于是便转向用物理学的方式去理解。例如,细胞如何分裂、细胞如何产生力学作用,如何实现如此精准的发育过程。在已有的数据基础上,我们建立的物理学模型,实际上已经能够回答为什么那些已有的知识和机制需要存在于特定的位置——因为若这些机制缺失,发育的精准性就无法得到保障。这正是物理学家能够直接帮助生物学家或实验学家去理解机制和知识的方式。
另外,我还想分享一个案例。我们9月份上传的一篇文章,是我们实验室第一篇关于人类类胚胎发育的工作。这篇文章讨论了一个简单的问题,也就是刚刚提到的“对称性破缺”:生命体如何产生头与尾、左与右、腹与背等结构。过去我们在研究线虫时,包括我们的朋友在研究果蝇时,都知道这些物种需要外界诱导才能确定身体的方向。但人和小鼠不需要。我查阅相关文献发现,目前为止,极少有物理学家对此作出回答。但从生物学或实验学的角度,已有一些清晰的数据,实验学家已经能够很好地解释这个现象。
来源:Guan, Guoye, et al. "Cooperative short-and long-range interactions enable robust symmetry breaking and axis formation." bioRxiv (2025): 2025-09.
那么,物理学家在此可以做些什么呢?这是我在这边所进行的工作。我当时提出的问题是:如果我们有四百个、一百个或几百个细胞,将它们放在一起,最初所有的细胞都完全相同。在这种情况下,我们是否能找到一套基于物理学规律的机制,类似元胞自动机一样,让细胞自发地产生特定结构?例如,这些细胞能自发产生一个“头”区域,并稳定为一种细胞类型;另一些则形成“尾”区域,成为另一种细胞类型。
可以看到,这个描述的过程就完全不是一个单纯的生物学问题,也不完全是一个实验问题,而是一个物理学问题。我们实际做的事情很简单:设计一个基因调控网络,这个网络可以产生基因或分子的输出以及力学输出,让所有细胞最初都是一样的,然后观察在怎样的网络设计下,这些细胞能够逐步分化,形成头尾结构。这就是一个纯粹的物理学问题。我将这个问题解决了,并得出结论:细胞一定需要具有某种特定的网络结构。后来,一位实验学家朋友来看了我们的结果,发现这与他多年实验积累的理解完全一致。有了这样的模型后,我就可以指导他的实验。他也非常高兴。例如,我告诉他:“你这个实验之所以失败,肯定是某个原因,你需要多加入某种特定物质,就会成功。”他照做之后,实验果然成功了。
有了这样的模型,我们还可以回答以前基因分析、荧光成像或测序数据中存在的问题。例如,为什么测序时发现细胞的粘性必须在某个特定时间发生分化,之前不分化,而在之后才分化?为什么一定会形成内部细胞是一种类型、外部细胞是另一种类型的结构?这些问题用物理学其实很容易解释:因为这正是实现对称性破缺的最简模型。此外,我们还预测了一种新的细胞力学相互作用模式,即细胞不仅在相互接触时存在力学作用,即使在细胞之间不接触时,也存在远程力学作用。如果存在这种远程作用,对称性破缺将更为稳定。我们花了一年时间做实验,最终证实了这种远程作用的存在。
我个人认为,纯粹实验、生物学路径,以及物理学路径,甚至是AI路径,它们在本质上并不矛盾。只是我们起初常常有一种误解,以为不同领域的研究者彼此无法理解,难以融合。但事实上,大家应该破除这种心理障碍,越早融合在一起,越能更有效地去回答科学问题。
Q7:哪些方向可能最先突破?
:从较为具体的视角来看,关于发育生物学一些细分领域的发展方向,我对其中几个方向持非常乐观的态度,其中部分也是我正在从事的研究方向。
第一个方向是数据积累方面,我认为这是非常乐观的。在整个科学史上,许多科学进展都得益于数据积累,特别是高质量的定量数据积累。当前,从分子级别到细胞级别,以及在不同的时空分辨率下的数据正在飞速积累,每年积累的数据可能都要比前一年翻倍。基于数据积累的速度,我相信终有一天,我们能够完全地了解生命过程中究竟发生了什么。
第二个我认为可以实现的目标,是特定组织器官的重现与人工合成。这个方向已经有了一些成功的案例。我认为在未来十年之内,将会出现一批能够稳定合成的组织和器官。
物理学方面,主要有两个方向,我也非常积极地认为,这些方向能够大幅推动我们对发育的理解。前面的数据积累主要由生物学家和实验学家完成,他们做出了非常伟大的贡献。但如何理解、系统地解构如此复杂的数据,我相信物理学家与计算机科学家的参与,将能够在较短时间内实现对大量数据的系统性理解。比如目前的AlphaFold技术,以及预测基因表达、预测基因与蛋白质之间如何相互作用等,都是计算机科学家积极参与到复杂数据的解构中,运用计算机建模快速解决过去许多重要的科学问题。
另一个非常重要的是物理学家的参与,例如前面提到的图灵斑图的案例,以及许多细胞的力学问题、形态发生问题等。这些问题本质上是物理学过程。物理学家的参与能够将过去的定性或半定量的观察,以及已有的数据,放入一个非常清晰且可预测的框架中,从而形成理论,使人们能够进行预测并进行理性的干预。举一个最直接的例子,也是我本人正在从事且目前已取得成功的工作,就是如何在体外合成多细胞群体的图灵斑图。图灵斑图本身是一个物理学过程,物理学家非常擅长于模拟这种复杂的物理学环境,或者为真实的生命体创造相应的物理学方程。目前我们已实现了在体外用小鼠的细胞重现条纹状的斑图、散点状的斑图,以及不同周期的条纹图案。完成这个工作后的下一步,可以想象,只需要将形成条纹的细胞替换成类似毛囊细胞或者指纹细胞,便可以进一步推动组织和器官的创造。这是我认为物理学家可以大力推动数据理解以及对真实生命体进行控制与干预的重要方向。
以上是我所看好的几个研究方向。
形态学数据助力发育研究
形态学数据助力发育研究
Q8:形态学数据的价值和难点是什么?
:不仅是线虫发育学,实际上所有的科学研究都是如此:我们的观察越精准,就越能发现更多的细节;而细节越丰富,我们就越能验证过去的理解,不论这种理解是定性的还是定量的,是否正确。因此,从方法学的角度来看,我们必须对数据进行更加精准的测量。
形态学长期以来都是数据积累中缺失的一环。这是因为细胞往往处于一个非常密集的状态,数量也非常多。不仅细胞密度高、体量大,而且还在整个活体过程中不断动态变化。此外,当我们希望观察细胞时,又不愿意对它造成伤害,因为一旦损伤细胞,发育过程就会变得异常。因此,如何以无损的方式获得细胞的位置、形态等数据,在技术上一直是一个难题。
Q9:形态学数据如何融入现有研究?
:不同领域的科学家会有不同的看法,我甚至也很好奇其他人将如何使用我们的数据。目前为止,我们的数据已经分发给了许多实验室,像麻省理工学院和普林斯顿大学的多个实验室都向我们要了数据。我认为很快会有人回答这个问题,这些数据下一步会如何被利用。
从我们自己的研究角度来看,目前有几个研究方向正在进行:
第一个研究方向是细胞的形态。细胞的形态实际上是一个非常容易测量的指标。我们目前的研究之一,是对线虫的细胞形态与细胞状态之间的关联进行分析。我们的目标是,通过观察细胞的形态,就能够精准判断出该细胞究竟属于肠道细胞、肌肉细胞,还是皮肤细胞。我们希望构建出这样一个预测器。目前,我们有几种不同的路径来构建这个预测器。一种路径是利用一些显性的几何指标,例如细胞是否接近球形,或者是否比较扁平。另一个路径则来自我的一些同事,他们提出了不同的看法。他们认为,如果拥有大量的数据,我们使用人工智能(AI)的方法可以做到更加精细的区分。比如,传统方法可能只能区分5到8种类型,但通过AI,我们或许可以区分100种类型。因此,另一个方向便是基于这些形态数据,测试类似于AlphaShape这样的AI模型,看能否仅通过细胞形态来准确预测细胞所处的状态,以及后续的形态演变。
第二个研究方向是关于细胞的迁移。我们在观察到细胞形态变化及细胞迁移到特定位置的细节之后,希望从物理学和力学的角度去回答:细胞之间是如何相互作用的,它们如何推动细胞迁移到新的位置,以及细胞之间如何进行信号传递。例如,为什么这两个细胞可以相互接触,而不和其他细胞接触。针对这些问题,我们正在建立新的物理学模型,将细胞的力学、信号传递以及细胞分化等不同的属性整合到一个物理学模型中,重现实际的发育过程。我们的最终目标,是希望创建一个类似“数字生命”的物理学模型,以重现现实世界的发育过程。通过这样的模型,人们可以进行各种干扰实验,比如改变某个细胞的形态,进而观察胚胎发育会发生怎样的变化。
第三个研究方向更加偏向生物学,细胞之间如何进行相互作用,哪些细胞彼此传递信号,从而促使对方形成新的组织器官。在以前没有形态数据时,我们无法精准获知细胞之间的接触关系和响应情况。但现在有了这些数据,我们就能更准确地分析细胞之间是否发生了“交流”,以及某个细胞是否因此产生了新的行为。
以上便是我们目前正在进行的三个主要研究方向。
Q10:如何看待“虚拟细胞”这个方向?
:我最喜欢的电影之一是《黑客帝国》。我认为,《黑客帝国》实际上早已把虚拟细胞,即数字生命或虚拟生命的概念讲得非常清楚了。在计算机内存在一些个体,这些个体自发地拥有一套控制程序,并且在计算机内部运行。我们可以观察到这些个体如何与其他个体进行相互作用,以及它们如何表现出特定的行为和反应。
我认为,这个概念过去可能并未用在细胞上,而现在我们把它应用到细胞领域,因此我们称为虚拟细胞或数字生命。我希望在未来,“虚拟生命”这一传统概念,不仅局限于线虫,还能够在其他领域也被广泛构建起来。此外,我认为虚拟生命的构建还应该加入更多维度的数据。例如,不仅包含细胞的形态和基因表达信息,是否还可以加入其他维度,比如表观遗传信息或染色质的可及性等,从而构建出更加全面的虚拟细胞或数字生命。通过积累更多维度的数据,以及更多标准化、规范化、高质量的数据,所有领域的研究人员都能够共同利用这些数据,开展他们感兴趣的研究。
本文根据访谈内容进行了书面化整理,内容删减仅涉及重复表述与非核心细节。
本文为科普中国创作培育计划作品
受访者:关国业 哈佛大学、丹娜法伯癌症研究院 生物物理学家
创作团队:集智俱乐部
审核专家:刘宇 北京师范大学珠海校区 副教授
出品:中国科协科普部
监制:中国科学技术出版社有限公司、北京中科星河文化传媒有限公司
「系统科学前沿」系列课程第二期
在AI浪潮席卷、生命奥秘不断揭示、社会演化加速的今天,我们对世界的理解正面临前所未有的挑战。用个体视角难以解释群体行为,单点优化难以解决系统瓶颈,简单因果逻辑在多因素交织中失效。复杂性不再是抽象概念,而是我们理解自然、生命与社会运行的底层逻辑。
继《系统科学前沿》首期课程的成功举办,北京师范大学系统科学学院与集智学园再度携手,重磅推出《系统科学前沿》第二期课程。本期课程会带领您从更深层次、更广维度,洞察复杂系统背后的精妙秩序与演化之理,赋能您在科研、产业与个人成长中的创新实践。
详情请见:《系统科学前沿》第二期课程——深度解析复杂机制,洞察万物演化之理
生命复杂性读书会:
生命复杂系统的构成原理
在生物学中心法则的起点,基因作为生命复杂系统的遗传信息载体,在生命周期内稳定存在;而位于中心法则末端的蛋白质,其组织构成和时空变化的复杂性呈指数式增长。随着分子生物学数十年来的突飞猛进,尤其是生命组学(基因组学、转录组学、蛋白质组学和代谢组学等的集合)等领域的日新月异,当代生命科学临近爆发的边缘。如此海量的数据如何帮助我们揭示宇宙中最复杂的物质系统——“人体”的构成原理和设计原理?阐释人类发育、衰老和重大疾病的发生机制?
集智俱乐部联合西湖大学理学院及交叉科学中心讲席教授汤雷翰,国家蛋白质科学中心(北京)副研究员常乘、李杨,香港浸会大学助理教授唐乾元,北京大学前沿交叉学科研究院研究员林一瀚,中国科学院分子细胞科学卓越创新中心博士后唐诗婕,共同发起「生命复杂性:生命复杂系统的构成原理」读书会,从微观细胞尺度、介观组织器官尺度到宏观人体尺度,梳理生命科学领域中的重要问题及重要数据,由生物学家提问,希望促进统计物理、机器学习方法研究者和生命科学研究者之间的深度交流,建立跨学科合作关系,激发新的研究思路和合作项目。读书会目前共进行10期,现在报名参与读书会可以加入读书会社群,观看视频回放,解锁完整读书会权限。
详情请见:
生命复杂性读书会:从微观到宏观,多尺度视角探索生命复杂系统的构成原理
推荐阅读
1. 当生命被编程:AI教会细胞“听话”,未来启发机器自进化
3. 数据驱动AI虚拟细胞探索:从Arc挑战赛看“数据基座”的力量
5. 集智学园精品课程免费开放,解锁系统科学与 AI 新世界
点击“阅读原文”,报名课程
