原创 集智百科团队 2025-08-11 18:47 云南
一种过去无关的系统演化、建模与预测工具。
导语
马尔科夫链是指一类定义在可列集合上、具有马尔科夫性的随机过程。其中,这个集合被称为是状态空间,而马尔科夫性是指在给定系统当前状态下,对于未来状态的预测不再依赖于过去状态。它描述了随着时间的推移,系统状态的变化过程。进一步,根据时间参数的离散或连续特性,它可以具体划分为离散时间马尔科夫链和连续时间马尔科夫链。
本词条主要参考北京大学李东风老师的应用随机过程讲义[1]以及清华大学张颢老师的书籍《随机过程及其应用》[2],作者们对相关基础概念进行了梳理,希望为后续相关应用做出铺垫。
为了系统梳理因果涌现最新进展,北京师范大学系统科学学院教授、集智俱乐部创始人张江老师领衔因果涌现系列读书会,目前已经持续到「因果涌现第六季」读书会,如果你对这一话题感兴趣,非常推荐你加入社区!
“集智百科精选”是一个长期专栏,持续为大家推送复杂性科学相关的基本概念和资源信息。作为集智俱乐部的开源科学项目,集智百科希望打造复杂性科学领域最全面的百科全书,欢迎对复杂性科学感兴趣、热爱知识整理和分享的朋友加入,文末可以扫码报名加入百科志愿者!
↑↑↑扫码直达百科词条
关键词:马尔科夫链,粗粒化
张江、NULL、张代健 | 编译
张江、王志鹏 | 整理、审校
目录
1. 历史发展
2. 离散(或连续)时间马尔科夫链的定义
2.1 例子
2.1.1 流网络
2.1.2 高尔顿钉板
2.1.3 Yahtzee的骰子游戏
2.2 定义
3. 离散时间马尔科夫链
3.1 基本概念和性质
3.1.1 多步转移概率的遗忘性
3.1.2 多步转移概率的计算——Chapman-Kolmogorov方程
3.1.3 时齐性与非时齐性
3.1.3.1 时齐性例子:高尔顿钉板
3.1.3.2 非时齐性例子:波利亚坛子模型
3.1.3.3 定义
3.2 时齐马尔科夫链的转移过程——初始状态确定
3.2.1 多步转移概率的计算与一步转移概率矩阵
3.2.2 基于转移行为的状态分类
3.2.2.1 可达、互通与可约性
3.2.2.2 周期性
3.3 时齐马尔科夫链的演化——初始状态随机
3.3.1 演化过程
3.3.2 平稳分布与转移概率矩阵的谱
3.4 时间可逆的马尔科夫链
3.4.1 时间可逆性的定义(细致平衡条件)及可逆分布
3.4.2 可逆分布与平稳分布
3.4.3 时间可逆性与动力学可逆性
3.5 离散时间马尔科夫链的粗粒化和度量
3.5.1 离散时间马尔科夫链的粗粒化
3.5.1.1 马尔科夫链的成块性
3.5.1.2 马尔科夫链的SVD粗粒化
3.5.2 离散时间马尔科夫链的度量
3.5.2.1 转移概率矩阵的有效信息
3.5.2.2 转移概率矩阵的动力学可逆性
4. 连续时间马尔科夫链
4.1 基本概念
4.1.1 与离散时间马尔科夫链对应的基本概念
4.1.1.1 转移速率矩阵
4.1.1.2 转移速率矩阵与转移概率矩阵关系
4.1.2 连续时间马尔科夫链中独有的概念
4.1.3 具体例子1: 排队问题
4.1.4 具体例子2: 基因调控网络
4.2 转移过程和演化性质
4.2.1 状态的划分——可达、互通和可约性
4.2.2 状态分布随着时间变化保持稳定——平稳分布
4.2.3 逆向过程和正向过程同分布——平稳可逆分布
4.2.4 具体例子
4.3 连续时间马尔科夫链的粗粒化
4.3.1 强成块性
4.3.2 时间尺度分解
1. 历史发展
1. 历史发展
1906年,俄罗斯数学家Andrey Andreyevich Markov在研究大数定律时,首次定义了离散随机序列在给定现在的条件下,过去与未来的条件独立性 [3]。这个性质后来被称为马尔科夫性,满足这个性质的离散随机过程被称为马尔科夫链。随后,Andrey Markov基于普希金的长诗《叶甫盖尼・奥涅金》研究了俄语字母序列上的马尔科夫链及其极限分布[4]。1931年,David George Kendall等人推广为连续时间马尔科夫链并建立了相应理论,其中包括著名的Kolmogorov方程[5]。1953年,Nicholas Metropolis通过引入马尔科夫链发展出了著名的马尔科夫链蒙特卡洛随机模拟算法[6]。
进一步,马尔科夫链被发展为更复杂的模型。1966年,Leonard Esau Baum和Ted Petrie提出了状态隐藏的双重马尔科夫过程——隐马尔科夫模型 [7]。 1980 年,Kindermann Richard和John Leslie Snell在专著中详细介绍了针对多维、无向的马尔科夫随机场 [8]。
2. 离散(或连续)时间马尔科夫链的定义
2. 离散(或连续)时间马尔科夫链的定义
2.1 例子
2.1.1 流网络
假设一个流网络模型,如图所示,其中节点代表不同的管道交汇处,连边代表不同的流管道,连边上的权重代表流量,方向代表水流的方向。
考虑一个粒子在此流网络中流动,在每一个节点处,它会以一定的概率顺不同的连边流向下一个节点。如果我们将粒子可能处于不同的节点看作是该粒子的不同状态,即定义状态空间描述该粒子的行为,其中
2.1.2 高尔顿钉板
高尔顿钉板是英国科学家高尔顿(Francis Galton)发明的一种物理装置。如下图(左)所示,这个有趣的装置由一大堆钉子按照三角形形状规则排列而形成的一个钉板。钉板的上侧有一个开口,你可以从这个开口投放小钢球进来,下面则是由若干个柱状的凹槽构成,每个凹槽可以把钢球接住,并盛放起来。实验的时候,你可以从上面的开口投放小球,小球就会下落,从而碰撞到一些钉子,然后坠入底部的凹槽之内。由于小球每碰撞一次钉子,就可能从该钉子的左侧下落,或从右侧下落,进而再碰撞另一个钉子,如此循环。于是,最终落到槽中的小球就可能堆积出一个小球的分布,这个分布会形成一种中间凸起,两边凹陷的钟形曲线。这个装置是由英国科学家高尔顿发明的,用以说明概率论中的中心极限定理,因而人们就叫它“高尔顿钉板”。
小球的坠落过程实际上可以被看作是一个马尔科夫链。为了方便起见,我们仅仅考虑由6颗钉子,4个底部凹槽构成的高尔顿钉板来作为示例(如上图右所示)。其中每一个节点对应了一颗钉子,也对应了小球在某一时刻的取值状态。一个小球在不同的钉子之间跳跃就可以由右图所示的状态转移图表示,其中连边上的数值代表从上一个节点跳转到下一个节点的概率。7~10号节点对应底部的4个凹槽。一旦进入这4个节点中的任意一个,小球就不动了,因此小球就停留在当前这个节点。在下落过程中,小球在每一层的位置只依赖于它在上一层的下落位置,因此,这也是一个马尔科夫过程。
2.1.3 Yahtzee的骰子游戏
接下来的这个例子来源于一个经典的骰子游戏——Yahtzee游戏。在游戏中共有5个六面均匀的骰子,游戏参与者至多有三次投掷骰子的机会,一次可以同时投掷5颗骰子。为了简化,我们在此处假设游戏的目标是使得所有骰子的结果相同(称为获得Yahtzee)。同时,游戏中有一个规则是如果游戏者在前两次的投掷后,出现了重复的数字,则可以仅针对剩下的与重复数字不同的骰子再进行一次投掷。
例如,第一次投掷结果为11234,由于有两个1,所以你可以保持对应的两个骰子不动,接下来,你只需要重新投掷234对应的三个骰子就可以。[9]
在这个随机过程中,我们可以用变量
2.2 定义
上面的几个例子都是时间和状态空间均为离散的数字,且系统都满足马尔科夫性质,也就是
定义(马尔科夫链):称状态空间,其中,
为马尔科夫链的一步转移概率,并引入记号
。
上述定义中,我们对时间步有非常明确的要求,即只能取一系列连续的整数。然而,在现实世界中,时间步实际上是取值为连续的实数的,它很难转化成一系列连续的整数。在这样的连续的时间域上,我们同样可以定义连续时间马尔科夫随机过程。
具体地:
定义(连续时间马尔科夫链):称状态空间
日常生活中的许多现象都可以利用马尔科夫链来描述,例如天气的变化。简单考虑两种天气状态,下雨和不下雨。那么,对应的马尔科夫假设就是明天是否下雨只取决于今天的天气,而与之前的天气无关。
3. 离散时间马尔科夫链
3. 离散时间马尔科夫链
3.1 基本概念和性质
上述定义中强调了一步转移概率对于历史的遗忘性,也就是当前状态只与上一时刻的状态有关,而与更早以前的状态无关。那么,我们如何利用这一性质计算任意步转移概率呢?如果对于多步转移概率,历史遗忘性也被满足,那么我们可以通过将路径进行分解来计算任意步的转移概率。
3.1.1 多步转移概率的遗忘性
考虑离散时间马尔科夫链,如果对任意的n ≥ 0 和m ≥ 1 ,有
即当X n 给定后,X n + m 和X n − 1 , … , X 0 条件独立。则我们称这一马尔科夫链具有多步转移的遗忘性。
注:事实上,你可以对
3.1.2 多步转移概率的计算——Chapman-Kolmogorov方程
由于上述性质,即给定现在,系统的过去与未来都是相互独立的,因此遗忘性对于多步转移概率也是成立的。那么,对于任意步转移概率的计算,我们就可以根据这个性质进行分解计算。
具体来说,对于,我们可以先给定某一中间时刻
这个式子被称为Chapman-Kolmogorov方程。上述计算过程可以绘制为示意图:
3.1.3 时齐性与非时齐性
由式1可知,多步转移概率其实是一步转移概率的乘积与求和。那么,我们自然地会想到,在计算乘积的过程中,一步转移概率是否会随时间变化?
3.1.3.1 时齐性例子:高尔顿钉板
回顾前面的三层高尔顿钉板的实验例子,如果我们将钉子按照它所属层的顺序依次编号为1-6,凹槽从左至右编号为7-10,那么小球下落过程构成了一个状态空间
其中,任意一条连边上的数值代表从连边的起点状态作为条件,到连边终点状态的条件转移概率。
很显然,这是一个与时间无关的概率转移矩阵的例子,这种情况也叫时齐的马尔科夫链。
3.1.3.2 非时齐性例子:波利亚坛子模型
然而,在另一个经典概率模型——波利亚坛子模型(Polya's urn scheme)中,一步转移概率就与时间有关。
模型假设坛子中装有
显然,上述概率是随着
定义
一般的,当一步转移概率只与状态
与状态
下面本词条的讨论主要围绕着离散时间时齐马尔科夫链而展开,这是最常见的一种场景。
3.2 时齐马尔科夫链的转移过程——初始状态确定
3.2.1 多步转移概率的计算与一步转移概率矩阵
由时齐性假设,记一步转移概率。
此时,转移过程如下
对应的Chapman-kolmogorov方程的具体表达式如下,
不难看出,上述方程与起始时刻无关,仅与时间间隔有关,即如果将时间窗任意平移
所以,一般的,记
观察上述方程容易发现,求和项是对处在中间的下角标进行遍历,这恰恰对应着矩阵乘法。 将上述例子中一步转移概率
那么,Chapman-Kolmogorov方程变形为,
其中,
通过观察可知,矩阵
一般的,称满足上述性质的矩阵为随机矩阵(stochastic matrix)。
3.2.2 基于转移行为的状态分类
3.2.2.1 可达、互通与可约性
下面举一个简单的例子具体观察状态间的转移行为,下图中(a)和(b)分别为马尔科夫链的转移概率矩阵和图表示。
例1.
由Chapman-Kolmogorov方程,可得100步转移概率矩阵和200步转移概率矩阵为
通过观察马尔科夫链的图表示可以发现,状态1和状态2之间存在互相到达的路径,但状态3与状态1和状态2之间均不能互相到达。此外,容易看出,随着转移步数的增加,对应的转移概率矩阵的第一列和第二列均趋近0,即状态1和状态2的转移行为逐渐一致,但与状态3的转移行为存在明显差异。那么,可以利用这种互相可达的特性来将相同转移行为的状态划分为一类,状态1和状态2是互通的,可被归为一类,而状态3只可达自身,所以状态3为另一个类。下面给出可达和互通的严格定义。
首先,需要明确可达的定义。图中的路径的权重是大于0的概率值,所以定义如下:
定义(可达关系):
易知,可达是传递关系,即
定义(互通关系): 进一步,若
易知,互通是一种等价关系。那么,可以将互通的状态归为一类,且任一状态仅属于一个类。
定义(不可约):特别的,若马尔科夫链中只存在一个互通等价类,则称它是不可约的(irreducible);否则,称为是可约的(reducible)。
若对例1中的状态3的转移分布稍作修改,
那么,3个状态间彼此互通,即均属于同一个类,则其对应的马尔科夫链是不可约的。
3.2.2.2 周期性
例2. 下面考察一个简单的两状态马尔科夫链,其转移概率矩阵。
计算
不难发现这个马尔科夫链的状态转移存在着周期性——初始状态不论是状态1还是状态2,每转移2步,都能够以正概率返回自身状态,即周期为2。进一步,如果有任一状态能够以一定周期、正概率返回自身,转移矩阵则不存在极限,即状态的周期性成为了一个转移矩阵收敛的判断条件。下面介绍状态的周期性的严格定义:
定义(周期):记使得转移概率
根据
回顾上节例1中的三状态马尔科夫链,由于
上述分类方法是基于局部性质进行两两判断分类。此外,还可以从整体转移机制的角度对状态进行划分,详细介绍参见成块性(Lumpability)。
3.2 时齐马尔科夫链的演化——初始状态随机
3.2.1 演化过程
上节中关于转移过程的内容,实际上是固定了初始时刻的状态。一般的,初始时刻的状态也存在着一定的随机性,即可以使用一个分布列来刻画。
记。
根据全概率公式,
进一步,递推可得,
注:
例1中的马尔科夫链如果在0时刻三个状态等概率地出现,那么在1时刻和2时刻的状态分布分别为
若将左手方程的左右两边同时进行转置,得
这是一个一阶线性齐次差分方程。由递推关系,自然地会联想到,马尔科夫链的长期行为本质上是一个特征值问题。
3.2.2 平稳分布与转移概率矩阵的谱
下面,我们来考察一下
它们的特征值分别为
通过观察不难发现两个共同的性质:
1都是两个转移矩阵的特征值;
特征值的模长均不超过1。
这两条性质对于一般的随机矩阵仍是成立的。
下面,我们简要分析特征值1以及对应的特征向量。
由于
另一方面,由于
所以,
注:即方程
若
,有:
,即如果初始时刻系统状态服从该分布,那么任意时刻下系统状态分布保持不变。
定义(平稳分布):我们称
考虑概率转移矩阵。易知,其存在平稳分布
。
如果一个马尔科夫链存在平稳分布
3.4 时间可逆的马尔科夫链
前面的讨论都沿着时间正向在讨论,下面考虑时间反向的过程。
即反向过程仍满足马尔科夫性质。这其实是马尔科夫性质的等价定义——给定现在的条件下,过去与未来条件独立。并且,一般来讲,上述一步转移概率是与时间
下面考察有限状态空间上不可约、非周期的马尔科夫链,其唯一的平稳分布为
此时,反向过程是齐次的。
3.4.1 时间可逆性的定义(细致平衡条件)及可逆分布
进一步,考虑一种特殊情形,
定义(时间可逆马尔科夫链):若
此时,称马尔科夫链满足细致平衡条件,也称该马尔科夫链是时间可逆的,称概率分布
注:
3.4.2 可逆分布与平稳分布
进一步,由细致平衡条件,则可逆分布是平稳分布,即
证:
这一性质为求解平稳分布提供了一种新的方法。例如,考虑如下可逆的马尔科夫链,其概率转移矩阵为:
利用细致平衡条件,可以得到关于
进一步,由求和为1,得可逆分布(也是平稳分布)
但上述结论反之则不然,考虑如下概率转移矩阵
易知,其存在平稳分布,但
即该链不是可逆的。
3.4.3 时间可逆性与动力学可逆性
时间可逆性描述的是状态概率分布上的时间反演对称性,即如果把时间点以达到平稳分布的时间为对称轴,进行反转,则可以得到一系列和原马尔科夫链正向时间演化过程完全相同的状态概率分布。
与时间可逆性不同,动力学可逆性则描述的是状态上的可逆性。如果一个平稳马尔科夫过程的概率转移矩阵是可逆的,则该过程的状态演化就完全是时间可逆的。进一步,近似动力学可逆性可以作为一种因果度量,详细内容参见后面有关转移概率矩阵的动力学可逆性的讨论,也可参考词条基于可逆性的因果涌现理论|集智百科。
3.5 离散时间马尔科夫链的粗粒化和度量
3.5.1 离散时间马尔科夫链的粗粒化
一般的,在状态分类的基础上,对分类后状态空间(宏观尺度上)重新定义马尔科夫转移矩阵的过程被称为马尔科夫概率转移矩阵的粗粒化(coarse-graining),详细介绍参见词条马尔科夫链的粗粒化。下面,简要介绍两种粗粒化方法——成块性和基于SVD分解的粗粒化方法。
3.5.1.1 马尔科夫链的成块性
可约是基于局部连通性进行两两判断从而对状态空间进行分类,但有时这个划分粒度仍很粗糙,即连通的状态间存在其他性质或结构可以继续划分。
例如,考虑如下马尔科夫链,
易知,这个马尔科夫链是不可约的。此外,无论从状态1还是2出发,下一时刻转移至状态1或状态2的概率均为0.6,转移至其他两个状态3和4的概率均为0.4。另一方面,状态3和状态4也是如此。那么,基于这样的转移机制,可以将状态1和2划分为1组,状态3和状态4划分为一组,形成两个宏观状态,得到一个新的两状态的马尔科夫转移矩阵
即同属于一个宏观状态的原始微观状态转移至宏观状态的机制是相同的,这种性质被称为成块性(Lumpability)。定义
详细介绍参见词条马尔科夫链的成块性。
3.5.1.2 马尔科夫链的SVD粗粒化
从转移矩阵谱的角度出发,张江团队提出了基于奇异值分解(SVD)的粗粒化方法[10]。
第一步,对状态空间进行划分。首先,考虑。接下来,利用Kmeans等聚类算法将
的行向量聚为
其中,的第
第二步,定义新的转移概率矩阵。假设有限维转移矩阵
称其组成的矩阵
为了满足行和为1的约束,对矩阵
详细介绍参见词条基于可逆性的因果涌现理论。
3.5.2 离散时间马尔科夫链的度量
3.5.2.1 转移概率矩阵的有效信息
马尔科夫链可以视为是通信领域中一种特殊的信道——离散无记忆信道。信道的输入和输出分别记为
为了描述信道能够传输的最大信息量,信息论领域提出了信道容量的概念,具体定义为
其中,
基于上述信道容量的概念,Erik Hoel[11]提出了离散马尔科夫动力学的有效信息度量
其中,和
为
通过粗粒化操作,可以得到宏观尺度下的转移矩阵
为有效信息增益。如果存在某个宏观尺度,使得有效信息增益大于0,则认为该系统发生了因果涌现。详细内容参见词条有效信息。
3.5.2.2 转移概率矩阵的动力学可逆性
易知,当且仅当
通过观察可以发现置换矩阵具有两方面特性:一方面,它是满秩矩阵;另一方面,它每行或列均为独热向量,具有稀疏性。这两方面都可以通过转移概率矩阵
并且
基于上述特性,张江团队定义转移概率矩阵
作为动力学可逆性的近似[10]。在应用中,常采用
基于
4. 连续时间马尔科夫链
4. 连续时间马尔科夫链
我们先以一个简单的例子说明为何要引入连续时间马尔科夫链(Continuous-Time Markov Chain,CTMC)。假设我们观察一个灯泡的运行状态,其状态空间只有两种:正常(工作)和故障(损坏)。初始时灯泡正常工作,而从正常到故障的转移时间服从指数分布,故障率为λ。如果我们试图用离散时间马尔科夫链(Discrete-Time Markov Chain,DTMC)来描述这一过程,就会遇到明显的局限性。
在DTMC中,状态转移只能发生在固定的时间步长上(如每小时、每天等),而灯泡的故障却可能在任意连续时间点发生。如果我们强行采用离散时间建模,就必须人为设定一个时间间隔
相比之下,CTMC更准确地刻画这一过程。灯泡的故障被建模为瞬时转移,其转移速率矩阵Q(详见转移速率矩阵一节)直接由故障率λ决定:
其中,第一个状态为工作,第二个状态为故障。矩阵中的第一行第二列的数字
回顾一下之前的定义,我们设
定义(连续时间马尔科夫链):如果对于任意正整数
则称
4.1 基本概念
4.1.1 与离散时间马尔科夫链对应的基本概念
与离散情形中一样,CTMC对于任意时间间隔都具有历史遗忘性。即对于
和离散时间马尔科夫链相同,我们定义满足:,
由时齐性,可知转移概率与起始时间
并且当对于任意一个CTMC,在
有了任意两个状态间的转移概率,我们就能定义
我们可以将一个时间间隔比较长的转移概率拆分为两个时间间隔比较短的转移概率,Chapman-Kolmogorov方程给出了两者的关系
其中。
4.1.1 连续时间马尔科夫链中独有的概念
4.1.2.1 转移速率矩阵
在CTMC中,我们几乎都是用转移速率矩阵或者转移强度矩阵来描述状态转移的规则,记作
并且对于有限状态的CTMC,转移概率矩阵
4.1.2.2 转移速率矩阵与转移概率矩阵关系
在这一节我们给出转移速率矩阵和转移概率矩阵之间关系推导思路,也就是为什么公式(2)成立的“证明”,仅供感兴趣的读者参考。
先给定转移概率矩阵唯一决定。这个极限是否存在呢?
在任何有限之间内只有有限次转移的CTMC,称作规则的CTMC。为了简化讨论,以后无特殊声明时,讨论的都是规则的CTMC。CTMC的轨迹是阶梯函数,并且在跳跃点是右连续的,更重要的是,它的概率转移矩阵
由于
接着讨论给定转移速率矩阵
先回忆Chapman-Kolmogorov方程:
我们将右边称为前,把左边称为后,在上式两边对后面的
写成矩阵形式得到:
我们上面这两个式子称作CTMC的向后方程。
同样可以对Chapman-Kolmogorov方程前面的
写成矩阵形式得到
这两个式子称作CTMC的向前方程。
向前方程和向后方程统称为Kolmogorov方程。
如果CTMC。则矩阵
再关于t逐项求导得到:
利用这个等式以及向前方程(也可以用向后方程证明),我们可以证明有限状态CTMC的转移概率矩阵
4.1.3 具体例子1: 排队问题
我们可以用CTMC来描述超市收银台的顾客数。假设超市中只有一个收银台,顾客随机到达收银台并排队结账。顾客到达人数程服从泊松过程,平均到达速率为
很容易它满足转移速率矩阵的三条性质。其中对角线元素表示离开状态n的总速率为
下面我们给一个维度更少的例子来说明转移速率矩阵在CTMC中相对于转移概率矩阵的优势:
固定时间间隔为1,可以通过数值计算的方式计算矩阵指数,从
可以看到用
4.1.4 具体例子2: 基因调控网络
在系统生物学中,基因调控网络(Gene Regulatory Network, GRN)描述了基因、蛋白质和其他分子之间复杂的相互作用,共同控制基因的表达水平。为了定量分析这类网络的动态行为,特别是涉及随机性的情况(如基因表达的噪声),人们常用CTMC作为数学建模的框架。考虑一个简化的两节点基因调控网络模型,包含以下两个组件。基因A:具有自发激活(Spontaneous Activation)和基础失活(Basal Inactivation)的能力。当基因A处于激活状态时,它能促进转录调节子R(Transcriptional Regulator R)的表达或激活。调节子R :具有基础失活(Basal Inactivation)的能力。当调节子R处于激活状态时,它会抑制基因A的表达。这个网络形成了一个负反馈回路:A激活R,而R抑制A。
两节点基因调控网络
根据基因A和调节子R的状态组合,整个系统可以处在一下四种离散状态之一:
基因调控网络状态转移示意图
基于上述状态定义和转移速率,可以构建描述该CTMC模型的转移速率矩阵Q。矩阵的行和列按顺序对应状态
4.2 转移过程和演化性质
4.2.1 状态的划分——可达、互通和可约性
和离散时间马尔科夫链的一样,为了研究CTMC的极限分布以及平稳分布存在的条件,需要引入可达概念。设
实际上CTMC的状态划分问题与DTMC的状态划分问题完全等价。对于任何的离散时间马尔科夫链,其状态空间和
因为总有
4.2.2 状态分布随着时间变化保持稳定——平稳分布
类似离散时间马尔科夫链,可以引入CTMC的平稳分布的定义。设
更进一步,我们可以定义平稳过程。
定义(CTMC的平稳过程):如果对于任何
前面我们提到了,在实际问题中我们常用转移速率矩阵
4.2.3 逆向过程和正向过程同分布——平稳可逆分布
在离散时间马尔科夫链
定义(细致平衡条件):设
为细致平衡条件,若
同样的,由于实际问题中常用转移速率矩阵得到
事实上,若
4.1.4 具体例子
对于一个转移速率矩阵如下的CTMC
通过解平稳分布一节中给出的线性方程组,可以得到CTMC的唯一平稳分布。平稳分布是不是可逆的呢?以状态0和1为例,有
,不满足公式(2)中的细致平衡条件,所以这个CTMC是不可逆的。
而对于另一个转移速率矩阵:
用同样的方法算出它的平稳分布为均匀分布,并且它满足公式(2)中的细致平衡条件,所以
我们再回到最开始给出的超市排队的例子,它的转移速率矩阵为:
读者可以自行求解平稳分布满足的方程组,会发现只有当
4.3 连续时间马尔科夫链的粗粒化
在连续时间马尔科夫链中粗粒化的本质是构造映射
4.3.1 强成块性
当CTMC满足强成块性时,即存在状态划分使得任意区块
此时粗粒化后的转移速率矩阵
强成块性确保了区块内状态的不可区分性,粗粒化过程严格保持瞬态与稳态分布[12]。
4.3.2 时间尺度分解
对于有快慢分离特性的系统,快变量可很快达到准稳态,慢变量主导宏观动力学。设快变量状态集
其中
参考文献
李东风. 应用随机过程, 2024, 163-215. https://www.math.pku.edu.cn/teachers/lidf/course/stochproc/stochprocnotes/html/_book/StocProc.pdf
陆大金,张颢. 随机过程及其应用, 清华出版社,2012, 176-255.
Markov A A.Rasprostranenie zakona bol’shih chisel na velichiny, zavisyaschie drug ot druga.Izvestiya Fiziko-matematicheskogo obschestva pri Kazanskom universitete, 1906, 15: 135-156.
Markov A A. Issledovanie statističeskich zakonov vjumel’nogo jazika (Analysis of statistical laws in the verse language). Trudy Imperatorskogo S.-Peterburgskogo Mineralogičeskogo Obščestva, 2nd series, 1913, 42:153–162.
Kendall D G, Batchelor G K, Bingham N H, Hayman W K, Hyland J M E, Lorentz G G, Moffatt H K, Parry W, Razborov A A, Robinson C A and Whittle P. Andrei Nikolaevich Kolmogorov (1903–1987). Bulletin of the London Mathematical Society, 1990, 22(1): 31-100.
Metropolis N, Rosenbluth A W, Rosenbluth M N, Teller A H and Teller E. Equation of state calculations by fast computing machines. The journal of chemical physics, 1953, 21(6): 1087-1092.
Baum L E and Petrie T. Statistical inference for probabilistic functions of finite state Markov chains. The annals of mathematical statistics, 1966, 37(6): 1554-1563.
Kindermann R, Snell J L. Markov random fields and their applications. American mathematical society, 1980.
http://www.stat.yale.edu/~pollard/Courses/251.spring2013/Handouts/Chang-MarkovChains.pdf
Zhang J, Tao R Y, Leong H K, Yang M Z, Yuan B. Dynamical reversibility and a new theory of causal emergence based on SVD. npj Complexity, 2025, 2(3): 1-11.
Hoel E P, Albantakis L, Tononi G. Quantifying causal emergence shows that macro can beat micro. Proceedings of the National Academy of Sciences, 2013, 110(49): 19790-19795.
Luca Cardelli and Radu Grosu and Kim G. Larsen and Mirco Tribastone and Max Tschaikowski and Andrea Vandin. Lumpability for Uncertain Continuous-Time Markov Chains. QEST, 2021, 391-409.
Daria Stepanova, Helen M. Byrne, Philip K. Maini, and Tomás Alarcón. A Method to Coarse-Grain Multiagent Stochastic Systems with Regions of Multistability. Multiscale Model. Simul. 2022, 20(1):404-432.
(参考文献可上下滑动查看)
作者简介
本词条由集智俱乐部众包生产,难免存在纰漏和问题,欢迎大家留言反馈,一经采纳,可以获得对应的积分奖励噢!
加入我们
亲爱的社区伙伴与知识探索者:
我们诚挚邀请热爱知识分享的您,加入集智百科词条编写志愿团队!无论您是领域专家,还是对特定主题充满热忱的学习者,这里都有您的舞台。通过编写百科词条,您将为全球读者传递权威知识,同时获得专家指导与个人能力跃升的双重成长。
📝 志愿者职责
创作新词条:覆盖复杂系统、人工智能等前沿领域
迭代经典内容:更新现有词条,守护知识的准确性与时效性
质量守护者:参与内容校对审核,共建精品知识库
🌟 我们期待您
集智读书会成员(需完成共创任务并获得退费资格)
拥有清晰表达复杂概念的写作能力
对特定领域有深度研究或强烈兴趣
具备信息检索与整合素养
怀揣责任感与协作精神,愿为知识共享赋能
🎁 您将收获
百科积分(支持兑换集智俱乐部周边:文化衫、复杂科学知识卡等)
集智俱乐部创始人张江教授亲自指导写作
科研助理晋升通道:表现优异者可加入张江教授科研团队
因果涌现读书会第六季
在霓虹灯的闪烁、蚁群的精密协作、人类意识的诞生中,隐藏着微观与宏观之间深刻的因果关联——这些看似简单的个体行为,如何跨越尺度,涌现出令人惊叹的复杂现象?因果涌现理论为我们揭示了答案:复杂系统的宏观特征无法通过微观元素的简单叠加解释,而是源于多尺度动态交互中涌现的因果结构。从奇异值分解(SVD)驱动的动态可逆性分析,到因果抽象与信息分解的量化工具,研究者们正逐步构建起一套跨越数学、物理与信息科学的理论框架,试图解码复杂系统的“涌现密码”。
为了系统梳理因果涌现最新进展,北京师范大学系统科学学院教授、集智俱乐部创始人张江老师领衔发起「因果涌现第六季」读书会,组织对本话题感兴趣的朋友,深入研读相关文献,激发科研灵感。
读书会将从2025年3月16日开始,每周日早9:00-11:00,持续时间预计10周左右。每周进行线上会议,与主讲人等社区成员当面交流,之后可以获得视频回放持续学习。诚挚邀请领域内研究者、寻求跨领域融合的研究者加入,共同探讨。
推荐阅读
3. 因果效应度量|集智百科
5. 集智学园精品课程免费开放,解锁系统科学与 AI 新世界
点击“阅读原文”,报名读书会
