1. 马尔可夫链与转移概率

为了理解C-K方程的用途,我们必须首先明确其应用的上下文:离散时间马尔可夫链

一个马尔可夫链是一个随机过程 ,它描述了一个系统在一系列时间点上在不同状态之间的转移。其核心特性是马尔可夫性质(Markov Property),即“无记忆性”:系统在未来时刻 的状态,只依赖于其当前时刻 的状态,而与它如何到达当前状态的历史路径无关。

形式化而言,对于任意的状态 和历史状态序列

这个条件概率 被称为一步转移概率,记作 。它是马尔可夫链最基本的组成部分,描述了系统从状态 一步转移到状态 的概率。所有这些概率可以组成一个转移概率矩阵

2. C-K方程的提出——解决多步转移问题

一步转移概率告诉了我们系统下一步的行为。一个自然而然的问题是:如果我们知道系统如何进行一步转移,我们如何计算系统经过n步之后从状态i转移到状态j的概率?

这个n步转移概率记作 。C-K方程正是为了回答这个问题而提出的。

C-K方程的形式化表述: 对于任意的非负整数 和任意状态 ,有:

其中 是所有可能状态的集合。

这个方程的直观含义是:从状态 经过 步到达状态 的总概率,等于从状态 先经过 步到达某个中间状态 ,再从这个中间状态 经过 步到达最终状态 的所有可能路径的概率之和。 我们必须对所有可能的中间状态 进行求和,以确保覆盖所有路径。

3. C-K方程的证明

现在,我们来逐步分析一下证明过程。

第一步:定义n步转移概率 证明的起点是 的定义。

这行公式仅仅是写出了 步转移概率的数学定义,即在初始状态为 的条件下,经过 步后系统处于状态 的概率。

第二步:应用条件概率的定义 根据条件概率的基本定义 ,其中

这一步是将条件概率展开为其联合概率与条件事件概率的比值形式。

第三步:引入中间状态并应用全概率公式 这是证明中最关键的、最具创造性的一步。我们考虑系统在中间时刻 的状态。系统在时刻 必然处于某个状态 。根据全概率公式(Law of Total Probability),我们可以将事件 的概率,分解为在所有可能的中间状态 下的条件概率之和。

将此式代入分母不变,得到:

这一步的核心思想是“分情况讨论”:要计算从 的总概率,我们可以枚举在时刻 可能的每一个落脚点 ,计算通过该落脚点的路径概率,然后将所有可能路径的概率相加。

第四步:代数变形以构造条件概率 为了将上式重新整理成条件概率的形式,证明中使用了一个标准的代数技巧:乘以一个值为1的项

这一步看起来是多余的,但其目的是为了在下一步中,将复杂的联合概率分解为两个更简单的条件概率的乘积。

第五步:再次应用条件概率的定义 现在,我们重新审视上式中的两部分:

  • 第一部分:,根据条件概率定义,这等于
  • 第二部分:,根据条件概率定义,这等于

所以,整个表达式变为:

第六步:应用马尔可夫性质 这是证明的第二个关键步骤,它利用了马尔可夫链的根本性质。我们来看第一项 。马尔可夫性质告诉我们,给定当前状态(时刻),未来的状态(时刻)与过去的状态(时刻)无关。因此:

这一步是合法的,当且仅当过程具有马尔可夫性。

第七步:将条件概率还原为n步转移概率符号 现在,我们将简化后的表达式还原为 的形式。

  • :这是从状态 开始,经过 步到达状态 的概率,即
  • :这是从状态 开始,经过 步到达状态 的概率,即

将这些符号代回求和式,我们便得到了C-K方程:

证明完毕。

4. C-K方程的矩阵形式与意义

C-K方程 的形式,与矩阵乘法的定义完全一致。如果我们定义 n 步转移概率矩阵为 ,其 元为 ,那么C-K方程可以被简洁地写作:

这是一个重要的结论。它告诉我们,两个转移矩阵的乘积,对应于其步数的相加。由此可以进行简单的推导:

可以看到,马尔可夫链的n步转移概率矩阵,就是其一步转移概率矩阵的 n次幂。C-K方程为这一优雅的代数关系提供了坚实的概率论基础。它使得我们可以通过简单、高效的矩阵乘法运算,来分析和预测马尔可夫链的长期演化行为。