讨论详情 - Sanhai

ACM
主定理
sanhai V LV 5 SU @ 2025-9-18 18:23:03

用大白话聊聊信息学（主要是算法分析）里的主定理。想象一下你是个小老板，手下有员工帮你干活，主定理就是快速算算这活总共要干多久的一个公式。

场景设定：分治法 - “大事化小，小事化了”

假设你接到一个大项目（一个大问题）。你的处理方法是：

拆！：把这个大项目拆成 $a$ 个 一模一样 的小项目（子问题）。每个小项目的大小是原项目的 $1/b$ (比如 $b=2$ ，就是拆成两半； $b=3$ ，就是拆成三份)。
做！：你自己（或者核心团队）需要花点时间做一些除了拆和合并之外的准备工作或者收尾工作。这个工作所需的时间，和问题的大小 $n$ 有关系，我们用一个函数 $f(n)$ 来表示这段时间。比如 $f(n) = n$ 表示时间随问题规模线性增长； $f(n) = n^2$ 表示时间随问题规模平方增长； $f(n) = 1$ 表示时间是固定的常数。
合！：当 $a$ 个小项目被手下员工解决后，你需要把它们的结果合并起来，得到最终大项目的结果。这个合并工作的时间也包含在 $f(n)$ 里面了（因为合并通常也和问题规模有关）。
递归： 最关键的一点！你手下那些员工处理小项目的方法，和你处理大项目的方法一模一样！他们也把自己负责的小项目拆成 $a$ 个更小的项目（原项目的 $1/b^2$ ），让他们的手下去做，如此一层一层拆下去，直到项目小到可以直接解决（比如项目小到只剩1个元素）。

一句话总结： 主定理就是用来计算这种 “拆分成 $a$ 份，每份是原来的 $1/b$ 大小，并且需要额外 $f(n)$ 时间” 的递归算法，它的总运行时间 $T(n)$ 到底是多少？

主定理公式（简化理解版）

主定理告诉我们，总时间 $T(n)$ 主要由三部分竞争决定，谁占主导， $T(n)$ 就接近谁：

最底层的总工作量 ( $n^{\log_b a}$ ):
- 想象递归树最底层的小项目数量。拆分了 $k$ 层后，项目大小是 $n / b^k$ 。当项目小到直接解决时 ( $n / b^k = 1$ )，层数 $k ≈ \log_b n$ (以 $b$ 为底的 $n$ 的对数)。
- 最底层有多少个小项目？每次拆分成 $a$ 份，拆了 $k$ 层，所以有 $a^k = a^{\log_b n}$ 个小项目。利用对数换底公式 $a^{\log_b n} = n^{\log_b a}$ (这个要记一下)。
- 如果每个小项目解决时间是常数 $C$ ，那么最底层的总时间就是 $C \cdot n^{\log_b a}$ 。这个 $n^{\log_b a}$ 代表了递归树最底层叶节点的数量级，也可以理解为递归产生的子问题数量的爆炸性增长因子。
每一层的“杂活”工作量 ( $f(n)$ ):
- 就是你在拆分和合并时花的那些时间 $f(n)$ 。但注意，在每一层递归上，你都要花这个时间。递归树有多少层？大约是 $\log_b n$ 层。
- 所以，每一层的 $f(n)$ 乘以层数 ( $\log_b n$ )，或者 $f(n)$ 本身增长很快，都会影响总时间。

主定理的判决 (谁赢了谁说了算)

主定理比较 “最底层工作量” ( $n^{\log_b a}$ ) 和 “杂活工作量” ( $f(n)$ ) 的增长速度，看谁更大，或者它们是否差不多大。这就分成了三种主要情况：

情况1：杂活干的轻松 ( $f(n)$ 长得慢) - 总时间由最底层决定
- 条件： $f(n)$ 的增长速度 显著慢于 $n^{\log_b a}$ 。数学上表示为 $f(n) = O(n^{\log_b a - \varepsilon})$ (其中 $\varepsilon > 0$ 是一个小正数)。
- 结果： $T(n) = \Theta(n^{\log_b a})$ 。
- 为啥？ 最底层的活 ( $n^{\log_b a}$ ) 是主力军，占了绝大部分时间。你在各层干的杂活 $f(n)$ 相比之下是毛毛雨，可以忽略。
- 例子： 二分查找 ( $a=1, b=2, f(n)=1$ $a = 1, b = 2, f (n) = 1$ )。
  - 最底层工作量： $n^{\log_2 1} = n^0 = 1$
  - 杂活： $f(n) = 1$
  - 判断： $1$ (杂活) 显著慢于 $1$ (最底层)? 这里 $1$ 是常数，等于 $n^0$ ，而 $\log_2 1 = 0$ , $n^{0} = 1$ 。 $f(n)=1$ 是 $O(n^{0 - \varepsilon})$ (比如 $\varepsilon=0.5$ , $n^{-0.5}$ ) 吗？不是，常数 $1$ 比任何 $n^{-\varepsilon}$ ( $\varepsilon>0$ ) 都大。所以二分查找其实不严格符合情况1，但它符合情况2！( $f(n)=1$ 和 $n^{\log_2 1}=1$ 是“差不多大”)。经典例子是 $a=2, b=4, f(n)=1$ 的递归。 $\log_4 2 = 0.5$ , $n^{0.5}$ vs $f(n)=1$ ， $1$ 确实显著慢于 $n^{0.5}$ ( $O(n^{0.5 - 0.1}) = O(n^{0.4})$ )。
情况2：杂活和大伙儿干的活差不多累 ( $f(n)$ 和底层工作量差不多大) - 总时间 = 底层工作量 × 层数
- 条件： $f(n)$ 的增长速度和 $n^{\log_b a}$ 差不多。数学上表示为 $f(n) = \Theta(n^{\log_b a} \log^k n)$ (其中 $k >= 0$ )。最常见的是 $k=0$ ，即 $f(n) = \Theta(n^{\log_b a})$ 。
- 结果： $T(n) = \Theta(n^{\log_b a} \log^{k+1} n)$ 。最常见的是 $T(n) = \Theta(n^{\log_b a} \log n)$ (当 $k=0$ 时)。
- 为啥？ 最底层的活 ( $n^{\log_b a}$ ) 和你在每一层干的杂活 ( $f(n) ≈ n^{\log_b a}$ ) 是同一数量级的。但是！ 杂活在每一层都要干，总共干了 $\log_b n$ 层！所以总时间 ≈ (每层杂活时间 $n^{\log_b a}$ ) × (层数 $\log n$ ) = $n^{\log_b a} \log n$ 。
- 例子： 归并排序 ( $a=2, b=2, f(n)=\Theta(n)$ $a = 2, b = 2, f (n) = Θ (n)$ )。
  - 最底层工作量： $n^{\log_2 2} = n^1 = n$
  - 杂活 ( $f(n)$ ): 合并两个子数组，时间是 $\Theta(n)$ 。
  - 判断： $f(n) = \Theta(n)$ 和 $n^{\log_2 2} = \Theta(n)$ 是“差不多大”( $k=0$ )。
  - 结果： $T(n) = \Theta(n \log n)$ 。这就是我们熟知的归并排序时间复杂度。
情况3：杂活太累太费时 ( $f(n)$ 长得快) - 总时间由杂活决定
- 条件： $f(n)$ 的增长速度 显著快于 $n^{\log_b a}$ 。数学上表示为 $f(n) = \Omega(n^{\log_b a + \varepsilon})$ (其中 $\varepsilon > 0$ )。并且还要满足一个“正则条件”：当你把问题拆小后，杂活 $f(n)$ 的增长速度不能太快以至于破坏了递归结构（通常 $f(n)$ 是多项式增长的话这个条件都满足）。
- 结果： $T(n) = \Theta(f(n))$ 。
- 为啥？ 你在每一层干的杂活 $f(n)$ 实在太重了，占了绝对的大头。即使最底层的活也不少 ( $n^{\log_b a}$ )，但和 $f(n)$ 比起来也是小巫见大巫。总时间基本就是你干杂活的总和 ( $\Theta(f(n))$ )。
- 例子： $a=2, b=2, f(n) = n^2$ 。
  - 最底层工作量： $n^{\log_2 2} = n^1 = n$
  - 杂活 ( $f(n)$ ): $n^2$
  - 判断： $n^2$ 显著快于 $n$ ( $n^2 = \Omega(n^{1 + \varepsilon})$ ，比如 $\varepsilon=0.5$ , $n^{1.5}$ )。
  - 结果： $T(n) = \Theta(n^2)$ 。虽然拆分了子问题，但合并过程 ( $n^2$ ) 太耗时了，决定了总时间。

总结成超级小白口诀

假设你的递归算法是：“把规模 $n$ 的问题拆成 $a$ 个 $n/b$ 的小问题，还要花 $f(n)$ 时间干杂活（拆分合并等）”。主定理帮你快速估总时间 $T(n)$ ：

看 $f(n)$ 和 $n^{\log_b a}$ 谁跑得快：
- 如果 $f(n)$ 慢很多 ( $n^{\log_b a}$ 遥遥领先) -> $T(n) ≈ n^{\log_b a}$ (底层活主导)
- 如果 $f(n)$ 和 $n^{\log_b a}$ 差不多快 -> $T(n) ≈ n^{\log_b a} \log n$ (杂活总量主导 = 每层杂活 × 层数)
- 如果 $f(n)$ 快很多 ( $f(n)$ 碾压 $n^{\log_b a}$ ) 且满足正则条件 -> $T(n) ≈ f(n)$ (杂活主导)

它有什么用？

快速分析时间复杂度： 不用画复杂的递归树或者解递推方程，直接套主定理公式就能得到递归算法时间复杂度的渐近阶 ( $\Theta$ 表示法)。
比较算法效率： 在设计和选择递归算法时，主定理能帮你快速判断哪种递归分解策略 ( $a$ 和 $b$ 的选择) 可能更高效。
理解递归本质： 它揭示了递归算法总时间成本的关键影响因素：子问题数量 ( $a$ )、问题规模缩减速度 ( $b$ )、以及每层额外操作的成本 ( $f(n)$ )。

举个简单例子 (归并排序)

问题： 排序 $n$ 个元素。
操作：
- 拆 ( $Divide$ ): 把数组分成大小相等的两半 ( $a=2$ , $b=2$ )。
- 杂活 ( $Conquer$ 的一部分 & $Combine$ ): 把两个排好序的子数组合并成一个大的有序数组。合并操作需要 $\Theta(n)$ 时间 ( $f(n) = \Theta(n)$ ）。
套主定理：
- 计算 $n^{\log_b a} = n^{\log_2 2} = n^1 = n$ 。
- 比较 $f(n)=\Theta(n)$ 和 $n^{\log_b a}=\Theta(n)$ ：它们相等 ( $k=0$ ) -> 属于情况2。
- 结果：$T(n) = \Theta(n^{\log_b a} \log n) = \Theta(n \log n)$。

Sanhai AI

目前还没有评论...

主定理