博弈论简介

定义 博弈论 又称 对策论(Game Theory),既是现代数学的一个新分支,也是运筹学的一个重要学科。本章重点介绍 公平组合游戏

1. 非公平组合游戏

定义 非公平组合游戏(Partizan Game)与公平组合游戏的区别在于在非公平组合游戏中,游戏者在某一确定状态可以做出的决策集合与游戏者有关。

大部分的棋类游戏都不是公平组合游戏,如国际象棋、中国象棋、围棋、五子棋等(因为双方都不能使用对方的棋子)。

2. 公平组合游戏

定义 在算法问题中出现的博弈论问题往往是 公平组合游戏(Impartial Combinatorial Games, ICG)问题,这类题目有如下特征:

  1. 有两名选手
  2. 两名选手交替操作,每次一步,每步都是在有限的合法集合中选取一种进行
  3. 在任何情况下,合法操作只取决于情况本身,与选手无关
  4. 游戏败北条件:当某位选手需要进行操作时,当前没有任何可执行的合法操作,则该选手败北

3. 反常游戏

定义 反常游戏(Misère Game)按照传统的游戏规则进行游戏,但是其胜者为第一个无法行动的玩家。以 Nim 游戏为例,Nim 游戏中取走最后一颗石子的为胜者,而反常 Nim 游戏中取走最后一刻石子的为败者。

部分反常游戏也可以通过公平组合游戏推得结论。

4. 常见的公平组合游戏

下面介绍几种 ICG 博弈的实际问题。

4.1 简化的 Nim 博弈(Nim Game)

题目链接:LeetCode: 292. Nim 游戏在新窗口打开

你和你的朋友,两个人一起玩 Nim 游戏:

  • 桌子上有一堆石头
  • 你们轮流进行自己的回合,你作为先手
  • 每一回合,轮到的人拿掉 131 \sim 3 块石头
  • 拿掉最后一块石头的人就是获胜者

假设你们每一步都是最优解。请编写一个函数,来判断你是否可以在给定石头数量为 nn 的情况下赢得游戏。如果可以赢,返回 true;否则,返回 false

简化版 Nim 游戏

注意,此处的 简化的 Nim 博弈 相当于下面的 Nim 游戏 的简化版本,在下面所有的名词 Nim 游戏 不会指代这个简化版本。

模拟推导可以得出结论,然后使用数学归纳法即可证明,当 n%4=0n \mathop{\%} 4 = 0 时,先手必输,否则先手必赢。

代码如下:

cpp
class Solution {
public:
    bool canWinNim(int n) {
        return n & 3;
    }
};

4.2 除数博弈(Divisor Game)

题目链接:LeetCode: 1025. 除数博弈在新窗口打开

爱丽丝和鲍勃一起玩游戏,他们轮流行动。爱丽丝先手开局。

最初,黑板上有一个数字 nn。在每个玩家的回合,玩家需要执行以下操作:

  • 选出任一 xx,满足 0<x<n0 < x < nn%x=0n \mathop{\%} x = 0
  • nxn - x 替换黑板上的数字 nn

如果玩家无法执行这些操作,就会输掉游戏。只有在爱丽丝在游戏中取得胜利时才返回 true。假设两个玩家都以最佳状态参与游戏。

模拟推导可以得出结论,然后使用数学归纳法即可证明,当 nn 为奇数时,先手必输,否则先手必赢。

代码如下:

cpp
class Solution {
public:
    bool divisorGame(int n) {
        return !(n & 1);
    }
};

4.3 巴什博奕(Bash Game)

一堆 nn 个石子,两个人轮流取出 1m1 \sim m 个石子,最后一个取光者胜出。

根据同余定理,n=k(m+1)+rn = k\left(m+1\right) + r,先手取 rr 个后者无论拿走多少个都不可能胜出。也就是说,nn 只要为 m+1m+1 倍数先手就必输。

数学归纳法易证明,代码如下:

cpp
bool bashGame(int n) {
    return n % (m + 1);
}

4.4 威佐夫博弈(Wythoff Game)

有两堆各若干个石子,两人轮流从任意一堆中取出至少一个或同时从两堆中取出同样多的石子,规定每次至少取一个,至多不限,最后取光者胜利。

本题证明复杂,此处不予证明。

设黄金分割率为 Φ\Phi

Φ=5+12 \Phi = \frac{\sqrt{5} + 1}{2}

设两堆石子分别有 a,ba,\,b 个,不妨设 aba \geqslant b,那么先手必输的情况为:

Φ(ab)=b \left\lfloor\Phi\cdot\left(a-b\right)\right\rfloor = b

cpp
bool wythoffGame(int a, int b) {
    double phi = (sqrt(5.0) + 1.0) / 2.0;
    return (int)(phi * (double)abs(a - b)) != min(a, b);
}

4.5 Nim 博弈(Nim Game)

nn 堆石子,两个人轮流取,每次取某堆若干石子,但不能不取,最后取完者获胜。

数学归纳法证明:

  1. 最终状态异或和为 00
  2. 对于任意一个必胜态(异或和不为 00),存在一个必败后继状态(异或和为0)。设 a1a2an=Sa_1 \oplus a_2 \oplus \cdots \oplus a_n = S,一定存在 aia_iSS 的最高位为 11,只要改变 aia_i 使这一位为 00,后面的位相应改变使总体异或和为 00 即可
  3. 对于任意一个必败态(异或和为 00),不存在一个必败后继状态(异或和为 00

nn 堆石子数量全部异或后结果为 00 则先手必败,否则必胜。

cpp
bool nimGame(vector<int>& nums) {
    int res = 0;
    for (auto val : nums)
        res ^= val;
    return res;
}

如果每次最多只能取 kk 个,那么每一堆石子都需要对 k+1k+1 取模。

对于一般的博弈论问题,我们使用 SG 定理 转换为 Nim 博弈问题。