博弈论算法详解：从CSP-S到IOI#

博弈论是组合数学和算法竞赛中的重要分支，在信息学奥赛中经常出现。本文将系统性地介绍从CSP-S到IOI级别的博弈论知识，帮助读者建立完整的博弈论知识体系。

一、博弈论基础#

1.1 基本概念#

在博弈论中,我们通常研究的是公平组合游戏（Impartial Combinatorial Games），其特点是：

两个玩家轮流操作
游戏状态对双方完全透明
双方可以执行相同的操作
不能操作的一方输掉游戏

1.2 必胜态与必败态#

必胜态（N态/Winning Position）：当前玩家有策略必胜
必败态（P态/Losing Position）：当前玩家必败（对手必胜）

核心定理：

无法进行任何操作的状态是必败态
能够转移到必败态的状态是必胜态
只能转移到必胜态的状态是必败态

1
// 判断状态的胜负性（记忆化搜索）
2
#include <bits/stdc++.h>
3
using namespace std;
4

5
map<int, int> memo; // 0: P态, 1: N态
6

7
// state: 当前状态
8
// getNextStates: 获取所有后继状态的函数
9
bool isWinning(int state, function<vector<int>(int)> getNextStates) {
10
    if (memo.count(state)) return memo[state];
11

12
    vector<int> nexts = getNextStates(state);
13

14
    // 无后继状态，为必败态
15
    if (nexts.empty()) {
16
        return memo[state] = 0;
17
    }
18

19
    // 有一个后继是必败态，则当前为必胜态
20
    for (int next : nexts) {
21
        if (!isWinning(next, getNextStates)) {
22
            return memo[state] = 1;
23
        }
24
    }
25

26
    // 所有后继都是必胜态，则当前为必败态
27
    return memo[state] = 0;
28
}

二、Nim游戏与SG函数#

2.1 经典Nim游戏#

有n堆石子，每堆有a[i]个。两人轮流操作，每次可以从任意一堆中取走任意个（至少1个）石子。取走最后一个石子的人获胜。

定理：当且仅当 a[1] ⊕ a[2] ⊕ ... ⊕ a[n] = 0 时，先手必败；否则先手必胜。（⊕表示异或）

1
#include <bits/stdc++.h>
2
using namespace std;
3

4
int main() {
5
    int n;
6
    cin >> n;
7

8
    int xor_sum = 0;
9
    for (int i = 0; i < n; i++) {
10
        int a;
11
        cin >> a;
12
        xor_sum ^= a;
13
    }
14

15
    if (xor_sum == 0) {
16
        cout << "先手必败" << endl;
17
    } else {
18
        cout << "先手必胜" << endl;
19
    }
20

21
    return 0;
22
}

2.2 SG函数（Sprague-Grundy Function）#

SG函数是博弈论的核心工具，用于求解任意公平组合游戏。

定义：对于状态x，设其所有后继状态为y1, y2, …, yk，则：

1
SG(x) = mex{SG(y1), SG(y2), ..., SG(yk)}

其中mex(S)表示不属于集合S的最小非负整数。

性质：

SG(x) = 0 当且仅当x是必败态
SG(x) ≠ 0 当且仅当x是必胜态

1
#include <bits/stdc++.h>
2
using namespace std;
3

4
const int MAXN = 1005;
5
int sg[MAXN];
6
bool vis[MAXN];
7

8
// 计算SG函数
9
// moves: 每次可以取走的石子数集合
10
int getSG(int n, const vector<int>& moves) {
11
    if (sg[n] != -1) return sg[n];
12

13
    memset(vis, 0, sizeof(vis));
14

15
    // 遍历所有可能的操作
16
    for (int move : moves) {
17
        if (n >= move) {
18
            vis[getSG(n - move, moves)] = true;
19
        }
20
    }
21

22
    // 计算mex
23
    for (int i = 0; ; i++) {
24
        if (!vis[i]) {
25
            return sg[n] = i;
26
        }
27
    }
28
}
29

30
int main() {
31
    int n, k;
32
    cin >> n >> k;
33

34
    vector<int> moves(k);
35
    for (int i = 0; i < k; i++) {
36
        cin >> moves[i];
37
    }
38

39
    memset(sg, -1, sizeof(sg));
40
    sg[0] = 0;
41

42
    if (getSG(n, moves) != 0) {
43
        cout << "先手必胜" << endl;
44
    } else {
45
        cout << "先手必败" << endl;
46
    }
47

48
    return 0;
49
}

2.3 多堆游戏的SG定理#

对于多个独立的游戏G1, G2, …, Gn，设它们的SG值分别为SG(G1), SG(G2), …, SG(Gn)，则：

组合游戏的SG值 = SG(G1) ⊕ SG(G2) ⊕ … ⊕ SG(Gn)

这就是著名的Sprague-Grundy定理。

三、经典博弈模型#

3.1 巴什博弈（Bash Game）#

规则：一堆n个石子，每次最多取m个，最少取1个，取走最后一个石子的人获胜。

结论：

若 n % (m + 1) == 0，先手必败
否则，先手必胜，且先手应取 n % (m + 1) 个

1
#include <bits/stdc++.h>
2
using namespace std;
3

4
int main() {
5
    long long n, m;
6
    cin >> n >> m;
7

8
    if (n % (m + 1) == 0) {
9
        cout << "先手必败" << endl;
10
    } else {
11
        cout << "先手必胜，先取 " << n % (m + 1) << " 个" << endl;
12
    }
13

14
    return 0;
15
}

3.2 威佐夫博弈（Wythoff Game）#

规则：两堆石子，数量分别为a和b。每次可以：

从一堆中取任意个
从两堆中取相同数量

结论：设较小值为mn = min(a, b)，较大值为mx = max(a, b)，定义：

1
k = mx - mn

当且仅当 mn == floor(k * φ) 时为必败态（φ = (1 + √5) / 2，黄金分割比）

1
#include <bits/stdc++.h>
2
using namespace std;
3

4
int main() {
5
    long long a, b;
6
    cin >> a >> b;
7

8
    if (a > b) swap(a, b);
9

10
    long long k = b - a;
11
    double phi = (1.0 + sqrt(5.0)) / 2.0;
12
    long long expected = (long long)(k * phi);
13

14
    if (a == expected) {
15
        cout << "先手必败" << endl;
16
    } else {
17
        cout << "先手必胜" << endl;
18
    }
19

20
    return 0;
21
}

3.3 斐波那契博弈#

规则：一堆n个石子，先手第一次不能全部取完，之后每次取的数量不能超过对手刚取数量的2倍。

结论：当且仅当n是斐波那契数时，先手必败。

1
#include <bits/stdc++.h>
2
using namespace std;
3

4
int main() {
5
    long long n;
6
    cin >> n;
7

8
    // 生成斐波那契数列
9
    set<long long> fib;
10
    long long a = 1, b = 2;
11
    fib.insert(a);
12
    fib.insert(b);
13

14
    while (b <= n) {
15
        long long c = a + b;
16
        fib.insert(c);
17
        a = b;
18
        b = c;
19
    }
20

21
    if (fib.count(n)) {
22
        cout << "先手必败" << endl;
23
    } else {
24
        cout << "先手必胜" << endl;
25
    }
26

27
    return 0;
28
}

3.4 阶梯Nim游戏#

规则：n个阶梯，每个阶梯上有若干石子。每次可以将某个阶梯上的若干石子移到下一层。最后一层的石子不能移动。将最后一个石子移到地面的人获胜。

结论：只考虑奇数层的石子，异或和为0则先手必败，否则先手必胜。

1
#include <bits/stdc++.h>
2
using namespace std;
3

4
int main() {
5
    int n;
6
    cin >> n;
7

8
    int xor_sum = 0;
9
    for (int i = 1; i <= n; i++) {
10
        int a;
11
        cin >> a;
12
        if (i % 2 == 1) { // 只考虑奇数层
13
            xor_sum ^= a;
14
        }
15
    }
16

17
    if (xor_sum == 0) {
18
        cout << "先手必败" << endl;
19
    } else {
20
        cout << "先手必胜" << endl;
21
    }
22

23
    return 0;
24
}

四、Multi-SG游戏#

4.1 Multi-SG理论#

在经典SG游戏中，每个局面只能转移一次。而在Multi-SG游戏中，每个局面可以转移多次（转移k次）。

定义：

SG(x, k) 表示在状态x下还可以进行k次转移的SG值
终止状态：SG(x, 0) = x

计算方法：

1
int getMultiSG(int x, int k, const vector<int>& moves) {
2
    if (k == 0) return x;
3

4
    set<int> vis;
5
    for (int move : moves) {
6
        if (x >= move) {
7
            vis.insert(getMultiSG(x - move, k - 1, moves));
8
        }
9
    }
10

11
    // 计算mex
12
    for (int i = 0; ; i++) {
13
        if (!vis.count(i)) return i;
14
    }
15
}

五、博弈树与Alpha-Beta剪枝#

5.1 博弈树搜索#

对于复杂的博弈问题，可以使用博弈树进行搜索。

1
#include <bits/stdc++.h>
2
using namespace std;
3

4
const int INF = 1e9;
5

6
struct State {
7
    // 定义游戏状态
8
    int value;
9

10
    vector<State> getNextStates() {
11
        // 返回所有后继状态
12
        vector<State> result;
13
        // ... 生成后继状态
14
        return result;
15
    }
16

17
    bool isTerminal() {
18
        // 判断是否为终止状态
19
        return false;
20
    }
21

22
    int evaluate() {
23
        // 评估函数
24
        return value;
25
    }
26
};
27

28
// Minimax算法
29
int minimax(State state, int depth, bool isMax) {
30
    if (depth == 0 || state.isTerminal()) {
31
        return state.evaluate();
32
    }
33

34
    if (isMax) {
35
        int maxEval = -INF;
36
        for (State next : state.getNextStates()) {
37
            int eval = minimax(next, depth - 1, false);
38
            maxEval = max(maxEval, eval);
39
        }
40
        return maxEval;
41
    } else {
42
        int minEval = INF;
43
        for (State next : state.getNextStates()) {
44
            int eval = minimax(next, depth - 1, true);
45
            minEval = min(minEval, eval);
46
        }
47
        return minEval;
48
    }
49
}

5.2 Alpha-Beta剪枝#

Alpha-Beta剪枝可以大幅减少博弈树的搜索节点数。

1
int alphaBeta(State state, int depth, int alpha, int beta, bool isMax) {
2
    if (depth == 0 || state.isTerminal()) {
3
        return state.evaluate();
4
    }
5

6
    if (isMax) {
7
        int maxEval = -INF;
8
        for (State next : state.getNextStates()) {
9
            int eval = alphaBeta(next, depth - 1, alpha, beta, false);
10
            maxEval = max(maxEval, eval);
11
            alpha = max(alpha, eval);
12
            if (beta <= alpha) {
13
                break; // Beta剪枝
14
            }
15
        }
16
        return maxEval;
17
    } else {
18
        int minEval = INF;
19
        for (State next : state.getNextStates()) {
20
            int eval = alphaBeta(next, depth - 1, alpha, beta, true);
21
            minEval = min(minEval, eval);
22
            beta = min(beta, eval);
23
            if (beta <= alpha) {
24
                break; // Alpha剪枝
25
            }
26
        }
27
        return minEval;
28
    }
29
}

六、动态博弈与组合游戏#

6.1 DAG上的博弈#

有向无环图（DAG）上的博弈是一类重要的博弈模型。

1
#include <bits/stdc++.h>
2
using namespace std;
3

4
const int MAXN = 1005;
5
vector<int> graph[MAXN];
6
int sg[MAXN];
7
bool vis[MAXN];
8

9
int getSG_DAG(int u) {
10
    if (sg[u] != -1) return sg[u];
11

12
    memset(vis, 0, sizeof(vis));
13

14
    for (int v : graph[u]) {
15
        vis[getSG_DAG(v)] = true;
16
    }
17

18
    for (int i = 0; ; i++) {
19
        if (!vis[i]) {
20
            return sg[u] = i;
21
        }
22
    }
23
}
24

25
int main() {
26
    int n, m;
27
    cin >> n >> m;
28

29
    for (int i = 0; i < m; i++) {
30
        int u, v;
31
        cin >> u >> v;
32
        graph[u].push_back(v);
33
    }
34

35
    memset(sg, -1, sizeof(sg));
36

37
    // 计算所有节点的SG值
38
    for (int i = 1; i <= n; i++) {
39
        getSG_DAG(i);
40
    }
41

42
    int q;
43
    cin >> q;
44
    while (q--) {
45
        int k;
46
        cin >> k;
47
        int xor_sum = 0;
48
        for (int i = 0; i < k; i++) {
49
            int pos;
50
            cin >> pos;
51
            xor_sum ^= sg[pos];
52
        }
53

54
        if (xor_sum == 0) {
55
            cout << "先手必败" << endl;
56
        } else {
57
            cout << "先手必胜" << endl;
58
        }
59
    }
60

61
    return 0;
62
}

6.2 翻硬币游戏#

n枚硬币排成一行，每次可以翻转一枚正面向上的硬币及其左边的所有硬币。最后一个翻硬币的人获胜。

解法：将正面向上的硬币位置看作Nim游戏的石子堆，异或和为0则先手必败。

1
#include <bits/stdc++.h>
2
using namespace std;
3

4
int main() {
5
    int n;
6
    cin >> n;
7

8
    int xor_sum = 0;
9
    for (int i = 0; i < n; i++) {
10
        int coin;
11
        cin >> coin;
12
        if (coin == 1) {
13
            xor_sum ^= i;
14
        }
15
    }
16

17
    if (xor_sum == 0) {
18
        cout << "先手必败" << endl;
19
    } else {
20
        cout << "先手必胜" << endl;
21
    }
22

23
    return 0;
24
}

七、IOI级别博弈题目#

7.1 删数游戏#

问题：给定一个序列，两人轮流删除一个数（有限制条件），最后无法操作的人输。

解法思路：

建模成博弈问题
使用SG函数或者动态规划
注意状态压缩和优化

1
#include <bits/stdc++.h>
2
using namespace std;
3

4
const int MAXN = 20;
5
int a[MAXN];
6
int n;
7
map<int, int> sg; // 状态 -> SG值
8

9
int getSG(int state) {
10
    if (sg.count(state)) return sg[state];
11

12
    set<int> vis;
13

14
    // 枚举删除哪个数
15
    for (int i = 0; i < n; i++) {
16
        if (state & (1 << i)) {
17
            // 检查是否可以删除
18
            bool canRemove = true;
19
            // ... 根据题目条件判断
20

21
            if (canRemove) {
22
                int nextState = state ^ (1 << i);
23
                vis.insert(getSG(nextState));
24
            }
25
        }
26
    }
27

28
    for (int i = 0; ; i++) {
29
        if (!vis.count(i)) {
30
            return sg[state] = i;
31
        }
32
    }
33
}
34

35
int main() {
36
    cin >> n;
37
    for (int i = 0; i < n; i++) {
38
        cin >> a[i];
39
    }
40

41
    int initState = (1 << n) - 1;
42

43
    if (getSG(initState) != 0) {
44
        cout << "先手必胜" << endl;
45
    } else {
46
        cout << "先手必败" << endl;
47
    }
48

49
    return 0;
50
}

7.2 分裂游戏#

问题：一个数n，每次可以将其分裂成若干个较小的数，最后无法操作的人输。

1
#include <bits/stdc++.h>
2
using namespace std;
3

4
map<int, int> sg;
5

6
int getSG(int n) {
7
    if (n == 0) return 0;
8
    if (sg.count(n)) return sg[n];
9

10
    set<int> vis;
11

12
    // 枚举所有分裂方案
13
    for (int i = 1; i <= n/2; i++) {
14
        // 分裂成 i 和 n-i
15
        int xor_sum = getSG(i) ^ getSG(n - i);
16
        vis.insert(xor_sum);
17
    }
18

19
    for (int i = 0; ; i++) {
20
        if (!vis.count(i)) {
21
            return sg[n] = i;
22
        }
23
    }
24
}
25

26
int main() {
27
    int n;
28
    cin >> n;
29

30
    if (getSG(n) != 0) {
31
        cout << "先手必胜" << endl;
32
    } else {
33
        cout << "先手必败" << endl;
34
    }
35

36
    return 0;
37
}

7.3 反Nim游戏#

问题：与经典Nim游戏相反，取走最后一个石子的人输。

结论：

如果所有堆石子数都为1，且堆数为奇数，先手必败
如果存在一堆石子数大于1，当异或和为0时先手必败
其他情况先手必胜

1
#include <bits/stdc++.h>
2
using namespace std;
3

4
int main() {
5
    int n;
6
    cin >> n;
7

8
    vector<int> a(n);
9
    int xor_sum = 0;
10
    bool allOne = true;
11

12
    for (int i = 0; i < n; i++) {
13
        cin >> a[i];
14
        xor_sum ^= a[i];
15
        if (a[i] > 1) allOne = false;
16
    }
17

18
    bool firstLose = false;
19
    if (allOne) {
20
        firstLose = (n % 2 == 1);
21
    } else {
22
        firstLose = (xor_sum == 0);
23
    }
24

25
    if (firstLose) {
26
        cout << "先手必败" << endl;
27
    } else {
28
        cout << "先手必胜" << endl;
29
    }
30

31
    return 0;
32
}

八、解题技巧总结#

8.1 识别博弈类型#

单堆取石子 → 巴什博弈或SG函数
多堆取石子 → Nim游戏
两堆特殊操作 → 威佐夫博弈
阶梯状态 → 阶梯Nim
图上移动 → DAG博弈

8.2 通用解题步骤#

确定游戏类型：公平组合游戏还是其他
定义状态：明确状态表示和终止状态
找出操作：列出所有可能的操作
计算SG值：使用记忆化搜索或动态规划
判断胜负：SG值为0则必败，否则必胜

8.3 优化技巧#

使用记忆化避免重复计算
状态压缩减少空间复杂度
找规律简化SG函数计算
对于周期性SG值，只需预处理一个周期

8.4 博弈论与其他算法的结合#

博弈论经常与其他算法知识点结合出题：

博弈 + 图论：在图上进行博弈，结合最短路、拓扑排序等
博弈 + 数论：质因数分解、约数等与博弈结合
博弈 + 动态规划：状态转移与博弈结合
博弈 + 组合数学：排列组合与博弈结合

九、经典习题推荐#

9.1 入门题目#

洛谷 P2197 - Nim游戏（入门）
洛谷 P2580 - 于是他错误的点名开始了（基础）
洛谷 P1247 - 取火柴游戏（巴什博弈）

9.2 进阶题目#

洛谷 P1288 - 取数游戏（SG函数）
洛谷 P2148 - 移动游戏（威佐夫博弈）
洛谷 P2578 - 威佐夫博弈（Wythoff Game）
洛谷 P4279 - 小凸想跑步（组合博弈）

9.3 高级题目#

CF1033D - Divisors（数论+博弈）
CF975D - Ghosts（图论+博弈）
IOI2001 - Game（经典IOI题）
NOI2005 - 智慧珠游戏（复杂博弈）

9.4 专题训练#

建议按以下顺序练习：

先做10道Nim游戏相关题目，熟悉异或运算
再做10道SG函数题目，掌握mex运算
每种经典模型至少做3道题
最后挑战组合博弈和IOI题目

十、总结#

博弈论是算法竞赛中的重要专题，从基础的Nim游戏到复杂的SG函数，从经典模型到IOI级难题，都需要扎实的理论基础和大量的练习。

关键要点#

理解必胜态和必败态的递推关系
掌握SG函数的定义和计算方法
熟记经典模型的结论和证明
灵活运用SG定理解决组合博弈
多做题积累经验和直觉

学习路径建议#

初学者（CSP-J/S水平）：

掌握必胜态必败态概念
熟练Nim游戏
掌握巴什博弈等简单模型

中级（省选水平）：

深入理解SG函数
掌握所有经典模型
能够解决Multi-SG问题

高级（NOI/IOI水平）：

博弈与其他算法结合
复杂状态空间的博弈
博弈树搜索与剪枝

常见错误提醒#

忘记判断边界条件：空状态是必败态
SG函数计算错误：mex运算要正确
异或运算理解偏差：多个游戏要异或SG值
经典模型记忆混淆：多做题加深记忆
状态表示不当：选择合适的状态表示方式

希望本文能帮助大家建立完整的博弈论知识体系，在算法竞赛中游刃有余！记住，博弈论不仅是数学工具，更是一种思维方式。通过大量练习，你会逐渐培养出博弈直觉，在面对新问题时能够快速找到解决方案。

继续加油，祝大家在OI道路上越走越远！