五子棋AI算法第三篇-Alpha Beta剪枝

首页 > 代码库 > 五子棋AI算法第三篇-Alpha Beta剪枝

五子棋AI算法第三篇-Alpha Beta剪枝

2024-08-17 08:33:34 217人阅读

剪枝是必须的

　　上一篇讲了极大极小值搜索，其实单纯的极大极小值搜索算法并没有实际意义。

　　可以做一个简单的计算，平均一步考虑 50 种可能性的话，思考到第四层，那么搜索的节点数就是 50^4 = 6250000，在我的酷睿I7的电脑上一秒钟能计算的节点不超过 5W 个，那么 625W 个节点需要的时间在 100 秒以上。电脑一步思考 100秒肯定是不能接受的，实际上最好一步能控制在 5 秒以内。

　　顺便说一下层数的问题，首先思考层数必须是偶数。因为奇数节点是AI，偶数节点是玩家，如果AI下一个子不考虑玩家防守一下，那么这个估分明显是有问题的。
然后，至少需要进行4层思考，如果连4四层都考虑不到，那就是只看眼前利益，那么棋力会非常非常弱。如果能进行6层思考基本可以达到随便赢普通玩家的水平了（普通玩家是指没有专门研究过五子棋的玩家，棋力大约是4层的水平）。

Alpha Beta 剪枝原理

　　Alpha Beta 剪枝算法的基本依据是：棋手不会做出对自己不利的选择。依据这个前提，如果一个节点明显是不利于自己的节点，那么就可以直接剪掉这个节点。

前面讲到过，AI会在MAX层选择最大节点，而玩家会在MIN层选择最小节点。那么如下两种情况就是分别对双方不利的选择：

在MAX层，假设当前层已经搜索到一个最大值 X，如果发现下一个节点的下一层（也就是MIN层）会产生一个比X还小的值，那么就直接剪掉此节点。

　　解释一下，也就是在MAX层的时候会把当前层已经搜索到的最大值X存起来，如果下一个节点的下一层会产生一个比X还小的值Y，那么之前说过玩家总是会选择最小值的。也就是说这个节点玩家的分数不会超过Y，那么这个节点显然没有必要进行计算了。

通俗点来讲就是，AI发现这一步是对玩家更有利的，那么当然不会走这一步。

在MAX层，假设当前层已经搜索到一个最大值 X，如果发现下一个节点的下一层（也就是MIN层）会产生一个比X还小的值，那么就直接剪掉此节点。

　　这个是一样的道理，如果玩家走了一步棋发现其实对AI更有利，玩家必定不会走这一步。

　　下面图解说明，懒得画图，直接用wiki上的图：

技术分享

　　如上图所示，在第二层，也就是MIN层，当计算到第三个节点的时候，已知前面有一个3和一个6，也就是最小值为3。在计算第三个节点的时候，发现它的第一个孩子的结果是5，因为它的孩子是MAX节点，而MAX节点是会选择最大值的，那么此节点的值不会比5小，因此此节点的后序孩子就没有必要计算了，因为这个节点不可能小于5，而同一层已经有一个值为3的节点了。

　　其实这个图里面第三层分数为7的节点也是不需要计算的。

　　这是 MAX 节点的剪枝，MIN节点的剪枝也是同样的道理，就不再讲了。 Alpha Beta 剪枝的 Alpha 和 Beta 分别指的是MAX 和 MIN节点。

代码实现

虽然原理说了很多，但是其实代码的实现特别简单。

对max和min函数都增加一个 alpha 和 beta 参数。在 max 函数中如果发现一个子节点的值大于 alpha，则不再计算后序节点，此为 Alpha 剪枝。在min 函数中如果发现一个子节点的值小于 beta，则不再计算后序节点，此为 Beta剪枝。

代码实现如下：

 1 var min = function(board, deep, alpha, beta) { 2   var v = evaluate(board); 3   total ++; 4   if(deep <= 0 || win(board)) { 5     return v; 6   } 7  8   var best = MAX; 9   var points = gen(board, deep);10 11   for(var i=0;i<points.length;i++) {12     var p = points[i];13     board[p[0]][p[1]] = R.hum;14     var v = max(board, deep-1, best < alpha ? best : alpha, beta);15     board[p[0]][p[1]] = R.empty;16     if(v < best ) {17       best = v;18     }19     if(v < beta) {  //AB剪枝20       ABcut ++;21       break;22     }23   }24   return best ;25 }26 27 28 var max = function(board, deep, alpha, beta) {29   var v = evaluate(board);30   total ++;31   if(deep <= 0 || win(board)) {32     return v;33   }34 35   var best = MIN;36   var points = gen(board, deep);37 38   for(var i=0;i<points.length;i++) {39     var p = points[i];40     board[p[0]][p[1]] = R.com;41     var v = min(board, deep-1, alpha, best > beta ? best : beta);42     board[p[0]][p[1]] = R.empty;43     if(v > best) {44       best = v;45     }46     if(v > alpha) { //AB 剪枝47       ABcut ++;48       break;49     }50   }51   return best;52 }

　　按照wiki上的说法，优化效果应该达到 1/2 次方，也就是能优化到 50^2 = 2500 左右，实际我测试的时候并没有这么理想。不过节点数也不到之前的十分之一，平均大约每一步计算 50W 个节点，需要时间在10秒左右。相比之前的600W节点已经有了极大的提升。

　　不过即使经过了Alpha Beta 剪枝，思考层数也只能达到四层，也就是一个不怎么会玩五子棋的普通玩家的水平。而且每增加一层，所需要的时间或者说计算的节点数量是指数级增加的。所以目前的代码想计算到第六层是很困难的。

我们的时间复杂度是一个指数函数 M^N，其中底数M是每一层节点的子节点数，N 是思考的层数。我们的剪枝算法能剪掉很多不用的分支，相当于减少了 N，那么下一步我们需要减少 M，如果能把 M 减少一半，那么四层平均思考的时间能降低到 0.5^4 = 0.06 倍，也就是能从10秒降低到1秒以内。

　　而这个M是怎么来的？其实 M 就是函数 gen 返回的那些可选的空位。其实gen函数有很大的优化空间，而这个优化后的gen函数其实就是启发式搜索函数。

五子棋AI算法第三篇-Alpha Beta剪枝

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > 五子棋AI算法第三篇-Alpha Beta剪枝