用Python和Pygame从零打造一个能‘思考’的五子棋AI(附完整代码)

风乘

用Python和Pygame从零打造一个能‘思考’的五子棋AI(附完整代码)

周末午后,我盯着电脑屏幕上的五子棋残局发呆——这已经是第三次输给朋友了。作为程序员,突然萌生一个想法:能不能用代码教会电脑下棋?于是开始了这段用Python构建五子棋AI的奇妙旅程。本文将带你从棋盘绘制开始,逐步实现一个具备基础决策能力的AI对手,最终完成完整的人机对战系统。

1. 搭建五子棋基础框架

1.1 初始化游戏环境

首先确保安装必要的库:

bash复制pip install pygame numpy

创建基础窗口的代码骨架:

python复制import pygame
import numpy as np

def init_game():
    pygame.init()
    screen = pygame.display.set_mode((615, 615))
    pygame.display.set_caption('五子棋AI')
    return screen

screen = init_game()

1.2 绘制专业级棋盘

标准五子棋采用19×19网格,我们通过精确计算实现视觉效果:

python复制def draw_board(screen):
    # 棋盘底色
    screen.fill("#DD954F")
    
    # 三层边框设计
    border_colors = ['#121010', "#DD954F", '#121010']
    for i, color in enumerate(border_colors):
        border = pygame.Surface((603-18*i, 603-18*i))
        border.fill(color)
        screen.blit(border, (6.5+6*i, 6.5+6*i))
    
    # 绘制网格线
    grid_size = 31
    for i in range(19):
        pygame.draw.line(screen, '#121010', (20, 20+32*i), (596, 20+32*i), 2)
        pygame.draw.line(screen, '#121010', (20+32*i, 20), (20+32*i, 596), 2)
    
    # 添加星位标记
    star_points = [(3,3), (9,3), (15,3), (3,9), (9,9), 
                  (15,9), (3,15), (9,15), (15,15)]
    for x,y in star_points:
        pygame.draw.circle(screen, '#121010', [20+32*x, 20+32*y], 5)

2. 实现游戏核心逻辑

2.1 棋子状态管理系统

使用numpy数组记录棋盘状态:

python复制board_state = np.zeros((19, 19))  # 0=空 1=黑 2=白

def place_piece(x, y, player):
    if board_state[x][y] == 0:
        board_state[x][y] = 1 if player == 'black' else 2
        return True
    return False

2.2 胜负判定算法

四方向检测的优化实现:

python复制def check_win(x, y, player):
    directions = [(1,0), (0,1), (1,1), (1,-1)]  # 横竖斜四个方向
    piece = 1 if player == 'black' else 2
    
    for dx, dy in directions:
        count = 1  # 当前落子
        
        # 正向检测
        nx, ny = x+dx, y+dy
        while 0<=nx<19 and 0<=ny<19 and board_state[nx][ny]==piece:
            count += 1
            nx += dx
            ny += dy
            
        # 反向检测
        nx, ny = x-dx, y-dy
        while 0<=nx<19 and 0<=ny<19 and board_state[nx][ny]==piece:
            count += 1
            nx -= dx
            ny -= dy
            
        if count >= 5:
            return True
    return False

3. 设计AI决策引擎

3.1 模式识别库构建

AI的核心是预定义的棋型模式库:

python复制PATTERNS = {
    # 进攻模式
    'five': [1,1,1,1,1],
    'open_four': [0,1,1,1,1,0],
    'half_four': [0,1,1,1,1,2],
    
    # 防守模式
    'block_four': [2,1,1,1,1,0],
    'open_three': [0,1,1,1,0],
    'half_three': [0,1,1,1,2]
}

3.2 评分系统实现

基于模式匹配的位置评估:

python复制def evaluate_position():
    score_map = np.zeros((19,19))
    
    for i in range(19):
        for j in range(19):
            if board_state[i][j] != 0:
                continue
                
            # 模拟落子
            board_state[i][j] = 2  # AI执白
            
            # 四方向扫描
            for dx, dy in [(1,0), (0,1), (1,1), (1,-1)]:
                line = []
                for k in range(-4, 5):
                    x, y = i + dx*k, j + dy*k
                    if 0 <= x < 19 and 0 <= y < 19:
                        line.append(board_state[x][y])
                    else:
                        line.append(-1)  # 边界
                
                # 模式匹配
                for name, pattern in PATTERNS.items():
                    if match_pattern(line, pattern):
                        score_map[i][j] += PATTERN_SCORES[name]
            
            # 恢复空位
            board_state[i][j] = 0
    
    return score_map

4. 完整人机对战实现

4.1 游戏主循环架构

python复制def main():
    screen = init_game()
    draw_board(screen)
    current_player = 'black'  # 玩家先手
    
    while True:
        for event in pygame.event.get():
            if event.type == pygame.QUIT:
                pygame.quit()
                return
                
            if event.type == pygame.MOUSEBUTTONDOWN and current_player == 'black':
                # 玩家落子逻辑
                x, y = get_click_position(event.pos)
                if place_piece(x, y, 'black'):
                    draw_piece(screen, x, y, 'black')
                    if check_win(x, y, 'black'):
                        show_winner('玩家')
                        return
                    current_player = 'white'
        
        # AI回合
        if current_player == 'white':
            pygame.time.delay(500)  # 增加思考时间
            x, y = find_best_move()
            place_piece(x, y, 'white')
            draw_piece(screen, x, y, 'white')
            if check_win(x, y, 'white'):
                show_winner('AI')
                return
            current_player = 'black'
        
        pygame.display.flip()

4.2 性能优化技巧

  1. 局部搜索优化:只在最后落子周围3格内检测
  2. Zobrist哈希:实现棋盘状态缓存
  3. Alpha-Beta剪枝:适用于更复杂的AI版本
python复制# 优化后的评估函数示例
def fast_evaluate(x, y):
    directions = [(1,0),(0,1),(1,1),(1,-1)]
    total_score = 0
    
    for dx, dy in directions:
        line = [board_state[x+dx*i][y+dy*i] for i in range(-4,5) 
               if 0<=x+dx*i<19 and 0<=y+dy*i<19]
        total_score += pattern_score(line)
    
    return total_score

5. 进阶AI策略探讨

5.1 多层决策树实现

python复制def minimax(depth, alpha, beta, maximizing_player):
    if depth == 0 or game_over():
        return evaluate_board()
    
    if maximizing_player:
        max_eval = -float('inf')
        for move in get_valid_moves():
            make_move(move, 'white')
            eval = minimax(depth-1, alpha, beta, False)
            undo_move(move)
            max_eval = max(max_eval, eval)
            alpha = max(alpha, eval)
            if beta <= alpha:
                break
        return max_eval
    else:
        min_eval = float('inf')
        for move in get_valid_moves():
            make_move(move, 'black')
            eval = minimax(depth-1, alpha, beta, True)
            undo_move(move)
            min_eval = min(min_eval, eval)
            beta = min(beta, eval)
            if beta <= alpha:
                break
        return min_eval

5.2 开局库与残局库

专业级AI通常会内置:

  • 26种标准开局定式
  • 10步以内必胜残局模式
  • 常见陷阱防御方案
python复制OPENING_BOOK = {
    "花月开局": [(9,9), (8,9), (9,8), (10,9)],
    "云雨开局": [(9,9), (10,8), (8,10), (9,7)]
}

6. 完整代码实现

以下是整合所有模块的最终版本(关键部分节选):

python复制import pygame
import numpy as np
from collections import defaultdict

class GomokuAI:
    def __init__(self):
        self.board = np.zeros((19,19))
        self.patterns = self._init_patterns()
        
    def _init_patterns(self):
        # 完整模式库初始化
        patterns = defaultdict(list)
        # [模式识别代码...]
        return patterns
    
    def find_best_move(self):
        # [决策引擎代码...]
        return best_x, best_y

def main():
    # [主游戏循环代码...]
    
if __name__ == "__main__":
    main()

在实现过程中,最让我意外的是AI会发展出独特的进攻风格——它特别擅长设置"双三"陷阱。有次测试时,AI在第15手突然下出一个看似无关的落子,三手之后这个位置竟同时形成两个活三,这种前瞻性思考让人工智能显得格外有趣。

内容推荐

不止是读取:用Python+pydicom批量提取DICOM元数据,快速构建你的影像数据集CSV
本文详细介绍了如何使用Python和pydicom库批量提取DICOM文件中的元数据,并快速构建结构化影像数据集CSV。通过环境准备、元数据解析、批量处理框架设计、数据整合与导出等步骤,实现高效自动化处理,适用于医学图像处理和研究场景。
【STM32】基于CubeMX与FreeRTOS:从零构建正点原子风格的多任务应用框架
本文详细介绍了基于STM32CubeMX和FreeRTOS构建正点原子风格多任务应用框架的全过程。从环境准备、基础工程创建到FreeRTOS内核配置,再到多任务框架设计与实现,提供了完整的开发指南和实用技巧。特别适合嵌入式开发者快速掌握STM32多任务开发,提升项目开发效率。
深入ESP32-C3 SPI从机模式:打造你的自定义传感器模块
本文深入探讨了ESP32-C3 SPI从机模式的配置与应用,详细解析了硬件连接、初始化设置及自定义传感器协议设计。通过实战案例展示如何将ESP32-C3打造为高效SPI从设备,适用于环境监测等物联网场景,提升多MCU系统中的通信效率与数据采集能力。
告别PyTorch设备混乱:一个`.to(device)`没写对引发的'血案'与最佳实践
本文深入探讨PyTorch开发中常见的设备管理问题,特别是因`.to(device)`使用不当导致的`RuntimeError`和`tensors`设备不一致问题。通过实战案例和系统化解决方案,帮助开发者避免`cpu`与`cuda`设备混用陷阱,提升代码健壮性和开发效率。
Python依赖安装全攻略:从pip到源码包(tar.gz)的实战指南
本文详细介绍了Python依赖安装的三种核心方式:pip在线安装、pip离线安装和源码包(tar.gz)安装。通过实战指南,帮助开发者掌握从基础命令到疑难问题排查的全流程,提升项目环境配置效率。特别针对国内开发者提供了镜像加速方案,并分享了依赖管理的最佳实践。
Matplotlib 3D绘图进阶:自定义Z轴布局与视觉优化
本文深入探讨了Matplotlib 3D绘图中Z轴的自定义布局与视觉优化技巧。通过五种实用方法(包括修改juggled参数、使用axisartist工具包等),帮助用户解决Z轴遮挡问题,提升数据可视化效果。文章还分享了多子图协同优化和工业级应用的实战经验,适用于科学计算和工程仿真场景。
从工厂流水线到手机扫码:YOLOv5二维码检测模型在不同硬件上的部署优化指南
本文详细解析了YOLOv5二维码检测模型在工业场景中的多平台部署优化策略,涵盖边缘计算设备(Jetson、树莓派)、移动端(Android/iOS)及服务端高并发架构。通过TensorRT加速、模型蒸馏、动态量化等技术,显著提升检测性能与效率,助力实现从工厂流水线到手机扫码的全场景应用。
【点云分割】S3DIS数据集实战指南:从数据加载到模型评估
本文详细介绍了S3DIS数据集在点云分割任务中的应用实战指南,从数据加载、预处理到模型训练与评估。通过具体的代码示例和技巧分享,帮助读者掌握室内场景点云分割的关键技术,提升模型在S3DIS数据集上的表现。
从Fmask到SNAP:构建哨兵2号与Landsat8影像的自动化去云与镶嵌工作流
本文详细介绍了如何利用Fmask和SNAP构建哨兵2号与Landsat8影像的自动化去云与镶嵌工作流。从软件安装配置到实战操作,涵盖云检测、批量处理技巧及常见问题解决方案,帮助用户高效处理遥感影像数据,提升工作效率。
保姆级教程:用Activiti 7.x实现一个带“反悔”功能的完整审批流(含撤回、驳回、挂起)
本文提供Activiti 7.x实现带撤回、驳回和挂起功能的审批流保姆级教程。从环境搭建到核心功能实现,详细讲解如何利用Activiti API构建智能审批系统,包含代码示例和最佳实践,适用于Java开发者快速掌握工作流引擎的高级应用。
LabVIEW界面设计精要:从控件布局到视觉优化
本文详细介绍了LabVIEW界面设计的核心要点,包括前面板控件布局、专业工具使用和视觉优化技巧。通过实战案例展示如何构建高效的工业监控系统界面,涵盖对齐工具、分布工具、颜色字体选择等关键要素,帮助开发者提升LabVIEW前面板设计的专业性和用户体验。
从入门到实战:MIKE模型在水环境管理中的核心应用
本文深入探讨了MIKE模型在水环境管理中的核心应用,从入门到实战全面解析。通过MIKE11、MIKE21和MIKE ECO Lab等模块的协同使用,详细介绍了河道建模、参数设置、建筑物模拟及水质分析等关键技术。结合实际案例,分享了防洪评估和排污口论证中的实用技巧,帮助从业者高效解决复杂水环境问题。
从 .bag 到 .db3:深入解析 ROS1 与 ROS2 rosbag 格式差异与高效转换实践
本文深入解析ROS1与ROS2的rosbag格式差异,重点对比.bag二进制文件与.db3数据库格式的优劣,并提供高效转换实践方法。通过rosbags工具实现快速格式转换,解决传统方法中的性能瓶颈和兼容性问题,助力机器人开发者提升数据处理效率。
从‘镜像点’到‘种子点’:拆解PTD滤波,看它如何一步步‘编织’出数字地面模型
本文深入解析PTD(渐进式不规则三角网加密)滤波技术如何从点云数据中构建精准数字地面模型。通过种子点选择、迭代加密和镜像点处理三大步骤,PTD算法能有效适应复杂地形,减少植被和建筑物的误判,成为LiDAR点云处理的标准算法之一。文章详细介绍了参数调优策略和实战经验,帮助读者掌握这一地面滤波核心技术。
玩转FPV与灯光秀:用富斯MC6接收机解锁SBUS飞控与WS2812B炫彩灯带全攻略
本文详细介绍了如何利用富斯MC6接收机实现SBUS飞控与WS2812B炫彩灯带的完美结合,打造专业级FPV与灯光秀系统。从硬件连接到飞控配置,再到灯光编程与高级控制技巧,提供全流程解决方案,助您解锁航空创意新玩法。
别再只用YOLOv5做有监督了!手把手教你用Efficient Teacher框架榨干未标注数据
本文详细解析了如何利用Efficient Teacher框架提升YOLOv5在半监督目标检测中的性能。通过集成伪标签分配器(PLA)和训练周期适配器(EA)两大核心模块,开发者可以在有限标注数据下显著提升模型精度7.45% AP50:95。文章提供了从环境配置到调参优化的完整实战指南,特别适合工业质检和安防监控等标注成本高的场景应用。
从图像压缩到推荐系统:矩阵分解(CR/LU/QR)在数据科学中的5个实战案例
本文探讨了矩阵分解(CR/LU/QR)在数据科学中的5个实战应用,包括图像压缩、推荐系统和金融风控等场景。通过具体案例展示了QR分解在特征工程中的降维效果、LU分解加速工业仿真的优势,以及CR分解在图像压缩中的高效表现。这些技术为处理高维数据提供了强大的数学工具,显著提升了计算效率和模型性能。
聚类分析实战:从原理到Python代码的完整指南
本文全面解析聚类分析从基础原理到Python代码实现的完整流程,涵盖K均值、DBSCAN等核心算法对比及实战案例。通过零售业客户分群、社交网络社区发现等场景,展示如何运用聚类技术挖掘数据价值,并提供数据预处理、特征工程等关键技巧,帮助读者掌握Cluster Analysis的实战应用。
Flutter:深入flutter_local_notifications——从基础配置到高级样式定制
本文深入探讨Flutter中flutter_local_notifications插件的使用,从基础配置到高级样式定制。涵盖Android和iOS双平台的本地通知实现,包括即时通知、定时通知、长文本与大图片样式、媒体控制等高级功能,帮助开发者高效实现跨平台消息推送功能。
手把手教你给STM32设计自动下载电路:用CH340G实现一键烧录,告别手动拔插BOOT0
本文详细介绍了基于CH340G的STM32自动下载电路设计,通过优化硬件布局和软件配置,实现一键烧录功能,显著提升开发效率。重点解析了CH340G信号特性、三极管控制电路设计及PCB布局规范,适用于嵌入式开发、创客项目和教育实验等场景。
已经到底了哦
精选内容
热门内容
最新内容
手把手教你为libuv项目集成C++内存池:以cacay/MemoryPool为例的避坑与性能调优指南
本文详细介绍了如何为libuv项目集成C++内存池,以cacay/MemoryPool为例,解决内存管理中的性能瓶颈和所有权问题。通过实战步骤和性能调优指南,帮助开发者提升内存分配效率,减少碎片,适用于高性能网络应用开发。
别再为组合图表发愁了!Origin图层管理保姆级教程:柱状、折线、散点图一键同框展示
本文提供Origin图层管理的保姆级教程,详细讲解如何将柱状图、折线图和散点图高效整合到同一画布中。通过双Y轴设置、图层模板应用等高级技巧,帮助科研人员快速掌握复合图表制作方法,提升数据可视化效率。
避坑指南:SQL Server 2019安装后SSMS连不上?一步步教你排查身份验证和TCP/IP问题
本文详细解析SQL Server 2019安装后SSMS连接失败的常见问题,包括身份验证模式选择、sa账户锁定、TCP/IP协议配置及防火墙设置等关键排查步骤。通过系统性的解决方案和实用技巧,帮助用户快速解决90%的连接问题,确保数据库服务稳定运行。
从零到一:手把手教你用MQTT.fx调试OneNET物模型
本文详细介绍了如何使用MQTT.fx调试OneNET物模型,从设备创建、物模型构建到MQTT.fx的深度配置和连接调试,手把手教你完成物联网设备的连接与数据交互。特别适合物联网开发初学者快速上手OneNET平台和MQTT协议。
Altium Designer实战:PCB Layout新手最容易忽略的安规距离,手把手教你查表计算
本文详细介绍了Altium Designer中PCB Layout新手最易忽略的安规距离问题,重点解析爬电距离与电气间隙的区别及设计要点。通过标准查表计算、规则配置和实战案例,帮助工程师规避安规陷阱,确保设计符合IEC 60950等国际标准,提升产品认证通过率。
别再手动勾选了!用Vue3+Element Plus的el-select封装一个带全选/反选/清空的通用组件
本文介绍了如何利用Vue3和Element Plus的el-select组件封装一个支持全选、反选和清空功能的智能选择器。通过组件化设计,开发者可以轻松实现批量操作,提升后台管理系统的交互效率,减少重复代码。文章详细讲解了核心功能实现、高级功能扩展及工程化实践,适用于权限管理、商品筛选等场景。
STM32新手必看:HY-SRF05超声波模块从接线到测距全流程(附完整代码)
本文详细介绍了STM32开发中HY-SRF05超声波模块的硬件连接、工作原理及代码实现全流程。从引脚功能解析到精准测距的核心原理,再到完整代码示例和优化技巧,帮助新手快速掌握超声波测距技术。特别分享了实际项目中的调试经验和常见问题解决方案,提升开发效率。
别再傻傻分不清了!FPGA项目里RAM、ROM、FIFO到底怎么选?用Spartan-6开发板实测告诉你
本文深入探讨FPGA项目中RAM、ROM与FIFO的选择策略,基于Spartan-6开发板的实测数据,提供存储器选型的黄金法则。从易失性、时序特性和资源占用三个维度分析各类存储器的优劣,并给出高速数据采集、低功耗物联网等典型场景的优化方案,帮助开发者避免常见陷阱,提升FPGA项目性能。
【S32K3环境搭建】-0.3-解决S32DS创建工程时无MCU可选问题:Product Updates与Packages安装全攻略
本文详细解析了S32DS创建工程时无MCU可选的问题,提供了Product Updates与Packages的安装全攻略。通过在线和离线两种安装方案,帮助开发者快速解决环境搭建中的常见问题,确保S32K3开发包的顺利安装与配置。
基于 AntV X6 与 Vue 3 构建可交互的单线流程编排器
本文详细介绍了如何基于 AntV X6 与 Vue 3 构建可交互的单线流程编排器。通过结合 AntV X6 强大的图编辑能力和 Vue 3 的响应式特性,开发者可以高效实现审批流、任务流等可视化配置场景。文章涵盖环境搭建、核心功能实现、自动布局优化及与后端数据交互等关键环节,并提供了性能优化和常见问题排查的实用技巧。