基于 PyTorch 实现的深度 Q 网络 (DQN) 贪吃蛇游戏,采用 Dueling Double DQN 架构,支持训练过程实时可视化。

实时可视化训练: 使用 pygame 实现训练过程的实时渲染,可观察蛇的移动、吃食物、变长等过程

先进 DQN 架构: 采用 Dueling DQN + Double DQN + 目标网络软更新

智能奖励设计: 结合稀疏奖励(吃食物)和密集奖励(距离塑形),加速学习

完整训练流程: 包含经验回放、epsilon-greedy 探索、批量训练等完整 DQN 组件

更多推荐