强化学习DQN episode是什么
强化学习
·
Agent将会从一个状态到另一个状态这样去探索,直到它到达目标状态。我们称每一次这样的探索为一个场景(episode)。
每个场景就是 Agent 从起始状态到达目标状态的过程。
每次Agent 到达了目标状态,程序就会进入到下一个场景中。

更多推荐
强化学习
Agent将会从一个状态到另一个状态这样去探索,直到它到达目标状态。我们称每一次这样的探索为一个场景(episode)。
每个场景就是 Agent 从起始状态到达目标状态的过程。
每次Agent 到达了目标状态,程序就会进入到下一个场景中。

更多推荐
所有评论(0)