
最近有一个同学实现了一个利用 DQN + CNN 的 Java 版增强学习 Flappybird:

作者自己手写了一个Java 版的 Flappybird,然后+ DJL 纯 Java 深度学习框架。
目前训练了 300 万步,鸟可以自己玩到 380 多分。训练好的模型已经在 repo 里面了,可以直接用来继续训练或者用 agent 跑跑看。
参考项目:
1 nl101531 2020 年 12 月 1 日 via iPhone 很有意思 |
2 saul0913 2020 年 12 月 1 日 这种东西用按键精灵不是更简单 |
3 tsening 2020 年 12 月 1 日 真厉害 |
4 lanking520 OP @saul0913 按键精灵没法应对随机管道呀 |
5 SkyLine7 2020 年 12 月 3 日 很强 |
6 choichun 2020 年 12 月 5 日 via Android |