跳转至

abcdRL (简单四步实现一个强化学习算法)

docs pypi docker autobuild Gitpod ready-to-code benchmark mirror repo

abcdRL 是一个模块化单文件强化学习代码库,提供“有但不严格”的模块化设计,和清晰的单文件算法实现。

Adam Adam

Adam

阅读代码时,在单文件代码中,快速了解算法的完整实现细节;改进算法时,得益于轻量的模块化设计,只需专注于少量的模块。

Ref

abcdRL 主要参考了 vwxyzjn/cleanrl 的单文件设计哲学和 PaddlePaddle/PARL 的模块设计。

路线图🗺️ #57

🗽 设计哲学

  • 要“拷贝📋”,不要“继承🧬”
  • 要“单文件📜”,不要“多文件📚”
  • 要“功能复用🛠”,不要“算法复用🖨”
  • 要“一致的逻辑🤖”,不要“一致的接口🔌”

✅ 已实现算法

Weights & Biases 性能报告 ➡️ report.abcdrl.xyz


引用 abcdRL

@misc{zhao_abcdrl_2022,
    author = {Yanxiao, Zhao},
    month = {12},
    title = {{abcdRL: Modular Single-file Reinforcement Learning Algorithms Library}},
    url = {https://github.com/sdpkjc/abcdrl},
    year = {2022}
}

最后更新: 2023-03-01