Learning

正在学习

在线书 · Walking Labs

现代强化学习实战——从代码到原理

一本偏实战的现代强化学习在线书，适合边跑代码边补齐算法直觉。

RL Deep Learning Python

Modern Reinforcement Learning 12%

Learning Notes

这本书把强化学习的核心概念放进可复现实验里讲，不只是罗列公式，而是从环境、策略、价值函数、训练循环和实验现象一步步建立理解。

为什么值得学

当前状态

目前先通读整体结构，重点关注基础环境建模、策略优化和实验复现部分。

下一步

正在学习