免费编程教程

最新
强化学习离线评估

学习在不与环境交互的情况下评估强化学习策略,如重要性采样、双重稳健估计等离线策略评估技术。

3 0 0
2026-06-24
最新
离线评估与在线

比较离线回测和在线实验的优缺点,学习处理离线指标与线上效果不一致的常见偏差及校准方法。

3 0 0
2026-06-24