- 题名/责任者:
- 基于Python的强化学习/(美) 安德里亚·隆萨著 刘继红, 王瑞文译
- 出版发行项:
- 北京:中国电力出版社,2023.01
- ISBN及定价:
- 978-7-5198-7037-9/CNY88.00
- 载体形态项:
- 265页:图;24cm
- 个人责任者:
- 隆萨 (Lonza, Andrea) 著
- 个人次要责任者:
- 刘继红 译
- 个人次要责任者:
- 王瑞文 译
- 学科主题:
- 程序语言-程序设计
- 非控制主题词:
- Python
- 中图法分类号:
- TP312PY
- 提要文摘附注:
- 本书首先介绍在强化学习环境中工作所需的工具、库和设置, 涵盖了强化学习的构成模块, 深入探讨基于值的方法, 如Q-learning和SARSA算法的应用。读者将学习如何结合使用Q-learning和神经网络来解决复杂问题。此外, 在学习DDPG和TD3确定性算法之前, 读者将学习策略梯度方法, 如TRPO和PPO, 以提高性能和稳定性。本书还介绍模仿学习的原理, 以及Dagger如何教智能体飞行。读者将探索进化策略和黑盒优化技术。
全部MARC细节信息>>