机读格式显示(MARC)
- 000 01394nam 22002891 450
- 010 __ |a 978-7-111-60022-0 |d CNY119.00
- 100 __ |a 20190905d2018 em y0chiy50 ea
- 200 1_ |a 强化学习 |A qiang hua xue xi |d Reinforcement learning |e state-of-the-art |f (荷)马可·威宁(Marco Wiering),(荷)马丁·范·奥特罗(Martijn van Otterlo)编著 |g 赵地[等]译 |z eng
- 210 __ |a 北京 |c 机械工业出版社 |d 2018
- 215 __ |a 21,464页 |c 图,照片 |d 26cm
- 225 2_ |a 智能科学与技术丛书 |A Zhi Neng Ke Xue Yu Ji Shu Cong Shu
- 330 __ |a 本书包括六大部分,介绍了强化学习中各领域的基本理论和研究内容,内容包括:MDP、动态规划、蒙特卡罗方法、批处理强化学习、TD学习、Q学习、策略迭代的最小二乘法、迁移学习、贝叶斯强化学习、一阶逻辑MDP、层次式强化学习、演化计算、预测性定义状态表示、去中心化的部分可观索MDP、博弈论和多学习器强化学习等内容,并阐述强化学习与心理和神经科学、游戏领域、机器人领域的关系和应用。
- 410 _0 |1 2001 |a 智能科学与技术丛书
- 510 1_ |a Reinforcement learning |e state-of-the-art |z eng
- 606 0_ |a 机器学习 |A Ji Qi Xue Xi |x 研究
- 701 _0 |c (荷) |a 威宁 |A wei ning |c (Wiering, Marco) |4 编著
- 701 _0 |c (荷) |a 奥特罗 |A ao te luo |c (Otterlo, Martijn van) |4 编著
- 702 _0 |a 赵地 |A zhao di |4 译
- 801 _0 |a CN |b 辽批 |c 20190905
- 905 __ |a LIB |d TP181/32