机读格式显示(MARC)

000 01394nam 22002891 450

001 0000512194

005 20190914125600.0

010 __ |a 978-7-111-60022-0 |d CNY119.00

100 __ |a 20190905d2018 em y0chiy50 ea

101 1_ |a chi |c eng

102 __ |a CN |b 110000

105 __ |a a z 001yy

106 __ |a r

200 1_ |a 强化学习 |A qiang hua xue xi |d Reinforcement learning |e state-of-the-art |f (荷)马可·威宁(Marco Wiering)，(荷)马丁·范·奥特罗(Martijn van Otterlo)编著 |g 赵地[等]译 |z eng

210 __ |a 北京 |c 机械工业出版社 |d 2018

215 __ |a 21,464页 |c 图，照片 |d 26cm

225 2_ |a 智能科学与技术丛书 |A Zhi Neng Ke Xue Yu Ji Shu Cong Shu

330 __ |a 本书包括六大部分，介绍了强化学习中各领域的基本理论和研究内容，内容包括：MDP、动态规划、蒙特卡罗方法、批处理强化学习、TD学习、Q学习、策略迭代的最小二乘法、迁移学习、贝叶斯强化学习、一阶逻辑MDP、层次式强化学习、演化计算、预测性定义状态表示、去中心化的部分可观索MDP、博弈论和多学习器强化学习等内容，并阐述强化学习与心理和神经科学、游戏领域、机器人领域的关系和应用。

410 _0 |1 2001 |a 智能科学与技术丛书

510 1_ |a Reinforcement learning |e state-of-the-art |z eng

606 0_ |a 机器学习 |A Ji Qi Xue Xi |x 研究

690 __ |a TP181 |v 5

701 _0 |c (荷) |a 威宁 |A wei ning |c (Wiering, Marco) |4 编著

701 _0 |c (荷) |a 奥特罗 |A ao te luo |c (Otterlo, Martijn van) |4 编著

702 _0 |a 赵地 |A zhao di |4 译

801 _0 |a CN |b 辽批 |c 20190905

905 __ |a LIB |d TP181/32