机读格式显示(MARC)

000 02054nam0 2200361 450

001 0000528716

005 20200914145400.0

010 __ |a 978-7-115-50830-0 |d CNY129.00

100 __ |a 20190424d2019 em y0chiy50 ea

101 1_ |a chi |c eng

102 __ |a CN |b 110000

105 __ |a ak a 000yy

106 __ |a r

200 1_ |a 基于函数逼近的强化学习与动态规划 |A ji yu han shu bi jin de qiang hua xue xi yu dong tai gui hua |f (罗) 卢西恩·布索尼 ... [等] 著 |d = Reinforcement learning and dynamic programming using function approximators |f Lucian Busoniu |g 刘全, 傅启明, 章宗长译 |z eng

210 __ |a 北京 |c 人民邮电出版社 |d 2019

215 __ |a 249页 |c 图 |d 24cm

304 __ |a 著者还有：(荷)罗伯特·巴布斯卡(Robert Babuska), (荷)巴特·德·舒特(Bart De Schutter), (比)达米安·厄恩斯特(Damien Ernst)

306 __ |a 由Taylor & Francis出版集团旗下CRC出版公司出版, 并经其授权翻译出版

320 __ |a 有书目 (第232-249页)

330 __ |a 本书针对连续变化的控制问题，重点集中在近似动态规划（DP）和强化学习（RL）方面。全书共分6章。第1章为概述；第2章为动态规划与强化学习介绍；第3章为大规模连续空间中的动态规划与强化学习；第4章为基于模糊表示的近似值迭代；第5章为用于在线学习和连续动作控制的近似策略迭代；第6章为基于交叉熵基函数优化的近似策略搜索。

333 __ |a 本材料主要面向系统与控制（特别是优化、自适应和学习控制）、计算机（特别是机器学习和人工智能）、运筹学和统计学领域的研究者、工作人员和研究生。本书可以作为处理DP和RL方法课程的辅助教材。

500 10 |a Reinforcement learning and dynamic programming using function approximators |A Reinforcement Learning And Dynamic Programming Using Function Approximators |m Chinese

606 0_ |a 机器学习 |A ji qi xue xi |x 研究

606 0_ |a 动态规划 |A dong tai gui hua |x 研究

690 __ |a TP181 |v 5

701 _1 |a 布索尼 |A bu suo ni |g (Busoniu, Lucian) |4 著

701 _1 |a 巴布斯卡 |A ba bu si ka |g (Babuska, Robert) |4 著

701 _1 |a 舒特 |A shu te |g (Schutter, Bart De) |4 著

702 _0 |a 刘全 |A liu quan |4 译

702 _0 |a 傅启明 |A fu qi ming |4 译

702 _0 |a 章宗长 |A zhang zong chang |4 译

801 _0 |a CN |b 江苏新华 |c 20190925

905 __ |a LIB |d TP181/107