机读格式显示(MARC)
- 010 __ |a 978-7-302-53829-5 |d CNY99.00
- 100 __ |a 20200602d2020 em y0chiy50 ea
- 200 1_ |a 强化学习 |A qiang hua xue xi |d = Reinforcement learning |f 邹伟, 鬲玲, 刘昱杓著 |z eng
- 210 __ |a 北京 |c 清华大学出版社 |d 2020.6
- 215 __ |a 17, 380页, 8页图版 |c 图 (部分彩图) |d 24cm
- 225 2_ |a 人工智能科学与技术丛书 |A ren gong zhi neng ke xue yu ji shu cong shu
- 320 __ |a 有书目 (第379-380页)
- 330 __ |a 该书共14章,大致分为4个部分:第1部分介绍强化学习的基础知识,包括强化学习的定义,发展历程,以及要解决的问题。第2部分包括动态规划方法,蒙特卡罗方法,时间差分方法。第3部分通过集成多个基本算法,或者将值函数、策略做函数近似,第4部分使用强化学习解决两类博弈问题:完美信息博弈和不完美信息博弈。
- 333 __ |a 可作为高等院校计算机、自动化及相关专业的本科生或研究生教材,也可供对强化学习感兴趣的研究人员和工程技术人员阅读参考
- 410 _0 |1 2001 |a 人工智能科学与技术丛书
- 510 1_ |a Reinforcement learning |z eng
- 606 0_ |a 机器学习 |A ji qi xue xi
- 701 _0 |a 邹伟 |A zou wei |4 著
- 701 _0 |a 鬲玲 |A ge ling |4 著
- 701 _0 |a 刘昱杓 |A liu yu biao |4 著
- 801 _0 |a CN |b 江苏新华 |c 20200402
- 905 __ |a LIB |d TP181/137