机读格式显示(MARC)

000 01923nam 2200337 450

001 0000790534

005 20250620130600.0

010 __ |a 978-7-122-45282-5 |d CNY69.80

100 __ |a 20240806d2024 em y0chiy50 ea

101 0_ |a chi

102 __ |a CN |b 110000

105 __ |a ak z 000yy

106 __ |a r

200 1_ |a 强化学习 |A qiang hua xue xi |d = Introduction to reinforcement learning |e 人工智能如何知错能改 |f 龚超 ... [等] 著 |z eng

210 __ |a 北京 |c 化学工业出版社 |d 2024.8

215 __ |a 234页 |c 图 |d 21cm

225 2_ |a 人工智能超入门丛书 |A ren gong zhi neng chao ru men cong shu

304 __ |a 题名页题: 龚超, 王冀, 梁霄, 贵宁著

314 __ |a 龚超, 工学博士, 清华大学日本研究中心主任助理, 中日创新中心主任研究员, 深圳清华大学研究院下一代互联网研发中心核心成员, 海口经济学院雅和人居工程学院客座教授。王冀, 工学博士, 西北工业大学计算机学院助理教授, 研究方向为关键数据提取及图像编码。梁霄, 中国人民大学附属中学教师, 信息学竞赛教练, 本科毕业于清华大学电子工程系, 博士毕业于清华大学计算机系。

330 __ |a 本书内容包含强化学习方向的基础知识, 如动态规划、时序差分等, 让读者在开始学习时对强化学习有初步的认识; 之后, 通过对马尔可夫决策过程及贝尔曼方程的解读, 逐渐过渡到强化学习的关键内容; 同时, 本书也解析了策略迭代与价值迭代两种核心算法, 也对蒙特卡洛方法、时序差分算法、深度强化学习及基于策略的强化学习算法进行了剖析。

333 __ |a 本书适合强化学习方向初学者阅读学习, 可以作为人工智能及计算机相关工作岗位的技术人员的入门读物, 也可以作为高等院校人工智能及计算机专业的师生阅读参考, 对人工智能感兴趣的人群也可以阅读

410 _0 |1 2001 |a 人工智能超入门丛书

510 1_ |a Introduction to reinforcement learning |z eng

517 1_ |a 人工智能如何知错能改 |A ren gong zhi neng ru he zhi cuo neng gai

606 0_ |a 人工智能 |A ren gong zhi neng |j 普及读物

690 __ |a TP18 |v 5

701 _0 |a 龚超 |A gong chao |4 著

701 _0 |a 王冀 |A wang ji |4 著

701 _0 |a 梁霄 |A liang xiao |4 著

801 _0 |a CN |b 湖北三新 |c 20240806

905 __ |a LIB |d TP18/656