机读格式显示(MARC)
- 010 __ |a 978-7-115-64917-1 |d CNY109.80
- 100 __ |a 20240823d2024 em y0chiy50 ea
- 200 1_ |a 深度学习入门 |A shen du xue xi ru men |h 4 |i 强化学习 |i = Reinforcement learning |f (日) 斋藤康毅著 |g 郑明智译
- 210 __ |a 北京 |c 人民邮电出版社 |d 2024.8
- 215 __ |a 313页 |c 彩图 |d 21cm
- 225 2_ |a 图灵程序设计丛书 |A tu ling cheng xu she ji cong shu
- 306 __ |a 简体中文版由人民邮电出版社有限公司出版, 2024 日文原版由O'Reilly Japan, Inc.出版, 2022 日文原版的翻译得到Koki Saitoh的授权
- 314 __ |a 斋藤康毅, 1984年出生于日本长崎县, 东京工业大学毕业, 并完成东京大学研究生院课程。目前在某企业从事人工智能相关的研究和开发工作。郑明智, 智慧医疗工程师。主要研究方向为医疗与前沿ICT技术的结合及其应用。
- 320 __ |a 有书目 (第310-313页)
- 330 __ |a 本书前半部分介绍强化学习的重要思想和基础知识, 后半部分介绍如何将深度学习应用于强化学习, 遴选讲解了深度强化学习的最新技术。全书从最适合入门的多臂老虎机问题切入, 依次介绍了定义一般强化学习问题的马尔可夫决策过程、用于寻找最佳答案的贝尔曼方程, 以及解决贝尔曼方程的动态规划法、蒙特卡洛方法和TD方法。随后, 神经网络和Q学习、DQN、策略梯度法等几章则分别讨论了深度学习在强化学习领域的应用。
- 333 __ |a 本书适合深度学习初学者阅读, 也适合对人工智能感兴趣的教师、学生和相关从业者学习参考
- 410 _0 |1 2001 |a 图灵程序设计丛书
- 517 1_ |a 强化学习 |A qiang hua xue xi
- 606 0_ |a 机器学习 |A ji qi xue xi
- 701 _0 |a 斋藤康毅, |A zhai teng kang yi |f 1984- |4 著
- 702 _0 |a 郑明智 |A zheng ming zhi |4 译
- 801 _0 |a CN |b 湖北三新 |c 20240823
- 905 __ |a LIB |d TP181/385:4