机读格式显示(MARC)
- 000 01451nam0 2200313 450
- 010 __ |a 978-7-118-13179-6 |b 精装 |d CNY89.00
- 100 __ |a 20240831d2024 em y0chiy50 ea
- 200 1_ |a 深度强化学习 |A shen du qiang hua xue xi |f (印) 莫希特·塞瓦克著 |d = Deep reinforcement learning |f Mohit Sewak |g 尹大伟, 吴敏杰译 |z eng
- 210 __ |a 北京 |c 国防工业出版社 |d 2024.6
- 215 __ |a 165页 |c 图 |d 25cm
- 306 __ |a 本书简体中文版由Springer授权国防工业出版社独家出版
- 320 __ |a 有书目 (第162-165页)
- 330 __ |a 本书主要内容包括: 介绍了强化学习的基本概念, 如智能体、环境、状态、奖励、动作等; 介绍了强化学习的数学和算法原理, 如马尔可夫决策过程和贝尔曼方程, 并在此基础上讨论了动态规划、值迭代和策略迭代方法; 介绍了强化学习的估计与控制问题, 并通过实例展示了Q学习的编程; 深入探讨了深度学习的概念、架构机制, 通过介绍激活函数、损失函数、优化器、卷积层、池化层、全连接层等概念, 为后续章节与强化学习算法相结合作铺垫。
- 500 10 |a Deep reinforcement learning |A Deep Reinforcement Learning |m Chinese
- 606 0_ |a 机器学习 |A ji qi xue xi
- 701 _1 |a 塞瓦克 |A sai wa ke |g (Sewak, Mohit) |4 著
- 702 _0 |a 尹大伟 |A yin da wei |4 译
- 702 _0 |a 吴敏杰 |A wu min jie |4 译
- 801 _0 |a CN |b 湖北三新 |c 20240831
- 905 __ |a LIB |d TP181/347