机读格式显示(MARC)
- 010 __ |a 978-7-111-77922-3 |d CNY119.00
- 100 __ |a 20250331d2025 em y0chiy50 ea
- 200 1_ |a 深度剖析DeepSeek大模型 |A shen du pou xi DeepSeek da mo xing |e 原理、开发与优化部署 |f 丁小晶, 崔远编著
- 210 __ |a 北京 |c 机械工业出版社 |d 2025.4
- 215 __ |a xii, 312页 |c 图 |d 24cm
- 225 2_ |a AIGC与大模型技术丛书 |A AIGC yu da mo xing ji shu cong shu
- 314 __ |a 丁小晶, 资深大模型AI应用技术专家与管理者, 拥有超过15年的计算机及AI领域经验、5年团队管理经验的技术创新与项目管理复合型人才, 精通大模型技术及多语言编程, 致力于AI大模型的应用和创新。崔远, 毕业于兰州大学, 副教授, 主攻人工智能 (AI)、自然语言处理 (NLP) 和深度学习等计算机前沿技术, 并致力于教学研究, 承担多门专业核心课程的教学工作。
- 330 __ |a 本书共分为12章, 首先介绍大模型的基础知识与发展历程, 从神经网络的起源到大规模预训练模型的演化, 再到Transformer、BERT与GPT等模型架构的深入剖析, 帮助读者理解大模型的技术基石。其次详细解析了DeepSeek R1及其Zero版本在强化学习与模型架构上的核心技术, 包括混合专家模型、动态学习率调度、分布式训练及高效推理优化策略等。再次聚焦于模型训练与开发实践, 介绍API调用、上下文拼接、多轮对话管理模型微调、知识蒸馏等关键技术, 并结合DeepSeek实际案例展示其在数学推理、代码生成等领域的应用。最后着重探讨了大模型在商业化落地场景中的高级应用, 如FIM补全、多轮对话、业务代码自动化生成以及基于云部署的智能推荐搜索系统等。
- 333 __ |a 本书适合大模型开发者、AI研究人员、工程师、数据科学家、企业技术决策者以及对人工智能技术感兴趣的高校师生阅读。无论是希望深入理解大模型技术的专业人士, 还是寻求在实际业务中应用AI技术的从业者, 都能从中获得有价值的信息和实践指导
- 410 _0 |1 2001 |a AIGC与大模型技术丛书
- 517 1_ |a 原理、开发与优化部署 |A yuan li 、kai fa yu you hua bu shu
- 606 0_ |a 人工智能 |A ren gong zhi neng
- 701 _0 |a 丁小晶 |A ding xiao jing |4 编著
- 701 _0 |a 崔远 |A cui yuan |4 编著
- 801 _0 |a CN |b 湖北三新 |c 20250331
- 905 __ |a LIB |d TP18/692