MARC状态:订购 文献类型:中文图书 浏览次数:1
- 题名/责任者:
- 数据科学并行计算/白琰冰编著
- 出版发行项:
- 北京:中国人民大学出版社,2021
- ISBN及定价:
- 978-7-300-29059-1/CNY49.00
- 载体形态项:
- 275页:图;26cm
- 丛编项:
- 数据科学与大数据技术丛书
- 个人责任者:
- 白琰冰 编著
- 学科主题:
- 数据处理-研究
- 中图法分类号:
- TP274
- 提要文摘附注:
- 本书通俗地讲解数据科学与并行计算的基本概念、方法和原理,系统地介绍基于典型大数据场景的并行计算解决思路,同时涵盖常用的数据并行计算工具的操作实践,使读者知其然更知其所以然。本书的特色在于:注重对大数据科学方法核心应用的讲解,突出以并行计算思维解决大数据场景问题的案例教学。基于典型大数据场景案例数据集,循序渐进地引导读者利用Parallel、Sparklyr、Dask和PySpark等主流并行计算工具实现数据的清洗、转换、描述和建模分析。帮助读者系统全面地构建数据科学的基本知识体系,领会数据并行计算方法的精髓,掌握不同编程语言和并行计算工具针对不同规模数据集的优缺点,能够利用并行计算工具解决实际的数据分析问题。
全部MARC细节信息>>