机读格式显示(MARC)
- 010 __ |a 978-7-115-57601-9 |d CNY119.80
- 100 __ |a 20211130d2021 em y0chiy50 ea
- 200 1_ |a Spark快速大数据分析 |A Spark kuai su da shu ju fen xi |b 专著 |d Learning spark |f (美)朱尔斯·S. 达米吉[等]著 |g 王道远译 |z eng
- 210 __ |a 北京 |c 人民邮电出版社 |d 2021
- 215 __ |a 24,314页 |c 图 |d 24cm
- 225 2_ |a 图灵程序设计丛书 |A Tu Ling Cheng Xu She Ji Cong Shu
- 304 __ |a 著者还有:布鲁克·韦尼希、(印)泰瑟加塔·达斯、 (印)丹尼·李
- 306 __ |a O'Reilly Media, Inc.授权人民邮电出版社有限公司出版
- 314 __ |a 朱尔斯·S. 达米吉 (Jules S. Damji) 是Databricks的高级开发人员,也是MLflow的贡献者。布鲁克·韦尼希 (Brooke Wenig) 是 Databricks的机器学习专家。泰瑟加塔·达斯 (Tathagata Das) 是Databricks的资深软件工程师、Apache Spark贡献者,以及Apache Spark PMC成员。王道远,目前就职于阿里云开源大数据平台数据湖存储团队,花名“健身”,主要负责数据湖架构下的缓存优化工作。
- 330 __ |a 本书的主角是在大数据时代应运而生的数据处理与分析利器--Spark。你将通过丰富的示例学习如何使用Spark的结构化数据API,利用Spark SQL进行交互式查询,掌握Spark应用的优化之道,用Spark和Delta Lake等开源工具构建可靠的数据湖,并用MLlib库实现机器学习流水线。随着Spark从2.x版本升级到3.0版本,本书第2版做了全面的更新,以体现Spark生态系统在机器学习、流处理技术等方面的发展,另新增一章详解Spark 3.0引入的新特性。
- 461 _0 |1 2001 |a 图灵程序设计丛书
- 510 1_ |a Learning spark |z eng
- 606 0_ |a 数据处理软件 |A Shu Ju Chu Li Ruan Jian
- 701 _0 |c (美) |a 达米吉 |A da mi ji |c (Damji, Jules S.) |4 著
- 701 _0 |c (印) |a 韦尼希 |A wei ni xi |c (Wenig, Brooke) |4 著
- 701 _0 |c (印) |a 达斯 |A da si |c (Das, Tathagata) |4 著
- 702 _0 |a 王道远 |A wang dao yuan |4 译
- 801 _0 |a CN |b LIB |c 20230618
- 905 __ |a LIB |d TP274/579