机读格式显示(MARC)

000 02330nam0 2200325 450

001 0000537976

005 20210912111800.0

010 __ |a 978-7-115-54156-7 |d CNY109.00

100 __ |a 20200922d2020 em y0chiy0110 ea

101 1_ |a chi |c eng

102 __ |a CN |b 110000

105 __ |a ak z 000yy

106 __ |a r

200 1_ |a 精通Spark数据科学 |A jing tong Sparkshu ju ke xue |d = Mastering spark for data science |f (美)安德鲁·摩根(Andrew Morgan) ... [等] 著 |g 柯晟劼, 刘少俊译 |z eng

210 __ |a 北京 |c 人民邮电出版社 |d 2020

215 __ |a 430页 |c 图 |d 24cm

304 __ |a 题名页题: (美) 安德鲁·摩根, 安托万·阿门德, 大卫·乔治, 马修·哈利特著

306 __ |a 本书由英国Packt Publishing公司授权人民邮电出版社出版

314 __ |a 安德鲁·摩根, 数据战略及其执行方面的专家, 在支持技术、系统架构和实现数据科学方面拥有丰富的经验。安托万·阿门德, 一位对大数据工程和可扩展计算充满热情的数据科学家。大卫·乔治, 一位杰出的分布式计算专家, 拥有超过15年的数据系统从业经验, 主要服务于全球闻名的IT咨询机构和品牌。柯晟劼, 日本东京海洋大学流通情报 (信息) 研究室应用环境系统学博士, 福州外语外贸学院经管学院副教授, 任教管理信息系统、数据分析等多门课程。刘少俊, 工程师, 任职于福建省科学技术信息研究所。毕业于东北师范大学, 获得计算机软件与理论理学硕士学位。目前的研究方向是信息抽取、数据分析、知识组织等。

330 __ |a ApacheSpark是专为大规模数据处理而设计的快速通用的计算引擎。这是一本专门介绍Spark的图书, 旨在教会读者利用Spark构建实用的数据科学解决方案。本书内容包括14章, 由浅入深地介绍了数据科学生态系统、数据获取、输入格式与模式、探索性数据分析、利用Spark进行地理分析、采集基于链接的外部数据、构建社区、构建推荐系统、新闻词典和实时标记系统、故事除重和变迁、情感分析中的异常检测、趋势演算、数据保护和可扩展算法。本书适合数据科学家以及对数据科学、机器学习感兴趣的读者阅读, 需要读者具备数据科学相关的基础知识, 并通过阅读本书进一步提升Spark运用能力, 从而创建出高效且实用的数据科学解决方案。

500 10 |a Mastering spark for data science |A Mastering Spark For Data Science |m Chinese

606 0_ |a 数据处理软件 |A shu ju chu li ruan jian

690 __ |a TP274 |v 5

701 _1 |c (美) |a 摩根 |A mo gen |c (Morgan, Andrew) |4 著

701 _0 |c (美) |a 阿门德 |A a men de |c (Amend, Antoin) |4 著

701 _0 |c (美) |a 乔治 |A qiao zhi |c (George, David) |4 著

702 _0 |a 柯晟劼 |A ke sheng jie |4 译

702 _0 |a 刘少俊 |A liu shao jun |4 译

801 _0 |a CN |b LIB |c 20210912

905 __ |a LIB |d TP274/444