机读格式显示(MARC)
- 000 01194nam0 2200241 450
- 010 __ |a 978-7-121-31071-3 |d CNY79.00
- 100 __ |a 20170420d2017 em y0chiy50 ea
- 200 1_ |a 网络爬虫全解析 |A wang luo pa chong quan jie xi |e 技术、原理与实践 |f 罗刚著
- 210 __ |a 北京 |c 电子工业出版社 |d 2017.03
- 215 __ |a 429页 |c 图 |d 25cm
- 330 __ |a 本书介绍了如何开发网络爬虫。内容主要包括开发网络爬虫所需要的Java语法基础和网络爬虫的工作原理, 如何使用开源组件HttpClient和爬虫框架Crawler4j抓取网页信息, 以及针对抓取到的文本进行有效信息的提取。为了扩展抓取能力, 本书介绍了实现分布式网络爬虫的关键技术。另外, 本书介绍了从图像和语音等多媒体格式文件中提取文本信息, 以及如何使用大数据技术存储抓取到的信息。最后, 以实战为例, 介绍了如何抓取微信和微博, 以及在电商、医药、金融等领域的案例应用。其中, 电商领域的应用介绍了使用网络爬虫抓取商品信息入库到网上商店的数据库表。
- 606 0_ |a 软件工具 |A ruan jian gong ju |x 程序设计
- 701 _0 |a 罗刚 |A luo gang |4 著
- 801 _0 |a CN |b 安徽时代 |c 20170420
- 905 __ |a LIB |d TP311.561/31