书单推荐
更多
新书推荐
更多

Python爬虫大数据采集与挖掘

Python爬虫大数据采集与挖掘

定  价:59.8 元

        

当前图书已被 1 所学校荐购过!
查看明细

  • 作者:曾剑平编著
  • 出版时间:2025/1/1
  • ISBN:9787302678250
  • 出 版 社:清华大学出版社
  • 中图法分类:TP312.8 
  • 页码:272页
  • 纸张:
  • 版次:1
  • 开本:26cm
9
7
6
8
7
7
8
3
2
0
5
2
0
本书围绕大数据采集与挖掘,对采集技术的相关基础、技术原理、Python实现技术、大数据挖掘与应用方法进行了系统介绍。书中全面、完整地覆盖了各种类型的网络爬虫及相关的信息处理挖掘技术,并提供了42个与爬虫技术和应用相关的Python程序。全书共分为四大部分,即概述、基础篇、技术与实现篇、大数据挖掘与应用篇。第一部分是概述,指出了利用Python采集互联网大数据的重要性,介绍了相关技术研究、技术体系、Python爬虫采集技术的合规性及应用现状等;第二部分是基础篇,包括Web服务器的应用架构以及HTTP、Robots、HTML、页面编码等相关协议和规范;第三部分是技术与实现篇,全面介绍了普通网络爬虫技术、动态页面采集方法、主题爬虫技术、DeepWeb爬虫、微博信息采集、Web信息提取以及反爬虫技术等,内容涵盖了各种爬虫技术实现方法及Python例子;第四部分是大数据挖掘与应用篇,介绍了文本、情感、社交网络和时间序列等典型大数据处理与挖掘技术及应用模式,并以新闻采集与分析、Web自动化测试、酒店评估文本挖掘为例介绍了Python爬虫应用构建方法,将本书介绍的一些关键技术、模型和工具贯穿在一起。
 你还可能感兴趣
 我要评论
您的姓名   验证码: 图片看不清?点击重新得到验证码
留言内容