这是一部营销和广告数据挖掘与分析的实战指南,横跨技术和业务两个维度,理论与实践相结合。技术维度,结合营销与广告行业的实际需求,系统讲解了广告数据挖掘的模型、算法以及数据分析方法,从而实现面向用户的精准营销;业务维度,结合广告业务的具体场景,为广告中的具体问题提供解决方案。更重要的是,本书还讲解了热门的机器学习算法在广告数据挖掘与分析中的应用。
全书共 10 章,从逻辑上可分为技术理论知识和具体业务应用两个部分。前6章以及第10章主要讲解了广告数据分析与挖掘的技术、方法和应用,第7~9 章则主要讲解了广告业务中的具体问题及相应的解决方法。
第1~2 章主要介绍了Python的安装和环境配置,以及广告数据和广告数据分析的基础知识;
第3~6章深入讲解了Python常用的工具包、模型常用的评价指标,以及如何利用Python建立广告分类模型和集成模型。
第7~8章讲解了广告数据分析的典型案例和常用分析方法,以及如何做一份满意的数据分析报告。
第9章讲解了如何运用数据分析与挖掘方法解决广告业务中的实际问题。
第 10 章主要讲解了常用的数据预处理及特征选择方法。
适读人群 :在校大学生或对移动广告营销数据分析感兴趣的小白;想转行做广告数据分析的职场白领、开发人员、其他技术人员等;由于工作需要学习相关数据分析知识的产品经理、运营相关人员 (1)两位作者是资深的数据分析与挖掘技术专家、AI技术专家,在广告和金融行业有深厚的积累。
(2)横跨技术和业务两个维度,理论与实践相结合,循序渐进,系统且全面。
(3)技术维度,系统讲解广告数据挖掘的模型、算法和方法,实现精准营销。
(4)业务维度,为广告业务中的具体问题提供解决方案,包含大量案例和代码。
为何写作本书
近几年来大数据、云计算、人工智能等概念越来越深入人心,相关技术也越来越成熟。技术的进步必然会带来社会的发展,进而推动整个人类社会不断进步。机器学习、深度学习、强化学习等均属于人工智能的细分领域,数据分析又是机器学习的基础,近几年在现实中的应用场景非常多,作用越发明显,因而越来越受到重视。随着5G时代的到来,数据分析、AI方面的人才将更加紧缺,可以说未来很长一段时间数据分析人才都会是招聘市场上的高端人才,备受企业青睐。本书旨在帮助读者快速了解移动广告相关业务知识及具体应用,掌握数据分析相关理论和实践技能。
本书主要特点
本书将深入剖析广告营销行业的常见数据分析案例,并结合当前热门的机器学习和AI算法在广告营销场景的具体应用进行介绍,帮助读者更好地理解广告行业相关业务与技术应用,快速掌握广告营销数据分析所需要的基本知识和技能。书中采用Python作为项目实战编程语言,可帮助读者学习用Python进行数据分析和解决现实问题。
本书读者对象
本书是一本广告营销行业数据分析入门指导书,适合的读者对象主要分为下面几类:
广告营销专业的在校学生;
对广告营销数据分析感兴趣的其他行业从业者;
想转行做广告数据分析的职场白领、开发人员、其他技术人员等。
如何阅读本书
本书共10章,从逻辑上可分为技术理论知识和具体业务应用两部分。其中,第1~2章主要介绍Python的安装和环境配置,带领读者认识广告数据,理解广告数据分析的意义。第3~6章主要介绍Python常用工具包以及模型常用评价指标,并利用Python建立广告分类模型。第7~8章主要介绍广告数据分析典型案例及常用分析方法,教读者如何做一份满意的数据分析报告。第9章主要介绍如何运用数据分析挖掘方法解决广告业务中的实际问题。第10章主要介绍常用的数据预处理及特征选择方法。
总之,前6章以及第10章主要介绍广告数据分析挖掘技术理论和应用,第7~9章则主要介绍广告业务中的具体问题及相应的解决方法,读者可以有选择性地阅读相应内容,有兴趣的话也可以通读全书。
勘误
尽管作者已经尽了自己最大的努力,但书中仍有不尽如人意的地方。若读者发现本书有错误之处,或者针对本书内容有更好的写作建议及意见,可以在微信公众号“数据挖掘与AI算法”上进行反馈。
致谢
动手写作本书时,我已有孕在身,所以一直顾虑颇多,很担心无法按时交稿。如今书稿付梓在即,心中感慨万千。首先要感谢本书的另一位作者周健的努力和配合,其次要感谢我的家人对我的理解和支持,没有他们,本书是无法顺利完成的。还要特别感谢机械工业出版社华章公司的两位编辑杨福川和李艺,他们的大力支持和辛勤付出才让本书得以顺利出版。
杨游云
杨游云
资深数据分析专家和AI技术专家,在广告领域工作多年,目前就职于微思敦深圳分公司皓量科技。在AI技术领域有非常深厚的积累,擅长机器学习和自然语言处理,对图像识别技术也有一定的研究。
个人微信公众号:数据挖掘与AI算法。
周健
资深数据挖掘工程师,现就职于国内某大型征信服务公司,曾为多家国有银行、股份制银行、大型金融机构提供反欺诈、信用评分方案。在传统机器学习方面有深入的理解和丰富的实战经验,在网络爬虫和自然语言处理方面也有自己独特的见解。
前言
第1章 Python安装方法1
1.1 Python介绍1
1.2 Anaconda安装2
1.3 PyCharm安装及环境配置9
1.4 为什么建议使用Python17
1.5 本章小结18
第2章 认识广告数据分析19
2.1 广告数据概述19
2.2 广告数据分布20
2.3 异常值诊断24
2.4 数据相关性26
2.5 显著性检验27
2.6 本章小结27
第3章 Python广告数据分析常用工具包29
3.1 数据基础运算工具:NumPy29
3.2 数据预处理工具:Pandas46
3.3 数据可视化分析工具:Matplotlib63
3.4 本章小结74
第4章 模型常用评价指标75
4.1 回归模型常用评价指标75
4.2 分类模型常用评价指标77
4.3 本章小结87
第5章 利用Python建立广告分类模型88
5.1 逻辑回归88
5.2 决策树92
5.3 KNN98
5.4 SVM101
5.5 神经网络110
5.6 本章小结118
第6章 利用Python建立广告集成模型119
6.1 随机森林119
6.2 GBDT124
6.3 XGBoost128
6.5 LR+GBDT137
6.6 FM142
6.6.1 FM的原理142
6.6.2 FM的改进145
6.6.3 FM的Python实现145
6.7 本章小结147
第7章 移动广告常用数据分析方法149
7.1 App下载数据分析149
7.2 游戏行业用户分析151
7.3 电商类App用户转化分析156
7.4 工具类App用户分析162
7.5 本地O2O婚纱摄影行业分析163
7.6 品牌广告与效果广告166
7.7 本章小结168
第8章 广告数据分析报告169
8.1 分析观点明确,逻辑清晰169
8.2 汇报结果,用数据说话170
8.3 分析过程有理有据171
8.4 图表说明171
8.5 数据验证173
8.6 分析建议173
8.7 本章小结174
第9章 广告用户数据挖掘与分析175
9.1 广告用户曝光与响应率分析175
9.2 广告用户曝光与点击率分析178
9.3 广告订单消耗与延时性分析181
9.4 Lookalike聚类分析186
9.5 Lookalike技术在广告中的应用190
9.6 本章小结192
第10章 广告数据预处理与特征选择193
10.1 广告数据预处理193
10.2 常用特征选择方法197
10.3 PCA209
10.4 本章小结214