《应用回归及分类》第一版自2016年出版以来,经过两版的沉淀,已经成为一本全面介绍回归和分类方法的权威教材,它涵盖了从传统统计学到现代机器学习的各种内容。本书旨在为读者提供一套完整、系统的数据分析工具和方法,帮助他们更好地理解和应用回归及分类技术。
1.在回归方面:本书详细介绍了经典线性回归和广义线性模型,这些模型是回归分析的基础,适用于各种实际问题的建模和预测。此外,本书还深入探讨了纵向数据(分层模型)的处理方法,为读者提供了处理复杂数据结构的有效手段。
2. 在机器学习回归方法方面:本书涵盖了决策树、bagging、随机森林、mboost、人工神经网络、支持向量机、k最近邻方法等多种技术。这些方法在现代数据分析中得到了广泛应用,具有强大的预测能力和灵活性。通过本书的学习,读者将能够熟练掌握这些方法的原理和应用技巧。
3.在分类方面:本书首先介绍了经典判别分析与logistic回归分类方法,这些方法在分类问题中具有重要地位。随后,本书深入探讨了机器学习分类方法,包括决策树、bagging、随机森林、adaboost、人工神经网络、支持向量机、k最近邻方法等。这些方法在处理复杂分类问题时具有显著优势,能够帮助读者提高分类准确性和效率。
吴喜之,北京大学数学力学系本科,美国北卡罗来纳大学统计博士。中国人民大学统计学院教授,博士生导师。曾在美国加利福尼亚大学、北卡罗来纳大学以及南开大学、北京大学等多所著名学府执教。张 敏 重庆工商大学讲师。作为第一作者发表CSSCI、CSCD、SCI文章多篇,主持或参与国家级及省部级课题多项,作为第二作者出版关于数据科学的教材多部。
第1章 引言
1.1 作为科学的统计
1.2 数据及模型
1.3 关于软件的说明
1.4 有监督学习传统统计方法与各机器学习方法的交叉验证比较
1.5 习题
1.6 本章的R和Python代码
第2章 经典线性回归
2.1 模型形式
2.2 用最小二乘法估计线性模型
2.3 回归系数的大小没有可解释性
2.4 传统统计关于线性回归系数的性质和推断*
2.5 通过一个“教材数据”来理解简单最小二乘回归
2.6 处理线性回归多重共线性的经典方法*
2.7 损失函数及分位数回归简介*
2.8 习题
2.9 本章的R和Python代码
第3章 广义线性模型
3.1 模型
3.2 指数分布族及典则连接函数
3.3 似然函数和准似然函数
3.4 广义线性模型的一些推断问题
3.5 logistic回归和二元分类问题
3.6 Poisson 对数线性模型及频数数据的预测*
3.7 习题
3.8 本章的Python代码
第4章 机器学习: 有监督学习
4.1 引言
4.2 决策树
4.3 集成算法的思想
4.4 bagging方法
4.5 随机森林
4.6 AdaBoost分类
4.7 mboost回归
4.8 Xgboost模型
4.9 神经网络
4.10 支持向量机
4.11 k最近邻方法
4.12 朴素贝叶斯分类
4.13 案例分析: 例4.8服装业生产率数据
4.14 案例分析: 例4.9信用卡批准数据
4.15 习题
4.16 本章的R和Python代码
第5章 判别分析*
5.1 线性判别分析
5.2 Fisher判别分析
5.3 混合线性判别分析
5.4 习题
第6章 混合效应模型*
6.1 概念
6.2 通过一个数值例子解释线性混合模型
6.3 线性混合模型的一般形式
6.4 广义线性混合模型
6.5 决策树关联的混合模型
6.6 对例6.2数学分数数据做第6章方法与其他模型的比较
6.7 Python对例6.2数学分数数据的MERF模型及其他模型比较
6.8 习题
第7章 生存分析及Cox模型*
7.1 基本概念
7.2 生存函数的Kaplan-Meier估计
7.3 累积危险函数
7.4 估计和检验*
7.5 Cox比例危险模型
7.6 习题
7.7 本章的Python代码
参考文献