本书基于Python与Pytorch对人工智能算法基础知识与实战应用进行了介绍,主要包含两部分内容。第一部分为人工智能算法知识的相关理论介绍,主要包含:人工智能的线性代数基础、概率统计基础、数据分析基础、机器学习基础以及深度学习基础。对机器学习中的回归、聚类以及分类等经典算法进行了介绍。对深度学习中的卷积、循环、Transformer等深度学习网络在计算机视觉与自然语言中的应用,以及大模型与微调相关的内容进行了介绍。第二部分为基于Python与Pythoch的人工智能算法实战案例应用,主要介绍:数据的预测回归分析案例;数据无监督学习中的聚类、降维以及关联规则案例;数据有监督分类模型的应用案例,以及深度学习中图像分类、图像语义分割、图像迁移学习、自然语言聚类与分类等经典算法的实战案例。
本书为读者提供了Notebook形式的源程序和使用的数据集,方便读者边学边实践。本书适合数据分析、机器学习、人工智能以及大数据领域的工程师学习,也可用作高等院校相关专业的教材及参考书。
第1章 人工智能简介 001
1.1 什么是人工智能 002
1.2 人工智能简史 003
1.3 人工智能应用 006
1.4 本章小结 007
第2章 人工智能基础 009
2.1 线性代数基础 010
2.1.1 向量的定义 010
2.1.2 向量运算 010
2.1.3 矩阵的定义 012
2.1.4 矩阵基本运算 013
2.1.5 矩阵特征值与特征向量 015
2.2 概率统计基础 016
2.2.1 随机事件及其概率 016
2.2.2 条件概率 018
2.2.3 独立性 018
2.2.4 随机变量 019
2.2.5 边缘分布 024
2.2.6 大数定律 024
2.3 数据分析基础 025
2.3.1 假设检验 025
2.3.2 方差分析 027
2.3.3 相关分析 030
2.4 机器学习基础 031
2.4.1 机器学习分类 032
2.4.2 机器学习性能度量 034
2.4.3 模型过拟合与欠拟合 036
2.5 深度学习基础 037
2.5.1 深度学习发展过程 038
2.5.2 深度学习任务 040
2.6 本章小结 042
第3章 回归分析 043
3.1 线性回归 045
3.1.1 一元线性回归 045
3.1.2 多元线性回归 047
3.1.3 回归诊断 050
3.2 正则化回归 051
3.2.1 Ridge回归 051
3.2.2 Lasso回归 051
3.2.3 弹性网回归 052
3.3 逻辑回归 053
3.4 时间序列回归 054
3.4.1 白噪声检验与平稳检验 054
3.4.2 自相关与偏自相关 057
3.4.3 ARMA模型 058
3.4.4 ARIMA模型 059
3.4.5 SARIMA模型 060
3.4.6 Prophet算法 061
3.5 本章小结 062
第4章 无监督学习 063
4.1 相似性度量 064
4.1.1 距离度量 064
4.1.2 分布度量 065
4.2 聚类分析 066
4.2.1 聚类的基本概念 066
4.2.2 k均值聚类 068
4.2.3 层次聚类 070
4.2.4 密度聚类 071
4.3 数据降维 073
4.3.1 主成分分析 073
4.3.2 局部线性嵌入(LLE) 075
4.3.3 t分布-随机邻近嵌入(t-SNE) 077
4.4 关联规则 078
4.4.1 关联规则基本概念 078
4.4.2 Apriori算法 079
4.4.3 FP-Growth算法 081
4.5 稀疏表示与字典学习 084
4.6 本章小结 085
第5章 有监督学习 087
5.1 决策树 088
5.1.1 决策树简介 088
5.1.2 节点特征选择 089
5.1.3 决策树算法 090
5.1.4 决策树剪枝 092
5.2 集成学习 093
5.2.1 集成学习模式与方法 093
5.2.2 随机森林算法 094
5.2.3 AdaBoost算法 094
5.2.4 梯度提升树算法 095
5.3 k近邻 096
5.4 判别分析 097
5.4.1 线性判别分析 098
5.4.2 二次判别分析 099
5.5 贝叶斯分类 099
5.5.1 贝叶斯定理 099
5.5.2 朴素贝叶斯分类器 100
5.6 支持向量机 101
5.6.1 支持向量与最大间隔 102
5.6.2 线性支持向量机建模 102
5.6.3 非线性支持向量机与核方法 103
5.7 本章小结 104
第6章 深度学习 105
6.1 人工神经网络 106
6.1.1 感知机与全连接神经网络 106
6.1.2 梯度下降算法 107
6.2 卷积神经网络 110
6.2.1 卷积 110
6.2.2 池化 112
6.2.3 Dropout 112
6.2.4 LeNet-5网络 113
6.2.5 AlexNet网络 113
6.2.6 VGG网络 114
6.2.7 GoogLeNet网络 115
6.2.8 ResNet网络 116
6.2.9 DenseNet网络 118
6.2.10 MobileNet网络 119
6.3 循环神经网络 121
6.3.1 RNN 122
6.3.2 LSTM网络 123
6.3.3 GRU 124
6.4 自编码器模型 125
6.4.1 自编码器 125
6.4.2 变分自编码器 126
6.4.3 生成扩散模型(diffusion models) 127
6.5 自注意力机制与Transformer 128
6.5.1 自注意力 128
6.5.2 交叉注意力 129
6.5.3 Transformer 130
6.6 生成对抗网络 130
6.6.1 生成对抗网络基本工作原理 131
6.6.2 条件生成对抗网络(CGAN) 132
6.6.3 Wasserstein GAN(WGAN) 132
6.6.4 深度卷积生成对抗网络(DCGAN) 133
6.6.5 循环生成对抗网络(CycleGAN) 134
6.7 图神经网络 135
6.7.1 图卷积网络 137
6.7.2 图注意力网络 139
6.7.3 图自编码网络 141
6.7.4 时空图神经网络 142
6.8 强化学习 143
6.8.1 Q-Learning 144
6.8.2 深度Q网络(deep Q-networks) 145
6.8.3 Actor-Critic方法 147
6.9 本章小结 149
第7章 计算机视觉基础 151
7.1 图像分类 152
7.1.1 ViT 152
7.1.2 Swin Tramsformer 153
7.1.3 CLIP模型 155
7.1.4 MaxViT 156
7.2 目标检测 158
7.2.1 R-CNN系列算法 158
7.2.2 YOLO系列算法 160
7.2.3 SSD系列算法 162
7.2.4 目标检测评价指标 163
7.3 语义分割 164
7.3.1 FCN语义分割网络 164
7.3.2 SegNet语义分割网络 165
7.3.3 U-Net语义分割网络 165
7.3.4 DeepLab系列语义分割网络 166
7.3.5 Segment Anything Model(SAM) 167
7.3.6 语义分割评价指标 168
7.4 图像风格迁移 169
7.4.1 固定风格固定内容的风格迁移 169
7.4.2 固定风格任意内容的快速风格迁移 169
7.4.3 图像迁移学习分类 171
7.5 图像去噪 174
7.5.1 基于卷积神经网络的去噪方法 174
7.5.2 基于生成对抗网络的去噪方法 175
7.5.3 图像去噪评价指标 176
7.6 本章小结 176
第8章 自然语言处理基础 177
8.1 文本数据处理 178
8.1.1 字符串处理 179
8.1.2 中文分词 179
8.1.3 词频统计与可视化 180
8.2 文本特征表示 181
8.2.1 N-gram与TF-IDF矩阵 181
8.2.2 词嵌入 182
8.3 文本聚类 183
8.3.1 LDA主题模型 183
8.3.2 深度文本聚类算法 184
8.4 文本分类 185
8.4.1 FastText文本分类 185
8.4.2 TextCNN文本分类 186
8.4.3 TextRNN文本分类 186
8.4.4 TextRCNN文本分类 187
8.5 大模型 188
8.5.1 BERT 188
8.5.2 GPT 190
8.5.3 Meta LLaMA 192
8.5.4 GLM 193
8.5.5 大模型微调 195
8.6 多模态大模型 198
8.6.1 主流多模态大模型 198
8.6.2 多模态大模型架构 201
8.6.3 多模态大模型未来趋势 202
8.7 本章小结 203
第9章 实战案例1:药物活性预测回归分析实战 205
9.1 数据预处理与探索 207
9.1.1 自变量数据可视化探索 208
9.1.2 因变量数据可视化探索 210
9.2 数据特征选择 213
9.3 线性回归模型 216
9.3.1 逐步线性回归预测 216
9.3.2 Lasso回归模型预测 219
9.4 集成学习回归模型 221
9.4.1 随机森林回归预测 221
9.4.2 提升树回归预测 223
9.5 支持向量机回归 224
9.6 本章小结 226
第10章 实战案例2:手写数字降维与聚类实战 227
10.1 数据准备 228
10.2 主成分分析降维 230
10.2.1 特征主成分分析 230
10.2.2 样本主成分分析 232
10.3 t-SNE与LLE降维 233
10.3.1 t-SNE降维 233
10.3.2 LLE降维 234
10.4 k均值聚类 235
10.4.1 主成分特征k均值聚类 236
10.4.2 t-SNE特征k均值聚类 238
10.5 密度聚类 239
10.6 层次聚类 241
10.7 本章小结 244
第11章 实战案例3:购物篮关联规则挖掘实战 245
11.1 数据准备与探索 246
11.2 Apriori算法关联规则分析 250
11.2.1 发现频繁项集 250
11.2.2 关联规则挖掘与分析 251
11.3 FP-Growth算法关联规则分析 252
11.3.1 发现频繁项集 252
11.3.2 关联规则发现与分析 253
11.4 本章小结 256
第12章 实战案例4:手写数字分类实战 257
12.1 k近邻分类 260
12.2 基于决策树算法分类 261
12.2.1 决策树分类 261
12.2.2 随机森林分类 264
12.3 支持向量机分类 266
12.3.1 线性SVM 266
12.3.2 非线性SVM 267
12.4 全连接网络分类 267
12.5 逻辑回归分类 268
12.6 本章小结 270
第13章 实战案例5:深度学习图像分类实战 271
13.1 CIFAR10图像数据准备与探索 272
13.2 LeNet-5实现CIFAR10图像分类 277
13.2.1 LeNet-5网络搭建 277
13.2.2 LeNet-5网络训练与测试 278
13.3 ResNet实现CIFAR10图像分类 280
13.3.1 ResNet网络搭建 280
13.3.2 ResNet-50网络训练与测试 283
13.4 ViT实现CIFAR10图像分类 284
13.4.1 ViT网络搭建 284
13.4.2 ViT网络训练与预测 287
13.5 预训练网络的CIFAR10图像分类 289
13.6 基于LoRA微调的CIFAR10图像分类 290
13.7 本章小结 292
第14章 实战案例6:深度学习语义分割实战 293
第15章 实战案例7:深度图像迁移学习实战 295
第16章 实战案例8:自然语言聚类与分类实战 297
参考文献 299