本书是一本系统阐释人工智能理论、技术与应用的综合性教材,融合基础理论、前沿技术与实践应用,兼顾广度和深度。本书以"理论基础—技术解析—应用拓展—问题思辨”为逻辑主线,全面覆盖人工智能的核心知识体系。全书以人工智能发展简史为引,解构其基本概念及数据、算力、算法三大底层支柱,继而以递进式视角深入剖析机器学习、神经网络、深度学习等核心技术原理,同步展开计算机视觉、自然语言处理、智能语音技术、具身智能等典型应用场景解析。本书聚焦生成式人工智能浪潮下大模型技术的爆发逻辑、基本原理和使用技巧,最终回归人工智能伦理挑战,让人工智能装好"刹车”再上路。 本书可作为高等院校人工智能、智能科学与技术、计算机科学与技术、大数据、软件工程等相关专业的入门教材,也可作为人工智能领域爱好者、初学者及相关行业从业者的参考用书。
曾诚,教授,现任湖北大学人工智能学院副院长、中国计算机学会服务计算专委会委员、教育专委会委员、智能感知系统与安全教育部重点实验室副主任、智慧政务与人工智能应用湖北省工程研究中心副主任、华为(武汉)人工智能创新中心特聘专家。主要方向是人工智能、软件工程。主持教育部产教融合协同育人项目6项,出版著作2部。
第1章 绪论 1
1.1 引言 1
1.2 人工智能发展简史 6
1.3 人工智能基本概念和
能力表现 11
1.3.1 人工智能三大基石 11
1.3.2 人工智能基本概念 15
1.3.3 人工智能六大能力 20
1.4 人工智能常见应用场景 24
小结 29
问题思辨 30
课程思政主题 31
练习题 32
第2章 机器学习 34
2.1 引言 34
2.1.1 机器学习的定义和
经典问题 34
2.1.2 机器学习的演进过程 36
2.1.3 莫拉维克悖论 38
2.2 机器学习的数学解释 39
2.2.1 人工智能的数学本质 39
2.2.2 特征函数及其功能 42
2.2.3 决策函数及其作用 46
2.3 机器学习的实施过程 48
2.3.1 数据预处理 48
2.3.2 特征选择与提取 50
2.3.3 建立模型 52
2.3.4 优化模型 53
2.3.5 模型泛化能力 54
2.4 常用的机器学习方法 59
2.4.1 朴素贝叶斯分类器 59
2.4.2 线性回归 62
2.4.3 逻辑回归 63
2.4.4 决策树 64
2.4.5 支持向量机 67
2.4.6 K近邻算法 69
2.4.7 K均值聚类算法 70
小结 72
问题思辨 72
课程思政主题 73
练习题 74
第3章 神经网络和深度学习 77
3.1 引言 77
3.2 感知器与多层感知器 78
3.2.1 感知器 78
3.2.2 多层感知器 80
3.3 深度神经网络 83
3.3.1 为什么加深网络层次 83
3.3.2 深度神经网络结构 84
3.4 深度神经网络的核心问题 87
3.4.1 网络层次的加深 87
3.4.2 梯度消失和梯度爆炸 88
3.4.3 过拟合 89
3.5 深度神经网络的经典模型 90
3.6 卷积神经网络 93
3.6.1 卷积运算 94
3.6.2 卷积运算中的填充与步幅 96
3.6.3 激活函数、池化层和
全连接层 97
3.6.4 两种常见的卷积神经网络 100
3.7 深度神经网络的应用 101
3.7.1 ImageNet大规模视觉识别
挑战赛 101
3.7.2 深度神经网络的其他应用 102
小结 104
问题思辨 104
课程思政主题 105
练习题 106
第4章 计算机视觉 109
4.1 引言 109
4.2 图像处理与分析 109
4.2.1 图像的表示 109
4.2.2 图像的预处理 110
4.2.3 图像的特征提取 111
4.3 基础视觉任务 112
4.3.1 图像分类 112
4.3.2 目标检测 114
4.3.3 图像分割 114
4.4 计算机视觉的应用 115
4.4.1 人脸识别 115
4.4.2 无人驾驶 117
4.4.3 三维重建 118
小结 119
问题思辨 119
课程思政主题 119
练习题 120
第5章 自然语言处理 122
5.1 引言 122
5.2 文本分析基础 123
5.2.1 Token技术 123
5.2.2 词嵌入技术 124
5.2.3 文本相似度 128
5.3 文本处理常见任务 131
5.3.1 分词和词性标注 131
5.3.2 指代消解 133
5.3.3 关键词提取和生成 133
5.3.4 文本摘要 134
5.3.5 文本分类 135
小结 136
问题思辨 136
课程思政主题 137
练习题 138
第6章 智能语音技术 139
6.1 引言 139
6.2 智能语音技术的概念 140
6.2.1 语音识别 140
6.2.2 声纹识别 141
6.2.3 语音合成 142
6.2.4 声学事件检测 143
6.3 智能语音技术的工作原理 143
6.4 智能语音技术的应用场景 145
小结 146
问题思辨 147
课程思政主题 147
练习题 148
第7章 大模型技术 149
7.1 大模型技术概述 149
7.1.1 大模型的基本概念 149
7.1.2 大模型的发展历程 150
7.1.3 大语言模型的基本原理 153
7.1.4 人工智能与大模型的关系 153
7.2 大模型产品 154
7.2.1 国外大模型产品 154
7.2.2 国内大模型产品 157
7.3 大模型的特点与分类 161
7.3.1 大模型的特点 161
7.3.2 大模型按技术领域分类 162
7.3.3 大模型按应用领域分类 163
7.4 大语言模型的幻觉现象和
解决方案 163
7.4.1 大语言模型的幻觉现象 163
7.4.2 幻觉解决方案——RAG 164
7.5 大模型提示词撰写技巧 166
7.5.1 提示词的基础概念 166
7.5.2 提示词的设计原则 167
7.5.3 提示词的撰写技巧 167
7.6 智能体Agent 171
7.7 大模型的本地化部署 174
7.7.1 为什么需要本地部署
大模型 174
7.7.2 在本地计算机部署
DeepSeek-R1 175
小结 182
问题思辨 183
课程思政主题 184
练习题 184
第8章 人工智能伦理 187
8.1 人工智能伦理的重要性 187
8.2 人工智能伦理的定义和
内涵 187
8.3 人工智能技术面临的
伦理挑战 188
8.4 人工智能伦理的未来展望 191
小结 192
问题思辨 193
课程思政主题 193
练习题 194
第9章 具身机器人 196
9.1 概念与特征 196
9.1.1 什么是具身机器人 196
9.1.2 具身机器人的核心特征 197
9.2 具身机器人的发展历程 198
9.2.1 萌芽探索阶段(20世纪70年代
—20世纪90年代) 198
9.2.2 集成发展阶段(21世纪初—
2010) 199
9.2.3 高动态发展阶段(2010—
2022) 200
9.2.4 智能化发展阶段(2022年
至今) 201
9.3 具身机器人的技术构成 201
9.3.1 硬件载体:支撑交互的
“物理躯体” 202
9.3.2 感知系统:“认识世界”的
多模态触角 203
9.3.3 决策系统:具身机器人的
“智能大脑” 204
9.3.4 行动控制系统:“执行动作”的
精准保障 204
9.4 具身机器人的典型应用场景 205
9.4.1 工业领域:从替代人力到
人机协同 205
9.4.2 家庭与服务领域:从工具到
伙伴 207
9.4.3 医疗健康领域:从辅助到
精准 208
9.4.4 特殊场景:突破人类能力
边界 209
9.5 挑战与展望 210
9.5.1 当前面临的核心挑战 210
9.5.2 未来发展展望 211
小结 212
问题思辨 213
课程思政主题 214
练习题 214
第10章 智能办公 216
10.1 智能办公概述 216
10.1.1 文档处理 216
10.1.2 数据分析 217
10.1.3 演示设计 217
10.2 AI写作助手 218
10.2.1 帮我写 218
10.2.2 帮我改 222
10.2.3 伴写 223
10.3 AI设计助手 225
10.3.1 AI排版 225
10.3.2 AI条件格式 228
10.3.3 AI生成PPT 229
10.4 AI阅读助手 233
10.4.1 全文总结 233
10.4.2 文档问答 234
10.4.3 划词解释、划词翻译 235
10.5 AI数据助手 237
10.5.1 AI写公式 237
10.5.2 AI数据分析 239
小结 241
练习题