本书介绍人工智能的理论、方法、技术及其应用,除了讨论那些仍然有用的和有效的基本原理和方法之外,着重阐述一些新的和正在研究的人工智能方法与技术。此外,本书使用比较多的篇幅论述了人工智能的应用,包括新增的预训练模型、基于LLM的Agent等内容。本书包括下列内容:①人工智能的起源与发展,人工智能的研究与应用领域;②知识表示与推理、不确定推理、因果推理等;③盲目搜索、启发式搜索、博弈搜索、贪婪局部搜索、模拟退火算法、遗传算法等搜索技术;④Agent、基于大模型的Agent、卷积神经网络、循环神经网络、QLearning算法、深度强化学习等人工智能技术和方法;⑤智能规划、自然语言处理、信息搜索、语言翻译、语音识别、阅读理解、ChatGPT、群体智能、机器人等应用;⑥人工智能伦理与安全、人工智能治理。本书适用于高等学校计算机类专业本科生和非计算机专业研究生人工智能课程教学,也可作为科技人员深入学习人工智能的参考书。
本书第3版被评为“首届教材二等奖”,首批入选“十二五”普通高等教育本科规划教材。本书是在第3版基础上修订后的新版。本书立足时代背景,力求形成“以不变的基本理论与方法为主体,充分反映人工智能技术发展水平,以培养学生具备继续学习能力为目标”的教学思路,使学生学习和掌握人工智能核心基础知识,筑牢基础。本书介绍人工智能的理论、方法、技术及其应用,除了讨论仍然有用的和有效的基本原理与方法之外,着重阐述新的和正在研究的人工智能方法与技术,特别是近期发展起来的方法与技术。此外,用比较多的篇幅论述人工智能的应用,包括人工智能新的应用研究。本书注重基础,知识体系完整,知识点前沿,强化实践。内容的可读性好,语言简练,深入浅出,通俗易懂。力图体现三方面特点:一是“基础性”;二是“实践性”;三是“前瞻性”。本书是作者多年来在高等学校一线从事人工智能课程建设和教学实践的结晶。适用于国内大多数普通高校计算机及相关专业,以及不同教学条件学校的人工智能课程教学的需要。理论授课注重案例式教学和启发式教学,以便为实践做好铺垫。上一版附录给出的28个人工智能课程大作业,本书以案例及思考题的方式给出。本书附录介绍了人工智能编程语言Python和手写体识别案例。提供了丰富的导学资源(电子书、慕课视频、案例程序等),设置了具有挑战性的人工智能实验,并对实验提出了较高的自主完成要求。
前言
我和本教材主编贲可荣教授与人工智能的缘分有一段类似的经历。我们都是本科学习数学,硕士期间学习数理逻辑和计算机科学理论。攻读博士学位期间,又共同师从陈火旺院士,开展人工智能与软件工程交叉研究。贲可荣教授博士论文研究采用自动推理技术证明程序正确性,属于AI4SE,我的博士论文研究面向智能体的人工智能程序设计语言,属于SE4AI,我们在人工智能方面的“童子功”都属于符号主义学派的范畴。虽然在我们研究生期间,Hopfield网络模型的出现激起了连接主义人工智能的一朵浪花,但符号主义人工智能的主导地位不可撼动,我和贲可荣教授对自己能够在当时的人工智能主航道上学习和工作倍感荣幸。然而,很快我和贲可荣教授共同经历了之后人工智能由热转冷的全过程。后来,我们又作为研究生导师,共同见证了因深度学习带来的连接主义人工智能的再次兴起,符号主义学派似乎被冷落了,大语言模型热潮又一次唤起人们对通用人工智能的憧憬。
学派分野带来的学科区分在人工智能领域十分明显,导致三种人工智能学派你方唱罢我登场。可以预见,自主机器人和具身智能将带来行为主义人工智能的大发展。实现具身智能的关键在于具身智能体对环境的感知、互动、适应、决策和行动,需要有效连接思考、感知与行动三大智能空间,从而推动全自主无人系统的具身智能技术发展。未来人工智能发展需要三种人工智能学派的大合唱,取长补短,走向融合和集成,共同为人工智能的发展做出贡献。为此亟须人工智能学科交叉问题,以及复合型人工智能人才培养问题,这里既包括融合三种人工智能学派的知识体系,也包括人工智能对人类未来发展的新挑战新认知。令人敬佩的是,贲可荣教授始终保持着学生时代对人工智能研究的热情投入,以及对人工智能发展的敏锐洞察。这种投入和洞察反映在了他主编的这本《人工智能》教材持续迭代升级之中。本书具有如下特点。
一是以人为本,紧跟时代步伐。站在立德树人的角度,融入楷模引领、典型应用、大国工匠、使命担当、批判思维、敢为人先、风险管控等德育元素,结合人工智能学科特点,因势利导,培养学生高尚的道德情操。
二是以融为先,系统设计内容。站在学科交叉的角度,阐述智能感知、智能推理、智能决策和智能行动所涉及的基本概念、基础理论、基本方法,内容涵盖了ACM和IEEECS制定的新版人工智能知识点。体系严谨,选材精练,讲解翔实。
三是以实为要,直面问题建模。站在提升能力的角度,通过每一章节“湿漉漉”的案例让学习者找到感觉,参与其中,提高解决复杂问题的实践能力,每章后的思考题也为学生课后实践提供了拓展空间。
本教材、的前序版本先后评为普通高等学校“十一五”规划教材、“十二五”普通高等教育本科规划教材、首届教材二等奖、“十四五”普通高等教育本科规划教材。我希望本教材能够为人工智能课程教学提供范本,更希望在智能时代到来之时,有更多的相关专业本科生、相关学科研究生、人工智能爱好者能够从中受益,成为新时代人工智能大合唱中不可或缺的、生动和谐的声部。
王怀民
国防科技大学教授
中国科学院院士人工智能(第4版)前言人工智能发展历程可以从两个角度来分析。优质,整个人工智能的发展可以看成怎么解决搜索问题的过程,开始是利用搜索,而后希望采取高级搜索来寻找精确解。因为我们面临的问题会越来越复杂,寻找精确解不太可行,只好采取近似搜索的方法。所以使用优化算法、随机算法,以及更为广泛的学习方法。第二,从如何处理知识表示的角度看待人工智能,这触及人工智能的本质和技术难点。基于规则的学习其目的是把人类对事物的理解形式化,从而希望机器能够有效和人类认知对齐以达到智能的目的。迄今为止,这条路径成效有限,转而采取较为可行的基于数据统计的方法,即用统计数据来代表知识表示,然后在数据上运行算法。而深度神经网络提供了一个统计数据的进一步表示,使得系统可以更为有效地进行端对端学习。
思路的改变对人工智能的发展起到了关键作用。例如,模式识别、自然语言处理、语音识别、视觉处理等都从统计方法上获得了巨大的成功。此外,从统计学的数据建模到计算机的算法建模,人工智能则从机器学习中看到了新的路径。
根据人工智能的发展历史,人工智能主要是要处理三个任务: ①识别,可以把识别看作搜索的一个高级形态; ②决策; ③生成。而这三个任务刚好又和机器学习的三大学习范式——有监督学习、强化学习和无监督学习相一致。
1. 感知智能、认知智能和决策智能
按照问题智能处理的水平可将智能分为感知智能、认知智能和决策智能。
感知智能的核心在于模拟人的视觉、听觉和触觉等感知能力,目前用于完成人可以简单完成、重复度较高的工作,如人脸识别、语音识别等。其核心业务目标是提高效率,降低成本。在智能能力方面,主要集中在模式识别层面,重在提升视觉、语音等场景中的效率,不具备理解和推理能力。
认知智能是指系统能推理、会理解,需要具有对信息的认知、理解、推理、存储和转换的能力,即与思维能力密切相关。推理是从已有的知识得出新的知识的思维形式,在推理中可以清楚地看到人类思维的创造性。
决策智能意味着能思考、会决策,在一种不确定的环境中做出合适的行动,或者做出合适的选择和决定的能力。智能应具备对不确定性环境的探索和发现。这里的环境,即指我们试图用智能科学更好地了解、探索、建模和驾驭的物理世界、人类社会等系统。决策智能主要基于对不确定环境的探索,因此需要获取环境信息和自身的状态,从而进行自主决策,并使得由环境反馈的收益最大。
2. 大语言模型
大语言模型主要利用语言数据,而现在则希望使用语言、图像和音频等融合的多模态异构数据。考虑到计算机视觉、自然语言处理和语音识别等也是由机器学习发展起来的,所以,现代人工智能可以理解成通过机器学习及由其驱动而发展起来的计算机视觉、自然语言处理和语音识别等技术来实现多模态数据的现实交互。
大语言模型是指具备数十亿乃至万亿参数,通过高达万亿词元数量的文本语料训练出来的深度神经网络模型。大语言模型在语言理解和生成上取得了出色的成绩,其发展历史可以追溯到2013年的Word2Vec,但直到近年诸如GPT3、LaMDA、PaLM、PaLM2、LLaMA、LLaMA2、CodeLLaMA、WizardMath 等大模型的出现,才使得大语言模型的应用得到普及。广义的大模型则包含语言、声音、视觉等多模态任务,其典型代表是Flamingo和GPT4。大语言模型能够发展到如此高度,得益于充分利用注意力机制进行序列建模的变换器网络(Transformer)架构以及稀疏变换器网络这样的变种。最近,变换器网络架构最终统一了语言、视觉、声音和多模态的建模。大语言模型支持通过提示工程实现应用于特定任务的情境学习,展示了强大的通用能力,并预示了通用人工智能曙光初现。此外,知识更新、事实凭据、复杂推理等对智能系统至关重要,知识图谱在其中发挥着关键作用。
3. 智能系统
智能系统是一类能够模拟人类智能,具有感知、理解、学习、推理、决策和交互等能力的计算机系统。智能系统能够根据环境和目标自主或半自主地进行决策和行动,能够处理复杂、不确定和动态的任务。智能系统的核心目的是利用人工智能方法和技术解决实际问题,其发展过程与人工智能相伴相生。
智能系统具备根据用户需求动态地调整决策和行动的自适应性,
贲可荣,海军工程大学电子工程学院教授、博士生导师,长期从事人工智能、软件工程等方面的教学科研工作。主编《人工智能》入选“十二五”普通高等教育本科规划教材,评为首届教材建设奖教材二等奖。指导毕业58名硕士研究生和13名博士研究生。发表学术论文180余篇,出版编著译著20余部。担任大学人工智能组组长、大学MOOC组组长、大学研究生教学督导。CCF理论计算机科学专委副主任、软件工程专委委员、CCF杰出会员。《计算机科学与探索》《计算机工程与科学》等编委。《海军新军事变革丛书》编委会副主任、《人工智能应用丛书》编委会副主任。担任军委装发国家安全重大基础研究项目组,军委装发人工智能装备应用基础技术专业组成员,军委装发海军人工智能装备应用专业组副组长。被评为骨干教师、首届湖北省研究生导师、海军名师工作室领衔名师、第三届大学教学名师,获院校育才奖金奖。张彦铎,湖北文理学院党委副书记、院长,博士生导师,教授,国务院政府特殊津贴获得者,湖北省有突出贡献的中青年,国家一流本科专业建设点“智能科学与技术”专业负责人,湖北教学团队“新一代人工智能新工科教学团队”负责人。长期从事智能控制理论研究与智能系统研发等工作。创建了湖北省优质支机器人足球队,连续获得14项冠军。主编教材《人工智能(第3版)》获得首届教材建设奖教材二等奖,获得第九届湖北省高等学校教学成果一等奖1项。卢涛,武汉工程大学计算机科学与工程学院人工智能学院教授,博士生导师。长期从事模式识别、智能机器人和机器视觉等方面的科研与教学工作。发表学术80余篇,出版专著2部,获得第九届湖北省教学成果一等奖1项,二等奖1项。张献,海军工程大学电子工程学院讲师。从事军事智能、软件质量等方面教学科研工作,主讲人工智能、人工智能应用实践、神经网络与深度学习等课程。先后参与国家自然科学、国防973、海军重大专项等科研项目10余项,发表SCI/EI等学术论文20余篇;参与编写《人工智能(第3版)》等教材4部,译著1部。指导学生获学科竞赛特等奖1项、一等奖1项等。先后获得和全军征文评比一等奖各1项、教学案例比赛二等奖2项,CCF武汉地区首届“青年教师学术风采展示论坛”二等奖1项,荣获个人三等功2次、“四有”个人1次,入选学校人才托举工程。
目录
第1章绪论1
1.1人工智能的定义与概况1
1.2人类智能与人工智能5
1.2.1智能信息处理系统的假设6
1.2.2人类智能的计算机模拟7
1.2.3弱人工智能与通用人工智能9
1.3人工智能各学派的认知观10
1.4人工智能的研究与应用领域12
1.4.1智能感知12
1.4.2智能推理15
1.4.3智能决策18
1.4.4智能行动21
1.5人工智能发展展望26
1.5.1新一轮人工智能的发展特征26
1.5.2未来30年的人工智能问题27
1.5.3新一代人工智能发展规划31
习题32
第2章知识表示和推理34
2.1概述34
2.1.1知识和知识表示34
2.1.2知识策略智能35
2.1.3人工智能对知识表示方法的要求36
2.1.4知识的分类37
2.1.5知识表示语言问题37
2.1.6现代逻辑学的基本研究方法38
2.2命题逻辑40
2.2.1语法40
2.2.2语义41
2.2.3命题演算形式系统42人工智能(第4版)目录2.3谓词逻辑44
2.3.1语法44
2.3.2语义45
2.3.3谓词逻辑形式系统48
2.3.4一阶谓词逻辑的应用50
2.4归结推理50
2.4.1命题演算中的归结推理50
2.4.2谓词演算中的归结推理53
2.4.3谓词演算归结反演的合理性和完备性58
2.4.4案例: 一个基于逻辑的财务顾问61
2.5因果推理61
2.5.1概述62
2.5.2因果推断的三个渐进层级63
2.5.3推断引擎的结构64
2.5.4因果增强的应用前景64
2.6产生式系统65
2.6.1产生式系统的表示65
2.6.2案例: 九宫图游戏66
2.6.3案例: 传教士和野人问题67
2.6.4产生式系统的控制策略68
2.7语义网络69
2.7.1基本命题的语义网络表示70
2.7.2连接词在语义网络中的表示71
2.7.3语义网络的推理73
2.7.4语义网络表示的特点75
2.8框架75
2.8.1框架的构成75
2.8.2框架系统的推理76
2.8.3框架表示的特点77
2.9知识图谱77
2.9.1知识图谱的定义与发展77
2.9.2知识图谱体系架构79
2.9.3知识图谱方法与技术79
2.10知识图谱应用81
2.10.1应用技术概述81
2.10.2百度知识图谱81
2.10.3在互联网金融中的应用82
2.11本体、语义Web与常识83
小结85
习题85
第3章搜索技术94
3.1概述94
3.2盲目搜索算法97
3.2.1概述97
3.2.2盲目搜索方法97
3.2.3盲目搜索的局限性99
3.3启发式搜索算法99
3.3.1启发性信息和评估函数100
3.3.2优先搜索100
3.3.3A算法和A算法102
3.3.4迭代加深A算法104
3.4ANDOR图启发式搜索105
3.4.1问题归纳的定义105
3.4.2问题的ANDOR图表示105
3.4.3AO算法107
3.5博弈搜索109
3.5.1极大极小过程111
3.5.2αβ过程112
3.5.3效用值估计方法114
3.6案例分析115
3.6.1八皇后问题115
3.6.2洞穴探宝115
3.6.3五子棋116
小结119
习题119
第4章高级搜索123
4.1爬山法搜索123
4.2模拟退火搜索125
4.2.1算法灵感来源126
4.2.2模拟退火算法127
4.2.3关键参数和操作设计128
4.3遗传算法130
4.3.1模拟自然选择131
4.3.2遗传算法基本操作132
4.4案例分析136
4.4.1爬山算法求解旅行商问题136
4.4.2模拟退火算法求解旅行商问题136
4.4.3遗传算法求解旅行商问题136
小结136
习题137
第5章不确定知识表示和推理140
5.1概述140
5.1.1什么是不确定性推理141
5.1.2不确定性推理要解决的基本问题141
5.1.3不确定性推理方法分类143
5.2非单调逻辑144
5.2.1非单调逻辑的产生144
5.2.2非单调规则145
5.2.3案例: 有经纪人的交易146
5.3主观Bayes方法147
5.3.1全概率公式和Bayes公式147
5.3.2主观Bayes方法148
5.4确定性理论153
5.4.1建造医学系统时的问题154
5.4.2CF模型155
5.4.3案例: 帆船分类系统158
5.5证据理论161
5.5.1假设的不确定性161
5.5.2证据的不确定性与证据组合163
5.5.3规则的不确定性164
5.5.4不确定性的传递与组合164
5.5.5证据理论案例165
5.6模糊逻辑和模糊推理167
5.6.1模糊集合及其运算167
5.6.2模糊关系168
5.6.3语言变量169
5.6.4模糊逻辑和模糊推理169
5.6.5案例: 抵押申请评估决策支持系统173
小结173
习题174
第6章机器学习178
6.1机器学习概述178
6.1.1机器学习的定义和发展史179
6.1.2机器学习的基本要素179
6.1.3机器学习的分类184
6.1.4机器学习系统的基本结构186
6.2基于统计的机器学习190
6.2.1回归学习190
6.2.2分类学习191
6.2.3聚类学习197
6.2.4降维学习198
6.2.5案例: 决策树的鸢尾花分类应用199
6.3神经网络与深度学习201
6.3.1神经网络概述201
6.3.2前馈神经网络203
6.3.3卷积神经网络210
6.3.4循环神经网络216
6.3.5注意力机制网络222
6.3.6案例: 基于反向传播网络拟合曲线227
6.3.7案例: 基于卷积神经网络的图像风格迁移227
6.4基于环境交互的强化学习230
6.4.1强化学习概述231
6.4.2马尔可夫决策过程232
6.4.3策略的求解235
6.4.4QLearning算法236
6.4.5深度强化学习238
6.4.6案例: 使用QLearning算法进行机器人路径规划240
小结241
习题243
第7章自然语言处理技术249
7.1自然语言理解的一般问题249
7.1.1自然语言理解的概念及意义249
7.1.2自然语言理解研究的发展250
7.1.3自然语言理解的层次250
7.1.4词法分析252
7.1.5案例: 单词音节划分253
7.1.6句法分析253
7.1.7语义分析256
7.2大规模真实文本的处理257
7.2.1语料库语言学及其特点257
7.2.2统计学方法的应用及所面临的问题258
7.2.3汉语语料库加工的基本方法259
7.2.4语义资源建设259
7.3信息搜索260
7.3.1搜索引擎的输入方式260
7.3.2搜索结果的输出呈现261
7.3.3搜索引擎的工作原理262
7.3.4智能搜索引擎技术264
7.3.5搜索引擎的发展趋势264
7.4自然语言处理中的预训练模型266
7.4.1语言表示学习266
7.4.2上下文编码器267
7.4.3预训练任务及分类268
7.4.4大型语言模型270
7.5机器翻译272
7.5.1机器翻译的基本模式和方法272
7.5.2统计机器翻译275
7.5.3利用深度学习改进统计机器翻译276
7.5.4端到端神经机器翻译277
7.6语音识别279
7.6.1智能语音技术概述279
7.6.2组成单词读音的基本单元280
7.6.3信号处理281
7.6.4单个单词的识别283
7.6.5隐马尔可夫模型283
7.6.6深度学习在语音情感识别中的应用285
7.7机器阅读理解285
7.7.1机器阅读理解任务的类型和评价指标285
7.7.2机器阅读理解的深度学习建模286
7.7.3对话理解与情感对话288
7.7.4面向推理的阅读理解290
7.7.5常识问答291
7.7.6开放域问答294
7.8聊天机器人与ChatGPT295
7.8.1聊天机器人应用场景295
7.8.2聊天机器人系统的组成结构及关键技术296
7.8.3ChatGPT297
小结298
习题300
第8章Agent302
8.1概述302
8.2Agent及其结构304
8.2.1Agent的定义304
8.2.2Agent要素及特性304
8.2.3Agent的结构特点306
8.2.4Agent的结构分类306
8.2.5Agent应用案例309
8.3Agent通信310
8.3.1通信方式310
8.3.2Agent通信语言312
8.4协调与协作315
8.4.1合同网316
8.4.2协作规划317
8.5移动Agent320
8.5.1定义和系统组成320
8.5.2实现技术321
8.5.3移动Agent系统321
8.6多Agent系统开发框架JADE322
8.6.1程序模型324
8.6.2可重用开发包324
8.6.3开发和运行的支持工具327
8.7案例: 火星探矿机器人327
8.7.1需求分析328
8.7.2设计与实现329
8.8基于LLM的Agent331
8.8.1基于LLM的Agent通用概念框架332
8.8.2案例: 自生成兵棋AI333
8.8.3基于LLM的Agent特征及发展趋势333
小结334
习题334
第9章智能规划337
9.1概述337
9.2状态空间搜索规划340
9.3偏序规划342
9.4命题逻辑规划345
9.5分层任务网络规划348
9.6非确定性规划350
9.7时态规划351
9.8多Agent规划354
9.9案例分析357
9.9.1规划问题的建模与规划系统的求解过程358
9.9.2Shakey世界358
9.9.3智能规划系统OPLAN、Graphplan、SciBox359
小结360
习题361
第10章机器人学363
10.1机器人概述363
10.1.1机器人的分类364
10.1.2机器人的特性365
10.1.3机器人学的研究领域366
10.2机器人系统367
10.2.1机器人系统的组成367
10.2.2机器人的工作空间368
10.2.3机器人的性能指标370
10.3机器人的编程模式与语言371
10.4机器人应用与展望372
10.4.1机器人应用372
10.4.2机器人发展展望376
10.5机器人运动控制实例分析380
10.5.1仿真平台使用介绍380
10.5.2仿真平台与策略程序的关系383
10.5.3策略程序的结构383
10.5.4动作函数及说明383
10.5.5策略384
10.5.6各种定位球状态的判断方法387
10.5.7比赛规则388
小结389
习题390
第11章互联网智能391
11.1概述391
11.2语义网与本体393
11.2.1语义网的层次模型393
11.2.2本体的基本概念394
11.2.3本体描述语言395
11.2.4本体知识管理框架396
11.2.5本体知识管理系统Protg396
11.2.6本体知识管理系统KAON397
11.3Web技术与Web挖掘398
11.3.1Web技术399
11.3.2Web挖掘402
11.4群体智能404
11.4.1社群智能404
11.4.2群体智能互动感知405
11.4.3互联网大脑(云脑)407
11.4.4智联网409
11.5案例410
11.5.1智能网联汽车410
11.5.2城市计算412
小结413
习题414
第12章人工智能伦理与安全417
12.1人工智能的风险与挑战417
12.2人工智能伦理420
12.2.1人工智能伦理概念420
12.2.2人工智能伦理问题421
12.3人工智能安全426
12.3.1人工智能安全概念426
12.3.2人工智能安全问题427
12.3.3人工智能安全属性430
12.4人工智能治理431
12.4.1治理原则与规范432
12.4.2治理体系与政策433
12.4.3治理技术与工具