(1)故事化讲解:以故事为线索,跟主角一起轻松掌握机器学习精髓。
(2)阶梯式学习:从传统机器学习到Transformer架构,助力稳步掌握关键知识与技能。
(3)场景化教学:紧密贴合实际,聚焦生活案例,让算法原理在真实场景中落地。
(4)智能体开发指南:教你运用现有工具创建智能体,快速搭建个性化AI智能体。
前言开始旅程
首先,感谢大家翻开本书。本书中,我们将会跟着主人公大学生村官小 L开启一次有趣的旅程。在本次的旅程中,小 L 将使用各种人工智能技术,包括经典的机器学习、深度学习、生成式模型、多模态模型等,帮助他所任职的地区完成一个又一个任务。跟随他的脚步,我们会学习到什么是机器学习、神经网络与卷积神经网络、变分自编码器、自回归模型、标准化流模型、Transformer 模型,以及如何用 Transformers 库调用不同的预训练模型等。
需要说明的是,本书的实操部分使用的是 Python 语言,因此需要读者有一定的 Python 编码能力。考虑到不是所有的读者都有图形处理器(GPU)算力环境,这里我们给大家推荐两个可以在云端进行实验的平台,分别是 Google 的 Colab 和数据科学竞赛平台 Kaggle。截至 2025 年 1 月,这两个平台都给用户提供了一定限额的免费 GPU 算力,可以让读者以最小的成本开始进行实验。
接下来,我们看一下如何使用这两个平台。
Colab
登录 Colab 平台,在菜单栏中选择文件菜单中的在云端硬盘中新建笔记本命令,如图 1 所示。
图 1 使用 Colab 新建笔记本
然后,就可以在新建的空白笔记本的单元格中运行代码了,如图 2 所示。
图 2 在 Colab 的笔记本中运行代码
在 Colab 的笔记本中编写和运行代码的方式与在本地计算机的 Jupyter Notebook中操作大体是一样的。如果我们要把本地的数据上传到 Colab 上用于模型训练,只要单击左边菜单栏中的文件夹图标,并在展开的菜单中单击上传到会话存储空间按钮即可,如图 3 所示。
图 3 上传本地数据到 Colab
我们在自己的计算机上写好的代码,也可以上传到 Colab 平台,使用免费的 GPU 来进行模型训练。要上传编辑好的笔记本文件,只要在 Colab 的欢迎界面中,选择文件菜单中的上传笔记本
命令即可,如图 4 所示。
图 4 上传编写好的笔记本文件到 Colab
在本书附赠的资源包中,如果看到 .ipynb 文件标有run on colab,就说明这个文件可以上传到 Colab 中进行实验。
Kaggle
登录 Kaggle 平台之后,就可以单击左边菜单栏中的Create按钮新建一个笔记本文件,如图5 所示。
图 5 在 Kaggle 平台新建笔记本文件
单击Create按钮后,选择New Notebook命令,就可以看到我们新创建的笔记本文件。这个时候,我们仍然可以上传自己本地的笔记本文件。只需要选择File菜单中的ImportNotebook命令就可以了,如图 6 所示。
同样地,大家如果下载了随书赠送的资源包,看到笔记本文件标有run on kaggle的字样,就说明这个文件可以在 Kaggle 平台中运行。当然,Kaggle 也支持我们上传自己的数据集和模型,只要在右侧菜单栏中单击Upload按钮就可以,如图 7 所示。
图 6 将本地的笔记本文件导入 Kaggle 中图 7 在 Kaggle 平台上传数据集或模型
除了以上基本操作,Colab 和 Kaggle 还有很多实用的功能,如选择不同的 GPU 加速等,这些留给读者朋友们自己探索。
还要跟大家强调一下,本书中涉及的人物、地名、事件以及用于说明原理的数据,均为虚构,仅仅是为了演示技术原理,与现实世界没有任何关联,请大家一定不要对号入座。
注意:如果读者在访问 Colab 时遇到障碍,请向你所在的学校或单位申请专用网络,确保自己在遵守相关法律法规的前提下进行实验。
到这里,相信大家已经做好了启程的准备,让我们出发吧!
温馨提示:
本书赠送资源已上传至百度网盘,供读者下载。读者可用微信扫一扫功能扫描封底二维码,关注微信公众号,输入本书 77 页资源下载码,根据提示获取下载地址及密码。
段小手,曾供职于百度、敦煌网、慧聪网、方正集团等知名IT企业。有多年的科技项目管理及开发经验。2019年至今,与云南省公安厅合作数据挖掘项目,使用机器学习技术协助云南警方打击违法犯罪活动。
其负责的项目曾获得国家发改委电子商务示范项目中关村现代服务业试点项目北京市信息化基础设施提升专项北京市外贸公共服务平台等多项政策支持。著有《深度学习与大模型基础》《巧用AI大模型轻松学会Python金融数据分析》等著作,在与云南省公安厅合作期间,使用机器学习算法有效将某类案件发案率大幅降低。