《AI视频生成:原理、工具与应用实践》结合36个典型案例,从AI视频生成的发展历史、现状、基本原理、平台、工具、模型、基础操作、场景应用和综合实战等几个方面详细介绍其核心知识、操作技巧与应用实战等。本书基于当前的主流开源模型、工具与平台,重点对AI视频的生成、换脸、转绘、重绘、编辑和控制等操作技巧与场景应用进行详细介绍,并详细展示AI动画和AI文旅视频两个综合项目案例的实现过程。AI视频生成:原理、工具与应用实践提供配套教学视频、案例素材、提示词文件、工作流文件、教学PPT和软件安装文件等超值配套资源,帮助读者高效、直观地学习。
AI视频生成:原理、工具与应用实践共19章,分为6篇。第1篇 AI视频概述,介绍AI视频的发展历史、对社会的冲击和未来展望等;第2篇AI视频原理,介绍AI视频生成模型、扩散模型和混合模型等相关知识;第3篇AI视频平台、工具与模型,介绍在线AI视频平台与常用工具,以及开源AI视频模型和多模态大模型等相关知识;第4篇AI视频平台、工具与模型的使用,介绍在线视频平台、开源视频模型和ComfyUI工作流的具体操作等;第5篇AI视频场景应用实战,通过一系列案例展示让图片动起来、AI视频换脸、AI视频转绘、AI视频重绘和AI视频编辑等常用技巧;第6篇AI视频项目案例实战,综合使用前面章节介绍的平台、工具、模型与技巧等,完成AI动画制作复现《门后的世界》、AI文旅视频制作武汉宣传片两个综合项目案例。
AI视频生成:原理、工具与应用实践内容丰富,讲解深入浅出,案例典型,适合自媒体创作、视频创作、影视创作和动漫创作等相关领域的从业者与爱好者阅读,也适合作为高等院校和培训机构影视、动画和动漫等专业的教材或培训用书。
AIGC(人工智能生成内容)的发展如火如荼,正在快速席卷各行各业。各种新模型层出不穷,基于新模型的新应用场景不断涌现。AI 视频生成作为AIGC 的重要应用场景正在深刻地影响着人们的日常生活。从自媒体创作到视频制作,从影视创作到动画与动漫创作等,AI 视频生成正在不断地重塑相关行业。可以说,AI 视频生成因其高效率、低成本、低门槛等特点已经成为自媒体从业者、视频创作者、影视从业者、动画与动漫创作者等必须掌握的基本技能,也正在成为大中专院校影视动画与数字媒体等相关专业的必修课。
为了帮助AIGC 从业者全面、系统、深入地学习绘画、语音和视频等生成与处理技术,可学AI团队于2023 年便开始组织人员筹划相关图书的写作和出版事宜,并于2024 年先后出版了《AI 绘画大师之道:轻松入门》和《AI 绘画全场景案例应用与实践》。这两部图书上市后均获得了广大读者的好评。为了帮助读者更加系统地学习AIGC 相关技术,可学AI团队经过调研,计划进一步推出《AIGC 绘画与音视频生成:ComfyUI 工作流应用与实践》《AI 语音与音乐生成:原理、工具与应用实践》《AI 视频生成:原理、工具与应用实践》《AI 绘画模型微调:原理、工具与应用实践》等图书,这些图书组成AIGC 技术探索丛书供读者阅读。
本书为AIGC 技术探索丛书中的《AI 视频生成:原理、工具与应用实践》分册。本书结合36 个应用案例详细介绍AI 视频生成的基本原理、主流平台与工具、开源模型、基础操作、场景应用与综合项目实战等。本书采用全彩印刷,效果精美。书中对一些重点中英文提示词用蓝色突出显示,对一些重点命令用紫色显示,以提高阅读体验。通过阅读本书,读者可以全面、系统、深入地掌握AI 视频生成涉及的核心技术、工具、模型、技巧与场景应用等。
本书特色
? 轻松上手:通过图书 教学视频 拓展学习 答疑解惑的立体教学方式,带领读者轻松上手。
? 内容全面:涵盖AI 视频生成的发展历史、基本原理、工具与平台、开源模型、基础操作、场景应用和项目实战等,涉及25 个AI 视频类在线平台与工具、27 款开源AI 视频模型、20 种常用ComfyUI 工作流,带领读者一站式掌握AI 视频生成的核心知识与应用。
? 技术新颖:紧跟技术发展趋势,基于当前的主流工具、平台和模型进行讲解,以确FOREWORD保内容的时效性与准确性。
? 图文并茂:结合300 多幅图进行讲解,直观地展现AI 视频生成的原理与操作过程。
? 实践性强:详解36 个类型丰富、由易到难的经典应用案例,涵盖AI 视频生成的常见场景应用,帮助读者快速提高AI 视频生成的实际动手能力。
? 举一反三:针对同一功能或场景应用,提供多种实现思路,帮助读者融会贯通,从而达到举一反三的效果。
? 资源超值:提供大量的超值配套学习资源(见后文),帮助读者高效、直观地学习。
? 服务完善:提供QQ 书友群、电子邮箱、B 站和公众号等多种服务渠道,为读者的学习保驾护航。
本书内容
第1 篇 AI 视频概述
第1 章介绍AI 视频技术的发展历史与现状,让读者了解AI 视频的发展脉络。
第2 章介绍AI 视频快速发展带来的冲击,包括AI 视频电信诈骗、好莱坞演员罢工和AI 视频作品版权等相关内容,让读者了解相应的对策。
第3 章介绍人们如何适应AIGC 和AI 视频发展的未来。
第2 篇 AI 视频原理
第4 章介绍常见的AI 视频生成模型,包括变分自编码器、生成对抗网络、扩散模型和自回归模型。
第5 章介绍视频扩散模型的相关知识,包括其应用场景、基本框架、生成高清视频的技巧,以及如何保持视频时空一致性和基于多样性数据训练模型。
第6 章介绍流行的混合模型DiT 的相关知识以及文生视频模型Sora 和国产视频生成模型可灵AI 的相关知识。
第3 篇 AI 视频平台、工具与模型
第7 章介绍国内外25 款在线AI 视频平台与工具,包括腾讯智影、秒创、可灵AI、剪映、即梦AI、PixVerse、清影、Vidu、Runway、Pika、HeyGen、Akool、度加创作工具、快手云剪、剪辑魔法师、万彩AI、33 搜帧、Q.AI、Fliki 等。
第8 章介绍开源AI 视频模型,包括4 款通用类模型、4 款图片说话类模型、3 款动作引导类模型、3 款SD-WebUI 插件类模型和3 款类Sora 知名开源模型。
第9 章介绍几款多模态大模型,包括文心一言、通义千问和讯飞星火等。
第4 篇 AI 视频平台、工具与模型的使用
第10 章介绍在线视频平台Runway、Pika 和可灵AI 的使用方法。
第11 章介绍SVD、CogVideo、Animate Anyone 和Champ 等开源AI 视频模型的部署和使用方法。
第12 章介绍20 个ComfyUI 视频工作流的用法,包括4 个文生视频工作流、5 个图生视频工作流、2 个视频风格转绘工作流、5 个图片跳舞工作流及4 个其他创意应用工作流。
第5 篇 AI 视频场景应用实战
第13 ~ 17 章分别介绍让图片动起来、视频换脸、视频转绘、视频重绘和视频编辑5个AI 视频的常见场景应用。每个场景应用都通过多个具体案例展示其实现过程与效果,并进行总结和扩展。
第6 篇 AI 视频项目案例实战
第18 章从编写脚本、美术设计、分镜设计、AI 绘画出图、视频制作、添加声音和后期制作7 个方面展示AI 动画制作复现《门后的世界》项目案例的实现。
第19 章从编写脚本、美术设计、分镜设计、AI 绘画出图、视频制作、添加声音和后期制作7 个方面展示AI 文旅视频制作武汉宣传片项目案例的实现。
读者对象
本书读者对象如下:
? 自媒体从业人员;
? 视频创作人员;
? 影视创作人员;
? 数字人、直播从业者;
? 其他AI 视频技术爱好者;
? 高等院校影视动漫、数字媒体等专业的学生和教师;
? AI 视频培训机构的学员。
配套资源获取方式
本书赠送以下超值配套资源:
? 教学视频;
? 案例素材;
? 提示词文件;
? 视频类工作流文件;
? 教学PPT;
? 软件安装文件。
上述配套资源有两种获取方式:一是关注微信公众号方大卓越,回复数字51自动获取下载链接;二是在清华大学出版社网站(www.tup.com.cn)上搜索到本书,然后在本书页面上找到资源下载栏目,单击网络资源按钮进行下载。另外,读者也可以在B 站上查找UP 主可学AI,在线观看本书配套教学视频。
意见反馈
AI 视频正在持续高速发展中,其功能迭代日新月异。虽然本书在写作中已尽力保持内容的时效性与新颖性,但是鉴于技术的快速变化和作者认知的局限性,书中难免存在一些未尽完善之处或细微疏漏,敬请各位读者批评与指正,笔者会及时进行调整和修改,您的宝贵意见是我们不断进步的动力。读者可以通过本书QQ 书友群或电子邮箱联系我们,也可关注微信公众号可学AI,了解AIGC 的相关进展信息。读者也可关注微信公众号方大卓越,回复数字51自动获取QQ 书友群号等信息。
致谢
感谢夏小康、尹子成、白玉棋、张炯涛、朱美霞、秦天琪、王佑琳、肖越汉、张洋和王浩铭等在本书写作期间给予笔者团队的支持与帮助!
感谢欧振旭在本书出版过程中给予笔者的大力支持与帮助!
感谢清华大学出版社参与本书出版的所有人员!是你们一丝不苟的精神,才使本书得
以高质量出版。
袁朝辉