AI视频生成_袁朝辉、王双、刘思岑、许义鑫_9787302697251

《AI视频生成：原理、工具与应用实践》结合36个典型案例，从AI视频生成的发展历史、现状、基本原理、平台、工具、模型、基础操作、场景应用和综合实战等几个方面详细介绍其核心知识、操作技巧与应用实战等。本书基于当前的主流开源模型、工具与平台，重点对AI视频的生成、换脸、转绘、重绘、编辑和控制等操作技巧与场景应用进行详细介绍，并详细展示AI动画和AI文旅视频两个综合项目案例的实现过程。AI视频生成：原理、工具与应用实践提供配套教学视频、案例素材、提示词文件、工作流文件、教学PPT和软件安装文件等超值配套资源，帮助读者高效、直观地学习。
AI视频生成：原理、工具与应用实践共19章，分为6篇。第1篇 AI视频概述，介绍AI视频的发展历史、对社会的冲击和未来展望等；第2篇AI视频原理，介绍AI视频生成模型、扩散模型和混合模型等相关知识；第3篇AI视频平台、工具与模型，介绍在线AI视频平台与常用工具，以及开源AI视频模型和多模态大模型等相关知识；第4篇AI视频平台、工具与模型的使用，介绍在线视频平台、开源视频模型和ComfyUI工作流的具体操作等；第5篇AI视频场景应用实战，通过一系列案例展示让图片动起来、AI视频换脸、AI视频转绘、AI视频重绘和AI视频编辑等常用技巧；第6篇AI视频项目案例实战，综合使用前面章节介绍的平台、工具、模型与技巧等，完成AI动画制作复现《门后的世界》、AI文旅视频制作武汉宣传片两个综合项目案例。
AI视频生成：原理、工具与应用实践内容丰富，讲解深入浅出，案例典型，适合自媒体创作、视频创作、影视创作和动漫创作等相关领域的从业者与爱好者阅读，也适合作为高等院校和培训机构影视、动画和动漫等专业的教材或培训用书。

AIGC（人工智能生成内容）的发展如火如荼，正在快速席卷各行各业。各种新模型层出不穷，基于新模型的新应用场景不断涌现。AI 视频生成作为AIGC 的重要应用场景正在深刻地影响着人们的日常生活。从自媒体创作到视频制作，从影视创作到动画与动漫创作等，AI 视频生成正在不断地重塑相关行业。可以说，AI 视频生成因其高效率、低成本、低门槛等特点已经成为自媒体从业者、视频创作者、影视从业者、动画与动漫创作者等必须掌握的基本技能，也正在成为大中专院校影视动画与数字媒体等相关专业的必修课。
为了帮助AIGC 从业者全面、系统、深入地学习绘画、语音和视频等生成与处理技术，可学AI团队于2023 年便开始组织人员筹划相关图书的写作和出版事宜，并于2024 年先后出版了《AI 绘画大师之道：轻松入门》和《AI 绘画全场景案例应用与实践》。这两部图书上市后均获得了广大读者的好评。为了帮助读者更加系统地学习AIGC 相关技术，可学AI团队经过调研，计划进一步推出《AIGC 绘画与音视频生成：ComfyUI 工作流应用与实践》《AI 语音与音乐生成：原理、工具与应用实践》《AI 视频生成：原理、工具与应用实践》《AI 绘画模型微调：原理、工具与应用实践》等图书，这些图书组成AIGC 技术探索丛书供读者阅读。
本书为AIGC 技术探索丛书中的《AI 视频生成：原理、工具与应用实践》分册。本书结合36 个应用案例详细介绍AI 视频生成的基本原理、主流平台与工具、开源模型、基础操作、场景应用与综合项目实战等。本书采用全彩印刷，效果精美。书中对一些重点中英文提示词用蓝色突出显示，对一些重点命令用紫色显示，以提高阅读体验。通过阅读本书，读者可以全面、系统、深入地掌握AI 视频生成涉及的核心技术、工具、模型、技巧与场景应用等。
本书特色
? 轻松上手：通过图书教学视频拓展学习答疑解惑的立体教学方式，带领读者轻松上手。
? 内容全面：涵盖AI 视频生成的发展历史、基本原理、工具与平台、开源模型、基础操作、场景应用和项目实战等，涉及25 个AI 视频类在线平台与工具、27 款开源AI 视频模型、20 种常用ComfyUI 工作流，带领读者一站式掌握AI 视频生成的核心知识与应用。
? 技术新颖：紧跟技术发展趋势，基于当前的主流工具、平台和模型进行讲解，以确FOREWORD保内容的时效性与准确性。
? 图文并茂：结合300 多幅图进行讲解，直观地展现AI 视频生成的原理与操作过程。
? 实践性强：详解36 个类型丰富、由易到难的经典应用案例，涵盖AI 视频生成的常见场景应用，帮助读者快速提高AI 视频生成的实际动手能力。
? 举一反三：针对同一功能或场景应用，提供多种实现思路，帮助读者融会贯通，从而达到举一反三的效果。
? 资源超值：提供大量的超值配套学习资源（见后文），帮助读者高效、直观地学习。
? 服务完善：提供QQ 书友群、电子邮箱、B 站和公众号等多种服务渠道，为读者的学习保驾护航。
本书内容
第1 篇 AI 视频概述
第1 章介绍AI 视频技术的发展历史与现状，让读者了解AI 视频的发展脉络。
第2 章介绍AI 视频快速发展带来的冲击，包括AI 视频电信诈骗、好莱坞演员罢工和AI 视频作品版权等相关内容，让读者了解相应的对策。
第3 章介绍人们如何适应AIGC 和AI 视频发展的未来。
第2 篇 AI 视频原理
第4 章介绍常见的AI 视频生成模型，包括变分自编码器、生成对抗网络、扩散模型和自回归模型。
第5 章介绍视频扩散模型的相关知识，包括其应用场景、基本框架、生成高清视频的技巧，以及如何保持视频时空一致性和基于多样性数据训练模型。
第6 章介绍流行的混合模型DiT 的相关知识以及文生视频模型Sora 和国产视频生成模型可灵AI 的相关知识。
第3 篇 AI 视频平台、工具与模型
第7 章介绍国内外25 款在线AI 视频平台与工具，包括腾讯智影、秒创、可灵AI、剪映、即梦AI、PixVerse、清影、Vidu、Runway、Pika、HeyGen、Akool、度加创作工具、快手云剪、剪辑魔法师、万彩AI、33 搜帧、Q.AI、Fliki 等。
第8 章介绍开源AI 视频模型，包括4 款通用类模型、4 款图片说话类模型、3 款动作引导类模型、3 款SD-WebUI 插件类模型和3 款类Sora 知名开源模型。
第9 章介绍几款多模态大模型，包括文心一言、通义千问和讯飞星火等。
第4 篇 AI 视频平台、工具与模型的使用
第10 章介绍在线视频平台Runway、Pika 和可灵AI 的使用方法。
第11 章介绍SVD、CogVideo、Animate Anyone 和Champ 等开源AI 视频模型的部署和使用方法。
第12 章介绍20 个ComfyUI 视频工作流的用法，包括4 个文生视频工作流、5 个图生视频工作流、2 个视频风格转绘工作流、5 个图片跳舞工作流及4 个其他创意应用工作流。
第5 篇 AI 视频场景应用实战
第13 ～ 17 章分别介绍让图片动起来、视频换脸、视频转绘、视频重绘和视频编辑5个AI 视频的常见场景应用。每个场景应用都通过多个具体案例展示其实现过程与效果，并进行总结和扩展。
第6 篇 AI 视频项目案例实战
第18 章从编写脚本、美术设计、分镜设计、AI 绘画出图、视频制作、添加声音和后期制作7 个方面展示AI 动画制作复现《门后的世界》项目案例的实现。
第19 章从编写脚本、美术设计、分镜设计、AI 绘画出图、视频制作、添加声音和后期制作7 个方面展示AI 文旅视频制作武汉宣传片项目案例的实现。
读者对象
本书读者对象如下：
? 自媒体从业人员；
? 视频创作人员；
? 影视创作人员；
? 数字人、直播从业者；
? 其他AI 视频技术爱好者；
? 高等院校影视动漫、数字媒体等专业的学生和教师；
? AI 视频培训机构的学员。
配套资源获取方式
本书赠送以下超值配套资源：
? 教学视频；
? 案例素材；
? 提示词文件；
? 视频类工作流文件；
? 教学PPT；
? 软件安装文件。
上述配套资源有两种获取方式：一是关注微信公众号方大卓越，回复数字51自动获取下载链接；二是在清华大学出版社网站（www.tup.com.cn）上搜索到本书，然后在本书页面上找到资源下载栏目，单击网络资源按钮进行下载。另外，读者也可以在B 站上查找UP 主可学AI，在线观看本书配套教学视频。
意见反馈
AI 视频正在持续高速发展中，其功能迭代日新月异。虽然本书在写作中已尽力保持内容的时效性与新颖性，但是鉴于技术的快速变化和作者认知的局限性，书中难免存在一些未尽完善之处或细微疏漏，敬请各位读者批评与指正，笔者会及时进行调整和修改，您的宝贵意见是我们不断进步的动力。读者可以通过本书QQ 书友群或电子邮箱联系我们，也可关注微信公众号可学AI，了解AIGC 的相关进展信息。读者也可关注微信公众号方大卓越，回复数字51自动获取QQ 书友群号等信息。
致谢
感谢夏小康、尹子成、白玉棋、张炯涛、朱美霞、秦天琪、王佑琳、肖越汉、张洋和王浩铭等在本书写作期间给予笔者团队的支持与帮助！
感谢欧振旭在本书出版过程中给予笔者的大力支持与帮助！
感谢清华大学出版社参与本书出版的所有人员！是你们一丝不苟的精神，才使本书得
以高质量出版。

袁朝辉

你还可能感兴趣

我要评论