书单推荐
更多
新书推荐
更多

大模型训练与推理加速实战:基于CUDA计算平台(Python版)

大模型训练与推理加速实战:基于CUDA计算平台(Python版)

定  价:129 元

        

当前图书已被 2 所学校荐购过!
查看明细

  • 作者:温浩
  • 出版时间:2025/7/1
  • ISBN:9787121505430
  • 出 版 社:电子工业出版社
  • 中图法分类:TP181;TP312.8 
  • 页码:464
  • 纸张:
  • 版次:01
  • 开本:16开
9
7
5
8
0
7
5
1
4
2
3
1
0

读者对象:本书兼具理论深度与工程实用性,适合从事深度学习系统优化的研究人员、高性能计算工程师及希望掌握GPU加速部署的开发者参考使用,是一本面向大模型时代的CUDA并行计算加速实战指南。

本书深入探讨深度学习模型训练和推理加速的前沿技术,尤其是在 NVIDIA CUDA(Compute Unified Device Architecture)平台上的应用与优化。本书从大模型训练的挑战和分布式训练,到 CUDA 加速推理技术,再到端侧推理的优化部署,系统地介绍如何利用 CUDA 平台加速大模型的训练与推理过程,并结合具体案例深入讲解数据并行、模型并行、任务调度、负载均衡等技术。本书共 10 章,首先介绍大模型训练面临的计算复杂性、内存带宽和数据传输瓶颈等问题,并讲解基于NCCL(NVIDIA Collective Communications Library)的优化方法;然后,通过深入浅出的讲解,展示如何使用 TensorRT 进行推理加速,并探讨多模型并行推理架构、混合精度训练与推理等优化策略;最后,详细阐述端侧推理加速,特别是在移动设备和边缘设备中的应用,强调模型量化、裁剪等技术在推理加速中的重要作用。
 你还可能感兴趣
 我要评论
您的姓名   验证码: 图片看不清?点击重新得到验证码
留言内容