深入理解 GPU 计算: CUDA 编程指南

对 CUDA 编程有深入理解, 全面掌握 CUDA 编程知识.

5.0 (个评分) 5536人学习

中级 99课时 12小时17分钟 2021/06/29更新

资料下载

二维码 下载学堂APP 缓存视频离线看

    • 畅销套餐
    • 精选套餐
    • 人气套餐
    • 尊享套餐
超值好课低价囤 低至2元 人工智能 爆款好课 会员免费领
  • 课程介绍
  • 课程大纲 试看
  • 讲师好课 2
  • 学员评价

你将会学到:

  • CUDA 编程基本概念
  • 网格, 线程块, 线程多层次结构
  • 网格, 线程块与线程到实际问题如何映射
  • 硬件处理器多层次结构
  • GPU 多层次内存: 寄存器, 高速缓存, 共享内存, 全局内存
  • 全局内存如何管理
  • 共享内存如何使用
  • 规约算法
  • 合作组 (Cooperative Groups)

适合人群:

高性能计算, 软件工程师和人工智能从业人员. 需要 C/C++ 知识.

学习计划:

1) 每周建议学习两个小时, 然后多写代码练习. 2) 本课程大概可以 6 周完成.

课程目标:

对 CUDA 编程有深入理解, 全面掌握 CUDA 编程知识.

课程简介:

本课程介绍NVIDIA GPU 计算的基本知识, 例如 NVIDIA GPU 计算核心架构, 内存架构, 内存模型和执行模型. 在接下来的课程, 将讲述CUDA编程的技术细节, 特别在最后本课程将详细介绍规约操作. 规约是很重要的操作, 并且实现难度大. 通过本课程, 希望学生可以掌握CUDA编程的基本知识.

-- GPU 计算基本概念
-- CUDA 编程基本概念
-- 网格, 线程块, 线程多层次结构
-- 网格, 线程块与线程到实际问题如何映射
-- 硬件处理器多层次结构
-- GPU 多层次内存: 寄存器, 高速缓存, 共享内存, 全局内存
-- 线程块与线程块如何调度
-- warp 如何划分与调度
-- 全局内存如何管理
-- 共享内存如何使用
-- 如何实现 CUDA 多层次同步: 核函数, 线程块, warp
-- 什么是规约算法
-- 如何设计高效规约算法
-- 如何在warp内构造更小的线程组
-- 如何在warp内实现通信
-- 合作组 (Cooperative Groups)
-- 如何优化CUDA 程序

展开更多

课程大纲-深入理解 GPU 计算: CUDA 编程指南

展开更多

5

条学员评分 超过  “人工智能”   99%的课程
      展开更多
      加载中
      没有了哦~

      ¥349.00

      立即购买
      关注公众号 领VIP会员
      下次再说

      点击打包下载,即可获取该课程全部资料

      打包下载
      迎新春满300减35 满400减50
      是否单独购买该课程?
      直接购买 去凑单
      在线
      客服
      APP
      下载

      下载Android客户端

      下载iphone 客户端

      官方
      微信

      关注官方微信

      返回
      顶部