Skip to content

Latest commit

 

History

History
26 lines (18 loc) · 993 Bytes

readme.md

File metadata and controls

26 lines (18 loc) · 993 Bytes

加速计算基础——CUDA Python 通关版

课程1 使用 Numba 的 CUDA Python 简介

  • 基于 Numba 的 CUDA Python 编程简介
  • 使用 Numba 在 Python 中编写自定义的 CUDA 核函数
  • 使用 Numba 实现 CUDA Python 的多维网格和共享内存

课程2 使用 Numba 的 CUDA Python 的自定义核函数和内存管理

  • 基于 Numba 的 CUDA Python 编程简介
  • 使用 Numba 在 Python 中编写自定义的 CUDA 核函数
  • 使用 Numba 实现 CUDA Python 的多维网格和共享内存

课程3 有效使用内存子系统

  • 编写受益于合并内存访问模式的 CUDA 核函数。
  • 使用多维网格和线程块。
  • 使用共享内存来协调块内的线程。
  • 使用共享内存来促进合并内存访问模式。
  • 解决共享内存区的冲突。