班级规模及环境--热线:4008699035 手机:15921673576( 微信同号) |
|
坚持小班授课,为保证培训效果,增加互动环节,每期人数限3到5人。 |
上课时间和地点 |
开课地址:【上海】同济大学(沪西)/新城金郡商务楼(11号线白银路站)【深圳分部】:电影大厦(地铁一号线大剧院站) 【武汉分部】:佳源大厦【成都分部】:领馆区1号【沈阳分部】:沈阳理工大学【郑州分部】:锦华大厦【石家庄分部】:瑞景大厦【北京分部】:北京中山 【南京分部】:金港大厦
新开班 (连续班 、周末班、晚班):2026年2月7日..参加培训,提升专业技能....课程再次升级....学用相长,注重实践....以质量求发展....合作共赢....实用实战....实战培训....用心服务..........--即将开课--............................(欢迎您垂询,视教育质量为生命!) |
实验设备 |
☆资深工程师授课
☆注重质量
☆边讲边练
☆合格学员免费推荐工作
★实验设备请点击这儿查看★ |
质量保障 |
1、培训过程中,如有部分内容理解不透或消化不好,可免费在以后培训班中重听;
2、课程完成后,授课老师留给学员手机和Email,保障培训效果,免费提供半年的技术支持。
3、培训合格学员可享受免费推荐就业机会。 |
课程大纲 |
| |
CUDA入门
1. GPU并行计算
2. 深度学习与GPU:
(1)深度学习介绍以及GPU在其中的作用
(2)caffe框架介绍及mnist训练和测试讲解
3. GPU体系架构
4. OpenMP介绍
5. CUDA环境搭建
CUDA入门
1. CUDA C编程基础
(1)CUDA编程模式:block和thread
(2)CUDA存储模式:global memory/shared memory
(3)CUDA C关键字及内核调用
(4)示例:向量加法
(5)课上练习:矩阵加法
2. CUDA线程调度
3. CUDA调试方法
4. 课上练习:调试方法练习
CUDA高级编程
1. 存储器优化技巧:
(1)矩阵乘法-global memory
(2)矩阵乘法-shared memory
2. 访存优化:bank conflict,bandwidth
3. 流与事件
4. 多GPU编程
5. 测试时间方法
6. 课上练习:
CUDA高级编程
1. 并行算法设计的一般原则
2. 并行算法设计方法
3. 优化技巧实战:卷积计算step by step优化性能
4. 调优工具:NSight分析性能瓶颈
|