 C++高性能并行编程与优化 -  课件 - 08 CUDA 开启的 GPU 编程类型的正弦函数。可 不要偷懒少打一个 f 哦,否则影响性能。 • 完成同步之后,和 CPU 算出来的比较差值, 看看 GPU 算的是否准确无误,从右边的输出 可以看到基本是一致的。 测试一下时间 • 使用第六节课中的 ticktock.h 测试一下 CPU 和 GPU 的用时。 • 注意,这里一定要把 TOCK 放到同步之 后。原因之前说过,因为对 GPU 核函数 的调用是异步的,只有 c 使用板块局部数组(共享内存)来加速数组求和 这就是胡渊鸣所说的 BLS ( block-local storage ) 进一步,当数组非常大,缩减后的数组可以继续递归地用 GPU 求和 • 这是第六课说过的方法。递归地缩并,时间复杂度是 O(logn) 。 • 同样是缩并到一定小的程度开始就切断 (cutoff) ,开始用 CPU 串行求和。 https://developer.download0 码力 | 142 页 | 13.52 MB | 1 年前3 C++高性能并行编程与优化 -  课件 - 08 CUDA 开启的 GPU 编程类型的正弦函数。可 不要偷懒少打一个 f 哦,否则影响性能。 • 完成同步之后,和 CPU 算出来的比较差值, 看看 GPU 算的是否准确无误,从右边的输出 可以看到基本是一致的。 测试一下时间 • 使用第六节课中的 ticktock.h 测试一下 CPU 和 GPU 的用时。 • 注意,这里一定要把 TOCK 放到同步之 后。原因之前说过,因为对 GPU 核函数 的调用是异步的,只有 c 使用板块局部数组(共享内存)来加速数组求和 这就是胡渊鸣所说的 BLS ( block-local storage ) 进一步,当数组非常大,缩减后的数组可以继续递归地用 GPU 求和 • 这是第六课说过的方法。递归地缩并,时间复杂度是 O(logn) 。 • 同样是缩并到一定小的程度开始就切断 (cutoff) ,开始用 CPU 串行求和。 https://developer.download0 码力 | 142 页 | 13.52 MB | 1 年前3
 C++高性能并行编程与优化 -  课件 - 17 由浅入深学习 map 容器->second 才能得到 V ,而 [] 和 at 可以直接返回 V 。 • ( K :这下俺只有苦劳辣 ! ) • 那么他们两个又有什么区别呢?很多新手都分不清他俩,可能只认识 [] 。 第六章:实战与应用 我负责监督你鞋习 ! 我负责监督你鞋习 ! 经典案例:遍历的同时修改 经典案例:一边遍历,一边删除 inorder traversal 只有好好鞋洗的童鞋 才有资格获得哦0 码力 | 90 页 | 8.76 MB | 1 年前3 C++高性能并行编程与优化 -  课件 - 17 由浅入深学习 map 容器->second 才能得到 V ,而 [] 和 at 可以直接返回 V 。 • ( K :这下俺只有苦劳辣 ! ) • 那么他们两个又有什么区别呢?很多新手都分不清他俩,可能只认识 [] 。 第六章:实战与应用 我负责监督你鞋习 ! 我负责监督你鞋习 ! 经典案例:遍历的同时修改 经典案例:一边遍历,一边删除 inorder traversal 只有好好鞋洗的童鞋 才有资格获得哦0 码力 | 90 页 | 8.76 MB | 1 年前3
 《深入浅出MFC》2/e的第三个参数和第四个参数分别指定这两个核心对象的安全属性。至于第 五个参数(TRUE 或FALSE)则用来设定这些安全属性是否要被继承。关于安全属性及 其可被继承的性质,碍于本章的定位,我不打算在此介绍。 第六个参数dwCreationFlags 可以是许多常数的组合,会影响到进程的建立过程。这些 常数中比较常用的是CREATE_SUSPENDED,它会使得子进程产生之后,其主执行线程立 刻被暂停执行。 希望窗口在特定位置有特定大小,可以这么做: 第五个参数pParentWnd 指定父窗口。对于一个top-level 窗口而言,此值应为NULL, 表示没有父窗口(其实是有的,父窗口就是desktop 窗口)。 第六个参数lpszMenuName 指定菜单。本例使用一份在RC 中准备好的菜单 ¡ § MainMenu¡ ¨ 。第八个参数pContext 是一个指向CCreateContext 结构的指针,framework 函数中设计绘图动作。玩过Windows 的接龙游戏吗?接龙成 功后扑克牌的跳动效果就可以利用LineDDA 完成。虽然扑克牌的跳动路径是一条曲 线,但将曲线拆成数条直线并不困难。LineDDA 的第六个(最后一个)参数可以视应用 程序的需要传递一个32 位指针,本例中Hello 传的是一个Device Context。 Bresenham 算法是计算机图学中为了「显示器(屏幕或打印机)系由图素构成」的这个0 码力 | 1009 页 | 11.08 MB | 1 年前3 《深入浅出MFC》2/e的第三个参数和第四个参数分别指定这两个核心对象的安全属性。至于第 五个参数(TRUE 或FALSE)则用来设定这些安全属性是否要被继承。关于安全属性及 其可被继承的性质,碍于本章的定位,我不打算在此介绍。 第六个参数dwCreationFlags 可以是许多常数的组合,会影响到进程的建立过程。这些 常数中比较常用的是CREATE_SUSPENDED,它会使得子进程产生之后,其主执行线程立 刻被暂停执行。 希望窗口在特定位置有特定大小,可以这么做: 第五个参数pParentWnd 指定父窗口。对于一个top-level 窗口而言,此值应为NULL, 表示没有父窗口(其实是有的,父窗口就是desktop 窗口)。 第六个参数lpszMenuName 指定菜单。本例使用一份在RC 中准备好的菜单 ¡ § MainMenu¡ ¨ 。第八个参数pContext 是一个指向CCreateContext 结构的指针,framework 函数中设计绘图动作。玩过Windows 的接龙游戏吗?接龙成 功后扑克牌的跳动效果就可以利用LineDDA 完成。虽然扑克牌的跳动路径是一条曲 线,但将曲线拆成数条直线并不困难。LineDDA 的第六个(最后一个)参数可以视应用 程序的需要传递一个32 位指针,本例中Hello 传的是一个Device Context。 Bresenham 算法是计算机图学中为了「显示器(屏幕或打印机)系由图素构成」的这个0 码力 | 1009 页 | 11.08 MB | 1 年前3
共 3 条
- 1













