值绑定 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

C++高性能并行编程与优化 - 课件 - 03 现代 C++ 进阶：模板元编程

glm::vec3 V> // 错误！模板参数：多个模板参数 • int N 和 class T 可以一起使用。 • 你只需要指定其中一部分参数即可，会自动根据参数类型（ T msg ）、默认值（ int N = 1 ），推断尖括号里没有指定的那些参数。模板参数：参数部分特化 1. func(T t) 完全让参数类型取决于调用者。 2. func(vector t) if constexpr 的表达式不能用运行时变量，模板尖括号内的参数也不能： • 可以在 bool debug 变量的定义前面加上 constexpr 来解决： • 但这样 debug = 右边的值也必须为编译期常量，否则出错：模板的难题：编译期常函数 • 编译期 constexpr 的表达式，一般是无法调用其他函数的。 • 解决：如果能保证 isnegative 里都可以在编译期求值，将他前面也标上引入了 auto ，使用 auto 定义的变量，其类型会自动根据等号右边的值来确定：自动类型推导：一些局限性 • 不过 auto 也并非万能，他也有很多限制。 • 因为需要等号右边的类型信息，所以没有 = 单独声明一个 auto 变量是不行的： • 而且，类成员也不可以定义为 auto ：自动类型推导：函数返回值 • 除了可以用于定义变量，还可以用作函数的返回类型： • 使用 auto

0 码力 | 82 页 | 12.15 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 14 C++ 标准库系列课 - 你所不知道的 set 容器

会把重复的元素去除，只保留一个，即去重。 • 区别 3 ： vector 中的元素在内存中是连续的，可以高效地按索引随机访问， set 则不行。 • 区别 4 ： set 中的元素可以高效地按值查找，而 vector 则低效。 set 的排序： string 会按“字典序”来排 • set 会从小到大排序，对 int 来说就是数值的大小比较。那么对字符串类型 string 要怎么排序会返回自增后迭代器。 • 还有 std::advance 会就地自增作为引用传入的迭代器，他同样会判断是否支持 += 来决定要采用哪一种实现。 • 区别： advance 就地修改迭代器，没有返回值； next 修改迭代器后返回，不会改变原迭代器。 • advance 相当于 += ， next 相当于 + 。 next 和 advance 同样支持负数 • next 的第二个参数 n val); insert 的第二个返回值：表示插入是否成功 • insert 函数的返回值是一个 pair 类型，也就是说他同时返回了两个值。其中第二个返回值是 bool 类型，指示了插入是否成功。 • 若元素在 set 容器中已存有相同的元素，则插入失败，这个 bool 值为 false ；如果元素在 set 中不存在，则插入成功，这个 bool 值为 true 。 • pair
0 码力 | 83 页 | 10.23 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 17 由浅入深学习 map 容器

[] 才对， [] 在写入时又和多数语言的 [] 行为一致了。 • 这时 [] 自动默默创建的特性反而是个优点了，如果用了 at() 反而会在插入新键值时莫名其妙报错。此外 [] 默默创建以后把值初始化为 0 的特性，由于调用者是 = val 赋值，所以初始化也没用了，反正马上会写入 val 。浅谈这种精分设计的原因 • 总结，要符合你熟悉的 Python 的 [] 行为，在 C++ 中要根据不同情况选择不同的方法访是不知道的 • [] 被调用的时候根本不知道他外面是想写入还是读取。找不到键值时，为了能兼容写入的情况， [] 只好创建一个零值。而有的同学误以为 [] 的读取在找不到键值时自然会报错提醒他，没想到 [] 返回了个零值坑了他。所以他们又另起炉灶，发明了越界时不会自动创建零值，而是能抛出异常的 at 函数。 C++ 和 Python 用法对比 C++ 和 Python 用法对比（运算符重载展开成普通函数后）来表示，非常明确。主要是为了把 get 和 put 作为接口函数，可以对应多个具体实现。错误示范 • 小彭老师说过，读取必须用 at 。 • 而这位同学却用了 [] 来读取 items 里的值。 • 乍看之下好像没错，运行结果也是正确的，但这只是碰巧你的 items 里存在 “ hello” 而已，如果哪天 “ hello” 不存在了他也不会报错而是默默创建然后返回 0 ，后患无穷！

0 码力 | 90 页 | 8.76 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 11 现代 CMake 进阶指南

Makefile 的构建规则写一份， MSBuild 也写一份。 • 现在只需要写一次 CMakeLists.txt ，他会视不同的操作系统，生成不同构建系统的规则文件。 • 那个和操作系统绑定的构建系统（ make 、 MSBuild ）称为本地构建系统（ native buildsystem ）。 • 负责从 CMakeLists.txt 生成本地构建系统构建规则文件的，称为生成器（。第 2 章：项目配置变量 CMAKE_BUILD_TYPE 构建的类型，调试模式还是发布模式 • CMAKE_BUILD_TYPE 是 CMake 中一个特殊的变量，用于控制构建类型，他的值可以是： • Debug 调试模式，完全不优化，生成调试信息，方便调试程序 • Release 发布模式，优化程度最高，性能最佳，但是编译比 Debug 慢 • MinSizeRel 最小体积发布，生成的文件比 RelWithDebInfo: `-O2 -g -DNDEBUG` • 此外，注意定义了 NDEBUG 宏会使 assert 被去除掉。小技巧：设定一个变量的默认值如何让 CMAKE_BUILD_TYPE 在用户没有指定的时候为 Release ，指定的时候保持用户指定的值不变呢。就是说 CMake 默认情况下 CMAKE_BUILD_TYPE 是一个空字符串。因此这里通过 if (NOT CMAKE_BUILD_TYPE)

0 码力 | 166 页 | 6.54 MB | 1 年前
3
Rust 异步并发框架在移动端的应用 - 陈明煜

Core Thread Thread Worker Worker task task Local queue Local queue Tokio 采用了如右图这种 GMP 模式： • 一核可以绑定多线程，每个线程拥有一个 Worker ，每个 Worker 拥有一个任务队列 • 但线程拥有相同优先级 • Worker 只持有一个本地 FIFO 队列移动端诉求：优先级 • 任务区分优先级：注册事件任务优先级调度 Task priority and quality of service 任务优先级调度 Linux CFS 调度 : 线程优先级 • 设置线程的 Nice 值给予线程不同的权重 2 个线程 A 和 B 。 A 的权重是 1024 ， B 的权重是 2048 。那么 A 获得 CPU 的时间比例是 1024/ (1024 + 2048) = 33.3%

0 码力 | 25 页 | 1.64 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 12 从计算机组成原理看 C 语言指针

一个个 0 和 1 。 • 每个存储 0 或 1 的空间称为一个位（ bit ），一位可以存储 0 或 1 两个可能的值。 • 现在的计算机都会把 8 个位打包成一个字节（ byte ），也就是说： 1 字节 = 8 位。 • 一字节可以表示 0 到 255 区间中所有的值，表示方式如下： • 00000000 表示 0 00000001 表示 1 00000010 表示 2 00000011 表示 255 • 字节实际上就是 C 语言中的 unsigned char 类型。表示更大范围的整数：字（ word ） • 但是单单一个字节表示的范围还是太有限了，只能表示 0 到 255 的值。 • 如何扩大表示范围？简单，用两个字节合在一起即可，例如： • 00000000-00000000 表示 0 00000000-00000001 表示 1 • 00000000-00000010 位。 • 比如 00000011 表示 3 ， 10000011 表示 -3 ，这样不就区分开来了吗？这叫做原码表示法。 • 的确可以，这种表示方式牺牲了一位作为符号位，剩下 7 位继续表示值。 • 这样的设计下无符号可以表示 0 到 255 ，而有符号可以表示 -127 到 127 。 • 但是有一个问题，那 00000000 就表示 0 ， 10000000 就表示 -0 ，而 0

0 码力 | 128 页 | 2.95 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 05 C++11 开始的多线程编程

std::thread 的解构函数会销毁线程 • 作为一个 C++ 类， std::thread 同样遵循 RAII 思想和三五法则：因为管理着资源，他自定义了解构函数，删除了拷贝构造 / 赋值函数，但是提供了移动构造 / 赋值函数。 • 因此，当 t1 所在的函数退出时，就会调用 std::thread 的解构函数，这会销毁 t1 线程。 • 所以， download 函数才会出师未捷身先死 zeno 也用了 opengl ，但他用多进程成功在 opengl 的百般拖后腿下实现了并发。第 2 章：异步异步好帮手： std::async • std::async 接受一个带返回值的 lambda ，自身返回一个 std::future 对象。 • lambda 的函数体将在另一个线程里执行。 • 接下来你可以在 main 里面做一些别的事情， download get() 方法，如果此时 download 还没完成，会等待 download 完成，并获取 download 的返回值。显示地等待： wait() • 除了 get() 会等待线程执行完毕外， wait() 也可以等待他执行完，但是不会返回其值。等待一段时间： wait_for() • 只要线程没有执行完， wait() 会无限等下去。 • 而 wait_for()

0 码力 | 79 页 | 14.11 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 08 CUDA 开启的 GPU 编程

用于定义核函数，他在 GPU 上执行，从 CPU 端通过三重尖括号语法调用，可以有参数，不可以有返回值。 • 而 __device__ 则用于定义设备函数，他在 GPU 上执行，但是从 GPU 上调用的，而且不需要三重尖括号，和普通函数用起来一样，可以有参数，有返回值。 • 即： host 可以调用 global ； global 可以调用 device ； device dim3(x, y, z) • 这样在核函数里就可以通过 threadIdx.y 获取 y 方向的线程编号，以此类推。那二维呢？ • 需要二维的话，只需要把 dim3 最后一位（ z 方向）的值设为 1 即可。这样就只有 xy 方向有大小，就相当于二维了，不会有性能损失。实际上一维的 <<>> 不过是 <<>> 的调用是异步的，返回的时候，并不会实际让 GPU 把核函数执行完毕，必须 cudaDeviceSynchronize() 等待他执行完毕（和线程的 join 很像）。所以，不可能从 kernel 里通过返回值获取 GPU 数据，因为 kernel 返回时核函数并没有真正在 GPU 上执行。所以核函数返回类型必须是 void 。试图解决：通过指针传递 • 那你可能会想，既然不能返回，那作为指

0 码力 | 142 页 | 13.52 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 02 现代 C++ 入门：RAII 内存管理

取决于内存的随机值编译器默认生成的构造函数：无参数（ POD 陷阱解决方案） • 不过我们可以手动指定初始化 weight 为 0 。 • 通过 {} 语法指定的初始化值，会在编译器自动生成的构造函数里执行。编译器默认生成的构造函数：无参数（ POD 陷阱解决方案，续） • 不过我们可以手动指定初始化 weight 为 0 。 • 通过 {} 语法指定的初始化值，不仅会在编译 • int x{}; • void *p{}; • 与 • int x{0}; • void *p{nullptr}; • 等价，都会零初始化。但是你不写那个空括号就会变成内存中随机的值。 • 再比如： std::cout << int{}; 会打印出 0 编译器默认生成的构造函数：初始化列表（感谢 C++11 ） • 当一个类（和他的基类）没有定义任何构造函数，这时编译器会自动生成一个参数个数和成，剩余的为默认值） • 这个编译器自动生成的初始化列表构造函数，除了可以指定全部成员来构造以外，还可以指定部分的成员，剩余没指定的保持默认。 • 不过你得保证那个没指定的有在类成员定义里写明 {} 初始化，否则有可能会变成内存里的随机值。 • 顺便一提， C++20 中还可以通过指定名称来跳顺序：编译器默认生成的构造函数：初始化列表（妙用，解决函数多返回值） • 典型的例子包括，图形学某知名应用中，

0 码力 | 96 页 | 16.28 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 13 C++ STL 容器全解之 vector

&operator[](size_t i) const noexcept; vector 容器：构造函数 • 除了先指定大小再一个个构造之外，还可以直接利用初始化列表（ C++11 新特性）在构造时就初始化其中元素的值。 • 例如创建具有 6, 1, 7, 4 四个元素的 vector ： • vector a = {6, 1, 7, 4}; • 和刚刚先创建再赋值的方法相比更直观。 • ve 会初始化为空字符串，指针类型会初始化为 nullptr ） • explicit vector(size_t n); vector 容器：构造函数 • 这个显式构造函数还可以指定第二个参数，这样就可以用 0 以外的值初始化整个数组了。 • 比如要创建 4 个 233 组成的数组就可以写： • vector a(4, 233); • 等价于 • vector a = {233, 233, • a.resize(4); • void resize(size_t n); vector 容器： resize • 当然， resize 也有一个接受第二参数的重载，他会用这个参数的值填充所有新建的元素。 • vector a(4, 233); • 等价于： • vector a; • a.resize(4, 233); • void resize(size_t

0 码力 | 90 页 | 4.93 MB | 1 年前
3

共 24 条前往

页

C++高性性能高性能并行编程优化课件 03 14 17 11 陈明煜 2023RustChinaConf 12 05 08 02 13

分类

语言

格式

C++高性能并行编程与优化 - 课件 - 03 现代 C++ 进阶：模板元编程

C++高性能并行编程与优化 - 课件 - 14 C++ 标准库系列课 - 你所不知道的 set 容器

C++高性能并行编程与优化 - 课件 - 17 由浅入深学习 map 容器

C++高性能并行编程与优化 - 课件 - 11 现代 CMake 进阶指南

Rust 异步并发框架在移动端的应用 - 陈明煜

C++高性能并行编程与优化 - 课件 - 12 从计算机组成原理看 C 语言指针

C++高性能并行编程与优化 - 课件 - 05 C++11 开始的多线程编程

C++高性能并行编程与优化 - 课件 - 08 CUDA 开启的 GPU 编程

C++高性能并行编程与优化 - 课件 - 02 现代 C++ 入门：RAII 内存管理

C++高性能并行编程与优化 - 课件 - 13 C++ STL 容器全解之 vector