智能指针 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

C++高性能并行编程与优化 - 课件 - 12 从计算机组成原理看 C 语言指针

从计算机组成原理看 C 语言指针 by 彭于斌（ @archibate ）往期录播： https://www.bilibili.com/video/BV1fa411r7zp 课程 PPT 和代码： https://github.com/parallel101/course 请问下面这三段代码有什么错误？ • float x = -3.14; • printf(“%f\n”, abs(x)); ：自动随系统位数决定大小 • 刚刚说过，计算机的位数决定了内存地址的大小。 • 而指针的本质就是内存地址，所以指针的大小在 32 位系统上就 32 位， 64 位系统上就 64 位。 • 稍后我们再来详细讲解一下指针，有时候我们需要把指针的地址值存在整型变量里。 • 而 32 位平台上的指针是 32 位， 64 位平台上的指针是 64 位。 • 所以是不是需要根据当前平台来判断要使用哪一种代码了？也就是说： sizeof(intptr_t) = sizeof(void *) = sizeof(uintptr_t) size_t ：表示大小的整数类型，其实等价于 uintptr_t • 除了指针需要随系统位数变化之外，数组的长度也是需要随系统位数变化的。 • 如果 64 位系统上 size_t 还是 uint32_t ，那就无法表示超过 4GB 大小的数组了。 • 今日乳 ja 笑话：

0 码力 | 128 页 | 2.95 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 02 现代 C++ 入门：RAII 内存管理

C++20 modules ）因此我们的课程基于 C++17 标准，有时会谈到 C++20 作为扩展阅读。 C++ 有哪些面向对象思想？ C++ 思想：封装比如要表达一个数组，需要：起始地址指针 v ，数组大小 nv 将多个逻辑上相关的变量包装成一个类因此 C++ 的 vector 将他俩打包起来，避免程序员犯错封装：不变性比如当我要设置数组大小为 4 时，不能只 nv = 4 Pig() ，他会调用每个成员的无参构造函数。 • 但是请注意，这些类型不会被初始化为 0 ： 1. int, float, double 等基础类型 2. void *, Object * 等指针类型 3. 完全由这些类型组成的类 • 这些类型被称为 POD （ plain-old-data ）。 • POD 的存在是出于兼容性和性能的考虑。 << 取决于内存的随机值编译器默认生成的构造函数：无参数（ CppCoreGuidelines 三五法则：拷贝构造函数 • 在 = 时，默认是会拷贝的。比如右边这样： • 但是这样对我们当前 Vector 的实现造成一个很大的问题。其 m_data 指针是按地址值浅拷贝的，而不深拷贝其指向的数组！ • 这就是说，在退出 main 函数作用域的时候， v1.m_data 会被释放两次！更危险的则是 v1 被解构而 v2 仍在被使用的情况。

0 码力 | 96 页 | 16.28 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 08 CUDA 开启的 GPU 编程

GPU 上执行。所以核函数返回类型必须是 void 。试图解决：通过指针传递 • 那你可能会想，既然不能返回，那作为指针传入局部变量的引用，不就好了。 • 这样，在 cudaDeviceSynchronize() 以后，应该可以获取数据了吧？ • 结果令人失望，尽管给 kernel 传了指向 ret 的指针，但 ret 的值并没有被改写成功。分析返回的错误代码 • CUDA 因此可以用用 cudaMalloc 分配 GPU 上的显存，这样就不出错了，结束时 cudaFree 释放。 • 注意到 cudaMalloc 的返回值已经用来表示错误代码，所以返回指针只能通过 &pret 二级指针。反之亦然， CPU 也不能访问 GPU 的内存地址 • 你可能已经迫不及待想通过 *pret 访问其返回值了。但是不行，因为 GPU 访问不了 CPU 的内存地址，同理，分配出来的地址，不论在 CPU 还是 GPU 上都是一模一样的，都可以访问。而且拷贝也会自动按需进行（当从 CPU 访问时），无需手动调用 cudaMemcpy ，大大方便了编程人员，特别是含有指针的一些数据结构。注意不要混淆 • 主机内存 (host) ： malloc 、 free • 设备内存 (device) ： cudaMalloc 、 cudaFree • 统一内存 (managed)

0 码力 | 142 页 | 13.52 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 17 由浅入深学习 map 容器

v2; } 纹丝不动 ~ • 如果你想让你对局部变量 v 的修改，能对原本 map 中的 v 生效，就要得到 v 的指针，因为只有指针是浅拷贝的，是可以远程修改另一个对象的。 • 这里说的指针，不光是 T * 指针，还包括 T & 引用， iterator 迭代器，他们都是指针的变体。 • 而 structural-binding 和 range-based loop 语法支持引用，也非常简单：语法支持引用，也非常简单： • for (auto &[k, v]: m) { • v = v2; // 引用比指针还方便，自动解引用。此处等价于迭代器版的 (*it).second = v2; • } map 的遍历：如果要修改，请你加引用 k v map 中的堆空间执行你这段代码的栈空间 v2 要写入的数执行中的代码 for (auto &[k, v]: m) { v2; } 未初始化 • 如果你想让你对局部变量 v 的修改，能对原本 map 中的 v 生效，就要得到 v 的指针，因为只有指针是浅拷贝的，是可以远程修改另一个对象的。 • 这里说的指针，不光是 T * 指针，还包括 T & 引用， iterator 迭代器，他们都是指针的变体。 • 而 structural-binding 和 range-based loop 语法支持引用，也非常简单：

0 码力 | 90 页 | 8.76 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 15 C++ 系列课：字符与字符串

每个字符都连续地排列在这个数组中，那么末尾的 0 是怎么回事？原来 C 语言的字符串因为只保留数组的首地址指针（指向第一个字符的指针），在以 char * 类型传递给其他函数时，其数组的长度无法知晓。为了确切知道数组在什么地方结束，规定用 ASCII 码中的“空字符”也就是 0 来表示数组的结尾。这样只需要一个首地址指针就能表示一个动态长度的数组，高，实在是高。 “0 结尾字符串”知识点应用举例 • 利用个字符写入 0 ，就会只保留前 n 个字符作为一个子字符串，删除后半部分。 “0 结尾字符串”知识点应用举例 • C 语言所谓的字符串类型 char * 实际上就是个首地址指针，如果让首地址指针向前移动 n 位，那就实现删除前 n 个字符的效果，而不用实际修改数组本身（更高效）。 C 语言转义符 • 常见的转义符： • ‘\n’ 换行符：另起一行（光标移到下一行行首） • ‘\r’ 会自动识别参数的类型，帮你调用相应的格式化函数。 c_str 和 data 的区别 • s.c_str() 保证返回的是以 0 结尾的字符串首地址指针，总长度为 s.size() + 1 。 • s.data() 只保证返回长度为 s.size() 的连续内存的首地址指针，不保证 0 结尾。 • 把 C++ 的 string 作为参数传入像 printf 这种 C 语言函数时，需要用 s.c_str()

0 码力 | 162 页 | 40.20 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 06 TBB 开启的并行编程之旅

下次课会进一步深入探讨访存优化，详细剖析这个案例，那么下周六 14 点敬请期待。第 6 章：并发容器 std::vector 扩容时会移动元素 • std::vector 内部存储了一个指针，指向一段容量 capacity 大于等于其 size 的内存。 • 众所周知， push_back 会导致 size 加 1 ，但当他看到容量 capacity 等于当前 size 时，意这就导致前半段的元素的地址被改变，从而导致之前保存的指针和迭代器失效。 reserve 预留足够的 capacity • 如果预先知道 size 最后会是 n ，则可以调用 reserve(n) 预分配一段大小为 n 的内存，从而 capacity 一开始就等于 n 。这样 push_back 就不需要动态扩容，从而避免了元素被移动造成指针和迭代器失效。不连续的 tbb::concurrent_vector tbb::concurrent_vector • std::vector 造成指针失效的根本原因在于他必须保证内存是连续的，从而不得不在扩容时移动元素。 • 因此可以用 tbb::concurrent_vector ，他不保证元素在内存中是连续的。换来的优点是 push_back 进去的元素，扩容时不需要移动位置，从而指针和迭代器不会失效。 • 同时他的 push_back 会额外返回一个迭代

0 码力 | 116 页 | 15.85 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 07 深入浅出访存优化

字节分块的效果拔群，但还是比顺序访问慢一些，为什么？明明没有浪费带宽了？缓存行预取技术：吃着一碗饭的同时，先喊妈妈烧下一碗饭 • 其实，当程序顺序访问 a[0], a[1] 时， CPU 会智能地预测到你接下来可能会读取 a[2] ，于是会提前给缓存发送一个读取指令，让他读取 a[2] 、 a[3] 。缓存在后台默默读取数据的同时， CPU 自己在继续处理 a[0] 的数据。这样等写入，他能够绕开缓存，将一个 4 字节的写入操作，挂起到临时队列，等凑满 64 字节后，直接写入内存，从而完全避免读的带宽。 • 可惜这货只支持 int 做参数，要用 float 还得转换一下指针类型， bitcast 一下参数。 stream 的特点：不会读到缓存里 • 因为 _mm_stream_si32 会绕开缓存，直接把数据写到内存，之后读取的话，反而需要等待 stream m> a; 可以在栈上分配 n 行 m 列的二维数组。 • 通过 a[i][j] 访问第 i 行，第 j 列的元素。 • array 和 C 语言的 [] 数组相比，好处是作为参数传入时不会退化成指针。 C 语言动态数组 • float *a = malloc(n * sizeof(float)); 可以在堆上分配有 n 个元素的一维数组。 • 通过 a[i] 访问第 i 个元素。 • float

0 码力 | 147 页 | 18.88 MB | 1 年前
3
新一代分布式高性能图数据库的构建 - 沈游人

等 100+ 公安机构，国家电网、国信通产业集团等电力能源行业提供数据智能产品解决方案及长期服务。海致专注为政府、金融、能源等客户提供大数据处理、分析、挖掘服务，在互联网技术基础上，打造专业、易用的企业级大数据实战应用产品及解决方案。北京中关村总部武汉运维中心深圳研发中心上海应用中心专注于数据智能技术赋能中国数字经济发展海致高性能图计算院士专家工作站郑纬民 - 年中国电子学会科学技术奖科技进步一等奖中国电子学会发布的《 2022 中国电子学会科学技术奖公告》，海致星图与北京邮电大学、蚂蚁科技集团有限公司、中移动信息技术有限公司联合研发的“大规模复杂异质图数据智能分析技术与规模化应用”项目，斩获“科学技术奖科技进步一等奖”，这也是国内电子信息领域的最高奖项。该奖项由数十名院士评审，历经三轮，从三百余个申报项目中遴选而出。由院士等组成的科技成果鉴定委员会认为：“该成果技术复杂模图数据所产生的建模能力不足、结构知识难用、巨量数据难算等技术挑战，实现了大规模复杂异质图数据的表示学习模型、语义推荐和风险管理关键技术，构建了完整的兼具理论指导与应用检验的大规模图数据智能分析系统与平台，满足了大数据时代从复杂异质图数据中进行知识发现的重要需求。最终获得国内外授权发明专利 43 项， CCF -A 类论文 51 篇，获得 2 次国际竞赛冠军，参与了 2 项图计算相关标准制定。

0 码力 | 38 页 | 24.68 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 05 C++11 开始的多线程编程

CMake 3.12 及以上（跨平台作业） Git 2.x （作业上传到 GitHub ） CUDA Toolkit 10.0 以上（ GPU 专题）温馨提示： 1. 会用到第二讲（ RAII 与智能指针）里的知识 2. 课件中一部分代码是基于 C++17 的个人认为， C++11 中很多特性，其实可以看做是为了支持多线程而顺带引入的……如 chrono 、移动、 lambda 、 RAII……

0 码力 | 79 页 | 14.11 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 13 C++ STL 容器全解之 vector

的这个显式构造函数，默认会把所有元素都初始化为 0 （不必手动去 memset ）。 • 如果是其他自定义类，则会调用元素的默认构造函数（例如：数字类型会初始化为 0 ， string 会初始化为空字符串，指针类型会初始化为 nullptr ） • explicit vector(size_t n); vector 容器：构造函数 • 这个显式构造函数还可以指定第二个参数，这样就可以用 0 以外的值初始化整个数组了。 noexcept; vector 容器： data() 获取首地址指针 • data() 会返回指向数组中首个元素的指针，也就是等价于 &a[0] 。由于 vector 是连续存储的数组，因此只要得到了首地址，下一个元素的地址只需指针 +1 即可。 • 因为指针的 p[i] 相当于 *(p + i) ，因此可以把 data() 返回的首地址指针当一个数组来访问。 • int *data() *data() const noexcept; vector 容器： data() 获取首地址指针 • data() 返回的首地址指针，通常配合 size() 返回的数组长度一起使用（见上一课《 C 语言指针》中提到，连续的动态数组只需要知道首地址和数组长度即可完全确定）。 • 用他来获取一个 C 语言原始指针 int * ，很方便用于调用 C 语言的函数和 API 等，同时还能享受到

0 码力 | 90 页 | 4.93 MB | 1 年前
3

共 21 条前往

页

C++高性性能高性能并行编程优化课件 12 02 08 17 15 06 07 游人 RustCC AtlasGraph 05 13

分类

语言

格式