接口部分 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

Go读书会第二期

语言精进之路导读 0 2 我是怎么读书的 0 3 写书的历程第一部分程序员的“小目标”与写书三要素写书三要素写书 <- 能力 +意愿 + 机会过程写书不易，写高质量的书更难 2018 年下旬开始动笔 2020 年 11 月下旬初稿交付 2021 年 12 月出版《 Go 语言精进之路》导读第二部分整体写作思路异曲同工精进之路，思维先行 – part1 • 变长参数函数妙用 • 方法的本质、 receiver 参数类型选择、方法集合 Go 程序逻辑的基本承载单元 Part5 – 语法核心：接口践行哲学，遵循惯例，认清本质，理解原理 • 接口的内部表示 • 接口设计 • 接口与组合接口：一切皆组合 Part6 – 语法核心：并发编程践行哲学，遵循惯例，认清本质，理解原理 • 并发设计 vs. 并行设计 • 并发原语的原理与应用模式 GoProgrammingFromBeginnerToMaster 读书实践与体会第三部分 Go 技术图书阅读：从外刊到内刊 Go 中文图书 Go 外文图书读书方法精读 • 选择高质量图书 • 脑图 + 细节摘录 + 行动清单（输出）泛读 • 闲书 ( 不烧脑 ) • 碎片化（快读） + 听书小结第四部分小结 • 写书三要素 • Go 精进之路导读：思维先行，践行哲学，遵循惯例，认清本

0 码力 | 26 页 | 4.55 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 17 由浅入深学习 map 容器

，内存管理与对象生命周期 10. C++ 异常处理机制的前世今生我们都要认真鞋习哦我们都要认真鞋习哦第一章：读取与写入我负责监督你鞋习 ! 我负责监督你鞋习 ! map 查找元素的两个接口 • map 提供了两个查找元素的接口，一曰 [] ，二曰 at 。 • 那么他们两个又有什么区别呢？很多新手都分不清他俩，可能只认识 [] 。读取 map 元素 • map m; 。而如果另一个同学是硬核的计算机思维，相当于 C++ 的一视同仁 API ，他会以为小彭老师真的在吃答辩。 • 这是通常来说，不过万一小彭老师真的这么重口味在吃答辩呢？要怎么传达这个信息？ C++ 一视同仁的接口就能处理这种罕见的情况，不过 Python 用一些 if 语句套一套一样可以。深入理解 Python 中 [] 能自动区分是读是写的原理 • 写入要创建元素，而读取则要在元素不存在时出错，确实应该是两个不同的函数。简单粗暴的 Java 用法 • 与 Python 和 C++ 不同， Java 放弃了花里胡哨的运算符重载，索性都采用成员函数 get put 来表示，非常明确。主要是为了把 get 和 put 作为接口函数，可以对应多个具体实现。错误示范 • 小彭老师说过，读取必须用 at 。 • 而这位同学却用了 [] 来读取 items 里的值。 • 乍看之下好像没错，运行结果也是正确的，但这只是碰巧你的

0 码力 | 90 页 | 8.76 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 13 C++ STL 容器全解之 vector

来把数组设为空。 • void clear() noexcept; vector 容器： clear 配合 resize • resize 会保留原数组的前面部分不变，只在后面填充上 0 。 • 如果需要把原数组前面的部分也填充上 0 ，可以先 clear 再 resize ，这是一个常见的组合。 • void clear() noexcept; vector 容器： push_back 函数返回之后解构） vector 容器： resize 到更大尺寸会导致 data 失效 • 当 resize 的目标长度大于原有的容量时，就需要重新分配一段更大的连续内存，并把原数组长度的部分移动过去，多出来的部分则用 0 来填充。这就导致元素的地址会有所改变，从而过去 data 返回的指针以及所有的迭代器对象，都会失效。 vector 容器： resize 到更小尺寸不会导致 data 况下，只用最简单的接口（首地址指针）就完成了遍历和打印的操作。迭代器模式 • 使用指针和长度做接口的好处是，可以通过给指针加减运算，选择其中一部分连续的元素来打印，而不一定全部打印出来。 • 比如这里我们选择打印前三个元素（去掉了最后一个元素，但不必用 pop_back 修改数组，只要传参数的时候修改一下长度部分即可）。迭代器模式 • 使用指针和长度做接口的好处是，可以通

0 码力 | 90 页 | 4.93 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 15 C++ 系列课：字符与字符串

表示回车（‘ \r’ ） • 27 表示 ESC 键（‘ \x1b’ ） • 127 表示 DEL 键（‘ \x7f’ ）等 • 0~31 和 127 这些整数，就构成了 ASCII 码中控制字符的部分。关于控制字符的一个冷知识 • 在 Linux 命令行中启动 cat 。 • 试试按 Ctrl+R ， Ctrl+E ， Ctrl+C 等一系列组合键，看到出现了什么？ • 可以看到显示的字符变成了语言中规定字符类型为 char 类型，是个 8 位整数。 • 这是因为 ASCII 码只有 0~127 这些整数，而 8 位整数的表示范围是 2^8 也就是 0~255 ，足以表示所有 ASCII 字符了（多余的部分实际上被用于表示中文）。 • char 和整数无异，例如 ‘ a’ 实际上会被编译器翻译成他对应的 ASCII 码： 97 。写 ‘ a’ 和写 (char)97 是完全一样的，方便阅读的语法糖而已。利用 C 语言字符串“以 0 结尾”这个特点，我们可以在一个本来非 0 的字符处写入 0 ，来提前结束字符串。例如在第 n 个字符写入 0 ，就会只保留前 n 个字符作为一个子字符串，删除后半部分。 “0 结尾字符串”知识点应用举例 • C 语言所谓的字符串类型 char * 实际上就是个首地址指针，如果让首地址指针向前移动 n 位，那就实现删除前 n 个字符的效果，而不用实际修改数组本身（更高效）。

0 码力 | 162 页 | 40.20 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 05 C++11 开始的多线程编程

及以上（跨平台作业） Git 2.x （作业上传到 GitHub ） CUDA Toolkit 10.0 以上（ GPU 专题）温馨提示： 1. 会用到第二讲（ RAII 与智能指针）里的知识 2. 课件中一部分代码是基于 C++17 的个人认为， C++11 中很多特性，其实可以看做是为了支持多线程而顺带引入的……如 chrono 、移动、 lambda 、 RAII…… 第 0 章：时间 C std::unique_lock 或 std::lock_guard 的第二个参数，这时他们会默认 mtx 已经上锁。 std::unique_lock 和 std::mutex 具有同样的接口 • 其实 std::unique_lock 具有 mutex 的所有成员函数： lock(), unlock(), try_lock(), try_lock_for() 等。除了他会在解构时按需自动调用这种只要具有某些指定名字的成员函数，就判断一个类是否满足某些功能的思想，在 Python 称为鸭子类型，而 C++ 称为 concept （概念）。比起虚函数和动态多态的接口抽象， concept 使实现和接口更加解耦合且没有性能损失。第 4 章：死锁同时锁住多个 mutex ：死锁难题 • 由于同时执行的两个线程，他们中发生的指令不一定是同步的，因此有可能出现这种情况：

0 码力 | 79 页 | 14.11 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 09 CUDA C++ 流体仿真实战

我们统一通过 unique_ptr 来管理对象，这样尽管 CudaSurface 对象是不可移动的，我们仍可以通过移动其指针的方式来实现双缓冲（ std::swap ）。对流部分对流部分：计算对流后位置（ RK3 ） • 这里我参考了 Taichi 官方案例中的 stable_fluid.py 代码（二维定常流仿真），主要由 k-ye 编写，我学习 GAMES201 后贡献了支持（ semi-lagrangian ）对流。对流部分：根据对流后位置重新采样 • 和 k-ye 思路不同的是我先在刚刚的 advect_kernel 算出对流后要采样的位置（ loc ），然后再对 vel 和 clr 根据刚刚算得的 loc 移动位置。这样 RK3 的对流只需要算一遍，避免重复对每个场都做一次对流的开销。对流部分：最终实现 • 然后，在 SmokeSim::advection clr ，并且读写是不同的坐标位置。 • 因此对 clr 和 vel 使用了双缓冲，写入 clrNext 的同时读取 clr 没有冲突，写入完毕后对调 clrNext 和 clr 。投影部分投影部分 • 我们要模拟的流体是不可压缩的，因此有着无散度的特点： div v = 0 • 上式对时间求导，即 d(div v)/dt = div dv/dt = 0 ；带入 dv/dt = -p

0 码力 | 58 页 | 14.90 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - Zeno 中的现代 C++ 最佳实践

这样只需要写一遍 eatTwice ，就可以对猫和狗都适用，实现代码的复用（ dont-repeat-yourself ），也让函数的作者不必去关注点从猫和狗的其他具体细节，只需把握住他们统一具有的“吃”这个接口。小知识： shared_ptr 如何深拷贝？浅拷贝：深拷贝：思考：能不能把拷贝构造函数也作为虚函数？ • 现在我们的需求有变，不是去对同一个对象调用两次 eatTwice ，而是先把对象复制一份他的源码，但你的老板却要求你把 speak 变成一个虚函数！怎么样，是不是准备好递交辞呈了？慢着，让万能的小彭老师来救你！类型擦除：还是以猫和狗为例 • 你还是可以照常定义一个 Animal 接口，其具有一个纯虚函数 speak 。然后定义一个模板类 AnimalWrapper ，他的模板参数 Inner 则是用来创建他的一个成员 m_inner 。 • 然后，给 AnimalWrapper 类型全局变量 helper ，然后他的右边其实是可以写一个表达式的，这个表达式实际上会在 main 函数之前执行！ • 全局变量的初始化会在 main 之前执行，这实际上是 C++ 标准的一部分，我们完全可以放心利用这一点来执行任意表达式。 • 对于 DLL 来说则是 DLL 加载时执行表达式。逗号表达式的妙用 • 那么这里是因为比较巧合， printf 的返回类型正好是

0 码力 | 54 页 | 3.94 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 03 现代 C++ 进阶：模板元编程

比如，利用重载实现“将一个数乘以 2” 这个功能，需要：为什么面向对象在 HPC 不如函数式和元编程香了？这个例子要是按传统的面向对象思想，可能是这样：令 Int, Float, Double 继承 Numeric 接口类并实现，其中 multiply(int) 作为虚函数。然后定义： Numeric *twice(Numeric *t) { return t->multiply(2); } 且不说这样的性能问题，你忍得住寂寞去重复定义好 V> // 错误！模板参数：多个模板参数 • int N 和 class T 可以一起使用。 • 你只需要指定其中一部分参数即可，会自动根据参数类型（ T msg ）、默认值（ int N = 1 ），推断尖括号里没有指定的那些参数。模板参数：参数部分特化 1. func(T t) 完全让参数类型取决于调用者。 2. func(vector t) 这样则可以限定仅仅这样则可以限定仅仅为 vector 类型的参数。 • 这里用了 const & 避免不必要的的拷贝。 • 不过，这种部分特化也不支持隐式转换。为什么要支持整数作为模板参数：因为是编译期常量 • 你可能会想，模板只需要支持 class T 不就行了？反正 int N 可以作为函数的参数传入，模板还不支持浮点。 • template void func(); • 和 •

0 码力 | 82 页 | 12.15 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 08 CUDA 开启的 GPU 编程

新特性，都可以用。甚至可以把任何一个 C++ 项目的文件后缀名全部改成 .cu ，都能编译出来。 • 这是 CUDA 的一大好处， CUDA 和 C++ 的关系就像 C++ 和 C 的关系一样，大部分都兼容，因此能很方便地重用 C++ 现有的任何代码库，引用 C++ 头文件等。 • host 代码和 device 代码写在同一个文件内，这是 OpenCL 做不到的。编写一段在 GPU 指令针对 CPU 和 GPU 生成不同的代码 • CUDA 编译器具有多段编译的特点。 • 一段代码他会先送到 CPU 上的编译器（通常是系统自带的编译器比如 gcc 和 msvc ）生成 CPU 部分的指令码。然后送到真正的 GPU 编译器生成 GPU 指令码。最后再链接成同一个文件，看起来好像只编译了一次一样，实际上你的代码会被预处理很多次。 • 他在 GPU 编译模式下会定义 __CUDA_ARCH__ 的数组，返回其起始地址 • void deallocate(T *p, size_t n) // 释放长度为 n ，起始地址为 p ，类型为 T 的数组抽象的 std::allocator 接口 • vector 会调用 std::allocator 的 allocate/deallocate 成员函数，他又会去调用标准库的 malloc/free 分配和释放内存空间（即他分配是的

0 码力 | 142 页 | 13.52 MB | 1 年前
3
Rust 异步并发框架在移动端的应用 - 陈明煜

移动端诉求：易用性 • IO 密集性任务与 CPU 密集型任务融合异步并发框架如 tokio 大多用于处理大量异步 IO 场景，而 CPU 密集型任务一般使用 rayon 。当前单框架提供的接口无法使用户在一个任务中同时处理 IO 任务以及 CPU 任务。 Incompatibility of the third party Runtime with Mobile 现有框架无法完美适配移动端（二） queue task New task Global queue New task take & run take & run Worker take & run Steal & run 两种接口拥有两套割裂的调度模式和线程池华为 Ylong 异步并发框架 Ylong Runtime 并发框架华为 Rust 异步并发框架，近期计划在 OpenHarmony 上开源。与 Tokio 类似，同样为事类似，同样为事件驱动型调度框架，提供异步 IO 、定时器、同步原语等功能。但额外提供：  任务优先级调度  异步并行迭代器  结构化并发 Ylong Runtime 对外接口 APP/SA 调度器提交任务 Async function CPU Task CPU Task IO Task IO Task Executor 高中低线程池 Reactor

0 码力 | 25 页 | 1.64 MB | 1 年前
3

共 28 条前往

页

go golang C++高性性能高性能并行编程优化课件 17 13 15 05 09 03 08 陈明煜 2023RustChinaConf

分类

语言

格式

Go读书会第二期

C++高性能并行编程与优化 - 课件 - 17 由浅入深学习 map 容器

C++高性能并行编程与优化 - 课件 - 13 C++ STL 容器全解之 vector

C++高性能并行编程与优化 - 课件 - 15 C++ 系列课：字符与字符串

C++高性能并行编程与优化 - 课件 - 05 C++11 开始的多线程编程

C++高性能并行编程与优化 - 课件 - 09 CUDA C++ 流体仿真实战

C++高性能并行编程与优化 - 课件 - Zeno 中的现代 C++ 最佳实践

C++高性能并行编程与优化 - 课件 - 03 现代 C++ 进阶：模板元编程

C++高性能并行编程与优化 - 课件 - 08 CUDA 开启的 GPU 编程

Rust 异步并发框架在移动端的应用 - 陈明煜