翻译工作流程 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

C++高性能并行编程与优化 - 课件 - 07 深入浅出访存优化

宽。三级缓存也装不下，那就取决于主内存的带宽了。 • 结论：要避免 mem-bound ，数据量尽量足够小，如果能装的进缓存就高效了。 L2: 256 KB L3: 12 MB 缓存的工作机制：读 • 缓存中存储的数据结构： • struct CacheEntry { • bool valid; • uint64_t address; • char data[64]; 个字节时，实际会导致 0x0040~0x0080 的 64 字节数据整个被读取到缓存中。 • 这就是为什么我们喜欢把数据结构的起始地址和大小对齐到 64 字节，为的是不要浪费缓存行的存储空间。缓存的工作机制：写 • 缓存中存储的数据结构： • struct CacheEntry { • bool valid, dirty; • uint64_t address; • char ，决定要预取的地址。一般来说只有线性的地址访问规律（包括顺序、逆序；连续、跨步）能被识别出来，而如果你的访存是随机的，那就没办法预测。遇到这种突如其来的访存时， CPU 不得不空转等待数据的抵达才能继续工作，浪费了时间。解决：按更大的分块（ 4096 字节）随机访问 • 解决方案就是，把分块的大小调的更大一些，比如 4KB 那么大，即 64 个缓存行，而不是一个。 • 这样一次随机访问之后会伴随着

0 码力 | 147 页 | 18.88 MB | 1 年前
3
Zadig 面向开发者的云原生 DevOps 平台

构建 | 部署 | 测试 | 发布特点： ● 重复流程自动化 ● 边开发、边验证 ● 服务全生命周期而非只关注代码 ● 每天多次提交提早验证 Zadig 采用「云原生产品级交付」设计理念数字化产研协同 • 环境 - 统一开发者协作平面 • 工作流 - 统一交付变更通道 • 异构支持 - 统一产研运管理平面重视开发者体验，工程师不再做脏活累活 65% 功能实现开源支撑开源社区开发者环境易用性增强接入：安装 10 分钟以内，成功率达 90% 集成环境：支持开发者 Remote debug 工作流：效率和性能、开发者体验提升贡献者流程建立开放社区搭建 2021 年 5 月 2021 年 7 月 2021 年 9 月 2021 年 11 月 2021 年 12 月 1 个月功能改造建立产品发展委员会贡献者流程优化 2022 年 9 月场景深化能力增强 Helm/K8s YAML/ 托管场景接入流程优化 UX/UI 升级，工程师一线体验优化推出效能看板，实时客观度量工程数据指标效率优化、开发者体验增强 2023 年面向生态伙伴开放场景面向开发者提供 IDE 插件 / 自测环境通用工作流广泛链接生态赋能开发者

0 码力 | 59 页 | 81.43 MB | 1 年前
3
Zadig 产品使用手册

设计思路：通过「平台工程」解决流程挑战，通过「技术升级」提升组织效能 01 04 02 03 工程化协同：“人、技术、流程、工具” 四维协同基线，沉淀全流程数据，从感知到赋能，服务于工程师释放云基建能力：链接任何云及自建资源（容器、主机、车机、端等），释放云原生价值和企业创新力生态开放：广泛开放系统模块和 OpenAPI ，链接一切流程、服务、工具和上下游伙伴方案局限性大，安全性风险高无法支持敏捷交付模式支持从需求到发布全流程敏捷交付。尤其面向多服务并行部署发布，云原生构建环境和运行环境，基础设施对接及企业级 SSO/ 权限管理等运维管理类平台蓝鲸 Rainbond KubeSphere KubeVela 面向资源管理的运维工具集面向开发者，需结合 CI/CD 工具额外搭建全流程能力专门面向开发者的生产力平台，涵盖需求到开发，测试，运维的云原生一体化技术底座支撑安全可靠自动化部署云原生 CI/CD 工具 Tekton Argo 使用门槛高、学习成本高需要额外建设全流程能力接入和使用都极其简单，内置模板库和最佳实践，基于平台工程打造，可以轻松连接一切工具链企业自建 DevOps 流程平台围绕 Jenkins 或 CI/CD 工具搭建流程串接胶水平台局限性大扩展性差内部推广难度极高做完后价值难被证明通用性、可扩展性、技术先进性强，可以灵活

0 码力 | 52 页 | 22.95 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 17 由浅入深学习 map 容器

位于等号左侧还是右侧，分成两个独立的函数。 • 如果等号在左侧，则被他的 ast 模块视为写入上下文（ store context ），翻译成 __setitem__ 。 • 如果等号在右侧，则被他的 ast 模块视为读取上下文（ load context ），翻译成 __getitem__ 。 • 也就是说 Python 的 [] 其实是调用了两个不同的运算符重载： • m[key] = val 5, 7 }; • std::find(a.begin(), a.end(), 5); • 这个 std::find 就是标准库帮我们实现的线性数组中查找元素的算法，让我们用动画演示一下他的工作原理吧。 1 4 2 8 5 7 内存地址 a a+1 a+2 a+3 a+4 a+5 vector 查找为什么低效 • 我们要找的数是 5 ，首先从数组第一个元素开始，判断第一个元素是否等于

0 码力 | 90 页 | 8.76 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 11 现代 CMake 进阶指南

TBB::tbb 这个伪对象（他实际指向真正的 tbb 库文件路径 /usr/lib/libtbb.so ），之后通过 target_link_libraries 链接 TBB::tbb 就可以正常工作了。 TBB::tbb 的秘密：自带了一些 PUBLIC 属性 TBB::tbb 是一个伪对象 (imported) ，除了他会指向 /usr/lib/libtbb.so 之外， TBBConfig ${MYVAR} 这个变量。如果有这个变量则会被替换为变量的值来进行接下来的比较，否则保持原来字符串不变。如果我加了 ${} 会怎么样呢？ if (${MYVAR} MATCHES “Hello”) 会被翻译成 if (Hello MATCHES “Hello”) 但是因为找不到名为 Hello 的变量，所以会被直接当成普通的字符串来处理。也就是 if (“Hello” MATCHES “Hello”) 从而会执行真分支，结果正常。万一好巧不巧，正好定义了 Hello 这个变量呢？然而假如存在 Hello 这个变量，其值为 “ world” 。那么 if (${MYVAR} MATCHES “Hello”) 会被翻译成 if (Hello MATCHES “Hello”) 而因为 Hello 这个变量名存在，所以会被（出于历史原因的） if 进一步求值： if (“world” MATCHES “Hello”)

0 码力 | 166 页 | 6.54 MB | 1 年前
3
新一代分布式高性能图数据库的构建 - 沈游人

海致简介—企业级知识图谱开创者专业顶尖技术团队支撑超 700 人团队，其中 80% 为技术人员，创始团队在完成全球第一个中文知识图谱网站研发后，探索知识图谱技术在企业领域的应用。 2021 年，海致院士专家工作站成立，站内清华大学计算机博士生占比达 90% 以上。企业级数据解决方案专家为建行、工行、交行、招行、上交所、深交所、中国人寿等 70+ 银行证券保险企业、公安部、上海市公安局、武汉市公安局等专注于数据智能技术赋能中国数字经济发展海致高性能图计算院士专家工作站郑纬民 - 海致科技首席科学家中国工程院院士、清华大学计算机科学与技术系教授、中国计算机学会前理事长，中国计算机系统结构的学科带头人，我国高性能计算和存储系统等方面的泰斗和先行者。 2021 年 3 月 25 日，海致科技与清华大学计算机科学与技术系共同建设高性能图计算院士专家工作站。高性能图计算是高性能计算、图计算两项杂数据的实时处理和存储需求，是计算机领域竞争新战略制高点。产学结合、协同创新，打造全球领先的国产自研图数据库 AtlasGraph ，培育世界级的图计算软硬件生态体系，保持对全球科技竞争的战略均衡。海致高性能图计算院士专家工作站海致获得“ 2021 年 CCF 科学技术奖科技进步卓越奖” CCF 科学技术奖被认为是计算机科学与技术领域最具影响力的专业奖项之一，其中科技进步卓越奖是 CCF 科技进步奖评选中的最高级别奖项，旨在嘉奖在计

0 码力 | 38 页 | 24.68 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 15 C++ 系列课：字符与字符串

这些整数，而 8 位整数的表示范围是 2^8 也就是 0~255 ，足以表示所有 ASCII 字符了（多余的部分实际上被用于表示中文）。 • char 和整数无异，例如 ‘ a’ 实际上会被编译器翻译成他对应的 ASCII 码： 97 。写 ‘ a’ 和写 (char)97 是完全一样的，方便阅读的语法糖而已。 “char 即整数”思想应用举例 “char 即整数”思想应用举例 C 语言帮手函数）。 • 其中 char_traits 定义了字符串具体各种函数的实现，例如 length 默认为 strlen ，如果这里指定其他的 traits ，就可以替换其实现，改变 string 内部的工作方式。 allocator 也是同理，之后我们会专门有一节课讲 allocator 与内存分配。 • 后面两个参数是默认的，写 basic_string 就行了。 • 同理， string_view

0 码力 | 162 页 | 40.20 MB | 1 年前
3
Rust与算法 - 谢波

个人项目实践学习中总结探索 2015 年发布，很多人近几年才知道 Rust ， Rust 中国大会也才第三届，期待 Rust 中国大会第十届 Rust 处于起步阶段中文圈学习资料或书籍少，有部分是翻译国外产品，能不能中国人向国外输出作品 Rust 缺少学习资源 Rust 未来大有可为 Rust 在操作系统，数据库，各种框架和工具上应用范围广写作动机当情况不明时，抱着一个纯粹的目标干事就行了，其他

0 码力 | 28 页 | 3.52 MB | 1 年前
3
应用 waPC (rust) 做软件测试工具

• Guest 也可返回请求 host Invoke(ctx,operation,payload) WAPC 流程 • Uses Length of response and error to return result res,err:= Invoke… WAPC 流程 #[no_mangle] pub fn wapc_init() { wapc::register_function("ping"

0 码力 | 30 页 | 2.50 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 06 TBB 开启的并行编程之旅

时间复杂度（ time-efficiency ）与工作量复杂度（ work-efficiency ） • 在“小学二年级”算法课里，我们学过复杂度的概念，意思是算法执行所花费的时间取决于数据量的大小 n ，比如 O(n²) 表示花费时间和数据量的平方成正比。 • 对于并行算法，复杂度的评估则要分为两种： • 时间复杂度：程序所用的总时间（重点） • 工作复杂度：程序所用的计算量（次要） • 这这两个指标都是越低越好。时间复杂度决定了快慢，工作复杂度决定了耗电量。 • 通常来说，工作复杂度 = 时间复杂度 * 核心数量 • 1 个核心工作一小时， 4 个核心工作一小时。时间复杂度一样，而后者工作复杂度更高。 • 1 个核心工作一小时， 4 个核心工作 1/4 小时。工作复杂度一样，而后者时间复杂度更低。 • 并行的主要目的是降低时间复杂度，工作复杂度通常是不变的。甚至有牺牲工作复杂度换取时间复杂度的情形。 8 个元素的映射，花了 8 秒用电量： 1*8=8 度电结论：串行映射的时间复杂度为 O(n) ，工作复杂度为 O(n) ，其中 n 是元素个数并行映射 4 个线程，每人处理 2 个元素的映射，花了 2 秒用电量： 4*2=8 度电结论：并行映射的时间复杂度为 O(n/c) ，工作复杂度为 O(n) ，其中 c 是线程数量封装好了： parallel_for 面向初学者： parallel_for

0 码力 | 116 页 | 15.85 MB | 1 年前
3

共 17 条前往

页

分类

语言

格式

C++高性能并行编程与优化 - 课件 - 07 深入浅出访存优化

Zadig 面向开发者的云原生 DevOps 平台

Zadig 产品使用手册

C++高性能并行编程与优化 - 课件 - 17 由浅入深学习 map 容器

C++高性能并行编程与优化 - 课件 - 11 现代 CMake 进阶指南

新一代分布式高性能图数据库的构建 - 沈游人

C++高性能并行编程与优化 - 课件 - 15 C++ 系列课：字符与字符串

Rust与算法 - 谢波

应用 waPC (rust) 做软件测试工具

C++高性能并行编程与优化 - 课件 - 06 TBB 开启的并行编程之旅