字符匹配 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

C++高性能并行编程与优化 - 课件 - 15 C++ 系列课：字符与字符串

C++ 系列课：字符与字符串 by 小彭老师（ @archibate ）课件 & 代码： https://github.com/parallel101/course 上期回顾： https://www.bilibili.com/video/BV1m34y157wb 课程安排 1. vector 容器初体验 & 迭代器入门 (BV1qF411T7sd) 2. 你所不知道的 7. C++ 标准输入输出流 & 字符串格式化 8. traits 技术，用户自定义迭代器与算法 9. allocator ，内存管理与对象生命周期 ASCII 码第 1 章计算机如何表达字符 https://zh.wikipedia.org/wiki/ASCII 计算机如何表达字符 • 众所周知，计算机只能处理二进制整数，字符要怎么办呢？ • 于是就有了 ASCII 码表，他规定，每个英文字符（包括大小写字母、数字、特殊符号）都对应着一个整数。在计算机里只要存储这个的整数，就能代表这个字符了。 • 例如 32 代表空格， 48 代表 ‘ 0’ ， 65 代表 ‘ A’ ， 97 代表 ‘ a’…… • 32~126 这些整数就用于是表示这些可显示字符 (printable character) 的。计算机如何表达字符 • 除了可显示字符 (printable

0 码力 | 162 页 | 40.20 MB | 1 年前
3
现代C++ 教程：高速上手C++11/14/17/20

. . . . . . . . . . . . . . . . . . . . . 57 普通字符 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 特殊字符 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 原始字符串字面量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 自定义字面量 . . 注意：弃用并非彻底不能用，只是用于暗示程序员这些特性将从未来的标准中消失，应该尽量避免使用。但是，已弃用的特性依然是标准库的一部分，并且出于兼容性的考虑，大部分特性其实会『永久』保留。 • 不再允许字符串字面值常量赋值给一个 char *。如果需要用字符串字面值常量赋值和初始化一个 char *，应该使用 const char * 或者 auto。 char *str = "hello world!"; // 将出现弃用警告

0 码力 | 83 页 | 2.42 MB | 1 年前
3
Hello 算法 1.0.0b5 C++版

52 3.3 数字编码 * . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 3.4 字符编码 * . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 3.5 小结 . . . 对数阶常见于分治算法。例如归并排序，输入长度为 ? 的数组，每轮递归将数组从中点划分为两半，形成高度为 log ? 的递归树，使用 ?(log ?) 栈帧空间。再例如将数字转化为字符串，输入一个正整数 ? ，它的位数为 log10 ?+1 ，即对应字符串长度为 log10 ?+1 ，因此空间复杂度为 ?(log10 ? + 1) = ?(log ?) 。 2.4.4 权衡时间与空间理想情况下，我们希望算法 CPU 可以直接进行运算的类型，在算法中直接被使用，主要包括以下几种类型。 ‧ 整数类型 byte、short、int、long 。 ‧ 浮点数类型 float、double ，用于表示小数。 ‧ 字符类型 char ，用于表示各种语言的字母、标点符号、甚至表情符号等。 ‧ 布尔类型 bool ，用于表示“是”与“否”判断。基本数据类型以二进制的形式存储在计算机中。一个二进制位即为 1 比特。在绝大多数现代系统中，1

0 码力 | 377 页 | 30.69 MB | 1 年前
3
Hello 算法 1.0.0 C++版

54 3.3 数字编码 * . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 3.4 字符编码 * . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 3.5 小结 . . . 对数阶常见于分治算法。例如归并排序，输入长度为 ? 的数组，每轮递归将数组从中点处划分为两半，形成高度为 log ? 的递归树，使用 ?(log ?) 栈帧空间。再例如将数字转化为字符串，输入一个正整数 ? ，它的位数为 ⌊log10 ?⌋ + 1 ，即对应字符串长度为 ⌊log10 ?⌋ + 1 ，因此空间复杂度为 ?(log10 ? + 1) = ?(log ?) 。 2.4.4 权衡时间与空间理想情况下，我 CPU 可以直接进行运算的类型，在算法中直接被使用，主要包括以下几种。 ‧ 整数类型 byte、short、int、long 。 ‧ 浮点数类型 float、double ，用于表示小数。 ‧ 字符类型 char ，用于表示各种语言的字母、标点符号甚至表情符号等。 ‧ 布尔类型 bool ，用于表示“是”与“否”判断。基本数据类型以二进制的形式存储在计算机中。一个二进制位即为 1 比特。在绝大多数现代操作系统中，1

0 码力 | 378 页 | 17.59 MB | 1 年前
3
Hello 算法 1.1.0 C++ 版

54 3.3 数字编码 * . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 3.4 字符编码 * . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 3.5 小结 . . . 对数阶常见于分治算法。例如归并排序，输入长度为 ? 的数组，每轮递归将数组从中点处划分为两半，形成高度为 log ? 的递归树，使用 ?(log ?) 栈帧空间。再例如将数字转化为字符串，输入一个正整数 ? ，它的位数为 ⌊log10 ?⌋ + 1 ，即对应字符串长度为 ⌊log10 ?⌋ + 1 ，因此空间复杂度为 ?(log10 ? + 1) = ?(log ?) 。 2.4.4 权衡时间与空间理想情况下，我 CPU 可以直接进行运算的类型，在算法中直接被使用，主要包括以下几种。 ‧ 整数类型 byte、short、int、long 。 ‧ 浮点数类型 float、double ，用于表示小数。 ‧ 字符类型 char ，用于表示各种语言的字母、标点符号甚至表情符号等。 ‧ 布尔类型 bool ，用于表示“是”与“否”判断。基本数据类型以二进制的形式存储在计算机中。一个二进制位即为 1 比特。在绝大多数现代操作系统中，1

0 码力 | 379 页 | 18.47 MB | 1 年前
3
Hello 算法 1.2.0 简体中文 C++ 版

54 3.3 数字编码 * . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 3.4 字符编码 * . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 3.5 小结 . . . 对数阶常见于分治算法。例如归并排序，输入长度为 ? 的数组，每轮递归将数组从中点处划分为两半，形成高度为 log ? 的递归树，使用 ?(log ?) 栈帧空间。再例如将数字转化为字符串，输入一个正整数 ? ，它的位数为 ⌊log10 ?⌋ + 1 ，即对应字符串长度为 ⌊log10 ?⌋ + 1 ，因此空间复杂度为 ?(log10 ? + 1) = ?(log ?) 。 2.4.4 权衡时间与空间理想情况下，我 CPU 可以直接进行运算的类型，在算法中直接被使用，主要包括以下几种。 ‧ 整数类型 byte、short、int、long 。 ‧ 浮点数类型 float、double ，用于表示小数。 ‧ 字符类型 char ，用于表示各种语言的字母、标点符号甚至表情符号等。 ‧ 布尔类型 bool ，用于表示“是”与“否”判断。基本数据类型以二进制的形式存储在计算机中。一个二进制位即为 1 比特。在绝大多数现代操作系统中，1

0 码力 | 379 页 | 18.48 MB | 10 月前
3
Hello 算法 1.2.0 繁体中文 C++ 版

在計算機中，所有資料都是以二進位制數的形式儲存的，字元 char 也不例外。為了表示字元，我們需要建立一套“字符集”，規定每個字元和二進位制數之間的一一對應關係。有了字符集之後，計算機就可以透過查表完成二進位制數到字元的轉換。 3.4.1 ASCII 字符集 ASCII 碼是最早出現的字符集，其全稱為 American Standard Code for Information Interchange（美國碼僅能夠表示英文。隨著計算機的全球化，誕生了一種能夠表示更多語言的 EASCII 字符集。它在 ASCII 的 7 位基礎上擴展到 8 位，能夠表示 256 個不同的字元。在世界範圍內，陸續出現了一批適用於不同地區的 EASCII 字符集。這些字符集的前 128 個字元統一為 ASCII 碼，後 128 個字元定義不同，以適應不同語言的需求。 3.4.2 GBK 字符集後來人們發現，EASCII 碼仍然無法滿足許碼仍然無法滿足許多語言的字元數量要求。比如漢字有近十萬個，光日常使用的就有幾千個。中國國家標準總局於 1980 年釋出了 GB2312 字符集，其收錄了 6763 個漢字，基本滿足了漢字的計算機處理需要。然而，GB2312 無法處理部分罕見字和繁體字。GBK 字符集是在 GB2312 的基礎上擴展得到的，它共收錄了 21886 個漢字。在 GBK 的編碼方案中，ASCII 字元使用一個位元組表示，漢字使用兩個位元組表示。

0 码力 | 379 页 | 18.79 MB | 10 月前
3
Hello 算法 1.0.0b4 C++版

3.3. 数字编码 * . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 3.4. 字符编码 * . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 3.5. 小结 . . 例如“归并排序”算法，输入长度为 ? 的数组，每轮递归将数组从中点划分为两半，形成高度为 log ? 的递归树，使用 ?(log ?) 栈帧空间。再例如“数字转化为字符串”，输入任意正整数 ? ，它的位数为 log10 ? ，即对应字符串长度为 log10 ? ，因此空间复杂度为 ?(log10 ?) = ?(log ?) 。 2.3.4. 权衡时间与空间理想情况下，我们希望算法的时间复可以直接进行运算的类型，在算法中直接被使用。它包括： ‧ 整数类型 byte , short , int , long 。 ‧ 浮点数类型 float , double ，用于表示小数。 ‧ 字符类型 char ，用于表示各种语言的字母、标点符号、甚至表情符号等。 ‧ 布尔类型 bool ，用于表示“是”与“否”判断。所有基本数据类型都以二进制的形式存储在计算机中。在计算机中，我们将 1

0 码力 | 343 页 | 27.39 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 12 从计算机组成原理看 C 语言指针

16 位 int 32 位 32 位 32 位 32 位 long 32 位 64 位 32 位 32 位 long long 64 位 64 位 64 位 64 位 char 又称字符类型，可以表示一个字符，因而得名。 short 是短整数类型，大小为 16 位或者说 2 字节。 int 是整数类型，大小为 32 位或者说 4 字节。 long long 是超长整数类型，大小为 64 位或者说变化的。 • 如果 64 位系统上 size_t 还是 uint32_t ，那就无法表示超过 4GB 大小的数组了。 • 今日乳 ja 笑话： java 的字符串常量不能超过 65535 个字符，因为他们是用 uint16_t 表示字符串长度。 • 因此对于表示”长度”、”大小”的用途，可以用 size_t 这个直观的名字，他和 uintptr_t 等价。 • size_t 是标准库大量使用的用于表示大小的类型，例如的错误：不会编译时检测参数类型是否正确 • 第一个 bug 是， printf 其实不知道他的参数是什么类型，他只看到你字符串里写的 “ %f” ，会误以为输入的是 float 参数。 • 如果你输入的是 3 这样的 int 类型常量， C 语言不会帮你检测到他和 “ %f” 其实是不匹配的，而是直接把 int 类型的 4 个字节推到栈上作为 printf 的参数，而 printf 却会把这

0 码力 | 128 页 | 2.95 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 03 现代 C++ 进阶：模板元编程

分离声明和定义，直接写在头文件里即可。如果分离还要罗列出所有模板参数的排列组合，违背了开 - 闭原则。模板的惰性：延迟编译 • 要证明模板的惰性，只需看这个例子： • 要是编译器哪怕细看了一眼：字符串怎么可能被写入呢？肯定是会出错的。 • 但是却没有出错，这是因为模板没有被调用，所以不会被实际编译！ • 而只有当 main 调用了这个函数，才会被编译，才会报错！ • 用一个假模板实现延迟 variant ：判断当前是哪个类型用 v.index() • 除了这个之外，还可以用成员方法 index() 获取当前是参数列表中的第几个类型。这样也可以实现判断。 variant ：批量匹配 std::visit • 如果你的 if-else 每个分支长得都差不多（除了 std::get<> 的类型不一样以外），可以考虑用 std::visit ，他会自动用相应的类型，调用你的名著不看红楼梦，后面我忘了，总之就是只能度过一个相对失败的人生 :) std::visit ：还支持多个参数 • 其实还可以有多个 variant 作为参数。 • 相应地 lambda 的参数数量要与之匹配。 • std::visit 会自动罗列出所有的排列组合！ • 所以如果 variant 有 n 个类型，那 lambda 就要被编译 n² 次，编译可能会变慢。 • 但是标准库能保证运行时是

0 码力 | 82 页 | 12.15 MB | 1 年前
3

共 22 条前往

页

C++高性性能高性能并行编程优化课件 15 现代教程高速上手 11 14 17 20 Hello 算法 1.0 0b5 1.1 1.2 简体中文简体中文繁体繁体中文 0b4 12 03

分类

语言

格式