Hello 算法 1.2.0 简体中文 Python 版那个时代的研究人员就在想:如果推出一个足够完整的字符集,将世界范围内的所有语言和符号都收录其 中,不就可以解决跨语言环境和乱码问题了吗?在这种想法的驱动下,一个大而全的字符集 Unicode 应运而 生。 Unicode 的中文名称为“统一码”,理论上能容纳 100 多万个字符。它致力于将全球范围内的字符纳入统一 的字符集之中,提供一种通用的字符集来处理和显示各种语言文字,减少因为编码标准不同而产生的乱码问 题。 自 到 4 字节 来表示一个字符,根据字符的复杂性而变。ASCII 字符只需 1 字节,拉丁字母和希腊字母需要 2 字节,常用 第 3 章 数据结构 www.hello‑algo.com 60 的中文字符需要 3 字节,其他的一些生僻字符需要 4 字节。 UTF‑8 的编码规则并不复杂,分为以下两种情况。 ‧ 对于长度为 1 字节的字符,将最高位设置为 0 ,其余 7 位设置为 Unicode 更占用空间,特别是 对于 ASCII 字符占比较高的文本。 从存储空间占用的角度看,使用 UTF‑8 表示英文字符非常高效,因为它仅需 1 字节;使用 UTF‑16 编码某些 非英文字符(例如中文)会更加高效,因为它仅需 2 字节,而 UTF‑8 可能需要 3 字节。 从兼容性的角度看,UTF‑8 的通用性最佳,许多工具和库优先支持 UTF‑8 。 第 3 章 数据结构 www.hello‑algo0 码力 | 364 页 | 18.43 MB | 10 月前3
Hello 算法 1.2.0 繁体中文 Python 版那個時代的研究人員就在想:如果推出一個足夠完整的字符集,將世界範圍內的所有語言和符號都收錄其 中,不就可以解決跨語言環境和亂碼問題了嗎?在這種想法的驅動下,一個大而全的字符集 Unicode 應運而 生。 Unicode 的中文名稱為“統一碼”,理論上能容納 100 多萬個字元。它致力於將全球範圍內的字元納入統一 的字符集之中,提供一種通用的字符集來處理和顯示各種語言文字,減少因為編碼標準不同而產生的亂碼問 題。 自 4 位元 組來表示一個字元,根據字元的複雜性而變。ASCII 字元只需 1 位元組,拉丁字母和希臘字母需要 2 位元組, 第 3 章 資料結構 www.hello‑algo.com 60 常用的中文字元需要 3 位元組,其他的一些生僻字元需要 4 位元組。 UTF‑8 的編碼規則並不複雜,分為以下兩種情況。 ‧ 對於長度為 1 位元組的字元,將最高位設定為 0 ,其餘 7 位設定為 Unicode 更佔用空間,特別 是對於 ASCII 字元佔比較高的文字。 從儲存空間佔用的角度看,使用 UTF‑8 表示英文字元非常高效,因為它僅需 1 位元組;使用 UTF‑16 編碼某 些非英文字元(例如中文)會更加高效,因為它僅需 2 位元組,而 UTF‑8 可能需要 3 位元組。 從相容性的角度看,UTF‑8 的通用性最佳,許多工具和庫優先支持 UTF‑8 。 第 3 章 資料結構 www.hello‑algo0 码力 | 364 页 | 18.74 MB | 10 月前3
Python3 基础教程 - 廖雪峰Python3 基础教程【完整版】 http://www.yeayee.com/ 5/531 Python 教程 这是小白的 Python 新手教程,具有如下特点: 中文,免费,零起点,完整示例,基于最新的 Python 3 版本。 Python 是一种计算机程序设计语言。你可能已经听说过很多种流行的编 程语言,比如非常难学的 C 语言,非常流行的 Java 语言,适合初学者 来。 那么问题来了:文本编辑器到底哪家强? 推荐两款文本编辑器: 一个是 Sublime Text,免费使用,但是不付费会弹出提示框: 一个是 Notepad++,免费使用,有中文界面: Python3 基础教程【完整版】 http://www.yeayee.com/ 21/531 请注意,用哪个都行,但是绝对不能用 Word 和 Windows 自带的记事本。 机里,也就是大小写英文字母、数字和一些符号,这个编码表被称为 ASCII 编码,比如大写字母 A 的编码是 65,小写字母 z 的编码是 122。 但是要处理中文显然一个字节是不够的,至少需要两个字节,而且还不 能和 ASCII 编码冲突,所以,中国制定了 GB2312 编码,用来把中文编进 去。 你可以想得到的是,全世界有上百种语言,日本把日文编到 Shift_JIS 里,韩国把韩文编到 Euc-kr 里,各国有各国的标准,就会不可避免地出0 码力 | 531 页 | 5.15 MB | 1 年前3
Hello 算法 1.1.0 Python版那个时代的研究人员就在想:如果推出一个足够完整的字符集,将世界范围内的所有语言和符号都收录其 中,不就可以解决跨语言环境和乱码问题了吗?在这种想法的驱动下,一个大而全的字符集 Unicode 应运而 生。 Unicode 的中文名称为“统一码”,理论上能容纳 100 多万个字符。它致力于将全球范围内的字符纳入统一 的字符集之中,提供一种通用的字符集来处理和显示各种语言文字,减少因为编码标准不同而产生的乱码问 题。 自 编码方法。它是一种可变长度的编码,使用 1 到 4 字节 来表示一个字符,根据字符的复杂性而变。ASCII 字符只需 1 字节,拉丁字母和希腊字母需要 2 字节,常用 第 3 章 数据结构 hello‑algo.com 60 的中文字符需要 3 字节,其他的一些生僻字符需要 4 字节。 UTF‑8 的编码规则并不复杂,分为以下两种情况。 ‧ 对于长度为 1 字节的字符,将最高位设置为 0 ,其余 7 位设置为 Unicode 更占用空间,特别是 对于 ASCII 字符占比较高的文本。 从存储空间占用的角度看,使用 UTF‑8 表示英文字符非常高效,因为它仅需 1 字节;使用 UTF‑16 编码某些 非英文字符(例如中文)会更加高效,因为它仅需 2 字节,而 UTF‑8 可能需要 3 字节。 从兼容性的角度看,UTF‑8 的通用性最佳,许多工具和库优先支持 UTF‑8 。 第 3 章 数据结构 hello‑algo0 码力 | 364 页 | 18.42 MB | 1 年前3
Hello 算法 1.0.0 Python版那个时代的研究人员就在想:如果推出一个足够完整的字符集,将世界范围内的所有语言和符号都收录其 中,不就可以解决跨语言环境和乱码问题了吗?在这种想法的驱动下,一个大而全的字符集 Unicode 应运而 生。 「Unicode」的中文名称为“统一码”,理论上能容纳 100 多万个字符。它致力于将全球范围内的字符纳入统 一的字符集之中,提供一种通用的字符集来处理和显示各种语言文字,减少因为编码标准不同而产生的乱码 问题。 自 编码方法。它是一种可变长度的编码,使用 1 到 4 字节 来表示一个字符,根据字符的复杂性而变。ASCII 字符只需 1 字节,拉丁字母和希腊字母需要 2 字节,常用 第 3 章 数据结构 hello‑algo.com 60 的中文字符需要 3 字节,其他的一些生僻字符需要 4 字节。 UTF‑8 的编码规则并不复杂,分为以下两种情况。 ‧ 对于长度为 1 字节的字符,将最高位设置为 0 ,其余 7 位设置为 Unicode 更占用空间,特别是 对于 ASCII 字符占比较高的文本。 从存储空间占用的角度看,使用 UTF‑8 表示英文字符非常高效,因为它仅需 1 字节;使用 UTF‑16 编码某些 非英文字符(例如中文)会更加高效,因为它仅需 2 字节,而 UTF‑8 可能需要 3 字节。 从兼容性的角度看,UTF‑8 的通用性最佳,许多工具和库优先支持 UTF‑8 。 第 3 章 数据结构 hello‑algo0 码力 | 362 页 | 17.54 MB | 1 年前3
Django 官方教程翻译项目书栈(BookStack.CN) 构建 README Django-intro-zh Django 官方教程翻译项目 目前版本:1.11 官方文档目录 中文版文档 翻译进度 我也想一起翻译 这个项目的目的是将 Django 官方教程的 intro 部分 翻译成中文版。 起因是在看完 Django Book 之后觉得有点过时,随后看了官方文档,还是觉得官方文档写的比较 通俗易懂。为了方便更多想要学习 Django 官方教程翻译项目 目前版本:1.11 官方文档目录 README - 3 - 本文档使用 书栈(BookStack.CN) 构建 Writing your first patch for Django 中文版文档请到 github page 查看,下方目录在 github page 点击才有效。 初识 Django 快速安装指南 创建你的第一个 Django 项目, 第一部分 创建你的第一个 Django your first patch for Django [==========] 100/100 欢迎一切有时间有能力的小伙伴一起来翻译。 流程: 1. 到任务大厅认领任务。 中文版文档 翻译进度 我也想一起翻译 README - 4 - 本文档使用 书栈(BookStack.CN) 构建 2. 任务申请被接受后,Fork 本项目。 3. 仔细阅读 正在讨论中的画0 码力 | 103 页 | 1.86 MB | 1 年前3
Flask入门教程程序的完整流程,包括每一行代码块,每一个需要 执行的命令。在阅读时,你需要自己输入每一个代码和命令,检查输出是否和书中 一致。在这个过程中,你也可以对它进行一些调整。比如,示例程序的界面语言使 用了英文,你可以修改为中文或是其他语言。对于页面布局和样式,你也可以自由 修改。 在本书的最后,你会把你自己编写的 Watchlist 部署到互联网上,让任何人都可以 访问。 讨论与反馈 如果你有任何疑问和想法,欢迎通过下面的方式提出: commit:eca06dc。 进阶提示 如果你使用 Python 2.7,为了使程序正常工作,需要在脚本首行添加编码声明 # -*- coding: utf-8-*- ,并在包含中文的字符串前面添加 u 前缀。本 书中对于包含中文的字符串均添加了 u 前缀,这在 Python 3 中并不需要。 对于 URL 变量,Flask 还支持在 URL 规则字符串里对变量设置处理器,对变 量进行预处理。比如 错误编写了自定义错误页面,对于另外两个常 见的错误 400 错误和 500 错误,你可以自己试着为它们编写错误处理函数和 对应的模板。 因为示例程序的语言和电影标题使用了英文,所以电影网站的搜索链接使用了 IMDb,对于中文,你可以使用豆瓣电影或时光网。以豆瓣电影为例,它的搜索 链接为 https://movie.douban.com/subject_search?search_text=关键词,对应 的 href0 码力 | 127 页 | 7.62 MB | 1 年前3
python3学习手册python3支持的常用字符集编码: u�-8 Unicdoe,默认无BOM u�-16 Unicdoe,默认小端字节序,有BOM,支持 UTF16代理对 gbk 中文-大陆,默认无BOM euc-jp 日语 shi�-jis 日语 euc-kr 韩语 big5 中文-台湾 la�n-1 iso-8859-1 ★文本文件读写操作 .write()方法写入文件,打开文件默认是跟随系统本地语言编码,写入 如果按下'Q'键就截图保存并退出 save_path = "D:\\tmp\\test-capture.jpg" # 带有中文的 保存文件路径 cv2.imwrite(save_path, frame) # imwrite()不支持中文路 径和文件名 # img_write = cv2.imencode(".jpg", frame) [1]0 码力 | 213 页 | 3.53 MB | 1 年前3
Hello 算法 1.0.0b4 Python版已成为国际上使用最广泛的 Unicode 编码方法。它是一种可变长的编码,使用 1 到 4 个字节 来表示一个字符,根据字符的复杂性而变。ASCII 字符只需要 1 个字节,拉丁字母和希腊字母需要 2 个字节, 常用的中文字符需要 3 个字节,其他的一些生僻字符需要 4 个字节。 UTF‑8 的编码规则并不复杂,分为两种情况: ‧ 对于长度为 1 字节的字符,将最高位设置为 0 、其余 7 位设置为 Unicode UTF‑16 更占用空间,特 别是对于主要使用 ASCII 字符的文本。 从存储空间的角度看,使用 UTF‑8 表示英文字符非常高效,因为它仅需 1 个字节;使用 UTF‑16 编码某些非 英文字符(例如中文)会更加高效,因为它只需要 2 个字节,而 UTF‑8 可能需要 3 个字节。从兼容性的角度 看,UTF‑8 的通用性最佳,许多工具和库都优先支持 UTF‑8 。 3. 数据结构 hello‑algo 字符集是常用的中文字 符集,共收录两万多个汉字。Unicode 致力于提供一个完整的字符集标准,收录世界内各种语言的字 符,从而解决由于字符编码方法不一致而导致的乱码问题。 ‧ UTF‑8 是最受欢迎的 Unicode 编码方法,通用性非常好。它是一种变长的编码方法,具有很好的扩展 性,有效提升了存储空间的使用效率。UTF‑16 和 UTF‑32 是等长的编码方法。在编码中文时,UTF‑160 码力 | 329 页 | 27.34 MB | 1 年前3
Hello 算法 1.0.0b5 Python版已成为国际上使用最广泛的 Unicode 编码方法。它是一种可变长的编码,使用 1 到 4 个字节 来表示一个字符,根据字符的复杂性而变。ASCII 字符只需要 1 个字节,拉丁字母和希腊字母需要 2 个字节, 常用的中文字符需要 3 个字节,其他的一些生僻字符需要 4 个字节。 UTF‑8 的编码规则并不复杂,分为以下两种情况。 ‧ 对于长度为 1 字节的字符,将最高位设置为 0、其余 7 位设置为 Unicode 字符占比较高的文本。 第 3 章 数据结构 hello‑algo.com 59 从存储空间的角度看,使用 UTF‑8 表示英文字符非常高效,因为它仅需 1 个字节;使用 UTF‑16 编码某些非 英文字符(例如中文)会更加高效,因为它只需要 2 个字节,而 UTF‑8 可能需要 3 个字节。 从兼容性的角度看,UTF‑8 的通用性最佳,许多工具和库都优先支持 UTF‑8 。 3.4.5 编程语言的字符编码 字符集是常用的中文字 符集,共收录两万多个汉字。Unicode 致力于提供一个完整的字符集标准,收录世界内各种语言的字 符,从而解决由于字符编码方法不一致而导致的乱码问题。 ‧ UTF‑8 是最受欢迎的 Unicode 编码方法,通用性非常好。它是一种变长的编码方法,具有很好的扩展 性,有效提升了存储空间的使用效率。UTF‑16 和 UTF‑32 是等长的编码方法。在编码中文时,UTF‑160 码力 | 361 页 | 30.64 MB | 1 年前3
共 51 条
- 1
- 2
- 3
- 4
- 5
- 6













