Python 3.11.10 正则表达式 HOWTO 'caaat' (3 个 'a' ),但不能匹配 'ct' 。 还有两个常用的重复运算符或量词。其中,问号 ? 表示匹配一次或零次,可以理解为将某个部分标记为可选 项。例如,home-?brew 可以匹配 'homebrew' 或 'home-brew'。 最复杂的量词是 {m,n},其中 m 和 n 是十进制整数。该量词表示必须至少重复 m 次,至多重复 n 次。例如, 正则 a/{1,3}b 可以匹配 'a////b',因为其中有四个斜杠。 这个量词中的 m 和 n 都是可以省略的。在这种情况下,系统会为缺失的值赋予一个合理的默认值。如果省略 m ,下限默认为 0 ;如果省略 n ,则上限默认为无限大。 最简单情况是 {m} ,它会精确匹配前面的元素 m 次。例如,a/{2}b 只会匹配 'a//b'。 善于归纳的读者可能会注意到,另外那三个量词都可以用这种表示法来表达。{0,} 等同于 *0 码力 | 19 页 | 403.22 KB | 11 月前3
Python 3.11.10 正则表达式 HOWTO 'caaat'(3 个 'a' ),但不能匹配 'ct' 。 还有两个常用的重复运算符或量词。其中,问号 ? 表示匹配一次或零次,可以理解为将某个部分标记为 可选项。例如,home-?brew 可以匹配 'homebrew' 或 'home-brew'。 最复杂的量词是 {m,n},其中 m 和 n 是十进制整数。该量词表示必须至少重复 m 次,至多重复 n 次。例 如,正则 a/{1,3}b 可以匹配 'a////b',因为其中有四个斜杠。 这个量词中的 m 和 n 都是可以省略的。在这种情况下,系统会为缺失的值赋予一个合理的默认值。如果 省略 m ,下限默认为 0 ;如果省略 n ,则上限默认为无限大。 最简单情况是 {m} ,它会精确匹配前面的元素 m 次。例如,a/{2}b 只会匹配 'a//b'。 善于归纳的读者可能会注意到,另外那三个量词都可以用这种表示法来表达。{0,} 等同于 *0 码力 | 18 页 | 403.35 KB | 11 月前3
阮一峰 JavaScript 教程String.prototype.replace() String.prototype.split() 匹配规则 字面量字符和元字符 转义符 特殊字符 字符类 预定义模式 重复类 量词符 贪婪模式 修饰符 组匹配 参考链接 RegExp 对象 RegExp 对象 - 374 - 本文档使用 书栈(BookStack.CN) 构建 RegExp 对象提供正则表示式的功能。 上面代码中,第一个模式指定 o 连续出现2次,第二个模式指定 o 连 续出现2次到5次之间。 重复类 RegExp 对象 - 394 - 本文档使用 书栈(BookStack.CN) 构建 量词符用来设定某个模式出现的次数。 ? 问号表示某个模式出现0次或1次,等同于 {0, 1} 。 * 星号表示某个模式出现0次或多次,等同于 {0,} 。 + 加号表示某个模式出现1次或多次,等同于 test('ttest') // true 13. /t*est/.test('tttest') // true 14. /t*est/.test('est') // true 上一小节的三个量词符,默认情况下都是最大可能匹配,即匹配直到下 一个字符不满足匹配规则为止。这被称为贪婪模式。 1. var s = 'aaa'; 2. s.match(/a+/) // ["aaa"] 上面代码中,模式是0 码力 | 540 页 | 3.32 MB | 10 月前3
Python 3.9.20 正则表达式 HOWTO 是十进制整数。该限定符意味着必须至少重复 m 次,最多 重复 n 次。例如,a/{1,3}b 可以匹配 'a/b'、'a//b' 或者 'a///b' ,但不能匹配中间没有斜杆的 'ab',或者四个斜杆的 'a////b' 。 这个量词中的 m 和 n 都是可以省略的。在这种情况下,系统会为缺失的值赋予一个合理的默认值。如果 省略 m ,下限默认为 0 ;如果省略 n ,则上限默认为无限大。 细心的读者也许注意到了,前面的三个重复限定符都可以用这种标记法来表示。{00 码力 | 18 页 | 401.42 KB | 11 月前3
Python 3.9.20 正则表达式 HOWTO 是十进制整数。该限定符意味着必须至少重复 m 次,最多重复 n 次。例如,a/{1,3}b 可以匹配 'a/b'、'a//b' 或者 'a///b' ,但不能匹配中间没有斜杆的 'ab',或 者四个斜杆的 'a////b' 。 这个量词中的 m 和 n 都是可以省略的。在这种情况下,系统会为缺失的值赋予一个合理的默认值。如果省略 m ,下限默认为 0 ;如果省略 n ,则上限默认为无限大。 细心的读者也许注意到了,前面的三个重复限定符都可以用这种标记法来表示。{00 码力 | 18 页 | 400.78 KB | 11 月前3
阮一峰 《ECMAScript 6入门》 第三版修饰符,才能识别当中的大括号,否则会被解读为量词。 /\u{61}/.test('a') // false /\u{61}/u.test('a') // true /\u{20BB7}/u.test('' ) // true 上面代码表示,如果不加 u 修饰符,正则表达式无法识别 \u{61} 这种表示法, 只会认为这匹配61个连续的 u 。 (3)量词 使用 u 修饰符后,所有量词都会正确识别码点大于0 码力 | 679 页 | 2.66 MB | 1 年前3
ffmpeg翻译文档高级字幕选项 高级选项 预设文件 ffpreset类型预设文件 avpreset类型预设文件 所有的数值选项,如果没有特殊定义,则需要一个接受一个字符串代表一个数作为输入,这可能跟着 一个单位量词首字母,例如 "k" , "m" 或 "G" 如果 i 是附加到SI单位的首字母,完整的字母将被解释为一个2的幂数单位,这是基于1024而不是 1000的,添加 B 的SI单位则是再将此值乘以8。例如0 码力 | 502 页 | 3.06 MB | 1 年前3
【PyTorch深度学习-龙龙老师】-测试版202112编码具有明显的缺陷。 在自然语言处理领域,有专门的一个研究方向在探索如何学习到单词的表示向量(Word Vector),使得语义层面的相关性能够很好地通过 Word Vector 体现出来。一个衡量词向量之 间相关度的方法就是余弦相关度(Cosine similarity): similarity(?,?) ≜ cos(?) = ? ⋅ ? |?| ∙ |?| 其中?和?代表了两个词向量。图0 码力 | 439 页 | 29.91 MB | 1 年前3
动手学深度学习 v2.0dtype=torch.float32) 嵌入层的输入是词元(词)的索引。对于任何词元索引i,其向量表示可以从嵌入层中的权重矩阵的第i行获 得。由于向量维度(output_dim)被设置为4,因此当小批量词元索引的形状为(2,3)时,嵌入层返回具有 形状(2,3,4)的向量。 x = torch.tensor([[1, 2, 3], [4, 5, 6]]) embed(x) 666 14. 自然语言处理:预训练0 码力 | 797 页 | 29.45 MB | 1 年前3
2022年美团技术年货 合辑搜索日志挖掘候选语料 搜索日志挖掘是工业界常用的同义词获取手段,挖掘的主要方向有: ● 用户搜索后点击共同商户: 利用两个点击相同 Document 的 Query 构建相 关关系。这种相关关系可以挖掘到大量词对,但这种简单的假设缺点也很明 显,点击共现的 Query 可能有不同程度的漂移。在美团场景下提供综合服务 的店铺很多,会有两种类型团单大量出现在相同商户下的情况,挖掘到“拔 牙”→“补牙”这0 码力 | 1356 页 | 45.90 MB | 1 年前3
共 10 条
- 1













