动手学深度学习 v2.0. . . . . . . . . . . . . . . . . 168 4.9 环境和分布偏移 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170 4.9.1 分布偏移的类型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 4.9.2 分布偏移示例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 4.9.3 分布偏移纠正 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 环境是否重要? • 环境是否变化?例如,未来的数据是否总是与过去相似,还是随着时间的推移会发生变化?是自然变化 还是响应我们的自动化工具而发生变化? 当训练和测试数据不同时,最后一个问题提出了分布偏移(distribution shift)的问题。接下来的内容将简要 描述强化学习问题,这是一类明确考虑与环境交互的问题。 1.3.4 强化学习 如果你对使用机器学习开发与环境交互并采取行动感兴0 码力 | 797 页 | 29.45 MB | 1 年前3
机器学习课程-温州大学-时间序列总结25 时间序列的频率、偏移量 默认生成的时间序列数据是按天计算的,即 频率为“D”。 • “D”是一个基础频率,通过用一个字符串 的别名表示,比如“D”是“day”的别名 。 • 频率是由一个基础频率和一个乘数组成的 ,比如,“5D”表示每5天。 26 时间序列的频率、偏移量 通过一张表来列举时 间序列的基础频率。 27 时间序列的频率、偏移量 通过一张表来列举时 间序列的基础频率。 28 时间序列的频率、偏移量 每个基础频率还可以跟着一个被称为日期偏 移量的DateOffset对象。如果想要创建一个 DateOffset对象,则需要先导入pd.tseries. offsets模块后才行。 from pandas.tseries.offsets import * DateOffset(months=4, days=5) 29 时间序列的频率、偏移量 还可以使用offsets模块中提供的偏移量类型 还可以使用offsets模块中提供的偏移量类型 进行创建。 Week(2) + Hour(10) 例如,创建14天10小时的偏移量,可以换算为两 周零十个小时,其中“周”使用Week类型表示的 ,“小时”使用Hour类型表示,它们之间可以使 用加号连接。 30 时间序列的移动 移动是指沿着时间轴方向将数据进行前移或 后移。 31 时间序列的移动 Pandas对象中提供了一个shift()方法,用来 前移或后移数据,但数据索引保持不变。0 码力 | 67 页 | 1.30 MB | 1 年前3
机器学习课程-温州大学-01机器学习-引言read_csv() | 从CSV文件读取 pd.read_table() | 从制表符分隔文件读取,如TSV pd.read_excel() | 从 Excel 文 件 读 取 pd.read_sql() | 从 SQL 表 或 数 据 库 读 取 pd.read_json() | 从JSON格式的URL或文件读取 pd.read_clipboard() | 从剪切板读取 将DataFrame写入⽂件0 码力 | 78 页 | 3.69 MB | 1 年前3
机器学习课程-温州大学-01深度学习-引言read_csv() | 从CSV文件读取 pd.read_table() | 从制表符分隔文件读取,如TSV pd.read_excel() | 从 Excel 文 件 读 取 pd.read_sql() | 从 SQL 表 或 数 据 库 读 取 pd.read_json() | 从JSON格式的URL或文件读取 pd.read_clipboard() | 从剪切板读取 将DataFrame写入⽂件0 码力 | 80 页 | 5.38 MB | 1 年前3
机器学习课程-温州大学-08机器学习-集成学习果将一些特征进行融合绑定,则可以降低 特征数量。 10 30 ? ? ? 20 假设 Bundle中有两个特征值,A取值为[0,10],B取值为 [0,20],为了保证特征A、B的互斥性,我们可以给特征B 添加一个偏移量转换为C[10,30], Bundle后的特征其取 值为[0,30],这样便实现了特征合并。 43 4.LightGBM 直方图算法 直方图算法的基本思想是将连续的特征离散化为?个离散特征,同时构造0 码力 | 50 页 | 2.03 MB | 1 年前3
PyTorch OpenVINO 开发实战系列教程第一篇模型库与功能函数,主要包括对象检测模块与模型库、图象数 据增强与预处理模块等。 以上并不是 pytorch 框架中全部模块与功能说明,作者这里只 列出了跟本书内容关联密切必须掌握的一些模块功能,希望读 者可以更好的针对性学习,掌握这些知识。 1.1.3 Pytorch 框架现状与趋势 Pytorch 是深度学习框架的后起之秀,它参考了市场上早期框 架包括 torch、caffe、tensorflow0 码力 | 13 页 | 5.99 MB | 1 年前3
Keras: 基于 Python 的深度学习库中设置 axis=1。 • momentum: 移动均值和移动方差的动量。 • epsilon: 增加到方差的小的浮点数,以避免除以零。 • center: 如果为 True,把 beta 的偏移量加到标准化的张量上。如果为 False,beta 被忽略。 • scale: 如果为 True,乘以 gamma。如果为 False,gamma 不使用。当下一层为线性层(或者 例如 nn.r0 码力 | 257 页 | 1.19 MB | 1 年前3
【PyTorch深度学习-龙龙老师】-测试版202112识是为了解决问题而生的,避免陷入为了学习而学习的窘境。 尽管作者试图将读者的基础要求降到最低,但是人工智能不可避免地需要使用正式化的 数学符号推导,其中涉及到少量的概率与统计、线性代数、微积分等数学知识,一般要求读 者对这些数学知识有初步印象或了解即可。比起理论基础,读者需要有少量的编程经验,特 别是 Python 语言编程经验,显得更加重要,因为本书更侧重于实用性,而不是堆砌公式。 总的来说,本书适合于大学三 要的东 西。−拉里·佩奇 在介绍完张量的基本操作后,现在来进一步学习张量的进阶操作,如张量的合并与分 割、范数统计、张量填充、张量限幅等。最后通过 MNIST 数据集的测试实战,来加深读 者对 PyTorch 张量进阶操作的理解。 5.1 合并与分割 5.1.1 合并 合并是指将多个张量在某个维度上合并为一个张量。以某学校班级成绩册数据为例, 设张量?保存了某学校0 码力 | 439 页 | 29.91 MB | 1 年前3
共 8 条
- 1













