 【PyTorch深度学习-龙龙老师】-测试版202112前向传播实战 4.11 参考文献 第 5 章 PyTorch 进阶 5.1 合并与分割 5.2 数据统计 5.3 张量比较 5.4 填充与复制 5.5 数据限幅 5.6 高级操作 5.7 经典数据集加载 5.8 MNIST 测试实战 5.9 参考文献 第 6 章 神经网络 6.1 感知机 6.2 全连接层 6.3 神经网络 6.4 激活函数 7.6 链式法则 7.7 反向传播算法 7.8 Himmelblau 函数优化实战 7.9 反向传播算法实战 7.10 参考文献 第 8 章 PyTorch 高级用法 8.1 常见功能模块 8.2 模型装配、训练与测试 8.3 模型保存与加载 8.4 自定义类 8.5 模型乐园 8.6 测量工具 8.7 可视化 8.8 参考文献 9 常见激活函数 ReLU 函数非常简单,它在? = ?的基础上面截去了? < 0的部分,可以直观地理解为 ReLU 函数仅保留正的输入部份,清零负的输入,具有单边抑制特性。虽然简单,ReLU 函 数却有优良的非线性特性,而且梯度计算非常简单,训练稳定,是深度学习中使用最广泛 的激活函数。因此,这里通过嵌套 ReLU 函数将模型转换为非线性模型: = ReLU(?? + ?) 3.60 码力 | 439 页 | 29.91 MB | 1 年前3 【PyTorch深度学习-龙龙老师】-测试版202112前向传播实战 4.11 参考文献 第 5 章 PyTorch 进阶 5.1 合并与分割 5.2 数据统计 5.3 张量比较 5.4 填充与复制 5.5 数据限幅 5.6 高级操作 5.7 经典数据集加载 5.8 MNIST 测试实战 5.9 参考文献 第 6 章 神经网络 6.1 感知机 6.2 全连接层 6.3 神经网络 6.4 激活函数 7.6 链式法则 7.7 反向传播算法 7.8 Himmelblau 函数优化实战 7.9 反向传播算法实战 7.10 参考文献 第 8 章 PyTorch 高级用法 8.1 常见功能模块 8.2 模型装配、训练与测试 8.3 模型保存与加载 8.4 自定义类 8.5 模型乐园 8.6 测量工具 8.7 可视化 8.8 参考文献 9 常见激活函数 ReLU 函数非常简单,它在? = ?的基础上面截去了? < 0的部分,可以直观地理解为 ReLU 函数仅保留正的输入部份,清零负的输入,具有单边抑制特性。虽然简单,ReLU 函 数却有优良的非线性特性,而且梯度计算非常简单,训练稳定,是深度学习中使用最广泛 的激活函数。因此,这里通过嵌套 ReLU 函数将模型转换为非线性模型: = ReLU(?? + ?) 3.60 码力 | 439 页 | 29.91 MB | 1 年前3
 动手学深度学习 v2.0xiv 16.1.1 在本地编辑和运行代码 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 741 16.1.2 高级选项 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 745 16.2 使用Amazon is Bishop的优秀教科书 (Bishop, 2006) ,对每 个主题都教得很透彻,以至于要读到线性回归这一章需要大量的工作。虽然专家们喜欢这本书正是因为它的 透彻性,但对初学者来说,这一特性限制了它作为介绍性文本的实用性。 在这本书中,我们将适时教授大部分概念。换句话说,你将在实现某些实际目的所需的非常时刻学习概念。 虽然我们在开始时花了一些时间来教授基础的背景知识,如线性代数和概率,但我们希望你在思考更深奥的 些的细节通常会被深度学习 框架的高级抽象隐藏起来。特别是在基础教程中,我们希望读者了解在给定层或优化器中发生的一切。在这 些情况下,我们通常会提供两个版本的示例:一个是我们从零开始实现一切,仅依赖张量操作和自动微分; 另一个是更实际的示例,我们使用深度学习框架的高级API编写简洁的代码。一旦我们教了您一些组件是如 何工作的,我们就可以在随后的教程中使用高级API了。 内容和结构 全书大致可分为三个部分,在0 码力 | 797 页 | 29.45 MB | 1 年前3 动手学深度学习 v2.0xiv 16.1.1 在本地编辑和运行代码 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 741 16.1.2 高级选项 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 745 16.2 使用Amazon is Bishop的优秀教科书 (Bishop, 2006) ,对每 个主题都教得很透彻,以至于要读到线性回归这一章需要大量的工作。虽然专家们喜欢这本书正是因为它的 透彻性,但对初学者来说,这一特性限制了它作为介绍性文本的实用性。 在这本书中,我们将适时教授大部分概念。换句话说,你将在实现某些实际目的所需的非常时刻学习概念。 虽然我们在开始时花了一些时间来教授基础的背景知识,如线性代数和概率,但我们希望你在思考更深奥的 些的细节通常会被深度学习 框架的高级抽象隐藏起来。特别是在基础教程中,我们希望读者了解在给定层或优化器中发生的一切。在这 些情况下,我们通常会提供两个版本的示例:一个是我们从零开始实现一切,仅依赖张量操作和自动微分; 另一个是更实际的示例,我们使用深度学习框架的高级API编写简洁的代码。一旦我们教了您一些组件是如 何工作的,我们就可以在随后的教程中使用高级API了。 内容和结构 全书大致可分为三个部分,在0 码力 | 797 页 | 29.45 MB | 1 年前3
 AI大模型千问 qwen 中文文档+= new_text print(generated_text) 1.3.3 下一步 现在,你可以选择流式模式或非流式模式与 Qwen1.5 进行对话。继续阅读文档,并尝试探索模型推理的更多 高级用法!” 1.4 llama.cpp llama.cpp 是一个 C++ 库,用于简化 LLM 推理的设置。它使得在本地机器上运行 Qwen 成为可能。该库是 一个纯 C/C++ 实现,不依赖任何外部库,并且针对 中包含了许多更多用途,您甚至可以在其中享受角色扮演的乐趣,并使用不同类型的量化模型。您可 以训练诸如 LoRA 这样的算法,并将 Stable Diffusion 和 Whisper 等扩展功能纳入其中。赶快去探索更多高级 用法,并将它们应用于 Qwen 模型中吧! 1.7 AWQ 对于量化模型,我们推荐使用 AWQ 结合 AutoAWQ 。AWQ 即激活感知权重量化,是一种针对 LLM 的低比 特权重量化的硬件友好方法。而 1.11.1 SkyPilot 是什么 SkyPilot 是一个可以在任何云上运行 LLM、AI 应用以及批量任务的框架,旨在实现最大程度的成本节省、最 高的 GPU 可用性以及受管理的执行过程。其特性包括: • 通过跨区域和跨云充分利用多个资源池,以获得最佳的 GPU 可用性。 • 把费用降到最低——SkyPilot 在各区域和云平台中为您挑选最便宜的资源。无需任何托管解决方案的 额外加价。0 码力 | 56 页 | 835.78 KB | 1 年前3 AI大模型千问 qwen 中文文档+= new_text print(generated_text) 1.3.3 下一步 现在,你可以选择流式模式或非流式模式与 Qwen1.5 进行对话。继续阅读文档,并尝试探索模型推理的更多 高级用法!” 1.4 llama.cpp llama.cpp 是一个 C++ 库,用于简化 LLM 推理的设置。它使得在本地机器上运行 Qwen 成为可能。该库是 一个纯 C/C++ 实现,不依赖任何外部库,并且针对 中包含了许多更多用途,您甚至可以在其中享受角色扮演的乐趣,并使用不同类型的量化模型。您可 以训练诸如 LoRA 这样的算法,并将 Stable Diffusion 和 Whisper 等扩展功能纳入其中。赶快去探索更多高级 用法,并将它们应用于 Qwen 模型中吧! 1.7 AWQ 对于量化模型,我们推荐使用 AWQ 结合 AutoAWQ 。AWQ 即激活感知权重量化,是一种针对 LLM 的低比 特权重量化的硬件友好方法。而 1.11.1 SkyPilot 是什么 SkyPilot 是一个可以在任何云上运行 LLM、AI 应用以及批量任务的框架,旨在实现最大程度的成本节省、最 高的 GPU 可用性以及受管理的执行过程。其特性包括: • 通过跨区域和跨云充分利用多个资源池,以获得最佳的 GPU 可用性。 • 把费用降到最低——SkyPilot 在各区域和云平台中为您挑选最便宜的资源。无需任何托管解决方案的 额外加价。0 码力 | 56 页 | 835.78 KB | 1 年前3
 Keras: 基于 Python 的深度学习库8.14 dot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 5.9 高级激活层 Advanced Activations . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 5.9.1 LeakyReLU 2.10 linear . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 10.3 高级激活函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 目录 VIII 11 244 KERAS: 基于 PYTHON 的深度学习库 1 1 Keras: 基于 Python 的深度学习库 1.1 你恰好发现了 Keras Keras 是一个用 Python 编写的高级神经网络 API,它能够以 TensorFlow, CNTK, 或者 Theano 作为后端运行。Keras 的开发重点是支持快速的实验。能够以最小的时延把你的想法转 换为实验结果,是做好研究的关键。0 码力 | 257 页 | 1.19 MB | 1 年前3 Keras: 基于 Python 的深度学习库8.14 dot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 5.9 高级激活层 Advanced Activations . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 5.9.1 LeakyReLU 2.10 linear . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 10.3 高级激活函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 目录 VIII 11 244 KERAS: 基于 PYTHON 的深度学习库 1 1 Keras: 基于 Python 的深度学习库 1.1 你恰好发现了 Keras Keras 是一个用 Python 编写的高级神经网络 API,它能够以 TensorFlow, CNTK, 或者 Theano 作为后端运行。Keras 的开发重点是支持快速的实验。能够以最小的时延把你的想法转 换为实验结果,是做好研究的关键。0 码力 | 257 页 | 1.19 MB | 1 年前3
 机器学习课程-温州大学-02-数学基础回顾-1.CS229-LinearAlgebra性代数而不会迷失在复杂的索引操作中,关键是要用尽可能多的概念进行操作。 实际上所有的线性代数都处理某种矩阵乘法,花一些时间对这里提出的观点进行直观的理解是非常必要 的。 除此之外,了解一些更高级别的矩阵乘法的基本属性是很有必要的: 矩阵乘法结合律: 矩阵乘法分配律: 矩阵乘法通常不是可交换的; 也就是说,通常 。 (例如,假设 , ,如果 和 不相等,矩阵乘积 甚至不存在!) 换句话说,正交矩阵的逆是其转置。 注意,如果 不是方阵 :即, , ,但其列仍然是 正交的,则 ,但是 。我们通常只使用术语"正交"来描述先前的情况 ,其中 是方 阵。 正交矩阵的另一个好的特性是在具有正交矩阵的向量上操作不会改变其欧几里德范数,即: 对于任何 , 是正交的。 3.9 矩阵的值域和零空间 一组向量 是可以表示为 的线性组合的所有向量的集合。 即: 可以证明,如果0 码力 | 19 页 | 1.66 MB | 1 年前3 机器学习课程-温州大学-02-数学基础回顾-1.CS229-LinearAlgebra性代数而不会迷失在复杂的索引操作中,关键是要用尽可能多的概念进行操作。 实际上所有的线性代数都处理某种矩阵乘法,花一些时间对这里提出的观点进行直观的理解是非常必要 的。 除此之外,了解一些更高级别的矩阵乘法的基本属性是很有必要的: 矩阵乘法结合律: 矩阵乘法分配律: 矩阵乘法通常不是可交换的; 也就是说,通常 。 (例如,假设 , ,如果 和 不相等,矩阵乘积 甚至不存在!) 换句话说,正交矩阵的逆是其转置。 注意,如果 不是方阵 :即, , ,但其列仍然是 正交的,则 ,但是 。我们通常只使用术语"正交"来描述先前的情况 ,其中 是方 阵。 正交矩阵的另一个好的特性是在具有正交矩阵的向量上操作不会改变其欧几里德范数,即: 对于任何 , 是正交的。 3.9 矩阵的值域和零空间 一组向量 是可以表示为 的线性组合的所有向量的集合。 即: 可以证明,如果0 码力 | 19 页 | 1.66 MB | 1 年前3
 机器学习课程-温州大学-01深度学习-引言中文名吴恩达,斯坦福大学副教 授,前“百度大脑”的负责人与百 度首席科学家。 6 李航, 现任字节跳动科技有限公司人 工智能实验室总监,北京大学、南京 大学客座教授,IEEE 会士,ACM 杰 出科学家,CCF 高级会员。 代表作:《统计学习方法》 国内泰斗 周志华,南京大学计算机科学与技 术系主任 、人工智能学院院长。 代表作:《机器学习》(西瓜书) 7 陈天奇,陈天奇是机器学习领域著名的青 年华人学者之一,本科毕业于上海交通 特征,如:线 ,边缘提取和 脊侦测,边角 检测、斑点检 测等局部化的 特征点检测 检测/分割 对图像进行分割 ,提取有价值的 内容,用于后继 处理, 如:筛 选特征点,分割 含有特定目标的 部分 高级处理 验证得到的 数据是否匹 配前提要求 ,估测特定 系数,对 目 标进行分类 •图像分类 •目标检测 •图像分割 •目标跟踪 •OCR文字识别 •图像滤波与降噪 •图像增强 •风格迁移 •三维重建 3、用于整合C/C++和Fortran代码的工具包; 4、实用的线性代数、傅里叶变换和随机数生成函数。numpy和稀疏矩阵运算包scipy 配合使用更加方便。 NumPy(Numeric Python)提供了许多高级的数值编程工具,如:矩阵数据类型、 矢量处理,以及精密的运算库。专为进行严格的数字处理而产生。多为很多大型金融 公司使用,以及核心的科学计算组织如:Lawrence Livermore,NASA用其处理一些0 码力 | 80 页 | 5.38 MB | 1 年前3 机器学习课程-温州大学-01深度学习-引言中文名吴恩达,斯坦福大学副教 授,前“百度大脑”的负责人与百 度首席科学家。 6 李航, 现任字节跳动科技有限公司人 工智能实验室总监,北京大学、南京 大学客座教授,IEEE 会士,ACM 杰 出科学家,CCF 高级会员。 代表作:《统计学习方法》 国内泰斗 周志华,南京大学计算机科学与技 术系主任 、人工智能学院院长。 代表作:《机器学习》(西瓜书) 7 陈天奇,陈天奇是机器学习领域著名的青 年华人学者之一,本科毕业于上海交通 特征,如:线 ,边缘提取和 脊侦测,边角 检测、斑点检 测等局部化的 特征点检测 检测/分割 对图像进行分割 ,提取有价值的 内容,用于后继 处理, 如:筛 选特征点,分割 含有特定目标的 部分 高级处理 验证得到的 数据是否匹 配前提要求 ,估测特定 系数,对 目 标进行分类 •图像分类 •目标检测 •图像分割 •目标跟踪 •OCR文字识别 •图像滤波与降噪 •图像增强 •风格迁移 •三维重建 3、用于整合C/C++和Fortran代码的工具包; 4、实用的线性代数、傅里叶变换和随机数生成函数。numpy和稀疏矩阵运算包scipy 配合使用更加方便。 NumPy(Numeric Python)提供了许多高级的数值编程工具,如:矩阵数据类型、 矢量处理,以及精密的运算库。专为进行严格的数字处理而产生。多为很多大型金融 公司使用,以及核心的科学计算组织如:Lawrence Livermore,NASA用其处理一些0 码力 | 80 页 | 5.38 MB | 1 年前3
 机器学习课程-温州大学-01机器学习-引言中文名吴恩达,斯坦福大学副教 授,前“百度大脑”的负责人与百 度首席科学家。 6 李航, 现任字节跳动科技有限公司人 工智能实验室总监,北京大学、南京 大学客座教授,IEEE 会士,ACM 杰 出科学家,CCF 高级会员。 代表作:《统计学习方法》 机器学习界的国内泰斗 周志华,南京大学计算机科学与技 术系主任 、人工智能学院院长。 代表作:《机器学习》(西瓜书) 7 陈天奇,陈天奇是机器学习领域著名的青 3、用于整合C/C++和Fortran代码的工具包; 4、实用的线性代数、傅里叶变换和随机数生成函数。numpy和稀疏矩阵运算包scipy 配合使用更加方便。 NumPy(Numeric Python)提供了许多高级的数值编程工具,如:矩阵数据类型、 矢量处理,以及精密的运算库。专为进行严格的数字处理而产生。多为很多大型金融 公司使用,以及核心的科学计算组织如:Lawrence Livermore,NASA用其处理一些0 码力 | 78 页 | 3.69 MB | 1 年前3 机器学习课程-温州大学-01机器学习-引言中文名吴恩达,斯坦福大学副教 授,前“百度大脑”的负责人与百 度首席科学家。 6 李航, 现任字节跳动科技有限公司人 工智能实验室总监,北京大学、南京 大学客座教授,IEEE 会士,ACM 杰 出科学家,CCF 高级会员。 代表作:《统计学习方法》 机器学习界的国内泰斗 周志华,南京大学计算机科学与技 术系主任 、人工智能学院院长。 代表作:《机器学习》(西瓜书) 7 陈天奇,陈天奇是机器学习领域著名的青 3、用于整合C/C++和Fortran代码的工具包; 4、实用的线性代数、傅里叶变换和随机数生成函数。numpy和稀疏矩阵运算包scipy 配合使用更加方便。 NumPy(Numeric Python)提供了许多高级的数值编程工具,如:矩阵数据类型、 矢量处理,以及精密的运算库。专为进行严格的数字处理而产生。多为很多大型金融 公司使用,以及核心的科学计算组织如:Lawrence Livermore,NASA用其处理一些0 码力 | 78 页 | 3.69 MB | 1 年前3
 机器学习课程-温州大学-12深度学习-自然语言处理和词嵌入比如, GPT-3)。 图37:人工智能的发展呈现同质化的过程 随着机器学习的引入,任务是如何执行的 (自动推断)从例子中显现出来 随着深度学习, 用于预测的高级 特征出现 有了基础模型,甚至出现了情境学习等高级 功能 ChatGPT核心技术优势 42 ChatGPT以基础模型为杠杆,可适用多类下游任务 ◼ ChatGPT采用了GPT3.5(InstructGPT)大规模预训练模型,在0 码力 | 44 页 | 2.36 MB | 1 年前3 机器学习课程-温州大学-12深度学习-自然语言处理和词嵌入比如, GPT-3)。 图37:人工智能的发展呈现同质化的过程 随着机器学习的引入,任务是如何执行的 (自动推断)从例子中显现出来 随着深度学习, 用于预测的高级 特征出现 有了基础模型,甚至出现了情境学习等高级 功能 ChatGPT核心技术优势 42 ChatGPT以基础模型为杠杆,可适用多类下游任务 ◼ ChatGPT采用了GPT3.5(InstructGPT)大规模预训练模型,在0 码力 | 44 页 | 2.36 MB | 1 年前3
 QCon北京2018-《未来都市--智慧城市与基于深度学习的机器视觉》-陈宇恒使用更加精巧的模型和Operator设计 - 使用模型压缩算法,在基本保障准确率的情况下大幅提升速度 - 利用最新的硬件特性,如GPU TensorCore/int8 *示意图来自互联网 Kubernetes在异构系统调度中的挑战 • Kubernetes版本发布快,新特性更新频繁,对异构调度的支持不断加强;但配套设施落后(e.g. Spark on K8s, GitlabCI) • 容器0 码力 | 23 页 | 9.26 MB | 1 年前3 QCon北京2018-《未来都市--智慧城市与基于深度学习的机器视觉》-陈宇恒使用更加精巧的模型和Operator设计 - 使用模型压缩算法,在基本保障准确率的情况下大幅提升速度 - 利用最新的硬件特性,如GPU TensorCore/int8 *示意图来自互联网 Kubernetes在异构系统调度中的挑战 • Kubernetes版本发布快,新特性更新频繁,对异构调度的支持不断加强;但配套设施落后(e.g. Spark on K8s, GitlabCI) • 容器0 码力 | 23 页 | 9.26 MB | 1 年前3
 《TensorFlow 快速入门与实战》4-实战TensorFlow房价预测并广泛支持多种平台,如:Python 脚本,Python,IPython Shell 和 Jupyter Notebook。 seaborn 是一个基于 matplotlib的 Python 数据可视化库。它提供了更易用的高级接口,用 于绘制精美且信息丰富的统计图形。 mpl_toolkits.mplot3d 是一个基础 3D绘图(散点图、平面图、折线图等)工具集,也是 matplotlib 库的一部分。同时,它也支持轻量级的独立安装模式。0 码力 | 46 页 | 5.71 MB | 1 年前3 《TensorFlow 快速入门与实战》4-实战TensorFlow房价预测并广泛支持多种平台,如:Python 脚本,Python,IPython Shell 和 Jupyter Notebook。 seaborn 是一个基于 matplotlib的 Python 数据可视化库。它提供了更易用的高级接口,用 于绘制精美且信息丰富的统计图形。 mpl_toolkits.mplot3d 是一个基础 3D绘图(散点图、平面图、折线图等)工具集,也是 matplotlib 库的一部分。同时,它也支持轻量级的独立安装模式。0 码力 | 46 页 | 5.71 MB | 1 年前3
共 17 条
- 1
- 2













