特征工程 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

PyConChina2022-杭州-Pants：Python工程化必备构建工具-沈达

Pants: Python工程化必备构建工具主讲人：沈达 – 比图科技数据工程师 Pants 2 https://www.pantsbuild.org 面向任意规模代码仓库的高性能、可扩展、用户友好的构建系统。由主要实现用定义构建对支持最好 Pants 1 诞生于推特 Pants 2 涅槃重生由Toolchain赞助人生苦短，我用Python 用户 JupyterLab 个人：JupyterLab最佳实践用户 JupyterLab 痛点：如何快速启动痛点：如何分享、协作痛点：如何管理依赖模版工程 https://github.com/da-tubi/jupyterlab-best-practice 企业项目：多个子项目的Python代码仓库模版工程 https://github.com/da-tubi/pants-pyspark-subprojects • 可扩展智能依赖 • 新建子项目简单 • 开发环境和生产环境一致 • 本地缓存（SaaS支持：远程缓存） • 只要没有import，就会智能排除业余项目：如何分发用Python实现的插件示例工程 https://github.com/texmacs/plugins-in-python JAR • Executable • Assembly PEX • Executable • Assembly

0 码力 | 9 页 | 975.41 KB | 1 年前
3
3 基于Azure的Python机器学习王大伟

Azure与自动机器学习什么是自动机器学习？机器学习的一般步骤包括：问题定义、数据收集、特征工程、模型选择、模型评估、模型应用。而算法工程师的工作一般是从特征工程开始。自动机器学习的自动体现在：自动特征工程、自动模型选择、自动超参数优化等。手动特征工程效率低、可移植性差、受到创造力的限制。自动特征工程自动超参数优化自动模型选择添加标题如何有效选择对应于特定数据集的模型至

0 码力 | 31 页 | 3.69 MB | 1 年前
3
8 4 Deep Learning with Python 费良宏

算法：Q-Learning以及时间差学习机器学习－方法及流程输入特征选择 – 基于什么进行预测目标 – 预测什么预测功能 – 回归、聚类、降维... Xn -> F(xn) -> T(x) 机器学习－举例机器学习－举例如何让机器分辨出来他／她是谁？图像分析 – 输入特征选择 ->面部特征、发型、裙子、身高、手势… 机器学习－何时使用你不需要机器学习，如果学习的算法，分别对应不同级别的抽象" 深度学习 VS. 机器学习 ML 的算法包括监督学习和无监督学习适用非线性处理单元的多层次的特征提取和转换基于对多个层的特征或者表象的学习，形成一个由低级到高级的层次结构特征传统的机器学习关注于特征工程,深度学习关注于端到端的基于原始数据的学习为什么需要深度学习？深度学习- 举例深度学习－神经网络是一种模仿生物神经网络(例如大脑)的结构和功能的计我的第一个Theano 程序深度学习的应用环境－ THEANO GPU vs. CPU TENSORFLOW 的新进展分布式的深度学习框架 TENSORFLOW 的新进展分布式的深度学习框架工程化思维 VS. 科学化思维 THINK GREAT THOUGHTS AND YOU WILL BE GREAT. 心怀伟大，你将会变得伟大！谢谢！

0 码力 | 49 页 | 9.06 MB | 1 年前
3
9 盛泳潘 When Knowledge Graph meet Python

easy ！）。所以，通俗的来说，在AI system中：要么从原有的知识体系中直接提取信息来使用，要么进行推理。将知识融合在机器中，使机器能够利用我们人类知识、专家知识解决问题，这就是早期知识工程（Knowledge Engineering）的核心内涵。 Preliminaries Explaining AI system from the perspective of KE – Symbolism R2：Dreyfus, Hubert (1979), What Computers Still Can't Do, New York: MIT Press. 本页PPT借鉴于复旦大学肖仰华老师《大数据时代的知识工程与知识管理》 Preliminaries Major difficulties: 自上而下：严重依赖专家和用户的干预（规模有限、质量存疑） Conventional KE – Features 3、很难处理异常情况 e.g., 鸵鸟不会飞本页PPT借鉴于复旦大学肖仰华老师《大数据时代的知识工程与知识管理》大数据时代催生KE飞速前进发展 Preliminaries Preliminaries 大数据时代的机遇 – 大规模知识自动获取本页PPT借鉴于复旦大学肖仰华老师《大数据时代的知识工程与知识管理》  Big Data + Machine Learning[R1] + Powerful

0 码力 | 57 页 | 1.98 MB | 1 年前
3
Python与高中技术课程教学以声音制造为例罗丹

未来职业规划声音制造教学设计该项目以研究声音信号为核心任务，学生通过 1. 了解声音 2. 分析声音 3. 制造声音 4. 处理声音 5. 传播声音五大研究模块来全面和深入地了解与声音信号相关的工程物理知识和数学模型并进行相关的实践活动. 声音制造项目具体要求: 学生自己动手制作一款可以演奏的电子乐器项目教学实施细则: 1. 带领学生复习(或预习)相关数学和物理知识 2. 向学生介绍计算机在数据处理上的特点和局限性信号生成和处理的核心工具 Python 生成声音信号数据 Python 的角色: 信号生成和处理的核心工具 ?=A*sin(2πf ∗ t) 处理前处理后 1. 让学生观察处理前后的信号特征 2. 将特征转化为数学模型 Python 处理声音信号 Python 的角色:用户交互界面的制作工具设计用户交互机制 1. 设计触发声音和修改控制参数的协议 2. 绑定事件反馈函数 3. 设计基本的用户界面

0 码力 | 12 页 | 731.76 KB | 1 年前
3
Hello 算法 1.2.0 简体中文 Python 版

或令人惊叹的事物背后，都隐藏着精妙的算法思想。同样，数据结构无处不在：大到社会网络，小到地铁线路，许多系统都可以建模为“图”；大到一个国家，小到一个家庭，社会的主要组织形式呈现出“树”的特征；冬天的衣服就像“栈”，最先穿上的最后才能脱下；羽毛球筒则如同“队列”，一端放入、另一端取出；字典就像一个“哈希表”，能够快速查找目标词条。本书旨在通过清晰易懂的动画图解和可运行的代码示例，位数的整数（例如学号），那么我们就可以用效率更高的“基数排序”来做，将时间复杂度降为 ?(??) ，其中 ? 为位数。当数据体量很大时，节省出来的运行时间就能创造较大价值（成本降低、体验变好等）。在工程领域中，大量问题是难以达到最优解的，许多问题只是被“差不多”地解决了。问题的难易程度一方面取决于问题本身的性质，另一方面也取决于观测问题的人的知识储备。人的知识越完备、经验越多，分析问题就会越深入，问题就能被解决得更优雅。非常贵，随 CPU 打包计价我们可以将计算机存储系统想象为图 4‑9 所示的金字塔结构。越靠近金字塔顶端的存储设备的速度越快、容量越小、成本越高。这种多层级的设计并非偶然，而是计算机科学家和工程师们经过深思熟虑的结果。 ‧ 硬盘难以被内存取代。首先，内存中的数据在断电后会丢失，因此它不适合长期存储数据；其次，内存的成本是硬盘的几十倍，这使得它难以在消费者市场普及。 ‧ 缓存的大容量和高速度难以兼得。随着

0 码力 | 364 页 | 18.43 MB | 10 月前
3
Hello 算法 1.1.0 Python版

或令人惊叹的事物背后，都隐藏着精妙的算法思想。同样，数据结构无处不在：大到社会网络，小到地铁线路，许多系统都可以建模为“图”；大到一个国家，小到一个家庭，社会的主要组织形式呈现出“树”的特征；冬天的衣服就像“栈”，最先穿上的最后才能脱下；羽毛球筒则如同“队列”，一端放入、另一端取出；字典就像一个“哈希表”，能够快速查找目标词条。本书旨在通过清晰易懂的动画图解和可运行的代码示例，非常贵，随 CPU 打包计价我们可以将计算机存储系统想象为图 4‑9 所示的金字塔结构。越靠近金字塔顶端的存储设备的速度越快、容量越小、成本越高。这种多层级的设计并非偶然，而是计算机科学家和工程师们经过深思熟虑的结果。 ‧ 硬盘难以被内存取代。首先，内存中的数据在断电后会丢失，因此它不适合长期存储数据；其次，内存的成本是硬盘的几十倍，这使得它难以在消费者市场普及。 ‧ 缓存的大容量和高速度难以兼得。随着两种实现的对比结论与栈一致，在此不再赘述。 5.2.3 队列典型应用 ‧ 淘宝订单。购物者下单后，订单将加入队列中，系统随后会根据顺序处理队列中的订单。在双十一期间，短时间内会产生海量订单，高并发成为工程师们需要重点攻克的问题。 ‧ 各类待办事项。任何需要实现“先来后到”功能的场景，例如打印机的任务队列、餐厅的出餐队列等，队列在这些场景中可以有效地维护处理顺序。 5.3 双向队列在队列中

0 码力 | 364 页 | 18.42 MB | 1 年前
3
Hello 算法 1.0.0 Python版

非常贵，随 CPU 打包计价我们可以将计算机存储系统想象为图 4‑9 所示的金字塔结构。越靠近金字塔顶端的存储设备的速度越快、容量越小、成本越高。这种多层级的设计并非偶然，而是计算机科学家和工程师们经过深思熟虑的结果。 ‧ 硬盘难以被内存取代。首先，内存中的数据在断电后会丢失，因此它不适合长期存储数据；其次，内存的成本是硬盘的几十倍，这使得它难以在消费者市场普及。 ‧ 缓存的大容量和高速度难以兼得。随着两种实现的对比结论与栈一致，在此不再赘述。 5.2.3 队列典型应用 ‧ 淘宝订单。购物者下单后，订单将加入队列中，系统随后会根据顺序处理队列中的订单。在双十一期间，短时间内会产生海量订单，高并发成为工程师们需要重点攻克的问题。 ‧ 各类待办事项。任何需要实现“先来后到”功能的场景，例如打印机的任务队列、餐厅的出餐队列等，队列在这些场景中可以有效地维护处理顺序。 5.3 双向队列在队列中数据完整性检查：数据发送方可以计算数据的哈希值并将其一同发送；接收方可以重新计算接收到的数据的哈希值，并与接收到的哈希值进行比较。如果两者匹配，那么数据就被视为完整。对于密码学的相关应用，为了防止从哈希值推导出原始密码等逆向工程，哈希算法需要具备更高等级的安全特性。 ‧ 单向性：无法通过哈希值反推出关于输入数据的任何信息。 ‧ 抗碰撞性：应当极难找到两个不同的输入，使得它们的哈希值相同。 ‧ 雪崩效应：输入的微小

0 码力 | 362 页 | 17.54 MB | 1 年前
3
Python 标准库参考指南 3.12

如果给出，doc 将成为该 property 属性的文档字符串。否则该 property 将拷贝 fget 的文档字符串（如果存在）。这令使用property() 作为decorator 来创建只读的特征属性可以很容易地实现: class Parrot: def __init__(self): self._voltage = 100000 @property def voltage(self): 将 voltage 的文档字符串设为”Get the current voltage.” @getter @setter @deleter 特征属性对象具有 getter, setter 和 deleter 方法，它们可用作装饰器来创建该特征属性的副本，并将相应的访问函数设为所装饰的函数。这最好是用一个例子来说明： class C: def __init__(self): self deleter def x(self): del self._x 上述代码与第一个例子完全等价。注意一定要给附加函数与原始的特征属性相同的名称 (在本例中为 x。) 返回的特征属性对象同样具有与构造器参数相对应的属性 fget, fset 和 fdel。在 3.5 版本发生变更: 特征属性对象的文档字符串现在是可写的。 class range(stop) class range(start, stop

0 码力 | 2253 页 | 11.81 MB | 9 月前
3
Python 标准库参考指南 3.12

如果给出，doc 将成为该 property 属性的文档字符串。否则该 property 将拷贝 fget 的文档字符串（如果存在）。这令使用property() 作为decorator 来创建只读的特征属性可以很容易地实现: class Parrot: def __init__(self): self._voltage = 100000 @property def voltage(self): 将 voltage 的文档字符串设为”Get the current voltage.” @getter @setter @deleter 特征属性对象具有 getter, setter 和 deleter 方法，它们可用作装饰器来创建该特征属性的副本，并将相应的访问函数设为所装饰的函数。这最好是用一个例子来说明： class C: def __init__(self): self deleter def x(self): del self._x 上述代码与第一个例子完全等价。注意一定要给附加函数与原始的特征属性相同的名称 (在本例中为 x。) 返回的特征属性对象同样具有与构造器参数相对应的属性 fget, fset 和 fdel。在 3.5 版本发生变更: 特征属性对象的文档字符串现在是可写的。 class range(stop) class range(start, stop

0 码力 | 2253 页 | 11.81 MB | 9 月前
3

共 73 条前往

页

分类

语言

格式

PyConChina2022-杭州-Pants：Python工程化必备构建工具-沈达

3 基于Azure的Python机器学习王大伟

8 4 Deep Learning with Python 费良宏

9 盛泳潘 When Knowledge Graph meet Python

Python与高中技术课程教学以声音制造为例罗丹

Hello 算法 1.2.0 简体中文 Python 版

Hello 算法 1.1.0 Python版

Hello 算法 1.0.0 Python版

Python 标准库参考指南 3.12

Python 标准库参考指南 3.12