pandas: powerful Python data analysis toolkit - 0.20.2
7.83 MB
1907 页
0 评论
| 语言 | 格式 | 评分 |
|---|---|---|
英语 | .pdf | 3 |
| 摘要 | ||
pandas: powerful Python data analysis toolkit Release 0.20.2 Wes McKinney & PyData Development Team Jun 04, 2017 CONTENTS 1 What’s New 3 1.1 v0.20.2 (June 4, 2017) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 | ||
| AI总结 | ||
# 《pandas: powerful Python data analysis toolkit - 0.20.2》文档内容总结
以下是对《pandas: powerful Python data analysis toolkit - 0.20.2》文档内容的总结,重点突出核心观点和关键信息:
---
### **1. 简介**
- **pandas** 是一个强大的 Python 数据分析工具包,旨在解决其他语言/科学研究环境的不足。
- 它适用于数据清洗、分析建模和结果整理等任务,是数据科学家理想的工具。
- **pandas** 的特点:
- **高效**:大量底层算法经过优化,部分代码使用 Cython 实现。
- **通用性**:虽然通用性可能牺牲部分性能,但其功能覆盖广泛。
- **生态重要性**:是 statsmodels 的依赖,广泛应用于金融领域。
- 需要熟悉 NumPy,文档假设用户对其有基本了解。
---
### **2. 主要更新内容**
#### **2.1 pandas 0.20.2**
- **发布日期**:2017年6月4日。
- **特点**:这是一个小幅的 bug 修复版本,主要包含回归修复、bug 修复和性能改进,推荐所有用户升级。
- **详细内容**:
- 修复了与下游项目兼容性的问题。
- 新增了对 UInt64 数据类型的支持。
- JSON 序列化新增了 `orient='table'` 选项,支持更交互式的 Jupyter Notebook 显示。
- 实验性支持将 styled DataFrame 导出为 Excel。
- 已弃用 `.ix` 索引器和 Panel 类型。
#### **2.2 pandas 0.20.0**
- **主要更新**:
- 新增 IntervalIndex 和 Interval 标量类型。
- 分组 API 改进,支持按索引级分组。
- 窗口二进制相关/协方差操作返回 MultiIndexed DataFrame,而非已弃用的 Panel。
- 支持 S3 处理使用 s3fs,Google BigQuery 支持使用 pandas-gbq 库。
-нист useContext.
#### **2.3 其他版本更新**
- **pandas 0.18.0** (2016年3月13日):
- 新增时间序列感知的 `rolling()` 函数。
- RangeIndex 替代 Int64Index,节省内存。
- `.resample` 方法改为类似 `.groupby` 的 API。
- 移除位置索引浮点数支持。
- **pandas 0.19.0** (2016年10月2日):
- 新增 `merge_asof()` 函数,支持时间序列连接。
- `.rolling()` 现在时间序列感知。
- 增强对稀疏数据结构的支持。
- 弃用 Panel4D 和 PanelND,建议使用 xarray 包替代。
- **pandas 0.14.1** (2014年7月11日):
- 新增 `select_dtypes()` 和 `sem()` 方法。
- 支持 dateutil 时区。
- 新增文档部分,介绍选项和设置。
---
### **3. 用户指南**
- **教程**:
- 包含从基础到高级的操作,例如数据导入/导出、数据筛选、分组、统计分析、时间序列处理等。
- 涵盖了 `DataFrame` 和 `Series` 的创建与操作。
- 包括实用功能,如异常值处理、数据转换、合并与连接等。
- **实践指南**:
- 使用真实数据集进行练习,涵盖数据获取、过滤、分组、合并、统计分析、可视化等内容。
- **资源推荐**:
- 提供了丰富的学习资源,包括教程、视频、博客和社区贡献的内容。
- 包括使用 pandas 进行统计分析、金融分析、数据整理等的实践材料。
---
### **4. 社区支持**
- **贡献者名单**:
- 列出了数百位为 pandas 贡献的开发者和社区成员。
- 包括 Aaron Barber、Adam J. Stewart、Adrian、Ajay Saxena 等。
- **开源信息**:
- 源代码托管在 GitHub:[pandas-dev/pandas](http://github.com/pandas-dev/pandas)。
- 官方文档地址:[http://pandas.pydata.org](http://pandas.pydata.org)。
---
### **总结**
本文档主要介绍了 **pandas 0.20.2** 的功能特点、版本更新内容以及用户指南和社区支持信息。**pandas** 作为 Python 生态中核心的数据分析工具,其强大的功能和灵活性使其成为数据科学领域的首选工具。文档内容全面,适合从新手到高级用户理解和掌握 **pandas** 的使用方法和最佳实践。 | ||
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余
1900 页请下载阅读 -
文档评分













