pdf文档 pandas: powerful Python data analysis toolkit - 0.20.2

7.83 MB 1907 页 0 评论
语言 格式 评分
英语
.pdf
3
摘要
pandas: powerful Python data analysis toolkit Release 0.20.2 Wes McKinney & PyData Development Team Jun 04, 2017 CONTENTS 1 What’s New 3 1.1 v0.20.2 (June 4, 2017) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
AI总结
# 《pandas: powerful Python data analysis toolkit - 0.20.2》文档内容总结 以下是对《pandas: powerful Python data analysis toolkit - 0.20.2》文档内容的总结,重点突出核心观点和关键信息: --- ### **1. 简介** - **pandas** 是一个强大的 Python 数据分析工具包,旨在解决其他语言/科学研究环境的不足。 - 它适用于数据清洗、分析建模和结果整理等任务,是数据科学家理想的工具。 - **pandas** 的特点: - **高效**:大量底层算法经过优化,部分代码使用 Cython 实现。 - **通用性**:虽然通用性可能牺牲部分性能,但其功能覆盖广泛。 - **生态重要性**:是 statsmodels 的依赖,广泛应用于金融领域。 - 需要熟悉 NumPy,文档假设用户对其有基本了解。 --- ### **2. 主要更新内容** #### **2.1 pandas 0.20.2** - **发布日期**:2017年6月4日。 - **特点**:这是一个小幅的 bug 修复版本,主要包含回归修复、bug 修复和性能改进,推荐所有用户升级。 - **详细内容**: - 修复了与下游项目兼容性的问题。 - 新增了对 UInt64 数据类型的支持。 - JSON 序列化新增了 `orient='table'` 选项,支持更交互式的 Jupyter Notebook 显示。 - 实验性支持将 styled DataFrame 导出为 Excel。 - 已弃用 `.ix` 索引器和 Panel 类型。 #### **2.2 pandas 0.20.0** - **主要更新**: - 新增 IntervalIndex 和 Interval 标量类型。 - 分组 API 改进,支持按索引级分组。 - 窗口二进制相关/协方差操作返回 MultiIndexed DataFrame,而非已弃用的 Panel。 - 支持 S3 处理使用 s3fs,Google BigQuery 支持使用 pandas-gbq 库。 -нист useContext. #### **2.3 其他版本更新** - **pandas 0.18.0** (2016年3月13日): - 新增时间序列感知的 `rolling()` 函数。 - RangeIndex 替代 Int64Index,节省内存。 - `.resample` 方法改为类似 `.groupby` 的 API。 - 移除位置索引浮点数支持。 - **pandas 0.19.0** (2016年10月2日): - 新增 `merge_asof()` 函数,支持时间序列连接。 - `.rolling()` 现在时间序列感知。 - 增强对稀疏数据结构的支持。 - 弃用 Panel4D 和 PanelND,建议使用 xarray 包替代。 - **pandas 0.14.1** (2014年7月11日): - 新增 `select_dtypes()` 和 `sem()` 方法。 - 支持 dateutil 时区。 - 新增文档部分,介绍选项和设置。 --- ### **3. 用户指南** - **教程**: - 包含从基础到高级的操作,例如数据导入/导出、数据筛选、分组、统计分析、时间序列处理等。 - 涵盖了 `DataFrame` 和 `Series` 的创建与操作。 - 包括实用功能,如异常值处理、数据转换、合并与连接等。 - **实践指南**: - 使用真实数据集进行练习,涵盖数据获取、过滤、分组、合并、统计分析、可视化等内容。 - **资源推荐**: - 提供了丰富的学习资源,包括教程、视频、博客和社区贡献的内容。 - 包括使用 pandas 进行统计分析、金融分析、数据整理等的实践材料。 --- ### **4. 社区支持** - **贡献者名单**: - 列出了数百位为 pandas 贡献的开发者和社区成员。 - 包括 Aaron Barber、Adam J. Stewart、Adrian、Ajay Saxena 等。 - **开源信息**: - 源代码托管在 GitHub:[pandas-dev/pandas](http://github.com/pandas-dev/pandas)。 - 官方文档地址:[http://pandas.pydata.org](http://pandas.pydata.org)。 --- ### **总结** 本文档主要介绍了 **pandas 0.20.2** 的功能特点、版本更新内容以及用户指南和社区支持信息。**pandas** 作为 Python 生态中核心的数据分析工具,其强大的功能和灵活性使其成为数据科学领域的首选工具。文档内容全面,适合从新手到高级用户理解和掌握 **pandas** 的使用方法和最佳实践。
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余 1900 页请下载阅读 -
文档评分
请文明评论,理性发言.