pandas: powerful Python data analysis toolkit - 0.20.3
9.18 MB
2045 页
0 评论
| 语言 | 格式 | 评分 |
|---|---|---|
英语 | .pdf | 3 |
| 摘要 | ||
文档介绍了pandas这一强大的Python数据分析工具包,版本0.20.3。该工具包提供高效、灵活和表达丰富的数据结构,适用于处理和分析关系型或标记式数据。pandas的主要功能包括数据清理、分析、建模和结果组织,支持时间序列数据、窗口函数、数据合并等操作。此外,文档详细列出了各个版本的新特性、改进和修复的bug,强调了其在生产中的应用,如金融领域。pandas也是统计计算生态系统statsmodels的依赖包,并提供了丰富的教程和练习,帮助用户掌握数据处理技能。用户需对NumPy有一定了解。 | ||
| AI总结 | ||
### 总结
本文档主要介绍了`pandas`这款强大的Python数据分析工具包,特别是版本`0.20.3`的相关内容。以下是核心内容的总结:
---
### 1. **概述**
- **pandas**是一款高效、灵活且表达力的Python数据分析工具,适用于处理“关系”或“标记”数据,能够轻松完成数据清洗、分析、建模和结果呈现。
- **pandas**是科学计算生态系统中的重要组件,广泛应用于金融等生产环境,并依赖于`NumPy`,熟悉`NumPy`会有助于更好地使用`pandas`。
- **pandas**的速度快,许多底层算法经过优化,但过于泛化可能会牺牲性能。它是`statsmodels`的依赖,并且与其他工具包(如`xarray`)兼容。
---
### 2. **版本更新**
#### **0.20.3版本(2017年7月7日)**
- 这是一个小版本,主要包含小范围的回归修复和bug修复,推荐所有用户升级。
#### **0.19.0版本(2016年10月2日)**
- 引入了`merge_asof()`函数,用于时间序列的按需合并(asof-style joining)。
- `.rolling()`现在支持时间序列操作。
- `read_csv()`新增对分类数据的解析支持。
- 增加了`union_categorical()`函数,用于合并分类变量。
- 去除了对`Panel4D`和`PanelND`的支持,建议使用`xarray`代替。
- 移除了之前已弃用的`pandas.io.data`、`pandas.io.wb`和`pandas.tools.rplot`模块。
#### **0.18.0版本(2016年3月13日)**
- 滚动窗口和扩展窗口函数现在是`Series`和`DataFrame`上的方法,类似于`.groupby`。
- 增加对`RangeIndex`的支持,以节省内存。
- `.resample`方法的API进行了更改,使其更类似于`.groupby`。
- 去除了对浮点数位置索引的支持,此前已弃用。
#### **0.14.1版本(2014年7月11日)**
- 新增了`select_dtypes()`方法,用于根据数据类型选择列。
- 支持`dateutil`时区。
- `read_csv()`现在可以忽略完整的评论行。
- 新增了“选项和设置”的文档部分。
---
### 3. ** learner 超全Features**
- **新功能**:
- 增加了`DataFrame.align`方法,支持标准的连接选项。
- `read_csv`和`read_table`新增了`parse_dates`选项,可选尝试解析索引列中的日期。
- **弃用与移除**:
-去除了 `.ix` 和 `Panel`,建议使用其他方法或工具包替代。
- 移除了部分废弃的函数和方法,例如`parseCSV`、`parseText`、`parseExcel`等。
---
### 4. ** 教程 和 Resources**
- 提供了针对新手的多个学习课程,包括数据导入/导出、数据清洗、统计分析、数据合并、可视化等内容。
- 练习部分涵盖了真实数据集的操作,帮助用户提升技能。
---
### 5. ** 贡献者**
- документalue列举了多个版本中贡献者的名字,感谢他们对pandas社区的贡献。
---
### 6. ** 总体**
- **pandas**是一个功能强大、社区活跃的开源工具包,适合处理复杂的数据分析任务。
- newUser建议从基础功能开始学习,并参考文档和教程以提升使用效率。
---
以上是文档的核心内容,涵盖了`pandas`的功能特点、版本更新、学习资源等方面,重点突出关键信息,语言简洁明了。 | ||
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余
2038 页请下载阅读 -
文档评分













