Python 常用的数据分析库有哪些?Python 数据分析模块介绍。Python 本身的数
据分析功能并不强,需要一些第三方的扩展库来增强它的能力。们课程用到的库包
括 NumPy、Pandas、Matplotlib、Seaborn、NLTK 等,接下来将针对相关库一个
简单的介绍,方便后面章节的学习。
在 Python 中,常用的数据分析库主要有以下几种:
1、NumPy 库
NumPyPython 源的数值计算扩展工具,它了 Python 对多维数组的支持,能够支
持高级的维度数组与矩阵运算。此外,针对数组运算也了量的数学函数库。
NumPy 部分 Python 科学计算的基础,它具有以下功能:
(1)快速的多维数据对象 ndarray。
(2)高性能科学计算和数据分析的基础包。
(3)多维数组(矩阵)具有矢量运算能力,快速、节省空间。
(4)矩阵运算。无需循环,可完成类似 Matlab 中的矢量运算。
(5)线性代数、随机数生成以及傅里叶变换功能。
2、Pandas 库
Pandas 一个基于 NumPy 的数据分析包,它为了解决数据分析任务而创建的。
Pandas 中纳入了量库和标准的数据模型,了地操作型数据集所需要的函数和方法,
使用户能快速便捷地处理数据。
Pandas 作为强而的数据分析环境中的重要因素之一,具有以下特:
(1)一个快速的 DataFrame 对象,具有默认和自定义的索引。
(2)用于在内存数据结构和不同文件格式中读取和写入数据,比如 CSV 和文本文件、
Excel 文件及 SQL 数据库。
(3)智能数据对齐和缺失数据的集成处理。
(4)基于标签的切片、花式索引和数据集的子集。
(5)可以删除或入来自数据结构的列。
(6)按数据分组进行聚合和转换。
(7)高性能的数据合并和连接。
(8)时间序列功能。
1
评论0
最新资源