pandas数据处理的简单实例——基于jupyter
基于知乎数据,进行简单数据处理,包含读取数据、数据预处理(数据去重、数据去重、缺省值处理、数据分组)等处理
基于知乎数据,进行简单数据处理,包含读取数据、数据预处理(数据去重、数据去重、缺省值处理、数据分组)等处理
此为jupyter文件,可在jupyter notebook里直接运行。帮助大家学习jupyter! 本文包含DataFrame数据的创建、查询、排序、索引等一系列基础操作语法 DataFrame表示一个长方形表格,并包含排好序的列,每一列都可以是不同的数值类型(数字,字符串,布尔值)。DataFrame有行索引和列索引(row index, column index);可以看做是分享所有索引的由series组成的字典
此为jupyter文件,可在jupyter notebook里直接运行。帮助大家学习jupyter! Series是带有label(即index)的一维序列。
该文件是.ipynb,可直接用jupyter打开运行 Matplotlib是一个强大的绘图工具,能满足几乎所有的2D和一些3D绘图的需求。 matplotlib是python科学计算中最基础、最重要的绘图库,一般使用matpltlib完全可以满足绘图需求 seaborn是构建在matplotlib之上的绘图库,能够一定程度上简化绘图过程。 seaborn基础还是matplotlib,所有利用python进行数据分析可视化,学习matplotlib是基础。
该文件是.ipynb,可直接用jupyter打开运行 本文内容包括: 一、创建Ndarray数组 二、Numpy的数据类型 三、数组的切片和索引 四、Numpy广播与数组操作 五、数组合并与通用函数 六、Numpy的统计函数 七、Numpy随机数、逻辑运算与数据存取