没有合适的资源?快使用搜索试试~ 我知道了~
资源详情
资源评论
资源推荐
11.3 Pandas
数
据
处
理
简
述
Pandas
是
⼀个
基
于
Numpy
构
建
的
Python
模
块
。
Pandas
模
块
所
具
有
的
⾼
性
能
、
⾼
效
率
和
⾼
⽔
平
使
之
成
为
数
据
分
析
最有
效
的
库
。
Pandas
中
常
⽤
的
两
种
数
据
结
构
Series
:
⼀
维
数
组
,
与
Python
基
本
的
数
据
结
构
List
相
近
。
其
区
别
是
,
List
中
的
元
素
可
以
是
不
同
的
数
据
类
型
,
⽽
Series
中
则
只
允
许
存
储
相
同
的
数
据
类
型
,
这
样
是
为
了
更有
效
地
使
⽤
内
存
,
提
⾼
运
算
效
率
。
DataFrame
:
⼆
维
的
表
格
型
数
据
结
构
。
可
以
将
DataFrame
理
解
为
Series
的
容
器
。
以
下
的
内
容
主
要
以
DataFrame
为主
。
⼀
、
Pandas
安
装
与
数
据
结
构
安
装
pandas
使
⽤
Series
$ sudo pip3 install pandas
import pandas as pd
pd.__version__
# '0.23.4'
ser = pd.Series(['
张
三
', '
李
四
', '
王
五
'])
"""
ser
0
张
三
1
李
四
2
王
五
dtype: object
"""
#
修
改
索
引
ser = pd.Series(['
张
三
', '
李
四
', '
王
五
'], list(range(1, 4)))
ser = pd.Series(['
张
三
', '
李
四
', '
王
五
'], index=list(range(1, 4))) #
这
样
会
更
明
确
"""
1
张
三
2
李
四
3
王
五
dtype: object
"""
# Series
有
个
values
属
性
,
它
的
值
是
array(['
张
三
', '
李
四
', '
王
五
'], dtype=object)
ser.values
type(ser.values) #
它
的
类
型
就
是
numpy.ndarray
# Series
也
可
以
运
算
ser2 = pd.Series([18, 19, 17], index=range(1, 4))
"""
1 18
2 19
3 17
dtype: int64
"""
ser2 + 1
#
字
典
的
key
作
为
索
引
data = {'beijing':9240, 'shanghai':8960, 'guangzhou':7400}
ser3 = pd.Series(data)
"""
beijing 9240
guangzhou 7400
shanghai 8960
dtype: int64
"""
ser3['beijing']
'beijing' in ser3
ser4 = pd.Series(data, index=['shanghai', 'beijing', 'chongqing'])
"""
shanghai 8960.0
beijing 9240.0
chongqing NaN
dtype: float64
"""
ser4.to_dict() # {'beijing': 9240.0, 'chongqing': nan, 'shanghai': 8960.0}
ser4.tolist() # [8960.0, 9240.0, nan]
ser4.to_json() # '{"shanghai":8960.0,"beijing":9240.0,"chongqing":null}'
DataFrame
⼆
、
Pandas
中
对
数
据
的
选
取
操
作
ser4.to_frame() # DataFrame
⽅
式
展
⽰
import numpy as np
data = np.arange(100, 109).reshape(3, -1)
"""
array([[100, 101, 102],
[103, 104, 105],
[106, 107, 108]])
"""
df = pd.DataFrame(data)
data = {
'name':['jack', 'mary', 'lily'],
'age':[19, 19, 17],
'height': [1.68, 1.72, 1.62]
}
df = pd.DataFrame(data)
df.columns #
查
看
key
,
Index(['age', 'height', 'name'], dtype='object')
df.columns = ['age', 'height', 'username'] #
可
以
这
样
修
改
key
df = pd.DataFrame(data, columns = ['age', 'height', 'name', 'email'])
df.index #
查
看
索
引
,
RangeIndex(start=0, stop=3, step=1)
df = pd.DataFrame(data, columns = ['age', 'height', 'name', 'email'], index=range(1, 4))
data = {
'name': ['
张
三
', '
李
四
', '
王
五
', '
赵
六
'],
'age': [18, 19, 17, 20],
'height': [1.68, 1.73, 1.62, 1.55]
}
剩余10页未读,继续阅读
Asama浅间
- 粉丝: 23
- 资源: 299
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0