没有合适的资源?快使用搜索试试~ 我知道了~
pandas基础操作1.0
2 下载量 200 浏览量
2020-12-22
00:53:50
上传
评论
收藏 135KB PDF 举报
温馨提示
试读
13页
pandas基础操作 一、pandas常用数据类型 1、Series 一维,带标签数组 2、DataFrame,二维,Series容器 二、创建 series 1、Series的创建(直接接受一个数组,默认的index是0开始的序列) import pandas as pd import string t = pd.Series([1,2,3,4]) Out[1]: 0 1 1 2 2 3 3 4 dtype: int64 type(t) #pandas.core.series.Series In [2]: pd.Series(np.arange(12),ind
资源详情
资源评论
资源推荐
pandas基础操作基础操作1.0
pandas基础操作基础操作
一、一、pandas常用数据类型常用数据类型
1、、Series 一维,带标签数组一维,带标签数组
2、、DataFrame,二维,,二维,Series容器容器
二、创建二、创建 series
1、、Series的创建(直接接受一个数组,默认的的创建(直接接受一个数组,默认的index是是0开始的序列)开始的序列)
import pandas as pd
import string
t = pd.Series([1,2,3,4])
Out[1]:
0 1
1 2
2 3
3 4
dtype: int64
type(t) #pandas.core.series.Series
In [2]:
pd.Series(np.arange(12),index=list(string.ascii_uppercase[:12]))# 索引index要和数组size一致
Out[2]:
A 0
B 1
C 2
D 3
E 4
F 5
G 6
H 7
I 8
J 9
K 10
L 11
dtype: int64
2、通过字典创建、通过字典创建Serise
a = {string.ascii_uppercase[i]:i for i in range(10)}
a
{'A': 0,
'B': 1,
'C': 2,
'D': 3,
'E': 4,
'F': 5,
'G': 6,
'H': 7,
'I': 8,
'J': 9}
pd.Series(a)
A 0
B 1
C 2
D 3
E 4
F 5
G 6
H 7
I 8
J 9
dtype: int64
3、索引对不上的情况、索引对不上的情况(即出现即出现nan)
pd.Series(a,index=list(string.ascii_uppercase[5:15]))
F 5.0
G 6.0
H 7.0
I 8.0
J 9.0
K NaN
L NaN
M NaN
N NaN
O NaN
dtype: float64
三、三、pandas之之Serise切片和索引切片和索引
t:
A 0
B 1
C 2
D 3
E 4
F 5
G 6
H 7
I 8
J 9
K 10
L 11
dtype: int64
1、切片:直接传入、切片:直接传入start end 或者步长即可或者步长即可
t[1:4:2] # 索引1-4,左闭右开,2为步长,参照python的list取值
'''
B 1
D 3
dtype: int64
'''
t[1:3] # 只输入start , end,步长默认1
'''
B 1
C 2
dtype: int64
'''
t[::2] # 只输入步长
'''
A 0
C 2
E 4
G 6
I 8
K 10
dtype: int64
'''
2、索引、索引:一个的时候直接传入序号或者一个的时候直接传入序号或者index,多个的时候传如序号或者,多个的时候传如序号或者index的列表的列表
#取一个
t[1]# 传入序号
t['A'] # 传index
# 取多个
t[[1,2,3]] t[['A','B','C']] # 注意:如果取没有的值,会出现nan
t[['A','M']] # M不存在
'''
A 0.0
M NaN
dtype: float64
'''
3、、bool取值取值
t[t>4] '''
F 5
G 6
H 7
I 8
J 9
K 10
L 11
dtype: int64
'''
4、获取、获取index
t.index
'''
Index(['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L'], dtype='object')
'''
for i in t.index:
print(i)
5、获取、获取values
t.values
'''
array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11])
'''
type(t.values)
#numpy.ndarray
6、总结、总结
#Series对象本质由两个数组构成,一个数组构成对象的键(index,索引),一个数组构成值values
#所以,数组的clip等方法是通用的,但是series的where方法结果与ndarray不同
t.where(t >2) # t将小于2的值变为了nan,而并没有去掉
'''
A NaN
B NaN
C NaN
D 3.0
E 4.0
F 5.0
G 6.0
H 7.0
I 8.0
J 9.0
K 10.0
L 11.0
dtype: float64
'''
t.where(t>3,10) # 将小于3的数变为了10,与ndarray的变化相反
'''
A 10
B 10
C 10
D 10
E 4
F 5
G 6
H 7
I 8
J 9
K 10
L 11
dtype: int64
'''
四、四、pandas读外部文件读外部文件
1、、pd.read_csv()
df = pd.read_csv("./dogNames2.csv")
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ZTR4L7CB-1584608153878)
(/Users/bobwang/Library/Application Support/typora-user-images/image-20200313113353181.png)]
2、读、读SQLpandas.``read_sql(sql, con**,** index_col=None**,** coerce_float=True**,** params=None**,**
parse_dates=None**,** columns=None**,** chunksize=None)
四、创建四、创建pandas的的DataFrame
1、直接传入字典、直接传入字典
d1 = {"name":["xiaoming","xiaofan"],"age":[12,13],"tel":[10010,10012]}
pd.DataFrame(d1,index=list("ab"))
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-VzOruUNr-1584608153881)
(/Users/bobwang/Library/Application Support/typora-user-images/image-20200313151557054.png)]
2、传入数组、传入数组
pd.DataFrame(np.arange(12).reshape(3,4))
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-GtKMGK5Q-1584608153887)
(/Users/bobwang/Library/Application Support/typora-user-images/image-20200313152921761.png)]
3、说明、说明
DataFrame对象既有行索引,又有列索引对象既有行索引,又有列索引
剩余12页未读,继续阅读
weixin_38691641
- 粉丝: 5
- 资源: 929
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0