pythonpandas基本操作练习50题.pdf资源-CSDN文库

160 浏览量 2023-06-11 17:32:56 上传评论收藏 2.89MB PDF 举报

资源推荐

资源详情

资源评论

pythonpandas基本操作练习50题

数据来源：数据来源：

⼀、例题⼀、例题1：探索快餐数据：探索快餐数据

1. 数据预览数据预览

变量含义

order_id 订单id

quantity 数量

item_name 商品名称

choice_description 详情

item_price 商品单价

2. 代码练习代码练习

#导⼊pandas

import pandas as pd

#读⼊数据

df = pd.read_csv('/Users/harper/Desktop/python/exercise_data/chipotle.tsv',sep=' ')

#查看前10⾏内容

df.head(10)

#数据集维度、⾏数、列数

print(df.shape)#维度：⾏*列

df.shape[0]#⾏数

df.shape[1]#⾏数

<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<

(4622, 5)

4622

<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<

#输出列名称，可以⽐较下⾯两种形式

print(df.columns)

print(df.columns.to_list())#以列表形式储存

<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<

Index(['order_id', 'quantity', 'item_name', 'choice_description',

'item_price'],

dtype='object')

['order_id', 'quantity', 'item_name', 'choice_description', 'item_price']

<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<

#被下单数最多商品(item_name)是什么

#思路：先按item_name分组，再根据quantity求和，再降序排列

#reset_index是可以输出成dataframe

df.groupby('item_name').quantity.sum().reset_index().sort_values(by = 'quantity',ascending = False)

<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<

item_name quantity

17 Chicken Bowl 761

18 Chicken Burrito 591

25 Chips and Guacamole 506

39 Steak Burrito 386

10 Canned Soft Drink 351

<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<

#求item_name的类别数

df['item_name'].nunique()

<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<

#在choice_description中下单次数最多的商品是什么

#注意到choice_description 中有⼀些空值，所以我们先挑出⾮空的⾏再分组-求和-排序

df[df['choice_description'].notnull()].groupby('choice_description').quantity.sum().reset_index().sort_values(by = 'quantity',ascending = False)

<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<

choice_description quantity

15 [Diet Coke] 159

14 [Coke] 143

583 [Sprite] 89

256 [Fresh Tomato Salsa, [Rice, Black Beans, Chees... 49

257 [Fresh Tomato Salsa, [Rice, Black Beans, Chees... 42

<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<

#⼀共有多少商品被下单，就是计算订单总数

print(df['quantity'].sum())

<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<

4972

<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<

#将item_price转换为浮点数

#注意到item_price前⾯有$符号

#⽅法1，个⼈感觉容易出错，str不知道什么时候需要加

df['item_price'] = df['item_price'].str.replace('$','')

#⽅法2：apply是针对每个元素，就不需要str了

def func(df):

df['item_price'] = df['item_price'].replace('$','')

return df

df = df.apply(func, axis = 1)

df['item_price'] = df['item_price'].astype('float')

print(df['item_price'])

7 Italy 16 0

10 Portugal 12 0

13 Spain 11 0

<<<<<<<<<<<<<<<<<<<<<<

#计算每个球队拿到的黄牌数的平均值，就是黄牌数的总数/球队总数

df['Yellow Cards'].sum()/df['Team'].nunique()

<<<<<<<<<<<<<<<<<<<<<<

7.4375

<<<<<<<<<<<<<<<<<<<<<<

#找到进球数Goals超过6的球队数据

df[df['Goals'] > 6])

<<<<<<<<<<<<<<<<<<<<<<

Team Goals Shots on target ... Subs on Subs off Players Used

5 Germany 10 32 ... 15 15 17

13 Spain 12 42 ... 17 17 18

<<<<<<<<<<<<<<<<<<<<<<

#选取以字母X开头/结尾/包含的球队数据

df[df['Team'].str.startswith('G')]#开头

<<<<<<<<<<<<<<<<<<<<<<

Team Goals Shots on target ... Subs on Subs off Players Used

5 Germany 10 32 ... 15 15 17

6 Greece 5 8 ... 12 12 20

<<<<<<<<<<<<<<<<<<<<<<

df[df['Team'].str.endswith('e')]#结尾

<<<<<<<<<<<<<<<<<<<<<<

Team Goals Shots on target ... Subs on Subs off Players Used

4 France 3 22 ... 11 11 19

6 Greece 5 8 ... 12 12 20

15 Ukraine 2 7 ... 9 9 18

<<<<<<<<<<<<<<<<<<<<<<

df[df['Team'].str.contains('a')]#中间

<<<<<<<<<<<<<<<<<<<<<<

Team Goals ... Subs off Players Used

0 Croatia 4 ... 9 16

2 Denmark 4 ... 7 15

3 England 5 ... 11 16

4 France 3 ... 11 19

5 Germany 10 ... 15 17

7 Italy 6 ... 18 19

8 Netherlands 2 ... 7 15

9 Poland 2 ... 7 17

10 Portugal 6 ... 14 16

11 Republic of Ireland 1 ... 10 17

12 Russia 5 ... 7 16

13 Spain 12 ... 17 18

15 Ukraine 2 ... 9 18

<<<<<<<<<<<<<<<<<<<<<<

#选取前7列

df.iloc[:,0:7]

#选取除了最后3列之外的全部列

df.iloc[:,0:-3]

#找到England,Italy,Russia的射正率(Shooting Accuracy)

df[df['Team'].isin(['England','Italy','Russia'])][['Team','Shooting Accuracy']]

剩余16页未读，继续阅读

评论收藏

内容反馈

是空空呀

粉丝: 167
资源: 3万+

pythonpandas基本操作练习50题.pdf

python编程练习题和答案.pdf

python编程练习题和答案借鉴.pdf

Python Pandas Cheat Sheet (DQ).pdf

python 中数组的基本操作.pdf

python面向对象概念及练习题.pdf

节Word的基本操作练习.pdf

计算机应用 基本操作练习3(样例).pdf

Linux基本操作命令练习[整理].pdf

计算机应用 基本操作练习2(样例).pdf

d《基因工程的基本操作程序》同步练习之欧阳数创编.pdf

基于Python Pandas Matplotlib的学生成绩分析.pdf

青少年编程等级考试∶Python编程一级试卷2练习.pdf

试卷青少年编程等级考试Python编程一级试卷3练习.pdf

【编程】青少年编程等级考试∶Python编程一级试卷6练习.pdf

python基础练习题100.pdf

实验一计算机基本操作及指法练习.pdf

Linux基本操作命令练习.pdf

实验二滴定分析基本操作练习.pdf

Python练习题100道.pdf

《Python100经典练习题》.pdf

130道python练习题.pdf

python练习题答案.pdf

中小学课时10：python基础知识及字符串的数据结构公开课教案教学设计课件案例测试练习题卷.pdf

Python测试题-python测试题.pdf

Python练习集100题.pdf

python二级考试操作题5.pdf

初中信息技术第一课用python编程优质word练习.pdf

最新资源

计算机应用基本操作练习3(样例).pdf

计算机应用基本操作练习2(样例).pdf