没有合适的资源?快使用搜索试试~ 我知道了~
数据分析练习1
0 下载量 38 浏览量
2021-01-20
12:25:43
上传
评论
收藏 58KB PDF 举报
温馨提示
![preview](https://dl-preview.csdnimg.cn/14885700/0001-47b7e7e445911681915f1cfb75897d78_thumbnail.jpeg)
![preview-icon](https://csdnimg.cn/release/downloadcmsfe/public/img/scale.ab9e0183.png)
试读
2页
寒假的练习任务 寒假学习了Python数据分析基础这本书,然后在学习完之后为了检验学习进度,布置了分析10万条数据的任务。 要求是这样的: 数据样例: 18 Jogging 102271561469000 -13.53 16.89 -6.4 18 Jogging 102271641608000 -5.75 16.89 -0.46 18 Jogging 102271681617000 -2.18 16.32 11.07 18 Jogging 3.36 18 Downstairs 103260201636000 -4.44 7.06 1.95 18 Downstairs 1032602416140
资源推荐
资源详情
资源评论
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![xlsx](https://img-home.csdnimg.cn/images/20210720083732.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/release/download_crawler_static/14885700/bg1.jpg)
数据分析练习数据分析练习1
寒假的练习任务寒假的练习任务
寒假学习了寒假学习了Python数据分析基础这本书,然后在学习完之后为了检验学习进度,布置了分析数据分析基础这本书,然后在学习完之后为了检验学习进度,布置了分析10万条数据的任务。万条数据的任务。
要求是这样的:要求是这样的:
数据样例:数据样例:
18 Jogging 102271561469000 -13.53 16.89 -6.4
18 Jogging 102271641608000 -5.75 16.89 -0.46
18 Jogging 102271681617000 -2.18 16.32 11.07
18 Jogging 3.36
18 Downstairs 103260201636000 -4.44 7.06 1.95
18 Downstairs 103260241614000 -3.87 7.55 3.3
18 Downstairs 103260321693000 -4.06 8.08 4.79
18 Downstairs 103260365577000 -6.32 8.66 4.94
18 Downstairs 103260403083000 -5.37 11.22 3.06
18 Downstairs 103260443305000 -5.79 9.92 2.53
6 Walking 0 0 0 3.214402
处理一:处理一:
将数据中所有的行信息有问题的那行信息删除,如样例中第四条数据将数据中所有的行信息有问题的那行信息删除,如样例中第四条数据
这一行数据只有三个元素,而其他行都有六个元素,所以删除第四条即可这一行数据只有三个元素,而其他行都有六个元素,所以删除第四条即可
再如最后一行第三个信息明显有问题所以该行也是问题行,删除即可再如最后一行第三个信息明显有问题所以该行也是问题行,删除即可
其他问题自己去找其他问题自己去找
将全部数据处理完之后,每行单个元素以逗号为分隔,写入文件将全部数据处理完之后,每行单个元素以逗号为分隔,写入文件test1
test1中样例:中样例:
6,Walking,23445542281000,-0.72,9.62,0.14982383,
6,Walking,23445592299000,-4.02,11.03,3.445948,
6,Walking,23470662276000,0.95,14.71,3.636633,
这个处理一要求的是将数据样例中的错误信息删除,错误有两处,第一就是有的数据只有
3
行,第二就是有的数据从第三行开
始都是
0
。这就是这个数据处理中的第一步,代码如下
`
#!/usr/bin/env python3
import sys
import csv
input_file=sys.argv[1] output_file=sys.argv[2]
a_len=6
with open(input_file,'r',newline='')as csv_in_file:
with open(output_file,'w',newline='')as csv_out_file:
filereader=csv.reader(csv_in_file,delimiter=' ')
filewriter=csv.writer(csv_out_file)
for row_list in filereader:
if len(row_list) == a_len and row_list[2] != '0':
filewriter.writerow(row_list)
思路很简单,先看正常数据它的长度为6,那我我给他定义一个a_len=6,然后在数据中循环,如果等于6那么就输出,如果小
于6那么就不输出,这样便可以清理掉第一部分错误数据。然后之前说从第三行开始,数值为0,那么我们就可以让第三行不
等于0的数据输出,这样处理一就解决了。而要注意的是首先0在这里不是数字0,而是‘0’,如果你按照数字0来处理的话,是
解决不了的,其次注意的是row[2]代表的意思是第3行,因为他是从0算起的。最后也是最重要的,是我刚开始做怎么也得不到
正确的答案的地方,就是delimiter,delimiter=‘,’是默认分隔符,所以如果你的输入文件和输出文件都是用逗号分隔的,就不
需要这个指定参数。而这个初始数据是以空格分隔得,所以必须要delimiter=‘ ’,才可以正常输出。
处理二:处理二:
将将test1数据中所有动作的数目统计出来,将动作数目打印到屏幕,数据中所有动作的数目统计出来,将动作数目打印到屏幕,
后将动作数目变为后将动作数目变为100的倍数,多余的删除,的倍数,多余的删除,
比如你统计出比如你统计出Jopping地数量为地数量为3021次次
那么打印出那么打印出3021后只往文件写入后只往文件写入3000条,写入文件条,写入文件test2
处理二是让将所有的动作数据统计出来,并且变为
100
的倍数输出。这个我分了两步,第一,先统计所有动作的数目,第二,
将他们变为
100
的倍数输出。
import csv
input_file="text1answer.csv"
output_file="text2.csv"
with open(input_file ,'r',newline='')as csv_in_file:
资源评论
![avatar-default](https://csdnimg.cn/release/downloadcmsfe/public/img/lazyLogo2.1882d7f4.png)
![avatar](https://profile-avatar.csdnimg.cn/default.jpg!1)
weixin_38522323
- 粉丝: 5
- 资源: 908
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![voice](https://csdnimg.cn/release/downloadcmsfe/public/img/voice.245cc511.png)
![center-task](https://csdnimg.cn/release/downloadcmsfe/public/img/center-task.c2eda91a.png)
安全验证
文档复制为VIP权益,开通VIP直接复制
![dialog-icon](https://csdnimg.cn/release/downloadcmsfe/public/img/green-success.6a4acb44.png)