pandasTrain.html python-pandas的一些小练习——东北大学大数据班数据挖掘实训Python基础二（2...

python

pandas

数据挖掘

数据分析

需积分: 31 8 下载量 34 浏览量 2020-03-29 13:04:34 上传评论收藏 329KB HTML 举报

温馨提示

python-pandas的一些小练习——东北大学大数据班数据挖掘实训Python基础二（2）实训练习：练习使用pandas 包中的dataframe和方法。 1将数据读取为dataframe类型，命名为df 2查看数据的形状[了解数据有多少行、多少列] 3查看数据的最开始的7条数据和尾部的3条数据 4查看数据的各字段的类型 5查看数据是否有缺失值 6如果有缺失值，进行补0操作 7从df中按字段取出‘ date’’dist’和‘ flight’形成新的df1 8从df中按位置选取行为3和4，列为0,1的数据形成新的df2 9在df中添加一列‘ low_dest’，内容是‘ dest’这列的字符串的小写形式 10从df中选取‘ dist’大于1000并且小于1200的数据作为一个新的df3 11从df中选取‘ time’大于100的数据做为新的df4 12将df3和df4合并为一个dataframe，命名为df5 13取出df3中的‘ time’,‘dist’ 这两列做为df6，求出df6中每列中最大值与最小值的差值（运用lambda函数的方式进行求解） 14将df根据“ dest”分组，统计各目的地，都有多少条数据，命名为“ dest_count”，然后将“ dest”和“ dest_count”组成新的dataframe命名为df7 15根据dep_delay不为0，统计df中有多少次航班起飞延误 16利用plane字段，统计df中不同航班的飞行次数，以plane和plane_cout格式保存为df8 17利用carrier字段，计算df中carrier字段不同属性数据的数据量的比值（如：XE的数据量与MQ的数据量的比值） 18分别将df7和 df8保存到本地文件，文件名分别为df7.csv和df8.csv

资源推荐

资源评论