9. 根据最大的类别筛选 Dataframe........................................................122
10. 选择最频繁出现的数据....................................................................122
11. 查看数据表的空值............................................................................127
12. 查看某一列空值................................................................................127
13. 查看某一列的唯一值........................................................................127
14. 选择包含特定字符串所在的行 ........................................................127
四、缺失数据处理...........................................................................................128
1. 何时/为什么数据丢失? ....................................................................128
2. 日期时间类型的缺失值......................................................................129
3. 插入缺失数据......................................................................................130
4. 缺失数据的计算..................................................................................131
5. 取出列中值缺失的行..........................................................................133
6. reindex()方法可以对指定轴上的索引进行改变/增加/删除操作,这将
返回原始数据的一个拷贝 .......................................................................133
7. 删除带有缺失值的行..........................................................................134
8. 代替缺失值..........................................................................................135
9. 当值为 NaN 时返回布尔值 TRUE,否则返回 FALSE .........................137
10. 判断 DataFrame 是否为空 ................................................................137
11. 计算变量缺失率................................................................................138
12. 获取 Dataframe 中某一字段值为 NaN 的记录数............................139
13. 填充缺失的数值,并且令数据类型为整数 ....................................139
五、相关的操作...............................................................................................140
1. 统计(stats) ......................................................................................140
2. Apply 函数.............................................................................................163
3. 直方图(Histogramming) .................................................................168
4. 字符串方法..........................................................................................169
六、合并数据...................................................................................................170
1. concat 函数 ...........................................................................................170
2. merge 函数 ...........................................................................................174
3. append 函数..........................................................................................176
4. combine 函数........................................................................................178
5. join 函数................................................................................................179
七、分组(Grouping)....................................................................................180
1. 分组,然后将函数 sum 应用到每一组的数据中 .............................182
2. 对多列进行分组形成一个层次索引,然后执行函数 ......................182
3. 连接分组记录中所有字段值为一个字符串 ......................................183
4. Series 系列分组 ....................................................................................183
5. 通过数据类型或者字典分组 ..............................................................184
6. 获取单个分组......................................................................................184
7. 对分组进行迭代..................................................................................184
8. 分组聚合..............................................................................................185
9. 分组生成字典......................................................................................188
10. 使用 axis=1 在横轴分块....................................................................189
11. 通过字典或者 series 进行分组.........................................................189