python基础教程:pandasDataFrame⾏列索引及值的获取的⽅法 pandas DataFrame是⼆维的,所以,它既有列索引,⼜有⾏索引 上⼀篇⾥只介绍了列索引: import pandas as pd df = pd.DataFrame({'A': [0, 1, 2], 'B': [3, 4, 5]}) print df # 结果: A B 0 0 3 1 1 4 2 2 5 ⾏索引⾃动⽣成了 0,1,2 如果要⾃⼰指定⾏索引和列索引,可以使⽤ index 和 column 参数: 这个数据是5个车站10天内的客流数据: ridership_df = pd.DataFrame( data=[[ 0, 0, 2, 5, 0], [1478, 3877, 3674, 2328, 2539], [1613, 4088, 3991, 6461, 2691], [1560, 3392, 3826, 4787, 2613], [1608, 4802, 3932, 4477, 2705], [1576, 3933, 3909, 4979, 2685], [ 95, 229, 255, 在Python的Pandas库中,DataFrame是一个非常重要的数据结构,用于处理二维表格型数据。它具有行索引和列索引,使得数据操作更加灵活。本教程将详细讲解如何在DataFrame中获取行列索引及值。 创建DataFrame时,默认情况下行索引会自动生成,如`0, 1, 2`等。例如: ```python import pandas as pd df = pd.DataFrame({'A': [0, 1, 2], 'B': [3, 4, 5]}) ``` 在这个例子中,我们创建了一个包含两列`A`和`B`的DataFrame,行索引为0, 1, 2。 如果你想自定义行索引和列索引,可以使用`index`和`columns`参数: ```python ridership_df = pd.DataFrame( data=[ [0, 0, 2, 5, 0], [1478, 3877, 3674, 2328, 2539], [1613, 4088, 3991, 6461, 2691], # ... ], index=['05-01-11', '05-02-11', '05-03-11', '05-04-11', '05-05-11'], columns=['R003', 'R004', 'R005', 'R006', 'R007'] ) ``` 在这里,我们创建了一个表示5个车站10天内客流数据的DataFrame,行索引是日期,列索引是站名。 获取DataFrame中的值有多种方法: 1. **获取某一列**:可以通过列名直接访问,例如`ridership_df['R003']`,这将返回一个Series对象,包含该列的所有值。 2. **获取某一行**:可以使用`.loc`或`.iloc`方法。`.loc`是基于标签的索引,`.iloc`是基于位置的索引。例如,`ridership_df.loc['05-01-11']`或`ridership_df.iloc[0]`都将返回指定日期的行。 3. **获取某一行某一列的值**:组合使用`.loc`或`.iloc`与列名,如`ridership_df.loc['05-05-11', 'R003']`或`ridership_df.iloc[4, 0]`,可获取特定日期和站名的数值。 4. **获取原始的NumPy二维数组**:通过`.values`属性,我们可以获取DataFrame的内部表示,即一个NumPy数组,例如`ridership_df.values`。 此外,还可以利用其他方法进行数据筛选、合并、分组等复杂操作。Pandas提供的这些工具使得数据分析工作变得高效而简洁。在实际应用中,理解并熟练运用DataFrame的各种操作是至关重要的,能够帮助我们快速处理大量数据,进行统计分析和数据清洗。
- 粉丝: 105
- 资源: 9354
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助