Pandas实现一列数据分隔为两列实现一列数据分隔为两列
分割成一个包含两个元素列表的列
对于一个已知分隔符的简单分割(例如,用破折号分割或用空格分割).str.split() 方法就足够了 。 它在字符串的列(系列)上
运行,并返回列表(系列)。
>>> import pandas as pd
>>> df = pd.DataFrame({'AB': ['A1-B1', 'A2-B2']})
>>> df
AB
0 A1-B1
1 A2-B2
>>> df['AB_split'] = df['AB'].str.split('-')
>>> df
AB AB_split
0 A1-B1 [A1, B1] 1 A2-B2 [A2, B2]
分割成两列,每列包含列表的相应元素
下面来看下如何从:分割成一个包含两个元素列表的列至分割成两列,每列包含列表的相应元素。
>>> df['AB'].str[0]
0 A
1 A
Name: AB, dtype: object
>>> df['AB'].str[1]
0 1
1 2
Name: AB, dtype: object
因此可以得到
>>> df['AB'].str.split('-', 1).str[0]
0 A1
1 A2
Name: AB, dtype: object
>>> df['AB'].str.split('-', 1).str[1]
0 B1
1 B2
Name: AB, dtype: object
可以通过如下代码将pandas的一列分成两列:
>>> df['A'], df['B'] = df['AB'].str.split('-', 1).str
>>> df
AB AB_split A B
0 A1-B1 [A1, B1] A1 B1
1 A2-B2 [A2, B2] A2 B2
补充知识:补充知识:pandas某一列中每一行拆分成多行的方法某一列中每一行拆分成多行的方法
在处理数据过程中,常会遇到将一条数据拆分成多条,比如一个人的地址信息中,可能有多条地址,既有家庭地址也有工作地
址,还有电话信息等等类似的情况,实际使用数据的时候又需要分开处理,这个时候就需要将这一条数据进行拆分成多条,以
方便使用。
在pandas中如何对DataFrame进行相关操作呢,经查阅相关资料,发现了一个简单的办法,
info.drop([‘city’], axis=1).join(info[‘city’].str.split(‘ ‘, expand=True).stack().reset_index(level=1,
drop=True).rename(‘city’))
看起来非常之长,分开来看,流程如下:
评论0
最新资源