Pandas dataframe列名重命名
有三种方法: 1、使用columns重命名:
import pandas as pd data=pd.read_csv(./data/job_info/job_info.csv,encoding=gbk) data.columns =[公司,岗位,工作地点,工资,发布日期] data
输出:
2、rename()方法:
原表: 对指定列重命名可以使用rename()方法。默认是使用新的列名新建一个dataframe
import pandas as pd data=pd.read_csv(./data/job_info/job_info.csv,encoding=gbk) data=data.rename(columns={ 字节跳动:公司,数据产品经理:岗位,北京:工作地点,2-3.5万/月:工资,09-03:发布日期}) data
输出: 如果要在原来的dataframe上修改列名,可以设置参数inplace为True:
import pandas as pd data=pd.read_csv(./data/job_info/job_info.csv,encoding=gbk) data=data.rename(columns={ 字节跳动:公司,数据产品经理:岗位,北京:工作地点,2-3.5万/月:工资,09-03:发布日期},inplace=True)
也可以使用lambda批量修改:
#但是我并没有看懂 #原代码: df.rename(columns=lambda x: x[1:], inplace=True)
3.pandas0.21重命名方法做了更改:rename()和set_axis()方法:
rename(),新增了参数axis,它的值为可以columns或者1,当参数为columns或1时,用于修改列名:
import pandas as pd data=pd.read_csv(./data/job_info/job_info.csv,encoding=gbk) data=data.rename(columns={ 字节跳动:公司,数据产品经理:岗位,北京:工作地点,2-3.5万/月:工资,09-03:发布日期}) data
输出: rename()是对指定列名做更改,set_axis则是可以重新设置列名,inplace参数用于标记是否在原来的dataframe修改列名:
import pandas as pd data=pd.read_csv(./data/job_info/job_info.csv,encoding=gbk) data.set_axis([公司,岗位,工作地点,工资,发布日期],axis=columns,inplace=False) data
输出: