运用pandas和openpyxl删除空行以及合并单元格
运用pandas和openpyxl删除空行以及合并单元格
在工作中,我们有时会碰到这样一个问题,需要把一个表格的空行删除以及合并单元格,删除空行对于pandas来说小菜一碟,但是合并单元格呢,emmmmm,暂时没有想到更好的方法。 需求如下: 我现在有这样一个表格: 需要把它变成: 主要步骤如下:
-
使用pandas对空行删除 将pandas处理完的数据转成openpyxl中的Worksheet对象 合并单元格和保存文件 各步骤代码如下:
pandas删除空行和填充空值
# 导入pandas和openpyxl库 import pandas as pd from openpyxl import Workbook from openpyxl.utils.dataframe import dataframe_to_rows # 读取需要处理的excel文件 df = pd.read_excel(./hhhhhh.xlsx) # 删除空行,原表替换 df.dropna(how=all,inplace=True) # 填充空值,使用前一个值进行填充 df.fillna(axis=0,method=ffill,inplace=True)
将DataFrame数据转成openpyxl可以处理的Worksheet数据
wb=Workbook() ws=wb.active for row in dataframe_to_rows(df,index=False): ws.append(row)
合并单元格和保存文件
# 获取第一列数据 type_list = [] i = 2 while True: r = ws.cell(i, 1).value if r: type_list.append(r) else: break i += 1 file = raa.xlsx # 判断合并单元格的始末位置 start = 0 end = 0 flag = type_list[0] for i in range(len(type_list)): if type_list[i] != flag: flag = type_list[i] end = i - 1 if end >= start: ws.merge_cells("A" + str(start + 2) + ":A" + str(end + 2)) start = end + 1 if i == len(type_list) - 1: end = i ws.merge_cells("A" + str(start + 2) + ":A" + str(end + 2)) wb.save(file)