运用pandas和openpyxl删除空行以及合并单元格

运用pandas和openpyxl删除空行以及合并单元格

在工作中,我们有时会碰到这样一个问题,需要把一个表格的空行删除以及合并单元格,删除空行对于pandas来说小菜一碟,但是合并单元格呢,emmmmm,暂时没有想到更好的方法。 需求如下: 我现在有这样一个表格: 需要把它变成: 主要步骤如下:

    使用pandas对空行删除 将pandas处理完的数据转成openpyxl中的Worksheet对象 合并单元格和保存文件 各步骤代码如下:

pandas删除空行和填充空值

# 导入pandas和openpyxl库
import pandas as pd
from openpyxl import Workbook
from openpyxl.utils.dataframe import dataframe_to_rows
# 读取需要处理的excel文件
df = pd.read_excel(./hhhhhh.xlsx)
# 删除空行,原表替换
df.dropna(how=all,inplace=True)
# 填充空值,使用前一个值进行填充
df.fillna(axis=0,method=ffill,inplace=True)

将DataFrame数据转成openpyxl可以处理的Worksheet数据

wb=Workbook()
ws=wb.active
for row in dataframe_to_rows(df,index=False):
    ws.append(row)

合并单元格和保存文件

# 获取第一列数据
type_list = []
i = 2


while True:
    r = ws.cell(i, 1).value
    if r:
        type_list.append(r)
    else:
        break
    i += 1

file = raa.xlsx
# 判断合并单元格的始末位置
start = 0
end = 0
flag = type_list[0]
for i in range(len(type_list)):
    if type_list[i] != flag:
        flag = type_list[i]
        end = i - 1
        if end >= start:
            ws.merge_cells("A" + str(start + 2) + ":A" + str(end + 2))
            start = end + 1
    if i == len(type_list) - 1:
        end = i
        ws.merge_cells("A" + str(start + 2) + ":A" + str(end + 2))

wb.save(file)
经验分享 程序员 微信小程序 职场和发展