1、收集数据源文件夹中的数据文件名称(workbook_name)
file_dir = "d:/test/test_data"
file_list = os.listdir(file_dir)
print("合并的文件包括:", file_list)
2、建立新的数据汇总文:用于收集并保存所有的数据
new_file = "d:/test/Summary/Data_Summary.xlsx"
new_list = []
sheet_num = 0
3、打开并读取Excel文件,收集每个数据文件中的表格名称(sheet_names)
for file in file_list:
file_path = os.path.join(file_dir, file)
wb = openpyxl.load_workbook(file_path)
sheet_names = wb.sheetnames
sheet_num += len(sheet_names)
4、按表格将数据转换位dataframe, 并汇总在一起
for sn in sheet_names:
dataframe = pd.read_excel(file_path, sheet_name=sn, header=0)
new_list.append(dataframe)
5、将dataframe转为Excel
df = pd.concat(new_list) df.to_excel(new_file, sheet_name="Data")
6、检查数据汇总的结果:
print("合并的表格数量:", sheet_num)
print("数据的汇总表格已经产生,请检查!")
神龙|纯净稳定代理IP免费测试>>>>>>>>天启|企业级代理IP免费测试>>>>>>>>IPIPGO|全球住宅代理IP免费测试