1、收集数据源文件夹中的数据文件名称(workbook_name)
file_dir = "d:/test/test_data" file_list = os.listdir(file_dir) print("合并的文件包括:", file_list)
2、建立新的数据汇总文:用于收集并保存所有的数据
new_file = "d:/test/Summary/Data_Summary.xlsx" new_list = [] sheet_num = 0
3、打开并读取Excel文件,收集每个数据文件中的表格名称(sheet_names)
for file in file_list: file_path = os.path.join(file_dir, file) wb = openpyxl.load_workbook(file_path) sheet_names = wb.sheetnames sheet_num += len(sheet_names)
4、按表格将数据转换位dataframe, 并汇总在一起
for sn in sheet_names: dataframe = pd.read_excel(file_path, sheet_name=sn, header=0) new_list.append(dataframe)
5、将dataframe转为Excel
df = pd.concat(new_list) df.to_excel(new_file, sheet_name="Data")
6、检查数据汇总的结果:
print("合并的表格数量:", sheet_num) print("数据的汇总表格已经产生,请检查!")
神龙|纯净稳定代理IP免费测试>>>>>>>>天启|企业级代理IP免费测试>>>>>>>>IPIPGO|全球住宅代理IP免费测试