清理重复文件通常涉及计算每个文件的哈希值(如MD5或SHA256),然后比较这些哈希值来找出重复项。下面是一个简单的例子,它会遍历指定目录下的所有文件,并删除重复的文件。 import pandas as pd def process_excel(file_path): # 读取Excel文件 df = pd.read_excel(file_path) # 数据 ...