对于大规模的专利申请文档,可以考虑利用文本挖掘技术来提取SMILES。通过训练模型来识别文档中的化学结构描述,并自动提取出对应的SMILES代码。这种方法可以大大提高处理效率,但需要一定的技术投入和数据支持。