self.processor.tokenizer.pad_token_id else -100 for label in labels] encoding = { "pixel_values": pixel_values.squeeze(), "labels": torch.tensor(labels) } return encoding 初始化TrOCR处理器,并准备训练和验证数据集。 # ...
OCR技术作为文档智能解析链路中的核心组件之一,贯穿整个技术链路,包括:文字识别、表格文字识别、公式识别,参看下面这张架构图: 前期介绍了很多关于文档智能解析相关核心技术及思路,本着连载的目的,本次迎来介绍整个链路中的最后一块拼图-OCR。