金融界2024年2月19日消息,据国家知识产权局公告,厦门海迈科技股份有限公司申请一项名为“一种基于PDF文件的数据提取方法及装置“,公开号CN117555860A,申请日期为2023年10月。
专利摘要显示,本发明提供一种基于PDF文件的数据提取方法及装置。本发明一种基于PDF文件的数据提取方法,包括:在画布上绘制并显示第一PDF文件页面视图,所述第一PDF文件中包括第一键和第一键值;根据所述第一PDF文件创建数据提取模块,所述数据提取模块用于关联第一键与第一键值,所述数据提取模块通过位置信息关联第一键和第一键值;通过所述数据提取模块提取第二PDF文件数据。本发明实施例通过根据第一PDF文件配置数据提取模块,将第一键与第一值关联,实现第二PDF文件的数据提取,提取过程不局限于文档的格式,而通过位置信息提取信息,解决了现有技术中容易出错,无法给出精确的信息的问题。
本文源自金融界