一种基于OCR的随货单识别校准方法与流程

文档序号:33647581发布日期:2023-03-29 05:20阅读:来源:国知局

技术特征:
1.一种基于ocr的随货单识别校准方法,其特征在于,该方法包括以下步骤:获取随货单图像,通过外部ocr接口对所述随货单图像进行识别,并得到预设输出格式的所述随货单的表格和以所述表格为参照的文字块坐标;识别所述随货单中包含公司的关键文字块,并与商品数据库匹配,得到所述随货单的供应商名称;将所述供应商名称对应的随货单表格与预存的多个表格模板适配,判断是否存在对应的目标表格模板;若存在所述目标表格模板,则根据所述文字块坐标将所述文字块对应填充至所述目标表格模板,得到表格信息对象;在所述表格信息对象中商品行数信息不为空时,确定所述随货单表格与所述目标表格模板适配准确,则确定所述表格信息对象作为识别结果,所述识别结果包括属性文本和商品行数信息。2.根据权利要求1所述的一种基于ocr的随货单识别校准方法,其特征在于,识别所述随货单中包含公司的关键文字块前,还包括:计算以所述随货单为参照的表格坐标和文字块位置坐标,将所述表格坐标与所述文字块位置坐标一一对应,得到校准好的所述随货单。3.根据权利要求1所述的一种基于ocr的随货单识别校准方法,其特征在于,若存在所述目标表格模板,还包括:获取若干属性文本在所述随货单表格的表头行中对应的第一属性列坐标,以及在所述目标表格模板的表头行中对应的第二属性列坐标,其中,所述属性文本包括批准文号、通用名、生产厂家、规格、生产日期、有效期、数量、生产批号、单价、产地;将若干所述属性文本的第二属性列坐标校准至与其对应的第一属性列坐标。4.根据权利要求3所述的一种基于ocr的随货单识别校准方法,其特征在于,将若干所述属性文本的第二属性列坐标校准至与其对应的第一属性列坐标后,还包括:判断所述随货单表格是否符合预设的模板适配条件,所述模板适配条件包括:所述随货单表格的属性文本一半以上与所述目标表格模板的属性文本一致,或者,所述随货单表格的属性文本三分之一以上与所述目标表格模板的属性文本一致,且所述属性文本中批准文号的第一属性列坐标与第二属性列坐标一致;若不符合,则根据获取的所述第一属性列坐标,构建对应的通用表格;将所述随货单的文字块填充至所述通用表格内,对应生成表格信息对象。5.根据权利要求4所述的一种基于ocr的随货单识别校准方法,其特征在于:在所述表格信息对象中商品行数信息为空时,确定所述随货单表格与所述目标表格模板适配错误,则根据获取的所述第一属性列坐标,构建对应的通用表格;将所述随货单的文字块填充至所述通用表格内,对应生成表格信息对象。6.根据权利要求5所述的一种基于ocr的随货单识别校准方法,其特征在于:若不存在所述目标表格模板,则根据获取的所述第一属性列坐标,构建对应的通用表格;将所述随货单的文字块填充至所述通用表格内,对应生成表格信息对象。7.根据权利要求1所述的一种基于ocr的随货单识别校准方法,其特征在于,得到表格
信息对象前,还包括:通过文字块位置坐标和表格坐标对填充的所述目标表格模板校准,得到表格信息对象。8.根据权利要求1所述的一种基于ocr的随货单识别校准方法,其特征在于,识别所述随货单中包含公司的关键文字块,并与商品数据库匹配,得到所述随货单的供应商名称,包括:识别包含公司的关键文字块并根据坐标排序,依序匹配与所述商品数据库中供应商名称的相似度;确定所述相似度最大的供应商名称为所述随货单的供应商名称。9.根据权利要求1-8任一项所述的一种基于ocr的随货单识别校准方法,其特征在于,该方法还包括:将所述识别结果中的商品名称、商品规格、生产厂家、批准文号与目标药店对应所述商品数据库中的子数据库匹配,获取符合所述目标药店的第一识别结果;根据所述识别结果中的批准文号及商品名称长度,计算得到所述识别结果的基础分,所述基础分用于指示识别结果和所述商品数据库的匹配度;选取超过所述基础分的第一识别结果,再次与所述商品数据库进行匹配,获取符合所述商品数据库的第二识别结果;合并所述第一识别结果和所述第二识别结果,并选取排序前五的识别结果作为准确识别结果。10.根据权利要求9所述的一种基于ocr的随货单识别校准方法,其特征在于:所述外部ocr接口为阿里ocr接口,所述预设输出格式为json格式。

技术总结
本发明涉及一种基于OCR的随货单识别校准方法,包括:通过外部OCR接口对随货单图像进行识别,并识别随货单中包含公司的关键文字块,与商品数据库匹配,得到供应商名称;将随货单表格与表格模板适配,判断是否存在对应的目标表格模板;若存在,则根据文字块坐标将文字块对应填充至目标表格模板,得到表格信息对象;在表格信息对象中商品行数信息不为空时,确定随货单表格与目标表格模板适配准确,则确定表格信息对象作为识别结果,识别结果包括属性文本和商品行数信息。本申请通过结合OCR文字识别技术提取随货单的图片数据,并结合行列坐标校验、多模板适配以及药店商品库数据,校准上述图片数据,从而提高随货单识别的准确性以及入库的效率。入库的效率。入库的效率。


技术研发人员:张步镇 陈峰 陈奇 吴勇 彭国权 王为 关亚通
受保护的技术使用者:广州药帮信息科技有限公司
技术研发日:2022.09.09
技术公布日:2023/3/28
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1