一种图像类型的识别方法、编码模型的训练方法和服务器与流程

文档序号：37050024发布日期：2024-02-20 20:46阅读：15来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本公开涉及图像识别技术，尤其涉及一种图像类型的识别方法、编码模型的训练方法和服务器。

背景技术：

1、目前，随着科技的发展，允许在线上提交多种类型的证件材料来办理业务。线上提交的证件材料以图像的形式为主。可以根据提交的证件图像，识别图像的类型，之后可以根据识别出的图像类型进行进一步的业务处理。

2、现有技术中，图像的类型识别主要是将收集到的图像打上类型标签，进行图像分类模型训练，得到类型识别模型。得到的类型识别模型可以用于识别图像的类型。

3、但是，上述方式中由于证件材料的种类多，且版式也不固定，有些证件材料的样件也不是很多，不足以训练出高准确率的类型识别模型，致使图像类型识别准确性有待进一步提高。

技术实现思路

1、本公开提供了一种图像类型的识别方法、编码模型的训练方法和服务器，以提高现有技术中分类模型的图像类型识别准确性。

2、根据本公开第一方面，提供了一种图像类型的识别方法，包括：

3、获取待识别的证件图像，并提取所述证件图像中的目标文本内容；

4、利用预设的编码模型对所述目标文本内容进行编码，获取所述证件图像对应的目标向量；

5、将所述目标向量与预设的召回库中包括的多个向量依次进行余弦相似度计算，并根据计算结果，确定所述证件图像的图像类型；其中，所述预设的召回库中包括的向量为根据所述预设的编码模型对图像类型的类型名称进行编码得到的；

6、其中，所述预设的编码模型为根据待训练证件图像的标注类型和文本内容之间的标注关联关系，预测关联关系，更新预设模型的参数得到的。

7、根据本公开第二方面，提供了一种编码模型的训练方法，包括：

8、获取训练数据集；所述训练数据集中包括多个待训练证件图像；所述待训练证件图像具有标注类型；

9、分别提取所述待训练证件图像中的文本内容；

10、利用预设模型中包括的编码模块分别对每个所述待训练证件图像的文本内容和标注类型的类型名称进行编码，得到编码后的文本内容和编码后的类型名称；

11、将编码后的文本内容和编码后的类型名称进行随机组合并输入至所述预设模型中包括的二分类模块中，得到编码后的文本内容和编码后的类型名称之间的预测关联关系；

12、根据编码后的文本内容和编码后的类型名称之间的标注关联关系和预测关联关系，更新所述预设模型的参数，得到编码模型；

13、其中，若确定编码后的文本内容和编码后的类型名称对应同一张待训练证件图像，则编码后的文本内容和编码后的类型名称之间的标注关联关系表征编码后的文本内容和编码后的类型名称之间关联；若确定编码后的文本内容和编码后的类型名称不对应同一张待训练证件图像，则编码后的文本内容和编码后的类型名称之间的标注关联关系表征编码后的文本内容和编码后的类型名称之间不关联；

14、其中，所述编码模型用于将图像类型的类型名称编码为向量；编码得到的向量用于生成预设的召回库；所述编码模型还用于对待识别的证件图像中提取的文本内容进行编码。

15、根据本公开第三方面，提供了一种图像类型的识别装置，包括：

16、获取单元，用于获取待识别的证件图像，并提取所述证件图像中的目标文本内容；

17、编码单元，用于利用预设的编码模型对所述目标文本内容进行编码，获取所述证件图像对应的目标向量；

18、确定单元，用于将所述目标向量与预设的召回库中包括的多个向量依次进行余弦相似度计算，并根据计算结果，确定所述证件图像的图像类型；其中，所述预设的召回库中包括的向量为根据所述预设的编码模型对图像类型的类型名称进行编码得到的；

19、其中，所述预设的编码模型为根据待训练证件图像的标注类型和文本内容之间的标注关联关系，预测关联关系，更新预设模型的参数得到的。

20、根据本公开第四方面，提供了一种编码模型的训练装置，包括：

21、获取单元，用于获取训练数据集；所述训练数据集中包括多个待训练证件图像；所述待训练证件图像具有标注类型；

22、提取单元，用于分别提取所述待训练证件图像中的文本内容；

23、训练单元，用于利用预设模型中包括的编码模块分别对每个所述待训练证件图像的文本内容和标注类型的类型名称进行编码，得到编码后的文本内容和编码后的类型名称；

24、训练单元，还用于将编码后的文本内容和编码后的类型名称进行随机组合并输入至所述预设模型中包括的二分类模块中，得到编码后的文本内容和编码后的类型名称之间的预测关联关系；

25、训练单元，还用于根据编码后的文本内容和编码后的类型名称之间的标注关联关系和预测关联关系，更新所述预设模型的参数，得到编码模型；

26、其中，若确定编码后的文本内容和编码后的类型名称对应同一张待训练证件图像，则编码后的文本内容和编码后的类型名称之间的标注关联关系表征编码后的文本内容和编码后的类型名称之间关联；若确定编码后的文本内容和编码后的类型名称不对应同一张待训练证件图像，则编码后的文本内容和编码后的类型名称之间的标注关联关系表征编码后的文本内容和编码后的类型名称之间不关联；

27、其中，所述编码模型用于将图像类型的类型名称编码为向量；编码得到的向量用于生成预设的召回库；所述编码模型还用于对待识别的证件图像中提取的文本内容进行编码。

28、根据本公开第五方面，提供了一种服务器，包括存储器和处理器；其中，

29、所述存储器，用于存储计算机程序；

30、所述处理器，用于读取所述存储器存储的计算机程序，并根据所述存储器中的计算机程序执行如第一方面、第二方面所述的方法。

31、根据本公开第六方面，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现如第一方面、第二方面所述的方法。

32、根据本公开第七方面，提供了一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时，实现如第一方面、第二方面所述的方法。

33、本公开提供的图像类型的识别方法、编码模型的训练方法和服务器，包括：获取待识别的证件图像，并提取证件图像中的目标文本内容；利用预设的编码模型对目标文本内容进行编码，获取证件图像对应的目标向量；将目标向量与预设的召回库中包括的多个向量依次进行余弦相似度计算，并根据计算结果，确定证件图像的图像类型；其中，预设的召回库中包括的向量为根据预设的编码模型对图像类型的类型名称进行编码得到的；其中，预设的编码模型为根据待训练证件图像的标注类型和文本内容之间的标注关联关系，预测关联关系，更新预设模型的参数得到的。本方案提供的图像类型的识别方法、编码模型的训练方法和服务器中，可以先提取待识别的证件图像的目标文本内容，利用预设的编码模型将目标文本内容编码后得到目标向量，并将目标向量与利用预设的编码模型对图像类型的类型名称进行编码后得到的向量进行余弦相似度计算，最终根据计算结果，确定待识别证件图像的图像类型。其中，编码模型为根据待训练证件图像的标注类型和文本内容之间的标注关联关系，预测关联关系，更新预设模型的参数得到的。可以提高图像类型识别的准确性。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：郭大勇,张海龙
技术所有人：上海通办信息服务有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。