重复题目识别方法、装置、电子设备及存储介质与流程

文档序号:36824639发布日期:2024-01-26 16:35阅读:16来源:国知局
重复题目识别方法、装置、电子设备及存储介质与流程

本公开涉及图像处理,尤其涉及一种重复题目识别方法、装置、电子设备及存储介质。


背景技术:

1、随着人工智能(artificial intelligence,ai)技术的成熟以及教育产业形态的不断细分,ai+教育得到了快速的发展。在ai+教育领域的很多应用场景中,都需要进行重复题目的检测。例如,在题目录入场景中,需要检测待录入题目与题库中已有题目是否为重复题目,以避免题库中被录入相同的题目。又例如,在题目答疑场景中,需要根据用户上传题目图像从题库中找到原题,并将相应的答案解析反馈给用户进行学习。

2、目前,现有的重复题目检测方案,主要是通过对用户上传题目图像进行特征提取得到特征向量,通过特征向量计算与题库中各题目的相似度,将相似度大于预设值的题库题目确定为相同题目。

3、然而,上述通过特征相似度进行重复题目检测的方式,存在准确性低的问题。


技术实现思路

1、为了解决上述技术问题或者至少部分地解决上述技术问题,本公开实施例提供了一种重复题目识别方法、装置、电子设备及存储介质。

2、根据本公开的一方面,提供了一种重复题目识别方法,包括:

3、从标准题库中获取与用户上传题目图像中的第一题目对应的标准题目图像;

4、基于所述用户上传题目图像和所述标准题目图像,确定所述用户上传图像和所述标准题目图像对应的图像特征向量,以及所述第一题目和所述标准题目图像中的第二题目为同一道题目的第一置信度;

5、基于所述第一题目对应的文本内容和所述第二题目对应的文本内容,确定所述用户上传图像和所述标准题目图像对应的文本特征向量,以及所述第一题目和所述第二题目为同一道题目的第二置信度;

6、基于所述图像特征向量和所述文本特征向量,确定所述第一题目和所述第二题目为同一道题目的第三置信度;

7、基于所述第一置信度、所述第二置信度和所述第三置信度,确定所述第一题目和所述第二题目是否为同一道题目。

8、根据本公开的另一方面,提供了一种重复题目识别装置,包括:

9、获取模块,用于从标准题库中获取与用户上传题目图像中的第一题目对应的标准题目图像;

10、第一确定模块,用于基于所述用户上传题目图像和所述标准题目图像,确定所述用户上传图像和所述标准题目图像对应的图像特征向量,以及所述第一题目和所述标准题目图像中的第二题目为同一道题目的第一置信度;

11、第二确定模块,用于基于所述第一题目对应的文本内容和所述第二题目对应的文本内容,确定所述用户上传图像和所述标准题目图像对应的文本特征向量,以及所述第一题目和所述第二题目为同一道题目的第二置信度;

12、第三确定模块,用于基于所述图像特征向量和所述文本特征向量,确定所述第一题目和所述第二题目为同一道题目的第三置信度;

13、第四确定模块,用于基于所述第一置信度、所述第二置信度和所述第三置信度,确定所述第一题目和所述第二题目是否为同一道题目。

14、根据本公开的另一方面,提供了一种电子设备,包括:

15、处理器;以及

16、存储程序的存储器,

17、其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据前述一方面所述的重复题目识别方法。

18、根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据前述一方面所述的重复题目识别方法。

19、根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,其中,所述计算机程序在被处理器执行时实现前述一方面所述的重复题目识别方法。

20、本公开实施例中提供的一个或多个技术方案,通过从标准题库中获取与用户上传题目图像中的第一题目对应的标准题目图像,并基于用户上传题目图像和标准题目图像,确定用户上传图像和标准题目图像对应的图像特征向量,以及第一题目和标准题目图像中的第二题目为同一道题目的第一置信度,接着,基于第一题目对应的文本内容和第二题目对应的文本内容,确定用户上传图像和标准题目图像对应的文本特征向量,以及第一题目和第二题目为同一道题目的第二置信度,以及基于图像特征向量和文本特征向量,确定第一题目和第二题目为同一道题目的第三置信度,进而基于第一置信度、第二置信度和第三置信度,确定第一题目和第二题目是否为同一道题目。采用本公开的方案,通过结合图像检测置信度、文本检测置信度,以及文本特征加图像特征的检测置信度,判断用户上传题目与题库中题目是否为同一道题目,保证了检测结果的准确性,为进行题目推荐、答疑、题目录入等提供了可靠信息。



技术特征:

1.一种重复题目识别方法,其中,所述方法包括:

2.如权利要求1所述的重复题目识别方法,其中,所述基于所述用户上传题目图像和所述标准题目图像,确定所述用户上传图像和所述标准题目图像对应的图像特征向量,以及所述第一题目和所述标准题目图像中的第二题目为同一道题目的第一置信度,包括:

3.如权利要求2所述的重复题目识别方法,其中,所述利用预先训练的图像特征提取模型,对所述灰度插图图像、所述分割插图图像、所述用户文本图像和所述标准文本图像进行特征提取和预测,得到所述用户上传图像和所述标准题目图像对应的图像特征向量,以及所述第一题目和所述标准题目图像中的第二题目为同一道题目的第一置信度,包括:

4.如权利要求2所述的重复题目识别方法,其中,所述对所述用户上传题目图像和所述标准题目图像进行插图检测,确定所述用户上传题目图像对应的用户插图图像以及所述标准题目图像对应的标准插图图像,包括:

5.如权利要求2所述的重复题目识别方法,其中,所述对所述用户上传题目图像和所述标准题目图像进行文本检测,确定所述用户上传题目图像对应的用户文本图像以及所述标准题目图像对应的标准文本图像,包括:

6.如权利要求3所述的重复题目识别方法,其中,所述基于所述用户插图图像和所述标准插图图像,生成插图图像,包括:

7.如权利要求1-6任一项所述的重复题目识别方法,其中,所述基于所述第一置信度、所述第二置信度和所述第三置信度,确定所述第一题目和所述第二题目是否为同一道题目,包括:

8.一种重复题目识别装置,其中,所述装置包括:

9.一种电子设备,包括:

10.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-7中任一项所述的重复题目识别方法。


技术总结
本公开提供一种重复题目识别方法、装置、电子设备及存储介质,所述方法包括:从标准题库中获取与用户上传题目图像中的第一题目对应的标准题目图像;基于所述用户上传题目图像和所述标准题目图像,确定图像特征向量以及第一题目和标准题目图像中的第二题目为同一道题目的第一置信度;基于所述第一题目对应的文本内容和所述第二题目对应的文本内容,确定文本特征向量以及第一题目和第二题目为同一道题目的第二置信度;基于所述图像特征向量和所述文本特征向量确定第一题目和第二题目为同一道题目的第三置信度;基于第一置信度、第二置信度和第三置信度,确定第一题目和第二题目是否为同一道题目。本方案保证了重复题目检测结果的准确性。

技术研发人员:兴百桥
受保护的技术使用者:深圳市星桐科技有限公司
技术研发日:
技术公布日:2024/1/25
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1