一种试题搜索方法及装置与流程

文档序号:11063580阅读:来源:国知局

技术特征:

1.一种试题搜索方法,其特征在于,包括:

获取目标试题的原始图像,并对所述目标试题的原始图像进行图像识别;

基于图像识别的结果在题库中进行全文检索,获取试题搜索结果;

当获取的试题搜索结果的数量为两个以上时,根据全文检索的评分机制,计算获取的各个试题搜索结果分别对应的第一评分;

根据相似度算法,计算获取的各个试题搜索结果分别对应的第二评分;

根据预设加权线性方案,对所述第一评分及第二评分进行加权计算,确定最终评分,并根据所述最终评分,由高至低对试题搜索结果进行排序并输出。

2.如权利要求1所述的试题搜索方法,其特征在于,所述基于图像识别的结果在题库中进行全文检索,获取试题搜索结果,包括:

根据图像识别的结果在题库中进行全文检索,获得所有相关的试题搜索结果;

当所述所有相关的试题搜索结果的数量为两个以上时,根据预设的数据模型对所述所有相关的试题搜索结果进行多维度统计,确定包含试题搜索结果数量最多的试题类别;

在所述包含试题搜索结果数量最多的试题类别下,保留相关度高的试题搜索结果。

3.如权利要求2所述的试题搜索方法,其特征在于,所述在所述包含试题搜索结果数量最多的试题类别下,保留相关度高的试题搜索结果,包括:

若所述试题类别下的试题搜索结果数量多于N个,则对所述试题类别下的试题搜索结果进行相关度排序,保留相关度高的前N个试题搜索结果;

若所述试题类别下的试题搜索结果数量不多于N个,则保留所述试题类别下的所有试题搜索结果;

N为预设的大于或等于2的自然数。

4.如权利要求1-3任一项所述的试题搜索方法,其特征在于,所述基于图像识别的结果在题库中进行全文检索,包括:

使用Lucene框架对图像识别的结果进行全文检索;

所述当获取的试题搜索结果的数量为两个以上时,根据全文检索的评分机制,计算获取的各个试题搜索结果分别对应的第一评分,包括:

对获取的各个试题搜索结果分别进行Lucene评分,获得所述各个试题搜索结果分别对应的第一评分。

5.如权利要求1-3任一项所述的试题搜索方法,其特征在于,所述相似度算法为最长公共子序列算法;所述基于相似度算法,计算获取的各个试题搜索结果分别对应的第二评分,包括:

根据最长公共子序列算法,对获取的各个试题搜索结果分别进行评分,获得所述各个试题搜索结果分别对应的第二评分。

6.一种试题搜索装置,其特征在于,所述试题搜索装置包括:

目标试题获取单元,用于获取目标试题的原始图像,并对所述目标试题的原始图像进行图像识别;

初步检索单元,用于基于所述目标试题获取单元得到图像识别的结果在题库中进行全文检索,获取试题搜索结果;

第一评分计算单元,用于当所述初步检索单元获取到的试题搜索结果的数量为两个以上时,根据全文检索的评分机制,计算获取的各个试题搜索结果分别对应的第一评分;

第二评分计算单元,用于根据相似度算法,计算所述初步检索单元获取到的各个试题搜索结果分别对应的第二评分;

搜索结果确定单元,用于根据预设加权线性方案,对所述第一评分计算单元得到的第一评分及所述第二评分计算单元得到的第二评分进行加权计算,确定最终评分,并根据所述最终评分,由高至低对所述试题搜索结果进行排序并输出。

7.如权利要求6所述的一种试题搜索装置,其特征在于,所述初步检索单元,包括:

搜索结果获取子单元,用于根据所述目标试题获取单元得到的图像识别结果在题库中进行全文检索,获得所有相关的试题搜索结果;

多维度统计子单元,用于当所述搜索结果获取子单元获取到的所有相关的试题搜索结果的数量为两个以上时,根据预设的数据模型对所述搜索结果获取子单元获取到的所有相关的试题搜索结果进行多维度统计,确定包含试题搜索结果数量最多的试题类别;

结果筛选子单元,用于在所述多维度统计子单元确定的包含试题搜索结果数量最多的试题类别下,保留相关度高的试题搜索结果。

8.如权利要求7所述的一种试题搜索装置,其特征在于,所述结果筛选子单元,具体用于,当所述多维度统计子单元确定的试题类别下的试题搜索结果数量多于N个时,对所述试题类别下的试题搜索结果进行相关度排序,保留相关度高的前N个试题搜索结果;

当所述多维度统计子单元确定的试题类别下的试题搜索结果数量不多于N个时,保留所述试题类别下的所有试题搜索结果;

N为预设的大于或等于2的自然数。

9.如权利要求6-8任一项所述的试题搜索装置,其特征在于,所述初步检索单元具体用于,使用Lucene框架对图像识别的结果进行全文检索;

所述第一评分计算单元具体用于,对所述初步检索单元获取到的各个试题搜索结果分别进行Lucene评分,获得所述各个试题搜索结果分别对应的第一评分。

10.如权利要求6-8任一项所述的试题搜索装置,其特征在于,所述第二评分计算单元具体用于,当使用的相似度算法为最长公共子序列算法时,根据最长公共子序列算法,对所述初步检索单元获取到的各个试题搜索结果分别进行评分,获得所述各个试题搜索结果分别对应的第二评分。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1