本公开涉及检索,尤其涉及一种信息搜索方法、装置、电子设备及存储介质。
背景技术:
1、目前在多数软件应用或检索类程序中,都需要用到中文搜索,尤其是汉字拼音的搜索。
2、传统拼音搜索的工作原理是基于一个拼音信息库,该信息库中详细存储了每个汉字的全拼、简拼以及多音字的读音信息。在进行文本数据处理时,该系统会将这些信息转化为相应的拼音形式。同样,当用户进行搜索时,系统也会对用户的问题进行处理,将其转换为拼音形式。最后,通过拼音字符串的模糊匹配,系统能够找到与用户查询最相关的数据记录。
3、但是当用户输入的拼音不规范或者错误时系统将无法匹配到任何结果。
技术实现思路
1、为了解决上述技术问题中的至少一个,本公开提供了一种信息搜索方法、装置、电子设备及存储介质。
2、一方面,提供了一种信息搜索方法,所述信息搜索方法包括:
3、接收用户输入的搜索指令,所述搜索指令中包括和目标信息对应的检索词;
4、响应于所述搜索指令,对所述检索词进行转换和分词处理,得到检索词汇;
5、基于所述最终检索词汇搜索得到所述目标信息。
6、根据本公开一种优选的实施方式,响应于所述搜索指令,对所述检索词进行转换和分词处理,得到检索词汇,包括:
7、响应于所述搜索指令,将所述检索词进行第一转换处理,得到第一形式的检索词;
8、对所述第一形式的检索词进行分词处理,得到检索词汇;
9、对所述检索词汇进行第二转换处理,得到所述最终检索词汇。
10、根据本公开一种优选的实施方式,将所述检索词进行第一转换处理,包括:
11、获取所述检索词的第一形式,基于所述检索词的第一形式确定对所述检索词进行第一转换处理;
12、对所述检索词汇进行第二转换处理,得到所述检索词汇,包括:
13、获取所述检索词汇的第二形式,基于所述检索词汇的第二形式确定对所述检索词进行第二转换处理。
14、根据本公开一种优选的实施方式,获取所述检索词的第一形式,基于所述检索词的第一形式确定对所述检索词进行第一转换处理,包括:
15、所述检索词的第一形式包括文字、拼音的全拼和简拼,当所述检索词的第一形式为文字时,确定对所述文字进行文字至拼音全拼和简拼的转换处理;
16、获取所述检索词汇的第二形式,基于所述检索词汇的第二形式确定对所述检索词进行第二转换处理,包括:
17、所述检索词汇的第二形式包括拼音的大写和小写,当所述检索词汇为大写时,确定对所述检索词汇进行大写至小写的转换处理。
18、根据本公开一种优选的实施方式,基于所述最终检索词汇搜索得到所述目标信息,包括:
19、所述最终检索词汇包括至少一个最终检索子词汇,基于所述最终检索子词汇搜索得到目标子信息;
20、获取目标子信息与最终检索子词汇之间的相似度;基于所述相似度确定所述目标信息。
21、根据本公开一种优选的实施方式,获取目标子信息与最终检索子词汇之间的相似度,包括:
22、获取目标子信息的目标指示子信息;
23、比较所述目标指示子信息与所述最终检索子词汇之间的相似度,将所述目标指示子信息与所述最终检索子词汇之间的相似度在阈值范围内的相似度作为目标子信息与最终检索子词汇之间的相似度。
24、根据本公开一种优选的实施方式,对所述检索词进行转换和分词处理,包括:
25、采用hanlp、pinyin4j、jpinyin以及tinypinyin中的任一个工具对所述检索词进行转换处理;
26、采用n-gram中的1-gram对所述检索词进行分词处理。
27、另一方面,提供了一种拼音搜索装置,包括:
28、接收模块,所述接收模块接收用户输入的搜索指令,所述搜索指令中包括和目标信息对应的检索词;
29、转换和处理模块,所述转换和处理模块响应于所述搜索指令,对所述检索词进行转换和分词处理,得到最终检索词汇;
30、搜索模块,所述搜索模块基于所述最终检索词汇搜索得到所述目标信息。
31、还一方面,提供了一种电子设备,包括:
32、存储器,所述存储器存储执行指令;
33、处理器,所述处理器执行所述存储器存储的执行指令,实现上述任一项所述的方法。
34、再一方面,提供了一种可读存储介质,所述可读存储介质中存储有执行指令,所述执行指令被处理器执行时实现上述任一项所述的方法。
1.一种信息搜索方法,其特征在于,包括:
2.根据权利要求1所述的信息搜索方法,其特征在于,响应于所述搜索指令,对所述检索词进行转换和分词处理,得到最终检索词汇,包括:
3.根据权利要求2所述的信息搜索方法,其特征在于,将所述检索词进行第一转换处理,包括:
4.根据权利要求3所述的信息搜索方法,其特征在于,获取所述检索词的第一形式,基于所述检索词的第一形式确定对所述检索词进行第一转换处理,包括:
5.根据权利要求1至4任一所述的信息搜索方法,其特征在于,基于所述最终检索词汇搜索得到所述目标信息,包括:
6.根据权利要求5所述的信息搜索方法,其特征在于,获取目标子信息与最终检索子词汇之间的相似度,包括:
7.根据权利要求1至4任一所述的信息搜索方法,其特征在于,对所述检索词进行转换和分词处理,包括:
8.一种拼音搜索装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括:
10.一种可读存储介质,其特征在于,所述可读存储介质中存储有执行指令,所述执行指令被处理器执行时实现如权利要求1至7中任一项所述的方法。