一种检索字词的方法、装置及介质与流程

文档序号:30526212发布日期:2022-06-25 07:09阅读:144来源:国知局
一种检索字词的方法、装置及介质与流程

1.本发明涉及字词检索技术领域,特别是涉及一种检索字词的方法、装置及介质。


背景技术:

2.供应商需要在采购平台上查看商品能否被采购人搜索到,但是由于商品状态、商品的销售区域、商品的配送区域以及商品库存等商品不同属性导致在采购平台内匹配不上搜索的条件,进而搜索不到商品。
3.现有的搜索平台在搜索过程中较多依赖搜索词库,进而对应的分词不准确以及对于新词和专业名词未输入至搜索词库中导致搜不到相对应的目标商品;由于设定的短词为最小的分词单位导致搜索不到目标商品,如红茶、绿茶等为最小分词单位,当检索词为茶一个短词时对应检索不到红茶、绿茶,只有检索词对应为最小分词单位方可检索得到;或者长词查询搜索时形成的分词压力和匹配汇集产生的计算资源等问题导致搜索较慢甚至搜索不到目标词汇,降低用户的体验感,耗费搜索过程中产生的大量计算资源。
4.因此,寻求一种检索字词的方法是本领域技术人员亟需要解决的。


技术实现要素:

5.本发明的目的是提供一种检索字词的方法、装置及介质,提高搜索准确性。
6.为解决上述技术问题,本发明提供一种检索字词的方法,包括:
7.获取目标检索字词和目标检索字词对应的字词长度;
8.当字词长度和目标检索字词满足预设条件时,则判断字词长度是否大于第一阈值;
9.若是,将目标检索字词进行全面匹配检索以得到检索结果;
10.若否,根据扩展词加载规则和同义词加载规则对目标检索字词进行搜索得到预设检索结果,并判断字词长度是否小于第二阈值,其中第一阈值大于第二阈值;
11.若小于第二阈值,将目标检索字词根据短字匹配规则进行检索得到检索结果;
12.若不小于第二阈值,将预设检索结果作为检索结果。
13.优选地,预设条件为字词长度小于或等于预设值且目标检索字词不包含敏感字词,其中预设值大于第一阈值。
14.优选地,将目标检索字词进行全面匹配检索以得到检索结果包括:
15.将目标检索字词拆分成多个分词;
16.将多个分词进行匹配检索得到检索结果。
17.优选地,扩展词加载规则的确定通过以下方式得到:
18.获取待写入检索字词以及对应的扩展字词;
19.将待写入检索字词和扩展字词确定单向映射关系以确定扩展词加载规则。
20.优选地,同义词加载规则的确定通过以下方式得到:
21.获取待写入检索字词以及对应的同义字词;
22.将待写入检索字词和同义字词确定双向映射关系以确定同义词加载规则。
23.优选地,短字匹配规则的确定通过以下方式得到:
24.将待写入检索字词根据最细粒度分词分成多个字并记录多个字对应的位置顺序;
25.根据待写入检索字词和位置顺序的映射关系设置预设匹配字数和预设移动次数以确定短字匹配规则。
26.优选地,将目标检索字词根据短字匹配规则进行检索得到检索结果,包括:
27.将目标检索字词根据最细粒度分词分成多个目标字并记录多个目标字对应的目标位置顺序;
28.将目标检索字词与目标位置顺序匹配短字匹配规则的待写入检索字词与位置顺序;
29.当目标检索字词与目标位置顺序分别满足预设匹配字数和预设移动次数时,则输出检索结果。
30.为解决上述技术问题,本发明还提供一种检索字词的装置,包括:
31.获取模块,用于获取目标检索字词和目标检索字词对应的字词长度;
32.第一判断模块,用于当字词长度和目标检索字词满足预设条件时,则判断字词长度是否大于第一阈值,若是,则触发全面检索模块,若否,则触发第二判断模块;
33.全面检索模块,用于将目标检索字词进行全面匹配检索以得到检索结果;
34.第二判断模块,用于根据扩展词加载规则和同义词加载规则对目标检索字词进行搜索得到预设检索结果,并判断字词长度是否小于第二阈值,其中第一阈值大于第二阈值,若小于第二阈值,则触发短字检索模块,若不小于第二阈值,则触发结果模块;
35.短字检索模块,用于将目标检索字词根据短字匹配规则进行检索得到检索结果;
36.结果模块,用于将预设检索结果作为检索结果。
37.为解决上述技术问题,本发明还提供一种检索字词的装置,包括:
38.存储器,用于存储计算机程序;
39.处理器,用于执行计算机程序时实现如上述检索字词的方法的步骤。
40.为解决上述技术问题,本发明还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述检索字词的方法的步骤。
41.本发明提供的一种检索字词的方法,获取目标检索字词和目标检索字词对应的字词长度;当字词长度和目标检索字词满足预设条件时,则判断字词长度是否大于第一阈值;若是,则将目标检索字词进行全面匹配检索以得到检索结果;若否,则根据扩展词加载规则和同义词加载规则对目标检索字词进行搜索得到预设检索结果,并判断字词长度是否小于第二阈值,其中第一阈值大于第二阈值;若小于第二阈值,则将目标检索字词根据短字匹配规则进行检索得到检索结果;若不小于第二阈值,则将预设检索结果作为检索结果。该方法根据扩展词加载规则和同义词加载规则对目标检索字词搜索避免现有的搜索平台仅依靠现有的搜索词库搜索不到的问题,以及短词根据短字匹配规则搜索避免现有的短词搜索不到的问题,对于长词在满足预设条件下进行全面匹配搜索,避免现有的分词压力和匹配汇集耗费计算资源问题,进而提高搜索准确性。
42.另外,本发明还提供了一种检索字词的装置及介质,具有如上述检索字词的方法
相同的有益效果。
附图说明
43.为了更清楚地说明本发明实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
44.图1为本发明实施例提供的一种检索字词的方法的流程图;
45.图2为本发明实施例提供的一种检索字词的装置的结构图;
46.图3为本发明实施例提供的另一种检索字词的装置的结构图;
47.图4为本发明实施例提供的另一种检索字词的方法的流程图。
具体实施方式
48.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本发明保护范围。
49.本发明的核心是提供一种检索字词的方法、装置及介质,提高搜索准确性。
50.为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。
51.需要说明的是,本发明提供的检索字词的方法,除适用于采购平台之外,还适用于任何搜索引擎平台,不做具体限定,根据实际情况进行设定。
52.图1为本发明实施例提供的一种检索字词的方法的流程图,如图1所示,该方法包括:
53.s11:获取目标检索字词和目标检索字词对应的字词长度。
54.可以理解的是,获取目标检索字词,也就是在搜索引擎平台上用户输入的搜索词,其输入方式可以通过用户打字进行输入,还可以通过用户语音输入,或者用户的脑电波信号通过解码设备解码得到目标搜索词的形式进行输入,不做具体限定。
55.根据用户的语音输入,需要获取用户的语音信息,语音信息进行滤波解码得到对应的检索字词。用户的脑电波信号,例如无法说话或者手指行动不便的用户无法完成上述的输入,则根据采集脑电波设备进行采集信号,将脑电波信号进行解码得到目标检索字词。
56.获取目标检索字词后,需要获取对应的字词长度以便后续的检索工作的整理。
57.s12:当字词长度和目标检索字词满足预设条件时,则判断字词长度是否大于第一阈值,若是,则进入步骤s13,若否,则进入步骤s14。
58.当获取到目标检索字词和对应的字词长度时,进一步检测满足对应的预设条件,为了建立安全健康的网络环境,其目标检索字词在搜索引擎中是否包含敏感词汇,对于字词长度较长,一方面长度大于建立搜索引擎平台时的最大长度限制,则会搜索无效;另一方面则会使得搜索引擎平台的搜索资源的耗费。
59.因此,在初步判断时需要规避上述的情况发生,当字词长度和目标检索字词不满足预设条件时,则拒绝搜索请求。需要说明的是,上述两种情况的搜索需要同时满足字词长
度和目标检索字词对应的预设条件后,方可进入后续的步骤。若只满足一种情况的预设条件,则也不会进入后续的步骤。
60.可以理解的是,字词长度和目标检索字词的预设条件是针对两种情况的设置,对于敏感词汇可以为虚拟专用网络(virtual private network,vpn)、违禁药品等,为了避免法律风险。对于最大长度的字词限制,是防止过长的词查询带来的性能问题。
61.当字词长度和目标检索字词满足预设条件时,则进一步判断字词长度是都大于第一阈值,进行初步筛选后,需要判断当前的字词长度是否大于第一阈值,若大于,则将查询退化为完全匹配,关闭统计功能,逐字查询。若不大于,则需要细化当前的目标检索字词,以解决现有的依赖建立的搜索数据库导致的搜索不到的问题。
62.s13:将目标检索字词进行全面匹配检索以得到检索结果。
63.由于目标检索字词的字词长度大于第一阈值,小于最大长度限制,说明此时的长度较长,需要精确逐字匹配,基于搜索的性能考虑。进行精准匹配的全面匹配检索得到检索结果。
64.s14:根据扩展词加载规则和同义词加载规则对目标检索字词进行搜索得到预设检索结果,并判断字词长度是否小于第二阈值,其中第一阈值大于第二阈值,若小于第二阈值,则进入步骤s15,若不小于第二阈值,则进入步骤s16。
65.当前的字词长度不大于第一阈值时,则进行词的映射,扩大词的召回范围,则需要根据扩展词加载规则和同义词加载规则对目标检索字词进行搜索得到预设检索结果。
66.扩展词加载规则根据目标检索词作为大类扩大该目标检索词的检索范围进行词的泛化,例如,搜索“肉”词汇,可以搜索到里脊、排骨具体的小类中,即使检索词不含“肉”这个词,也能够被搜索到。但是若搜索“排骨”词汇,则搜索不到肉或者与之并列的里脊词汇,其传递为单向。
67.同义词加载规则根据目标检索词的双向映射,使得用户在搜索该词时可以搜索到该词的替代商品,例如:搜索“马桶”可以搜索到坐便器为名称的词汇,搜索“坐便器”可以搜索到马桶为名称的词汇。
68.根据上述两种搜索规则,得到预设检索结果,进一步判断目标检索词汇的字词长度是否小于第二阈值,其中第一阈值大于大二阈值,若小于,则进一步将目标检索词汇进行短句匹配搜索进入步骤s15,若不小于,则结束当前的搜索,进入步骤s16,将预设检索结果作为检索结果。
69.s15:将目标检索字词根据短字匹配规则进行检索得到检索结果。
70.当字词长度小于第二阈值时,则将目标检索字词根据短字匹配规则进行检索得到检索结果。
71.短字匹配规则根据字和字对应的位置顺序的方式匹配进行的检索,需要记录分词的字以及字与字之间的位置顺序。
72.s16:将预设检索结果作为检索结果。
73.当字词长度大于或等于第二阈值时,则将预设检索结果作为检索结果。需要说明的是,检索结果为检索出目标检索字词对应的字词或者商品名称或者未搜索到任何结果需要显示“未检索到相对应的产品请换取其他名称检索”等。
74.本发明提供的一种检索字词的方法,获取目标检索字词和目标检索字词对应的字
词长度;当字词长度和目标检索字词满足预设条件时,则判断字词长度是否大于第一阈值;若是,则将目标检索字词进行全面匹配检索以得到检索结果;若否,则根据扩展词加载规则和同义词加载规则对目标检索字词进行搜索得到预设检索结果,并判断字词长度是否小于第二阈值,其中第一阈值大于第二阈值;若小于第二阈值,则将目标检索字词根据短字匹配规则进行检索得到检索结果;若不小于第二阈值,则将预设检索结果作为检索结果。该方法根据扩展词加载规则和同义词加载规则对目标检索字词搜索避免现有的搜索平台仅依靠现有的搜索词库搜索不到的问题,以及短词根据短字匹配规则搜索避免现有的短词搜索不到的问题,对于长词在满足预设条件下进行全面匹配搜索,避免现有的分词压力和匹配汇集耗费计算资源问题,进而提高搜索准确性。
75.在上述实施例的基础上,步骤s12中的当字词长度和目标检索字词满足预设条件时,则判断字词长度是否大于第一阈值,其中,预设条件为字词长度小于或等于预设值且目标检索字词不包含敏感字词,其中预设值大于第一阈值。
76.具体地,字词长度和目标检索字词的预设条件相对应的两种情况,为了避免目标检索字词包含的敏感词汇导致的法律风险和字词长度的最大字词长度的限制,防止过长词查询带来的性能问题,其预设条件为字词长度小于或等于预设值,且目标检索字词不包含敏感词汇。
77.可以理解的是,当字词长度和目标检索字词满足预设条件的任意一种情况则无法进入后续的流程,只有全部满足后则进一步判断字词长度与第一阈值的关系。
78.预设值为搜索引擎平台设定的最大长度,当大于预设值,则拒绝本次搜索请求,故预设值大于第一阈值,进一步满足预设条件后,判断字词长度与第一阈值的关系。
79.本实施例提供的预设条件为字词长度小于或等于预设值且目标检索字词不包含敏感字词,其中预设值大于第一阈值,规避法律风险以及过长词查询带来的性能问题。
80.在上述实施例的基础上,步骤s13中的将目标检索字词进行全面匹配检索以得到检索结果包括:
81.将目标检索字词拆分成多个分词;
82.将多个分词进行匹配检索得到检索结果。
83.当目标检索字词的字词长度大于第一阈值时,小于或等于预设值,说明此时的长度较长,需要精确逐字匹配,基于搜索的性能考虑。进行精准匹配的全面匹配检索得到检索结果,也就是现有情况的精准搜索,其目标检索字词不具有短词匹配的问题,其将目标检索字词拆分成多个分词,对分词进行匹配检索得到检索结果。
84.本实施例提供的将目标检索字词拆分成多个分词,对分词进行匹配检索得到检索结果,目标检索字词的长度较长,对于长词在满足预设条件下进行全面匹配搜索,避免现有的分词压力和匹配汇集耗费计算资源问题。
85.基于上述实施例,扩展词加载规则的确定通过以下方式得到:
86.获取待写入检索字词以及对应的扩展字词;
87.将待写入检索字词和扩展字词确定单向映射关系以确定扩展词加载规则。
88.具体地,扩展词单向扩大该词的检索范围,进行词的泛化,只能从a到b并不能从b到a。从而避免用户在进行精确搜索时,导致范围扩大。例如:床单-》四件套/丝绒被/六件套/被子/棉被。这种单向映射可以使得用户搜索床单时可以检索到丝绒被,而搜丝绒被这
个更具体的词时,不会检索到床单。
89.需要建立待写入检索字词以及对应的扩展字词的映射关系,并确定为单向映射关系,以确定扩展词加载规则。
90.本实施例提供的获取待写入检索字词以及对应的扩展字词;将待写入检索字词和扩展字词确定单向映射关系以确定扩展词加载规则,避免用户在进行搜索时进一步导致搜索范围的扩大。
91.基于上述实施例,同义词加载规则的确定通过以下方式得到:
92.获取待写入检索字词以及对应的同义字词;
93.将待写入检索字词和同义字词确定双向映射关系以确定同义词加载规则。
94.具体地,同义词加载规则与上述的扩展词加载规则不同,其属于双向映射关系,既能从a到b,也能从b到a。主要用在同一种事物的多种不同描述上面。比如坐便器和马桶,打印纸和复印纸。用户在搜索马桶时,将查询同步改写为马桶或坐便器。用户在搜索坐便器时也同步将查询改写为坐便器或马桶。这样不管供应商的商品输入是马桶还是坐便器,都可以被召回。进而提升整个的搜索体验。
95.可以理解的是,当字词长度小于或等于第一阈值时,其对应的目标检索字词根据顺序先进行扩展词加载规则的搜索,再进行同义词加载规则的搜索。进而再进行后续的搜索。
96.本实施例提供的获取待写入检索字词以及对应的同义字词;将待写入检索字词和同义字词确定双向映射关系以确定同义词加载规则。提升用户的搜索体验,避免现有的搜索平台仅依靠现有的搜索词库搜索不到的问题。
97.基于上述实施例,短字匹配规则的确定通过以下方式得到:
98.将待写入检索字词根据最细粒度分词分成多个字并记录多个字对应的位置顺序;
99.根据待写入检索字词和位置顺序的映射关系设置预设匹配字数和预设移动次数以确定短字匹配规则。
100.具体地,将待写入检索字词根据最细力度分词分成多个字并记录对应的位置关系,进而根据代写入检索字词和位置顺序的映射关系设置预设匹配字数和与预设移动次数。
101.例如待写入检索字词为“龙井茶”,其字与位置的顺序如表1的位置表:
102.表1字词位置表
[0103][0104][0105]
在搜索时需要按照上述规则进行分词,设置预设匹配字数和预设移动字数,例如设置预设匹配字数为2个,预设移动次数为2次,当输入“龙茶”其对应的位置为0、1,茶的位置比龙大,其匹配字数为2个,和“龙井茶”词相比之间移动了一个字,即移动字数为1个。当大于预设匹配字数的个数和小于预设移动次数的个数,其通过搜索“龙茶”也可搜索到“龙
井茶”。
[0106]
本实施例提供的将待写入检索字词根据最细粒度分词分成多个字并记录多个字对应的位置顺序;根据待写入检索字词和位置顺序的映射关系设置预设匹配字数和预设移动次数以确定短字匹配规则,根据短字匹配规则搜索避免现有的短词搜索不到的问题。
[0107]
在上述实施例的基础上,步骤s15中的将目标检索字词根据短字匹配规则进行检索得到检索结果,包括:
[0108]
将目标检索字词根据最细粒度分词分成多个目标字并记录多个目标字对应的目标位置顺序;
[0109]
将目标检索字词与目标位置顺序匹配短字匹配规则的待写入检索字词与位置顺序;
[0110]
当目标检索字词与目标位置顺序分别满足预设匹配字数和预设移动次数时,则输出检索结果。
[0111]
具体地,对于分词,存在两种情况,一种是对于词库的依赖,一种是分词算法问题,由于分词算法的词图和分词路径选择问题,会导致最终分词结果的不可控。为了解决上述两种情况,需要将目标检索字词根据最细粒度分词分成多个目标字并记录多个目标字对应的目标位置顺序。例如搜索“龙井茶”,会被分成“龙井茶”,同时记录每个字的位置和顺序,在查询时也要按该顺序匹配,以防止搜索“茶井龙”时,也召回了该商品,造成召回准确率下降问题。
[0112]
同时考虑用户的漏搜索部分字段,设置预设匹配字数和预设移动次数,例如搜索“红色纸”,用户可以通过搜索“红纸”,也能搜索到该商品,由于记录字的位置顺序,其预设匹配字数大于等于2个,预设移动个数小于2次,满足预设匹配字数和预设移动个数的情况,即可以匹配到该商品。
[0113]
短词匹配规则解决了传统分词带来的分词不合理,导致商品搜不到问题。但是自身需要保证词序,这样就失去了传统分词具有的跳词功能。例如“西藏超好吃的手撕牛肉干”,传统上通过搜索“西藏牛肉干”即可搜索到该商品,而新的分词模型,依赖词序,因为西藏和牛肉干之间距离过长,会导致搜索不到。因此在最终方案是将两种搜索模式进行混合使用,解决了传统分词结果带来的搜不到问题,有兼具传统分词搜索的跳词搜索能力。
[0114]
同时为了解决长词带来的搜索引擎性能问题,使用词长度退化功能。在一般的搜索场景中,用户的搜索词往往是较短的。例如搜索“打印机”往往是会有“打印机”、“激光打印机”、“hp打印机”。长词往往代表用户是使用商品名全称。为了解决这个问题,在初始化商品名称结果时,除了正常的分词结果,还将商品名称的全称初始化为一个独立分词,这样在面对长尾词,只需要全匹配即可,极大的降低了搜索的计算量。
[0115]
本实施例提供的将目标检索字词根据短字匹配规则进行检索得到检索结果,根据短字匹配规则搜索避免现有的短词搜索不到的问题,提高搜索准确性。
[0116]
上述详细描述了检索字词的方法对应的各个实施例,在此基础上,本发明还公开与上述方法对应的检索字词的装置,图2为本发明实施例提供的一种检索字词的装置的结构图。如图2所示,检索字词的装置包括:
[0117]
获取模块11,用于获取目标检索字词和目标检索字词对应的字词长度;
[0118]
第一判断模块12,用于当字词长度和目标检索字词满足预设条件时,则判断字词
长度是否大于第一阈值,若是,则触发全面检索模块13,若否,则触发第二判断模块14;
[0119]
全面检索模块13,用于将目标检索字词进行全面匹配检索以得到检索结果;
[0120]
第二判断模块14,用于根据扩展词加载规则和同义词加载规则对目标检索字词进行搜索得到预设检索结果,并判断字词长度是否小于第二阈值,其中第一阈值大于第二阈值,若小于第二阈值,则触发短字检索模块15,若不小于第二阈值,则触发结果模块16;
[0121]
短字检索模块15,用于将目标检索字词根据短字匹配规则进行检索得到检索结果;
[0122]
结果模块16,用于将预设检索结果作为检索结果。
[0123]
由于装置部分的实施例与上述的实施例相互对应,因此装置部分的实施例请参照上述方法部分的实施例描述,在此不再赘述。
[0124]
本发明提供的一种检索字词的装置,获取目标检索字词和目标检索字词对应的字词长度;当字词长度和目标检索字词满足预设条件时,则判断字词长度是否大于第一阈值;若是,则将目标检索字词进行全面匹配检索以得到检索结果;若否,则根据扩展词加载规则和同义词加载规则对目标检索字词进行搜索得到预设检索结果,并判断字词长度是否小于第二阈值,其中第一阈值大于第二阈值;若小于第二阈值,则将目标检索字词根据短字匹配规则进行检索得到检索结果;若不小于第二阈值,则将预设检索结果作为检索结果。该装置根据扩展词加载规则和同义词加载规则对目标检索字词搜索避免现有的搜索平台仅依靠现有的搜索词库搜索不到的问题,以及短词根据短字匹配规则搜索避免现有的短词搜索不到的问题,对于长词在满足预设条件下进行全面匹配搜索,避免现有的分词压力和匹配汇集耗费计算资源问题,进而提高搜索准确性。
[0125]
图3为本发明实施例提供的另一种检索字词的装置的结构图,如图3所示,该装置包括:
[0126]
存储器21,用于存储计算机程序;
[0127]
处理器22,用于执行计算机程序时实现检索字词的方法的步骤。
[0128]
本实施例提供的检索字词的装置可以包括但不限于智能手机、平板电脑、笔记本电脑或者台式电脑等。
[0129]
其中,处理器22可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器22可以采用数字信号处理器(digital signal processor,dsp)、现场可编程门阵列(field-programmable gate array,fpga)、可编程逻辑阵列(programmable logic array,pla)中的至少一种硬件形式来实现。处理器22也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称中央处理器(central processing unit,cpu);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器22可以集成有图像处理器(graphics processing unit,gpu),gpu用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器22还可以包括人工智能(artificial intelligence,ai)处理器,该ai处理器用于处理有关机器学习的计算操作。
[0130]
存储器21可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器21还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器21至少用于存储以下计算机程序211,
其中,该计算机程序被处理器22加载并执行之后,能够实现前述任一实施例公开的检索字词的方法的相关步骤。另外,存储器21所存储的资源还可以包括操作系统212和数据213等,存储方式可以是短暂存储或者永久存储。其中,操作系统212可以包括windows、unix、linux等。数据213可以包括但不限于检索字词的方法所涉及到的数据等等。
[0131]
在一些实施例中,检索字词的装置还可包括有显示屏23、输入输出接口24、通信接口25、电源26以及通信总线27。
[0132]
领域技术人员可以理解,图3中示出的结构并不构成对检索字词的装置的限定,可以包括比图示更多或更少的组件。
[0133]
处理器22通过调用存储于存储器21中的指令以实现上述任一实施例所提供的检索字词的方法。
[0134]
本发明提供的一种检索字词的装置,获取目标检索字词和目标检索字词对应的字词长度;当字词长度和目标检索字词满足预设条件时,则判断字词长度是否大于第一阈值;若是,则将目标检索字词进行全面匹配检索以得到检索结果;若否,则根据扩展词加载规则和同义词加载规则对目标检索字词进行搜索得到预设检索结果,并判断字词长度是否小于第二阈值,其中第一阈值大于第二阈值;若小于第二阈值,则将目标检索字词根据短字匹配规则进行检索得到检索结果;若不小于第二阈值,则将预设检索结果作为检索结果。该装置根据扩展词加载规则和同义词加载规则对目标检索字词搜索避免现有的搜索平台仅依靠现有的搜索词库搜索不到的问题,以及短词根据短字匹配规则搜索避免现有的短词搜索不到的问题,对于长词在满足预设条件下进行全面匹配搜索,避免现有的分词压力和匹配汇集耗费计算资源问题,进而提高搜索准确性。
[0135]
进一步的,本发明还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器22执行时实现如上述检索字词的方法的步骤。
[0136]
可以理解的是,如果上述实施例中的方法以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0137]
对于本发明提供的一种计算机可读存储介质的介绍请参照上述方法实施例,本发明在此不再赘述,其具有上述检索字词的方法相同的有益效果。
[0138]
为了使本领域的技术人员更好的理解本发明的技术方案,下面结合附图、本发明提供实施例提供的检索字词的方法、装置及介质,作进一步的详细说明。
[0139]
图4为本发明实施例提供的另一种检索字词的方法的流程图,如图4所示,该流程图包括:
[0140]
s11:获取目标检索字词和目标检索字词对应的字词长度;
[0141]
s21:判断字词长度是否大于预设值,若是,则进入步骤s22,若否,则进入步骤s23;
[0142]
s22:拒绝请求;
[0143]
s23:判断目标检索字词是否包含敏感词汇,若是,则进入步骤s24,若否,则进入步
骤s25;
[0144]
s24:拒绝请求;
[0145]
s25:判断字词长度是否大于第一阈值,其中第一阈值小于预设值,若是,则进入步骤s13,若否,则进入步骤s26;
[0146]
s13:将目标检索字词进行全面匹配检索以得到检索结果;
[0147]
s26:将目标检索字词进行扩展词加载规则和同义词加载规则搜索得到预设检索结果;
[0148]
s27:判断字词长度是否大于第二阈值,其中,第二阈值小于第一阈值,若是,则进入步骤s16,若否,则进入步骤s28;
[0149]
s16:将预设检索结果作为检索结果;
[0150]
s28:根据短字匹配规则对目标检索字词进行检索得到检索结果。
[0151]
上文通过对本发明实施例提供的另一种检索字词的方法的流程图进行了介绍,具有与上述提到的检索字词的方法相同的有益效果。
[0152]
以上对本发明所提供的一种检索字词的方法、装置及介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
[0153]
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1