搜索方法、装置、电子设备以及存储介质与流程

文档序号:33498498发布日期:2023-03-17 21:33阅读:34来源:国知局
搜索方法、装置、电子设备以及存储介质与流程

1.本公开涉及计算机技术领域,尤其涉及智能搜索领域。


背景技术:

2.随着信息化的飞速发展,通过搜索引擎进行信息查询成为用户获取信息的重要手段之一。用户可以在搜索引擎提供的搜索输入界面中输入需要查询的搜索词,搜索引擎可以基于搜索词搜集信息。在对搜索得到的信息进行处理后,例如,对搜索得到的信息进行去重之后,可以将最终得到的信息展示给用户。


技术实现要素:

3.本公开提供了一种搜索方法、装置、电子设备、存储介质和程序产品。
4.根据本公开的一方面,提供了一种搜索方法,包括:
5.接收搜索请求,其中,上述搜索请求包括目标搜索内容和目标场景标识,其中,上述目标场景标识用于表征上述搜索请求所涉及的搜索场景;
6.响应于上述搜索请求,确定与上述目标场景标识匹配的目标索引库,其中,不同场景标识通过管理平台预先配置有各自对应的索引库;
7.根据上述目标搜索内容和上述目标索引库,输出搜索结果。
8.根据本公开的另一方面,提供了一种搜索装置,包括:
9.第一接收模块,用于接收搜索请求,其中,上述搜索请求包括目标搜索内容和目标场景标识,其中,上述目标场景标识用于表征上述搜索请求所涉及的搜索场景;
10.第一确定模块,用于响应于上述搜索请求,确定与上述目标场景标识匹配的目标索引库,其中,不同场景标识通过管理平台预先配置有各自对应的索引库;
11.输出模块,用于根据上述目标搜索内容和上述目标索引库,输出搜索结果。
12.根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与上述至少一个处理器通信连接的存储器;其中,上述存储器存储有可被上述至少一个处理器执行的指令,上述指令被上述至少一个处理器执行,以使上述至少一个处理器能够执行如上所述的搜索方法。
13.根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,上述计算机指令用于使上述计算机执行如上所述的搜索方法。
14.根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,上述计算机程序在被处理器执行时实现如上所述的搜索方法。
15.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
16.附图用于更好地理解本方案,不构成对本公开的限定。其中:
17.图1示意性示出了根据本公开实施例的可以应用搜索方法及装置的示例性系统架构;
18.图2示意性示出了根据本公开实施例的搜索方法的流程图;
19.图3示意性示出了根据本公开实施例的管理平台的示意图;
20.图4示意性示出了根据本公开实施例的基于管理平台对配置策略进行审核的流程图;
21.图5示意性示出了根据本公开实施例的在线查询服务的示意图;
22.图6示意性示出了根据本公开实施例的构建索引库的流程图;
23.图7示意性示出了根据本公开实施例的对每个场景进行离线建索引的流程图;
24.图8示意性示出了根据本公开实施例的搜索装置的框图;以及
25.图9示意性示出了根据本公开实施例的适于实现搜索方法的电子设备的框图。
具体实施方式
26.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
27.在搜索引擎中提供搜索输入界面,使得用户可以基于该搜索输入界面输入想检索的搜索词。在信息搜索过程中,随着用户的输入,搜索引擎可以不断提示以用户输入内容为前缀的关键词,使得用户在尚未完成全部输入的时候,就有可能看到对其需求的正确表述,用户可以直接选择相应的关键词形成搜索,节省了用户的输入成本。
28.以搜索输入界面为搜索框为例,随着用户的输入,可以不断提示以用户输入内容为前缀的关键词,使得用户在尚未完成全部输入的时候,就有可能看到对其需求的正确表述,用户可以直接在下拉框中选择相应的关键词形成搜索。在搜索框中视觉效果从上往下,用户的选择成本会增高,位置越靠后,选择成本越高。
29.由于在给用户推荐关键词时能够推荐的数量有限,所以将提示给用户的关键词按照某种特征(如热门程度或者相关性)进行排序,使符合用户需求的关键词尽可能的排在前面,更能进一步降低用户的选择成本。在一些垂类搜索引擎和垂类细分产品中,存在着对用户提供输入框的场景,研究多个垂类的场景来提高用户的输入效率成为一种需要研究的问题。
30.垂类搜索引擎是指不同搜索场景分别对应不同的搜索引擎。例如,图片搜索场景和视频搜索场景对应不同的垂类搜索引擎,网页端浏览器搜索和移动端页面搜索对应不同的垂类搜索引擎。
31.在相关技术中,各个垂类搜索引擎通过建立各自的搜索场景对应的搜索建议服务,对每个搜索场景进行索引建设,进而提供给该搜索场景用户,以提升垂类搜索的查询效率。
32.但是,在实现本公开的过程发现,各个垂类搜索引擎各自实现和维护一个功能十分类似的搜索建议服务,一个垂类搜索引擎的新功能不能较为快速的通过技术迁移而实现其他垂类搜索引擎具有相同功能,不仅浪费了开发资源和管理资源,而且导致新的产品功
能上线时间延迟,影响了用户体验。
33.有鉴于此,本公开的实施例提供了一种搜索方法,包括:接收搜索请求,其中,搜索请求包括目标搜索内容和目标场景标识,其中,目标场景标识用于表征搜索请求所涉及的搜索场景;响应于搜索请求,确定与目标场景标识匹配的目标索引库,其中,通过管理平台预先配置有不同场景标识各自对应的索引库;根据目标搜索内容和目标索引库,输出搜索结果。
34.图1示意性示出了根据本公开实施例的可以应用搜索方法及装置的示例性系统架构。
35.需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。例如,在另一实施例中,可以应用搜索方法及装置的示例性系统架构可以包括终端设备,但终端设备可以无需与服务器进行交互,即可实现本公开实施例提供的搜索方法及装置。
36.如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线和/或无线通信链路等等。
37.用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如搜索类应用、知识阅读类应用、网页浏览器应用、即时通信工具、邮箱客户端和/或社交平台软件等(仅为示例)。
38.终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
39.服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的内容提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
40.需要说明的是,本公开实施例所提供的搜索方法一般可以由终端设备101、102、或103执行。相应地,本公开实施例所提供的搜索装置也可以设置于终端设备101、102、或103中。
41.或者,本公开实施例所提供的搜索方法一般也可以由服务器105执行。相应地,本公开实施例所提供的搜索装置一般可以设置于服务器105中。本公开实施例所提供的搜索方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的搜索装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
42.例如,在用户搜索时,终端设备101、102、103可以获取用户输入的需要查询的搜索词,然后将获取的搜索词发送给服务器105,由服务器105针对搜索词搜集信息,确定最终的搜索结果。或者由能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群针对搜索词搜集信息,确定最终的搜索结果。
43.应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需
要,可以具有任意数目的终端设备、网络和服务器。
44.在本公开的技术方案中,所涉及的数据(包括但不限于用户个人信息)的收集、存储、使用、加工、传输、提供、公开和应用等处理,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。
45.在本公开的技术方案中,在获取或采集用户个人信息之前,均获取了用户的授权或同意。
46.图2示意性示出了根据本公开实施例的搜索方法的流程图。
47.如图2所示,该方法包括操作s210~s230。
48.在操作s210,接收搜索请求,其中,搜索请求包括目标搜索内容和目标场景标识,其中,目标场景标识用于表征搜索请求所涉及的搜索场景。
49.在操作s220,响应于搜索请求,确定与目标场景标识匹配的目标索引库,其中,通过管理平台预先配置有不同场景标识各自对应的索引库。
50.在操作s230,根据目标搜索内容和目标索引库,输出搜索结果。
51.根据本公开的实施例,搜索请求的生成方式不做限定。例如,搜索请求可以是用户在搜索输入界面的搜索框中语音输入需要查询的搜索词后,自动生成的搜索请求。搜索请求也可以是用户在搜索界面的搜索框中手动输入部分需要查询的搜索词后,点击搜索框的下拉框中以用户输入内容为前缀的关键词而触发的搜索请求。
52.根据本公开的实施例,搜索请求中包括目标搜索内容和目标场景标识。其中,目标场景标识可以根据用户搜索时涉及的场景生成的。例如,用户使用搜索引擎搜索图片时,目标场景标识可以是图片搜索场景标识;用户使用搜索引擎搜索音频时,目标场景标识可以是音频搜索场景标识。
53.根据本公开的实施例,目标搜索内容可以为汉字或者拼音等其它符号,例如:桃花、taohua。目标场景标识可以通过数字标号、英文标号或者特殊指令等与搜索场景相对应,例如:目标场景标识a对应于图片搜索场景,目标场景标识b对应于视频搜索场景。
54.根据本公开的实施例,不同的场景标识对应于不同的搜索场景。其中,搜索场景可以包括但不限于以下至少之一:视频搜索场景、图片搜索场景、音频搜索场景、文库搜索场景等、网页浏览器搜索场景和智能移动端软件搜索场景等。
55.根据本公开的实施例,管理平台预先配置有不同场景标识各自对应的索引库。在确定与目标场景标识匹配的目标索引库时,可以将目标场景标识与索引库按照索引库标识的排列顺序依次进行匹配,进而得到目标索引库,或者,也可以将目标场景标识与多个索引库标识分别同时进行匹配,以实现并行匹配的效果。
56.根据本公开的实施例,利用搜索引擎基于目标搜索内容和目标索引库,可以从互联网或者本地搜索信息,确定搜索结果后,将搜索结果输出。搜索结果的展现形式不做限定。
57.根据本公开的实施例,通过管理平台可以预先为不同场景标识统一配置各自对应的索引库,在接收到搜索请求之后,可以基于搜索请求中携带的目标场景标识来确定与目标场景标识匹配的目标索引库,从而根据搜索请求中携带的目标搜索内容和目标索引库输出搜索结果。管理平台可以为不同搜索场景各自的索引库进行统一配置,相比于各个业务部门为各自负责的搜索场景分别各自实现和维护索引服务而言,可以加速不同搜索场景中
搜索功能快速迁移的能力;通过解析搜索请求中携带的目标场景标识,基于目标场景标识匹配得到目标索引库,实现了在不同垂类搜索和不同产品应用之间的通用搜索功能的迁移。
58.图3示意性示出了根据本公开实施例的管理平台的示意图。
59.如图3所示,管理平台300可以包括接入申请模块310、审核生效模块320、策略配置分发模块330和质量过滤模块340。
60.根据本公开的实施例,管理平台300可以是面向业务方的管理平台,可以对整体的接入方场景进行统一管理,管理内容可以包括每个接入场景的搜索建议状态和离线建库历史等信息。
61.根据本公开的实施例,场景业务接入方可以在管理平台300提交申请接入,管理人员可以利用接入申请模块310对场景业务接入方进行审核。接入申请模块310可以维护该场景接入方的关联信息。例如,可以维护接入方联系方式,接入类型,接入状态,申请时间,操作时间等。
62.根据本公开的实施例,审核生效模块320可以对与场景业务接入方相关联的配置策略进行审核。在场景业务接入方提交配置策略之前,可以与场景业务接入方进行需求沟通评估,确定策略开关和配置。
63.根据本公开的实施例,针对审核通过的配置策略,策略配置分发模块330可以将审核生效的策略配置生成配置,并分发给在线服务与离线建索引服务。
64.根据本公开的实施例,利用质量过滤模块340可以对搜索建议的质量过滤进行配置,从而提升搜索建议服务的处理能力。
65.图4示意性示出了根据本公开实施例的基于管理平台对配置策略进行审核的流程图。
66.如图4所示,该方法包括操作s410~s430。
67.在操作s410,通过管理平台接收来自场景业务接入方的策略配置请求。
68.在操作s420,响应于策略配置请求,对与场景业务接入方相关联的配置策略进行审核。
69.在操作s430,在配置策略审核通过的情况下,使配置策略生效。
70.根据本公开的实施例,管理平台可以维护场景接入方的相关信息,例如,接入方的详细说明和生效状态等。场景接入方可以在平台提交申请接入。接收到策略配置请求后,管理人员对与场景业务接入方相关联的配置策略进行审核。在平台进行审核通过后,平台将审核通过的配置策略进行生成配置和分发给在线服务与离线建索引服务。根据本公开的实施例,配置策略包括与场景业务接入方相关联的搜索策略和索引配置策略。
71.根据本公开的实施例,可以利用策略开关选择更多的索引配置策略和搜索策略,例如开启拼音转换策略,则会在查询前缀key中增加拼音的转换,新增拼音查询前缀key。
72.根据本公开的实施例,通过策略开关的方式使用不同的搜索策略或索引配置策略,实现了策略热插拔。可以针对每个垂类搜索引擎设置一个或多个开关,该开关可以控制是否对其他垂类搜索进行功能的升级,使得多个垂类搜索等各应用场景可以部署一套统一搜索建议在线服务,节省了垂类场景各自维护的人力成本,进一步推广搜索建议在多个站点的应用,提升技术输出能力和提升工作效率。
73.根据本公开的实施例,用户端可以在搜索界面的输入框内输入搜索请求,然后由搜索引擎向在线查询服务发送请求搜索建议的搜索请求,在一种实施方式中,搜索请求可以是在线网络请求。
74.在线查询服务可以根据目标场景标识和为场景配置的不同策略算法,进行查询索引变换,准备查询索引的前置处理。在线查询服务可以先根据目标场景标识去定位查询的场景索引模块,基于场景索引模块向特定的索引库发起一次查询请求,并获得索引返回的索引查询结果数据;根据索引查询结果数据向垂类搜索模块返回需要显示的推荐信息。
75.图5示意性示出了根据本公开实施例的在线查询服务的示意图。
76.如图5所示,在线查询服务可以包括入口网关模块510、过滤模块520、搜索建议查询模块530和索引模块540组成。
77.例如,当用户在输入框内进行“桃花”词输入时,会发起搜索建议的在线网络请求,到达入口网关模块510,然后向过滤模块520进行查询,确定是否符合质量过滤后的标准,符合标准后可以进行搜索建议词的内容推荐。此后进入到搜索建议查询模块530,这里主要分为三个步骤:
78.首先,接收在线网络请求,针对在线网络请求中携带的查询词wd和场景标识prod,其中,场景标识是搜索页面包含的场景标识,发送在线网络请求时可以携带场景标识,将查询词wd进行归一化处理,可以做一些全角字符转换等操作,比如用户输入了乱码、繁体字,则可以删除乱码进行繁体转换简体;或者全角转半角,将用户复制过来的字体的格式统一;又或者,进行大小写的转换等,不限制具体归一化的类型,可以给后端查询提供统一的字体格式,提供查询效率和准确性,相当于对用户输入的关键词进行了预处理。
79.根据本公开的实施例,本公开实施例提供的搜索方法还包括如下操作:对目标搜索内容进行质量过滤,得到质量过滤结果;根据质量过滤结果从搜索结果中确定最终的搜索结果。根据本公开的实施例,可以将质量过滤过程和响应搜索建议请求并行处理,根据质量过滤结果确定是否显示最终的搜索建议结果。具体到本公开的实施例中,过滤模块520、搜索建议查询模块530和索引模块540可以并行处理,根据质量过滤结果确定是否显示最终的搜索建议结果。
80.其次,搜索建议查询模块530可以根据场景标识和场景配置的不同策略算法,进行查询索引的变换,不同索引查询策略举例:文字、文字+拼音等;关键词变换和前置处理举例:桃花变换为taohua,对桃花进行拆分组合等,可以理解为对关键词的各种扩展;准备查询索引的前置处理。
81.索引模块540可以根据目标场景标识去定位查询的索引库,向目标索引库中的场景索引发起一次索引查询请求,并获得索引库返回的索引结果。根据本公开的实施例,通过管理平台管理的索引库包括但不限于索引库1~索引库4。
82.最后,根据索引结果进行召回和搜索建议内容排序,将排序的结果进行数量控制和截断(例如,一般不超过10条结果),组装成最后的结果返回给用户,将搜索建议内容展示到用户的搜索界面中。根据本公开的实施例,可以根据质量过滤结果中符合质量标准的搜索内容,从搜索结果中确定最终的搜索结果。
83.根据本公开的实施例,质量过滤模块对搜索内容进行查询,确定符合质量标准的搜索内容。从搜索结果中确定最终的搜索结果,以确保最终的搜索结果中不包含违规词语,
且更贴近搜索内容,并将最终的搜索结果推荐给用户。
84.根据本公开的实施例,根据目标搜索内容和目标索引库,输出搜索结果,可以包括如下操作。
85.根据目标搜索内容从目标索引库中查询得到索引结果;根据索引结果确定搜索结果。
86.根据本公开的实施例,在根据目标搜索内容从目标索引库中查询时,先进行查询索引的前置处理,对查询索引进行变换。例如:将索引中的桃花变换为taohua,对桃花进行拆分组合以及各种扩展等。根据场景标识去定位查询的索引模块,向特定的场景索引发起一次索引查询请求,从而获得索引返回的查询结果数据,进而确定搜索结果。
87.根据本公开的实施例,根据索引结果确定搜索结果,可以包括如下操作。
88.根据索引结果进行结果召回,得到召回结果;对召回结果进行搜索建议内容排序,得到排序结果;对排序结果进行筛选,得到搜索结果。
89.根据本公开的实施例,根据索引结果进行结果召回,得到召回结果。对召回结果进行搜索建议内容排序,将排序的结果进行数量控制和截断,最后将搜索建议内容展示到用户端的搜索框中。在搜索建议内容排序过程中,可以基于相关度设置权重进行排序,还可以基于热度设置权重进行排序,在此不做限定。
90.根据本公开的实施例,该搜索方法还包括如下操作。
91.对目标搜索内容进行质量过滤,得到符合质量标准的搜索内容;其中,根据目标搜索内容和目标索引库,输出搜索结果包括:根据符合质量标准的搜索内容和目标索引库,输出搜索结果。
92.根据本公开的实施例,质量过滤模块对目标搜索内容进行查询,判断目标搜索内容是否符合质量过滤标准,符合标准后进行搜索建议词的内容推荐。其中,质量过滤标准为对敏感词或者特殊符号等一些违规搜索内容过滤的标准。
93.根据本公开的实施例,搜索方法还包括如下操作。
94.响应于搜索请求,确定与目标场景标识匹配的目标搜索策略,其中,不同场景标识通过管理平台预先配置有各自对应的搜索策略;根据目标搜索策略对目标搜索内容进行关键词扩展,得到扩展结果;其中,根据目标搜索内容和目标索引库,输出搜索结果包括:根据扩展结果和目标索引库,输出搜索结果。
95.根据本公开的实施例,可以通过管理平台为不同场景配置不同的搜索策略。其中,搜索策略包括以下至少一种策略或以下多种策略混合:汉字搜索策略、拼音搜索策略、简拼搜索策略、前缀搜索策略、后缀搜索策略、历史输入搜索策略、热点搜索策略和隐式语义搜索策略。例如:文字、文字+拼音等。
96.根据本公开的实施例,根据目标搜索策略对目标搜索内容进行关键词扩展,得到扩展结果,根据扩展结果和目标索引库,输出搜索结果。如表1所示,假设目标搜索策略包括汉字搜索策略、热点搜索策略和隐式语义搜索策略。在输入搜索词桃花时,可以基于汉字搜索策略、热点搜索策略和隐式语义搜索策略等对桃花进行关键词扩展。
97.表1扩展结果
98.99.[0100][0101]
根据本公开的实施例,在根据目标搜索策略对目标搜索内容进行关键词扩展,得到扩展结果之前,还包括如下操作。
[0102]
对目标搜索内容进行归一化处理,以便根据目标搜索策略对归一化处理后的搜索内容进行关键词扩展。
[0103]
根据本公开的实施例,对目标搜索内容进行归一化处理,例如做一些全角字符转换等操作。假设用户输入了乱码、繁体字,则可以删除乱码进行繁体转换简体;或者全角转半角,将用户复制过来的字体的格式统一;又或者,进行大小写的转换等,不限制具体归一化的类型,可以给后端查询提供统一的字体格式,提供查询效率和准确性,相当于对用户输入的目标搜索内容进行了预处理。
[0104]
图6示意性示出了根据本公开实施例的构建索引库的流程图。
[0105]
如图6所示,该方法包括操作s610~s620。
[0106]
在操作s610,通过离线建库系统对原始数据进行处理,得到满足构建条件的目标数据,其中,原始数据和与场景标识对应的场景相匹配。
[0107]
在操作s620,根据满足构建条件的目标数据构建得到与场景标识对应的索引库。
[0108]
根据本公开的实施例,离线建库系统可以对接入垂类搜索和应用场景的原始数据进行处理和加工,生成搜索引擎所需求的索引库。离线建库系统可以根据场景接入方平台的接入请求和记录,进行公共数据的获取,然后根据每个场景提供的场景名称、数据地址和策略勾选开关对原始数据进行处理和加工。其中,策略勾选开关包括确定保存时间、是否开启前缀策略、是否后缀策略以及结果的最大数量等。根据本公开的实施例,可以对每个场景的搜索建议进行离线建索引工作,进而满足构建条件的目标数据,如离线建库中间能识别的数据格式;质量相关性达标的数据。其中,原始数据和与场景标识对应的场景相匹配。
[0109]
具体地,图7示意性示出了根据本公开实施例的对每个场景进行离线建索引的流程图。
[0110]
如图7所示,该方法包括操作s710~s750。
[0111]
在操作s710,获取公共数据。根据本公开的实施例,公共数据来自公开数据集,其获取方式和获取内容均符合相关法律法规的规定,并采取了必要保密措施。
[0112]
在操作s720,下载原始数据。根据本公开的实施例,可以从公共数据中筛选得到不同场景所需的原始数据。
[0113]
例如:针对视频搜索的业务应用场景,可以离线下载视频搜索的原始数据,针对文库搜索的业务应用场景,可以离线下载文库搜索的原始数据。
[0114]
在操作s730,对获取到的原始数据进行处理,例如,对原始数据进行数据格式处理,转成统一的离线建库中间能识别的数据格式。
[0115]
在操作s740,对处理得到的数据进行质量相关性评估。例如,针对视频数据,执行
视频搜索数据的质量相关性策略,控制相关性和识别异常错误数据,最后将质量相关性达标的数据送到操作s750,构建索引环境,构建索引时会根据策略配置,对每个场景分别构建前缀索引和后缀索引等索引数据内容,最后合并成搜索场景所需要的索引,如图7所示,分别得到不同场景所需要的索引。
[0116]
根据本公开的实施例,可以将构建得到的索引生效到在线查询服务。将索引放到在线查询服务所使用的场景索引中,使得用户请求查询时获得最新的索引数据结果。
[0117]
根据本公开的实施例,根据满足构建条件的目标数据构建得到与场景标识对应的索引库,可以包括如下操作。
[0118]
针对每个场景标识,根据与场景标识对应的索引配置策略和满足构建条件的目标数据,构建得到与场景标识对应的索引库。
[0119]
根据本公开的实施例,构建索引时会根据策略配置,对每个场景分别构建前缀索引和后缀索引等索引数据内容。
[0120]
如表2所示,针对候选项“桃花源记”进行索引配置。
[0121]
表2索引配置
[0122][0123]
根据本公开的实施例,在构建索引库过程中,还可以反转构建索引前缀。将前查询前缀和候选项进行反转,并将候选项根据权重进行排序,如表3所示,候选项包括“桃花源记”和“桃花扇”两个候选。实际建索引会有很多候选聚集在同一个查询前缀下,这时需要对候选数量做控制,保留一定数量的候选,例如50个。
[0124]
表3反转构建索引
[0125][0126]
根据本公开的实施例,使用上述构建索引库的方法,可以快速支持新场景的搜索建议需求,提升系统效率和接入效率。
[0127]
图8示意性示出了根据本公开实施例的搜索装置的框图。
[0128]
如图8所示,该实施例的一种搜索装置包括第一接收模块810、第一确定模块820以及输出模块830。
[0129]
第一接收模块810,用于接收搜索请求,其中,搜索请求包括目标搜索内容和目标场景标识,其中,目标场景标识用于表征搜索请求所涉及的搜索场景。在一实施例中,第一接收模块810可以用于执行前文描述的操作s210,在此不再赘述。
[0130]
第一确定模块820,用于响应于搜索请求,确定与目标场景标识匹配的目标索引库,其中,通过管理平台预先配置有不同场景标识各自对应的索引库。在一实施例中,第一确定模块820可以用于执行前文描述的操作s220,在此不再赘述。
[0131]
输出模块830,用于根据目标搜索内容和目标索引库,输出搜索结果。在一实施例中,输出模块830可以用于执行前文描述的操作s230,在此不再赘述。
[0132]
根据本公开的实施例,通过管理平台可以预先为不同场景标识统一配置各自对应的索引库,在接收到搜索请求之后,可以基于搜索请求中携带的目标场景标识来确定与目标场景标识匹配的目标索引库,根据搜索请求中携带的目标搜索内容和目标索引库输出搜索结果。由于通过管理平台可以为不同场景各自的索引库进行统一配置,相比于各个业务部门为各自负责的场景分别各自实现和维护索引服务而言,可以加速不同场景中搜索功能快速迁移的能力;通过解析搜索请求中携带的目标场景标识,基于目标场景标识匹配得到目标索引库,实现了在不同垂类搜索和不同产品应用之间的通用搜索功能的迁移。
[0133]
根据本公开的实施例,输出模块830包括查询子模块和第一确定子模块。
[0134]
查询子模块,用于根据目标搜索内容从目标索引库中查询得到索引结果。
[0135]
第一确定子模块,用于根据索引结果确定搜索结果。
[0136]
根据本公开的实施例,第一确定子模块包括召回单元、排序单元以及筛选单元。
[0137]
召回单元,用于根据索引结果进行结果召回,得到召回结果。
[0138]
排序单元,用于对召回结果进行搜索建议内容排序,得到排序结果。
[0139]
筛选单元,用于对排序结果进行筛选,得到搜索结果。
[0140]
根据本公开的实施例,搜索装置还包括第一过滤模块。
[0141]
第一过滤模块,用于对目标搜索内容进行质量过滤,得到符合质量标准的搜索内容。
[0142]
其中,输出模块830还包括第一输出子模块。
[0143]
第一输出子模块,用于根据符合质量标准的搜索内容和目标索引库,输出搜索结果。
[0144]
根据本公开的实施例,搜索装置还包括第二过滤模块和第二确定模块。
[0145]
第二过滤模块,用于对目标搜索内容进行质量过滤,得到质量过滤结果;
[0146]
第二确定模块,用于根据质量过滤结果从搜索结果中确定最终的搜索结果。
[0147]
根据本公开的实施例,第二确定模块包括第二确定子模块。
[0148]
第二确定子模块,用于根据质量过滤结果中符合质量标准的搜索内容,从搜索结果中确定最终的搜索结果。
[0149]
根据本公开的实施例,搜索装置还包括第三确定模块和扩展模块。
[0150]
第三确定模块,用于响应于搜索请求,确定与目标场景标识匹配的目标搜索策略,其中,不同场景标识通过管理平台预先配置有各自对应的搜索策略。
[0151]
扩展模块,用于根据目标搜索策略对目标搜索内容进行关键词扩展,得到扩展结果。
[0152]
其中,输出模块830包括第二输出子模块。
[0153]
第二输出子模块,用于根据扩展结果和目标索引库,输出搜索结果。
[0154]
根据本公开的实施例,搜索装置还包括归一模块。
[0155]
归一模块,用于在根据目标搜索策略对目标搜索内容进行关键词扩展,得到扩展结果之前,对目标搜索内容进行归一化处理,以便根据目标搜索策略对归一化处理后的搜索内容进行关键词扩展。
[0156]
根据本公开的实施例,其中,搜索策略包括以下至少一种策略或以下多种策略混合:汉字搜索策略、拼音搜索策略、简拼搜索策略、前缀搜索策略、后缀搜索策略、历史输入搜索策略、热点搜索策略和隐式语义搜索策略。
[0157]
根据本公开的实施例,搜索场景包括以下至少之一:视频搜索场景、图片搜索场景、音频搜索场景、文库搜索场景。
[0158]
根据本公开的实施例,搜索装置还包括第二接收模块、审核模块以及生效模块。
[0159]
第二接收模块,用于通过管理平台接收来自场景业务接入方的策略配置请求;
[0160]
审核模块,用于响应于策略配置请求,对与场景业务接入方相关联的配置策略进行审核;
[0161]
生效模块,用于在配置策略审核通过的情况下,使配置策略生效。
[0162]
根据本公开的实施例,配置策略包括与场景业务接入方相关联的搜索策略和索引配置策略。
[0163]
根据本公开的实施例,搜索装置还包括处理模块和构建模块。
[0164]
处理模块,用于针对每个场景标识,通过离线建库系统对原始数据进行处理,得到满足构建条件的目标数据,其中,原始数据和与场景标识对应的场景相匹配。
[0165]
构建模块,用于根据满足构建条件的目标数据构建得到与场景标识对应的索引库。
[0166]
根据本公开的实施例,构建模块包括构建子模块。
[0167]
构建子模块,用于针对每个场景标识,根据与场景标识对应的索引配置策略和满足构建条件的目标数据,构建得到与场景标识对应的索引库。
[0168]
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(field programmable gate array,fpga)、可编程逻辑阵列(programmable logic arrays,pla)、片上系统、基板上的系统、封装上的系统、专用集成电路(application specific integrated circuit,asic),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
[0169]
根据本公开的实施例,第一接收模块810、第一确定模块820以及输出模块830中的任意多个可以合并在一个模块/单元/子单元中实现,或者其中的任意一个模块/单元/子单元可以被拆分成多个模块/单元/子单元。或者,这些模块/单元/子单元中的一个或多个模块/单元/子单元的至少部分功能可以与其他模块/单元/子单元的至少部分功能相结合,并在一个模块/单元/子单元中实现。根据本公开的实施例,第一接收模块810、第一确定模块820以及输出模块830的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(fpga)、可编程逻辑阵列(pla)、片上系统、基板上的系统、封装上的系统、专用集成电路(asic),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,第一接收模块810、第一确定模块820以及输出模块830中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
[0170]
需要说明的是,本公开的实施例中搜索装置部分与本公开的实施例中搜索方法部分是相对应的,搜索装置部分的描述具体参考搜索方法部分,在此不再赘述。
[0171]
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
[0172]
根据本公开的实施例,一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如上所述的方法。
[0173]
根据本公开的实施例,一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行如上所述的方法。
[0174]
根据本公开的实施例,一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现如上所述的方法。
[0175]
图9示出了可以用来实施本公开的实施例的示例电子设备900的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
[0176]
如图9所示,设备900包括计算单元901,其可以根据存储在只读存储器(rom)902中的计算机程序或者从存储单元908加载到随机访问存储器(ram)903中的计算机程序,来执行各种适当的动作和处理。在ram 903中,还可存储设备900操作所需的各种程序和数据。计算单元901、rom 902以及ram 903通过总线904彼此相连。输入/输出(i/o)接口905也连接至总线904。
[0177]
设备900中的多个部件连接至i/o接口905,包括:输入单元906,例如键盘、鼠标等;输出单元907,例如各种类型的显示器、扬声器等;存储单元908,例如磁盘、光盘等;以及通信单元909,例如网卡、调制解调器、无线通信收发机等。通信单元909允许设备900通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0178]
计算单元901可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元901的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元901执行上文所描述的各个方法和处理,例如搜索方法。例如,在一些实施例中,搜索方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元908。在一些实施例中,计算机程序的部分或者全部可以经由rom 902和/或通信单元909而被载入和/或安装到设备900上。当计算机程序加载到ram 903并由计算单元901执行时,可以执行上文描述的搜索方法的一个或多个步骤。备选地,在其他实施例中,计算单元901可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行搜索方法。
[0179]
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、复杂可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
[0180]
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件
包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0181]
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0182]
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
[0183]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
[0184]
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以是分布式系统的服务器,或者是结合了区块链的服务器。
[0185]
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
[0186]
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1