内容搜索方法、装置、电子设备以及存储介质与流程

文档序号:25586777发布日期:2021-06-22 17:02阅读:107来源:国知局
内容搜索方法、装置、电子设备以及存储介质与流程

本发明实施例涉及自然语言处理技术领域,尤其涉及一种内容搜索方法、装置、电子设备以及存储介质。



背景技术:

随着智能手机的普及,聊天软件越来越多,其功能随着用户的喜好不断地进行迭代优化。越来越多的用户经常使用多样化的功能进行沟通联络感情。但是,在众多的功能和大量的聊天记录里面搜索自己想要的聊天内容是一件十分耗时的事情。



技术实现要素:

本发明提供一种内容搜索方法、装置、电子设备以及存储介质,以实现提高内容搜索的准确性和效率。

第一方面,本发明实施例提供了一种内容搜索方法,该方法包括:

获取待搜索内容,并识别所述待搜索内容的至少一个初始关键词;

基于对所述初始关键词的操作指令和/或预设关键词库确定所述待搜索内容的目标关键词;

当检测到对所述待搜索内容触发的搜索指令时,基于所述搜索指令以及所述目标关键词对所述待搜索内容进行内容搜索,并得到所述待搜索内容的搜索结果。

第二方面,本发明实施例还提供了一种内容搜索装置,该装置包括:

初始关键词识别模块,用于获取待搜索内容,并识别所述待搜索内容的初始关键词;

目标关键词确定模块,用于基于预设关键词库或者基于对所述初始关键词的操作指令确定所述待搜索内容的目标关键词;

搜索结果确定模块,用于当监测到对所述待搜索内容触发的搜索指令时,基于所述搜索指令以及所述目标关键词对所述待搜索内容进行内容搜索,并得到所述待搜索内容的搜索结果。

第三方面,本发明实施例还提供了一种电子设备,所述电子设备包括:

一个或多个处理器;

存储装置,用于存储一个或多个程序,

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例提供的内容搜索方法。

第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例提供的内容搜索方法。

本发明实施例的技术方案具体包括:获取待搜索内容,并识别该待搜索内容的至少一个初始关键词,基于对该初始关键词的操作指令和/或预设关键词库确定该待搜索内容的目标关键词,以实现提高搜索结果的准确性;当检测到对该待搜索内容触发的搜索指令时,基于搜索质量以及目标关键词对该待搜索内容进行搜索,并得到待搜索内容的搜索结果,提升了搜索到的效率。本发明实施例的技术方案通过多次提取关键词以确定待搜索内容的目标关键词,实现了提高搜索结果的准确率,以及基于搜索指令和目标关键词对待搜索内容进行搜索,提高了搜索的效率。

附图说明

为了更加清楚地说明本发明示例性实施例的技术方案,下面对描述实施例中所需要用到的附图做一简单介绍。显然,所介绍的附图只是本发明所要描述的一部分实施例的附图,而不是全部的附图,对于本领域普通技术人员,在不付出创造性劳动的前提下,还可以根据这些附图得到其他的附图。

图1是本发明实施例一提供的内容搜索方法的流程示意图;

图2是本发明实施例二提供的内容搜索装置的结构示意图;

图3为本发明实施例三提供的电子设备的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1为本发明实施例一提供的一种内容搜索方法的流程图,本实施例可适用于对待搜索内容进行搜索的情况,具体的,更适用于基于关键词对待搜索内容进行搜索的情况。该方法可以由内容搜索装置来执行,该装置可以由软件和/或硬件的方式来实现。

如图1所示,该方法具体包括以下步骤:

s110、获取待搜索内容,并识别所述待搜索内容的至少一个初始关键词。

在本发明实施例中,待搜索内容包括但不限于电子设备接收到的会话消息,以及电子设备显示端显示的书籍内容等内容。该会话消息可以是文字消息、图片消息也可以是文档消息,本实施例对待搜索内容的类型不加以限制。

具体的,识别待搜索内容的至少一个初始关键词的方法可以根据待搜索内容的类型的不同而采用不同的识别方法。示例性的,当待识别内容为文字会话消息或者电子设备显示端显示的书籍内容时,基于分词方法对文字内容进行分词,并基于分词结果确定上述文字内容的关键词;当待识别内容为图片消息时,先对图片进行图像时识别,获取图像中的文字内容,再基于该文字内容进行关键字提取,确定上述文字内容的关键词;当待识别内容为文档消息时,获取文档中的文字内容,在基于该文字内容进行关键字提取,确定上述文字内容的关键词。可以预先设置初始关键词的个数,个数可以是一个,也可以是多个,本实施例对此不加以限制。

s120、基于对所述初始关键词的操作指令和/或预设关键词库确定所述待搜索内容的目标关键词。

可以理解的是,初始关键词是基于待搜索内容提取出的关键词,目标关键词是基于初始关键词进一步处理之后确定的关键词。对初始关键词进行处理确定待搜索内容的目标关键词的有益效果在于:可以更加精确的对待搜索内容进行搜索,使得到的搜索结果更加准确。

具体的,基于初始关键词确定待搜索内容的目标关键词的方法可以是仅基于对初始关键词的操作指令或者基于预设关键词库确定,还可以是基于对初始关键词的操作指令获得的关键词在根据预设关键词库进行确定。

可选的,仅基于对初始关键词的操作指令确定待搜索内容的目标关键词的方法可以是:监测对所述初始关键词的操作指令,并根据该操作指令确定目标关键词。具体的,根据该操作指令确定目标关键词可以是当检测到用户对所述各初始关键词的选中操作时,将选中的初始关键词作为目标关键词;根据该操作指令确定目标关键词还可以是当检测到用户对所述各初始关键词的删除操作时,将未删除的初始关键词作为目标关键词。

可选的,仅基于预设关键词库确定所述待搜索内容的目标关键词的方法可以是:将初始关键词与所述预设关键词库中的各关键词进行匹配,得到匹配关键词,并将所述匹配关键词以及所述匹配关键词对应的同义词和/或缩略词作为所述待搜索内容的目标关键词。

其中,预设关键词库可以是预先建立的关键词库,该关键词库中包含有至少一项具有关联关系的词组。可选的,关联关系可以是互为同义词关系,即一个词组中的多个词可以是互为同义词的词语,例如:爱护和爱惜;关联关系还可以是缩略关系,即一个词组中的各词语包括全称以及简称,例如:ct和计算机断层扫描、mri和磁共振成像等。当然,关联关系还可以是词语之间的其他关系,本实施例在此对关联关系的类型不加以限制。

具体的,将获取到的至少一个初始关键词,分别将各初始关键词和预设关键词库中的各词语进行匹配,比对结果达到预设相似阈值时,将预设关键词库中的该词语作为比配关键词,并将该匹配关键词所在的词组的所有词语均作为待搜索内容的目标关键词。其中,匹配关键词所在词组中的词语为该匹配关键词对应的同义词和/或缩略词。

在一些实施例中,为了进一步保证搜索结果的准确性,会定期基于初始关键词更新预设关键词库。即,若初始关键词与预设关键词库中的各词组进行匹配关键词识别时,预设关键词库中没有与初始关键词匹配的匹配关键词,则将该初始关键词存储于预设位置,并定期将预设位置中存储的各初始关键词更新至预设关键词库,并且在更新初始关键词的同时还基于互联网将该初始关键词对应的同义词和/或缩略词组成新的词组存储于预设关键词库中。

s130、当检测到对所述待搜索内容触发的搜索指令时,基于所述搜索指令以及所述目标关键词对所述待搜索内容进行内容搜索,并得到所述待搜索内容的搜索结果。

在本发明实施例中,对所述待搜索内容触发的搜索指令的方法可以是:当检测到用户在电子设备上操作快捷键时,触发所述搜索指令;具体的,搜索指令可以包括用户操作电子设备上至少两个物理按键的组合、或物理按键与虚拟按键的组合、或至少两个虚拟按键的组合时产生的指令,快捷键包括物理按键或虚拟按键。其中,物理按键如电子设备上的音量+键,音量-键,home键、电源开关键等设于电子设备上的物理实键,虚拟按键如在电子设备的显示端上的虚拟键盘、菜单上的按键等。具体的,将快捷键预先关联搜索指令,在检测到该快捷键被触发时,则产生搜索指令。进一步的,还可设置快捷键同时被触发的时长,在满足时长情况下产生搜索信号。例如,用户可在电子设备进行快捷键搜索设置,如同时按下“音量-”和“音量+”的快捷键设置,两个按键同时按下的时间差不超过0.5s即表示进入快捷键搜索,从而电子设备可接收到用户触发的搜索指令。

可选的,对所述待搜索内容触发的搜索指令的方法还可以是:当检测到用户在电子设备上触控操作产生的封闭轨迹时,触发所述搜索指令。例如封闭轨迹可以是在电子设备的显示端画规则形状或者不规则形状的封闭区域。

具体的,当检测到对待搜索内容触发的搜索指令时,获取待搜索内容的搜索范围。基于所述搜索指令与所述目标关键词对所述搜索范围进行匹配,并将匹配结果作为所述待搜索内容的搜索结果。

其中,搜索范围可以根据待搜索内容的类型确定,即,待搜索内容是显示端显示的文本时,当待搜索内容是会话消息时,搜索范围可以是与预设对象的会话记录,当然还可以是预设时间段内的会话记录;当然,搜索范围不止包括会话记录中的文本消息,还可以包括会话记录的图片消息和文档消息;当待搜索内容是显示端的文本内容时,可以是预先设置搜索范围。例如,当显示的文本内容是书籍中的某一章节的内容时,搜索范围可以是当前章节,也可以是正本书籍,当然还可以根据实际情况具体设置。本实施例中搜索范围的灵活设置提高了搜索的准确性和效率。

在一些实施例中,在得到待搜索内容的搜索结果之后,对搜索结果中的目标关键字进行区别显示,以快速定位搜索结果所在的位置。进一步的,当包含多个搜索结果时,还根据预设的展示规则对搜索结果进行展示。具体的,预设展示规则可以是:在同一搜索范围内,若包含目标关键词数量多的会话消息越多,则展示位置越靠前;当包含目标关键词数量相等时,则时间越近的会话消息,则展示位置越靠前,以方便用户对搜索结果中的会话消息进行快速定位,精准查看。

本发明实施例的技术方案具体包括:获取待搜索内容,并识别该待搜索内容的至少一个初始关键词,基于对该初始关键词的操作指令和/或预设关键词库确定该待搜索内容的目标关键词,以实现提高搜索结果的准确性;当检测到对该待搜索内容触发的搜索指令时,基于搜索质量以及目标关键词对该待搜索内容进行搜索,并得到待搜索内容的搜索结果,提升了搜索到的效率。本发明实施例的技术方案通过多次提取关键词以确定待搜索内容的目标关键词,实现了提高搜索结果的准确率,以及基于搜索指令和目标关键词对待搜索内容进行搜索,提高了搜索的效率。

以下是本发明实施例提供的内容搜索装置的实施例,该装置与上述各实施例的内容搜索方法属于同一个发明构思,在内容搜索装置的实施例中未详尽描述的细节内容,可以参考上述内容搜索方法的实施例。

实施例二

图2为本发明实施例三提供的内容搜索装置的结构示意图,本实施例可适用于在软件测试中进行性能测试的情况。该内容搜索装置的具体结构如下:初始关键词识别模块210、目标关键词确定模块220和搜索结果确定模块230;其中,

初始关键词识别模块210,用于获取待搜索内容,并识别所述待搜索内容的初始关键词;

目标关键词确定模块220,用于基于预设关键词库或者基于对所述初始关键词的操作指令确定所述待搜索内容的目标关键词;

搜索结果确定模块230,用于当监测到对所述待搜索内容触发的搜索指令时,基于所述搜索指令以及所述目标关键词对所述待搜索内容进行内容搜索,并得到所述待搜索内容的搜索结果。

本发明实施例的技术方案具体包括:获取待搜索内容,并识别该待搜索内容的至少一个初始关键词,基于对该初始关键词的操作指令和/或预设关键词库确定该待搜索内容的目标关键词,以实现提高搜索结果的准确性;当检测到对该待搜索内容触发的搜索指令时,基于搜索质量以及目标关键词对该待搜索内容进行搜索,并得到待搜索内容的搜索结果,提升了搜索到的效率。本发明实施例的技术方案通过多次提取关键词以确定待搜索内容的目标关键词,实现了提高搜索结果的准确率,以及基于搜索指令和目标关键词对待搜索内容进行搜索,提高了搜索的效率。

在上述实施例技术方案的基础上,该装置还包括:

关键词库建立模块,用于在所述基于预设关键词库确定所述待搜索内容的目标关键词之前,预先建立关键词库;其中,所述关键词库中包括具有关联关系的至少一项词组,所述关联关系为互为同义词关系和/或具有缩略关系。

在上述实施例技术方案的基础上,目标关键词确定模块220,包括:

操作指令监测单元,用于监测对所述初始关键词的操作指令;

第一目标关键词确定单元,用于当检测到用户对所述各初始关键词的选中操作时,将选中的初始关键词作为目标关键词;

第二目标关键词确定单元,用于当检测到用户对所述各初始关键词的删除操作时,将未删除的初始关键词作为目标关键词。

在上述实施例技术方案的基础上,目标关键词确定模块220,包括:

匹配关键词获取单元,用于将初始关键词或者经过操作指令筛选得到的关键词,与所述预设关键词库中的各关键词进行匹配,得到匹配关键词;

第三目标关键词确定单元,用于将所述匹配关键词以及所述匹配关键词对应的同义词和/或缩略词作为所述待搜索内容的目标关键词。

在上述实施例技术方案的基础上,搜索结果确定模块230,包括:

第一搜索指令触发单元,用于当检测到用户在电子设备上操作快捷键时,触发所述搜索指令;

第二搜索指令触发单元,用于当检测到用户在电子设备上触控操作产生的封闭轨迹时,触发所述搜索指令。

在上述实施例技术方案的基础上,搜索结果确定模块230,包括:

搜索范围获取单元,用于获取所述待搜索内容的搜索范围;

搜索结果确定单元,用于基于所述搜索指令与所述目标关键词对所述搜索范围进行匹配,并将匹配结果作为所述待搜索内容的搜索结果。

在上述实施例技术方案的基础上,该装置还包括:

搜索结果显示单元,用于在所述得到所述待搜索内容的搜索结果之后,对所述搜索结果中的目标关键字进行区别显示。

本发明实施例所提供的内容搜索装置可执行本发明任意实施例所提供的内容搜索方法,具备执行方法相应的功能模块和有益效果。

值得注意的是,上述内容搜索装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。

实施例三

图3为本发明实施例三提供的一种电子设备的结构示意图。图3示出了适于用来实现本发明实施方式的示例性电子设备12的框图。图3显示的电子设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。

如图3所示,电子设备12以通用计算电子设备的形式表现。电子设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。

总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(isa)总线,微通道体系结构(mac)总线,增强型isa总线、视频电子标准协会(vesa)局域总线以及外围组件互连(pci)总线。

电子设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。

系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(ram)30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图3未显示,通常称为“硬盘驱动器”)。尽管图3中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如cd-rom,dvd-rom或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。系统存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。

具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如系统存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。

电子设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该电子设备12交互的设备通信,和/或与使得该电子设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口22进行。并且,电子设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图3所示,网络适配器20通过总线18与电子设备12的其它模块通信。应当明白,尽管图3中未示出,可以结合电子设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。

处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及样本数据获取,例如实现本发实施例所提供的一种内容搜索方法步骤,内容搜索方法包括:

获取待搜索内容,并识别所述待搜索内容的至少一个初始关键词;

基于对所述初始关键词的操作指令和/或预设关键词库确定所述待搜索内容的目标关键词;

当检测到对所述待搜索内容触发的搜索指令时,基于所述搜索指令以及所述目标关键词对所述待搜索内容进行内容搜索,并得到所述待搜索内容的搜索结果。

当然,本领域技术人员可以理解,处理器还可以实现本发明任意实施例所提供的样本数据获取方法的技术方案。

实施例四

本实施例四提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现例如实现本发实施例所提供的一种内容搜索方法步骤,内容搜索方法包括:

获取待搜索内容,并识别所述待搜索内容的至少一个初始关键词;

基于对所述初始关键词的操作指令和/或预设关键词库确定所述待搜索内容的目标关键词;

当检测到对所述待搜索内容触发的搜索指令时,基于所述搜索指令以及所述目标关键词对所述待搜索内容进行内容搜索,并得到所述待搜索内容的搜索结果。

本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于:电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

本领域普通技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个计算装置上,或者分布在多个计算装置所组成的网络上,可选地,他们可以用计算机装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件的结合。

注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1