信息检索方法、装置、设备和介质与流程

文档序号:17642180发布日期:2019-05-11 00:45阅读:234来源:国知局
信息检索方法、装置、设备和介质与流程

本发明实施例涉及数据处理技术领域,尤其涉及一种信息检索方法、装置、设备和介质。



背景技术:

随着社会的进步和经济的发展,传统的公安办案方法已经不能满足当前打击犯罪、预防犯罪和社会治安管理的要求,急需科技手段来提高民警的办案效率,例如,通过报案人的案件描述,通过信息检索,很快检索确定出案件涉及犯案人员的特征信息。

加强信息化建设,有助于提高公安机关对犯罪份子的打击,有效预防犯罪发生,但是现有公安信息检索系统,各案件检索过程独立,检索过程中使用的检索条件无法重复利用,存在办案效率较低的问题。



技术实现要素:

本发明提供一种信息检索方法、装置、设备和介质,以实现事件所述关联特征信息的高效检索。

第一方面,本发明实施例提供了一种信息检索方法,该方法包括:

获取待检事件的事件描述信息,根据所述事件描述信息确定对应的事件属性;

基于检索关联数据表,获取所述事件属性对应的至少一条标准检索语句,其中,所述检索关联数据表根据设定的检索语句生成策略获得;

将获取的所述标准检索语句确定为所述待检事件的目标检索语句;

采用所述目标检索语句检索选定的素材信息库,获得所述待检事件的特征信息。

第二方面,本发明实施例还提供了信息检索装置,该装置包括:

事件属性确定模块,用于获取待检事件的事件描述信息,根据所述事件描述信息确定对应的事件属性;

标准语句获取模块,用于基于检索关联数据表,获取所述事件属性对应的至少一条标准检索语句,其中,所述检索关联数据表根据设定有检索语句生成策略的生成模块获得;

目标语句确定模块,用于将获取的所述标准检索语句确定为所述待检事件的目标检索语句;

特征信息搜索模块,用于采用所述目标检索语句检索选定的素材信息库,获得所述待检事件的特征信息。

第三方面,本发明实施例还提供了一种设备,所述设备包括:

一个或多个处理器;

存储器,用于存储一个或多个程序;

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例中任一所述的信息检索方法。

第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现实施例中任一所述的信息检索方法。

本发明通过获取待检事件的事件描述信息,根据所述事件描述信息确定对应的事件属性;基于检索关联数据表,获取该事件属性对应的至少一条标准检索语句,其中,检索关联数据表根据设定的检索语句生成策略获得;将获取的标准检索语句确定为待检事件的目标检索语句;采用目标检索语句检索选定的素材信息库,获得待检事件的特征信息;解决了信息检索过程中检索语句重复使用率低的问题,提高了事件所关联特征信息的信息检索效率,进而提升了信息化办案的用户体验。

附图说明

图1是本发明实施例一提供的信息检索方法的步骤流程图;

图1b是本发明实施例一提供的生成检索关联数据表的实现流程图;

图2是本发明实施例二提供的信息检索方法的步骤流程图;

图3是本发明实施例三提供的信息检索装置的结构示意图;

图4是本发明实施例四提供的一种设备的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1是本发明实施例一提供的信息检索方法的步骤流程图,本实施例可适用于特征信息检索的情况,该方法可以由信息检索装置来执行,具体包括如下步骤:

步骤101、获取待检事件的事件描述信息,根据所述事件描述信息确定对应的事件属性。

其中,待检事件可以是需要根据事件相关数据获取特征信息的事件;描述信息可以是对待检事件的简单描述,可以由用户根据经验生成或使用自动化工具根据事件内容生成,例如,事件描述可以由办案民警根据事件的案情输入为发生了物品丢失事件;事件属性可以是用于反映待检事件所属类型的信息,具体可以包括偷盗案件、环保案件、治安案件和抢劫案件等。

具体的,可以获取待检事件的对应的描述信息,根据描述信息采用字符匹配或者神经网络算法确定待检事件的所属的事件类型,示例性的,事件属性可以包括偷盗案件、环保案件、治安案件和抢劫案件等,可选的,事件属性还可以由分词语料、近义词语料和词性语料共同分析事件相关的数据生成,具体获取的方式可以是先对事件相关数据进行预处理,包括中的无意义内容进行过滤,例如过滤“.#@%##%$2423”等文字,删除事件相关数据的停用词,如回车和空格等,预处理还包括将相关数据中的表情图像或者表情字符进行翻译,例如表情字符“┭┮﹏┭┮”可以翻译成“哭泣”,然后可以在经过预处理后的事件相关数据中提取事件属性,具体过程可以根据分词语料对将事件相关数据内的词语分割为单个的词语,该词语若在近义词语料中存在相近的近义词,则使用近义词语料中近义词对应的哈希结果作为该词语的哈希运算结果,分别统计各词语的词频,计算各词语的权重,可以对重点词语的权重加权,例如偷盗和抢劫等与事件性质相关的重点词语可以使用log(词语总数/重点词语词频)的计算方式进行加权,确保重点词语被确定为事件属性,最后可以将使用各词语的哈希计算结果和权重形成向量,将该向量作为卷积神经网络的输入,由卷积神经网络生成对应事件的事件属性。

步骤102、基于检索关联数据表,获取所述事件属性对应的至少一条标准检索语句,其中,所述检索关联数据表根据设定的检索语句生成策略获得。

其中,检索关联数据表可以是存储有事件属性和事件属性对应的标准检索语句的数据表,事件属性和标准检索语句的对应关系可以包括一对一、一对多和多对多等,检索关联数据表可以根据设定的检索语句生成策略获得;标准检索语句可以是预设的用于事件特征检索的模板查询语句,可以依据待检事件的案件时间、搜索关键字、特殊号码和/或数据来源进行调整。

具体的,可以根据待检事件对应的事件属性在存储有事件属性和对应标准检索语句的数据表中查找用于检索待检事件的标准检索语句,其中,查询到对应待检事件的条数可以为一条或多条。

步骤103、将获取的所述标准检索语句确定为所述待检事件的目标检索语句。

其中,目标检索语句可以是以标准检索语句为模板,依据待检事件的信息调整后生成的查询语句,可以是进行检索待检事件的查询语句。

具体的,可以依据待检事件的相关信息对获取到的标准检索语句进行调整,调整的方式可以包括改变标准检索语句的检索范围、检索关键字和案件时间等信息,还可以包括在标准检索语句的基础上增加新的查询条件,例如去除外卖电话;将调整后的标准检索语句作为待检事件的目标检索语句。

一种可选的实施方式,可以不对标准检索语句进行调整,直接将获取到的标准检索语句作为目标检索语句。

步骤104、采用所述目标检索语句检索选定的素材信息库,获得所述待检事件的特征信息。

其中,素材信息库可以是存储有待检事件相关信息的数据库,其获取的方式可以包括从微信、qq和飞信等软件服务器下载或连接待检事件相关的智能终端获取智能终端中存储的所有信息,待检事件的特征信息可以是用于表征待检事件标志性的信息,可以包括:事件涉及人物的职业、性别、姓名、身体状况、婚姻状况、常用联系人和事件详细情况等。

具体的,可以使用获取到的目标检索语句在素材信息中进行检索,获取用于表征待检事件特征的事件涉及人物的职业、性别、姓名、身体状况、婚姻状况、常用联系人和事件详细情况等信息。

本实施例的技术方案,通过获取到待检事件的描述信息,对描述信息进行分析确定待检事件的事件属性,根据事件属性在检索关联数据表中获取到对应的标准检索语句,使用标准语句确定用于检索待检事件的目标检索语句,使用目标检索语句检索待检事件对应的素材信息库,获取待检事件的特征信息,解决了搜索过程中检索语句重复利用率低问题,提高了待检事件特征信息的检索效率。

在上述技术方案的基础上,本实施例具体对根据设定的检索语句生成策略获得检索关联数据表,进行了优化,图1b是本发明实施例一提供的生成检索关联数据表的实现流程图,如图1b所示,检索关联数据表的生成具体包括以下步骤:

步骤110、获取历史事件集中各历史事件的历史事件描述信息。

其中,历史事件集可以是基于标准检索语句进行过检索的事件的集合,其中,历史事件集中可关联存储有对应的历史事件描述信息和标准特征信息。

具体的,可以每隔一段时间在存储的历史事件集中使用遍历的方式读取各历史事件的描述信息。一种可选的实施方式,可以每当有新的历史事件产生时读取其对应的历史事件描述信息。

步骤111、基于各所述历史事件描述信息确定对应的历史事件属性,并分别记各所述历史事件属性为标准属性。

其中,历史事件属性可以是用于标识历史事件所属类别的信息,具体可以包括偷盗案件、环保案件、治安案件和抢劫案件等;标准属性可以是用于生成检索关联数据表的属性信息,可以是统一文字描述的历史事件属性,例如,历史事件属性为偷窃,那么其对应的标准属性为偷盗案件。

具体的,可以使用字符匹配或者神经网络算法根据获取到的历史事件集中所有的各历史事件的描述确定历史事件集的历史事件属性,可以对各历史事件属性信息进行合并整理,生成对应各历史事件的标准属性。一种可选的实施方式,可以不对历史事件属性进行处理,直接将获取到的各历史事件的历史事件属性作为其对应的标准属性。

步骤112、基于各所述历史事件对应的标准特征信息,确定至少一条获得各所述标准特征信息所需的标准检索语句。

其中,标准特征信息可以是历史事件检索的最终结果,可以和历史事件属性关联存储于历史事件集,标准检索语句可以是根据标准特征信息生成,例如特征信息为身份证号,则对应检索语句可以是身份证号的查询语句。

具体的,可以获取历史事件集存储的对应各历史事件的标准特征信息,根据历史特征信息生成对应的标准检索语句,可选的,还可以存储历史事件检索过程使用的目标检索语句,根据历史特征信息在存储的目标检索语句进行匹配,将匹配到的存储目标检索语句作为标准检索语句。

步骤113、关联存储各所述标准属性及对应的标准检索语句,形成检索关联数据表。

其中,检索关联数据表可以是存储有事件属性和事件属性对应的标准检索语句的数据表,事件属性和标准检索语句的对应关系可以包括一对一、一对多和多对多等。

具体的,可以将标准属性作为存储的主键,标准检索语句可以依据标准属性进行存储,生成检索关联数据表,其中,检索关联数据表的具体形式可以包括文件、表格和数据库等。

实施例二

图2是本发明实施例二提供的信息检索方法的步骤流程图;本实施例是在上述实施例的基础上,提供的一种实施例,参见图2,本发明实施例提供的一种信息检索方法包括:

步骤201、获取待检事件的描述信息,提取所述描述信息中的关键字。

其中,关键字可以是用于表征待检事件所属类别特征的词语,如偷盗、丢失和伤害等。

具体的,可以使用神经网络算法在待检事件的描述信息中提取用于表征待检事件特征的词语,将获取到的词语作为关键字,可以理解的提取关键字具体方法具有多种,本实施方式举出的神经网络算法仅为示例而非对实施方式的限定。

步骤202、使用所述关键字在预设的属性关系表查找对应的事件属性,将查询结果确定为所述待检事件的事件属性。

其中,属性关系表可以提前预设的关键字与事件属性之间对应关系的数据表,例如,关键字为丢失,其对应的事件属性为偷盗案件,关键字和事件属性可以一对一、一对多和多对多,也就是一个关键字可以对应一个案件属性也可以对应多个案件属性。

具体的,可以根据获取到的关键字在预设的属性关系表中查找其对应存储的事件属性,将查找到的事件属性作为待检事件的事件属性,进一步的,为了获取关键字与案件属性之间的对应关系,可以采用神经网络分类算法,将关键字作为神经网络分类算法的输入,其对应得输出结果可以为待检案件得案件属性。

步骤203、基于检索关联数据表,获取所述事件属性对应的至少一条标准检索语句,其中,所述检索关联数据表根据设定的检索语句生成策略获得。

步骤204、获取所述待检事件的案件时间、搜索关键字、特殊号码和/或数据来源信息。

其中,案件时间可以是待检事件发生的时间或者报警时间,搜索关键字可以是自动生成的字词或用户根据自身经验确定的字词,特殊号码可以是有事件直接相关的号码,例如电话号码或身份证号码等,特殊号码还可以是与事件不相关的干扰信息的号码,例如外卖或者快递的电话号码,数据来源可以是事件涉及数据的数据来源,例如来自微信、短信、彩信、qq和户籍信息等。

具体的,可以获取用户输入的与待检事件相关的案件时间、搜索关键字、特殊号码和/或数据来源信息等数据。进一步的,可以通过提供可选的案件时间、搜索关键字、特殊号码和/或数据来源信息的数据标签,由用户通过选择标签的形式添加对应的参数信息。

步骤205、根据所述案件时间、搜索关键字、特殊号码和/或数据来源信息生成对应的调整检索语句,将所述调整检索语句添加进所述标准检索语句生成所述待检事件的目标检索语句。

其中,调整语句可以是根据获取到的案件时间、搜索关键字、特殊号码和/或数据来源信息等数据对应生成的查询语句,可以是标准检索语句的补充内容,例如,输入一个案件时间,可以根据输入案件时间生成对应的查询语句。

具体的,可以根据获取到的案件时间、搜索关键字、特殊号码和/或数据来源信息生成对应的调整语句,将获取到的调整语句补充进标准检索语句,将进行调整后的标准检索语句作为目标检索语句。

步骤206、获取所述素材信息库存储的事件数据,分割所述事件数据生成事件分词集。

其中,事件数据可以是待检事件相关内容的数据,可以包括微信消息、短信消息、彩信消息、qq消息、笔录和智能终端的使用记录等,事件分词集可以是将事件数据去除连接词后分割为单词的数据集合。

具体的,可以获取素材信息库中与待检事件相关的所有数据,可以去除获取到数据的连接词并分割成单词,形成事件分词集。

步骤207、使用所述目标检索语句对所述事件分词集进行检索获取所述待检事件的特征信息。

其中,特征信息可以是用于表征待检事件标志性的信息,可以包括:事件涉及人物的职业、性别、姓名、身体状况、婚姻状况、常用联系人和事件详细情况等。

具体的,可以使用确定的目标检索语句对事件分词集进行查询,将查询到的事件涉及人物的职业、性别、姓名、身体状况、婚姻状况、常用联系人和事件详细情况等作为待检事件的特征信息。

本发明实施例的技术方案,通过在待检事件描述信息中提取的关键字确定对应的案件属性,根据案件属性在检索关联数据表中获取标准检索语句,获取到的用户的案件时间、搜索关键字、特殊号码和数据来源信息等参数对标准检索语句进行调整确定目标检索语句,使用目标检索语句检索事件分词集获取对应的特征信息,通过将标准检索语句调整为目标检索语句提高了检索语句的准确度,使用目标检索语句对事件分词集进行检索,有效提高检索效率。

实施例三

图3是本发明实施例三提供的信息检索装置的结构示意图。本发明实施例所提供的信息检索装置可执行本发明任意实施例所提供的信息检索方法,具备执行方法相应的功能模块和有益效果。参见图3,本发明实施提供的信息检索装置包括:事件属性确定模块301、标准语句获取模块302、目标语句确定模块303和特征信息搜索模块304。

其中,事件属性确定模块301,用于获取待检事件的事件描述信息,根据所述事件描述信息确定对应的事件属性。

标准语句获取模块302,用于基于检索关联数据表,获取所述事件属性对应的至少一条标准检索语句,其中,所述检索关联数据表根据设定有检索语句生成策略的生成模块获得。

目标语句确定模块303,用于将获取的所述标准检索语句确定为所述待检事件的目标检索语句。

特征信息搜索模块304,用于采用所述目标检索语句检索选定的素材信息库,获得所述待检事件的特征信息。

本实施例的技术方案,通过事件属性确定模块获取待检事件的描述信息,根据描述信息确定待检事件的事件属性,标准语句获取模块根据事件属性在检索关联数据表获取对应的标准检索语句,目标语句确定模块根据标准检索语句确定用于检索的目标检索语句,特征信息搜索模块使用目标检索语句检索待检事件对应的素材信息库,获取待检事件的特征信息,提高了检索语句在事件检索中的重复利用率,有效提高特征信息的检索效率。

进一步的,所述生成模块包括:

描述信息获取单元,用于获取历史事件集中各历史事件的历史事件描述信息。

标准属性获取单元,用于基于各所述历史事件描述信息确定对应的历史事件属性,并分别记各所述历史事件属性为标准属性。

标准语句获取单元,用于基于各所述历史事件对应的标准特征信息,确定至少一条获得各所述标准特征信息所需的标准检索语句。

检索关联数据表生成单元,用于关联存储各所述标准属性及对应的标准检索语句,形成检索关联数据表。

进一步的,所述目标语句确定模块303包括:

信息获取单元,用于获取所述待检事件的案件时间、搜索关键字、特殊号码和/或数据来源信息。

搜索语句调整单元,用于根据所述案件时间、搜索关键字、特殊号码和/或数据来源信息生成对应的调整检索语句,将所述调整检索语句添加进所述标准检索语句生成所述待检事件的目标检索语句。

进一步的,所述特征信息搜索模块304包括:

获取所述素材信息库存储的事件数据,分割所述事件数据生成事件分词集。

使用所述目标检索语句对所述事件分词集进行检索获取所述待检事件的特征信息。

进一步的,所述事件属性确定模块301,包括:

获取所述待检事件的描述信息,提取所述描述信息中的关键字。

使用所述关键字在预设的属性关系表查找对应的事件属性,将查询结果确定为所述待检事件的事件属性。

实施例四

图4是本发明实施例四提供的一种设备的结构示意图,如图4所示,该设备包括处理器70、存储器71、输入装置72和输出装置73;设备中处理器70的数量可以是一个或多个,图4中以一个处理器70为例;设备中的处理器70、存储器71、输入装置72和输出装置73可以通过总线或其他方式连接,图4中以通过总线连接为例。

存储器71作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的信息检索方法对应的程序指令/模块(例如,信息检索装置包括:事件属性确定模块301、标准语句获取模块302、目标语句确定模块303和特征信息搜索模块304)。处理器70通过运行存储在存储器71中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的信息检索方法。

存储器71可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器71可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器71可进一步包括相对于处理器70远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置72可用于接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置73可包括显示屏等显示设备。

实施例五

本发明实施例五还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种信息检索方法,该方法包括:

获取待检事件的事件描述信息,根据所述事件描述信息确定对应的事件属性;

基于检索关联数据表,获取所述事件属性对应的至少一条标准检索语句,其中,所述检索关联数据表根据设定的检索语句生成策略获得;

将获取的所述标准检索语句确定为所述待检事件的目标检索语句;

采用所述目标检索语句检索选定的素材信息库,获得所述待检事件的特征信息。

当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的信息检索方法中的相关操作。

通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、闪存(flash)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。

值得注意的是,上述信息检索装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。

注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1