一种智慧城市系统的信息检索方法及装置与流程

文档序号:30072277发布日期:2022-05-18 02:21阅读:357来源:国知局
一种智慧城市系统的信息检索方法及装置与流程

1.本发明涉及人工智能领域,具体地说,涉及一种智慧城市系统的信息检索方法及装置。


背景技术:

2.智慧城市是指利用各种信息技术或创新概念,将城市的系统和服务打通、集成,以提升资源运用的效率,优化城市管理和服务,以及改善市民生活质量。其中,信息化可以把空间距离降至零,因为信息具有流动性,可以即时获取。信息网络的普及可以把城市的信息鸿沟填平,使得人们在时间和空间上都可以没有障碍地获取信息。
3.在智慧城市的建设中,信息的获取和传播是十分重要的环节,检索是人们获得信息的常用途径,如何根据检索内容提供所需的结果是关键。目前的检索方式多数是根据神经网络提取出检索语句中的主题词,根据主题词去资料库中去匹配,并根据用户反馈从而试探出用户的检索意图。但这种查询方式是对于整个语句提取主题词,比较耗时,且对于主题词的提取根据模型的不同可能会有较大差别,并不能很好的获得正确的检索结果。


技术实现要素:

4.为解决以上问题,本发明公开一种智慧城市系统的信息检索方法,包括以下步骤:获取检索语句并转换为对应的语句向量;将所述语句向量输入到识别模型,所述识别模型包括依次连接的第一模块和第二模块,所述第一模块和所述第二模块均包括依次连接的输入层、中间层、输出层,各中间层为神经网络层,其中,所述语句向量经所述第一模块的输入层输入,所述第一模块的中间层的参数依次与所述第二模块的中间层的参数相加,作为第二模块的中间层的更新参数,所述第二模块的输出加载分类模型,得到所述检索语句中每个字的分类结果;将所述分类结果进行信息流的拼接,得到与所述检索语句对应的至少一条概要信息流;根据所述概要信息流进行检索,取得与所述检索语句对应的检索结果。
5.可选地,所述第一模块的输入为n维的语句向量,所述第一模块、第二模块的任一中间层是lstm模型。
6.可选地,所述分类包括无关信息、第一实体、第二实体、属性、结束标记,其中,在遇到结束标记前将所识别的实体依照第一实体、第二实体的顺序分类到各实体分类中。
7.可选地,如果遇到结束标记前的实体数多于2个时,还通过tf-idf提取主题词形成主题词向量,并将各实体与主题词向量求取相似度,并选取相似度最高的两个实体分类到第一实体、第二实体分类中。
8.可选地,所述结束标记包括逗号、句号、分号,以及并列语义的词语。
9.可选地,将所述检索语句形成语句向量的步骤包括:使用word2vec模型对所述检索语句进行处理,形成与所述检索语句中的每个字对应的字向量,从而得到与所述检索语句对应的语句向量。
10.可选地,根据所述概要信息流去匹配知识图谱中的实体-关系-实体中的任两个,
从而获得与所述概要信息流对应的检索结果。
11.本发明还提供一种计算机装置,该计算机装置包括存储器和至少一个处理器,所述存储器中存储有至少一个指令,所述至少一个指令被所述至少一个处理器执行时实现如上所述智慧城市系统的信息检索方法。
12.根据本发明的上述构成,基于信息流的方式,以一定顺序拼接实体/属性,并在遇到结束标记时再次获取概要信息流,从而得到多个概要信息流,并根据每个概要信息流获取检索结果,因此可以通过多个概要信息流获得对应的检索结果,提高在智慧城市系统中进行检索查询时的检索结果的准确率,提升用户体验。
附图说明
13.通过结合下面附图对其实施例进行描述,本发明的上述特征和技术优点将会变得更加清楚和容易理解。
14.图1是表示本发明实施例的智慧城市系统的信息检索方法的步骤示意图;
15.图2是表示本发明实施例的分类的示意图;
16.图3是表示本发明实施例的智慧城市系统的信息检索方法的硬件装置架构图。
具体实施方式
17.下面将参考附图来描述本发明所述的实施例。本领域的普通技术人员可以认识到,在不偏离本发明的精神和范围的情况下,可以用各种不同的方式或其组合对所描述的实施例进行修正。因此,附图和描述在本质上是说明性的,而不是用于限制权利要求的保护范围。此外,在本说明书中,附图未按比例画出,并且相同的附图标记表示相同的部分。
18.下面,参照图1来说明本实施例的智慧城市系统的信息检索方法。
19.首先,在步骤s1,当用户利用智慧城市系统中的检索查询功能时,将用户输入的检索语句转换为对应的语句向量,所述检索语句是用户检索或查询时所输入的语句,例如,用户输入检索语句可以是“北京最高的建筑”、“天安门在北京什么位置”、“北京的特产和天津的特产”等。
20.接着,在步骤s2,将所述检索语句对应的语句向量输入到识别模型,所述识别模型包括依次连接的第一模块和第二模块,所述第一模块和所述第二模块均包括输入层、输出层和在其之间的多个中间层,各中间层为神经网络层。其中,语句向量经所述第一模块的输入层输入,所述第一模块的中间层的参数依次与所述第二模块的中间层的参数相加,作为第二模块的中间层的更新参数,所述第二模块对最后一层中间层的输出加载分类模型,得到所述检索语句中每个字的所属分类。
21.其中,所述识别模型在使用之前先进行训练,对训练结果进行数据拟合,将数据拟合结果作为最终训练结果,基于最终训练结果确定识别模型的参数,得到最终的识别模型,用于对用户意图进行识别。
22.接着,在步骤s3,将所述第二模块分类的结果进行信息流的拼接,得到与所述检索语句对应的至少一条概要信息流。
23.在步骤s4,根据所述概要信息流进行检索,并取得与检索语句对应的检索结果。
24.优选地,可以基于知识图谱获取用户意图,从而得出与用户意图对应的检索结果。
具体说,根据所述概要信息流去匹配知识图谱中的实体-关系-实体中的任两个,从而获得与所述概要信息流对应的检索结果。
25.进一步地,在步骤s2中,所述第一模块的任一中间层是lstm模型,所述lstm模型的输入为n维的语句向量。第一模块的输入形状为(batch_size,time_step,word_n),第一模块的输出形状为(batch_size,time_step,output_feature),中间层lstm模块的形状为(batch_size,time_step,inner_feature)。为了使多层的lstm模型顺利连接,每层lstm模型的batch_size和time_step都对应一致,最后的feature维每层可以不一样。
26.所述第二模块的神经网络中间层也是lstm模型,第二模块的输入形状为(batch_size,time_step,output_feature),输出形状为(batch_size,time_step,i),中间层lstm模型的形状均为(batch_size,time_step,inner_feature),其中,各中间层lstm模型的batch_size和time_step都对应一致,保持对应以便链接。
27.其中,batch_size是批尺寸,time_step是时间步长,word_n是n维语句向量,inner_feature中间特征,output_feature是输出特征,i为输出的分类数目。
28.所述第一模块采用全0的初始化方式对模型进行初始化处理。
29.所述第二模块进行初始化处理时,采用所述第一模块的输出结果(batch_size,最后一维,inner_feature)作为其初始化参数。
30.所述第二模块按照time_step依次输出,并加载softmax层回归概率,从而获取检索语句中每个字的所属分类(包括实体,属性等),然后对每个time_step检索语句得到的结果进行拼接,得到用户检索或查询的意图,从而得出与用户意图对应的检索结果。
31.参数i表示输出的分类的分类个数,以i为5为例来说明,表示对于检索语句中的每个字会被识别模型分为5类中的1类,如图2所示,其中类1代表无关信息,类2代表第一实体,类3代表第二实体,类4代表属性,类5代表结束一条概要信息流。通过识别结束标记来作为结束信息流的标记,所述结束标记可以是例如“。”、“,”“;”等标点符号,也可以是带有并列语义的词语,例如“和”、“并且”,这些结束标记都代表可能已经表述了一个实体和其对应的属性。例如“故宫的位置和故宫的太和殿的历史”。其中,在“和”之前的“故宫的位置”就构成{故宫

位置}这样的概要信息流,“和”之后的也构成另一个{故宫

太和殿

历史}这样的概要信息流。
32.在图2中,对于检索语句“黑龙江的特产和辽宁的沈阳的特产,海南的特产”,通过识别模型提取概要信息流时,从句首一次遍历到句尾,其中,“黑龙江”是识别出的实体,放置在类2中,“特产”是识别出的属性,放置在类4中。当识别模型在遍历到’和’字时,其提取到的概要信息流为{黑龙江

特产},箭头表示查询到属性,并在此时触发结束信息流。
33.同样的方式继续查询时,“辽宁”作为第一实体,“沈阳”作为第二实体,遍历到的概要信息流为{辽宁

沈阳},但并未结束一直到语句的“,”位置,形成的概要信息流为{辽宁

沈阳

特产}。继续识别知直到语句末尾,通过识别模型得到三条概要信息流,即[{黑龙江

特产},{辽宁

沈阳

特产},{海南

特产}]。
[0034]
在一个可选实施例中,使用word2vec模型对所述检索语句进行处理,形成与所述检索语句中的每个字对应的字向量,从而得到与所述检索语句对应的语句向量。
[0035]
在一个可选实施例中,对于在遇到结束标记前的实体数多于2个的情况,还通过tf-idf(一种用于信息搜索和信息挖掘的常用加权技术)提取主题词,形成主题词向量,并
将各实体与主题词向量求取相似度,并选取相似度最高的两个实体分类到第一实体、第二实体分类中。
[0036]
在一个可选实施例中,第二模块的输出层连接的分类模型可以是hmm模型。利用训练集对hmm模型进行训练,对于训练集中的各个字符添加标签,即注明该字符属于实体类,还是属性类,还是无关信息类,还是结束标记。然后把数据输入各hmm模型中,训练得到各hmm模型的参数。利用前向算法,计算字分类到各分类的概率,以分类的概率最高的作为该字的分类。经过上述的hmm分类器训练后,训练集中每一个类对应有一个分类器hmm。获取字向量,对于各分类的概率最高的,则表示该字向量符合该分类的特征。
[0037]
进一步地,hmm模型表示为l(a,b,r),其中a是状态si到sj的转换概率矩阵,b是状态的观察输出概率密度,r是状态的初始分布概率,其中,状态是指字向量的分类项,本实施例是五个分类:无关信息、第一实体、第二实体、属性、结束信息流,则对应每个分类都建立一个hmm模型,hmm模型集k包括k1、k2、k3、k4、k5。状态si到sj可以是例如无关信息状态到第一实体状态的转换概率矩阵,也可以是第二实体状态到属性状态的转换概率矩阵。其中,在实体的分类中,第一实体和第二实体的概率基本相同,在判断时,先判断第一实体中是否已分配实体,如果有,则将实体分类到第二实体。例如,“辽宁的沈阳的特产”,前两个字“辽宁”是实体的概率较高,则判定为实体,此时第一实体分类中还没有分配实体,则将“辽宁”分配到第一实体分类中。“沈阳”是实体的概率较高,但此时第一实体分类中已经分配了实体,则将“沈阳”分配到第二实体分类中。
[0038]
通过各hmm模型,观察值序列o即为识别的字向量对应于各hmm模型的概率,选取其中概率最高的,作为该字向量所属的分类,即分类到无关信息、第一实体、第二实体、属性、结束信息流中去。
[0039]
以上详细介绍了本技术的智慧城市系统的信息检索方法,下面说明一下实现所述智慧城市系统的信息检索方法的硬件装置架构。参阅图3所示,为本技术较佳实施例提供的计算机装置的结构示意图。在本技术较佳实施例中,所述计算机装置3包括存储器31、至少一个处理器32。本领域技术人员应该了解,图3示出的计算机装置的结构并不构成本技术实施例的限定,既可以是总线型结构,也可以是星形结构,所述计算机装置3还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置。
[0040]
在一些实施例中,所述存储器31用于存储程序代码和各种数据,例如安装在所述计算机装置3中的智慧城市系统的信息检索系统,并在计算机装置3的运行过程中实现高速、自动地完成程序或数据的存取。所述存储器31包括只读存储器、可编程只读存储器、可擦除可编程只读存储器、一次可编程只读存储器、电子擦除式可复写只读存储器、只读光盘或其他光盘存储器、磁盘存储器、磁带存储器、或者任何其他能够用于携带或存储数据的计算机可读的存储介质。
[0041]
在一些实施例中,所述至少一个处理器32可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述至少一个处理器32是所述计算机装置3的控制核心,利用各种接口和线路连接整个计算机装置3的各个部件,通过运行或执行存储在所述存储器31内的程序或者模块,以及调用存储在所述存储器31内的数据,以执行计算机装置3的各种功能和处理数据,例如执行智
慧城市系统的信息检索的功能。
[0042]
在一些实施例中,所述智慧城市系统的信息检索系统30运行于计算机装置3中。所述智慧城市系统的信息检索系统30可以包括多个由程序代码段所组成的功能模块。各功能模块是对应上述的智慧城市系统的信息检索方法的划分的不同的程序代码。所述智慧城市系统的信息检索系统30中的各个程序段的程序代码可以存储于计算机装置3的存储器31中,并由至少一个处理器32所执行,以实现智慧城市系统的信息检索功能(详见图1的流程描述)。
[0043]
尽管未示出,所述计算机装置3还可以包括给各个部件供电的电源(比如电池),优选的,电源可以通过电源管理装置与所述至少一个处理器32逻辑相连,从而通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述计算机装置3还可以包括多种传感器、蓝牙模块、wi-fi模块等,在此不再赘述。
[0044]
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是服务器、个人电脑等)或处理器(processor)执行本技术各个实施例所述方法的部分。
[0045]
在进一步的实施例中,结合图3,所述至少一个处理器32可执行所述计算机装置3的操作装置以及安装的各类应用程序(如所述的智慧城市系统的信息检索系统30)、程序代码等,例如,上述的各个模块。
[0046]
在本技术的一个实施例中,所述存储器31存储一个或多个指令(即至少一个指令),所述至少一个指令被所述至少一个处理器32所执行以实现图1所示的信息检索的目的。
[0047]
在本技术所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
[0048]
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
[0049]
另外,在本技术各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
[0050]
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1