信息获取方法、装置、电子设备及计算机可读存储介质与流程

文档序号:24398308发布日期:2021-03-26 23:39阅读:118来源:国知局
信息获取方法、装置、电子设备及计算机可读存储介质与流程

1.本发明实施例涉及数据处理技术领域,具体涉及一种信息获取方法、装置、电子设备及计算机可读存储介质。


背景技术:

2.随着信息技术的发展,越来越多的用户期望借助互联网能够获取想要得到的信息,比如,查询与某一关键词相关的信息、问询与某一关键词相关的信息、搜索与某一对象相关的产品信息等等。现有技术中,信息平台大多直接使用用户输入的关键词或者以空格键分割的关键词作为关键词进行查询或搜索,再将查询或搜索出的信息或页面展示给用户,但上述处理方法由于目标查询范围较大,关键词准确度不足,因此导致查询运算量较大,同时查询结果准确性较低,查询结果与关键词之间的相关度较低,即查询命中率较低。


技术实现要素:

3.本发明实施例提供一种信息获取方法、装置、电子设备及计算机可读存储介质。
4.第一方面,本发明实施例中提供了一种信息获取方法。
5.具体的,所述信息获取方法,包括:
6.获取输入信息,并将所述输入信息分解为一个或多个成分对象;
7.确定所述成分对象的类别信息;
8.根据所述成分对象及其类别信息确定候选信息集合,基于所述成分对象在所述候选信息集合中确定目标信息。
9.结合第一方面,本发明实施例在第一方面的第一种实现方式中,所述获取输入信息,并将所述输入信息分解为一个或多个成分对象,包括:
10.获取输入信息;
11.根据语义分词方法将所述输入信息分解为一个或多个成分对象,其中,所述成分对象为以下对象中的一种或多种:字、词语和词组。
12.结合第一方面和第一方面的第一种实现方式,本发明实施例在第一方面的第二种实现方式中,所述确定所述成分对象的类别信息,包括:
13.获取预设分类架构,其中,所述预设分类架构用于表征类别及类别之间的关系;
14.根据所述预设分类架构确定所述成分对象的类别信息。
15.结合第一方面、第一方面的第一种实现方式和第一方面的第二种实现方式,本公开在第一方面的第三种实现方式中,所述预设分类架构为第一预设分类架构或第二预设分类架构,其中,所述第一预设分类架构的颗粒度大于所述第二预设分类架构的颗粒度,且所述第二预设分类架构中的类别与所述第一预设分类架构中的类别存在一对一或多对一的映射关系。
16.结合第一方面的第一种实现方式、第一方面的第二种实现方式和第一方面的第三种实现方式,本公开在第一方面的第四种实现方式中,所述第一预设分类架构为包括父类、
子类和实例的树形结构或者为包括类和实例的树形结构,所述第二预设分类架构为包括根节点、父类、子类和实例的树形结构。
17.结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式、第一方面的第三种实现方式和第一方面的第四种实现方式,本公开在第一方面的第五种实现方式中,所述第二预设分类架构中,自根节点向下的第一预设数量的类别自顶向下生成,自末级节点向上的第二预设数量的类别自底向上生成,其中,所述第一预设数量与第二预设数量之和为所述第二预设分类架构的类别层级总数量。
18.结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式、第一方面的第三种实现方式、第一方面的第四种实现方式和第一方面的第五种实现方式,本公开在第一方面的第六种实现方式中,所述根据所述成分对象及其类别信息确定候选信息集合,基于所述成分对象在所述候选信息集合中确定目标信息,包括:
19.根据所述成分对象及其类别信息确定与所述成分对象对应的候选信息集合;
20.将所述成分对象与所述候选信息集合进行匹配,得到与所述成分对象匹配的目标子信息;
21.组合与所述一个或多个成分对象匹配的目标子信息,得到目标信息。
22.结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式、第一方面的第三种实现方式、第一方面的第四种实现方式、第一方面的第五种实现方式和第一方面的第六种实现方式,本公开在第一方面的第七种实现方式中,所述组合与所述一个或多个成分对象匹配的目标子信息,得到目标信息,被实施为:
23.对于所述一个或多个成分对象匹配的目标子信息进行去重;
24.组合去重之后的目标子信息,得到目标信息。
25.结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式、第一方面的第三种实现方式、第一方面的第四种实现方式、第一方面的第五种实现方式、第一方面的第六种实现方式和第一方面的第七种实现方式,本公开在第一方面的第八种实现方式中,还包括:
26.显示所述确定的目标信息。
27.结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式、第一方面的第三种实现方式、第一方面的第四种实现方式、第一方面的第五种实现方式、第一方面的第六种实现方式、第一方面的第七种实现方式和第一方面的第八种实现方式,本公开在第一方面的第九种实现方式中,所述显示所述确定的目标信息,被实施为:
28.确定目标信息显示对象,并在所述目标显示对象上显示所述确定的目标信息。
29.结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式、第一方面的第三种实现方式、第一方面的第四种实现方式、第一方面的第五种实现方式、第一方面的第六种实现方式、第一方面的第七种实现方式、第一方面的第八种实现方式和第一方面的第九种实现方式,本公开在第一方面的第十种实现方式中,所述显示所述确定的目标信息,被实施为:
30.确定目标信息权重因子;
31.根据所述目标信息的权重因子计算所述目标信息的显示优先级;
32.根据所述显示优先级显示所述确定的目标信息。
33.第二方面,本发明实施例中提供了一种信息获取装置。
34.具体的,所述信息获取装置,包括:
35.分解模块,被配置为获取输入信息,并将所述输入信息分解为一个或多个成分对象;
36.确定模块,被配置为确定所述成分对象的类别信息;
37.搜索模块,被配置为根据所述成分对象及其类别信息确定候选信息集合,基于所述成分对象在所述候选信息集合中确定目标信息。
38.结合第二方面,本发明实施例在第二方面的第一种实现方式中,所述分解模块包括:
39.获取子模块,被配置为获取输入信息;
40.分解子模块,被配置为根据语义分词装置将所述输入信息分解为一个或多个成分对象,其中,所述成分对象为以下对象中的一种或多种:字、词语和词组。
41.结合第二方面和第二方面的第一种实现方式,本发明实施例在第二方面的第二种实现方式中,所述确定模块包括:
42.获取子模块,被配置为获取预设分类架构,其中,所述预设分类架构用于表征类别及类别之间的关系;
43.第一确定子模块,被配置为根据所述预设分类架构确定所述成分对象的类别信息。
44.结合第二方面、第二方面的第一种实现方式和第二方面的第二种实现方式,本公开在第二方面的第三种实现方式中,所述预设分类架构为第一预设分类架构或第二预设分类架构,其中,所述第一预设分类架构的颗粒度大于所述第二预设分类架构的颗粒度,且所述第二预设分类架构中的类别与所述第一预设分类架构中的类别存在一对一或多对一的映射关系。
45.结合第二方面的第一种实现方式、第二方面的第二种实现方式和第二方面的第三种实现方式,本公开在第二方面的第四种实现方式中,所述第一预设分类架构为包括父类、子类和实例的树形结构或者为包括类和实例的树形结构,所述第二预设分类架构为包括根节点、父类、子类和实例的树形结构。
46.结合第二方面、第二方面的第一种实现方式、第二方面的第二种实现方式、第二方面的第三种实现方式和第二方面的第四种实现方式,本公开在第二方面的第五种实现方式中,所述第二预设分类架构中,自根节点向下的第一预设数量的类别自顶向下生成,自末级节点向上的第二预设数量的类别自底向上生成,其中,所述第一预设数量与第二预设数量之和为所述第二预设分类架构的类别层级总数量。
47.结合第二方面、第二方面的第一种实现方式、第二方面的第二种实现方式、第二方面的第三种实现方式、第二方面的第四种实现方式和第二方面的第五种实现方式,本公开在第二方面的第六种实现方式中,所述搜索模块包括:
48.第二确定子模块,被配置为根据所述成分对象及其类别信息确定与所述成分对象对应的候选信息集合;
49.匹配子模块,被配置为将所述成分对象与所述候选信息集合进行匹配,得到与所述成分对象匹配的目标子信息;
50.组合子模块,被配置为组合与所述一个或多个成分对象匹配的目标子信息,得到目标信息。
51.结合第二方面、第二方面的第一种实现方式、第二方面的第二种实现方式、第二方面的第三种实现方式、第二方面的第四种实现方式、第二方面的第五种实现方式和第二方面的第六种实现方式,本公开在第二方面的第七种实现方式中,所述组合子模块被配置为:
52.对于所述一个或多个成分对象匹配的目标子信息进行去重;
53.组合去重之后的目标子信息,得到目标信息。
54.结合第二方面、第二方面的第一种实现方式、第二方面的第二种实现方式、第二方面的第三种实现方式、第二方面的第四种实现方式、第二方面的第五种实现方式、第二方面的第六种实现方式和第二方面的第七种实现方式,本公开在第二方面的第八种实现方式中,还包括:
55.显示模块,被配置为显示所述确定的目标信息。
56.结合第二方面、第二方面的第一种实现方式、第二方面的第二种实现方式、第二方面的第三种实现方式、第二方面的第四种实现方式、第二方面的第五种实现方式、第二方面的第六种实现方式、第二方面的第七种实现方式和第二方面的第八种实现方式,本公开在第二方面的第九种实现方式中,所述显示模块被配置为:
57.确定目标信息显示对象,并在所述目标显示对象上显示所述确定的目标信息。
58.结合第二方面、第二方面的第一种实现方式、第二方面的第二种实现方式、第二方面的第三种实现方式、第二方面的第四种实现方式、第二方面的第五种实现方式、第二方面的第六种实现方式、第二方面的第七种实现方式、第二方面的第八种实现方式和第二方面的第九种实现方式,本公开在第二方面的第十种实现方式中,所述显示模块被配置为:
59.确定目标信息权重因子;
60.根据所述目标信息的权重因子计算所述目标信息的显示优先级;
61.根据所述显示优先级显示所述确定的目标信息。
62.第三方面,本发明实施例提供了一种电子设备,包括存储器和处理器,所述存储器用于存储一条或多条支持信息获取装置执行上述第一方面中信息获取方法的计算机指令,所述处理器被配置为用于执行所述存储器中存储的计算机指令。所述信息获取装置还可以包括通信接口,用于信息获取装置与其他设备或通信网络通信。
63.第四方面,本发明实施例提供了一种计算机可读存储介质,用于存储信息获取装置所用的计算机指令,其包含用于执行上述第一方面中信息获取方法为信息获取装置所涉及的计算机指令。
64.本发明实施例提供的技术方案可包括以下有益效果:
65.上述技术方案通过将输入信息分解为一个或多个成分对象,并根据确定的所述成分对象的类别信息确定候选信息集合,最终基于所述成分对象在所述候选信息集合中确定得到目标信息。该技术方案对于目标查询范围进行了限缩,提高了关键词的准确度,从而在有效降低查询运算量的情况下,提高查询结果的准确性,增强查询结果与关键词之间的相关度,提高查询命中率。
66.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明实施例。
附图说明
67.结合附图,通过以下非限制性实施方式的详细描述,本发明实施例的其它特征、目的和优点将变得更加明显。在附图中:
68.图1示出根据本发明一实施方式的信息获取方法的流程图;
69.图2示出根据图1所示实施方式的信息获取方法的步骤s101的流程图;
70.图3示出根据图1所示实施方式的信息获取方法的步骤s102的流程图;
71.图4示出根据本发明一实施方式的父子类属性继承示意图;
72.图5示出根据本发明一实施方式的预设分类架构示意图;
73.图6示出根据图1所示实施方式的信息获取方法的步骤s103的流程图;
74.图7示出根据本发明一实施方式的信息搜索场景示意图;
75.图8示出根据本发明一实施方式的信息推荐场景示意图;
76.图9示出根据本发明一实施方式的信息问答场景示意图;
77.图10示出根据本发明一实施方式的信息获取装置的结构框图;
78.图11示出根据图10所示实施方式的信息获取装置的分解模块1001的结构框图;
79.图12示出根据图10所示实施方式的信息获取装置的确定模块1002的结构框图;
80.图13示出根据图10所示实施方式的信息获取装置的搜索模块1003的结构框图;
81.图14示出根据本发明另一实施方式的信息获取装置的结构框图;
82.图15示出根据本发明一实施方式的电子设备的结构框图;
83.图16是适于用来实现根据本发明一实施方式的信息获取方法的计算机系统的结构示意图。
具体实施方式
84.下文中,将参考附图详细描述本发明实施例的示例性实施方式,以使本领域技术人员可容易地实现它们。此外,为了清楚起见,在附图中省略了与描述示例性实施方式无关的部分。
85.在本发明实施例中,应理解,诸如“包括”或“具有”等的术语旨在指示本说明书中所公开的特征、数字、步骤、行为、部件、部分或其组合的存在,并且不欲排除一个或多个其他特征、数字、步骤、行为、部件、部分或其组合存在或被添加的可能性。
86.另外还需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明实施例。
87.本发明实施例提供的技术方案通过将输入信息分解为一个或多个成分对象,并根据确定的所述成分对象的类别信息确定候选信息集合,最终基于所述成分对象在所述候选信息集合中确定得到目标信息。该技术方案对于目标查询范围进行了限缩,提高了关键词的准确度,从而在有效降低查询运算量的情况下,提高查询结果的准确性,增强查询结果与关键词之间的相关度,提高查询命中率。
88.图1示出根据本发明一实施方式的信息获取方法的流程图,如图1所示,所述信息获取方法包括以下步骤s101-s103:
89.在步骤s101中,获取输入信息,并将所述输入信息分解为一个或多个成分对象;
90.在步骤s102中,确定所述成分对象的类别信息;
91.在步骤s103中,根据所述成分对象及其类别信息确定候选信息集合,基于所述成分对象在所述候选信息集合中确定目标信息。
92.上文提及,随着信息技术的发展,越来越多的用户期望借助互联网能够获取想要得到的信息,比如,查询与某一关键词相关的信息、问询与某一关键词相关的信息、搜索与某一对象相关的产品信息等等。现有技术中,信息平台大多直接使用用户输入的关键词或者以空格键分割的关键词作为关键词进行查询或搜索,再将查询或搜索出的信息或页面展示给用户,但上述处理方法由于目标查询范围较大,关键词准确度不足,因此导致查询运算量较大,同时查询结果准确性较低,查询结果与关键词之间的相关度较低,即查询命中率较低。
93.考虑到上述问题,在该实施方式中,提出一种信息获取方法,该方法通过将输入信息分解为一个或多个成分对象,并根据确定的所述成分对象的类别信息确定候选信息集合,最终基于所述成分对象在所述候选信息集合中确定得到目标信息。该技术方案对于目标查询范围进行了限缩,提高了关键词的准确度,从而在有效降低查询运算量的情况下,提高查询结果的准确性,增强查询结果与关键词之间的相关度,提高查询命中率。
94.在本实施例的一个可选实现方式中,所述输入信息指的是信息输入方在信息输入区域输入的、想要获取与其相关的信息。其中,所述信息输入区域比如可以为信息获取栏等信息输入区域。其中,所述输入信息可以为字、词语、词组甚至可以为一句话,比如,所述输入信息可以为:“波西米亚连衣裙”、“儿童防走失”、“女童全棉短袖睡裙”等等。
95.在本实施例的一个可选实现方式中,所述成分对象指的是作为输入信息全部或者部分成分的、具有独立含义的信息部分。比如,对于“波西米亚连衣裙”这一输入信息,其成分对象可以为“波西米亚”和“连衣裙”;对于“儿童防走失”这一输入信息,其成分对象可以为“儿童”和“防走失”;对于“女童全棉短袖睡裙”这一输入信息,其成分对象可以为“女童”、“全棉”、“短袖”和“睡裙”。
96.在本实施例的一个可选实现方式中,所述成分对象的类别信息指的是所述成分对象所属的、能够将其与其他成分对象进行区分的类别。比如,成分对象“波西米亚”的类别可以为一种“视觉风格”,“连衣裙”和“睡裙”的类别可以为一种“品类”,“儿童”和“女童”的类别可以为一种“人群受众”,“防走失”的类别可以为一种“功能”;“全棉”的类别可以为一种“材质”,而“短袖”的类别可以为一种“款式”。
97.在本实施例的一个可选实现方式中,根据所述成分对象及其类别信息确定的候选信息集合指的是与所述成分对象的类别信息相对应的、包含有同属于该类别信息的、与所述成分对象相同相关或相应的信息、产品或对象。比如,“波西米亚”的类别为“视觉风格”,则根据成分对象“波西米亚”及类别信息“视觉风格”确定的候选信息集合为所有视觉风格为波西米亚风格的网页信息、产品信息组成的集合,等等。
98.在本实施例的一个可选实现方式中,如图2所示,所述步骤s101,即获取输入信息,并将所述输入信息分解为一个或多个成分对象的步骤,包括以下步骤s201-s202:
99.在步骤s201中,获取输入信息;
100.在步骤s202中,根据语义分词方法将所述输入信息分解为一个或多个成分对象,其中,所述成分对象为以下对象中的一种或多种:字、词语和词组。
101.为了全面获取输入信息的成分信息,在该实施方式中,借助语义分词方法将所述
输入信息分解为一个或多个成分对象,其中,所述成分对象可以为以下对象中的一种或多种:具有独立含义的字、词语、词组。
102.其中,可根据实际应用的需要以及输入信息的特点选择合适的语义分词方法,本公开对其不作具体限定,比如机械分词等基于字符串匹配的分词方法、基于隐性马尔可夫模型(hmm)或条件随机场算法(crf)等基于统计及机器学习的分词方法等等。
103.在本实施例的一个可选实现方式中,如图3所示,所述步骤s102,即确定所述成分对象的类别信息的步骤,包括以下步骤s301-s302:
104.在步骤s301中,获取预设分类架构,其中,所述预设分类架构用于表征类别及类别之间的关系;
105.在步骤s302中,根据所述预设分类架构确定所述成分对象的类别信息。
106.为了准确获取成分对象的类别信息,提高候选信息集合的精准度,以进一步提高后续目标信息的获取准确性,在该实现方式中,借助预先设置的分类架构来确定所述成分对象的类别信息。其中,所述预设分类架构是一个预先设置的、在大量数据的基础上形成的、用于表征各类别的信息以及类别之间关系的架构。
107.现有技术提出一种用于对于输入关键词进行分析的cpv体系,其中,c指的是一个多级类目体系,比如“数字阅读->出版物电子书->外语/语言文学->专著”是“专著”这一类目的类目路径,不同的商品分属于对应的类目;p指的是属性,比如“笔尖材质”、“跟高”等;v指的是属性值,比如“合金”是属性“笔尖材质”的值,“5厘米”是属性“跟高”的值。但所述cpv体系存在一定的缺点:类目、属性、属性值并不是在同一个体系下协同构建的,互相之间的关系松散,因此维护困难,另外,cpv体系是针对商品理解和分析设计的,无法直接应用于用户需求理解和购物场景理解,更无法应对目前类目众多、属性众多、场景众多的互联网商品销售平台的需求。
108.为了满足不同计算量的要求,在本实施例的一个可选实现方式中,将所述预设分类架构分为第一预设分类架构和第二预设分类架构。其中,所述第一预设分类架构的颗粒度大于所述第二预设分类架构的颗粒度,即所述第一预设分类架构是一种扁平化的、粗颗粒度的分类架构,易于理解,可作为对外应用接口,而所述第二预设分类架构是一种深度化的、细颗粒度的分类架构。另外,为了保障信息的完整性,所述第一预设分类架构中包含信息的总和与第二预设分类架构中包含信息的总和相同,上文提及,所述第一预设分类架构的颗粒度大于所述第二预设分类架构的颗粒度,因此,所述第二预设分类架构中的类别与所述第一预设分类架构中的类别存在一对一或多对一的映射关系。
109.在本实施例的一个可选实现方式中,所述第二预设分类架构为包括根节点、父类、子类和实例的树形结构,其中,父类、子类可为一级也可以为多级;而所述第一预设分类架构较为简单,比如,其可为仅包括父类、子类和实例的树形结构,也可为仅包括类和实例的树形结构。其中,父类、子类可为一级也可以为多级,而且根据实际数据的情况,不同的父类可具有不同层级数量的子类。其中,实例指的是末级子类中具体的内容信息,比如,“波西米亚”是“视觉风格”类中的一个实例,“连衣裙”、“睡裙”是“品类”类中的实例,“儿童”、“女童”是“受众:人群”类中的实例,“防走失”是“功能”类中的实例,“全棉”是“服装材质”类中的实例,“短袖”是“款式”类中的实例,等等。借助上述根节点、父类、子类和实例的结构,即可对于任一信息对象进行不同成分的分析。需要说明的是,所述第一预设分类架构中的类别级
别数量需小于所述第二预设分类架构中的类别级别数量。
110.其中,类可包括概念类和实体类,概念类指的是一个抽象的类的集合,比如,“橘子”是指橘子这个类别,而不是指某处桌子上放的具体的某一个橘子;实体类指的是一个客观存在事物的类的集合,比如,“袁隆平”属于科学家这个类别,其为一个客观存在的实体。需要说明的是,实体类可以是概念类的子类,但是概念类不可以是实体类的子类。
111.其中,每一个类别均拥有属于自己的、特有的属性,由于子类本质上属于父类,因此,子类将继承父类所有的属性。如图4所示,父类“事物”具有“名称(name)”、“别名(alternatename)”、“描述(description)”、“图片(image)”四个属性,“事物”的子类“品类”具有“受众(audience)”、“所属行业(industry)”两个特有的属性,由于“品类”是“事物”的子类,所以子类“品类”将继承父类“事物”的四个属性,因此,“品类”共具有“名称”、“别名”、“描述”、“图片”、“受众”、“所属行业”六个属性。
112.为了形成广度和深度都能够满足实际应用需求的分类架构,考虑到层次越深的子类就越能对输入信息进行全面精准的刻画,比如“风格”类别下的“视觉风格”子类、“材质”类别下的“服装材质”子类等。因此,在本实施例的一个可选实现方式中,在生成所述第二预设分类架构时,对于自根节点向下的第一预设数量的类别,按照自顶向下的规则生成,对于自末级节点向上的第二预设数量的类别,按照自底向上的规则生成。比如,在实际应用中发现用户对“服装材质”这一类别的需求,从而设置“服装材质”这一类别,然后将其父类设置为“材质”;同时“材质”又为无形物这一类别的一个子类,这样就完成了从“事物>无形物>材质>服装材质”这一类别分支的设置。基于上述,第二预设分类架构的设置同时兼顾自顶向下以及自底向上的生成规则,通过数据的不断优化与迭代,最终可完成第二预设分类架构的设置。其中,所述第一预设数量和第二预设数量可根据实际应用的需要进行设置和选择,本公开对其不作具体限定,需要说明的是,所述第一预设数量与第二预设数量之和为所述第二预设分类架构的类别层级总数量。
113.接下来以互联网商品销售平台为例,对于所述预设分类架构进行详细地介绍。
114.对于所述互联网商品销售平台,如图5所示,所述第一预设分类架构可包括“品类”、“品牌”、“ip”、“时间”、“对象”、"颜色"、“事件”、“功能”、“图案”、“材质”、“修饰语”、“自然”、“机构”、“空间”、“度量值”、“形状”、“风格”、“受众”等首级类别,即父类,每个父类还可包括相应的子类。其中,图5中仅示意性地显示出“品类”、“ip”、“功能”、“受众”、“风格”等有限的几个类别。
115.对于所述互联网商品销售平台,如图5所示,所述第二预设分类架构可包括“事物”这一根节点,向下可包括“动作”、“创作品”、“活动”、“无形物”、“品类”、“医疗实体”、“机构”、“人物”、“地点”等子类,其中,“品类”指的是一个可购买的商品的集合,比如“连衣裙”、“外套”、“微波炉”等等,品类是互联网商品销售平台中最为重要的类别,是用户购买需求的集中体现;“人物”指的是客观存在的人员,比如,“袁隆平”是一位“科学家”,等等,对于未指出的其它类别,在图5中使用虚线框进行标识,比如“事物n”、“无形物n”。
116.上述子类还可作为父类,继续包括下一级子类,比如,“无形物”类又可包括“受众”、“功能”、“风格”、“款式”、“材质”、“品质或成色”、“度量值”、“口味”、“气味”、“颜色”、“工艺”、“环保”、“纹路”、“服务”、“形状”、“计量单位”、“修饰语”、“动作”、“品牌”、“创作品”、“行政区”、“地区”、“国家”、“人物”等子类,其中:
[0117]“受众”指的是商品的受众群体,比如“医生”、“护士”、“公务员”等等。除了人群可以是受众之外,动物、植物、身体部位也都可以是受众,比如“小狗洗澡用品”中的“小狗”,“多肉植物肥料”中的“多肉植物”,以及“面部护理”中的“面部”,因此,“受众”类又可包括“受众:人群”、“受众:动物”、“受众:植物”、“受众:身体部位”等子类。
[0118]“功能”指的是具有明确含义的、能够表明商品在某一方面的具体功能的类别,比如“防走失”、“防晒”等等,“功能”类又可包括“美妆功能”、“服饰功能”、“气象功能”、“保健功能”、“家居功能”等子类。
[0119]“风格”是一个极度抽象的类别,其能够表征商品在风格方面具有的特点,比如“波西米亚风”、“潮范”、“南美风情”等等,“风格”类具有一个显性的特点,即风格类的词语经常以或者可以以“风/味/风格/风情/风潮/范/风范”等词作为结尾。“风格”类又可包括“文学风格”、“音乐舞蹈风格”、“触觉风格”、“视觉风格”等子类。
[0120]“款式”也是一个抽象的类别,其能够表征商品在款式方面具有的特点,比如“一字肩”、“双排扣”等等。
[0121]“材质”指的是一个事物的构成元素,比如“山羊毛”、“黄杨木”等等。按照商品所属行业的不同,“材质”类又可包括“建筑材质”、“服装材质”、“家居材质”、“首饰材质”等子类。
[0122]“品质或成色”用于表示商品的新旧或品质,比如“7成新”、“8成新”、“新款”等等。
[0123]“度量值”包括所有可度量的类别,比如,“距离”、“持续时间”、“质量”、“人数”、“价格”、“尺码”、“温度”、“厚度”、“容量”均是“度量值”类的子类。
[0124]“口味”指的是某一商品具有的、可被品尝到的味道,比如,“酸”、“甜”等等。
[0125]“气味”指的是某一商品具有的、可被闻到的味道,比如,“香”、“臭”等等。
[0126]“颜色”指的是某一商品具有的、可被观察到的颜色,比如,“红色”、“土豪金”等等。
[0127]“工艺”指的是形成某一商品所使用的工艺,比如,“一次成型”、“手工编织”等等。
[0128]“环保”指的是由与环保主题相关的词汇构成的类别,比如,“无甲醛”、“无毒”等等。
[0129]“纹路”指的是某一商品所具有的纹路特征,比如,“仿木纹”、“仿石纹”等等。
[0130]“服务”指的是由与服务主题相关的词汇构成的类别,比如,“送货上门”、“入户安装”等等。
[0131]“形状”指的是某一商品所具有的形状特征,比如,“方形”、“圆形”等等。
[0132]“计量单位”指的是由与计量单位相关的词汇构成的类别,比如,“公分”、“公斤”等等。
[0133]“修饰语”指的是由起到修饰作用的词汇构成的类别,比如,“齐名”、“媲美”等等。“修饰语”类可包括“否定词”、“后置修饰语”、“前置修饰语”等子类,“前置修饰语”类又可包括“品类前置修饰语”等子类。
[0134]“动作”指的是由起到动作限制作用的词汇构成的类别,其中,“动作”类可包括“动作:消耗/获取”、“动作:创造”、“动作:气象”、“动作:移动”、“动作:交易”、“动作:转移”等子类。
[0135]“品牌”指的是由与品牌相关的词汇构成的类别,比如,“阿里巴巴”、“华为”等等。
[0136]“创作品”指的是由一些创造工作得到的事物构成的类别,“创作品”类可包括“电影”、“电视剧”、“动漫”、“纪录片”、“综艺节目”、“书籍”、“虚拟角色”、“游戏”、“音乐录音”等
子类。
[0137]“行政区”指的是由国家为了进行分级行政管理而进行区域划分得到的省市级区域构成的类别,比如,“北京市”、“浙江省”等等。
[0138]“地区”指的是国家为了进行分级行政管理而进行区域划分得到的市内区域构成的类别,比如,“海淀区”、“闵行区”等等。
[0139]“国家”指的是国际上国家级别上的类别,比如“中国”、“美国”等等。
[0140]“人物”指的是客观存在的人员,比如,“袁隆平”是一位“科学家”。“人物”类可包括“科学家”、“体育人物”、“艺术家”、“娱乐人物”、“政治人物”、“历史人物”、“作家”等子类。
[0141]
上文提及,类可包括概念类和实体类,在上文示例中,“品类”、“受众”、“功能”、“风格”、“款式”、“材质”、“品质或成色”、“度量值”、“口味”、“气味”、“颜色”、“工艺”、“环保”、“纹路”、“服务”、“形状”、“计量单位”、“修饰语”、“动作”等类均属于概念类,“品牌”、“创作品”、“行政区”、“地区”、“国家”、“人物”等类均属于实体类。
[0142]
根据上述分类架构的设置方法,可确定某一类或某一子类的路径树,从而能够唯一地确定该类或子类在所述分类架构中的位置,比如,“品类”类的路径树为“事物>品类”;“受众”类的路径树为“事物>无形物>受众”;“功能”类的路径树为“事物>无形物>功能”;“风格”类的路径树为“事物>无形物>风格”;“款式”类的路径树为“事物>无形物>款式”;“材质”类的路径树为“事物>无形物>材质”;“品质或成色”类的路径树为“事物>无形物>品质或成色”;“度量值”类的路径树为“事物>无形物>度量值”;“口味”类的路径树为“事物>无形物>口味”;“气味”类的路径树为“事物>无形物>气味”;“颜色”类的路径树为“事物>无形物>颜色”;“工艺”类的路径树为“事物>无形物>工艺”;“环保”类的路径树为“事物>无形物>环保”;“纹路”类的路径树为“事物>无形物>纹路”;“服务”类的路径树为“事物>无形物>服务”;“形状”类的路径树为“事物>无形物>形状”;“计量单位”类的路径树为“事物>无形物>计量单位”;“修饰语”类的路径树为“事物>无形物>修饰语”;“动作”类的路径树为“事物>动作”;“品牌”类的路径树为“事物>无形物>品牌”;“创作品”类的路径树为“事物>创作品”;“行政区”类的路径树为“事物>地点>行政区”;“地区”类的路径树为“事物>地点>地区”;“国家”类的路径树为“事物>地点>国家”;“人物”类的路径树为“事物>人物”,其中,符号“>”用于表征类别之间的关系,符号“>”右侧的类别为左侧类别的子类。
[0143]
上文提及,所述第一预设分类架构的颗粒度大于所述第二预设分类架构的颗粒度,因此,所述第二预设分类架构中的类别与所述第一预设分类架构中的类别存在一对一或多对一的映射关系。以上文第一预设分类架构和第二预设分类架构示例为例,第二预设分类架构中的“创作品”类及其所有子类、“人物”类及其所有的子类均映射至第一预设分类架构中的“ip”类中;第二预设分类架构中的“功能”类及其所有的子类映射至第一预设分类架构中的“功能”类中;第二预设分类架构中的“风格”类及其所有的子类映射至第一预设分类架构中的“风格”类中。
[0144]
基于所述预设分类架构,就可以根据成分对象与所述预设分类架构所包含的实例信息、根据两者之间的匹配度确定所述成分对象所属的类别信息,进而根据所述成分对象及其类别信息确定和获取目标信息。
[0145]
相比cpv体系,上述预设分类架构中的类目和实例均是在同一个体系下协同构建的,借助父类与子类之间的继承关系、对每个类中属性的独立设置,使得架构元素之间的关
系紧密,从而便于维护。另外,上述预设分类架构不仅考虑了商品的理解和分析,而且还考虑了用户需求理解和购物场景理解等多样化场景的需求,因此能够有效应用于目前类目众多、属性众多、场景众多的互联网商品销售平台中。
[0146]
需要特别说明的是,上述预设分类架构中所包含的类目和实例均可根据实际应用的需要进行删除、增加或调整,对其本公开不作特别限定也不再赘述。
[0147]
在本实施例的一个可选实现方式中,如图6所示,所述步骤s103,即根据所述成分对象及其类别信息确定候选信息集合,基于所述成分对象在所述候选信息集合中确定目标信息的步骤,包括以下步骤s601-s603:
[0148]
在步骤s601中,根据所述成分对象及其类别信息确定与所述成分对象对应的候选信息集合;
[0149]
在步骤s602中,将所述成分对象与所述候选信息集合进行匹配,得到与所述成分对象匹配的目标子信息;
[0150]
在步骤s603中,组合与所述一个或多个成分对象匹配的目标子信息,得到目标信息。
[0151]
为了获取与所述输入信息相应的、匹配的、准确的目标信息,在该实现方式中,首先根据所述成分对象及其类别信息确定与所述成分对象对应的候选信息集合;然后将所述成分对象与所述候选信息集合进行匹配,得到与所述成分对象匹配的目标子信息;最后组合与所述一个或多个成分对象匹配的目标子信息,即可得到目标信息,其中,所述组合指的是交集组合。
[0152]
在本实施例的一个可选实现方式中,所述步骤s603,即组合与所述一个或多个成分对象匹配的目标子信息,得到目标信息,可被实施为:
[0153]
对于所述一个或多个成分对象匹配的目标子信息进行去重;
[0154]
组合去重之后的目标子信息,得到目标信息。
[0155]
为了避免重复信息带来的信息冗余,在该实现方式中,在组合目标子信息之前首先对于目标子信息进行去重,以去除存在重复的目标子信息,减少信息冗余,提高数据传输效率。
[0156]
在本实施例的一个可选实现方式中,所述方法还包括显示所述确定的目标信息的步骤,其中,所述显示所述确定的目标信息的步骤可被实施为:确定目标信息显示对象,并在所述目标显示对象上显示所述确定的目标信息。其中,所述目标信息显示对象比如可以为目标信息显示页面等对象。
[0157]
在本实施例的一个可选实现方式中,所述目标信息还可配置有权重因子,以对所述目标信息的重要程度进行有效标识,并借助权重因子的数值设置,来使得所述目标信息与所述输入信息之间的匹配度更高。
[0158]
即,在本实施例的一个可选实现方式中,所述显示所述确定的目标信息的步骤可被实施为:
[0159]
确定目标信息权重因子;
[0160]
根据所述目标信息的权重因子计算所述目标信息的显示优先级;
[0161]
根据所述显示优先级显示所述确定的目标信息。
[0162]
其中,所述权重因子的设置可由以下因素中的一种或多种确定:信息输入方的偏
好信息、目标信息的被查询次数或频率等等。权重因子对应的权重数值越高的目标信息,其优先级也就越高,最终在显示时就会被优先显示。以商品搜索为例,若最终查询得到6种目标信息:目标信息1、目标信息2、目标信息3、目标信息4、目标信息5和目标信息6,其中,按照目标信息被查询次数由高至低确定的显示优先级顺序为:目标信息4、目标信息1、目标信息6、目标信息3、目标信息2和目标信息5,那么在所述目标显示对象上就按照上述顺序进行排列显示。
[0163]
接下来以几个常用的场景为例对于上述方案进行解释和说明。
[0164]
如图7所示,在信息搜索场景中,假设输入信息为“波西米亚连衣裙”,其成分对象为“波西米亚”和“连衣裙”,“波西米亚”所述类别的路径树为“事物>无形物>风格>视觉风格”,那么就根据所述路径树确定所有视觉风格为波西米亚风格的产品信息组成的候选信息集合,“连衣裙”所述类别的路径树为“事物>品类”,那么就根据所述路径树确定所有品类为连衣裙的产品信息组成的候选信息集合;然后分别以“波西米亚”和“连衣裙”作为搜索词在相应的候选信息集合中进行搜索,得到视觉风格为波西米亚风格以及品类为连衣裙的产品信息;最后将同时包含波西米亚和连衣裙的产品信息,即进行交集组合操作,得到所述输入信息对应的搜索结果,即目标信息,最后再将得到的搜索结果在信息搜索结果页面中显示出来。
[0165]
如图8所示,在信息推荐场景中,假设输入信息为“有波西米亚连衣裙吗”,与信息搜索场景类似,经过成分对象分解、根据成分对象及其类别信息确定候选信息集合、以成分对象作为关键词在相应的候选信息集合中进行查询后,将同时包含波西米亚和连衣裙的产品信息作为与所述输入信息相应的目标推荐信息在信息推荐结果页面中显示出来。
[0166]
如图9所示,在信息问答场景中,假设输入信息为“有波西米亚连衣裙吗”,与上述应用场景类似,经过成分对象分解、根据成分对象及其类别信息确定候选信息集合、以成分对象作为关键词在相应的候选信息集合中进行查询后,将同时包含波西米亚和连衣裙的产品信息作为与所述输入信息相应的目标回答信息在信息回答结果页面中显示出来。
[0167]
当然本公开技术方案还可应用于信息查询等众多根据输入信息获取目标信息的场景,工作流程与上述应用场景类似,本公开在此不再赘述。
[0168]
下述为本发明装置实施例,可以用于执行本发明方法实施例。
[0169]
图10示出根据本发明一实施方式的信息获取装置的结构框图,该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图10所示,所述信息获取装置包括:
[0170]
分解模块1001,被配置为获取输入信息,并将所述输入信息分解为一个或多个成分对象;
[0171]
确定模块1002,被配置为确定所述成分对象的类别信息;
[0172]
搜索模块1003,被配置为根据所述成分对象及其类别信息确定候选信息集合,基于所述成分对象在所述候选信息集合中确定目标信息。
[0173]
上文提及,随着信息技术的发展,越来越多的用户期望借助互联网能够获取想要得到的信息,比如,查询与某一关键词相关的信息、问询与某一关键词相关的信息、搜索与某一对象相关的产品信息等等。现有技术中,信息平台大多直接使用用户输入的关键词或者以空格键分割的关键词作为关键词进行查询或搜索,再将查询或搜索出的信息或页面展
示给用户,但上述处理方法由于目标查询范围较大,关键词准确度不足,因此导致查询运算量较大,同时查询结果准确性较低,查询结果与关键词之间的相关度较低,即查询命中率较低。
[0174]
考虑到上述问题,在该实施方式中,提出一种信息获取装置,该装置通过将输入信息分解为一个或多个成分对象,并根据确定的所述成分对象的类别信息确定候选信息集合,最终基于所述成分对象在所述候选信息集合中确定得到目标信息。该技术方案对于目标查询范围进行了限缩,提高了关键词的准确度,从而在有效降低查询运算量的情况下,提高查询结果的准确性,增强查询结果与关键词之间的相关度,提高查询命中率。
[0175]
在本实施例的一个可选实现方式中,所述输入信息指的是信息输入方在信息输入区域输入的、想要获取与其相关的信息。其中,所述信息输入区域比如可以为信息获取栏等信息输入区域。其中,所述输入信息可以为字、词语、词组甚至可以为一句话,比如,所述输入信息可以为:“波西米亚连衣裙”、“儿童防走失”、“女童全棉短袖睡裙”等等。
[0176]
在本实施例的一个可选实现方式中,所述成分对象指的是作为输入信息全部或者部分成分的、具有独立含义的信息部分。比如,对于“波西米亚连衣裙”这一输入信息,其成分对象可以为“波西米亚”和“连衣裙”;对于“儿童防走失”这一输入信息,其成分对象可以为“儿童”和“防走失”;对于“女童全棉短袖睡裙”这一输入信息,其成分对象可以为“女童”、“全棉”、“短袖”和“睡裙”。
[0177]
在本实施例的一个可选实现方式中,所述成分对象的类别信息指的是所述成分对象所属的、能够将其与其他成分对象进行区分的类别。比如,成分对象“波西米亚”的类别可以为一种“视觉风格”,“连衣裙”和“睡裙”的类别可以为一种“品类”,“儿童”和“女童”的类别可以为一种“人群受众”,“防走失”的类别可以为一种“功能”;“全棉”的类别可以为一种“材质”,而“短袖”的类别可以为一种“款式”。
[0178]
在本实施例的一个可选实现方式中,根据所述成分对象及其类别信息确定的候选信息集合指的是与所述成分对象的类别信息相对应的、包含有同属于该类别信息的、与所述成分对象相同相关或相应的信息、产品或对象。比如,“波西米亚”的类别为“视觉风格”,则根据成分对象“波西米亚”及类别信息“视觉风格”确定的候选信息集合为所有视觉风格为波西米亚风格的网页信息、产品信息组成的集合,等等。
[0179]
在本实施例的一个可选实现方式中,如图11所示,所述分解模块1001包括:
[0180]
获取子模块1101,被配置为获取输入信息;
[0181]
分解子模块1102,被配置为根据语义分词装置将所述输入信息分解为一个或多个成分对象,其中,所述成分对象为以下对象中的一种或多种:字、词语和词组。
[0182]
为了全面获取输入信息的成分信息,在该实施方式中,所述分解模块1001借助语义分词方法将所述输入信息分解为一个或多个成分对象,其中,所述成分对象可以为以下对象中的一种或多种:具有独立含义的字、词语、词组。
[0183]
其中,可根据实际应用的需要以及输入信息的特点选择合适的语义分词方法,本公开对其不作具体限定,比如机械分词等基于字符串匹配的分词方法、基于隐性马尔可夫模型(hmm)或条件随机场算法(crf)等基于统计及机器学习的分词方法等等。
[0184]
在本实施例的一个可选实现方式中,如图12所示,所述确定模块1002包括:
[0185]
获取子模块1201,被配置为获取预设分类架构,其中,所述预设分类架构用于表征
类别及类别之间的关系;
[0186]
第一确定子模块1202,被配置为根据所述预设分类架构确定所述成分对象的类别信息。
[0187]
为了准确获取成分对象的类别信息,提高候选信息集合的精准度,以进一步提高后续目标信息的获取准确性,在该实现方式中,所述确定模块1002借助预先设置的分类架构来确定所述成分对象的类别信息。其中,所述预设分类架构是一个预先设置的、在大量数据的基础上形成的、用于表征各类别的信息以及类别之间关系的架构。
[0188]
现有技术提出一种用于对于输入关键词进行分析的cpv体系,其中,c指的是一个多级类目体系,比如“数字阅读->出版物电子书->外语/语言文学->专著”是“专著”这一类目的类目路径,不同的商品分属于对应的类目;p指的是属性,比如“笔尖材质”、“跟高”等;v指的是属性值,比如“合金”是属性“笔尖材质”的值,“5厘米”是属性“跟高”的值。但所述cpv体系存在一定的缺点:类目、属性、属性值并不是在同一个体系下协同构建的,互相之间的关系松散,因此维护困难,另外,cpv体系是针对商品理解和分析设计的,无法直接应用于用户需求理解和购物场景理解,更无法应对目前类目众多、属性众多、场景众多的互联网商品销售平台的需求。
[0189]
为了满足不同计算量的要求,在本实施例的一个可选实现方式中,将所述预设分类架构分为第一预设分类架构和第二预设分类架构。其中,所述第一预设分类架构的颗粒度大于所述第二预设分类架构的颗粒度,即所述第一预设分类架构是一种扁平化的、粗颗粒度的分类架构,易于理解,可作为对外应用接口,而所述第二预设分类架构是一种深度化的、细颗粒度的分类架构。另外,为了保障信息的完整性,所述第一预设分类架构中包含信息的总和与第二预设分类架构中包含信息的总和相同,上文提及,所述第一预设分类架构的颗粒度大于所述第二预设分类架构的颗粒度,因此,所述第二预设分类架构中的类别与所述第一预设分类架构中的类别存在一对一或多对一的映射关系。
[0190]
在本实施例的一个可选实现方式中,所述第二预设分类架构为包括根节点、父类、子类和实例的树形结构,其中,父类、子类可为一级也可以为多级;而所述第一预设分类架构较为简单,比如,其可为仅包括父类、子类和实例的树形结构,也可为仅包括类和实例的树形结构。其中,父类、子类可为一级也可以为多级,而且根据实际数据的情况,不同的父类可具有不同层级数量的子类。其中,实例指的是末级子类中具体的内容信息,比如,“波西米亚”是“视觉风格”类中的一个实例,“连衣裙”、“睡裙”是“品类”类中的实例,“儿童”、“女童”是“受众:人群”类中的实例,“防走失”是“功能”类中的实例,“全棉”是“服装材质”类中的实例,“短袖”是“款式”类中的实例,等等。借助上述根节点、父类、子类和实例的结构,即可对于任一信息对象进行不同成分的分析。需要说明的是,所述第一预设分类架构中的类别级别数量需小于所述第二预设分类架构中的类别级别数量。
[0191]
其中,类可包括概念类和实体类,概念类指的是一个抽象的类的集合,比如,“橘子”是指橘子这个类别,而不是指某处桌子上放的具体的某一个橘子;实体类指的是一个客观存在事物的类的集合,比如,“袁隆平”属于科学家这个类别,其为一个客观存在的实体。需要说明的是,实体类可以是概念类的子类,但是概念类不可以是实体类的子类。
[0192]
其中,每一个类别均拥有属于自己的、特有的属性,由于子类本质上属于父类,因此,子类将继承父类所有的属性。如图4所示,父类“事物”具有“名称(name)”、“别名
(alternatename)”、“描述(description)”、“图片(image)”四个属性,“事物”的子类“品类”具有“受众(audience)”、“所属行业(industry)”两个特有的属性,由于“品类”是“事物”的子类,所以子类“品类”将继承父类“事物”的四个属性,因此,“品类”共具有“名称”、“别名”、“描述”、“图片”、“受众”、“所属行业”六个属性。
[0193]
为了形成广度和深度都能够满足实际应用需求的分类架构,考虑到层次越深的子类就越能对输入信息进行全面精准的刻画,比如“风格”类别下的“视觉风格”子类、“材质”类别下的“服装材质”子类等。因此,在本实施例的一个可选实现方式中,在生成所述第二预设分类架构时,对于自根节点向下的第一预设数量的类别,按照自顶向下的规则生成,对于自末级节点向上的第二预设数量的类别,按照自底向上的规则生成。比如,在实际应用中发现用户对“服装材质”这一类别的需求,从而设置“服装材质”这一类别,然后将其父类设置为“材质”;同时“材质”又为无形物这一类别的一个子类,这样就完成了从“事物>无形物>材质>服装材质”这一类别分支的设置。基于上述,第二预设分类架构的设置同时兼顾自顶向下以及自底向上的生成规则,通过数据的不断优化与迭代,最终可完成第二预设分类架构的设置。其中,所述第一预设数量和第二预设数量可根据实际应用的需要进行设置和选择,本公开对其不作具体限定,需要说明的是,所述第一预设数量与第二预设数量之和为所述第二预设分类架构的类别层级总数量。
[0194]
上文以互联网商品销售平台为例,对于所述预设分类架构进行了详细地介绍,此处不再赘述。
[0195]
根据上文所描述的分类架构的设置方法,可确定某一类或某一子类的路径树,从而能够唯一地确定该类或子类在所述分类架构中的位置。另外,由于所述第一预设分类架构的颗粒度大于所述第二预设分类架构的颗粒度,因此,所述第二预设分类架构中的类别与所述第一预设分类架构中的类别存在一对一或多对一的映射关系。
[0196]
基于所述预设分类架构,就可以根据成分对象与所述预设分类架构所包含的实例信息、根据两者之间的匹配度确定所述成分对象所属的类别信息,进而根据所述成分对象及其类别信息进行确定和获取目标信息。
[0197]
相比cpv体系,上述预设分类架构中的类目和实例均是在同一个体系下协同构建的,借助父类与子类之间的继承关系、对每个类中属性的独立设置,使得架构元素之间的关系紧密,从而便于维护。另外,上述预设分类架构不仅考虑了商品的理解和分析,而且还考虑了用户需求理解和购物场景理解等多样化场景的需求,因此能够有效应用于目前类目众多、属性众多、场景众多的互联网商品销售平台中。
[0198]
需要特别说明的是,上述预设分类架构中所包含的类目和实例均可根据实际应用的需要进行删除、增加或调整,对其本公开不作特别限定也不再赘述。
[0199]
在本实施例的一个可选实现方式中,如图13所示,所述搜索模块1003包括:
[0200]
第二确定子模块1301,被配置为根据所述成分对象及其类别信息确定与所述成分对象对应的候选信息集合;
[0201]
匹配子模块1302,被配置为将所述成分对象与所述候选信息集合进行匹配,得到与所述成分对象匹配的目标子信息;
[0202]
组合子模块1303,被配置为组合与所述一个或多个成分对象匹配的目标子信息,得到目标信息。
[0203]
为了获取与所述输入信息相应的、匹配的、准确的目标信息,在该实现方式中,第二确定子模块1301根据所述成分对象及其类别信息确定与所述成分对象对应的候选信息集合;匹配子模块1302将所述成分对象与所述候选信息集合进行匹配,得到与所述成分对象匹配的目标子信息;组合子模块1303组合与所述一个或多个成分对象匹配的目标子信息,即可得到目标信息,其中,所述组合指的是交集组合。
[0204]
在本实施例的一个可选实现方式中,所述组合子模块1303可被配置为:
[0205]
对于所述一个或多个成分对象匹配的目标子信息进行去重;
[0206]
组合去重之后的目标子信息,得到目标信息。
[0207]
为了避免重复信息带来的信息冗余,在该实现方式中,组合子模块1303在组合目标子信息之前首先对于目标子信息进行去重,以去除存在重复的目标子信息,减少信息冗余,提高数据传输效率。
[0208]
在本实施例的一个可选实现方式中,所述装置还包括显示所述确定的目标信息的部分,即如图14所示,所述信息获取装置包括:
[0209]
分解模块1401,被配置为获取输入信息,并将所述输入信息分解为一个或多个成分对象;
[0210]
确定模块1402,被配置为确定所述成分对象的类别信息;
[0211]
搜索模块1403,被配置为根据所述成分对象及其类别信息确定候选信息集合,基于所述成分对象在所述候选信息集合中确定目标信息;
[0212]
显示模块1404,被配置为显示所述确定的目标信息。
[0213]
具体地,所述显示模块1404可被配置为:确定目标信息显示对象,并在所述目标显示对象上显示所述确定的目标信息。其中,所述目标信息显示对象比如可以为目标信息显示页面等对象。
[0214]
在本实施例的一个可选实现方式中,所述目标信息还可配置有权重因子,以对所述目标信息的重要程度进行有效标识,并借助权重因子的数值设置,来使得所述目标信息与所述输入信息之间的匹配度更高。
[0215]
即,在本实施例的一个可选实现方式中,所述显示模块1404可被配置为:
[0216]
确定目标信息权重因子;
[0217]
根据所述目标信息的权重因子计算所述目标信息的显示优先级;
[0218]
根据所述显示优先级显示所述确定的目标信息。
[0219]
其中,所述权重因子的设置可由以下因素中的一种或多种确定:信息输入方的偏好信息、目标信息的被查询次数或频率等等。权重因子对应的权重数值越高的目标信息,其优先级也就越高,最终在显示时就会被优先显示。以商品搜索为例,若最终查询得到6种目标信息:目标信息1、目标信息2、目标信息3、目标信息4、目标信息5和目标信息6,其中,按照目标信息被查询次数由高至低确定的显示优先级顺序为:目标信息4、目标信息1、目标信息6、目标信息3、目标信息2和目标信息5,那么在所述目标显示对象上就按照上述顺序进行排列显示。
[0220]
本发明实施例还公开了一种电子设备,图15示出根据本发明一实施方式的电子设备的结构框图,如图15所示,所述电子设备1500包括存储器1501和处理器1502;其中,
[0221]
所述存储器1501用于存储一条或多条计算机指令,其中,所述一条或多条计算机
指令被所述处理器1502执行以实现上述任一方法步骤。
[0222]
图16适于用来实现根据本发明实施方式的信息获取方法的计算机系统的结构示意图。
[0223]
如图16所示,计算机系统1600包括中央处理单元(cpu)1601,其可以根据存储在只读存储器(rom)1602中的程序或者从存储部分1608加载到随机访问存储器(ram)1603中的程序而执行上述实施方式中的各种处理。在ram1603中,还存储有系统1600操作所需的各种程序和数据。cpu1601、rom1602以及ram1603通过总线1604彼此相连。输入/输出(i/o)接口1605也连接至总线1604。
[0224]
以下部件连接至i/o接口1605:包括键盘、鼠标等的输入部分1606;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分1607;包括硬盘等的存储部分1608;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分1609。通信部分1609经由诸如因特网的网络执行通信处理。驱动器1610也根据需要连接至i/o接口1605。可拆卸介质1611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1610上,以便于从其上读出的计算机程序根据需要被安装入存储部分1608。
[0225]
特别地,根据本发明的实施方式,上文描述的方法可以被实现为计算机软件程序。例如,本发明的实施方式包括一种计算机程序产品,其包括有形地包含在及其可读介质上的计算机程序,所述计算机程序包含用于执行所述信息获取方法的程序代码。在这样的实施方式中,该计算机程序可以通过通信部分1609从网络上被下载和安装,和/或从可拆卸介质1611被安装。
[0226]
附图中的流程图和框图,图示了按照本发明各种实施方式的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,路程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0227]
描述于本发明实施方式中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。
[0228]
作为另一方面,本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施方式中所述装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,所述程序被一个或者一个以上的处理器用来执行描述于本发明实施例的方法。
[0229]
以上描述仅为本发明的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本发明实施例中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本发明实施例中公开的(但不限
于)具有类似功能的技术特征进行互相替换而形成的技术方案。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1