一种用于物联网物品信息搜索排序的重要性评估方法与流程

文档序号:17926519发布日期:2019-06-15 00:27阅读:392来源:国知局
一种用于物联网物品信息搜索排序的重要性评估方法与流程

本发明涉及一种重要性评估方法,具体涉及一种用于物联网物品信息搜索排序的重要性评估方法。



背景技术:

随着廉价微型传感器、无线通信技术和移动计算技术的迅速发展和普及,众多具有感知、计算以及通信能力的现实世界物品(如可穿戴设备、智能仪表、钥匙串和座椅等)将广泛存在于物联网中。可以预见,正如当前利用网络搜索引擎查找互联网信息一样,随着各种应用领域(如环境监测、智能家居、智能物流和智能建筑工地等)对现实世界物品信息查找和浏览需求的日益增长,很快人们将能在英特网上查找和浏览现实世界中的各种物品信息。从用户的角度考虑,由于时间、精力以及移动设备资源有限等原因,用户往往只关注物品搜索结果列表的第一项或前几项内容。因此,在基于用户查询关键字检索出海量的候选物品后,如何对这些候选物品进行排序以快速发掘出符合用户查询意图的物品信息成为国内外学界、业界研究的热点问题。

物联网物品搜索排序主要涉及候选物品与用户查询意图的相关性评估和候选物品自身的重要性评估两个方面。现有研究中,物联网物品既没有类似网页之间的超链接关系,也没有类似社交网络中用户之间的好友关系,导致基于链接的重要性评估方法(如pagerank、hits等)不能直接应用于候选物品的重要性评估。因此,如何对没有显式链接关系的候选物品建立重要性评估方法是物联网物品搜索排序需要解决的另一个难题。



技术实现要素:

本发明的目的在于克服现有技术的不足,提供一种用于物联网物品信息搜索排序的重要性评估方法。

这种用于物联网物品信息搜索排序的重要性评估方法,包括如下步骤:

a、物品隐式链接关系挖掘

b、物品隐式链接关系图构建,提取特征

c、融合物品显式特征与隐式特征进行重要性评估

作为优选,步骤a包括以下步骤:

a11、收集三类物品交织互动行为信息:交织互动行为涉及的物品、交织互动行为发生的时间以及交织互动行为发生位置。

a12、通过提取细粒度的物品交互特征,结合物品内容与属性等信息,对物品隐式链接关系应用潜变量模型进行建模挖掘。

作为优选,步骤b包括以下步骤:

b11、构建物品隐式链接关系图。

b12、从物品隐式链接关系图提取节点拓扑结构的特征和边权重的特征用于候选物品的重要性评估。

作为优选,步骤b12包括以下步骤:

b121、建立出发物品、中介物品与目标物品的转移概率矩阵。

b122、根据随机游走算法计算三种物品之间的重启动向量。

b123、算法收敛后得到稳定的隐式链接关系强度。

作为优选,步骤c包括以下步骤:

c11、利用物品传感信息和文本信息提取物品显式特征。

c12、利用用户历史查询信息提取用户点击过的物品信息,并依据用户点击顺序生成训练样本,建立候选物品的重要性评估模型。

本发明的有益效果是:

本发明涉及一种用于物联网物品信息搜索排序的重要性评估方法,主要是深度挖掘物品交织互动行为,利用蕴含丰富时空模式和用户生活习惯的物品交织互动行为信息可以挖掘出物品之间的隐式链接关系,建立对于候选物品的重要性评估的方法。

本专利提出的方法深度挖掘物品交织互动行为,利用蕴含丰富时空模式和用户生活习惯的物品交织互动行为信息可以挖掘出物品之间的隐式链接关系,从而建立融合物品显式特征和隐式链接关系的候选物品重要性评估方法。

附图说明

图1是候选物品重要性评估方法的建立流程图;

图2是不同传感器的信息收集、隐式链接关系提取流程图;

图3是得到完整隐式链接关系向量的流程图;

图4是物品隐式链接关系示意图;

图5是出发物品、中间物品与目标物品示意图;

图6是物品重要性计算流程图。

具体实施方式

下面结合实施例对本发明做进一步描述。下述实施例的说明只是用于帮助理解本发明。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

一、本发明的整体思想:

我们主要考虑以下两个方面:如何从物品信息中挖掘隐式关系、提取隐式特征;如何根据物品的隐式、显式特征进行候选物品的重要性评估。

二、本发明所述的这种产生候选物品重要性的方法的具体实施方式包括以下步骤,如图1所示

a、物品隐式链接关系挖掘,如图2所示

步骤a包括以下步骤:

a11、收集三类物品交织互动行为信息:交织互动行为涉及的物品、交织互动行为发生的时间以及交织互动行为发生位置。基于多传感器,根据不同类型传感信息更新频率的差别,采用发布/订阅的方式对传感信息进行收集。采用状态传感器获取物品交织互动行为的起止时间;对于室外发生的物品交织互动行为,采用gps获得交互物品的位置信息;对于室内发生的物品交织互动行为,采用基于位置指纹的定位方法获取交互物品的位置信息。

a12、通过提取细粒度的物品交互特征(例如,交互时间的概率分布、交互位置蕴含的语义信息以及交互活动蕴含的用户行为习惯等),结合物品内容与属性等信息,对物品隐式链接关系应用潜变量模型进行建模挖掘。鉴于物品参与交织互动行为的频率与其隐式链接关系强度存在正相关性,将物品内容信息、属性以及从交织互动行为提取的细粒度交互特征作为观察变量,将物品隐式链接关系强度作为影响物品交织互动行为的潜变量,利用概率图构建物品隐式链接关系的潜变量挖掘模型。

b、物品隐式链接关系图构建,提取特征,如图3所示

步骤b包括以下步骤:

b11、构建物品隐式链接关系图,如图4所示。其中,以物品作为该关系图的节点,以物品之间的隐式链接关系强度作为该关系图的边权重。图中实线代表隐式链接关系中挖掘出的隐式链接关系强度,虚线则代表尚未求取的隐式关系强度。

b12、从物品隐式链接关系图提取两类特征用于候选物品的重要性评估,一类是从物品隐式链接关系图节点拓扑结构提取的特征,包括节点的度、中心度、介数和特征向量中心性等。另一类是从物品隐式链接关系图边权重提取的特征,采用随机游走算法获取每对物品之间的隐式链接关系强度,将节点所有邻接边的权重组合为特征向量。

步骤b12包括以下步骤:

b121、可以将物品分为三类:出发物品、中介物品与目标物品,其关系图如图5所示(在计算时,通常只有一个出发物品,目标物品则可能有多个)。因此,可以表示这三类物品的转移概率。其中,x是出发物品与中介物品之间的隐式关系强度,y是中介物品与目标物品之间的隐式关系强度,状态转移矩阵(to、tb、td)表示允许顶点通过随机游走以一定概率回到原顶点,以对角矩阵表示。

b122、令表示对出发物品与出发物品、中介物品、目标物品之间的隐式关系强度向量,αo、αb、αd是随机游走传播算法重新启动的概率,设置为0.05。令vo、vb、vd表示所有出发物品、中介物品与目标物品顶点的重启动向量,所有元素初始化为0,随机游走向量o、b、d初始化为1,随机游走传播过程如下(使用vo、vb、vd进行初始化):

其中的计算过程类似。

b123、算法收敛之后,hd即尚未得到的隐式链接关系强度,与已知的隐式链接关系强度共同组成了出发物品的隐式链接关系强度特征向量。

c、融合物品显式特征和隐式特征进行重要性评估,如图6所示

步骤c包括以下步骤:

c11、利用物品传感信息和文本信息提取物品显式特征,例如,地理位置、信息时效性等。

c12、提取出物品的显式特征及隐式特征,利用用户历史查询信息提取用户点击过的物品信息,并依据用户点击顺序生成训练样本,借鉴排序学习思想建立候选物品的重要性评估模型,如图6所示。

对于物品i1,i2,……,in,假定其对应的显式特征向量与隐式特征向量组合之后的特征向量为δ1,δ2,……,δn,每个特征向量的维度分别是m维。假设对应的权重向量为w=(w1,w2,……,wm),用户对物品的点击顺序向量是η=(t1,t2,······,tn),其中ti代表第i个物品的点击顺序。为方便表示,假定该向量为增序,则不断调整权重向量w,使得:

δ1w<δ2w<······<δnw

从而查询新物品时inew,通过计算δneww可以得到物品的重要性。

三、实施实例:

假定有四个物品,分别记为物品1,物品2,物品3,物品4,其中物品1与物品3、物品4存在已知的隐式链接关系,与物品2的隐式链接关系待求取。同时,物品3、物品4与物品2也存在已知的隐式链接关系。

假设物品1与物品3的关系强度为2,物品1与物品4的关系强度为3;

物品3与物品2的强度为1,物品4与物品2的强度为4。

物品3与物品4的强度为2。

则有

to=[1];

tb=[2,0;0,2];

td=[1];

y=[2,3];

x=[1,4];

设重启动向量vo、vb、vd均为0.2,即vo=[0.2],vb=[0.2,0.2],vd=[0.2],则有:

假设状态转移矩阵均为0,则一次游走之后:

重复计算直到收敛。

假定仅有两个物品,其隐式链接向量分别是(1,2)、(2,1),显式链接向量是(3,4)、(4,3),则组合向量是((1,2,3,4),(2,1,4,3))。假定权重向量初始为(1,2,1,2),点击顺序是(1,2),此时δ1w=16,δ2w=14,与点击顺序不符。

调整权重向量至(2,1,1,1),此时δ1w=11,δ2w=12,与点击顺序相符,则该向量可用于计算新加入的物品重要性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1