一种创建个人场景多维度特征图谱的方法、装置及其应用与流程

文档序号:17382890发布日期:2019-04-12 23:58阅读:265来源:国知局
一种创建个人场景多维度特征图谱的方法、装置及其应用与流程

本发明涉及互联网技术领域,具体而言,涉及一种时序创建个人场景多维度特征图谱的方法、装置及其应用。



背景技术:

随着计算机行业的大数据和人工智能技术的快速发展,个性化推荐越来越受到用户的欢迎,也为用户创造了越来越多的个性化价值。预测用户行为是实现个性化推荐的重要前置技术,而目前的预测用户行为的技术方案主要是使用推荐算法,具体为:

通过用户维度数据、内容维度数据、时间维度、地址维度数据建立特征仓库,然后根据特征仓库数据进行逻辑计算,获得针对用户的推荐内容,包括:

1.根据用户喜欢某些特征的内容进行用户内容匹配;根据用户对物品或者信息的偏好,发现物品或者内容本身的相关性,或者是发现用户的相关性,这种方案被称为基于协同过滤的推荐;发明cn201310079241.5提供了一种基于地图的信息推荐方法,该方法适用于为当前地图搜索服务提供用户需求预测并推荐。用户输入搜索查询,通过与知识库中的模型匹配,能够对用户的需求进行预测并推荐。

2.发明cn201610285120.x利用用户之前喜欢的内容进行内容匹配,找到与这些内容相似的内容,根据推荐物品或内容的元数据,发现物品或者内容的相关性,这种方案被称为基于内容的推荐;

3.根据用户特征寻找相似的用户、相似的用户喜欢的东西进行用户匹配,根据系统用户的基本信息发现用户的相关程度,这种方案被称为基于人口统计学的推荐。在构建模型与用户模型后,需要计算两个模型的相似性,从而将按相似性大小排序后的文献集返回给用户。传统的相似性计算主要是将两个模型定义为向量,采用余弦相似性方法进行计算,然而此方法对两个向量的元素个数匹配有强制性的要求,这就加剧了数据稀疏性的问题。

现有技术中上述的推荐算法存在冷启动、稀疏性、精度和多样性等问题;相关异构的信息不够全面、内容特征样本不利于用户理解、特征训练算法不太符合用户逻辑性、结果和实际偏差较大、推荐的个性化、针对性有效性、准确性不高。但很少针对场景图谱服务的属性筛选服务以满足用户的个性化需求,有鉴于此,本发明提出一种时序创建个人场景多维度特征图谱的方法及其应用,通过创建个人场景图谱,预测用户行为,实现精确、有效、个性化推荐的目的。



技术实现要素:

本发明的目的是:提出一种时序创建个人场景多维度特征图谱的方法、装置及其应用,通过创建个人场景图谱,预测用户行为,实现个性化推荐的目的。

本发明所采用的技术方案是:

本发明一方面提出一种时序创建个人场景多维度特征图谱的方法,包括:

步骤1:预设多层次场景标签库,并预设对应的场景逻辑关系、场景间的关联概率计算规则、以及场景之间的时序关系、链式串联表达关系;

步骤2:通过用户手机使用的基站或/和卫星定位系统自动获得获取和/或计算用户的多层次场景标签值,对应存储到预设的多层次场景标签库中,根据预设的所述场景逻辑关系,生成用户个人场景;

步骤3:基于多个独立的用户个人场景,根据场景间的关联概率计算规则,计算预设时间段内多个独立的用户个人场景之间关联概率,根据预设的场景之间的时序关系、链式串联表达关系,生成用户个人场景图谱。

进一步地,所述的自动时序创建个人场景串联多维度特征图谱的方法,其中:

所述多层次场景标签,包括一级场景标签和多级下属场景标签,所述一级场景标签包括人、时间、地点、天气四个标签。

进一步地,所述的自动时序创建个人场景串联多维度特征图谱的方法,其中:

所述人的多层次场景标签值,由预设的用户画像数据库或/和实时计算获得;

所述时间的多层次场景标签值,由系统自动获得;

所述地点的多层次场景标签值,由用户手机使用的基站或/和卫星定位系统自动获得;

所述天气的多层次场景标签值,由系统自动获得。

进一步地,所述的自动时序创建个人场景串联多维度特征图谱的方法,其中:

所述实时计算人的多层次场景标签值是针对无法直接采集的场景标签进行自动获取,步骤为:

a.预设可直接采集的场景标签为第一场景标签,无法直接采集的场景标签为第二场景标签,并建立对应的场景标签条目;

b.根据第二场景标签,

搜索或匹配获得第二场景标签值;

根据第一场景标签推理获得第二场景标签值;

通过对会话内容进行语义推理获得第二场景标签值;

通过获取与会话内容关联的关联词获得第二场景标签值;

根据已训练好的分类器分类获得第二场景标签值;

通过已获得的第二场景标签进一步多层次推理计算获得其他的第二场景标签值;

根据上述方法的任意组合获得第二场景标签值。

进一步地,所述的自动时序创建个人场景串联多维度特征图谱的方法,其中:

所述场景逻辑关系,是在多层次场景标签库的各场景标签之间,定义场景标签获得对应的场景标签值后,用于组成描述用户个人场景的规则;

所述场景间的关联概率计算规则,是根据在一个预设时间段内统计的用户数据,计算一个用户个人场景与时间上相邻的其他用户个人场景之间关联发生的概率。

进一步地,所述的自动时序创建个人场景串联多维度特征图谱的方法,其中:

所述时序关系包括:before:场景在另一个场景之前发生;after:场景在另一个场景之后发生;includes:一个场景包含另一个场景;is_included:一个场景被另一个场景包含;during:一个场景在一段时间内保持一个状态;simultane-ous:同时发生;iafter:场景紧跟另一个场景发生,且它们不重叠、不间断;ibe-fore:场景在另一个场景之前发生,且它们不重叠、不间断;1iaentity:表示同一场景;begins:一个场景开始导致另一个场景开始;ends:一个场景结束导致另一个场景结束;begunby:一个场景因另一个场景开始而开始,与begins相对;ended_by:一个场景因另一个场景结束而结束,与ends相对;

所述时序关系的计算方法为:在采集场景的同时,采集场景发生的开始时间点和结束时间点,通过时间计算确定时序关系;

所述链式串联表达关系的确定方法是:根据如上计算方法获得的13种时序关系,基于正向和反向时序关系建立多个独立的用户场景之间的链式串联表达图,并在邻接边上标注概率信息。

进一步地,所述的自动时序创建个人场景串联多维度特征图谱的方法,其特征在于,其中:

所述预设时间段,可由用户自定义。

本发明还提出一种自动创建的个人场景图谱的装置,包括:

多层次场景标签库单元,预设有多层次场景标签,并在各标签下预设存储对应的场景标签值的存储位;

预设计算规则模型单元,其上存储有与多层次场景标签库中的场景标签对应的场景逻辑关系、场景间的关联概率计算规则、以及场景之间的时序关系、链式串联表达关系;

时间段预设单元,允许用户设置用于采集建立个人场景图谱的数据的时间长度;

场景标签值采集单元,用于根据多层次场景标签库中的场景标签,采集用户在预设时间段内,所处的各类场景标签值;

用户个人场景生成单元,用于根据已经存储到多层次场景标签库中的各场景标签值,调取预设的场景逻辑关系,组成对用户个人场景的描述;

相邻场景间关联概率计算单元,用于对时间上相邻的用户个人场景,计算其相邻发生的概率;

用户个人场景图谱生成单元,用于根据一定时间段内,基于正向和反向时序关系,建立多个独立的用户个人场景之间的链式串联表达,并在邻接边上标注概率信息,形成用户个人场景图谱。

进一步地,所述的自动创建的个人场景图谱的装置,所述场景标签值采集单元包括:

场景标签值直接采集单元,用于针对用户画像、时间、地点、天气场景标签对应的场景标签值进行直接采集;

第二场景标签值采集单元,用于针对无法直接采集的场景标签对应的场景标签值进行计算获得;

云服务器,所述云服务器为区块链云服务器,包括私有区块链设备、公有区块链设备、节点服务器、中央服务器、硬件防火墙、区块链存储模块、发送模块和接收模块;其中私有区块链设备、公有区块链设备通过区块链存储模块存储个人的公有和私有的事件采集数据,实时的通过发送模块分布式发送到节点服务器中,通过接收模块接受实时采集的事件数据并通过节点服务器上传到中央服务器中,所述云服务器还包括硬件防火墙;区块链存储模块中数据划分为区块链备份模块、区块链隔离模块和区块链节点模块,即将现有区块链数据按照功能隔离为单独的模块,区块链节点模块可以设置在不同的节点服务器中,支持跨网络访问,在某个模块出现运行错误时,区块链备份模块、区块链隔离模块可以针对单一模块进行升级修复更新。

本发明还提出一种自动创建的个人场景图谱的应用,将所述的自动创建的个人场景图谱应用于个性化推荐系统。

进一步地,所述的自动创建的个人场景图谱的应用,通过所述的个人场景图谱,实现用户行为预测,根据预测结果,实现个性化推荐。

本发明的有益效果是:本发明通过组建预设多层次场景标签库;获取并计算用户的人、时间、天气、地点的多层次场景标签值,生成用户的个人场景;研究得到的用户模型的过程中主题数量丰富,解决了原始数据的稀疏性;基于多个独立的用户个人场景,生成用户个人场景图谱,实现自动创建个人场景图谱,使得功能推荐更具针对性,提升了功能推荐的有效率,使得一些多维新特征场景信息补充通过功能推荐迅速获得大量用户大数据;并应用所述个人场景图谱,实现用户行为预测,根据预测结果,实现推荐个性化。采用图谱特征是通过链接形态更好、直观地理解事物。通过多维度形态相关异构的信息连接在一起而得到的一个拓扑网络,信息样本全面,通过基于正向和反向时序关系的链式串联表达,提供了从“链接”和“发展/传播”的角度去分析问题的能力,根据13种时序关系,基于正向和反向时序关系建立多个独立的用户场景之间的链式串联表达图,并在邻接边上标注概率信息,是关联推理的最直接的表达形式。基于图谱的推荐系统能有效帮助用户快速发现感兴趣和高质量的信息,提升用户体验。利用构建的图谱为深入、准确地理解标签(词条)的语义以及标签之间的语义关联提供了背景知识。而改进的算法模型应用于个性化推荐系统,对生成的数据做滤波、去除伪迹等预处理操作,然后提取数据的人、时间、天气、地点、性别、职业、年龄、实时等特征参数,进行pca相关性主成分分析,提取主成分特征参数,然后训练识别模型,选择径向基函数为核函数的支持向量机作为情绪识别模型,不仅提高了推介效果、精确度,经过前pca主成分分析的特征前处理有利于数据的收敛,而且将其应用于基于标签描述用户场景特征的个性化推荐技术后,推广了个性化推荐在交叉、推理领域的应用场景;所述云服务器为区块链云服务器,包括私有区块链设备、公有区块链设备、节点服务器、中央服务器、硬件防火墙、区块链存储模块、发送模块和接收模块;其中私有区块链设备、公有区块链设备通过区块链存储模块存储个人的公有和私有的事件采集数据,实时的通过发送模块分布式发送到节点服务器中,通过接收模块接受实时采集的事件数据并通过节点服务器上传到中央服务器中,所述云服务器还包括硬件防火墙;区块链存储模块中数据划分为区块链备份模块、区块链隔离模块和区块链节点模块,即将现有区块链数据按照功能隔离为单独的模块,区块链节点模块可以设置在不同的节点服务器中,支持跨网络访问,在某个模块出现运行错误时,区块链备份模块、区块链隔离模块可以针对单一模块进行升级修复更新。

附图说明

图1为本发明的方法流程示意图;

图2为本发明的装置的结构示意图

图3为本发明的精简实施例一的流程示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步说明。

本发明中所出现的特定技术名词解释如下:

场景标签:指用户所处的场景的属性,如:人、时间、天气、地点、性别、职业、年龄、实时状态等;

场景标签值:指用户在所处的场景中对应的属性值,如:人-刘医生、时间-2017.10.1818:00、性别-男、实时状态-心情很好等;

多层次场景标签库:指根据用户所处的场景的属性对用户的场景标签值进行分级管理的数据库,如:一级场景标签-人-刘医生,“人”对应的二级场景标签-性别-男、职业-医生等,“职业”对应的三级场景标签-职位-主任医生、职务-西医外科医生等;

用户个人场景:指用户在某个具体时间上,可获取和计算所有的场景标签对应的场景标签值组合所描述的用户状态,如:秋季星期一的晚餐时间,天气凉爽,用户刘医生待在家里;

用户个人场景图谱:指用户在一定时间长度内多个独立的个人场景,通过基于正向和反向时序关系的链式串联表达,以及经计算获得的相邻场景之间的发生概率,生成对应的图谱。

如附图1所示为一种时序创建个人场景多维度特征图谱的方法,包括:

本发明一方面提出一种时序创建个人场景多维度特征图谱的方法,包括:

步骤1:预设多层次场景标签库,并预设对应的场景逻辑关系、场景间的关联概率计算规则、以及场景之间的时序关系、链式串联表达关系;

步骤2:通过用户手机使用的基站或/和卫星定位系统自动获得获取和/或计算用户的多层次场景标签值,对应存储到预设的多层次场景标签库中,根据预设的所述场景逻辑关系,生成用户个人场景;

步骤3:基于多个独立的用户个人场景,根据场景间的关联概率计算规则,计算预设时间段内多个独立的用户个人场景之间关联概率,根据预设的场景之间的时序关系、链式串联表达关系,生成用户个人场景图谱。

进一步地,所述的自动时序创建个人场景串联多维度特征图谱的方法,其中:

所述多层次场景标签,包括一级场景标签和多级下属场景标签,所述一级场景标签包括人、时间、地点、天气四个标签。

进一步地,所述的自动时序创建个人场景串联多维度特征图谱的方法,其中:

所述人的多层次场景标签值,由预设的用户画像数据库或/和实时计算获得;

所述时间的多层次场景标签值,由系统自动获得;

所述地点的多层次场景标签值,由用户手机使用的基站或/和卫星定位系统自动获得;

所述天气的多层次场景标签值,由系统自动获得。

进一步地,所述的自动时序创建个人场景串联多维度特征图谱的方法,其中:

所述实时计算人的多层次场景标签值是针对无法直接采集的场景标签进行自动获取,步骤为:

a.预设可直接采集的场景标签为第一场景标签,无法直接采集的场景标签为第二场景标签,并建立对应的场景标签条目;

b.根据第二场景标签,

搜索或匹配获得第二场景标签值;

根据第一场景标签推理获得第二场景标签值;

通过对会话内容进行语义推理获得第二场景标签值;

通过获取与会话内容关联的关联词获得第二场景标签值;

根据已训练好的分类器分类获得第二场景标签值;

通过已获得的第二场景标签进一步多层次推理计算获得其他的第二场景标签值;

根据上述方法的任意组合获得第二场景标签值。

进一步地,所述的自动时序创建个人场景串联多维度特征图谱的方法,其中:

所述场景逻辑关系,是在多层次场景标签库的各场景标签之间,定义场景标签获得对应的场景标签值后,用于组成描述用户个人场景的规则;

所述场景间的关联概率计算规则,是根据在一个预设时间段内统计的用户数据,计算一个用户个人场景与时间上相邻的其他用户个人场景之间关联发生的概率。

进一步地,所述的自动时序创建个人场景串联多维度特征图谱的方法,其中:

所述时序关系包括:before:场景在另一个场景之前发生;after:场景在另一个场景之后发生;includes:一个场景包含另一个场景;is_included:一个场景被另一个场景包含;during:一个场景在一段时间内保持一个状态;simultane-ous:同时发生;iafter:场景紧跟另一个场景发生,且它们不重叠、不间断;ibe-fore:场景在另一个场景之前发生,且它们不重叠、不间断;1iaentity:表示同一场景;begins:一个场景开始导致另一个场景开始;ends:一个场景结束导致另一个场景结束;begunby:一个场景因另一个场景开始而开始,与begins相对;ended_by:一个场景因另一个场景结束而结束,与ends相对;

所述时序关系的计算方法为:在采集场景的同时,采集场景发生的开始时间点和结束时间点,通过时间计算确定时序关系;

所述链式串联表达关系的确定方法是:根据如上计算方法获得的13种时序关系,通过在一个时间轴上表示场景相邻出现的关系(包括相交、包含、相邻发生、同时发生等等),基于正向和反向时序关系建立多个独立的用户场景之间的链式串联表达图,并在邻接边上标注概率信息。

进一步地,所述的自动时序创建个人场景串联多维度特征图谱的方法,其特征在于,其中:

所述预设时间段,可由用户自定义。

如附图2所示,本发明还提出一种自动创建的个人场景图谱的装置,包括:

多层次场景标签库单元,预设有多层次场景标签,并在各标签下预设存储对应的场景标签值的存储位;

预设计算规则模型单元,其上存储有与多层次场景标签库中的场景标签对应的场景逻辑关系、场景间的关联概率计算规则、以及场景之间的时序关系、链式串联表达关系;

时间段预设单元,允许用户设置用于采集建立个人场景图谱的数据的时间长度;

场景标签值采集单元,用于根据多层次场景标签库中的场景标签,采集用户在预设时间段内,所处的各类场景标签值;

用户个人场景生成单元,用于根据已经存储到多层次场景标签库中的各场景标签值,调取预设的场景逻辑关系,组成对用户个人场景的描述;

相邻场景间关联概率计算单元,用于对时间上相邻的用户个人场景,计算其相邻发生的概率;

用户个人场景图谱生成单元,用于根据一定时间段内,基于正向和反向时序关系,建立多个独立的用户个人场景之间的链式串联表达,并在邻接边上标注概率信息,形成用户个人场景图谱。

进一步地,所述的自动创建的个人场景图谱的装置,所述场景标签值采集单元包括:

场景标签值直接采集单元,用于针对用户画像、时间、地点、天气场景标签对应的场景标签值进行直接采集;

第二场景标签值采集单元,用于针对无法直接采集的场景标签对应的场景标签值进行计算获得;

云服务器;所述云服务器为区块链云服务器,包括私有区块链设备、公有区块链设备、节点服务器、中央服务器、硬件防火墙、区块链存储模块、发送模块和接收模块;其中私有区块链设备、公有区块链设备通过区块链存储模块存储个人的公有和私有的事件采集数据,实时的通过发送模块分布式发送到节点服务器中,通过接收模块接受实时采集的事件数据并通过节点服务器上传到中央服务器中,所述云服务器还包括硬件防火墙;区块链存储模块中数据划分为区块链备份模块、区块链隔离模块和区块链节点模块,即将现有区块链数据按照功能隔离为单独的模块,区块链节点模块可以设置在不同的节点服务器中,支持跨网络访问,在某个模块出现运行错误时,区块链备份模块、区块链隔离模块可以针对单一模块进行升级修复更新。

本发明还提出一种自动创建的个人场景图谱的应用,将所述的自动创建的个人场景图谱应用于个性化推荐系统。

进一步地,所述的自动创建的个人场景图谱的应用,通过所述的个人场景图谱,实现用户行为预测,根据预测结果,实现个性化推荐。

精简实施例一

如附图3所示,一种时序创建个人场景多维度特征图谱的方法,包括:

步骤1:预设多层次场景标签库,并预设对应的场景逻辑关系、场景间的关联概率计算规则、以及场景之间的时序关系、链式串联表达关系,所述多层次场景标签,包括一级场景标签和多级下属场景标签,所述一级场景标签包括人、时间、地点、天气四个标签;

具体地,在本实施例中,对所述预设多层次场景标签库,做如下设计:

1.人是一级场景标签,预设对应的标签条目;其包含二级场景标签:性别/职业/婚姻状态/年龄/健康状况/心情,预设对应的标签条目;二级场景标签中的医生包含三级场景标签:职务/职位,预设对应的标签条目,所有预设的标签条目按照逻辑从属关系排列建库。

2.时间是一级场景标签;其包含二级场景标签:季节/年中状态/生日/工作日;二级场景标签中的工作日包含三级场景标签:上午上班时段/下午上班时段;三级场景标签中的上午上班时段包含四级场景标签:刚上班时段/快下班时段,预设对应的标签条目,所有预设的标签条目按照逻辑从属关系排列建库。

3.地点是一级场景标签;其包含二级场景标签:家里/公司/餐厅/电影院;二级场景标签中的餐厅包含三级场景标签:西餐厅/中餐厅;三级场景标签中的中餐厅包含四级场景标签:湘菜馆/川菜馆,预设对应的标签条目,所有预设的标签条目按照逻辑从属关系排列建库。

4.天气是一级场景标签;其包含二级场景标签:好天气/不好天气/气候灾难;二级场景标签中不好天气包含三级场景标签:气象/温度/风力,预设对应的标签条目,所有预设的标签条目按照逻辑从属关系排列建库。

步骤2:通过用户手机使用的基站或/和卫星定位系统自动获得获取和/或计算用户的多层次场景标签值,对应存储到预设的多层次场景标签库中,根据预设的所述场景逻辑关系,生成用户个人场景,所述人的多层次场景标签值,由预设的用户画像数据库或/和实时计算获得,所述时间的多层次场景标签值,由系统自动获得,所述地点的多层次场景标签值,由用户手机使用的基站或/和卫星定位系统自动获得,所述天气的多层次场景标签值,由系统自动获得,所述场景逻辑关系,是在多层次场景标签库的各场景标签之间,定义场景标签获得对应的场景标签值后,用于组成描述用户个人场景的规则;

在本实施例中,针对用户刘医生,获得如下场景标签值:

1.所述人的多层次场景标签值,由预设的用户画像数据库或/和实时计算获得:

一级场景标签对应的场景标签值为:人-刘医生;

二级场景标签对应的场景标签值为:性别-男、职业-医生、婚姻状态-已婚、年龄-40岁、健康状况-实时身体健康、心情-实时心情很好;

二级场景标签中的医生包含的三级场景标签对应的场景标签值为:职位-主任医生、职务-西医外科医生。

2.所述时间的多层次场景标签值,由系统自动获得:

一级场景标签对应的场景标签值为:时间-2017/08/2009:00;

二级场景标签对应的场景标签值为:季节-夏季、年中状态-非年头年尾、生日-1、工作日-1;

二级场景标签中的工作日包含三级场景标签对应的场景标签值为:上午上班时段-1、下午上班时段-0;

三级场景标签中的上午上班时段包含的四级场景标签对应的场景标签值为:刚上班时段-1、快下班时段-0。

3.所述地点的多层次场景标签值,由用户手机使用的基站或/和卫星定位系统自动获得:

一级场景标签对应的场景标签值为:地点-**省**市集贤路2号;

二级场景标签对应的场景标签值为:家里-0、公司-1、餐厅-0、电影院-0;

二级场景标签公司下未设置三级场景标签,所以地点的多层次场景标签值获取完成。

4.所述天气的多层次场景标签值,由系统自动获得:

一级场景标签对应的场景标签值为:天气-暴雨,气温30℃,5级大风;

二级场景标签对应的场景标签值为:好天气-0、不好天气-1、气候灾难-0;

二级场景标签中不好天气包含三级场景标签:气象-暴雨、温度-寒冷、风力-5级大风;

5.根据预设的所述场景逻辑关系,生成用户个人场景:

所述用户个人场景,是指由多个多层次场景标签组合描述的用户状态,如上所述的多层次场景标签值获得后,可根据场景逻辑关系,建立个场景标签值之间的组合关系,生成对应的用户个人场景:刘医生,男,40岁,已婚,身体健康,在夏季工作日上午生日当天在公司,心情很好。

步骤3:基于多个独立的用户个人场景,根据场景间的关联概率计算规则,计算预设时间段内多个独立的用户个人场景之间关联概率,根据预设的场景之间的时序关系、链式串联表达关系,生成用户个人场景图谱,所述场景间的关联概率计算规则,是根据在一个预设时间段内统计的用户数据,计算一个用户的个人场景与时间上相邻的其他用户个人场景之间关联发生的概率,所述场景之间的链式串联表达关系是,根据13种时序关系,基于正向和反向时序关系建立多个独立的用户场景之间的链式串联表达图,并在邻接边上标注概率信息,所述预设时间段,可由用户自定义;

例如:用户刘医生自定义记录夏季7-9月的所有用户个人场景,然后系统依据所有这些相互独立的用户个人场景,统计相邻场景之间的发生概率,如刘医生下午在公司上班的场景,这个场景之前的场景是中餐时间在餐厅,概率是70%;之后的场景是在家里,概率是90%,将所记录的时间段内的所有这些相互独立的用户个人场景,组成基于正向和反向时序关系的链式串联表达,以及经计算获得的相邻场景之间的发生概率标注在链式串联表达的边上,生成用户个人场景图谱。

精简实施例二

步骤1:预设多层次场景标签库,并预设对应的场景逻辑关系、场景间的关联概率计算规则、以及场景之间的时序关系、链式串联表达关系,所述多层次场景标签,包括一级场景标签和多级下属场景标签,所述一级场景标签包括人、时间、地点、天气四个标签;

具体地,在本实施例中,对所述预设多层次场景标签库,做如下设计:

1.人是一级场景标签,预设对应的标签条目;其包含二级场景标签:性别/职业/婚姻状态/年龄/健康状况/心情/活动,预设对应的标签条目;二级场景标签中的医生包含三级场景标签:职务/职位/工作单位/工作地址,预设对应的标签条目,所有预设的标签条目按照逻辑从属关系排列建库。

2.时间是一级场景标签;其包含二级场景标签:季节/年中状态/生日/工作日;二级场景标签中的工作日包含三级场景标签:上午上班时段/下午上班时段;三级场景标签中的上午上班时段包含四级场景标签:刚上班时段/快下班时段,预设对应的标签条目,所有预设的标签条目按照逻辑从属关系排列建库。

3.地点是一级场景标签;其包含二级场景标签:家里/公司/餐厅/电影院;二级场景标签中的餐厅包含三级场景标签:西餐厅/中餐厅;三级场景标签中的中餐厅包含四级场景标签:湘菜馆/川菜馆,预设对应的标签条目,所有预设的标签条目按照逻辑从属关系排列建库。

4.天气是一级场景标签;其包含二级场景标签:好天气/不好天气/气候灾难;二级场景标签中不好天气包含三级场景标签:气象/温度/风力,预设对应的标签条目,所有预设的标签条目按照逻辑从属关系排列建库。

步骤2:通过用户手机使用的基站或/和卫星定位系统自动获得获取和/或计算用户的多层次场景标签值,对应存储到预设的多层次场景标签库中,根据预设的所述场景逻辑关系,生成用户个人场景,所述人的多层次场景标签值,由预设的用户画像数据库或/和实时计算获得,所述时间的多层次场景标签值,由系统自动获得,所述地点的多层次场景标签值,由用户手机使用的基站或/和卫星定位系统自动获得,所述天气的多层次场景标签值,由系统自动获得,所述场景逻辑关系,是在多层次场景标签库的各场景标签之间,定义场景标签获得对应的场景标签值后,用于组成描述用户个人场景的规则;

所述实时计算人的多层次场景标签值是针对无法直接采集的场景标签进行自动获取,步骤为:

a.预设可直接采集的场景标签为第一场景标签,无法直接采集的场景标签为第二场景标签,并建立对应的场景标签条目;

b.根据第二场景标签,

搜索或匹配获得第二场景标签值;

根据第一场景标签值推理获得第二场景标签值;

通过对会话内容进行语义推理获得第二场景标签值;

通过获取与会话内容关联的关联词获得第二场景标签值;

根据已训练好的分类器分类获得第二场景标签值;

通过已获得的第二场景标签进一步多层次推理计算获得其他的第二场景标签值;

根据上述方法的任意组合获得第二场景标签值。

在本实施例中,针对用户刘医生,获得如下场景标签值:

1所述人的多层次场景标签值,由预设的用户画像数据库或/和实时计算获得;

所述预设的用户画像数据库是指预先建立的用户画像数据库,用户在进行活动时,系统获取用户的场景信息,利用hbase分布式高写入的特性,将数据写入到hbase中,通过不同场景的特点,关联到用户身份;并据此建立相应的用户画像数据库,利用分布式技术,实现列式存储的数据库功能,对于在线情况发生的高速读和高速写进行支持,提高系统对用户操作的推荐响应性能,然后从所述用户画像数据库中获取用户场景标签对应的场景标签值,如关于刘医生在用户画像数据库中已获得刘医生的工作地址为**省**市集贤路2号,工作单位为**市第二医院,则获取对应的值作为工作地址和工作单位两个场景标签对应的场景标签值。

本实施例根据第二场景标签,搜索或匹配获得第二场景标签值,具体是将第二场景标签与大数据或互联网数据进行匹配的方式获得第二场景标签值,例如针对性别场景标签,只需采用正则表达式“性别*”与用户的基本信息进行匹配,就能获得与性别场景标签对应的结果,对于年龄、兴趣爱好、星座、血型、职业等第二场景标签,也可以采用正则表达式或其他匹配技术获得;

本实施例中,第一场景标签值可以直接采集获得,故本实施例可以根据第一场景标签值推理获得第二场景标签值,具体地,首先预设场景标签推理规则,然后根据第一场景标签值以及预设的场景标签推理规则,获得第二场景标签值,例如可以根据已采集的第一场景标签值(例如时间、地点场景标签)以及预设的场景推理规则(例如当地点是超市,时间为上午,则用户活动为超市购物);

本实施例通过获取用户与人会话时的会话内容,分析用户的实时状态,如健康状况、心情等,如用户与人聊天中提及“哎,今天感冒了,真难受”,即可判断用户的健康状况为生病;

本实施例中,其他第二场景标签值的获取。

步骤3:基于多个独立的用户个人场景,根据场景间的关联概率计算规则,计算预设时间段内多个独立的用户个人场景之间关联概率,根据预设的场景之间的时序关系、链式串联表达关系,生成用户个人场景图谱,所述场景间的关联概率计算规则,是根据在一个预设时间段内统计的用户数据,计算一个用户的个人场景与时间上相邻的其他用户个人场景之间发生的概率,所述场景之间的链式串联表达关系是,根据13种时序关系,基于正向和反向时序关系建立多个独立的用户场景之间的链式串联表达图,并在邻接边上标注概率信息,所述预设时间段,可由用户自定义;

例如:用户刘医生自定义记录夏季7-9月的所有用户个人场景,然后系统依据所有这些相互独立的用户个人场景,统计相邻场景之间的发生概率,如刘医生下午在公司上班的场景,这个场景之前的场景是中餐时间在餐厅,概率是70%;之后的场景是在家里,概率是90%,将所记录的时间段内的所有这些相互独立的用户个人场景,组成基于正向和反向时序关系的链式串联表达(如中餐时间在餐厅与在家里这两个场景在时间轴上表示为一前一后的关系),以及经计算获得的相邻场景之间的发生概率标注在链式串联表达的边上,生成用户个人场景图谱。

精简实施例三

本发明还提出一种自动创建的个人场景图谱的应用,将所述的自动创建的个人场景图谱应用于个性化推荐系统,通过所述的个人场景图谱,实现用户行为预测,根据预测结果,实现个性化推荐。

本实施例中,创建好的个人场景图谱存储在服务器上,与用户终端关联,当用户使用如移动终端进行某种操作时,系统自动获取用户即时所处的场景,获取对应的场景标签值,然后从服务器上存储的用户个人场景图谱中,匹配最相近的一个个人场景,根据这个个人场景在用户个人场景图谱中的位置,预测用户的行为,并据此实现个性化推荐。例如用户刘医生在周一-周四下班后直接回家的概率是90%,周五则由有80%的概率会去外面的餐厅吃饭、之后从事看电影或其他娱乐活动,则在用户刘医生周五下班前后查看手机,使用浏览器或其他工具上网时,可以优先推荐餐厅、电影院等场所,为用户接下来的行程提供选择。

本发明未涉及部分均与现有技术相同或可采用现有技术加以实现。

以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,对前述实施例记载的技术方案进行修改或轻易想到的变化,或者对其中部分技术特征进行等同替换,而这些修改、变化或替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1