身心状态知识图谱的生成方法、装置、设备及存储介质与流程

文档序号:31334303发布日期:2022-08-31 08:13阅读:51来源:国知局
身心状态知识图谱的生成方法、装置、设备及存储介质与流程

1.本发明涉及知识图谱技术领域,尤其涉及一种身心状态知识图谱的生成方法、装置、设备及存储介质。


背景技术:

2.随着互联网技术的发展和人们生活水平的提高,越来越多的身心状态数据被数字化处理并记录,这些数据越丰富,对人们身心状态的分析便越准确。
3.现有技术在进行身心状态数据分析时,通常是基于单方面的数据进行特征分析,例如用户的调查问卷、用户画像数据等,存在过于片面的技术缺陷,并且缺乏一种综合数据分析方法,导致现有技术在进行身心状态数据分析时难以反映数据之间的关系,准确率较低。


技术实现要素:

4.本发明提供了一种身心状态知识图谱的生成方法、装置、设备及存储介质,用于提高身心状态数据分析的准确率。
5.本发明第一方面提供了一种身心状态知识图谱的生成方法,包括:
6.获取目标用户的身心状态调查问卷信息,并根据所述身心状态调查问卷信息生成身心状态调查数据;
7.获取用户画像数据,并对所述用户画像数据进行身心状态特征提取,得到身心状态特征数据;
8.获取用户生活行为数据,并对所述用户生活行为数据进行聚类分析,得到生活习惯特征数据;
9.对所述身心状态调查数据、所述身心状态特征数据和所述生活习惯特征数据进行实体关系识别,并生成所述目标用户的身心状态知识图谱数据。
10.可选的,在本发明第一方面的第一种实现方式中,所述获取目标用户的身心状态调查问卷信息,并根据所述身心状态调查问卷信息生成身心状态调查数据,包括:
11.获取目标用户的身心状态调查问卷信息,所述身心状态调查问卷信息包括身体状态问卷信息、精神状态问卷信息、睡眠状态问卷信息、情绪状态问卷信息、营养状态问卷信息和运动状态问卷信息;
12.通过预置的标准选项,对所述身体状态问卷信息、所述精神状态问卷信息、所述睡眠状态问卷信息、所述情绪状态问卷信息、所述营养状态问卷信息和所述运动状态问卷信息进行问题主体的非标准选择关联,得到身心状态调查数据,所述身心状态数据用于指示所述身心状态调查问卷信息中非标准选择与问题主体的关联关系。
13.可选的,在本发明第一方面的第二种实现方式中,所述获取用户画像数据,并对所述用户画像数据进行身心状态特征提取,得到身心状态特征数据,包括:
14.获取用户画像数据,并提取所述用户画像数据中的身心状态标签和用户基本信息
标签;
15.通过预先训练的身心状态特征识别模型对所述身心状态标签和所述用户基本信息标签进行身心状态实体识别和特征融合,得到身心状态特征数据,所述身心状态特征识别模型包括多层感知机。
16.可选的,在本发明第一方面的第三种实现方式中,所述获取用户生活行为数据,并对所述用户生活行为数据进行聚类分析,得到生活习惯特征数据,包括:
17.获取生活行为记录工具采集的用户生活行为数据,所述用户生活行为数据包括预置周期内的至少一项行为记录数据,行为记录数据为饮食记录数据、运动记录数据、睡眠记录数据、体态记录数据和体脂记录数据;
18.通过预置的聚类算法分别对每项行为记录数据进行数据聚类,得到各项行为记录数据对应的生活习惯聚类结果;
19.对各项行为记录数据进行实体识别,得到行为实体信息,并通过所述行为实体信息和各项行为记录数据对应的生活习惯聚类结果生成生活习惯特征数据,所述生活习惯特征数据用于指示行为实体信息与生活习惯聚类结果之间的关系。
20.可选的,在本发明第一方面的第四种实现方式中,所述通过预置的聚类算法分别对每项行为记录数据进行数据聚类,得到各项行为记录数据对应的生活习惯聚类结果,包括:
21.通过预置的聚类算法确定各项行为记录数据对应的聚类滑动窗口半径,并通过聚类滑动窗口半径对各项行为记录数据进行密集区域采集,得到各项行为记录数据对应的密集数据集,所述聚类算法用于指示均值漂移聚类算法;
22.对各项行为记录数据对应的密集数据集进行均值计算,得到各项行为记录数据对应的生活习惯聚类结果。
23.可选的,在本发明第一方面的第五种实现方式中,所述对所述身心状态调查数据、所述身心状态特征数据和所述生活习惯特征数据进行实体关系识别,并生成所述目标用户的身心状态知识图谱数据,包括:
24.通过预先训练的实体抽取模型中的知识库对所述身心状态调查数据、所述身心状态特征数据和所述生活习惯特征数据进行实体抽取,得到目标实体信息;
25.基于所述目标实体信息,通过预先训练的知识关系抽取模型对所述身心状态调查数据、所述身心状态特征数据和所述生活习惯特征数据进行实体关系抽取和事实关系抽取,得到目标实体关系信息和目标事实关系信息;
26.对所述目标实体信息、所述目标实体关系信息和所述目标事实关系信息进行知识图谱构建,得到目标用户的身心状态知识图谱数据。
27.可选的,在本发明第一方面的第六种实现方式中,所述知识关系抽取模型包括词嵌入网络、单序列长短期记忆循环神经网络和基于依存关系的长短期记忆循环神经网络,所述基于所述目标实体信息,通过预先训练的知识关系抽取模型对所述身心状态调查数据、所述身心状态特征数据和所述生活习惯特征数据进行实体关系抽取和事实关系抽取,得到目标实体关系信息和目标事实关系信息,包括:
28.通过所述词嵌入网络对所述身心状态调查数据、所述身心状态特征数据和所述生活习惯特征数据进行嵌入词转换,得到目标嵌入词信息;
29.基于所述目标实体信息,通过所述单序列长短期记忆循环神经网络和所述基于依存关系的长短期记忆循环神经网络,基于所述目标实体信息对所述目标嵌入词信息进行联合关系特征抽取,得到目标实体关系信息和目标事实关系信息。
30.本发明第二方面提供了一种身心状态知识图谱的生成装置,包括:
31.获取模块,用于获取目标用户的身心状态调查问卷信息,并根据所述身心状态调查问卷信息生成身心状态调查数据;
32.提取模块,用于获取用户画像数据,并对所述用户画像数据进行身心状态特征提取,得到身心状态特征数据;
33.聚类模块,用于获取用户生活行为数据,并对所述用户生活行为数据进行聚类分析,得到生活习惯特征数据;
34.生成模块,用于对所述身心状态调查数据、所述身心状态特征数据和所述生活习惯特征数据进行实体关系识别,并生成所述目标用户的身心状态知识图谱数据。
35.可选的,在本发明第二方面的第一种实现方式中,所述获取模块具体用于:
36.获取目标用户的身心状态调查问卷信息,所述身心状态调查问卷信息包括身体状态问卷信息、精神状态问卷信息、睡眠状态问卷信息、情绪状态问卷信息、营养状态问卷信息和运动状态问卷信息;
37.通过预置的标准选项,对所述身体状态问卷信息、所述精神状态问卷信息、所述睡眠状态问卷信息、所述情绪状态问卷信息、所述营养状态问卷信息和所述运动状态问卷信息进行问题主体的非标准选择关联,得到身心状态调查数据,所述身心状态数据用于指示所述身心状态调查问卷信息中非标准选择与问题主体的关联关系。
38.可选的,在本发明第二方面的第二种实现方式中,所述提取模块具体用于:
39.获取用户画像数据,并提取所述用户画像数据中的身心状态标签和用户基本信息标签;
40.通过预先训练的身心状态特征识别模型对所述身心状态标签和所述用户基本信息标签进行身心状态实体识别和特征融合,得到身心状态特征数据,所述身心状态特征识别模型包括多层感知机。
41.可选的,在本发明第二方面的第三种实现方式中,所述聚类模块包括:
42.获取单元,用于获取生活行为记录工具采集的用户生活行为数据,所述用户生活行为数据包括预置周期内的至少一项行为记录数据,行为记录数据为饮食记录数据、运动记录数据、睡眠记录数据、体态记录数据和体脂记录数据;
43.聚类单元,用于通过预置的聚类算法分别对每项行为记录数据进行数据聚类,得到各项行为记录数据对应的生活习惯聚类结果;
44.识别单元,用于对各项行为记录数据进行实体识别,得到行为实体信息,并通过所述行为实体信息和各项行为记录数据对应的生活习惯聚类结果生成生活习惯特征数据,所述生活习惯特征数据用于指示行为实体信息与生活习惯聚类结果之间的关系。
45.可选的,在本发明第二方面的第四种实现方式中,所述聚类单元具体用于:
46.通过预置的聚类算法确定各项行为记录数据对应的聚类滑动窗口半径,并通过聚类滑动窗口半径对各项行为记录数据进行密集区域采集,得到各项行为记录数据对应的密集数据集,所述聚类算法用于指示均值漂移聚类算法;
47.对各项行为记录数据对应的密集数据集进行均值计算,得到各项行为记录数据对应的生活习惯聚类结果。
48.可选的,在本发明第二方面的第五种实现方式中,所述生成模块包括:
49.抽取单元,用于通过预先训练的实体抽取模型中的知识库对所述身心状态调查数据、所述身心状态特征数据和所述生活习惯特征数据进行实体抽取,得到目标实体信息;
50.生成单元,用于基于所述目标实体信息,通过预先训练的知识关系抽取模型对所述身心状态调查数据、所述身心状态特征数据和所述生活习惯特征数据进行实体关系抽取和事实关系抽取,得到目标实体关系信息和目标事实关系信息;
51.构建单元,用于对所述目标实体信息、所述目标实体关系信息和所述目标事实关系信息进行知识图谱构建,得到目标用户的身心状态知识图谱数据。
52.可选的,在本发明第二方面的第六种实现方式中,所述知识关系抽取模型包括词嵌入网络、单序列长短期记忆循环神经网络和基于依存关系的长短期记忆循环神经网络,所述生成单元具体用于:
53.通过所述词嵌入网络对所述身心状态调查数据、所述身心状态特征数据和所述生活习惯特征数据进行嵌入词转换,得到目标嵌入词信息;
54.基于所述目标实体信息,通过所述单序列长短期记忆循环神经网络和所述基于依存关系的长短期记忆循环神经网络,基于所述目标实体信息对所述目标嵌入词信息进行联合关系特征抽取,得到目标实体关系信息和目标事实关系信息。
55.本发明第三方面提供了一种身心状态知识图谱的生成设备,包括:存储器和至少一个处理器,所述存储器中存储有计算机程序;所述至少一个处理器调用所述存储器中的所述计算机程序,以使得所述身心状态知识图谱的生成设备执行上述的身心状态知识图谱的生成方法。
56.本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,当其在计算机上运行时,使得计算机执行上述的身心状态知识图谱的生成方法。
57.本发明提供的技术方案中,获取目标用户的身心状态调查问卷信息,并根据所述身心状态调查问卷信息生成身心状态调查数据;获取用户画像数据,并对所述用户画像数据进行身心状态特征提取,得到身心状态特征数据;获取用户生活行为数据,并对所述用户生活行为数据进行聚类分析,得到生活习惯特征数据;对所述身心状态调查数据、所述身心状态特征数据和所述生活习惯特征数据进行实体关系识别,并生成所述目标用户的身心状态知识图谱数据。本发明实施例中,为了多维度地对用户身心状态进行分析,获取目标用户的身心状态调查问卷信息、用户画像数据和用户生活行为数据进行身心状态特征识别,得到身心状态调查数据、身心状态特征数据以及生活习惯特征数据,最后对这些数据进行实体关系识别,得到目标用户的身心状态知识图谱数据,本发明可以提高身心状态数据分析的准确率。
附图说明
58.图1为本发明实施例中身心状态知识图谱的生成方法的一个实施例示意图;
59.图2为本发明实施例中身心状态知识图谱的生成方法的另一个实施例示意图;
60.图3为本发明实施例中身心状态知识图谱的生成装置的一个实施例示意图;
61.图4为本发明实施例中身心状态知识图谱的生成装置的另一个实施例示意图;
62.图5为本发明实施例中身心状态知识图谱的生成设备的一个实施例示意图。
具体实施方式
63.本发明实施例提供了一种身心状态知识图谱的生成方法、装置、设备及存储介质,用于提高身心状态数据分析的准确率。
64.本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
65.可以理解的是,本发明的执行主体可以为身心状态知识图谱的生成装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。
66.为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中身心状态知识图谱的生成方法的一个实施例包括:
67.101、获取目标用户的身心状态调查问卷信息,并根据身心状态调查问卷信息生成身心状态调查数据;
68.需要说明的是,目标用户用于指示待分析的用户,为了综合分析单个用户的身心状态信息,服务器获取该目标用户的身心状态调查问卷信息,身心状态调查问卷信息包括多个身心状态相关的提问和各提问对应的用户选项,例如,身心状态调查问卷信息中一个身心状态相关的提问为:“您每天大概睡多久?”,该提问对应的用户选项可以为“小于5小时”、“5-7小时”、“7-9小时”、“9小时以上”等,具体此处不做限定。
69.在一种实施方式中,服务器根据身心状态调查问卷信息中每个提问对应的关键词信息,构建关键词信息与对应用户选项之间的关联关系,得到身心状态调查数据。例如,身心状态调查问卷信息中一个身心状态相关的提问为:“您每周锻炼的频率为?”,假设该提问对应的关键词信息为“锻炼频率”,用户选项为“低于1次”,那么,关键词信息与对应用户选项之间的关联关系则可以为“锻炼频率
”‑“
《1次/周”,得到的身心状态调查数据包含该关联关系,具体此处不做限定。本实施方式能够准确地提取调查问卷中的关键信息,从而提高身心状态数据分析的准确度。
70.102、获取用户画像数据,并对用户画像数据进行身心状态特征提取,得到身心状态特征数据;
71.需要说明的是,由于用户画像数据也能够一定程度地反映用户的身心状态,因此,通过增加身心状态数据分析的维度,能够提高身心状态数据分析的准确度。例如,目标用户的用户画像数据指示目标用户目前处于失业状态且有房贷压力、或指示目标用户为高收入群体且无贷款压力,那么,处于失业状态且有房贷压力的身心状态特征数据则可能是“焦虑”,说明目标用户可能处于情感焦虑心理状态,而高收入群体且无贷款压力的身心状态特
征数据则可能是“非焦虑”,说明该目标用户未处于焦虑心理状态,具体此处不做限定。
72.在一种实施方式中,服务器获取用户画像数据之后,基于预置的多个身心状态分类标签,提取用户画像数据中各身心状态分类标签对应的身心状态数据,并对各身心状态分类标签对应的身心状态数据进行身心状态分类,得到身心状态特征数据,身心状态特征数据用于指示身心状态分类结果。例如,一个身心状态分类标签为“是否有焦虑情绪”,那么,通过对该身心状态分类标签对应的身心状态数据进行身心状态分类,得到的身心状态特征数据可以为“无焦虑情绪”,也可以为“有焦虑情绪”。进一步的,对各身心状态分类标签对应的身心状态数据进行身心状态分类,得到身心状态特征数据包括:对各身心状态分类标签对应的身心状态数据进行打分,得到身心状态分值,并通过身心状态分值确定身心状态分类结果,身心状态分类结果用于指示身心状态特征数据。例如,假设一个身心状态分类标签为“是否有焦虑情绪”,身心状态分值为88分,那么,该身心状态分值可以指示目标用户具体焦虑情绪的概率为88%,那么,该身心状态分值确定的身心状态分类结果可以为具有该身心状态分类标签对应的身心状态,即具有焦虑情绪,具体此处不做限定。
73.103、获取用户生活行为数据,并对用户生活行为数据进行聚类分析,得到生活习惯特征数据;
74.需要说明的是,用户生活行为数据用于指示目标用户预置时段内的生活行为轨迹,例如,2022年3月1日08:00起床、09:00-10:00跑步、13:00-14:00午休、22:00入睡等,具体此处不做限定,随着生活行为记录工具(如运动手环、饮食记录软件、记账软件、外卖软件等)的发展和普及,用户生活行为数据可以通过这些生活行为记录工具获取,用于用户生活习惯分析。
75.在一种实施方式中,服务器通过基于密度的聚类算法对用户生活行为数据进行数据聚类,得到多个数据簇,并对各数据簇进行众数计算,得到各数据簇对应的众数,最后通过各数据簇对应的众数确定生活习惯特征数据。例如,用户生活行为数据的其中一个数据簇为“入睡时间数据簇”,通过对“入睡时间数据簇”进行众数计算,得到目标用户的入睡时间众数可以为“22:00”,那么,最后得到的生活习惯特征数据中则包含“入睡时间=22:00”的数据,具体此处不做限定。
76.104、对身心状态调查数据、身心状态特征数据和生活习惯特征数据进行实体关系识别,并生成目标用户的身心状态知识图谱数据。
77.需要说明的是,为了更直观的反映目标用户的身心状态,通过身心状态调查数据、身心状态特征数据和生活习惯特征数据构建目标用户的身心状态知识图谱数据,身心状态知识图谱数据以结构化的形式描述身心状态实体、事实及关系,例如每天运动的事实与身体状态之间的关系、每天晚上12点以后入睡的事实与情绪状态之间的关系等,具体此处不做限定。
78.在一种实施方式中,服务器通过预先训练的知识图谱构建模型对身心状态调查数据、身心状态特征数据和生活习惯特征数据进行实体识别、事实识别以及实体关系识别,得到目标用户的身心状态知识图谱数据。本实施方式能够准确地构建知识图谱,从而提高身心状态数据分析的准确度。
79.在一种实施方式中,在生成目标用户的身心状态知识图谱数据之后,服务器通过身心状态知识图谱数据绘制目标用户的身心状态知识图谱,以直观地反映目标用户的身心
状态。
80.进一步地,服务器将身心状态知识图谱数据存储于区块链数据库中,具体此处不做限定。
81.本发明实施例中,为了多维度地对用户身心状态进行分析,获取目标用户的身心状态调查问卷信息、用户画像数据和用户生活行为数据进行身心状态特征识别,得到身心状态调查数据、身心状态特征数据以及生活习惯特征数据,最后对这些数据进行实体关系识别,得到目标用户的身心状态知识图谱数据,本发明可以提高身心状态数据分析的准确率。
82.请参阅图2,本发明实施例中身心状态知识图谱的生成方法的另一个实施例包括:
83.201、获取目标用户的身心状态调查问卷信息,并根据身心状态调查问卷信息生成身心状态调查数据;
84.具体的,步骤201包括:获取目标用户的身心状态调查问卷信息,身心状态调查问卷信息包括身体状态问卷信息、精神状态问卷信息、睡眠状态问卷信息、情绪状态问卷信息、营养状态问卷信息和运动状态问卷信息;通过预置的标准选项,对身体状态问卷信息、精神状态问卷信息、睡眠状态问卷信息、情绪状态问卷信息、营养状态问卷信息和运动状态问卷信息进行问题主体的非标准选择关联,得到身心状态调查数据,身心状态数据用于指示身心状态调查问卷信息中非标准选择与问题主体的关联关系。
85.本实施方式中,为了提高身心状态调查的准确度,在制订身心状态调查问卷时将多维度的问卷调查囊括至身心状态调查问卷中,包括身体状态维度、精神状态维度、睡眠状态维度、情绪状态维度、营养状态维度和运动状态维度,从而得到身心状态调查问卷信息中的身体状态问卷信息、精神状态问卷信息、睡眠状态问卷信息、情绪状态问卷信息、营养状态问卷信息和运动状态问卷信息。例如,身体状态温度的提问可以为“您是否患有基础疾病?”、精神状态维度的提问可以为“您是否在早上一想到要去面对一天的工作或学习,就感到非常累?”、睡眠状态维度的提问可以为“您是否经常做梦?”、情绪状态维度的提问可以为“您是否经常处于情绪低沉或闷闷不乐的状态?”、营养状态维度的提问可以为“您是否偏爱某种食物?”、以及运动状态维度的提问可以为“您步行3公里有困难吗?”,具体此处不做限定。
86.本实施方式中,身心状态调查问卷信息中的每个提问对应一个问题主体和标准选项,服务器提取身体状态问卷信息、精神状态问卷信息、睡眠状态问卷信息、情绪状态问卷信息、营养状态问卷信息和运动状态问卷信息中的非标准选择,并将非标准选择与问题主体进行关联,得到身心状态调查数据。例如,提问为“您是否患有基础疾病?”对应的问题主体为“基础疾病”,标准选项为“否”,若身心状态调查问卷信息中的用户选择为“是”,那么,该用户选择则为非标准选择,将“基础疾病”与“是”进行关联,得到“有基础疾病”的身心状态调查数据,具体此处不做限定。
87.202、获取用户画像数据,并对用户画像数据进行身心状态特征提取,得到身心状态特征数据;
88.具体的,步骤202包括:获取用户画像数据,并提取用户画像数据中的身心状态标签和用户基本信息标签;通过预先训练的身心状态特征识别模型对身心状态标签和用户基本信息标签进行身心状态实体识别和特征融合,得到身心状态特征数据,身心状态特征识
别模型包括多层感知机。本实施方式中,为了提高基于用户画像数据的身心状态特征提取的准确度,首先提取用户画像数据中与用户身心状态相关的身心状态标签和用户基本信息标签,再通过预先训练的身心状态特征识别模型中的多层感知机(multilayer perceptron,mlp)对身心状态标签和用户基本信息标签进行身心状态实体识别和特征融合,得到身心状态特征数据,其中,多层感知机也称为人工神经网络(artificial neural network,ann),是一种前向结构的人工神经网络,由多个节点层组成,每一层都全连接到下一层,除了输入节点,每个节点都是一个带有非线性激活函数的神经元,多层感知器能够克服单层感知器无法对线性不可分数据进行识别的弱点,从而提高身心状态特征识别的准确度。
89.203、获取生活行为记录工具采集的用户生活行为数据,用户生活行为数据包括预置周期内的至少一项行为记录数据,行为记录数据为饮食记录数据、运动记录数据、睡眠记录数据、体态记录数据和体脂记录数据;
90.本实施方式中,为了提高通过生活行为数据分析,获得用户生活习惯特征数据的准确度,服务器读取生活行为记录工具采集的用户生活行为数据,用户生活行为数据包括一定周期内的至少一项行为记录数据,即用户生活行为数据包括饮食记录数据、运动记录数据、睡眠记录数据、体态记录数据和体脂记录数据中的至少一项,用于后续的生活习惯分析。
91.204、通过预置的聚类算法分别对每项行为记录数据进行数据聚类,得到各项行为记录数据对应的生活习惯聚类结果;
92.具体的,步骤204包括:通过预置的聚类算法确定各项行为记录数据对应的聚类滑动窗口半径,并通过聚类滑动窗口半径对各项行为记录数据进行密集区域采集,得到各项行为记录数据对应的密集数据集,聚类算法用于指示均值漂移聚类算法;对各项行为记录数据对应的密集数据集进行均值计算,得到各项行为记录数据对应的生活习惯聚类结果。
93.本实施方式中,服务器通过聚类算法中的均值漂移聚类算法对每项行为记录数据进行数据聚类,得到各项行为记录数据对应的密集数据集,具体的,首先通过均值漂移聚类算法计算各项行为记录数据对应的聚类滑动窗口半径,再以各项行为记录数据对应的聚类滑动窗口半径确定各项行为记录数据对应的聚类滑动窗口,并基于各项行为记录数据对应的聚类滑动窗口对各项行为记录数据进行密集区域采集,得到各项行为记录数据对应的密集数据集,密集数据集用于指示行为记录数据中数据密度最大的数据集合,最后,服务器对各项行为记录数据对应的密集数据集进行均值计算,得到各项行为记录数据对应的行为记录均值,并通过各项行为记录数据对应的行为记录均值生成生活习惯聚类结果。例如,一个行为记录数据反映的是目标用户的入睡时刻,那么,入睡时刻对应的密集数据集则包含数据密度最大的入睡时刻数据集合,通过对该密集数据集的均值计算,得到的行为记录均值可以为23:00,说明目标用户几乎每天都在23点左右入睡,则该入睡时刻行为记录数据对应的生活习惯聚类结果则为“23:00”。
94.205、对各项行为记录数据进行实体识别,得到行为实体信息,并通过行为实体信息和各项行为记录数据对应的生活习惯聚类结果生成生活习惯特征数据,生活习惯特征数据用于指示行为实体信息与生活习惯聚类结果之间的关系;
95.本实施方式中,为了确定各项行为记录数据所记录的行为实体,服务器对各项行
为记录数据进行实体识别,得到行为实体信息,如运动行为记录数据对应的行为实体信息可以为“跑步”、“跳绳”等,服务器再将行为实体信息与对应的生活习惯聚类结果进行关联,得到生活习惯特征数据。例如,某一睡眠行为的生活习惯聚类结果为“23:00”,该睡眠行为对应的行为实体为“入睡时刻”,那么,该生活习惯特征数据则为“入睡时刻-23:00”。
96.206、对身心状态调查数据、身心状态特征数据和生活习惯特征数据进行实体关系识别,并生成目标用户的身心状态知识图谱数据。
97.具体的,步骤206包括:通过预先训练的实体抽取模型中的知识库对身心状态调查数据、身心状态特征数据和生活习惯特征数据进行实体抽取,得到目标实体信息;基于目标实体信息,通过预先训练的知识关系抽取模型对身心状态调查数据、身心状态特征数据和生活习惯特征数据进行实体关系抽取和事实关系抽取,得到目标实体关系信息和目标事实关系信息;对目标实体信息、目标实体关系信息和目标事实关系信息进行知识图谱构建,得到目标用户的身心状态知识图谱数据。本实施方式中,为了准确地抽取身心状态调查数据、身心状态特征数据和生活习惯特征数据中的实体信息,服务器通过预先训练的实体抽取模型中的知识库对身心状态调查数据、身心状态特征数据和生活习惯特征数据进行实体抽取,得到目标实体信息,其中,实体抽取模型包括条件随机场(conditional random fields,crf)和长短期记忆(long short-term memory,lstm)网络,能够准确地抽取目标实体信息,从而提高身心状态知识图谱构建的准确度。服务器基于目标实体信息,通过预先训练的知识关系抽取模型对身心状态调查数据、身心状态特征数据和生活习惯特征数据进行目标实体的实体关系抽取和事实关系抽取,得到目标实体关系信息和目标事实关系信息,并对目标实体信息、目标实体关系信息和目标事实关系信息进行知识图谱构建,得到目标用户的身心状态知识图谱数据。
98.进一步的,知识关系抽取模型包括词嵌入网络、单序列长短期记忆循环神经网络和基于依存关系的长短期记忆循环神经网络,基于目标实体信息,通过预先训练的知识关系抽取模型对身心状态调查数据、身心状态特征数据和生活习惯特征数据进行实体关系抽取和事实关系抽取,得到目标实体关系信息和目标事实关系信息,包括:通过词嵌入网络对身心状态调查数据、身心状态特征数据和生活习惯特征数据进行嵌入词转换,得到目标嵌入词信息;基于目标实体信息,通过单序列长短期记忆循环神经网络和基于依存关系的长短期记忆循环神经网络,基于目标实体信息对目标嵌入词信息进行联合关系特征抽取,得到目标实体关系信息和目标事实关系信息。
99.本实施方式中,知识关系抽取模型包括词嵌入(word embedding)网络、单序列长短期记忆循环神经(long short-term memory and recurrent neural network,lstm-rnn)网络和基于依存关系的长短期记忆循环神经网络,为基于深度学习的联合关系抽取模型,服务器首先通过词嵌入网络对身心状态调查数据、身心状态特征数据和生活习惯特征数据进行嵌入词转换,得到目标嵌入词信息,再基于目标实体信息,通过单序列长短期记忆循环神经网络和基于依存关系的长短期记忆循环神经网络,基于目标实体信息对目标嵌入词信息进行联合关系特征抽取,得到目标实体关系信息和目标事实关系信息,最后,构建目标实体信息、目标实体关系信息和目标事实关系信息对应的知识图谱,得到目标用户的身心状态知识图谱数据。本实施方式能够通过深度学习模型准确地进行关系抽取,从而提高身心状态知识图谱构建的准确度。
100.本发明实施例中,为了多维度地对用户身心状态进行分析,获取目标用户的身心状态调查问卷信息、用户画像数据和用户生活行为数据进行身心状态特征识别,得到身心状态调查数据、身心状态特征数据以及生活习惯特征数据,其中,生活习惯特征数据通过聚类算法对用户生活行为数据进行聚类分析得到。最后对这些数据进行实体关系识别,得到目标用户的身心状态知识图谱数据,本发明可以提高身心状态数据分析的准确率。
101.上面对本发明实施例中身心状态知识图谱的生成方法进行了描述,下面对本发明实施例中身心状态知识图谱的生成装置进行描述,请参阅图3,本发明实施例中身心状态知识图谱的生成装置一个实施例包括:
102.获取模块301,用于获取目标用户的身心状态调查问卷信息,并根据所述身心状态调查问卷信息生成身心状态调查数据;
103.提取模块302,用于获取用户画像数据,并对所述用户画像数据进行身心状态特征提取,得到身心状态特征数据;
104.聚类模块303,用于获取用户生活行为数据,并对所述用户生活行为数据进行聚类分析,得到生活习惯特征数据;
105.生成模块304,用于对所述身心状态调查数据、所述身心状态特征数据和所述生活习惯特征数据进行实体关系识别,并生成所述目标用户的身心状态知识图谱数据。进一步地,将身心状态知识图谱数据存储于区块链数据库中,具体此处不做限定。
106.本发明实施例中,为了多维度地对用户身心状态进行分析,获取目标用户的身心状态调查问卷信息、用户画像数据和用户生活行为数据进行身心状态特征识别,得到身心状态调查数据、身心状态特征数据以及生活习惯特征数据,最后对这些数据进行实体关系识别,得到目标用户的身心状态知识图谱数据,本发明可以提高身心状态数据分析的准确率。
107.请参阅图4,本发明实施例中身心状态知识图谱的生成装置的另一个实施例包括:
108.获取模块301,用于获取目标用户的身心状态调查问卷信息,并根据所述身心状态调查问卷信息生成身心状态调查数据;
109.提取模块302,用于获取用户画像数据,并对所述用户画像数据进行身心状态特征提取,得到身心状态特征数据;
110.聚类模块303,用于获取用户生活行为数据,并对所述用户生活行为数据进行聚类分析,得到生活习惯特征数据;
111.生成模块304,用于对所述身心状态调查数据、所述身心状态特征数据和所述生活习惯特征数据进行实体关系识别,并生成所述目标用户的身心状态知识图谱数据。
112.可选的,所述获取模块301具体用于:
113.获取目标用户的身心状态调查问卷信息,所述身心状态调查问卷信息包括身体状态问卷信息、精神状态问卷信息、睡眠状态问卷信息、情绪状态问卷信息、营养状态问卷信息和运动状态问卷信息;
114.通过预置的标准选项,对所述身体状态问卷信息、所述精神状态问卷信息、所述睡眠状态问卷信息、所述情绪状态问卷信息、所述营养状态问卷信息和所述运动状态问卷信息进行问题主体的非标准选择关联,得到身心状态调查数据,所述身心状态数据用于指示所述身心状态调查问卷信息中非标准选择与问题主体的关联关系。
115.可选的,所述提取模块302具体用于:
116.获取用户画像数据,并提取所述用户画像数据中的身心状态标签和用户基本信息标签;
117.通过预先训练的身心状态特征识别模型对所述身心状态标签和所述用户基本信息标签进行身心状态实体识别和特征融合,得到身心状态特征数据,所述身心状态特征识别模型包括多层感知机。
118.可选的,所述聚类模块303包括:
119.获取单元3031,用于获取生活行为记录工具采集的用户生活行为数据,所述用户生活行为数据包括预置周期内的至少一项行为记录数据,行为记录数据为饮食记录数据、运动记录数据、睡眠记录数据、体态记录数据和体脂记录数据;
120.聚类单元3032,用于通过预置的聚类算法分别对每项行为记录数据进行数据聚类,得到各项行为记录数据对应的生活习惯聚类结果;
121.识别单元3033,用于对各项行为记录数据进行实体识别,得到行为实体信息,并通过所述行为实体信息和各项行为记录数据对应的生活习惯聚类结果生成生活习惯特征数据,所述生活习惯特征数据用于指示行为实体信息与生活习惯聚类结果之间的关系。
122.可选的,所述聚类单元3032具体用于:
123.通过预置的聚类算法确定各项行为记录数据对应的聚类滑动窗口半径,并通过聚类滑动窗口半径对各项行为记录数据进行密集区域采集,得到各项行为记录数据对应的密集数据集,所述聚类算法用于指示均值漂移聚类算法;
124.对各项行为记录数据对应的密集数据集进行均值计算,得到各项行为记录数据对应的生活习惯聚类结果。
125.可选的,所述生成模块304包括:
126.抽取单元3041,用于通过预先训练的实体抽取模型中的知识库对所述身心状态调查数据、所述身心状态特征数据和所述生活习惯特征数据进行实体抽取,得到目标实体信息;
127.生成单元3042,用于基于所述目标实体信息,通过预先训练的知识关系抽取模型对所述身心状态调查数据、所述身心状态特征数据和所述生活习惯特征数据进行实体关系抽取和事实关系抽取,得到目标实体关系信息和目标事实关系信息;
128.构建单元3043,用于对所述目标实体信息、所述目标实体关系信息和所述目标事实关系信息进行知识图谱构建,得到目标用户的身心状态知识图谱数据。
129.可选的,所述知识关系抽取模型包括词嵌入网络、单序列长短期记忆循环神经网络和基于依存关系的长短期记忆循环神经网络,所述生成单元3042具体用于:
130.通过所述词嵌入网络对所述身心状态调查数据、所述身心状态特征数据和所述生活习惯特征数据进行嵌入词转换,得到目标嵌入词信息;
131.基于所述目标实体信息,通过所述单序列长短期记忆循环神经网络和所述基于依存关系的长短期记忆循环神经网络,基于所述目标实体信息对所述目标嵌入词信息进行联合关系特征抽取,得到目标实体关系信息和目标事实关系信息。
132.本发明实施例中,为了多维度地对用户身心状态进行分析,获取目标用户的身心状态调查问卷信息、用户画像数据和用户生活行为数据进行身心状态特征识别,得到身心
状态调查数据、身心状态特征数据以及生活习惯特征数据,其中,生活习惯特征数据通过聚类算法对用户生活行为数据进行聚类分析得到。最后对这些数据进行实体关系识别,得到目标用户的身心状态知识图谱数据,本发明可以提高身心状态数据分析的准确率。
133.上面图3和图4从模块化功能实体的角度对本发明实施例中的身心状态知识图谱的生成装置进行详细描述,下面从硬件处理的角度对本发明实施例中身心状态知识图谱的生成设备进行详细描述。
134.图5是本发明实施例提供的一种身心状态知识图谱的生成设备的结构示意图,该身心状态知识图谱的生成设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,cpu)510(例如,一个或一个以上处理器)和存储器520,一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对身心状态知识图谱的生成设备500中的一系列计算机程序操作。更进一步地,处理器510可以设置为与存储介质530通信,在身心状态知识图谱的生成设备500上执行存储介质530中的一系列计算机程序操作。
135.身心状态知识图谱的生成设备500还可以包括一个或一个以上电源540,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口560,和/或,一个或一个以上操作系统531,例如windows serve,mac os x,unix,linux,freebsd等等。本领域技术人员可以理解,图5示出的身心状态知识图谱的生成设备结构并不构成对身心状态知识图谱的生成设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
136.本发明还提供一种计算机设备,所述计算机设备包括存储器和处理器,存储器中存储有计算机可读计算机程序,计算机可读计算机程序被处理器执行时,使得处理器执行上述各实施例中的所述身心状态知识图谱的生成方法的步骤。
137.本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,使得计算机执行所述身心状态知识图谱的生成方法的步骤。
138.进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
139.本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
140.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
141.所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用
时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干计算机程序用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
142.以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1