一种基于领域特征和隐语义分析的科技资源推荐方法

文档序号:9750998阅读:313来源:国知局
一种基于领域特征和隐语义分析的科技资源推荐方法
【技术领域】
[0001 ]本发明涉及科技资源数据处理领域,更具体地,涉及一种基于领域特征和隐语义分析的科技资源推荐方法。
【背景技术】
[0002]知识时代,科技资源在国民经济发展中愈发重要,在科技活动中的共享和利用程度也得到相关部门和企业的高度重视,资源的多维大数据特征得以突显。为改善科技创新环境,为广大科技工作者和科技活动提供强有力的基础条件支撑,该专利研究科技资源推荐方法,适用于科技资源共享平台和科技资源查询推荐系统,为科技资源使用者提供便利,有效提尚科技资源的利用率。
[0003]科技资源具有领域性强、数据分散、地域性强的特点,当前的通用性推荐算法(如用户行为分析、协同过滤技术等)在实际的资源共享平台中的应用效果不佳,资源推荐准确率偏低。隐语义分析技术是一种基于机器学习的一系列方法,具有比较好的理论基础,目前部分算法在推荐系统中已经得到应用和肯定。但是,对于科技资源,目前尚无相关推荐模型,也没有将领域与隐语义分析相结合的算法。

【发明内容】

[0004]本发明提供一种能够有效避免隐语义分析算法存在的冷启动问题的基于领域特征和隐语义分析的科技资源推荐方法。
[0005]为了达到上述技术目的,本发明的技术方案如下:
一种基于领域特征和隐语义分析的科技资源推荐方法,包括以下步骤:
S1:通过对科技资源进行领域聚类,将用户和资源按领域进行有效分类,形得到用户领域和资源领域,并进行预处理得到用户-用户领域数据集、用户领域-资源领域数据集、资源领域-资源数据集;
S2:利用用户领域和资源领域建立基于领域特征和隐语义分析的推荐模型;
S3:获取用户的需求信息,通过建立的基于领域特征和隐语义分析的推荐模型为用户推荐所需的资源。
[0006]进一步地,所述步骤SI的具体过程如下:
定义活跃用户、用户领域、资源领域、热点数据、关注数据、收藏数据、订单数据、日志数据,采用去除稀疏数据,处理缺失值的数据处理技术,获得用户-用户领域数据集、用户领域-资源领域数据集、资源领域-资源数据集。
[0007]进一步地,所述步骤S2的具体过程如下:
对用户-用户领域数据集、用户领域-资源领域数据集和资源领域-资源数据集进行初始化,并分别对用户-用户领域数据集、用户领域-资源领域数据集和资源领域-资源数据集进行训练得到用户领域矩阵P、资源领域矩阵Q和用户领域-资源领域矩阵L。
[0008]进一步地,所述步骤S2还包括: 通过计算公式L-LFM=P X L X Q,得到基于领域特征和隐语义分析的推荐算法模型(L-LFM) ο
[0009]进一步地,得到用户领域矩阵P的过程如下:
将用户-用户领域数据集通过slope-one算法进行运算,形成用户领域矩阵P[u][j],并获得P矩阵的相关参数。
[0010]进一步地,得到用户领域矩阵Q的过程如下:
将资源领域-资源数据集通过slope-one算法进行运算,形成资源领域矩阵Q[ j ][ i ],并获得Q矩阵的相关参数。
[0011]进一步地,得到用户领域矩阵L的过程如下:
将用户领域-资源领域数据集通过slope-one算法进行运算,形成用户领域-资源领域矩阵Q[i][s],并获得Q矩阵的相关参数。
[0012]本发明方法通过对科技资源进行领域聚类,将用户和资源的按领域进行有效分类,形成用户领域和资源领域,再此基础上,建立引入领域矩阵的推荐模型,改善了隐语义分析算法不太适用于资源数非常庞大的系统,有效提高推荐语义的可解释性。并且,科技资源推荐不同于新闻推荐,对实时性要求不高,用户群体相对固定,因此,能够有效避免隐语义分析算法存在的冷启动问题。
[0013]与现有技术相比,本发明技术方案的有益效果是:
本发明方法引入用户领域和资源领域,寻找更适合描述用户和资源的分类,更有利于隐语义分析算法形成有意义的主题分类,改善了隐语义分析算法无法解释分类意义的现象,同时首先运用高效快速的slope-one算法对三大数据集进行运算,形成P、L、Q矩阵,改善了隐语义分析算法时间复杂度高的问题,适用于跨领域广、数据量庞大、用户群体相对固定的科技资源推荐,有效地避免隐语义分析算法存在的冷启动问题。
【附图说明】
[0014]图1为本发明中基于领域特征和隐语义分析的推荐算法模型(L-LFM)的框图。
【具体实施方式】
[0015]附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
[0016]下面结合附图和实施例对本发明的技术方案做进一步的说明。
[0017]实施例1
一种基于领域特征和隐语义分析的科技资源推荐方法,包括以下步骤:
S1:通过对科技资源进行领域聚类,将用户和资源按领域进行有效分类,形得到用户领域和资源领域,并进行预处理得到用户-用户领域数据集、用户领域-资源领域数据集、资源领域-资源数据集;
S2:利用用户领域和资源领域建立基于领域特征和隐语义分析的推荐模型;
S3:获取用户的需求信息,通过建立的基于领域特征和隐语义分析的推荐模型为用户推荐所需的资源。
[0018]进一步地,所述步骤SI的具体过程如下:
定义活跃用户、用户领域、资源领域、热点数据、关注数据、收藏数据、订单数据、日志数据,采用去除稀疏数据,处理缺失值的数据处理技术,获得用户-用户领域数据集、用户领域-资源领域数据集、资源领域-资源数据集。
[0019]如图1所示,步骤S2的具体过程如下:
对用户-用户领域数据集、用户领域-资源领域数据集和资源领域-资源数据集进行初始化,并分别对用户-用户领域数据集、用户领域-资源领域数据集和资源领域-资源数据集进行训练得到用户领域矩阵P、资源领域矩阵Q和用户领域-资源领域矩阵L。
[0020]步骤S2还包括:
通过计算公式L-LFM=P X L X Q,得到基于领域特征和隐语义分析的推荐算法模型(L-LFM) ο
[0021 ]得到用户领域矩阵P的过程如下:
将用户-用户领域数据集通过slope-one算法进行运算,形成用户领域矩阵P[u][j],并获得P矩阵的相关参数。
[0022]得到用户领域矩阵Q的过程如下:
将资源领域-资源数据集通过slope-one算法进行运算,形成资源领域矩阵Q[ j ][ i ],并获得Q矩阵的相关参数。
[0023]得到用户领域矩阵L的过程如下:
将用户领域-资源领域数据集通过slope-one算法进行运算,形成用户领域-资源领域矩阵Q[i][s],并获得Q矩阵的相关参数。
[0024]本发明方法引入用户领域和资源领域,寻找更适合描述用户和资源的分类,更有利于隐语义分析算法形成有意义的主题分类,改善了隐语义分析算法无法解释分类意义的现象,同时首先运用高效快速的slope-one算法对三大数据集进行运算,形成P、L、Q矩阵,改善了隐语义分析算法时间复杂度高的问题,适用于跨领域广、数据量庞大、用户群体相对固定的科技资源推荐,有效地避免隐语义分析算法存在的冷启动问题。
[0025]相同或相似的标号对应相同或相似的部件;
附图中描述位置关系的用于仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
【主权项】
1.一种基于领域特征和隐语义分析的科技资源推荐方法,其特征在于,包括以下步骤: S1:通过对科技资源进行领域聚类,将用户和资源按领域进行有效分类,形得到用户领域和资源领域,并进行预处理得到用户-用户领域数据集、用户领域-资源领域数据集、资源领域-资源数据集; S2:利用用户领域和资源领域建立基于领域特征和隐语义分析的推荐模型; S3:获取用户的需求信息,通过建立的基于领域特征和隐语义分析的推荐模型为用户推荐所需的资源。2.根据权利要求1所述的基于领域特征和隐语义分析的科技资源推荐方法,其特征在于,所述步骤SI的具体过程如下: 定义活跃用户、用户领域、资源领域、热点数据、关注数据、收藏数据、订单数据、日志数据,采用去除稀疏数据,处理缺失值的数据处理技术,获得用户-用户领域数据集、用户领域-资源领域数据集、资源领域-资源数据集。3.根据权利要求2所述的基于领域特征和隐语义分析的科技资源推荐方法,其特征在于,所述步骤S2的具体过程如下: 对用户-用户领域数据集、用户领域-资源领域数据集和资源领域-资源数据集进行初始化,并分别对用户-用户领域数据集、用户领域-资源领域数据集和资源领域-资源数据集进行训练得到用户领域矩阵P、资源领域矩阵Q和用户领域-资源领域矩阵L。4.根据权利要求3所述的基于领域特征和隐语义分析的科技资源推荐方法,其特征在于,所述步骤S2还包括: 通过计算公式L-LFM=P X L X Q,得到基于领域特征和隐语义分析的推荐算法模型。5.根据权利要求3所述的基于领域特征和隐语义分析的科技资源推荐方法,其特征在于,得到用户领域矩阵P的过程如下: 将用户-用户领域数据集通过slope-one算法进行运算,形成用户领域矩阵P[u][j],并获得P矩阵的相关参数。6.根据权利要求3所述的基于领域特征和隐语义分析的科技资源推荐方法,其特征在于,得到用户领域矩阵Q的过程如下: 将资源领域-资源数据集通过slope-one算法进行运算,形成资源领域矩阵Q[ j] [ i ],并获得Q矩阵的相关参数。7.根据权利要求3所述的基于领域特征和隐语义分析的科技资源推荐方法,其特征在于,得到用户领域矩阵L的过程如下: 将用户领域-资源领域数据集通过slope-one算法进行运算,形成用户领域-资源领域矩阵Q[i][s],并获得Q矩阵的相关参数。
【专利摘要】本发明提供一种基于领域特征和隐语义分析的科技资源推荐方法,该方法引入用户领域和资源领域,寻找更适合描述用户和资源的分类,更有利于隐语义分析算法形成有意义的主题分类,改善了隐语义分析算法无法解释分类意义的现象,同时首先运用高效快速的slope-one算法对三大数据集进行运算,形成P、L、Q矩阵,改善了隐语义分析算法时间复杂度高的问题,适用于跨领域广、数据量庞大、用户群体相对固定的科技资源推荐,有效地避免隐语义分析算法存在的冷启动问题。
【IPC分类】G06F17/27, G06F17/30
【公开号】CN105512323
【申请号】CN201510962244
【发明人】罗亮, 林珠, 方少亮, 徐迪威, 李海威, 黄皓璇
【申请人】广东省科技基础条件平台中心
【公开日】2016年4月20日
【申请日】2015年12月21日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1