一种研究人员所属领域确定系统及其方法

文档序号:9235511阅读:605来源:国知局
一种研究人员所属领域确定系统及其方法
【技术领域】
[0001] 本发明设及分类确定方法,属于数据分析与处理应用领域,尤其设及一种研究人 员所属领域确定系统及其方法。
【背景技术】
[0002] 研究人员在访问文献网站的时候会遇到信息过载和泛滥的问题,无法快速定位到 自己真正所需要的资源。如果通过对研究人员的个人信息和行为进行分析从而确定其偏好 和所属领域,就可W屏蔽不必要信息,给研究人员的学习与科研带来极大便利性。
[0003] 目前在图书推荐系统,购物推荐系统等其他类似系统中用一种协同过滤算法将用 户的全部偏好作为一个参考值来计算用户之间的相似度,寻找到相邻用户后,通过相似的 借阅或购买历史来预测当前用户可能会借阅的书或购买的商品,此系统可W很好的吸引新 用户,留住老用户,为商家带来巨大盈利。但是该些系统都没有将相似的用户形成一个交流 圈,不方便信息的交流与共享,用户只是被动的去接受系统推荐信息。而且用户的阅读兴趣 和购买商品的类别变化范围是很大的,难W确定一个圈子。
[0004] 领域确定在对研究人员个人信息、行为特征进行分析的基础上,为研究人员确定 研究领域,缩小资源定位的范围,极力满足研究人员的需求。目前,在电子商务领域应用的 个性化推荐服务类似于领域确定的方法。电子商务网站通过分析用户的访问操作,商品购 买和评价W及其好友的购买行为,推测出用户有购买意向的商品并进行及时推送。并且捜 集用户的后续反馈进行改进服务,挺高服务质量和用户满意度。所W-个好的推荐算法对 推荐系统至关重要。传统算法时效性差和预测不准性的缺陷致使推荐系统效率低下。
[0005] 与个性化推荐服务有所不同,领域确定方法会在研究人员注册时捜集静态信息, 根据属性特征值计算出研究人员的领域参数值并对其进行领域的模糊划分。之后,再根据 研究人员的行为特征动态计算所得参数值并最终确定其研究领域。并且会在确定其领域的 同时为其推荐相关领域细粒度的交流区,方便其与相同领域的其他专业人±进行交流,提 高学习的效率。
[0006] 但是现有技术存在如下问题:研究人员操作行为的缺少带来的冷启动和数据稀疏 性。稀疏性问题是指信息的缺乏导致目前的推荐算法不准确,而冷启动可W理解为稀疏性 问题的极端,因为没有足够的信息使得系统难W执行算法。目前,主要采取平均值法,奇异 值分解降维等方法缓解此问题。

【发明内容】

[0007] 为解决上述技术问题,本发明采用的技术方案如下:
[000引一种研究人员所属领域确定系统,包括人机交互模块、数据挖掘与处理模块、领域 确定模块;人机交互模块用于向研究人员提供一个可操作的界面访问资源并捜集其操作行 为数据,捜集的数据将提交数据挖掘与处理模块进行相关处理;数据挖掘与处理模块将捜 集的行为进行筛选后提交给后台数据库,后台数据库为领域确定模块提供访问接口;领域 确定模块访问数据库对其中的研究人员数据进行分析计算,确定其所属的领域,计算结果 将通过人机交互模块显示给用户。
[0009] 一种根据上述系统实现的研究人员所属领域确定方法,包括如下步骤:
[0010] 步骤一;构建领域模型,确定本系统的领域分类并为所有领域划分属性,建立领域 分类一-领域属性矩阵;
[0011] 步骤二:分析研究人员在注册的时候所填写个人信息。
[0012] 步骤进一步确定研究人员所属的研究领域,对每个领域进行详细分类。各子领 域对应的属性与原领域相同。并且构建子领域分类一-领域属性矩阵,同时将原来的父领 域作为该矩阵的外键。
[0013] 步骤四:对研究人员进行领域初步划分后便推荐其所属领域的资源,并捜集研究 人员访问站点时的操作行为。
[0014] 步骤五:将相同领域的研究人员互相推荐,形成一个细粒度交流圈。
[0015] 所述步骤一的矩阵构建方法为:将分类的各领域作为矩阵的列,领域属性作为矩 阵的行,矩阵的初始值为零。再根据专家意见,对领域属性进行权重划分,构建领域属性矩 阵,该矩阵只有一行,列数与所确定的领域属性个数相同。
[0016] 所述步骤二的分析方法为根据研究人员个人信息修改矩阵的各领域属性值,计算 领域属性权重矩阵与领域分类一-领域属性矩阵相乘之积,得到一行新矩阵各列的值代表 该研究人员在各个领域的参数值,计算公式如下:
[0020] (其中P代表领域一属性矩阵,1C代表某领域对应的属性值,q是权重系数矩阵, qim是各属性对应的权重值,R是前者相乘得到的新矩阵,P是各领域具体的值。)
[0021] 所述步骤四进一步表述为将操作行为的数据过滤并放入步骤=的两个领域分类 矩阵中,先计算属性权重矩阵与领域分类一-领域属性矩阵相乘之积,得到的一行新矩阵 值最大的一列所对应的领域即初步为研究人员划分的领域。再根据为研究人员初步划分 的领域将其所属领域进行细分,计算属性权重矩阵与子领域分类一-领域属性矩阵相乘之 积,得到的一行新矩阵值最大的一列所对应的领域即最终为研究人员划分的领域,计算公 式如下:
[0022] 子领域、属性矩闻
(4)
[0023] 新矩阵:
巧)
[0024](其中C是子领域一属性矩阵,Cmt是属性对应各个子领域的值,r是前者相乘得到 的新矩阵,rit是各领域具体的值。)
[0025] 式(4)式的第一列是父领域,将父领域的各项属性值细化到各个子领域中,确保 某一行属性所对应的各个子领域的值相加之和与该属性对应的父领域值相等。例如研究人 员具有i领域的j属性,且该属性重复出现m次,则Cy=m。式(3)中maxirr。,…,riiJ 所对应的列即为研究人员所属领域。
[0026] 本发明具有W下有益效果:
[0027] 1、确定人员所属领域方便实现捜索文献资料的快速定位,研究人员按照自身在研 究方向、研究层次、知识基础W及研究任务度等方面的需要,快速找到所需的知识资源项, 缩小捜索范围,从而达到良好的学习效果。使科研人员可W在系统的推荐下快速地定制出 满足其个性化需求的研究路线和文献资源,解决科研人员开展文献调研和知识学习的盲目 感,塑造更好的用户体验。
[002引 2、确定研究人员所属领域有效减轻了其在海量信息中捜索自己所需信息的负担, 大幅度减少了研究人员在无用信息上的时间和精力,给研究人员良好的学习环境。
[0029] 3、本发明的根据研究人员静态信息划分初步研究领域的方法可W有效解决由于 数据稀疏性带来的冷启动问题。为研究人员根据系统筛选并推送的信息,进一步明确自己 研究领域,形成良性循环。
[0030] 4、可W实现科技资源的有效配置,提高科技资源的利用效率,有利于知识的快速 高效交流与学习,对于激励和培育创新思维、造就创新人才、做出创新成果和实现可持续发 展,具有积极的促进作用。
【附图说明】
[0031] 图1系统模型图
【具体实施方式】
[0032] 本发明提出的研究人员所属领域确定的方法,首先会在研究人员注册账户时捜集 基本个人信息,根据其研究领域,兴趣方向,专业学历等属性计算各领域的加权值进行初步 的领域确定,并向其推荐相关领域的信息,避免冷启动问题。其次会捜集研究人员的行为特 征并对其进行分析,根据相应权重系数再次计算出各领域的加权值,选出值最大的一项为 用户研究领域,在推送信息的同时向研究人员推荐同领域的其他研究人员,促进交流,形成 良好的学习环境。
[0033] 首先构建本系统模型
[0034]本发明分为=个功能模块;人机交互模块、数据挖掘与处理模块、领域确定模块, =个模块互相依赖。其中,人机交互模块用于向研究人员提供一个可操作的界面访问资源 并捜集其操作行为数据,捜集的数据将提交数据挖掘与处理模块进行相关处理;数据挖掘 与处理模块将捜集的行为进行筛选后提交给后台数据库,后台数据库为领域确定模块提供 访问接口;领域确定模块访问数据库对其中的研究人员数据进行分析计算,确定其所属的 领域,计算结果将通过人机交互模块显示给用户。该系统的组织框图如图1所示。
[0035]由该系统框图可W看出;从人机交互模块到数据挖掘与领域划分依次对应着交互 层、数据层、领域划分层。其详细的组件功能可描述如下:
[0036] (1)人机交互模块:在用户终端设置人机交互界面,分为Web浏览器和客户端。为 研究人员提供一种方便操作的友好界面,利于接受其访问时留下的偏好数据。研究人员访 问系统时的操作行为主要有静态和动态两种形式。静态形式时指在研究人员进行页面访问 时要进行注册,录入其专业方向,学位,兴趣偏好,工作方向等。该些信息因为基本是不变 的,所W称之为静态。动态形式是指系统需要研究人员对站点进行访问操作,捜集其操作行 为,例如浏览、评论文章的类型及次数,发表文章的所属领域,其关注的好友的研究领域等。 该些数据是变化的。
[0037] (2)数据挖掘与处理模块使用数据处理引擎对研究人员的操作行为信息进行分析 与预处理,存入关系数据库。在进行领域确定之前必须要先建立用户的研究偏好模型,它捕 获用户的真实研究偏好信息的能力很大程度上决定领域划分成功
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1