多样性增强的医疗资讯推荐方法及装置与流程

文档序号:13446475阅读:104来源:国知局
多样性增强的医疗资讯推荐方法及装置与流程

本发明涉及计算机技术领域,尤其涉及一种多样性增强的医疗资讯推荐方法及装置。



背景技术:

目前,在向用户推荐资讯时,一般需先确定待推荐资讯包含的关键词,然后获取目标用户的兴趣关键词,确定待推荐资讯的关键词与目标用户兴趣关键词的相似度较高的情况下,将待推荐资讯推荐并呈现给目标用户。然而,这种资讯推荐方式,仅考虑了待推荐资讯的关键词与目标用户感兴趣关键词之间的联系,并未考虑内容多样性的推荐问题,会导致推荐资讯内容较为单一,无法扩展推荐内容的覆盖面。



技术实现要素:

针对相关技术中的缺陷,本发明提供了一种多样性增强的医疗资讯推荐方法及装置,用以解决相关技术中推荐资讯内容较为单一的问题。

根据本发明的一个方面,提供一种资讯推荐方法,包括:获取第一用户集合中的第一用户对预选资讯集合中的预选资讯的第一评分;所述预选资讯包括医疗资讯,根据所述第一评分以及目标用户对所述预选资讯的第二评分计算所述目标用户与所述第一用户之间的相似度;根据计算出的所述相似度计算所述目标用户与所述第一用户之间的多样性度量值;根据计算出的所述多样性度量值选择预设个数的所述第一用户作为所述目标用户的最近邻;根据所述目标用户的最近邻对预选资讯的评分计算所述目标用户对所述预选资讯的评分;根据计算出的预选资讯的评分确定目标资讯,将目标资讯推荐给目标用户。

可选的,所述根据计算出的所述相似度计算所述目标用户与所述第一用户之间的多样性度量值,包括:建立所述第一用户对于所述预选资讯集合中的所述预选资讯的第一评分矩阵;基于用户分类型参数将所述第一评分矩阵扩充成第二评分矩阵,所述用户分类型参数为所述第一用户的种类参数;根据聚类算法利用所述第二评分矩阵将所述第一用户集合中的所述第一用户分成多个类,得到聚类簇;计算所述目标用户与所述聚类簇中各类中的用户的多样性度量值。

可选的,所述计算所述目标用户与所述聚类簇中各类中的用户的多样性度量值,包括:所述目标用户与所述聚类簇中的类之间的多样性使用如下公式(1)进行计算:

其中,v属于聚类簇v,k为聚类簇v中的类vk中的用户数目,diversion(u,v)为目标用户u与聚类簇v之间的多样性度量值,sim(u,v)为用户u与用户v之间相似度;

根据如下公式(2)计算所述目标用户与所述聚类簇中的用户的多样性度量值:

其中,diversion(u,v)为目标用户u与用户v之间的多样性度量值,λ为可调参数,当λ趋向于1时,目标用户u与用户v之间的多样性度量值最高,当λ不趋向于1时,目标用户u的与用户v之间的相似性最高。

可选的,所述根据所述目标用户的最近邻对预选资讯的评分计算所述目标用户对所述预选资讯的评分,包括:使用如下公式(3)计算所述目标用户对所述预先资讯的评分:

其中,rv,i为用户v对资讯i的评分,为目标用户u对资讯i的评分,v属于所述目标用户的最近邻n(u)中的用户。

可选的,所述根据所述第一评分以及目标用户对所述预选资讯的第二评分计算所述目标用户与所述第一用户之间的相似度,包括:使用如下公式(4)计算所述目标用户与所述第一用户之间的相似度:

其中,sim(u,v)代表用户u与用户v之间相似度,ru,t为用户u对资讯t的评分,rv,t为用户v对于资讯t的评分,iu,v为用户v以及用户u的共同资讯的集合,au为用户u对所述共同资讯评分的平均值,av为用户v对所述共同资讯评分的平均值。

根据本发明的另一个方面,提供了一种资讯推荐装置,包括:获取模块,用于获取第一用户集合中的第一用户对预选资讯集合中的预选资讯的第一评分,所述预选资讯包括医疗资讯;第一计算模块,用于根据所述第一评分以及目标用户对所述预选资讯的第二评分计算所述目标用户与所述第一用户之间的相似度;第二计算模块,用于根据计算出的所述相似度计算所述目标用户与所述第一用户之间的多样性度量值;选择模块,用于根据计算出的所述多样性度量值选择预设个数的所述第一用户作为所述目标用户的最近邻;第三计算模块,用于根据所述目标用户的最近邻对预选资讯的评分计算所述目标用户对所述预选资讯的评分;推荐模块,用于根据计算出的预选资讯的评分确定目标资讯,将目标资讯推荐给目标用户。

可选的,所述第二计算模块,包括:建立单元,用于建立所述第一用户对于所述预选资讯集合中的所述预选资讯的第一评分矩阵;扩充单元,用于基于用户分类型参数将所述第一评分矩阵扩充成第二评分矩阵,所述用户分类型参数为所述第一用户的种类参数;分类单元,用于根据聚类算法利用所述第二评分矩阵将所述第一用户集合中的所述第一用户分成多个类,得到聚类簇;计算单元,用于计算所述目标用户与所述聚类簇中各类中的用户的多样性度量值。

可选的,所述计算单元用于:所述目标用户与所述聚类簇中的类之间的多样性使用如下公式(1)进行计算:

其中,v属于聚类簇v,k为聚类簇v中的类vk中的用户数目,diversion(u,v)为目标用户u与聚类簇v之间的多样性度量值,sim(u,v)为用户u与用户v之间相似度;

根据如下公式(2)计算所述目标用户与所述聚类簇中的用户的多样性度量值:

其中,diversion(u,v)为目标用户u与用户v之间的多样性度量值,λ为可调参数,当λ趋向于1时,目标用户u与用户v之间的多样性度量值最高,当λ不趋向于1时,目标用户u的与用户v之间的相似性最高。

可选的,所述第三计算模块用于:使用如下公式(3)计算所述目标用户对所述预先资讯的评分:

其中,rv,i为用户v对资讯i的评分,为目标用户u对资讯i的评分,v属于所述目标用户的最近邻n(u)中的用户。

可选的,所述第一计算模块用于:使用如下公式(4)计算所述目标用户与所述第一用户之间的相似度:

其中,sim(u,v)代表用户u与用户v之间相似度,ru,t为用户u对资讯t的评分,rv,t为用户v对于资讯t的评分,iu,v为用户v以及用户u的共同资讯的集合,au为用户u对所述共同资讯评分的平均值,av为用户v对所述共同资讯评分的平均值。

与相关技术相比较,本发明基于用户对资讯的评分,根据与目标用户相似的近邻用户对资讯的偏好对目标用户进行资讯推荐,使得为用户推荐的资讯变得更加多样性,解决了相关技术中推荐资讯内容较为单一的问题。

附图说明

为了更清楚地说明本发明实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些图获得其他的附图。

图1是本发明实施例提供的多样性增强的医疗资讯推荐方法的流程图;

图2是本发明实施例提供的多样性增强的医疗资讯推荐装置的框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1为本发明一实施例提供的多样性增强的医疗资讯推荐方法,如图1所示,该方法可以包括如下处理:

步骤101:获取第一用户集合中的第一用户对预选资讯集合中预选资讯的第一评分;

在一个示例性实施例中,预选资讯可以是医疗资讯或进一步可以是移动医疗资讯。

步骤102:根据第一评分以及目标用户对预选资讯集合中的资讯的第二评分计算目标用户与第一用户之间的相似度;

在一个示例性实施例中,步骤101以及步骤102可以通过如下方式来实现:

建立第一用户集合u对于资讯集合k的评分矩阵rhk,增加用户分类型参数,使用该分类型参数扩充rhk并生成rchk,采用enhancekp聚类算法并利用rchk将用户集u分成多个类,利用矩阵rhk计算目标用户u与用户集u中所有用户之间的皮尔逊相似度,该相似度的计算公式如下:

其中,sim(u,v)代表用户u与用户v之间相似度,ru,t代表了用户u对于资讯t的评分,rv,t代表了用户v对于资讯t的评分,iu,v指的是该公式中包括用户v以及用户u的共同资讯的集合,au代表了用户u对共同资讯评分的平均值,av代表了用户v对共同资讯评分的平均值。

其中,对于上述评分矩阵rhk,还可以进一步根据用户的浏览日志获得用户浏览记录、转载记录、点赞次数以及资讯属性等信息,对用户未评价的信息进行加权等预处理,从而得到更加完整的评分矩阵rhk。

其中,上述enhancekp是通过修改k-prototypes算法得到的,enhancekp算法步骤与k-prototypes一样,包括如下步骤:

步骤(1):在数据集x={x1,x2,x3…xn}中随机选择k个数据对象作为初始聚类中心,初始聚类中心集合为v={v1,v2,v3…vk};

步骤(2):依次计算数据集中所有数据对象xi到各个聚类中心vj的距离d(i,j);

步骤(3):根据d(i,j)的最小值将xi划入到相应的vj所在的聚类簇之中;

步骤(4):所有的xi分配完毕后,根据分类型属性值和数值型属性值与聚类中心距离来更新各个簇的聚类中心;

步骤(5)重复步骤上述(2)、(3)以及(4),直到聚类准则函数收敛;

(6)算法完成,并输出最终结果;

enhancekp在(2)中对分类型属性值与聚类中心的距离的计算公式如下:

其中,xni与vmi代表对象n和对象m,i是指对象n与对象m的分类型属性i。dl代表聚类集合第l个属性(分类属性)中,所有属性值与聚类中心的差异值的和。dlm代表待分类对象xni分类型属性i的属性值与聚类中心的差异值。t为可调整参数(通过训练集进行训练,从而确定最优t)。其中,相同属性值之间的差异值为0,不同属性值之间的差异值为1。因此数据对象xn与xm之间的距离计算公式如下:

其中,d1(n,m)为欧氏距离,d2(n,m)为分类型属性计算公式,此处的x的下标i和v的下标j代表在l属性下的不同值。

示例性的,上述目标用户也是第一用户集合u中的一员,故其也在对u进行划分后得到的某个类中。

步骤103:根据计算出的相似度计算目标用户与第一用户之间的多样性度量值;

在一个示例性实施例中,计算目标用户与第一用户之间的多样性度量值可以包括:建立第一用户对于预选资讯集合中的预选资讯的第一评分矩阵;基于用户分类型参数将第一评分矩阵扩充成第二评分矩阵,用户分类型参数为第一用户的种类参数;根据聚类算法利用第二评分矩阵将第一用户集合中的第一用户分成多个类,得到聚类簇;计算目标用户与聚类簇中各类中的用户的多样性度量值。其中,用户分类型参数可以包括用户性别、用户受教育程度等参数。

计算目标用户与聚类簇中各类中的用户的多样性度量值可以采用如下方式:

其中,diversion(u,v)为目标用户u与用户v之间的多样性度量值;diversion(u,v)计算方式如下:

目标用户与聚类簇中的类之间的多样性使用如下公式进行计算:

其中,v属于聚类簇v,k为聚类簇v中的类vk中的用户数目,diversion(u,v)为目标用户u与聚类簇v之间的多样性度量值,sim(u,v)为用户u与用户v之间相似度;

根据如下公式计算目标用户与聚类簇中的用户的多样性度量值:

其中,λ为可调参数,当λ趋向于1时,目标用户u与用户v之间的多样性度量值最高,反之,目标用户u的与用户v之间的相似性最高,通过对λ的调整可以使得推荐的内容更加多样性。

步骤104:根据计算出的多样性度量值选择预设个数的第一用户作为目标用户的最近邻;

确定目标用户u,依据目标用户u与其他用户的diversion(u,v)值,并按照从大到小的顺序选择k个用户作为目标用户u的最近邻,形成目标用户u的最近邻居集n(u)。

步骤105:根据目标用户的最近邻对预选资讯的评分计算目标用户对预选资讯的评分;

在一个示例性实施例中,根据目标用户的最近邻对预选资讯的评分计算目标用户对预选资讯的评分可以包括:

使用如下公式计算目标用户对预先资讯的评分:

其中,rv,i为用户v对资讯i的评分,为目标用户u对资讯i的评分,v属于目标用户的最近邻n(u)中的用户。

步骤106:根据计算出的预选资讯的评分确定目标资讯,将目标资讯推荐给所述目标用户。

在步骤106中,可以预测目标用户对指定资讯的评分,取前l项最高评分生成推荐列表,为用户提供准确且多样性的资讯。

本发明实施例提供的资讯推荐方法,基于用户对资讯的评分根据与目标用户相似近邻用户的偏好对目标用户进行资讯推荐,在计算目标用户的相似近邻的过程中加入多样性因素,以增加资讯推荐的多样性;基于预测目标用户未评价过的资讯的评分,选取预设个数预测评分高的资讯进行推荐,使得用户能够获知其感兴趣的资讯。

本发明还提供了一种多样性增强的医疗资讯推荐装置,该装置用于实现本发明提供的资讯推荐方法,图2是该装置的框图,如图2所示,该装置20包括如下组成部分:

获取模块21,用于获取第一用户集合中的第一用户对预选资讯集合中资讯的第一评分;其中,预选资讯包括医疗资讯。

第一计算模块22,用于根据第一评分以及目标用户对预选资讯集合中的资讯的第二评分计算目标用户与第一用户之间的相似度;

第二计算模块23,用于根据计算出的相似度计算目标用户与第一用户之间的多样性度量值;

选择模块24,用于根据计算出的多样性度量值选择预设个数的第一用户作为目标用户的最近邻;

第三计算模块25,用于根据目标用户的最近邻对预选资讯的评分计算目标用户对预选资讯的评分;

推荐模块26,用于根据计算出的预选资讯的评分确定目标资讯,将目标资讯推荐给所述目标用户。

在一个示例性实施例中,上述第二计算模块23可以如下单元:

建立单元,用于建立第一用户对于预选资讯集合中的预选资讯的第一评分矩阵;

扩充单元,用于基于用户分类型参数将第一评分矩阵扩充成第二评分矩阵,用户分类型参数为第一用户的种类参数;

分类单元,用于根据聚类算法利用第二评分矩阵将第一用户集合中的第一用户分成多个类,得到聚类簇;

计算单元,用于计算目标用户与聚类簇中各类中的用户的多样性度量值。

其中,目标用户与聚类簇中的类之间的多样性使用如下公式进行计算:

其中,v属于聚类簇v,k为聚类簇v中的类vk中的用户数目,diversion(u,v)为目标用户u与聚类簇v之间的多样性度量值,sim(u,v)为用户u与用户v之间相似度;

计算单元可以用于:根据如下公式计算目标用户与聚类簇中的用户的多样性度量值:

其中,diversion(u,v)为目标用户u与用户v之间的多样性度量值,λ为可调参数,当λ趋向于1时,目标用户u与用户v之间的多样性度量值最高,反之,目标用户u的与用户v之间的相似性最高。

第三计算模块25可以用于使用如下公式计算目标用户对预先资讯的评分:

其中,rv,i为用户v对资讯i的评分,为目标用户u对资讯i的评分,v属于目标用户的最近邻n(u)中的用户。

上述第一计算模块22可以用于:使用如下公式计算目标用户与第一用户之间的相似度:

其中,sim(u,v)代表用户u与用户v之间相似度,ru,t为用户u对资讯t的评分,rv,t为用户v对于资讯t的评分,iu,v为用户v以及用户u均进行评分的资讯的集合,au为用户u对iu,v评分的平均值,av代表了用户v对iu,v评分的平均值。

本发明实施例提供的资讯推荐装置,基于用户对资讯的评分根据与目标用户相似近邻用户的偏好对目标用户进行资讯推荐,在计算目标用户的相似近邻的过程中加入多样性因素,以增加资讯推荐的多样性;基于预测目标用户未评价过的资讯的评分,选取预设个数预测评分高的资讯进行推荐,使得用户能够获知其感兴趣的资讯。

本发明的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本发明公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释呈反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在于该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是互相排斥之处,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本发明实施例的一种浏览器终端的设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1