协同过滤系统以及协同过滤方法

文档序号:6408335阅读:555来源:国知局
专利名称:协同过滤系统以及协同过滤方法
技术领域
本发明涉及协同过滤系统以及协同过滤方法,尤其涉及使用了多个用户各自对项目的评价值的协调过滤系统以及协调过滤方法。
背景技术
目前提出了一种如下的协同过滤的方法,S卩,对于大量的用户预先积存与其爱好相关的信息,并使用与某用户爱好相似的其他用户的信息,来对该用户的爱好进行预测。协同过滤被用于进行推荐和个性化设置。例如,在专利文献I中公开了一种如下的信息推荐方法,即,当任意的用户实际已对任意的条目进行了投票时,将对该条目的评价值代入条目-用户矩阵中的对应的单元中,并且向与该条目相似的其他条目的单元中也模拟地代入评价值。专利文献I中的信息推荐方法,对由于不存在评价值而无法进行推荐的条目也能够进行推荐。在先技术文献专利文献专利文献I :日本特开2005-202540号公报

发明内容
发明所要解决的课题有时汽车导航系统会考虑到用户的爱好而应用上述这种协同过滤来实施对店铺和设施等项目的推荐。例如,有时汽车导航系统根据用户过去驾车访问过的餐馆的履历、和访问过该餐馆的其他用户对餐馆的访问履历,来实施对可能适合该用户的爱好的、该用户尚未访问过的餐馆进行推荐的服务。在这种情况下,汽车导航系统有可能只推荐用户的行动范围周边的项目。S卩,作为汽车导航系统所推荐的项目,设想有餐馆、酒店以及小卖店等,但这些均为与位置相关的项目。在协同过滤中,当计算项目间的相似度时,需要多个对项目的双方均进行了评价的用户。但是,在与位置相关的项目中,由于当项目彼此间在距离上相隔较远时,对双方均进行了评价的用户会比较少,因此相似度的计算较为困难。其结果为,由于可计算相似度的项目成为了彼此距离较近的项目,因此汽车导航系统能够推荐的项目也有可能仅为用户的行动范围周边的项目。此外,还存在对项目附上评价分的用户较少,从而协同过滤不工作的可能性。gp,作为附上对项目的评价值的方法,考虑到了用户通过网站来写入评价分的方法、和用户在访问了作为项目的店铺和设施等之后通过汽车导航系统而输入评价分的方法等。但是可以预想到,由于上述的任意一种方法均需要花费用户的劳力和时间,因此难以收集用户的评价值。本发明是考虑了这种情况而完成的,其目的在于,提供一种能够进一步扩大可通过协同过滤而对评价值进行预测的项目的范围的协同过滤系统以及协同过滤方法。此外,、本发明的目的还在于,提供能够通过个数更少的用户的评价值来实施通过协同过滤而进行的预测的协同过滤系统以及协同过滤方法。 用于解决课题的方法本发明为一种协同过滤系统,其使用了多个用户各自对项目的评价值,其中,所述协同过滤系统具备相似度计算单元,当不存在对第一项目以及第二项目的双方均进行了评价的、至少一个用户的评价值时,所述相似度计算单元使用第三项目的评价值来计算第一项目与第二项目的相似度,其中,所述第三项目为,存在对第一项目以及第三项目的双方均进行了评价的至少一个用户的评价值、且存在对第二项目以及第三项目的双方均进行了评价的至少一个用户的评价值的项目;预测评价值计算单元,其使用由相似度计算单元计算出的第一项目与第二项目的相似度、和对第一项目以及第二项目的评价值,来计算对第一项目以及第二项目中的某一个项目未进行评价的用户的预测评价值。
当不存在对第一项目以及第二项目的双方均进行了评价的、用户的评价值时,即,由于第一项目与第二项目之间的距离较远等原因,有时会无法直接计算出第一项目与第二项目的相似度。此时,相似度计算单元根据第三项目的评价值来计算第一项目与第二项目的相似度,其中,所述第三项目为,存在对第一项目以及第三项目的双方均进行了评价的至少一个用户的评价值、且存在对第二项目以及第三项目的双方均进行了评价的至少一个用户的评价值的项目。即,相似度计算单元使用能够分别直接计算出与第一项目以及与第二项目的相似度的第三项目,来间接地对第一项目与第二项目的相似度进行计算。由此,能够对无法直接计算的、第一项目与第二项目的相似度进行计算。此外,预测评价值计算单元使用由相似度计算单元计算出的第一项目与第二项目的相似度、和对第一项目以及第二项目的评价值,来计算对第一项目以及第二项目中的某一个项目未进行评价的用户的预测评价值。由此,能够对无法直接计算的、第一项目以及第二项目的预测评价值进行计算。因此,能够进一步扩大能够通过协同过滤而进行的对评价值的预测的项目的范围。此时,优选为,当对于第三项目的个数为N个、且I彡i彡N的第i个第三项目而言,作为皮尔逊的积差相关系数的、第一项目与第三项目的相似度用s (Cl,C3i)来表示,且作为皮尔逊的积差相关系数的、第二项目与第三项目的相似度用s (C2, C3i)来表示时,相似度计算单元通过下述式(I)来计算作为第一项目与第二项目的相似度的s (C1,C2),数学式I
'i Il + s(Cl, C3f) 11 + s(C2, C3Q、s(Cl,C2)=旦^--—---- x2 —I.·· (I)。
VJ根据该结构,能够根据用皮尔逊的积差相关系数来表示的、第一项目与第三项目的相似度、和第二项目与第三项目的相似度,来定量地计算第一项目与第二项目的相似度。此外,本发明为一种协同过滤系统,其使用了多个用户各自对项目的评价值,其中,所述协同过滤系统具备预测评价值计算单元,对于利用过特定项目、且对特定项目未进行评价的一个用户,所述预测评价值计算单元使用一个用户对特定项目的利用频度、和利用过特定项目且对特定项目进行了评价的其他用户对特定项目的利用频度以及对特定项目的评价值,来计算一个用户对特定项目的预测评价值。或者,优选为,在上述系统过滤系统中,对于利用过特定项目且对特定项目未进行评价的一个用户,预测评价值计算单元使用一个用户对特定项目的利用频度、和利用过特定项目且对特定项目进行了评价的其他用户对特定项目的利用频度以及对特定项目的评价值,来计算一个用户对特定项目的预测评价值。有时会存在利用过特定的项目且对特定的项目未进行评价的一个用户。此时,预测评价值计算单元使用该一个用户对特定项目的利用频度、和利用过特定项目且对特定项目进行了评价的其他用户对特定项目的利用频度以及对特定项目的评价值。可以认为,用户各自对项目的利用频度和对该项目的评价值是相关的。因此,即使不存在该一个用户本身的评价值,预测评价值计算单元也能够使用该一个用户对特定项目的利用频度、和利用过特定项目且对特定项目进行了评价的其他用户对特定项目的利用频度以及评价值,来计算一个用户对特定项目的预测评价值。因此,能够通过个数更少的用户的评价值来实施通 过协同过滤而进行的预测。此时,优选为,预测评价值计算单元使用一个用户对特定项目的利用频度、和其他用户对特定项目的利用频度以及对特定项目的评价值,来计算一个用户对特定项目的预测评价值,其中,所述其他用户对特定项目的利用频度为,特定项目的利用频度与一个用户对特定项目的利用频度之间存在预定的阈值以内的差异。当项目的利用频度存在预定的阈值以内的差异时,可以推断为评价值也近似。因此,预测评价值计算单元通过使用一个用户对特定项目的利用频度、和对特定项目的利用频度与一个用户对特定项目的利用频度之间存在预定的阈值以内的差异的、其他用户对特定项目的利用频度以及对特定项目的评价值,来计算一个用户对特定项目的预测评价值,从而能够高精度地对预测评价值进行计算。此外,优选为,预测评价值计算单元使用一个用户对特定项目的利用频度、和其他用户对特定项目的利用频度以及对特定项目的评价值,来计算一个用户对特定项目的预测评价值,其中,所述其他用户对所述特定项目的利用频度为,所述特定项目所属的类别内的非特定多数的项目的利用频度与一个用户对非特定多数的项目的利用频度之间存在预定的阈值以内的差异。当特定项目所属的类别内的非特定多数的项目的利用频度存在预定的阈值以内的差异时,可以推断为对特定项目的评价值也近似。因此,预测评价值计算单元通过使用一个用户对特定项目的利用频度、和对特定项目所属的类别内的非特定多数的项目的利用频度与一个用户对非特定多数的项目的利用频度之间存在预定的阈值以内的差异的、其他用户对特定项目的利用频度以及对特定项目的评价值,来计算一个用户对特定项目的预测评价值,从而能够进一步高精度地对预测评价值进行计算。此外,优选为,预测评价值计算单元使用一个用户对特定项目的利用频度,和多个其他用户各自对特定项目的利用频度中的每一个利用频度的、对特定项目的评价值的中央值以及平均值中的某一个值,来计算一个用户对特定项目的预测评价值。可以推断为,多个其他用户各自对特定项目的利用频度中的每一个利用频度的、对特定项目的评价值的中央值或平均值,高精度地表示了利用频度与评价值的相关关系。因此,预测评价值计算单元通过使用一个用户对特定项目的利用频度,和多个其他用户各自对特定项目的利用频度中的每一个利用频度的、对特定项目的评价值的中央值以及平均值中的某一个值,来计算一个用户对特定项目的预测评价值,从而能够进一步高精度地对预测评价值进行计算。此外,优选为,预测评价值计算单元根据利用过特定项目且对特定项目进行了评价的其他用户对特定项目的利用频度、以及对特定项目的评价值,来导出对特定项目的评价值相对于特定项目的利用频度的函数,并使用一个用户对特定项目的利用频度和函数,来计算一个用户对特定项目的预测评价值。可以推断为,根据利用过特定项目且对特定项目进行了评价的其他用户对特定项目的利用频度、以及对特定项目的评价值而导出的、对特定项目的评价值相对于特定项目的利用频度的函数,高精度地表示了利用频度与评价值 的相关关系。而且,即使得到的利用频度与评价值是离散的值,也能够通过该函数来进行插值。因此,预测评价值计算单元通过根据利用过特定项目且对特定项目进行了评价的其他用户对特定项目的利用频度、以及对特定项目的评价值,来导出对特定项目的评价值相对于特定项目的利用频度的函数,并使用一个用户对特定项目的利用频度和函数,来计算一个用户对特定项目的预测评价值,从而能够进一步高精度地对预测评价值进行计算。此外,即使其他用户的利用频度与一个用户的利用频度是离散的值,也能够通过函数的插值来计算预测评价值。另一方面,本发明为一种协同过滤方法,其使用了多个用户各自对项目的评价值,其中,所述协同过滤方法包括相似度计算工序,在所述相似度计算工序中,当不存在对第一项目以及第二项目的双方均进行了评价的至少一个用户的评价值时,使用第三项目的评价值来计算第一项目与第二项目的相似度,其中,所述第三项目为,存在对第一项目以及第三项目的双方均进行了评价的至少一个用户的评价值、且存在对第二项目以及第三项目的双方均进行了评价的至少一个用户的评价值的项目;预测评价值计算工序,在所述预测评价值计算工序中,使用在相似度计算工序中计算出的第一项目与第二项目的相似度、和对第一项目以及第二项目的评价值,来计算对第一项目以及第二项目中的某一个项目未进行评价的用户的预测评价值。此时,优选为,在相似度计算工序中,当对于第三项目的个数为N个、且KiSN的第i个第三项目而言,作为皮尔逊的积差相关系数的、第一项目与第三项目的相似度用s(Cl,C3i)来表示,且作为皮尔逊的积差相关系数的、第二项目与第三项目的相似度用s(C2,C3i)来表示时,通过下述式(2)来计算作为第一项目与第二项目的相似度的s (C1,C2),数学式权利要求
1.一种协同过滤系统,其使用了多个用户各自对项目的评价值,其中, 所述协同过滤系统具备 相似度计算单元,当不存在对第一项目以及第二项目的双方均进行了评价的、至少一个用户的评价值时,所述相似度计算单元使用第三项目的评价值来计算所述第一项目与所述第二项目的相似度,其中,所述第三项目为,存在对所述第一项目以及所述第三项目的双方均进行了评价的至少一个用户的评价值、且存在对所述第二项目以及所述第三项目的双方均进行了评价的至少一个用户的评价值的项目; 预测评价值计算单元,其使用由所述相似度计算单元计算出的所述第一项目与所述第二项目的相似度、和对所述第一项目以及所述第二项目的评价值,来计算对所述第一项目以及所述第二项目中的某一个项目未进行评价的用户的预测评价值。
2.如权利要求I所述的协同过滤系统,其中, 当对于所述第三项目的个数为N个、且I < i < N的第i个所述第三项目而言,作为皮尔逊的积差相关系数的、所述第一项目与所述第三项目的相似度用s (Cl,C3i)来表示,且作为皮尔逊的积差相关系数的、所述第二项目与所述第三项目的相似度用s (C2,C3i)来表示时,所述相似度计算单元通过下述式(I)来计算作为所述第一项目与所述第二项目的相似度的s (Cl,C2), 数学式I
3.一种协同过滤系统,其使用了多个用户各自对项目的评价值,其中, 所述协同过滤系统具备预测评价值计算单元,对于利用过特定项目、且对所述特定项目未进行评价的一个用户,所述预测评价值计算单元使用所述一个用户对所述特定项目的利用频度、和利用过所述特定项目且对所述特定项目进行了评价的其他用户对所述特定项目的利用频度以及对所述特定项目的评价值,来计算所述一个用户对所述特定项目的预测评价值。
4.如权利要求I或2所述的协同过滤系统,其中, 对于利用过特定项目且对所述特定项目未进行评价的一个用户,所述预测评价值计算单元使用所述一个用户对所述特定项目的利用频度、和利用过所述特定项目且对所述特定项目进行了评价的其他用户对所述特定项目的利用频度以及对所述特定项目的评价值,来计算所述一个用户对所述特定项目的预测评价值。
5.如权利要求3或4所述的协同过滤系统,其中, 所述预测评价值计算单元使用所述一个用户对所述特定项目的利用频度、和其他用户对所述特定项目的利用频度以及对所述特定项目的评价值,来计算所述一个用户对所述特定项目的预测评价值,其中,所述其他用户对所述特定项目的利用频度为,所述特定项目的利用频度与所述一个用户对所述特定项目的利用频度之间存在预定的阈值以内的差异。
6.如权利要求3至5中的任一项所述的协同过滤系统,其中, 所述预测评价值计算单元使用所述一个用户对所述特定项目的利用频度、和其他用户对所述特定项目的利用频度以及对所述特定项目的评价值,来计算所述一个用户对所述特定项目的预测评价值,其中,所述其他用户对所述特定项目的利用频度为,所述特定项目所属的类别内的非特定多数的项目的利用频度与所述一个用户对所述非特定多数的项目的利用频度之间存在预定的阈值以内的差异。
7.如权利要求3至6中的任一项所述的协同过滤系统,其中, 所述预测评价值计算单元使用所述一个用户对所述特定项目的利用频度,和多个所述其他用户各自对所述特定项目的利用频度中的每一个利用频度的、对所述特定项目的评价值的中央值以及平均值中的某一个值,来计算所述一个用户对所述特定项目的预测评价值。
8.如权利要求3至7中的任一项所述的协同过滤系统,其中, 所述预测评价值计算单元根据利用过特定项目且对所述特定项目进行了评价的其他用户对所述特定项目的利用频度、以及对所述特定项目的评价值,来导出对所述特定项目的评价值相对于所述特定项目的利用频度的函数,并使用所述一个用户对所述特定项目的利用频度和所述函数,来计算所述一个用户对所述特定项目的预测评价值。
9.一种协同过滤方法,其使用了多个用户各自对项目的评价值,其中, 所述协同过滤方法包括 相似度计算工序,在所述相似度计算工序中,当不存在对第一项目以及第二项目的双方均进行了评价的至少一个用户的评价值时,使用第三项目的评价值来计算所述第一项目与所述第二项目的相似度,其中,所述第三项目为,存在对所述第一项目以及所述第三项目的双方均进行了评价的至少一个用户的评价值、且存在对所述第二项目以及所述第三项目的双方均进行了评价的至少一个用户的评价值的项目; 预测评价值计算工序,在所述预测评价值计算工序中,使用在所述相似度计算工序中计算出的所述第一项目与所述第二项目的相似度、和对所述第一项目以及所述第二项目的评价值,来计算对所述第一项目以及所述第二项目中的某一个项目未进行评价的用户的预测评价值。
10.如权利要求9所述的协同过滤方法,其中 在所述相似度计算工序中,当对于所述第三项目的个数为N个、且I < i < N的第i个所述第三项目而言,作为皮尔逊的积差相关系数的、所述第一项目与所述第三项目的相似度用s (Cl,C3i)来表示,且作为皮尔逊的积差相关系数的、所述第二项目与所述第三项目的相似度用s (C2,C3i)来表示时,通过下述式(2)来计算作为所述第一项目与所述第二项目的相似度的s (C1,C2), 数学式2
11.一种协同过滤方法,其使用了多个用户各自对项目的评价值,其中, 所述协同过滤方法包括预测评价值计算工序,在所述预测评价值计算工序中,对于利用过特定项目且对所述特定项目未进行评价的一个用户,使用所述一个用户对所述特定项目的利用频度、和利用过所述特定项目且对所述特定项目进行了评价的其他用户对所述特定项目的利用频度以及对所述特定项目的评价值,来计算所述一个用户对所述特定项目的预测评价值。
12.如权利要求9或10所述的协同过滤方法,其中, 在所述预测评价值计算工序中,对于利用过特定项目且对所述特定项目未进行评价的一个用户,使用所述一个用户对所述特定项目的利用频度、和利用过所述特定项目且对所述特定项目进行了评价的其他用户对所述特定项目的利用频度以及对所述特定项目的评价值,来计算所述一个用户对所述特定项目的预测评价值。
13.如权利要求11或12所述的协同过滤方法,其中, 在所述预测评价值计算工序中,使用所述一个用户对所述特定项目的利用频度、和其他用户对所述特定项目的利用频度以及对所述特定项目的评价值,来计算所述一个用户对所述特定项目的预测评价值,其中,所述其他用户对所述特定项目的利用频度为,所述特定项目的利用频度与所述一个用户对所述特定项目的利用频度之间存在预定的阈值以内的差异。
14.如权利要求11至13中的任一项所述的协同过滤方法,其中, 在所述预测评价值计算工序中,使用所述一个用户对所述特定项目的利用频度、和其他用户对所述特定项目的利用频度以及对所述特定项目的评价值,来计算所述一个用户对所述特定项目的预测评价值,其中,所述其他用户对所述特定项目的利用频度为,所述特定项目所属的类别内的非特定多数的项目的利用频度与所述一个用户对所述非特定多数的项目的利用频度之间存在预定的阈值以内的差异。
15.如权利要求11至14中的任一项所述的协同过滤方法,其中, 在所述预测评价值计算工序中,使用所述一个用户对所述特定项目的利用频度,和多个所述其他用户各自对所述特定项目的利用频度中的每一个利用频度的、对所述特定项目的评价值的中央值以及平均值中的某一个值,来计算所述一个用户对所述特定项目的预测评价值。
16.如权利要求11至15中的任一项所述的协同过滤方法,其中, 在所述预测评价值计算工序中,根据利用过特定项目且对所述特定项目进行了评价的其他用户对所述特定项目的利用频度、以及对所述特定项目的评价值,来导出对所述特定项目的评价值相对于所述特定项目的利用频度的函数,并使用所述一个用户对所述特定项目的利用频度和所述函数,来计算所述一个用户对所述特定项目的预测评价值。
全文摘要
一种协调过滤系统以及协调过滤方法。当不存在对项目(X)和项目(Z)的双方均进行了评价的用户的评价值时,信息处理中心(10a)的运算处理部(30)的间接相似度计算部(32)使用项目(Y)的评价值来间接地计算项目(X)与项目(Z)的相似度,该项目(Y)为,存在对项目(X)和项目(Y)的双方均进行了评价的用户的评价值、且存在对项目(Y)和项目(Z)的双方均进行了评价的用户的评价值的项目。预测评价值计算部(33)使用间接相似度计算部(32)计算出的项目(X)与项目(Z)的相似度,和对项目(X)以及项目(Z)的评价值,来计算对项目(X)和项目(Z)中的某一个未进行评价的用户的预测评价值。由此,能够计算出不能直接计算的、项目(X)和项目(Z)的预测评价值。由此,能够扩大可通过协同过滤而对评价值进行预测的项目的范围。
文档编号G06F17/30GK102640141SQ20098016267
公开日2012年8月15日 申请日期2009年12月18日 优先权日2009年12月18日
发明者井原直树, 吉津沙耶香, 木村雄喜, 横山好纪 申请人:丰田自动车株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1