信息处理设备、方法及其程序、信息处理系统及其方法

文档序号:6442910阅读:117来源:国知局
专利名称:信息处理设备、方法及其程序、信息处理系统及其方法
技术领域
本发明涉及一种信息处理设备、信息处理方法、实施信息处理方法的程序、信息处理系统和信息处理系统的方法,更具体地说,涉及这样的信息处理设备、信息处理方法、实施信息处理方法的程序、信息处理系统和信息处理系统的方法,其中在相似性的计算中使用指示用户的喜好的信息以适当地选择要推荐给用户的内容。
背景技术
公知的是基于内容信息比如EPG(电子节目导视)选择与用户的喜好匹配的内容比如电视或无线电广播节目并将所选择的内容推荐给用户。在下文中,电视或无线电广播节目被简单地称为节目,除非与计算机程序混淆。已知有不同的方法获取指示用户的喜好的信息,并根据获取指示用户的喜好的信息的方法将内容以各种方式推荐给用户。例如,登记用户收视的电视广播节目,并基于日志数据推荐节目。
在这种技术中,在每次用户收视节目时,存储与收视过的节目相关的元数据。在所存储的元数据的量达到特定的水平时,借助于tf/idf方法或根据发生的频率将权重分配给每个元数据(或指示多个节目元数据共有的属性的数据)。然后对每个节目的元数据产生矢量以使矢量的元素由各个权重给定(在下文中,将这种矢量称为特征矢量)。此外,基于一个或多个特征矢量产生指示用户喜好的矢量(在下文中称为用户喜好矢量)。在基于节目收视日志数据的常规技术中,用户喜好矢量用作表示用户的喜好的信息。与候选节目相关的内容元矢量(其元素通过分配给候选节目的节目元数据的权重给定的矢量)相对于用户的喜好矢量的相似性。如果确定相似性较高,则将该候选节目推荐给用户。
在基于节目收视日志数据的这种常规技术中,用户喜好矢量的维数数量(元素的数量)增加,因此操作的复杂度随内容(TV节目)的类型(即随节目元数据的数量)增加。为解决上述的问题,公知的是,采用各种技术减小维数数量。
例如,公知的是,通过奇异值分解(主分量分析)将所有的矢量投影到最佳的基线(轴),由此减小维数数量(例如,参考(1)日本未审查专利申请出版物No.2001-155063,(2)1989年6月13日的美国专利US4,839,853“Computer information retrieval using latentsemantic structure”,(3)1994年4月5日的美国专利US5,301,109“Ccomputerized cross-language document retrieval usinglatent semantic indexing”)。
然而,在基于节目收视日志数据的常规技术中,用户喜好矢量(在候选节目的相似性的计算中用作参考)不一定指示用户的正确的喜好,因此基于用户的喜好矢量推荐的内容(TV节目)通常被用户拒绝。

发明内容
考虑到上述的问题,本发明的一个目的是提供一种在要推荐的内容的相似性计算中使用正确地指示用户的喜好的信息的技术。
在一方面中,本发明提供一种信息处理设备,该信息处理设备包括修改装置、产生装置和相似性计算装置,该修改装置用于获取每个包括N条单个信息的M个信息组并至少部分地修改M个信息组中每个的N条单个信息以便突出在N条单个信息中的相关性,这里N是等于或大于2的整数,M是等于或大于1的整数,该产生装置用于产生包括基于M个信息组所形成的N条单个信息的参考信息组,该M个信息组中每个包括通过修改装置修改的N条单个信息,该相似性计算装置用于获取包括N个单个信息元素的新信息组作为比较信息组并计算比较信息组相对于由产生装置产生的参考信息组的相似性。
通过修改装置获取的M个信息组每个的N条单个信息可以包括指示特定的内容或特定的内容的一部分或指示该内容的属性的至少一条或多条内容元信息,并且也包括指示用户使用内容的内部或外部状态的至少一条或多条上下文(context)信息。
上下文信息可以包括作为权重分配给指示用户的空间位置的位置信息的值或它的归一化值。
上下文信息可以包括作为权重值分配给指示用户的情绪的情绪信息的值或它的归一化值。
上下文信息可以包括通过用户或通过设置在用户的附近的传感器获取的值或它的归一化值。
修改装置可以包括矢量化装置和矩阵产生装置,在每次用户使用内容时,该矢量化装置用于获取包括与该内容相关的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,以及产生其元素通过分配给各个N条单个信息的权重值给定的矢量作为该内容的特征矢量,以及在通过矢量化装置产生M个特征矢量时该矩阵产生装置用于产生具有N行和M列的第一矩阵以使它的元素由该M个特征矢量给定,对第一矩阵执行操作以便将第一矩阵转换为其N×M个元素至少被部分地修改的第二矩阵以便突出在M列的每列中N行元素的相关性,其中产生装置可以基于通过矩阵产生装置产生的第二矩阵的M列产生包括N个元素的参考信息组,以及相似性计算装置可以从比较信息组中产生包括N个元素的比较矢量并计算在比较矢量和由产生装置产生的参考矢量之间的相似性。
产生装置可以选择第二矩阵的M列的至少一个或多个列并将在所有选择的列中的每行中的元素相加在一起,由此产生参考矢量。
产生装置可以根据对应于上下文信息的元素从第二矩阵的M列中选择彼此具有较高的相似性的列并将在所有选择的列中的每行中的元素相加在一起,由此产生参考矢量。
产生装置可以根据对应于上下文信息的元素从第一矩阵的M列中选择彼此具有较高的相似性的列,并进一步从第二矩阵中选择对应于第一矩阵的所选择的列的列并将在从第二矩阵中选择的所有的列中的每行中的元素相加在一起,由此产生参考矢量。
产生装置通过直接运用由矩阵产生装置产生的第二矩阵的各个M列可以产生参考矢量。
矢量化装置可以通过使用N条单个信息中的每个在该内容中出现的频率或基于出现频率的归一化值将权重值分配给N条单个信息中的每个。
矢量化装置可以产生其元素分别通过分配给各个N条单个信息的权重值和N个可变系数的乘积给定的特征矢量。
相似性计算装置可以计算通过如下过程计算相似性获取包括与新内容关联的N条单个信息的信息组作为比较信息,将权重值分配给N条单个信息中的每个,产生其元素通过分配给N条单个信息的权重值给定的比较矢量,以及计算在比较矢量和参考矢量之间相似性,以及信息处理设备进一步可以包括提供(presentation)装置,如果通过相似性计算装置计算的相似性等于或高于阈值则该提供装置将新内容作为推荐内容提供给用户。
在提供装置将推荐的内容提供给用户时,提供装置也可以提供基于参考矢量推荐的原因。
相似性计算装置可以通过如下过程计算相似性在产生比较矢量之前,进一步获取包括与用户当前使用的内容关联的N条单个信息的信息组,将权重值分配给各个N条单个信息,产生其元素由分配给用户当前使用的内容的各个N条单个信息的权重值给定的特征矢量,计算在产生的特征矢量和由产生装置产生的一个或多个参考矢量之间的相似性,基于具有等于或高于阈值的相似性的参考矢量产生的新的参考矢量,以及在产生了比较矢量之后,计算在参考矢量和比较矢量之间的相似性。
相似性计算装置可以通过如下过程计算相似性在产生比较矢量之前,进一步获取指示用户所在的当前上下文的一条或多条上下文信息,将权重值分配给各条的上下文信息,产生其对应于各条的上下文信息的元素由分配的权重值给定以及其它的元素由0给定的当前上下文特征矢量,计算在当前上下文特征矢量和由产生装置产生的一个或多个参考矢量之间的相似性,基于具有等于或高于阈值的相似性的参考矢量产生的新的参考矢量,以及在产生了比较矢量之后,计算在参考矢量和比较矢量之间的相似性。
矩阵产生装置可以通过如下过程产生第二矩阵将第一矩阵分解为具有N行和N列的第一分量矩阵、具有N行和M列的第二分量矩阵和具有M行和M列的第三分量矩阵的转置阵的乘积,从第一分量矩阵中产生具有N行和K列的第四分量矩阵(这里K是小于第一矩阵的等级的整数),从第二分量矩阵中产生具有K行和K列的第五分量矩阵,以及从第三分量矩阵中产生具有M行和K列的第六分量矩阵,以及产生通过第四分量矩阵、第五分量矩阵和第六分量矩阵的转置阵的乘积给定第二矩阵。
相似性计算装置可以通过如下过程计算相似性获取包括与新内容关联的N条单个信息的信息组作为比较信息,将权重值分配给各个N条单个信息,产生其元素由分配给各个N条单个信息的权重值给定的比较特征矢量,通过将比较矢量和参考矢量从左边乘以第四分量矩阵的转置阵将比较矢量和参考矢量转换为其维数降低到K的矢量,以及计算维数减小到K的比较矢量和维数减小到K的参考矢量之间的相似性,其中信息处理设备进一步可以包括提供装置,如果通过相似性计算装置计算的相似性等于或高于阈值,则提供装置将新内容作为推荐的内容提供给用户。
在提供装置将推荐的内容提供给用户时,提供装置也可以提供基于参考矢量推荐的原因。
相似性计算装置可以通过如下过程计算相似性在产生比较矢量之前,进一步获取包括与用户当前使用的内容关联的N条单个信息的信息组,将权重值分配给各个N条单个信息,产生其元素由分配给用户当前使用的内容的各个N条单个信息的权重值给定的特征矢量,通过将特征矢量和一个或多个参考矢量从左边乘以第四分量矩阵的转置阵将所产生的特征矢量和一个或多个参考矢量转换为其维数降低到K的矢量,以及计算维数减小到K的特征矢量和维数减小到K的一个或多个参考矢量之间的相似性,以及基于具有等于或高于阈值的相似性的维数减小的参考矢量产生新的K-维参考矢量,在产生了比较矢量之后,通过将比较矢量从左边乘以第四分量矩阵的转置阵将比较矢量转换为其维数降低到K的矢量,以及计算在新的K-维参考矢量和维数减小到K的比较矢量之间的相似性。
相似性计算装置可以通过如下过程计算相似性在产生比较矢量之前,进一步获取指示用户所在的当前上下文的一条或多条上下文信息,将权重值分配给各条的上下文信息,产生其对应于各条的上下文信息的元素由分配的权重值给定以及其它的元素由0给定的当前上下文特征矢量,通过将当前上下文特征矢量和一个或多个参考矢量从左边乘以第四分量矩阵的转置阵将当前上下文特征矢量和由产生装置产生的一个或多个参考矢量转换为其维数降低到K的矢量,以及计算维数减小到K的当前上下文特征矢量和维数减小到K的一个或多个参考矢量之间的相似性,以及基于具有等于或高于阈值的相似性的维数减小的参考矢量产生新的K-维参考矢量,在产生了比较矢量之后,通过将比较矢量从左边乘以第四分量矩阵的转置阵将比较矢量转换为其维数降低到K的矢量,以及计算在新的K-维参考矢量和维数减小到K的比较矢量之间的相似性。
在每次产生特征矢量时,矢量化装置可以将产生的特征矢量分类为指示用户的肯定喜好因素的肯定喜好特征矢量或者指示用户的否定喜好因素的否定喜好特征矢量。
矩阵产生装置可以使用由矢量化装置产生的M个肯定喜好特征矢量产生第二矩阵。
信息处理设备可以进一步包括通过使用矩阵产生装置产生的第二矩阵的列作为训练数据通过学习分类用于产生分类器的学习装置和分类装置,该分类装置用于通过如下过程进行分类获取包括与新内容关联的N条单个信息的信息组,产生其元素通过分配给新内容的各个N条单个信息的权重值给定的特征矢量,以及使用由学习装置产生的分类器对与新内容关联的特征矢量分类为肯定喜好特征矢量或否定喜好特征矢量。
相似性计算装置可以运用通过分类装置分类为肯定喜好特征矢量的特征矢量作为比较矢量并计算在比较矢量和参考矢量之间的相似性。
信息处理设备进一步可以包括登记装置,该登记装置用于选择通过矩阵产生装置产生的第二矩阵的列的一个或多个特定的元素并在用户的个人字典中登记识别每个所选择的元素的字作为用户感兴趣的字或用户不感兴趣的字。
在通过矢量化装置产生M个否定喜好特征矢量时,矩阵产生装置可以进一步使用M个否定喜好特征矢量产生第二矩阵,产生装置可以基于通过矩阵产生装置产生的M个肯定喜好特征矢量从通过矩阵产生装置产生的第二矩阵中产生第一参考矢量,以及进一步基于否定喜好特征矢量从通过矩阵产生装置产生的第二矩阵中产生第二参考矢量,以及相似性计算装置可以计算在比较矢量和第一参考矢量之间的第一相似性,也计算在比较矢量和第二参考矢量之间的第二相似性。
相似性计算装置可以获取包括与新内容关联的N条单个信息的信息组作为比较信息,将权重值分配给N条单个信息中的每个,产生其元素由分配给N条单个信息的权重值给定的比较矢量,以及计算第一相似性和第二相似性,该信息处理设备进一步可以包括提供装置,该提供装置用于基于通过相似性计算装置计算的第一相似性和第二相似性确定新内容是否适合作为要推荐的内容,并且如果确定新内容是适合的则将新内容作为推荐的内容提供给用户。
在提供装置将推荐的内容提供给用户时,提供装置也可以提供基于参考矢量推荐的原因。
如果第一相似性等于或高于第一阈值并且第二相似性低于第二阈值,则提供装置可以确定新内容适合作为推荐的内容并将新内容作为推荐的内容提供给用户。
如果第一相似性等于或高于第二相似性并且第二相似性低于阈值,则提供装置可以确定新内容适合作为推荐的内容并将新内容作为推荐的内容提供给用户。
在一方面中,本发明提供一种信息处理方法,该信息处理方法包括修改步骤、产生步骤和相似性计算步骤,该修改步骤用于获取每个包括N条单个信息的M个信息组并至少部分地修改M个信息组中每个的N条单个信息以便突出在N条单个信息中的相关性,这里N是等于或大于2的整数,M是等于或大于1的整数,该产生步骤用于从M个信息组中产生包括N条单个信息的参考信息组以在相似性的计算中用作参考,该M个信息组中每个包括在修改步骤中修改的N条单个信息,该相似性计算步骤用于获取包括N个单个信息元素的新信息组作为比较信息组并计算比较信息组相对于在产生步骤中产生的参考信息组的相似性。
在一方面中,本发明提供一种计算机执行的程序,该程序包括修改步骤、产生步骤和相似性计算步骤,该修改步骤用于获取每个包括N条单个信息的M个信息组并至少部分地修改M个信息组中每个的N条单个信息以便突出在N条单个信息中的相关性,这里N是等于或大于2的整数,M是等于或大于1的整数,该产生步骤用于从M个信息组中产生包括N条单个信息的参考信息组以在相似性的计算中用作参考,该M个信息组中每个包括在修改步骤中修改的N条单个信息,该相似性计算步骤用于获取包括N个单个信息元素的新信息组作为比较信息组并计算比较信息组相对于在产生步骤中产生的参考信息组的相似性。
在上文描述的信息处理设备、信息处理方法和程序中,在获取包括N(≥2)条单个信息的M(≥1)的信息组时,至少部分地修改M个信息组中每个的N条单个信息以便突出在N条单个信息中的相关性。然后从每个包括修改的N条单个信息的M个信息组中形成在相似性的计算中用作参考的包括N条单个信息的参考信息组。此后,如果给定包括N条单个信息的新信息组,则计算这个新信息组相对于参考信息组的相似性。
在一方面中,本发明提供一种信息处理设备,该信息处理设备包括矢量化装置、矩阵产生装置、参考矢量产生装置、候选内容获取装置、相似性计算装置和提供装置,该矢量化装置用于在每次用户使用内容时获取包括与该内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,并形成其元素通过分配给各个N条单个信息的权重值给定的矢量作为该内容的特征矢量,该矩阵产生装置用于在通过矢量化装置形成M个特征矢量时形成具有N行和M列的第一矩阵以使它的元素由该M个特征矢量给定,对第一矩阵执行操作以便将第一矩阵转换为其N×M个元素至少被部分修改的第二矩阵以便突出在M个列中每个列的N行元素中的相关性,该参考矢量产生装置用于从通过矩阵产生装置形成的第二矩阵的M列中形成在相似性的计算中作为参考的包括N个元素的参考矢量,该候选内容获取装置用于在每次通过参考矢量产生装置形成参考矢量时基于参考矢量获取要推荐给用户的内容的候选内容,该相似性计算装置用于获取包括与新内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,形成其元素通过由分配给N条单个信息的权重值给定的比较矢量,以及计算在比较矢量和由参考矢量产生装置形成的一个或多个参考矢量之间的相似性,该提供装置用于从通过候选内容获取装置获取的候选内容中选择对应于其通过相似性计算装置计算的相似性等于或高于阈值的参考矢量的候选内容并将所选择的候选内容作为推荐内容提供给用户。
在一方面中,本发明提供一种信息处理方法,该信息处理方法包括矢量化步骤、矩阵产生步骤、参考矢量产生步骤、相似性计算步骤和提供步骤,该矢量化步骤用于在每次用户使用内容时获取包括与该内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,并形成其元素通过分配给各个N条单个信息的权重值给定的矢量作为该内容的特征矢量,该矩阵产生步骤用于当在矢量化步骤中形成M个特征矢量时形成具有N行和M列的第一矩阵以使它的元素由该M个特征矢量给定,对第一矩阵执行操作以便将第一矩阵转换为其N×M个元素至少被部分修改的第二矩阵以便突出在M个列中每个列的N行元素中的相关性,该参考矢量产生步骤用于从通过矩阵产生步骤形成的第二矩阵的M列中形成在相似性的计算中作为参考的包括N个元素的参考矢量,该相似性计算步骤用于获取包括与新内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,形成其元素通过由分配给N条单个信息的权重值给定的比较矢量,以及计算在比较矢量和在参考矢量产生步骤中形成的一个或多个参考矢量之间的相似性,该提供步骤用于从在候选内容获取步骤中获取的候选内容中选择对应于其通过相似性计算装置计算的相似性等于或高于阈值的参考矢量的候选内容并将所选择的候选内容作为推荐内容提供给用户。
在一方面中,本发明提供一种计算机执行的程序,该程序包括矢量化步骤、矩阵产生步骤、参考矢量产生步骤、相似性计算步骤和提供步骤,该矢量化步骤用于在每次用户使用内容时获取包括与该内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,并形成其元素通过分配给各个N条单个信息的权重值给定的矢量作为该内容的特征矢量,该矩阵产生步骤当在矢量化步骤中形成M个特征矢量时形成具有N行和M列的第一矩阵以使它的元素由该M个特征矢量给定,对第一矩阵执行操作以便将第一矩阵转换为其N×M个元素至少被部分修改的第二矩阵以便突出在M个列中每个列的N行元素中的相关性,该参考矢量产生步骤用于从通过矩阵产生步骤形成的第二矩阵的M列中形成在相似性的计算中作为参考的包括N个元素的参考矢量,该相似性计算步骤用于获取包括与新内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,形成其元素通过由分配给N条单个信息的权重值给定的比较矢量,以及计算在比较矢量和在参考矢量产生步骤中形成的一个或多个参考矢量之间的相似性,该提供步骤用于从在候选内容获取步骤中获取的候选内容中选择对应于其通过相似性计算装置计算的相似性等于或高于阈值的参考矢量的候选内容并将所选择的候选内容作为推荐内容提供给用户。
在上文描述的信息处理设备、信息处理方法和程序中,在每次用户使用内容时,获取包括与该内容关联的N条单个信息的信息组,将权重值分配给各个N条单个信息,以及为该内容形成其元素通过分配给各个N条单个信息的权重值给定的特征矢量。在以上述方式已经形成了M个特征矢量时,形成具有N行和M列的第一矩阵以使矩阵的列由各个M个特征矢量给定。然后对第一矩阵执行操作以将第一矩阵转换为其N×M个元素至少被部分修改的第二矩阵以便突出在M个列中每个列的N行元素中的相关性。然后基于第二矩阵的M个列形成在相似性计算中用作参考的包括N个元素的参考矢量。在每次以上述的方式形成参考矢量时,基于参考矢量确定要推荐给用户的内容的候选内容。在获取包括与新内容关联的N条单个信息的信息组时,将权重值分配给各个N条单个信息,以及形成其元素由分配给各个N条单个信息的权重值给定的比较特征矢量。此外,计算在比较矢量和一个或多个参考矢量之间的相似性。对应于具有等于或高于阈值的相似性的参考矢量的内容被选择并推荐给用户。
在一方面中,本发明提供一种信息处理设备,该信息处理设备包括矢量化装置、矩阵产生装置和类型设置装置,该矢量化装置用于在每次用户使用内容时获取包括与该内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,并形成其元素通过分配给各个N条单个信息的权重值给定的矢量作为该内容的特征矢量,该矩阵产生装置用于在通过矢量化装置形成M个特征矢量时形成具有N行和M列的第一矩阵以使它的元素由该M个特征矢量给定,对第一矩阵执行操作以便将第一矩阵转换为其N×M个元素至少被部分修改的第二矩阵以便突出在M个列中每个列的N行元素中的相关性,该类型设置装置计算通过矩阵产生装置形成的第二矩阵的M列中的相似性,基于所计算的相似性对M个列中的每个进行分类,以及设置在分类中获得的每个类别作为类型。
该类型设置装置可以通过使用属于该类型的列作为训练数据通过学习每种类型的类别形成分类器,该信息处理设备进一步可以包括分类装置,该分类装置用于通过如下方式进行分类获取包括与新内容关联的N条单个信息的信息组,将权重值分配给各个N条单个信息,形成其元素通过分配给新内容的各个N条单个信息的权重值给定的特征矢量,以及使用通过类型设置装置形成的分类器将与新内容关联的特征矢量分类作为由类型设置装置设定的类型中的一种类型。
在每次类型设置装置设定一种类型时,类型设置装置可以从属于该类型的列中选择元素并基于所选择的元素将名字分配给该类型。
在一方面中,本发明提供一种信息处理方法,该信息处理方法包括矢量化步骤、矩阵产生步骤和类型设置步骤,该矢量化步骤用于在每次用户使用内容时获取包括与该内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,并形成其元素通过分配给各个N条单个信息的权重值给定的矢量作为该内容的特征矢量,该矩阵产生步骤用于在矢量化步骤中形成M个特征矢量时形成具有N行和M列的第一矩阵以使它的元素由该M个特征矢量给定,对第一矩阵执行操作以便将第一矩阵转换为其N×M个元素至少被部分修改的第二矩阵以便突出在M个列中每个列的N行元素中的相关性,该类型设置步骤计算在矩阵产生步骤中形成的第二矩阵的M列中的相似性,基于所计算的相似性对M个列中的每个进行分类,以及设置在分类中获得的每个类别作为类型。
在一方面中,本发明提供一种程序,该程序包括矢量化步骤、矩阵产生步骤和类型设置步骤,该矢量化步骤用于在每次用户使用内容时获取包括与该内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,并形成其元素通过分配给各个N条单个信息的权重值给定的矢量作为该内容的特征矢量,该矩阵产生步骤用于在矢量化步骤中形成M个特征矢量时形成具有N行和M列的第一矩阵以使它的元素由该M个特征矢量给定,对第一矩阵执行操作以便将第一矩阵转换为其N×M个元素至少被部分修改的第二矩阵以便突出在M个列中每个列的N行元素中的相关性,该类型设置步骤计算在矩阵产生步骤中形成的第二矩阵的M列中的相似性,基于所计算的相似性对M个列中的每个进行分类,以及设置在分类中获得的每个类别作为类型。
在上述的信息处理设备、信息处理方法和程序中,在每次用户使用内容时,获取包括与该内容关联的N条单个信息的信息组,将权重值分配给各个N条单个信息,以及为该内容形成其元素通过分配给各个N条单个信息的权重值给定的特征矢量。在以上述方式已经形成了M个特征矢量时,形成具有N行和M列的第一矩阵以使矩阵的列由各个M个特征矢量给定。然后对第一矩阵执行操作以将第一矩阵转换为其N×M个元素至少被部分修改的第二矩阵以便突出在M个列中每个列的N行元素中的相关性。然后计算在第二矩阵的M列中的相似性,以及基于所计算的相似性对M个列中的每个进行分类。设定在分类中获得的每个类别作为类型。
在一方面中,本发明提供一种包括服务器和由用户使用的客户的信息处理系统,该信息处理系统包括矢量化装置、矩阵产生装置、参考矢量产生装置和相似性计算装置,该矢量化装置用于在每次用户使用内容时获取包括与该内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,并形成其元素通过分配给各个N条单个信息的权重值给定的矢量作为该内容的特征矢量,该矩阵产生装置用于在通过矢量化装置形成M个特征矢量时形成具有N行和M列的第一矩阵以使它的元素由该M个特征矢量给定,对第一矩阵执行操作以便将第一矩阵转换为其N×M个元素至少被部分修改的第二矩阵以便突出在M个列中每个列的N行元素中的相关性,该参考矢量产生装置用于从通过矩阵产生装置形成的第二矩阵的M列中形成在相似性的计算中作为参考的包括N个元素的参考矢量,该相似性计算装置用于如下地计算相似性获取包括N条单个信息的新信息组,将权重值分配给各个N条单个信息,形成其元素通过由分配给各个N条单个信息的权重值给定的比较特征矢量,以及计算在比较矢量和由参考矢量产生装置形成的参考矢量之间的相似性,其中在矢量化装置、矩阵产生装置、参考矢量产生装置和相似性计算装置中,至少矩阵产生装置包括在服务器中。
在一方面中,本发明提供一种用于包括服务器和由用户使用的客户的信息处理系统的信息处理方法,该信息处理方法包括矢量化步骤、矩阵产生步骤、参考矢量产生步骤和相似性计算步骤,该矢量化步骤用于在每次用户使用内容时获取包括与该内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,并形成其元素通过分配给各个N条单个信息的权重值给定的矢量作为该内容的特征矢量,该矩阵产生步骤用于当在矢量化步骤中形成M个特征矢量时形成具有N行和M列的第一矩阵以使它的元素由该M个特征矢量给定,对第一矩阵执行操作以便将第一矩阵转换为其N×M个元素至少被部分修改的第二矩阵以便突出在M个列中每个列的N行元素中的相关性,该参考矢量产生步骤用于从通过矩阵产生步骤形成的第二矩阵的M列中形成在相似性的计算中作为参考的包括N个元素的参考矢量,该相似性计算步骤包括如下子步骤以计算相似性获取包括N条单个信息的新信息组,将权重值分配给各个N条单个信息,形成其元素通过由分配给各个N条单个信息的权重值给定的比较特征矢量,以及计算在比较矢量和由参考矢量产生步骤形成的参考矢量之间的相似性,其中在矢量化步骤、矩阵产生步骤、参考矢量产生步骤和相似性计算步骤中,至少矩阵产生步骤由服务器执行。
在上文描述的信息处理系统及其方法中,通过服务器和/或客户执行至少下文描述的第一至第四过程。第一过程包括如下步骤在每次用户使用内容时,获取包括与该内容关联的N条单个信息的信息组,将权重值分配给各个N条单个信息中的每个,以及为该内容形成其元素通过分配给各个N条单个信息的权重值给定的矢量作为特征矢量。第二过程包括如下步骤在第一过程中形成了M个特征矢量时,形成具有N行和M列的第一矩阵以使它的元素由该M个特征矢量给定,对第一矩阵执行操作以将第一矩阵转换为其N×M个元素至少被部分修改的第二矩阵以便突出在M个列中每个列的N行元素中的相关性。第三过程包括如下步骤从在第二过程中形成的第二矩阵的M个列中形成在相似性计算中用作参考的包括N个元素的参考矢量。第四过程包括计算相似性的步骤,该步骤包括如下的子步骤获取包括N条单个信息的新信息组,将权重值分配给各个N条单个信息,形成其元素由分配给各个N条单个信息的权重值给定的比较特征矢量,以及计算在比较矢量和在第三过程中形成的参考矢量之间的相似性。当然在这些第一至第四过程中,通过服务器执行包括矩阵的计算的第二过程。
如上文所述,本发明允许在选择内容的相似性的计算过程中通过使用正确指示用户的喜好的信息将正确的内容推荐给用户。


附图1根据本发明的一种实施例信息处理设备的功能性方块图;附图2所示为用于输入上下文信息的屏幕的实例的附图;附图3所示为通过在附图1中所示的信息处理设备执行的UPV产生过程的实例的流程图;附图4所示为在附图3中所示的UPV产生过程中CCV产生过程的详细流程的实例的流程图;附图5所示为其元素通过内容元信息和上下文信息给定的特征矢量的实例的附图;附图6所示为在附图3中所示的UPV产生过程中近似矩阵(空间)产生过程的详细流程的实例的流程图;附图7所示为其列通过在附图5中所示的各个特征矢量给定的矩阵的附图;附图8所示为通过在附图7中所示的矩阵的奇异值分解获得的一个分量矩阵的附图;附图9所示为通过在附图7中所示的矩阵的奇异值分解获得的一个分量矩阵的附图;附图10所示为通过在附图7中所示的矩阵的奇异值分解获得的一个分量矩阵的附图;附图11所示为通过奇异值分解和维数降低从在附图5中所示的矩阵中获得的矩阵(在附图5中所示的矩阵的近似矩阵)的附图;附图12所示为在附图3中所示的UPV产生过程中CUPV产生过程的详细流程的实例的流程图;附图13所示为通过在附图1中所示的信息处理设备执行的内容推荐过程的实例的流程图;附图14所示为在附图13所示的内容推荐过程中CUPV设置过程的详细流程的实例的流程图;附图15所示为从当前上下文信息中形成的当前上下文特征矢量的实例的附图;附图16所示为在附图15中所示的当前上下文特征矢量相对于在附图11中所示的每个特征矢量(近似矩阵的列)的相似性的计算结果的实例的附图;附图17所示为在附图13中所示的内容推荐过程中内容推荐计算过程的详细流程的实例的流程图;附图18所示为根据本发明的另一实施例信息处理设备的功能性方块图;附图19所示为通过在附图18中所示的信息处理设备执行的UPV产生过程的实例的流程图;附图20所示为在附图19中所示的UPV产生过程中的CUPV产生过程的详细流程的实例的流程图;附图21所示为通过在附图18中所示的信息处理设备执行的在附图13中所示的内容推荐过程中的CUPV设置过程的实例的流程图;附图22所示为通过在附图18中所示的信息处理设备执行的在附图13中所示的内容推荐过程中的内容推荐计算过程的实例的流程图;附图23所示为通过在附图1中所示的信息处理设备执行的UPV产生过程的另一实例的流程图;附图24所示为在附图23中所示的UPV产生过程中的上下文相关页面获取过程的实例的流程图;附图25所示为在附图23中所示的UPV产生过程之后执行的内容推荐过程的实例的流程图;附图26所示为根据本发明的另一实施例信息处理设备的功能性方块图;附图27所示为通过在附图26中所示的信息处理设备执行的在附图3中所示的UPV产生过程中近似矩阵(空间)产生过程的实例的流程图;附图28所示为通过在附图26中所示的信息处理设备执行的在附图13中所示的内容推荐过程中的CUPV设置过程的实例的流程图;附图29所示为通过在附图26中所示的信息处理设备执行的在附图13中所示的内容推荐过程中的内容推荐计算过程的实例的流程图;附图30所示为根据本发明的另一实施例的信息处理设备的功能性方块图;附图31所示为通过在附图30中所示的信息处理设备执行的UPV产生过程的实例的流程图;附图32所示为在附图31中所示的UPV产生过程中的UP类型产生过程的详细流程的实例的流程图;附图33所示为通过在附图30中所示的信息处理设备执行的在附图13中所示的内容推荐过程中的内容推荐计算过程的实例的流程图;附图34所示为根据本发明的实施例的信息处理系统的方块图;附图35所示为根据本发明的实施例的信息处理设备的硬件结构的实例的方块图。
具体实施例方式
在描述本发明的优选实施例之前,描述在优选实施例中步骤/部件的特定实例和在各个权利要求中的步骤/部件之间的对应关系。注意,随后的描述的目的是要表明对应于各个权利要求的特定的实例描述在优选实施例中,由此随后的描述的目的并不是将各个权利要求的特定实例限制到在下文对应关系的描述中的实施例中。这就是说,在优选实施例中描述过但没有在下文对应关系的描述中描述的部件/步骤可以是对应于特定的权利要求的部件/步骤的部件/步骤。相反,在下文的对应关系的描述中描述的部件/步骤的具体实例可以对应于不同于在下文的对应关系的描述中描述的部件/步骤的权利要求的部件/步骤。
还要注意,从下文的对应关系的描述中不应该理解在优选实施例中描述的所有的特定的实例都描述在权利要求中。换句话说,下文的对应关系的描述并不否定这样的可能性可能存在对应于在优选实施例中描述过但没有包括在当前的权利要求中的特定的实例的权利要求,也就是说,下文的对应关系的描述并不排除这样的可能性通过分案或修改申请提交将来的权利要求。
现在描述对应关系。在一方面,本发明提供一种信息处理设备(例如在附图1、18或26中所示的信息处理设备(在下文的对应关系的描述中,假设在附图1中所示的信息处理设备对应于在这方面的信息处理设备,除非另外描述),包括修改装置(例如在附图1中所示的特征矢量(CCV)发生器21和矩阵计算器(空间发生器)22)),用于获取每个包括N条单个信息的M个信息组(例如在附图5中所示的总共16条内容元信息、上下文信息A和上下文信息B),并至少部分地修改M个信息组中每个的N条单个信息(例如基于在附图5中所示的信息产生的矩阵D(CCM)(附图7)被转换为在附图11中所示的矩阵Dk(CCM*))以便突出在N条单个信息中的相关性(例如突出在字“幼儿园”和字“孩子”之间的相关性或在附图5中所示的内容元信息和上下文信息A之间的相关性),这里N是等于或大于2的整数,M是等于大于1的整数,产生装置(例如,在附图1中所示的用户喜好矢量(UPV)发生器23),用于产生在相似性计算中用作参考的的参考信息组(例如用户喜好矢量UPV*),该参考信息组包括基于M个信息组(例如在附图11中所示的矩阵Dk(CCM*)的列(特征矢量)CCV*1至CCV*7)产生的N条单个信息,该M个信息组中每个包括通过修改装置修改的N条单个信息;和相似性计算装置(例如在附图1中所示的匹配单元31或匹配计算器31),用于获取包括N个单个信息元素的新信息组作为比较信息组并计算比较信息组相对于通过产生装置形成的参考信息组的相似性。
在这个信息处理设备中,通过修改装置获取的M个信息组中的每个的N条单个信息可以包括指示特定的内容或特定的内容的一部分或指示该内容的属性的至少一条或多条内容元信息(实例在附图5中示出,其中内容元信息是字,比如在作为内容给定的电子邮件消息中出现的“幼儿园”),并且也包括指示用户使用内容的内部或外部状态的至少一条或多条上下文信息(在电子邮件消息作为内容给定的实例中,外部状态的实例是用户读取电子邮件的空间位置(在附图5中的上下文信息A),内部状态的实例是用户读取电子邮件的情绪状态(在附图5中的上下文信息B))。
在这种信息处理设备中,上下文信息可以包括通过用户或通过设置在用户的附近的传感器(例如,在附图1中的传感器42)获取的值或它的归一化值。
在这种信息处理设备中,修改装置可以包括矢量化装置(例如在附图1中所示的特征矢量(CCV)发生器21),用于在每次用户使用内容时,获取包括与该内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,以及形成其元素通过分配给各个N条单个信息(例如在附图5中所示的矢量CCV1至CCV7)的权重值给定的矢量作为该内容的特征矢量,以及矩阵产生装置(例如在附图1中所示的矩阵计算器(空间发生器)22),用于在通过矢量化装置产生M个特征矢量时,该矩阵产生装置用于产生具有N行和M列的第一矩阵(如在附图7中所示的矩阵D(CCM))以使它的元素由该M个特征矢量给定,对第一矩阵执行操作(例如奇异值分解和维数降低)以便将第一矩阵转换为其N×M个元素至少被部分地修改的第二矩阵(例如在附图11中所示的矩阵Dk(CCM*))以便突出在M列的每列中N行元素的相关性,其中产生装置基于通过矩阵产生装置产生的第二矩阵的M列产生包括N个元素的参考矢量(例如用户喜好矢量UPV*)作为参考信息组,以及相似性计算装置可以从比较信息组中产生包括N个元素的比较矢量(例如与新内容关联的特征矢量CCV)并计算在比较矢量和由产生装置产生的参考矢量之间的相似性。
在这种信息处理设备中,相似性计算装置可以计算通过如下过程计算相似性获取包括与新内容关联的N条单个信息的信息组作为比较信息,将权重值分配给N条单个信息中的每个,产生其元素通过分配给N条单个信息的权重值给定的比较矢量(例如,与新内容关联的特征矢量CCV),以及计算在比较矢量和参考矢量之间相似性,以及信息处理设备进一步可以包括提供装置(例如,在附图1中所示的推荐器9),如果通过相似性计算装置计算的相似性等于或高于阈值则该提供装置将新内容作为推荐内容提供给用户。
在这种信息处理设备中,矩阵产生装置可以通过如下过程产生第二矩阵将第一矩阵分解(例如,根据公式(1))为具有N行和N列的第一分量矩阵((例如,在附图8中所示的分量矩阵U))、具有N行和M列的第二分量矩阵(例如,在附图9中所示的分量矩阵∑)和具有M行和M列的第三分量矩阵的转置阵(例如在附图10中所示的分量矩阵V)的乘积,从第一分量矩阵中产生具有N行和K列的第四分量矩阵(例如在附图8中所示的分量矩阵Uk)(这里K是小于第一矩阵的秩的整数),从第二分量矩阵中产生具有K行和K列的第五分量矩阵(例如在附图9中所示的分量矩阵∑k),从第三分量矩阵中产生具有M行和K列的第六分量矩阵(在附图10中所示的分量矩阵Vk),以及产生通过第四分量矩阵、第五分量矩阵和第六分量矩阵的转置阵的乘积(例如公式(2)的右手侧)给定第二矩阵(例如在附图11中所示的矩阵Dk(CCM*))。
在这种信息处理设备(例如在附图18中所示的信息处理设备)中,相似性计算装置(例如在附图18中所示的投影匹配单元101)可以通过如下过程计算相似性获取包括与新内容关联的N条单个信息的信息组作为比较信息,将权重值分配给N条单个信息中的每个,产生其元素由分配给各个N条单个信息的权重值给定的比较特征矢量,通过将比较矢量和参考矢量从左边乘以第四分量矩阵的转置阵将比较矢量和参考矢量转换为其维数降低到K的矢量,以及计算在具有减小到K的维数的比较矢量和具有减小到K的维数的参考矢量之间的相似性,其中信息处理设备进一步可以包括提供装置(例如在附图18中所示的推荐器9),如果通过相似性计算装置计算的相似性等于或高于阈值,则提供装置将新内容作为推荐的内容提供给用户。
在这种信息处理设备(例如,在附图26中所示信息处理设备)中,在每次产生特征矢量时,矢量化装置(例如在附图26中所示的特征矢量(CCV)发生器211)将产生的特征矢量分类为指示用户的肯定喜好因素的肯定喜好特征矢量或者指示用户的否定喜好因素的否定喜好特征矢量。
在这种信息处理设备(例如,在附图26中所示信息处理设备)中,矩阵产生装置(例如在附图26中所示的矩阵计算器(特定喜好空间发生器))使用由矢量化装置产生的M个肯定喜好特征矢量产生第二矩阵。
本信息处理设备(例如,在附图26中所示信息处理设备)可以进一步包括通过使用矩阵产生装置产生的第二矩阵的列作为训练数据通过学习分类用产生分类器(例如在附图26中所示的SVM模型存储单元203)的学习装置(例如在附图26中所示的SVM分类学习单元221)和分类装置(例如在附图26中所示的SVM分类器231),该分类装置用于通过如下过程进行分类获取包括与新内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,产生其元素通过分配给新内容的各个N条单个信息的权重值给定的特征矢量,以及使用由学习装置产生的分类器对与新内容关联的特征矢量分类为肯定喜好特征矢量(在本说明书中,也表示为“肯定地分类”)或否定喜好特征矢量(在本说明书中,也表示为“否定地分类”)。
本信息处理设备(例如在附图26中所示的信息处理设备)进一步可以包括登记装置(例如在附图26中所示的语法字典发生器7),该登记装置用于选择通过矩阵产生装置产生的第二矩阵的列的一个或多个特定的元素并在用户的个人字典中登记识别每个所选择的元素的字作为用户感兴趣的字或用户不感兴趣的字。
在本信息处理设备(例如在附图26中所示的信息处理设备)中,相似性计算装置(例如子附图26中所示的匹配单元204)可以通过如下过程计算相似性获取包括与新内容关联的N条单个信息的信息组作为比较信息,将权重值分配给N条单个信息中的每个,产生其元素由分配给N条单个信息的权重值给定的比较矢量,以及计算在比较矢量和第一参考矢量之间的第一相似性和在比较矢量和第二参考矢量之间的第二相似性,其中该信息处理设备进一步可以包括提供装置(例如在附图26中所示的推荐器9),该提供装置用于基于通过相似性计算装置计算的第一相似性和第二相似性确定新内容是否适合作为要推荐的内容并且如果确定新内容是适合的则将新内容作为推荐的内容提供给用户。
在一方面中,本发明提供一种信息处理方法(例如在附图1、28或26中所示的信息处理设备的信息处理方法(在各个描述中,假设信息处理方法用于在附图1中的信息处理设备,除非另外描述),该信息处理方法包括修改步骤(例如CCV产生过程(在附图3中所示的步骤S1(其详细描述在附图4中示出)),用于获取每个包括N条单个信息的M个信息组并至少部分地修改M个信息组中每个的N条单个信息以便突出在N条单个信息中的相关性,这里N是等于或大于2的整数,M是等于或大于1的整数,近似矩阵(空间)产生步骤(在附图3中所示的步骤S2(其详细描述在附图6中示出)),产生步骤(例如CUPV产生过程(在附图3中所示的步骤S6(其详细描述在附图12中示出)),用于产生在相似性计算中用作参考的参考信息组,该参考信息组包括基于每个包括在修改步骤中修改的N条单个信息的M个信息组产生的N条单个信息,相似性计算步骤(例如,在附图13中所示的内容推荐过程(其详细描述在附图14或17中示出)),用于获取包括N个单个信息元素的新信息组作为比较信息组并计算比较信息组相对于在产生步骤中产生的参考信息组的相似性。
在一方面中,本发明提供一种计算机执行的程序,包括修改步骤(例如CCV产生过程(在附图3中所示的步骤S1(其详细描述在附图4中示出)),用于获取每个包括N条单个信息的M个信息组并至少部分地修改M个信息组中每个的N条单个信息以便突出在N条单个信息中的相关性,这里N是等于或大于2的整数,M是等于或大于1的整数,近似矩阵(空间)产生步骤(在附图3中所示的步骤S2(其详细描述在附图6中示出)),产生步骤(例如CUPV产生过程(在附图3中所示的步骤S6(其详细描述在附图12中示出)),用于从M个信息组中产生在相似性计算中用作参考的包括N条元素的参考信息组,该M个信息组每个包括在修改步骤中修改的N条单个信息,以及相似性计算步骤(例如,在附图13中所示的内容推荐过程(其详细描述在附图14或17中示出)),用于获取包括N个单个信息元素的新信息组作为比较信息组并计算比较信息组相对于在产生步骤中产生的参考信息组的相似性。
在一方面中,本发明提供一种信息处理设备(例如根据第三实施例的信息处理设备具有如在附图1中所示的结构,即,执行在附图23至25中所示的处理的信息处理设备),该信息处理设备包括矢量化装置(例如在附图1中所示的特征矢量(CCV)发生器21),用于在每次用户使用内容时,获取包括与该内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,并形成其元素通过分配给各个N条单个信息的权重值给定的矢量作为该内容的特征矢量,矩阵产生装置(例如在附图1中所示的矩阵计算器(空间发生器)22),用于在通过矢量化装置形成M个特征矢量时,形成具有N行和M列的第一矩阵以使它的元素由该M个特征矢量给定,对第一矩阵执行操作以便将第一矩阵转换为其N×M个元素至少被部分修改的第二矩阵以便突出在M个列中每个列的N行元素中的相关性,参考矢量产生装置(例如在附图1中所示的用户喜好矢量(UPV)发生器23),用于从通过矩阵产生装置形成的第二矩阵的M列中形成在相似性的计算中作为参考的包括N个元素的参考矢量,候选内容获取装置(例如在附图1中所示的相关信息获取单元8),用于在每次通过参考矢量产生装置形成参考矢量时,基于参考矢量获取要推荐给用户的内容的候选内容,相似性计算装置(在附图1中的匹配单元3或匹配计算器31),用于获取包括与新内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,形成其元素通过由分配给N条单个信息的权重值给定的比较矢量,以及计算在比较矢量和由参考矢量产生装置形成的一个或多个参考矢量之间的相似性,提供装置(例如在附图1中所示的推荐器9),用于从通过候选内容获取装置获取的候选内容中选择对应于其通过相似性计算装置计算的相似性等于或高于阈值的参考矢量的候选内容并将所选择的候选内容作为推荐内容提供给用户。
在一方面中,本发明提供一种信息处理方法(例如对应于在附图23至25中所示的过程的信息处理方法),该信息处理方法包括矢量化步骤(例如在附图23中所示的步骤S301中的过程),用于在每次用户使用内容时获取包括与该内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,并形成其元素通过分配给各个N条单个信息的权重值给定的矢量作为该内容的特征矢量,矩阵产生步骤(例如在附图23中所示的步骤S302中的过程),用于在通过矢量化步骤形成M个特征矢量时,形成具有N行和M列的第一矩阵以使它的元素由该M个特征矢量给定,对第一矩阵执行操作以便将第一矩阵转换为其N×M个元素至少被部分修改的第二矩阵以便突出在M个列中每个列的N行元素中的相关性,参考矢量产生步骤(例如在附图23中所示的步骤S303),用于从通过矩阵产生步骤形成的第二矩阵的M列中形成在相似性的计算中作为参考的包括N个元素的参考矢量,候选内容获取步骤(例如在附图23中所示的步骤S304(其细节在附图24中示出)),用于在每次通过参考矢量产生步骤形成参考矢量时基于参考矢量获取要推荐给用户的内容的候选内容,相似性计算步骤(例如在附图25中所示的步骤S341),用于获取包括与新内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,形成其元素通过由分配给N条单个信息的权重值给定的比较矢量,以及计算在比较矢量和在参考矢量产生步骤中形成的一个或多个参考矢量之间的相似性,提供步骤(例如在附图25中所示的步骤S342),用于从在候选内容获取步骤中获取的候选内容中选择对应于其通过相似性计算装置计算的相似性等于或高于阈值的参考矢量的候选内容并将所选择的候选内容作为推荐内容提供给用户。
在一方面中,本发明提供一种计算机(例如在附图35中所示的CPU 501)执行的程序,该程序包括矢量化步骤(例如在附图23中所示的步骤S301中的过程),用于在每次用户使用内容时获取包括与该内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,并形成其元素通过分配给各个N条单个信息的权重值给定的矢量作为该内容的特征矢量,矩阵产生步骤(例如在附图23中所示的步骤S302中的过程),用于在通过矢量化步骤形成M个特征矢量时,形成具有N行和M列的第一矩阵以使它的元素由该M个特征矢量给定,对第一矩阵执行操作以便将第一矩阵转换为其N×M个元素至少被部分修改的第二矩阵以便突出在M个列中每个列的N行元素中的相关性,参考矢量产生步骤(例如在附图23中所示的步骤S303),用于从通过矩阵产生步骤形成的第二矩阵的M列中形成在相似性的计算中作为参考的包括N个元素的参考矢量,候选内容获取步骤(例如在附图23中所示的步骤S304(其细节在附图24中示出)),用于在每次通过参考矢量产生步骤形成参考矢量时基于参考矢量获取要推荐给用户的内容的候选内容,相似性计算步骤(例如在附图25中所示的步骤S341),用于获取包括与新内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,形成其元素通过由分配给N条单个信息的权重值给定的比较矢量,以及计算在比较矢量和在参考矢量产生步骤中形成的一个或多个参考矢量之间的相似性,提供步骤(例如在附图25中所示的步骤S342),用于从在候选内容获取步骤中获取的候选内容中选择对应于其通过相似性计算装置计算的相似性等于或高于阈值的参考矢量的候选内容并将所选择的候选内容作为推荐内容提供给用户。
在一方面中,本发明提供一种信息处理设备(例如在附图30中所示的信息处理设备),该信息处理设备包括矢量化装置(例如在附图30中所示的特征矢量(CCV)发生器211),用于在每次用户使用内容时,获取包括与该内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,并形成其元素通过分配给各个N条单个信息的权重值给定的矢量作为该内容的特征矢量,矩阵产生装置(例如在附图30中所示的矩阵计算器(特定喜好空间发生器)212),用于在通过矢量化装置形成M个特征矢量时,形成具有N行和M列的第一矩阵以使它的元素由该M个特征矢量给定,对第一矩阵执行操作以便将第一矩阵转换为其N×M个元素至少被部分修改的第二矩阵以便突出在M个列中每个列的N行元素中的相关性,类型设置装置(例如在附图30中所示的SVM分类学习单元(UP类型发生器)321)计算通过矩阵产生装置形成的第二矩阵的M列中的相似性,基于所计算的相似性对M个列中的每个进行分类,以及设置在分类中获得的每个类别作为类型。
在这种信息处理设备中,该类型设置装置可以通过使用属于该类型的列作为训练数据通过学习每种类型的类别形成分类器。本信息处理设备进一步可以包括分类装置(例如在附图30中所示的类型确定单元304或SVM分类器331),该分类装置用于通过如下方式进行分类获取包括与新内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,形成其元素通过分配给新内容的各个N条单个信息的权重值给定的特征矢量,以及使用通过类型设置装置形成的分类器将与新内容关联的特征矢量分类作为由类型设置装置设定的类型中的一种类型。
在一方面中,本发明提供一种信息处理方法(例如对应于在附图31至33中所示的过程的信息处理方法),该信息处理方法包括矢量化步骤(例如在附图31中所示的步骤S501中的过程),用于在每次用户使用内容时,获取包括与该内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,并形成其元素通过分配给各个N条单个信息的权重值给定的矢量作为该内容的特征矢量,矩阵产生步骤(例如在附图31中所示的步骤S502中的过程),用于在矢量化步骤中形成M个特征矢量时,形成具有N行和M列的第一矩阵以使它的元素由该M个特征矢量给定,对第一矩阵执行操作以便将第一矩阵转换为其N×M个元素至少被部分修改的第二矩阵以便突出在M个列中每个列的N行元素中的相关性,类型设置步骤(例如在附图31中所示的步骤S504(其细节将在附图32中示出)),用于计算在矩阵产生步骤中形成的第二矩阵的M列中的相似性,基于所计算的相似性对M个列中的每个进行分类,以及设置在分类中获得的每个类别作为类型。
在一方面中,本发明提供一种由计算机(例如在附图35中的CPU501)执行的程序,该程序包括矢量化步骤(例如在附图31中所示的步骤S501中的过程),用于在每次用户使用内容时,获取包括与该内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,并形成其元素通过分配给各个N条单个信息的权重值给定的矢量作为该内容的特征矢量,矩阵产生步骤(例如在附图31中所示的步骤S502中的过程),用于在矢量化步骤中形成M个特征矢量时,形成具有N行和M列的第一矩阵以使它的元素由该M个特征矢量给定,对第一矩阵执行操作以便将第一矩阵转换为其N×M个元素至少被部分修改的第二矩阵以便突出在M个列中每个列的N行元素中的相关性,类型设置步骤(例如在附图31中所示的步骤S504(其细节将在附图32中示出)),用于计算在矩阵产生步骤中形成的第二矩阵的M列中的相似性,基于所计算的相似性对M个列中的每个进行分类,以及设置在分类中获得的每个类别作为类型。
在一方面中,本发明提供一种包括服务器(例如在附图34中所示的服务器401)和由用户使用的客户(例如在附图34中所示的客户403)的信息处理系统(例如在附图34中所示的信息处理系统),该信息处理系统包括矢量化装置(例如在附图34中所示的服务器401的空间/UPV发生器2的一部分,该部分对应于在附图1中所示的特征矢量(CCV)发生器21),用于在每次用户使用内容时,获取包括与该内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,并形成其元素通过分配给各个N条单个信息的权重值给定的矢量作为该内容的特征矢量,矩阵产生装置(例如在附图34中所示的服务器401的空间/UPV发生器2的一部分,该部分对应于在附图1中所示的矩阵计算器(空间发生器)22),用于在通过矢量化装置形成M个特征矢量时,形成具有N行和M列的第一矩阵以使它的元素由该M个特征矢量给定,对第一矩阵执行操作以便将第一矩阵转换为其N×M个元素至少被部分修改的第二矩阵以便突出在M个列中每个列的N行元素中的相关性,参考矢量产生装置(在附图34中所示的服务器401的空间/UPV发生器2的一部分,对应于用户喜好矢量(UPV)发生器23),用于从通过矩阵产生装置形成的第二矩阵的M列中形成在相似性的计算中作为参考的包括N个元素的参考矢量,相似性计算装置(例如在附图34中所示的客户403的匹配单元3),用于如下地计算相似性获取包括N条单个信息的新信息组,将权重值分配给各个N条单个信息,形成其元素通过由分配给各个N条单个信息的权重值给定的比较特征矢量,以及计算在比较矢量和由参考矢量产生装置形成的参考矢量之间的相似性,其中在矢量化装置、矩阵产生装置、参考矢量产生装置和相似性计算装置中,至少矩阵产生装置包括在服务器中。
在一方面中,本发明提供一种用于包括服务器(例如在附图34中所示的服务器401)和由用户使用的客户(例如在附图34中所示的客户403)的信息处理系统的信息处理方法,该信息处理方法包括矢量化步骤(例如在附图3中所示的步骤S1的过程),用于在每次用户使用内容时,获取包括与该内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,并形成其元素通过分配给各个N条单个信息的权重值给定的矢量作为该内容的特征矢量,矩阵产生步骤(例如在附图3中所示的步骤S2中的过程),用于在通过矢量化步骤形成M个特征矢量时,形成具有N行和M列的第一矩阵以使它的元素由该M个特征矢量给定,对第一矩阵执行操作以便将第一矩阵转换为其N×M个元素至少被部分修改的第二矩阵以便突出在M个列中每个列的N行元素中的相关性,参考矢量产生步骤(例如在附图3中所示的步骤S6),用于从通过矩阵产生步骤形成的第二矩阵的M列中形成在相似性的计算中作为参考的包括N个元素的参考矢量,以及相似性计算步骤(例如在附图13中所示的内容推荐过程),用于通过如下的子步骤计算相似性获取包括N条单个信息的新信息组,将权重值分配给各个N条单个信息,形成其元素通过由分配给各个N条单个信息的权重值给定的比较特征矢量,以及计算在比较矢量和由参考矢量产生步骤形成的参考矢量之间的相似性,其中在矢量化步骤、矩阵产生步骤、参考矢量产生步骤和相似性计算步骤中,至少矩阵产生步骤由服务器执行。
下文结合附图参考具体实施例进一步详细地描述本发明。
虽然可以以各种方式实施本发明,但是下文仍然通过举例(非限制性)参考五个具体的实施例描述本发明。在描述了这五个具体实施例(第一至第五实施例)之后,讨论其它实施例的可能性。
第一实施例实行,参考附图1至17描述本发明的第一实施例。
附图1所示为根据本发明的第一实施例的信息处理设备。
如附图1所示,根据第一实施例的信息处理设备包括元信息获取单元1、空间/UPV发生器2(UPV是用户喜好矢量的另一名称)、匹配单元3、CCV存储单元4(CCV是特征矢量的另一名称)、分量矩阵存储单元5、UPV存储单元6、语法字典发生器7、相关信息获取单元8和推荐器9。
输入单元41和传感器42可以设置在信息处理设备的里面的部件或者可以设置在外面并连接到信息处理设备的外部装置。
对上述的部件(元信息获取单元1至推荐器9)的特定形式没有限制。具体地,元信息获取单元1、空间/UPV发生器2、匹配单元3、语法字典发生器7、相关信息获取单元8和推荐器9可以通过软件、硬件或软件和硬件的混合实施。
元信息获取单元1包括文本获取单元11、文本分析器12、元数据获取单元13和上下文获取单元14。
如附图1所示,内容数据和EPG数据输入到元信息获取单元1。对输入到元信息获取单元1中的内容数据没有特定的限制,只要内容数据已经或将要被用户使用(收视或欣赏)即可。注意,术语“内容”在此用于描述各种各样的内容,不仅包括电视节目、电影、照片、音乐内容、图像(运动图像、静态图像、音频内容或这些组合),而且还包括文件、物品(物理目标或产品)和会话,它们可以是用户可使用的软件或硬件的形式。在实际中,在内容以物理目标(硬件)的形式给定时,产生指示物理目标的运动/静态图像的数据并将所得的数据用作内容数据。
文本获取单元11从所输送的内容数据或EPG数据中抽取文本数据。例如,在通过电子邮件浏览器(未示)接收电子邮件时,文本获取单元11抽取包括在所接收的电子邮件中的文本数据。通过文本获取单元11获取的文本数据输送到文本分析器12。
文本分析器12将所接收的文本数据分成多个段(例如以文件或段落为单位)。文本分析器12分析每段的描述(文字)并将每段的文字分解为字(例如,如附图5中所示的“幼儿园”或“小孩”)。所得的字数据输送到空间/UPV发生器2或匹配单元3。
元数据获取单元13分析所输送的内容数据或EPG数据的除了文字之外的部分并将该数据分解为字并形成新的字数据。所得的字数据输送到空间/UPV发生器2或匹配单元3。元数据获取单元13也抽取在EPG数据中存在的字数据,并直接将所抽取的字数据输送给空间/UPV发生器2或匹配单元3。
此后,为区别于从上下文获取单元14中输出的数据,将从文本分析器12或元数据获取单元13中输出的字数据称为内容元信息。注意,在本说明书中,如前文所描述,内容不仅可以是通常的内容,而且还可以是私人文件(比如邮件文件)等。即,在本描述中,术语“内容元信息”用于描述不仅通常的内容比如电视节目的元信息,而且还描述前文定义的各种各样的内容(广义上的内容)或这种广义内容的一部分或以表示内容的属性的字(数字也被看作字)的形式的信息的元信息。
上述的常规技术的问题主要发生在这样的情况在推荐满足用户的喜好的内容时,如果内容与用户所处的当前上下文不匹配则所推荐的内容被拒绝。即,如果简单地基于与用户所经历过的内容关联的内容元信息推荐内容,则推荐的内容不一定与用户所在当前上下文匹配。
注意,在本说明书中,术语“上下文”用于描述用户的各种各样的内外状态。用户的内部状态的实例包括用户的身体条件和情绪状态(感情或精神状态)。用户的外部状态的实例包括用户的空间或时间位置(“时间位置”指当前的时间)和用户所位于的空间或时间环境(或空间和时间环境)。
在常规的技术中,在推荐内容时不考虑指示用户的上下文的信息(下文简单地称为上下文信息),很少有使用外部上下文信息比如指示时间或位置的信息或内部上下文信息比如指示用户手动输入的感情的信息的例外情况。即使在这种少有的例外中,在选择要推荐的内容的过程中也非常有限地考虑上下文信息。
即,在常规的技术中,内容元信息和上下文信息分别处理,并且要求服务提供商应该事先建立链接内容元信息(对应于内容元信息的候选内容)和上下文(情绪状态)的规则。在上下文信息和内容元信息分别处理的常规的内容推荐技术中,所推荐的内容并不总是与变化的上下文匹配,因此所推荐的内容经常被用户拒绝。即,常规的内容推荐技术不能解决上文描述的问题。此外,要求服务器提供商准备上述的规则,这给服务提供商增加了极大的负担。
在常规的技术中,即使在从各种各样的传感器中获得了多条上下文信息的情况下,仍然简单地将这多条上下文信息根据预定的规则解释,并将其分类为非常少数量的固定的类别中的一种(即使在例如借助于统计分析事先已经执行了分类的情况下)。因此,即使在使用多条上下文信息的情况下,仍然存在上述的问题,并且如上文所述还带来另一新的问题。
在本发明的第一实施例中,为避免上述的问题,同等地处理上下文信息和内容元信息两者。为此,除了获取内容元信息的方块(文本获取单元11、文本分析器12和元数据获取单元13)之外,元信息获取单元1还包括上下文获取单元14。
如果上下文获取单元14通过输入单元41或传感器42接收信息,则上下文获取单元14将所接收的信息根据需要转换,并将该信息作为上下文信息输送给空间/UPV发生器2或匹配单元3。
输入单元41包括键盘、鼠标和输入接口。用户可以通过输入单元41输入各种各样的上下文给上下文获取单元14。
相应地,上下文获取单元14分析通过输入单元41输入的上下文并将它转换为字。所得的字数据作为上下文信息输送给空间/UPV发生器2或匹配单元3。
更具体地说,例如,信息处理设备在显示器(比如在附图34中所示的显示器424,虽然在附图1中没有示出)上显示选择-输入用户接口屏比如在附图2中所显示的显示屏。通过操作输入单元41,用户在附图2中所示的“上下文选择”窗中设置的每个方框中选择指示用户的当前上下文的字。在各个方框中选择的字输入到上下文获取单元14。
更具体地说,在附图2中所示的用户接口显示屏允许用户根据“位置”(用户使用的内容的地方(在附图2中所示的实例中选择“公司”))和“场合”(用户使用内容的场合(在附图2中所示的实例中选择“工作”))选择(通过操作输入单元41)指示用户的外部上下文的字。
在附图2所示的实例中,用户接口显示屏也允许用户根据“精神”状态(在用户使用内容时的精神状态(在附图2所示的实例中选择“新鲜”))、“情绪”状态(在用户使用内容时用户的情绪状态(在附图2所示的实例中选择“高兴”))和“等级”(用户对该内容评估的(在附图2所示的实例中选择“重要”))选择(通过操作输入单元41)指示用户的内部上下文的字。
在附图2所示的实例中,如上文所述,数据以字的形式输入到在附图1中所示的上下文获取单元14中。上下文获取单元14直接将输入字数据作为上下文信息输送到空间/UPV发生器2或匹配单元3。
输入单元41用于检测用户的外部或内部上下文。对传感器42的类型和数量没有特别的限制。在单个传感器用作传感器42时,传感器42不一定是仅检测一种上下文,而是可以检测两种或多种上下文。例如,作为检测外部上下文的传感器,检测用户的当前位置的GPS(全球定位系统)接收器、检测当前的时间的时钟或检测在用户附近存在的人或物体的无线通信装置都可以使用。作为检测内部上下文的传感器,例如,可以使用检测脉搏、呼吸频率、排汗或瞳孔的开度的传感器。
在从传感器42输入到上下文获取单元14的信息以数字数据的形式的情况下,上下文获取单元14将输入的数字数据作为上下文信息输送(直接或在根据预定的规则转换之后)到空间/UPV发生器2或匹配单元3。在另一方面,在从传感器42输入到上下文获取单元14的信息不是数字数据的形式的情况下,上下文获取单元14分析该信息并将它转换为字(将数字值看作字)。所得的字数据作为上下文信息输送给空间/UPV发生器2或匹配单元3。
现在,下文解释空间/UPV发生器2。空间/UPV发生器2包括特征矢量(CCV)发生器21、矩阵计算器(空间发生器)22和用户喜好矢量(UPV)发生器23。
特征矢量(CCV)发生器21对每个内容产生其元素由一条或多条内容元信息和从元信息获取单元1输送的一条或多条上下文信息给定的矢量。通过特征矢量(CCV)发生器21产生的这种矢量指示用户的喜好的特征,即指示用户经历的内容的特征和用户经历的内容的上下文的特征。因此,在下文中,通过特征矢量(CCV)发生器21产生的这种矢量被称为特征矢量CCV。
根据这种情况,特征矢量CCV由匹配单元3产生,如下文所描述。
在本实施例中,通过举例而非限制,特征矢量CCV具有预定数量的维数(元素的数量),每个元素对应于预定的特定类型的信息(内容元信息或上下文信息)。即,特征矢量CCV的元素的数量固定,并且在各个元素中描述的信息项和项目的顺序固定。在下文中,这种形式的特征矢量CCV被称为标准形式的特征矢量。下文参考附图5描述特征矢量CCV的具体实例。
更具体地说,在特征矢量CCV的形成过程中,根据字出现的频率或根据加权方法比如tf方法,特征矢量(CCV)发生器21将权重分配给从元信息获取单元1输送的每条内容元信息和上下文信息(以字或数字值的形式)。所分配的权重代入特征矢量CCV的对应于的元素中,由此获得了特征矢量CCV。注意,在从元信息获取单元1输送的特定的内容的内容信息和上下文信息(可以以数字值的形式的字数据)不包括对应于特征矢量CCV的特定的元素的信息时,即在没有权重代入特征矢量CCV的该元素中时,将“0”代入该元素中。
在这种情况下,基于字出现的频率执行加权,出现的频率可以直接用作权重值,或可以使用根据特定的规则(比如归一化)转换出现频率获得的值。
在从传感器42(环境传感器、身体传感器或这些传感器的组合)输送的上下文信息为值(实数)的形式的情况下,将该值直接用作权重值或可以使用根据特定的规则(比如归一化)转换所输送的值获得的值。在以字数据的形式的上下文信息从输入单元41输送的情况下,通过根据第一规则对字数据加权获得的值可以用作权重值或可以使用根据第二规则(比如归一化)转换第一值获得的第二值。
分配给内容元信息的权重值和分配给上下文信息的权重值可以乘以可变系数,并将所得的值用作最后的权重值。在这种情况下,通过对应于应该被调整的权重值修改一个或多个可变系数可以简单地调节权重值(入在附图4中的步骤S26,将在下文中描述)。
如上文所述,在每次用户使用内容时,包括N条单个信息(内容元信息或上下文信息)的信息从元信息获取单元1输送到特征矢量(CCV)发生器21,其中N是为该内容设定的等于或大于2的整数。然而,对于特定的内容,如果某些N条单个信息为空(因为单个信息不通过元信息获取单元1获取),则该单个信息被看作“0”。响应接收信息组,特征矢量(CCV)发生器21将权重(值)分配给所输送的信息组的各个N条单个信息并产生其元素由分配给各个N条单个信息的权重值给定的特征矢量CCV)。
如上文所述,根据特定的内容和根据使用该内容的上下文产生特征矢量CCV,并将所得的特征矢量CCV存储在CCV存储单元4中。即,在每次用户使用内容时,该内容的特征矢量CCV通过特征矢量(CCV)发生器21产生并存储在CCV存储单元4中。
注意,在以上文所述的方式产生的并存储在CCV存储单元4中的特征矢量CCV中,所有的上下文信息和所有的内容元信息中的每个都作为元素同等地处理。特征矢量CCV的上下文信息的条数(严格地说,特征矢量CCV的元素的数量,该元素的数量对应于上下文信息)并不限于1,而是可以是2或更大。如下文将要描述,与基于常规的推荐方法推荐的内容相比,基于以上述的方式产生的特征矢量CCV推荐的内容比具有该内容被用户拒绝的更小的可能性。
如果以上述的方式产生的并累积在CCV存储单元4中的特征矢量CCV的数量变得等于M(等于或大于2的整数),则矩阵计算器(空间发生器)22产生其列由M个特征矢量CCV给定的N×M矩阵。这样产生的矩阵可以被看作特征矢量CCV组,即指示用户喜欢(欣赏)的内容和/或指示该内容的属性的内容元信息组和指示用户经历该内容的上下文的上下文信息。为与其它的矩阵区别,通过矩阵计算器(空间发生器)22以这种方式产生的矩阵被称为内容-和-上下文矩阵,也可以简单地称为矩阵CCM。
矩阵计算器(空间发生器)22通过奇异值分解和维数降低(即通过上文所述的LSI方法)将矩阵CCM的各个元素(指示用户经历的内容或该内容的属性的内容元信息和用户经历内容的上下文信息)投影到主分量轴上。
作为上述处理(提供减小矩阵CCM的维数)的结果获得的矩阵被称为矩阵CCM的近似矩阵。为方便,矩阵CCM的近似矩阵也简单地称为近似矩阵CCM*。投影元素的空间被称为最佳空间UPS。
更具体地说,在上述的处理中,矩阵计算器(空间发生器)22通过奇异值分解将N×M矩阵CCM分解为矩阵U、∑和V的乘积以满足下式(1)。
D(=CCM)=U∑V~ (1)这里D表示矩阵CCM,U表示由左手奇异值矢量给定的N×M分量矩阵,V表示由右手奇异值矢量给定的M×M分量矩阵,∑表示N×M奇异值矩阵,以及V~表示矩阵V的转置阵。
用r表示矩阵CCM的秩(其中r是等于或小于N和M的整数)。分量矩阵∑在它的主对角线上具有r个奇异值,而在任何其它的元素上为0。在分量矩阵U的最左的区域中的r列(左奇异值矢量)形成了正交基,这些r列以从左到右重要性降低的顺序设置(以使最左的列具有最大的重要性)。因此,使用k(小于r的整数)个左奇异值矢量的特征矢量CCV的表示得到最佳的近似。
因此,矩阵计算器(空间发生器)22使用在分量矩阵U的最左区域(左奇异值矢量)中的k列形成具有N行和k列矩阵Uk(比如在附图8中所示的)。
如下文进一步描述,在给定(N维)特征矢量CCV时,如果将特征矢量CCV从左乘以矩阵Uk的转置阵,获得减小到k的维数的近似矩阵矢量。即,通过矩阵Uk的转置阵的乘积,特征矢量CCV投影到k-维最佳空间UPS。即,矩阵计算器(空间发生器)22通过形成矩阵Uk形成最佳空间UPS。
类似地,矩阵计算器(空间发生器)22通过使用在分量矩阵V的最左区域(右奇异值矢量)中的k列形成分量矩阵V的近似矩阵(如在附图10所示)。即,近似矩阵具有M行和k列,它的k列由分量矩阵V的最左区域(右奇异值矢量)中的k列给定。下文中,这种近似矩阵由Vk表示。
矩阵计算器(空间发生器)22也通过抽取分量矩阵∑的最左区域的k列中的每个第一至第k元素并使用每个具有所抽取的k个元素的这些k列作为矩阵∑k的列形成k×k矩阵∑k(比如在附图9中所示的矩阵)(即矩阵∑k由在分量矩阵∑的左上区域中的k×k元素给定)。
矩阵计算器(空间发生器)22计算公式(2)的右手侧以获得其秩减小到k的矩阵Dk。
Dk=(CCM*)=Uk∑kVk~ (2)这里Vk~表示分量矩阵Vk的转置阵。
所得的矩阵Dk作为矩阵CCM的近似矩阵CCM*输送给用户喜好矢量(UPV)发生器23。
近似矩阵CCM*(=Dk)的分量矩阵Uk(根据需要,以及矩阵Vk和/或∑k)输送给语法字典发生器7并存储在分量矩阵存储单元5中。
在这个第一实施例中,如下文所描述,分量矩阵Uk并不被匹配单元3使用,因此分量矩阵存储单元5不是根据第一实施例的信息处理设备的关键部件。相反,在下文描述的第二实施例中,投影匹配单元101(附图18)使用分量矩阵Uk,因此分量矩阵存储单元5是根据第二实施例的信息处理设备的关键部件。
用户喜好矢量(UPV)发生器23从矩阵计算器(空间发生器)22输送的近似矩阵CCM*中(即从M个特征矢量CCV*中(注意,由近似矩阵CCM*的列给定的特征矢量通过特征矢量CCV*表示以区别于特征矢量CCV))产生标准形式的包括N个元素的矢量。通过用户喜好矢量(UPV)发生器23产生的标准形式的矢量用作在通过匹配单元3或推荐器9执行内容推荐处理时指示用户的喜好的参考矢量。因此,通过用户喜好矢量(UPV)发生器23产生的矢量被称为用户喜好矢量UPV*。
在本实施例(第一实施例)中,用户喜好矢量UPV*基于从矩阵计算器(空间发生器)22输送的近似矩阵CCM*产生,因此在UPV后加上后缀*。注意,对产生用户喜好矢量UPV*的方法没有特别的限制,只要基于从矩阵计算器(空间发生器)22输送的近似矩阵CCM*形成用户喜好矢量UPV*即可。
例如,近似矩阵CCM*的列(即特征矢量CCV*)可以直接用作用户喜好矢量UPV*。
可替换地,对于在近似矩阵CCM*的所有列或所选择的列(特征矢量CCV*)上的每个元素可以进行求和,并且其元素由所计算的和给定的标准的矢量可以用作用户喜好矢量UPV*。即,通过将近似矩阵CCM*的所有的列或选择的列(特征矢量CCV*)加在一起获得的和矢量可以用作用户喜好矢量UPV*。
在通过将从近似矩阵CCM*的列(特征矢量CCV*)选择的列加在一起计算和矢量时,对应该选择的列没有特别的限制。
更具体地说,计算指示在特征矢量CCV*中的上下文信息(分配给上下文信息的权重值)的特定的元素的相关性,并选择具有较高的相关性的特征矢量CCV*。计算以上述方式选择的特征矢量的和矢量(通过在特征矢量上的对应的元素的和给定每个元素),并将所得的和矢量用作用户喜好矢量UPV*。
可替换地,计算指示在原始的矩阵CCM(即在原始的特征矢量CCV)中的上下文信息的元素的相关性(上下文信息的权重值的相关性),并选择具有较高的相关性的特征矢量CCV。此外,选择对应于所选择的特征矢量(原始的矩阵CCM的列)的特征矢量CCV*(近似矩阵CCM*的列)并将所选择的特征矢量CCV*的和矢量(其元素分别由在所选择的特征矢量CCV*上的对应的元素的和给定的矢量)用作用户喜好矢量UPV*。
在上下文中具有较高的相似性的特征矢量CCV*的和矢量用作用户喜好矢量UPV*的情况下,所得的用户喜好矢量UPV*是特定的上下文(或两个或更多个上下文的组合)的用户喜好矢量UPV*。在下文中,特定的上下文的这种用户喜好矢量UPV*被称为上下文用户喜好矢量CUPV*以区别于其它的用户喜好矢量UPV*。即在本说明书中,上下文用户喜好矢量CUPV*明确地区别于由直接使用近似矩阵CCM*的列(特征矢量CCV*)形成的用户喜好矢量UPV*。
以上述方式形成的用户喜好矢量UPV*(或上下文用户喜好矢量CUPV*)输送给相关信息获取单元8。用户喜好矢量UPV*(或上下文用户喜好矢量CUPV*)也输送给UPV存储单元6并存储在其中。
现在,解释匹配单元3。匹配单元3包括匹配计算器31。匹配计算器31通过利用分配给从元信息获取单元1输送的每条信息的权重值作为它的元素形成标准形式的特征矢量CCV。匹配计算器31然后计算这个特征矢量CCV相对于存储在UPV存储单元6中的每个用户喜好矢量UPV*的相似性并将计算结果输送给推荐器9。
更具体地说,在推荐器9推荐与用户所处的当前上下文十分好地匹配的内容时,匹配计算器31首先从元信息获取单元1获取指示用户的当前上下文的上下文信息,并形成其元素由上下文信息的各个权重值给定并且它的对应于内容元信息的元素都为0的标准形式的特征矢量CCV。匹配计算器31计算这个特征矢量CCV相对于存储在UPV存储单元6中的多个上下文用户喜好矢量CUPV*中的每个的相似性,并运用具有最高的相似性的上下文用户喜好矢量CUPV*作为与用户所处的当前上下文最佳地匹配的上下文用户喜好矢量CUPV*。
通过匹配计算器31选择作为与用户所处的当前上下文匹配的上下文用户喜好矢量UPV*的这种上下文用户喜好矢量UPV*被称为特定上下文用户喜好矢量sCUPV*以区别于其它的上下文用户喜好矢量UPV*。
在UPV存储单元6中没有存储上下文用户喜好矢量CUPV*而是直接存储近似矩阵CCM*的列(特征矢量CCV*)作为用户喜好矢量UPV*的情况下,匹配计算器31计算指示用户所处的当前上下文的特征矢量CCV相对于存储在UPV存储单元6中的每个用户喜好矢量UPV*的相似性。匹配计算器31选择具有等于或高于阈值的相似性的某些用户喜好矢量UPV*,形成其元素每个由所选择的用户喜好矢量UPV*的对应的列的和给定的标准形式的矢量(即,形成所选择的用户喜好矢量UPV*的和矢量),并运用所形成的矢量作为用户所处的当前上下文的上下文用户喜好矢量CUPV*,即作为特定上下文用户喜好矢量sCUPV*。
在每次匹配计算器31从元信息获取单元1接收与要推荐的候选内容关联的内容元信息时,匹配计算器31形成其元素由上下文信息的各个权重值给定并且它的对应于上下文信息的元素都为0的标准形式的特征矢量CCV。匹配计算器31计算特征矢量CCV相对于特定上下文用户喜好矢量sCUPV*的相似性并将计算结果输送给推荐器9。
响应接收的计算结果,推荐器9选择对应于相对于特定上下文用户喜好矢量sCUPV*具有最高的相似性的特征矢量CCV的内容并将所选择的内容推荐给用户。基于从匹配计算器31输送的计算结果(根据相似性),推荐器9可以选择对应于其相似性等于或高于阈值的特征矢量CCV的一个或多个内容,并可以将所选择的内容推荐给用户。
如上文所述,推荐给用户的内容是那些对应于相对特定上下文用户喜好矢量sCUPV*(与用户所处的当前上下文匹配的上下文用户喜好矢量CUPV*)具有最高的相似性的特征矢量CCV。即,在被用户喜欢的各种内容中,将与用户的当前上下文最佳地匹配的内容推荐给用户。这就减小了推荐的内容被用户拒绝的可能性。
在上述的实例中,在对应于要推荐的候选内容的特征矢量CCV中,与上下文信息关联的元素都是0。然而,这些元素不一定都是0,而除了0之外的值也可以代入这些元素中。对这些元素的值没有特别限制。例如,可以使用在另一用户使用内容的特定的上下文中使用的权重值,或者用户可以将特定的权重值分配给预计该内容将被用户使用的上下文。
语法字典发生器7例如通过使用由空间/UPV发生器2形成的最佳空间UPS(即通过使用在公式(2)中的近似矩阵CCM*(=Dk)的分量矩阵Uk)给用户形成语法字典。更具体地说,语法字典发生器7从使用分量矩阵Uk(根据公式(2))形成的近似矩阵CCM*(=Dk)的元素中检测具有等于或大于阈值的值的元素,在语法字典中登记对应于所检测的元素的字作为用户感兴趣的字(例如登记在附图11中的“幼儿园”)。语法字典发生器7从近似矩阵CCM*(=Dk)的元素中可以检测其最大值或平均值小于阈值的元素,并可以将对应于所检测的元素的字作为用户不感兴趣的字(例如在附图11中可以登记“党派”或“啤酒”)登记在语法字典中。
相关信息获取单元8为从空间/UPV发生器2输送的每个用户喜好矢量UPV*选择与用户的喜好相关的重要的字,并且相关信息获取单元8通过站点搜索等获取与所选择的重要的字相关的信息。所获得的相关的信息根据需要输送给推荐器9。一旦从相关信息获取单元8接收到相关的信息,推荐器9连同推荐的内容一起提供相关的信息以指示推荐该内容的原因,或者考虑所输送的相关的信息推荐器9确定是否应该推荐该内容。
现在,参考附图3的流程图,下文描述为形成用户喜好矢量UPV*(基于近似矩阵CCM*)而由信息处理设备(在附图1中示出)执行的处理(下文中这个过程被称为UPV产生过程)。
通过举例,在此假设用户接收(读取)的7个邮件的文件(表示为DOC1至DOC7)作为内容处理,而用户读取文件DOC1至DOC7的位置(家里或公司)和读取文件的情绪状态(放松、紧张、高兴或悲伤状态)作为上下文处理。
更具体地说,在本实例中,元信息获取单元1的文本获取单元11获取文件DOC1至DOC7,文本分析器12分解这些文件DOC1至DOC7字(名词)中的每个字比如下面(I)至(VII)中所列的字。此外,上下文获取单元14获取在(I)至(II)中的括号中的字作为各个文件DOC1至DOC7的上下文。
(I)幼儿园、小孩、幼儿园、小孩、早退(公司,高兴),(II)紧急、通话(公司,紧张),(III)小孩、大海、小孩(家,高兴),(IV)党派,啤酒(公司,放松),(V)紧急、专利(公司,紧张),(VI)幼儿园,幼儿园,小孩,寒冷(家,悲伤),和(VII)寒冷,早退(公司,悲伤)指示上文从(I)至(VII)所列的这些字的数据从元信息获取单元1输送到空间/UPV发生器2。
在步骤S1中,空间/UPV发生器2的特征矢量(CCV)发生器21产生对应于(I)至(VII)的特征矢量CCV(在下文中,分别称为特征矢量CCV1至CCV7),并将它们存储在CCV存储单元4中。
在下文中,通过特征矢量(CCV)发生器21执行的这个过程(在步骤S1中)被称为CCV产生过程。附图4示出了根据第一实施例的CCV产生过程的详细流程的实例。参考附图4,下文描述根据第一实施例的CCV产生过程的细节。
首先,在步骤S21中,特征矢量(CCV)发生器21获取内容元信息和上下文信息。更具体地说,在本实例中,特征矢量(CCV)发生器21获取在(I)中的“幼儿园”、“小孩”、“幼儿园”、“小孩”和“早退”的数据作为文件(内容)DOC1的内容元信息,并获取在(I)中的“公司”和“高兴”的数据作为文件DOC1的内容信息。
在步骤S22中,特征矢量(CCV)发生器21将权重(数字值)分配给内容元信息和上下文信息。在本实施例中,根据字出现的频率进行加权,虽然对加权的方法没有特别的限制。例如,在文件DOC1中,在文件DOC1的内容元信息中“幼儿园”出现两次,因此“2”被作为权重分配给“幼儿园”。类似地,在文件DOC1的内容元信息中,“2”被分配给“小孩”,“1”被分配给“早退”。文件DOC1的上下文信息也以字的形式给定,并将权重以类似的方式分配给内容元信息。更具体地说,在本实例中,“1”被分配给“公司”和“高兴”两者。
在步骤S23中,特征矢量(CCV)发生器21产生其元素由分配给内容元信息和上下文信息的权重值给定。
在本实施例中,以如附图5中所示的标准矢量的形式表示特征矢量,但对特征矢量CCV的维数和元素没有特别限制。在附图5的具体实施例中,特征矢量CCV作为16-维矢量给定(“幼儿园”、“小孩”、“早退”、“紧急”、“通话”、“大海”、“党派”、“啤酒”、“专利”、“寒冷”、“家”、“公司”、“放松”、“紧张”、“高兴”、“悲伤”)。注意,实际上在特征矢量CCV的16个元素的每个元素中不是代入字而是对应的权重。
更具体地说,在本实例(文件DOC1)中,特征矢量(CCV)发生器21为文件DOC1产生特征矢量CCV1以使“2”代入对应于“幼儿园”的第1元素中,“2”代入对应于“小孩”的第2元素中,“1”代入对应于“早退”的第3元素中,“1”代入对应于“公司”的第12元素中,“1”代入对应于悲伤的第16元素中,以及“0”代入对应于其它的元素(第4至第11元素和第13至第15元素)中。即,如附图5所示,文件DOC1的特征矢量CCV1由(2,2,1,0,0,0,0,0,0,0,0,1,0,0,0,1)给定。
在步骤S24中,特征矢量(CCV)发生器21将在直接在先的步骤S23中产生的特征矢量CCV(在这个具体的实例中,与文件DOC1关联的特征矢量CCV1)存储在CCV存储单元4中。
在步骤S25中,特征矢量(CCV)发生器21确定是否要产生更多的其它内容的特征矢量CCV。
在本具体情况下,对于其余的文件DOC1至DOC7应该产生更多的特征矢量CCV,反复地执行步骤S21至S25以产生如在附图5中所示的文件DOC2至DOC7的特征矢量CCV2至CCV7。所得的特征矢量CCV存储在CCV存储单元4中。
如果所有的内容的特征矢量CCV(在本特定的实例中特征矢量CCV1至CCV7)都以上述的方式已经存储在CCV存储单元,则决定步骤S25的结果变为No,处理进行到步骤S26。在步骤S26中,特征矢量(CCV)发生器21调整分配给特征矢量CCV的各个元素的权重。
在每个特征矢量CCV的每个元素值(内容元信息和上下文信息的权重值)如上文所述地乘以可变系数的情况下,在步骤S26中通过修改对应于应该被调整的权重值的一个或多个可变系数可以简单地调节元素值。
在完成权重的调节时,结束CCV产生过程。
再次参考附图3,在步骤S2中,在完成了CCV产生过程(步骤S1)之后,矩阵计算器(空间发生器)22基于在CCV存储单元4中存储的多个特征矢量CCV产生矩阵CCM,进一步产生矩阵CCM的近似矩阵CCM*,并将所得的近似矩阵CCM*输送给用户喜好矢量(UPV)发生器23。
在下文中,通过矩阵计算器(空间发生器)22执行的上述的过程(步骤S2)被称为近似矩阵(空间)产生过程。附图6所示为根据第一实施例的近似矩阵产生过程的详细流程的实例。参考附图6,下文描述根据第一实施例的近似矩阵(空间)产生过程的细节。
首先,在步骤S41中,矩阵计算器(空间发生器)22从CCV存储单元4中获取多个特征矢量CCV。更具体地说,在本实例中,矩阵计算器(空间发生器)22获取特征矢量CCV1至CCV7。
在步骤S42中,矩阵计算器(空间发生器)22产生矩阵CCM,该矩阵CCM包括多个特征矢量CCV作为列分量。更具体地说,在本实例中,矩阵计算器(空间发生器)22产生矩阵D比如在附图7中所示的矩阵作为矩阵CCM。
在步骤S43中,矩阵计算器(空间发生器)22通过奇异值分解和阶数的降低将矩阵CCM分解为如在公式(2)的右手侧所示的分量矩阵Uk、∑k和Vk的乘积(由此产生最佳空间UPS)。在步骤S44中,这些分量矩阵Uk、∑k和Vk存储在分量矩阵存储单元5中。
在步骤S45中,矩阵计算器(空间发生器)22使用分量矩阵Uk、∑k和Vk产生矩阵CCM的近似矩阵CCM*(通过计算在公式(2)的右手侧的表达式),并将所得的近似矩阵CCM*输送给用户喜好矢量(UPV)发生器23。
更具体地说,在本实例中,如下地执行步骤S43至S45。矩阵计算器(空间发生器)22通过奇异值分解将在如附图7中所示的矩阵D(矩阵CCM)分解为分量矩阵U、∑和V的乘积以便满足公式(1)。通过上述过程(从在附图7中所示的矩阵D)获得的分量矩阵U、∑和V分别在附图8至10中示出。
虽然分量矩阵∑实际具有16行和7列,但是仅第1至第7行(在矩阵∑的上部区域)在附图9中示出,因为在矩阵∑的左上区域中的7×7个元素形成了如附图9中所示的对角矩阵,所有的其它的元素都是0。
虽然分量矩阵U实际具有16行和16列,但是仅第1至第7列在附图8中示出。注意,在U×∑的计算中,即使在附图8中没有示出的列(第8至第16列)具有任何值,在这些列乘以矩阵∑的对应的行时,结果都变为0,因为矩阵∑的对应的行在所有的元素中都是0。
如上文所述,矩阵计算器(空间发生器)22通过从在附图8中所示的分量矩阵U中抽取第1至第3列(在附图8中所示的虚线框中包围的左奇异值矢量)产生16×3矩阵Uk。
此外,矩阵计算器(空间发生器)22通过从在附图10中所示的分量矩阵V中抽取第1至第3列(在附图10中所示的虚线框中包围的右奇异值矢量)产生7×3矩阵Vk,矩阵计算器(空间发生器)22通过抽取在附图9中所示的矩阵∑的左上区域(在附图9中所示的虚线框中包围)中的3×3个元素产生3×3矩阵∑k。
在矩阵计算器(空间发生器)22将所获得的分量矩阵Uk、∑k和Vk存储在分量矩阵存储单元5中之后,矩阵计算器(空间发生器)22将这些分量矩阵Uk、∑k和Vk代入公式(2)的右手侧,由此形成其秩减小到3的矩阵Dk比如在附图11中所示的矩阵。所得的矩阵Dk作为矩阵CCM的近似矩阵CCM*输送给用户喜好矢量(UPV)发生器23。
因此,完成了近似矩阵(空间)产生过程。
再次参考附图3,在步骤S3中,在完成了近似矩阵(空间)产生过程(步骤S2)之后,用户喜好矢量(UPV)发生器23确定要产生的用户喜好矢量UPV*的类型,即用户喜好矢量(UPV)发生器23确定是否为每个上下文产生用户喜好矢量UPV*,即上下文用户喜好矢量CUPV*。
如果用户喜好矢量(UPV)发生器23确定要产生的用户喜好矢量不是上下文用户喜好矢量CUPV*的类型,因此用户喜好矢量(UPV)发生器23执行步骤S4和S5。
在步骤S4中,用户喜好矢量(UPV)发生器23通过利用近似矩阵CCM*的各个列(即在近似矩阵CCM*中的各个特征矢量CCV*)作为喜好矢量UPV*产生用户喜好矢量UPV*。在步骤S5中,用户喜好矢量(UPV)发生器23将这些用户喜好矢量UPV*存储在UPV存储单元6中。更具体地说,在本实例中,在近似矩阵(空间)产生过程(步骤S2)中产生在附图11中所示的矩阵Dk作为近似矩阵CCM*,并运用近似矩阵CCM*中的每行(即在附图11中所示的特征矢量CCV*1至CCV*7中的每个)作为用户喜好矢量UPV*并存储在UPV存储单元6中。
因此,完成了UPV产生过程。
在另一方面,如果在步骤S3中确定要产生的用户喜好矢量是上下文用户喜好矢量CUPV*的类型,然后处理进行到步骤S6,在步骤S6中用户喜好矢量(UPV)发生器23产生上下文用户喜好矢量CUPV*。
在下文中,通过用户喜好矢量(UPV)发生器23为产生上下文用户喜好矢量CUPV*而执行的过程(在步骤S6中)被称为CUPV产生过程。附图12所示为根据第一实施例的CUPV产生过程的详细流程的实例。参考附图12,下文描述根据第一实施例的CUPV产生过程的细节。
首先,在步骤S61中,用户喜好矢量(UPV)发生器23根据在各个元素中描述的上下文信息计算在近似矩阵CCM*中的项的相似性,即在近似矩阵CCM*的特征矢量CCV*中的相似性。更具体地说,在本实例中,在近似矩阵(空间)产生过程(步骤S2)中形成在附图11中所示的矩阵Dk作为近似矩阵CCM*之后,根据与上下文信息(“家”、“公司”、“放松”、“紧张”、“高兴”、“悲伤”)关联的元素计算在近似矩阵CCM*的列中(即在特征矢量CCV*1至CCV*7中)的相似性。
在步骤S62中,用户喜好矢量(UPV)发生器23对每个特征矢量CCV*分类(在本具体实例中,在附图11中所示的特征矢量CCV*1至CCV*7)。更具体地说,基于在步骤S61中的计算结果,用户喜好矢量(UPV)发生器23将具有等于或高于阈值的相似性的特征矢量CCV*分为相同的类别。
在下文中,在步骤S63中,用户喜好矢量(UPV)发生器23计算属于每个分类的特征矢量CCV*的每个元素的值的总和(例如,元素“幼儿园”的值的总和),并且用户喜好矢量(UPV)发生器23形成其元素由每个类别的各个元素的值的计算的总和给定的矢量。每个类别的所得的矢量被用作该类别的上下文用户喜好矢量CUPV*。
在步骤S64中,用户喜好矢量(UPV)发生器23在UPV存储单元6中存储为各个类别形成的上下文用户喜好矢量CUPV*。
因此,完成了在附图12中的CUPV产生过程(在附图3中的步骤S6),并完成了在附图3中的UPV产生过程。
现在,参考在附图13中所示的流程图,描述关于根据第一实施例的信息处理设备(附图1)基于已经准备的用户喜好矢量UPV*推荐与用户所处于的当前上下文很好地匹配的内容而执行的处理。
在步骤S101中,基于在UPV存储单元6中存储的用户喜好矢量UPV*(或上下文用户喜好矢量CUPV*),匹配单元3的匹配计算器31产生与用户所处于的当前上下文很好地匹配的特定上下文用户喜好矢量sCUPV*。
在下文中,通过匹配计算器31设定特定上下文用户喜好矢量sCUPV*而执行的过程(在步骤S101中)被称为CUPV设定过程。附图14所示为根据第一实施例的CUPV设置过程的详细流程的实例。参考附图14,下文详细地描述根据第一实施例的CUPV设置过程。
首先,在步骤S121中,匹配计算器31从元信息获取单元1(上下文获取单元14)中获取当前上下文信息。
在此,我们假设在步骤S121中匹配计算器31从元信息获取单元1中获取“家”和“高兴”作为当前上下文信息。即,用户当前处于用户在家里并感觉高兴的上下文中。
在这种情况下,在步骤S122中,匹配计算器31从当前上下文信息中产生特征矢量CCV。即,如附图15所示,匹配计算器31产生特征矢量CCV以便将“1”设定到对应于“家”的元素(第11个元素),将“1”设置到对应于“高兴”的元素(第15个元素),以及将0设置到其它的元素(第1至第10个元素、第12至第14个元素和第16个元素)。在下文中将以上述的方式通过匹配计算器31产生的特征矢量CCV(即指示用户所处的当前上下文的特征矢量CCV)称为当前上下文特征矢量cCCV以区别于其它的特征矢量CCV。在本具体实施例中,在步骤S122中,匹配计算器31产生如在附图15中所示的当前上下文特征矢量cCCV。
在步骤S123中,匹配计算器31计算当前上下文特征矢量cCCV相对于在UPV存储单元6中存储的每个用户喜好矢量UPV*(或上下文用户喜好矢量CUPV*)的相似性。
在步骤S124中,匹配计算器31确定在步骤S123中执行的相似性的计算是否相对于上下文用户喜好矢量CUPV*。
如果在步骤S124中确定相似性的计算是相对于上下文用户喜好矢量CUPV*,则处理进行到步骤S125。在步骤S125中,匹配计算器31选择具有最高的相似性的上下文用户喜好矢量CUPV*并将它用作特定上下文用户喜好矢量sCUPV*。
在另一方面,如果在步骤S124中确定相似性的计算不是相对于上下文用户喜好矢量CUPV*,则处理进行到步骤S126。在步骤S126中,匹配计算器31确定具有等于或高于阈值的相似性的用户喜好矢量UPV*的和给定的和矢量,并且匹配计算器31将它用作特定上下文用户喜好矢量sCUPV*。
更具体地说,在本实例中,如附图16所示地计算在附图15中所示的当前上下文特征矢量cCCV相对于在附图11中所示的每个特征矢量CCV*1至CCV*7(在UPV存储单元6中存储的用户喜好矢量UPV*)的相似性。
如果设定阈值例如是0.8,则在上述的步骤S126中,匹配计算器31计算特征矢量CCV*1和特征矢量CCV*3的和并利用所得的和矢量作为特定上下文用户喜好矢量sCUPV*。
注意,在用户喜好矢量UPV*由在附图7中所示的原始矩阵CCM的列(即通过在附图5中所示的特征矢量CCV1至CCV7)给定的情况下,在特定上下文用户喜好矢量sCUPV*的产生的过程中,反映仅仅具有与当前上下文特征矢量cCCV的元素(附图15)相同的与上下文信息关联的元素的特征矢量(即其与“家”和“高兴”关联的元素等于“1”和其它的元素等于“0”的CCV3)。相反,在本实例中,用户喜好矢量UPV*通过在附图11中所示的近似矩阵CCM*的列(即通过在附图11中所示的特征矢量CCV*1至CCV*7)给定,在特定上下文用户喜好矢量sCUPV*的产生的过程中不仅反映对应于特征矢量CCV3的特征矢量CCV*3,而且还反映对应于特征矢量CCV1的特征矢量CCV*1。
注意,在通过空间/UPV发生器2借助于LSI法(通过执行在附图6中所示的近似矩阵(空间)产生过程)从在附图7中所示的原始矩阵CCM中产生的近似矩阵CCM*中,在元素中(在内容元信息和上下文信息中)的相关性清楚地出现在特征矢量CCV*1至CCV*7中,虽然相关性在附图5中所示的特征矢量CCV1至CCV7中不清楚。此外,可以清楚地看到对应于特征矢量CCV*1的内容(DOC1)的上下文类似于当前上下文。
即,在附图5中所示的特征矢量CCV1至CCV7直接用作用户喜好矢量UPV*的情况下,特征矢量CCV6类似于在附图15中所示的当前上下文特征矢量cCCV,在附图15中“家”的元素具有值“1”,以及特征矢量CCV1类似于在附图15中所示的当前上下文特征矢量cCCV,在附图15中“高兴”的元素具有值“1”。因此,在这种情况下,相对于在附图15中所示的当前上下文特征矢量cCCV,特征矢量CCV6的相似性和特征矢量CCV1的相似性相等。相反,在通过LSI法(元素的权重值通过LSI法修改)突出每个内容(DOC1至DOC7)的元素中(在内容元信息和上下文信息中)的相关性的情况下,特征矢量CCV*1的“家”的元素被修改到大约0.6,它类似于特征矢量CCV*6的元素,并且特征矢量CCV*1的“高兴”的元素被修改到大约1.06,它远大于特征矢量CCV*6的“高兴”的元素的大约0.16。因此,在这种情况下,特征矢量CCV*1与在附图15中所示的当前上下文特征矢量cCCV的相似性比特征矢量CCV*6更高。即转换到特征矢量CCV*1至CCV*7揭示了在“高兴”的情绪状态下在“公司”中用户使用的文件DOC1比在“悲伤”的情绪状态下在“家”中使用的文件DOC6更好地与当前上下文(用户在“高兴”的情绪状态下在“家”里)匹配。
在本发明中,使用LSI法的特征矢量转换不仅提供了维数数量减少的第一个优点,而且还提供了在每个矢量中的元素中的相关性比在原始的特征矢量CCV中在特征矢量CCV*中变得更加清楚的第二个优点。这第二个优点在本发明中更加重要,本发明的主要目的是实现这第二个优点。即,原始的特征矢量CCV到特征矢量CCV*的转换使得可以容易地指出哪些字(权重值)彼此密切相关。更具体地说,通过借助于LSI法将具有大量维数的原始特征矢量CCV转换为低维数的特征矢量CCV*,彼此具有密切关系但分散在原始的特征矢量CCV中的不同的维数上的字落在具有减少的维数的特征矢量CCV*的相同维数上。
如上文所述,本发明的最重要的目的是提供上述的第二优点(除了不重要的第一优点之外),因此对将原始的特征矢量CCV形成为特征矢量CCV*的方法没有特别的限制,只要实现第二优点即可。即,该方法并不限于LSI法,如果原始度特征矢量CCV可以被转换为其中在元素中的相关性比在原始的特征矢量CCV中变得更加清楚的特征矢量CCV*,就可以使用其它的方法。
即,空间/UPV发生器2并不限于在附图1中所示那样,而是还可以以许多方式构造空间/UPV发生器2,只要它包括具有如下功能的修改单元和产生单元即可。即,修改单元获取M个(等于或大于1的整数(在本实例中对应于文件DOC11至DOC7的7组))信息组,每个信息组包括N条(等于或大于2的整数(在本实例中为16))单个信息(在本实例中,包括“幼儿园”、“小孩”等的内容元信息和包括“家”、“高兴”等的上下文信息,如附图5所示),并至少部分地修改M个信息组中的每个的N条单个信息以便突出在N条单个信息中的相关性。基于包括通过修改单元修改的N条单个信息的M个信息组(在本实例中近似矩阵CCM*),产生单元形成包括N条单个信息的参考信息组(在本实例中,上下文用户喜好矢量CUPV*)。
如果在附图14中在步骤S125至S126中以上述的方式设定特定上下文用户喜好矢量sCUPV*,则完成CUPV设置过程。
再次参考附图13,如果完成了CUPV设置过程(步骤S101),则处理进行到步骤S102,在步骤S102中匹配计算器31基于特定上下文用户喜好矢量sCUPV*从用户喜欢的内容中选择与用户的当前上下文最佳匹配的内容,推荐器9将所选择的内容作为推荐的内容提供给用户。
在下文中,通过匹配计算器31和推荐器9为将推荐的内容提供给用户而执行的处理(步骤S102)被称为内容推荐计算过程。附图17所示为根据第一实施例的内容推荐计算过程的详细流程的实例的流程图。参考附图17,下文详细地描述根据第一实施例的内容推荐计算过程。
首先,在步骤S141中,匹配计算器31从元信息获取单元1(文本分析器12或元数据获取单元13)中获取与作为要推荐的内容的候选内容的多个内容关联的内容元信息。
在步骤S142中,匹配计算器31从与要推荐的每个候选内容关联的每个内容元信息中形成特征矢量CCV。即,匹配计算器31形成要推荐的内容的每个候选内容的特征矢量CCV。更具体地说,在本实例中,形成其对应于上下文信息的元素(即第11至第16元素)等于“0”的标准形式的特征矢量CCV比如在附图11或15中所示的特征矢量CCV。
在步骤S143中,匹配计算器31计算在步骤S142中形成的对应于要推荐的内容的各个候选内容的每个特征矢量CCV相对于在步骤S101中在CUPV设置过程中设置的特定上下文用户喜好矢量sCUPV*的相似性(附图13(它的细节在附图14中示出))并将计算结果输送给推荐器9。
在步骤S144中,推荐器9选择对应于具有比阈值更高的相似性的特征矢量CCV的内容(或对应于具有最高的相似性的特征矢量CCV的内容)并将所选择的内容推荐给用户。因此,完成了内容推荐计算过程(在附图13中所示的步骤S102),并且也完成了在附图13中所示的内容推荐过程。
对应于以上述方式推荐给用户的内容的特征矢量CCV具有与在步骤S101中在CUPV设置过程中设置的特定上下文用户喜好矢量sCUPV*(用户所处的当前上下文的上下文用户喜好矢量CUPV*)较高的相似性。因此,在用户喜欢的内容中,将与用户的当前上下文最佳匹配的内容推荐给用户。这就减小了推荐的内容被用户拒绝的可能性。
即,如上文所述,为选择与用户所处的当前上下文十分好地匹配的内容,基于包括与用户经历的内容关联的内容元信息和上下文信息的特征矢量CCV形成矩阵CCM,并使用LSI(潜在语义索引)法等形成矩阵CCM的近似矩阵CCM*,并基于近似矩阵CCM*执行匹配过程,由此使得能够发现(揭示)在该内容和上下文中重要的潜在的相关性,由此使得能够正确地推荐与用户所处的当前上下文十分好地匹配的内容。
为什么能够实现上述的优点的一个原因在于不是分离地而是一起地处理上下文信息和内容元信息,如上文所述。即,根据本实施例,同等地处理上下文信息和内容元信息使得能够不是基于在内容和有限的上下文之间的匹配简单地选择内容,而是基于在内容和通过匹配过程(使用近似矩阵CCM*)揭示的上下文之间的密切的相关性选择内容。
虽然在上述的实例中,与用户所处的当前上下文最佳地匹配的内容(即,在上下文方面具有最高相似性的内容)被推荐给用户,但是在内容方面具有最高相似性的内容也可以被提供给用户。
此外,可以推荐与用户当前使用的内容最佳地匹配的另一内容。
在这种情况下,匹配单元3执行如下的过程。即,匹配单元3从元信息获取单元1中获取用户当前使用的内容的内容元信息,并将权重值分配给每条所获取的内容元信息。分配给相应条的内容元信息的权重值代入在标准形式的矢量的对应的元素中,由此形成用户当前使用的内容的特征矢量CCV。匹配单元3然后计算在UPV存储单元6中存在的用户喜好矢量UPV*每个相对于所产生的特征矢量CCV的相似性。然后基于具有等于或高于阈值的用户喜好矢量UPV*形成新用户喜好矢量UPV*(对应于上文描述的特定上下文用户喜好矢量sCUPV*)。匹配单元3计算另一内容的特征矢量CCV相对于新用户喜好矢量UPV*的相似性并将计算结果推荐给推荐器9。
第二实施例参考附图18至附图22,下文描述根据第二实施例的信息处理设备。
附图18所示为根据本发明的第二实施例的信息处理设备。在附图18中,与根据第一实施例(附图1)的信息处理设备的部件类似的部件以类似的参考标号表示。
在根据第二实施例的信息处理设备中,根据第一实施例的匹配单元3(附图)以投影匹配单元101替代。
如上文所述,通过计算16-维当前上下文特征矢量cCCV相对于在UPV存储单元6中存储的每个16-维上下文用户喜好矢量CUPV*的相似性,根据第一实施例的匹配单元3设定16-维特定上下文用户喜好矢量sCUPV*。匹配单元3进一步计算对应于要推荐的内容的候选内容的每个16-维特征矢量CCV相对于16-维特定上下文用户喜好矢量sCUPV*的相似性并将计算结果输送给推荐器9。
如上文所述,匹配单元3处理与通过特征矢量(CCV)发生器21产生的特征矢量CCV的维数的数量相同数量的维数(在上述的实例中是16维)的矢量。因此,在第一实施例中,随着用户使用的内容的类型的数量增加,内容元信息的条数增加。结果,通过特征矢量(CCV)发生器21产生的特征矢量CCV的维数数量(元素数量)增加,因此通过用户喜好矢量(UPV)发生器23产生的用户喜好矢量UPV*的维数数量增加。这导致通过匹配单元3执行的计算的复杂性增加。
在第二实施例中,为解决上述的问题,投影匹配单元101将在相似性计算中要处理的矢量的元素(即对应于要推荐的内容的候选内容的特征矢量CCV和当前上下文特征矢量cCCV)投影到通过矩阵计算器(空间发生器)22产生的最佳空间UPS,由此减小了维数的数量。投影匹配单元101然后计算具有减小的维数的特征矢量CCV每个相对于在UPV存储单元6中存储的具有减小的维数的用户喜好矢量UPV*的相似性。在下文中将进一步详细地描述具有减小维数的用户喜好矢量UPV*。
投影匹配单元101包括矩阵计算器(投影单元)111和匹配计算器112。
如果矩阵计算器(投影单元)111从元信息获取单元1中接收特征矢量CCV(要推荐的候选内容的特征矢量CCV或当前上下文特征矢量cCCV),则矩阵计算器(投影单元)111通过将特征矢量CCV的元素投影到通过矩阵计算器(空间发生器)22产生的最佳空间UPS中减小所接收的特征矢量CCV的维数的数量。更具体地说,矩阵计算器(投影单元)111将所接收的特征矢量CCV乘以在分量矩阵存储单元5中存储的分量矩阵Uk的转置阵(公式(2))以将分量矩阵Uk的转置阵从左乘,由此将所接收的特征矢量CCV投影到最佳空间UPS,由此获得具有减小的维数的特征矢量CCV。在下文中,这种具有减小的维数的特征矢量CCV被称为特征矢量CCV#。
作为矩阵计算器(投影单元)111,用户喜好矢量(UPV)发生器23也将形成的用户喜好矢量UPV*(具有与通过特征矢量(CCV)发生器21形成的特征矢量CCV的维数数量相同的维数数量(在本实例中,16维)的用户喜好矢量UPV*)投影在通过矩阵计算器(空间发生器)22形成的最佳空间UPS中,由此减小了维数的数量。所得的具有减小的维数的用户喜好矢量UPV*存储在UPV存储单元6中。更具体地说,用户喜好矢量(UPV)发生器23将所形成的用户喜好矢量UPV*乘以通过矩阵计算器(空间发生器)22形成的分量矩阵Uk的转置阵以使分量矩阵Uk的转置阵左乘,由此将用户喜好矢量UPV*投影到最佳空间UPS,因此获得了具有减小的维数的用户喜好矢量UPV*。在下文中,将具有减小的维数的用户喜好矢量UPV*称为用户喜好矢量UPV*#。
当然,具有减小的维数的用户喜好矢量UPV*#可以通过矩阵计算器(投影单元)111形成。
匹配计算器112计算从矩阵计算器(投影单元)111中输出的具有减小的维数的特征矢量CCV#相对于在UPV存储单元6中存在的具有减小的维数的用户喜好矢量UPV*#的相似性,并根据需要将计算结果输送给推荐器9。
在第二实施例中,如上文所述,因为投影匹配单元101处理具有减小的维数的矢量,因此计算处理的复杂性比通过匹配单元3(附图1)根据第一实施例执行的处理的复杂性更低,在第一实施例中处理具有没有减小的维数的原始矢量。
对投影匹配单元101的具体形式没有限制,它可以通过软件、硬件或软件和硬件的混合实施。
在第二实施例中,除了投影匹配单元101之外信息处理设备的部件基本类似于在附图1中所示的第一实施例的部件。即,在附图18中,元信息获取单元1、空间/UPV发生器2和从CCV存储单元4至推荐器9的其它的部件在结构和功能上都类似于在附图1中的对应的方块,因此在此不再对它们重复描述。
现在,参考附图19中所示的流程图,下文描述根据第二实施例的信息处理设备(附图18)执行的UPV产生过程。
根据第二实施例的UPV产生过程的流程在许多部分上类似于根据第一实施例(附图3)的过程。在此不再描述与第一实施例的部分类似的部分,下文参考附图19中所示的流程图的讨论集中在与根据第一实施例的部分不同的不同上。
在附图19的步骤S201中的CCV产生过程与在附图3的步骤S1中的CCV产生过程基本相同的方式执行,在附图19的步骤S202中的近似矩阵(空间)产生过程与在附图3的步骤S2中的近似矩阵(空间)产生过程基本相同的方式执行。
在完成了近似矩阵(空间)产生过程(步骤S202)之后,然后在步骤S203中用户喜好矢量(UPV)发生器23确定要产生的用户喜好矢量UPV*的类型是否是每个上下文的用户喜好矢量CUPV*。
如果在步骤S203中用户喜好矢量(UPV)发生器23确定要产生的用户喜好矢量UPV*不是用户喜好矢量CUPV*,则用户喜好矢量(UPV)发生器23执行步骤S204至S206。
在这种情况下,首先,在步骤S204中,用户喜好矢量(UPV)发生器23设定用户喜好矢量UPV*以使矩阵CCM的列(即在近似矩阵CCM*中的特征矢量CCV*)分别用作用户喜好矢量UPV*。
在步骤S205中,用户喜好矢量(UPV)发生器23将每个用户喜好矢量UPV*投影到最佳空间UPS(由此产生具有减小的维数的用户喜好矢量UPV*#)。
在步骤S206中,用户喜好矢量(UPV)发生器23将具有减小的维数的这些用户喜好矢量UPV*#存储在UPV存储单元6中。
因此,根据第二实施例的UPV产生过程完成。
在另一方面,在用户喜好矢量(UPV)发生器23在步骤S203中确定要形成的用户喜好矢量UPV*的类型是用户喜好矢量CUPV*的情况下,用户喜好矢量(UPV)发生器23在步骤S207中执行CUPV产生过程。即,在步骤S207中,用户喜好矢量(UPV)发生器23产生具有减小的维数的上下文用户喜好矢量CUPV*#。
附图20所示为根据第二实施例的CUPV产生过程的详细流程的实例。根据第二实施例的CUPV产生过程的流程在许多方面类似于根据第一实施例(附图12)的流程。在此省去与第一实施例中的部分类似的部分,下文参考附图20的流程图的讨论集中在与根据第一实施例的流程不同的部分上。
在附图20中的步骤S221至S223与在附图12中的步骤S61至S63基本相同的方式执行。在步骤S221至S223完成之后,如下地执行处理。
即,在步骤S223中为每个类别设置了上下文用户喜好矢量CUPV*之后,处理进行到步骤S224,在步骤S224中用户喜好矢量(UPV)发生器23将每个类别的上下文用户喜好矢量CUPV*投影到最佳空间UPS(由此对于每个类别产生具有减小的维数的上下文用户喜好矢量CUPV*#)。
在步骤S225中,用户喜好矢量(UPV)发生器23将为各个类别产生的具有减小的维数的上下文用户喜好矢量CUPV*#存储在UPV存储单元6中。
因此,完成了根据第二首鼠两端CUPV产生过程(在附图19中在步骤S207中),并完成了根据第二实施例的UPV产生过程。
下文描述通过根据第二实施例的信息处理设备执行的内容推荐处理。
根据第二实施例的内容推荐处理的流程类似于根据在附图13中所示的第一实施例的流程。
然而,根据第二实施例的CUPV设置过程(步骤S101)稍微不同于根据第一实施例(附图14)的过程,根据第二实施例的内容推荐计算过程(步骤S102)稍稍不同于根据第一实施例(附图17)的过程。
附图21所示为根据第二实施例的CUPV设置过程(步骤S101)的细节,附图22所示为根据第二实施例的内容推荐计算过程(步骤S102)的细节的流程图。首先,参考附图21,描述根据第二实施例的CUPV设置过程(步骤S101)的细节。在下文中,参考附图22,描述根据第二实施例的内容推荐计算过程(步骤S102)的细节。
首先,在附图21的步骤S241中,矩阵计算器(投影单元)111从元信息获取单元1(上下文获取单元14)中获取当前上下文。
在步骤S242中,矩阵计算器(投影单元)111从当前上下文信息中产生特征矢量CCV(即产生当前上下文特征矢量cCCV)。
在步骤S243中,矩阵计算器(投影单元)111将当前上下文特征矢量cCCV投影到最佳空间UPS(即矩阵计算器(投影单元)111产生具有减小的维数的当前上下文特征矢量cCCV#)。
在步骤S244中,匹配计算器112计算具有减小的维数的当前上下文特征矢量cCCV#相对于在UPV存储单元6中存储的具有减小的维数的上下文用户喜好矢量CUPV*#的相似性。
在步骤S245中,匹配计算器112选择具有最高的相似性的具有减小维数的上下文用户喜好矢量CUPV*#并将它用作具有减小维数的特定上下文用户喜好矢量sCUPV*#。
因此,完成了根据第二实施例的CUPV设置过程。
虽然在附图21中没有示出,在UPV存储单元6中存储的用户喜好矢量不是上下文用户喜好矢量CUPV*#而是用户喜好矢量UPV*#的情况下,匹配计算器112通过执行与根据第一实施例(步骤S124)的处理类似的处理设置特定上下文用户喜好矢量sCUPV*#。
在完成了根据第二实施例的CUPV设置过程(在附图13中的步骤S101)之后,执行根据第二实施例的内容推荐计算过程(在附图13中的步骤S102)。
即,在附图22的步骤S261中,矩阵计算器(投影单元)111从元信息获取单元1(文本分析器12获元数据获取单元13)中获取多个内容中的每个内容的内容元信息作为要推荐的每个候选内容的内容元信息。
在步骤S262中,矩阵计算器(投影单元)111从要推荐的每个候选内容的内容元信息中产生特征矢量CCV。即,矩阵计算器(投影单元)111产生对用于每个内容的特征矢量CCV。
在步骤S263中,矩阵计算器(投影单元)111将每个候选内容的特征矢量CCV投影在最佳空间UPS(即,为每个候选内容产生具有减小的维数的特征矢量CCV#)。
在步骤S264中,匹配计算器112计算每个候选内容的具有减小的维数的特征矢量CCV#(在步骤S263中产生)相对于在CUPV设置过程中在步骤S101(在附图13中示出(其细节在附图21中示出))中设定的具有减小的维数的特定上下文用户喜好矢量sCUPV*#的相似性,匹配计算器112将计算的结果输送给推荐器9。
在步骤S265中,推荐器9选择对应于具有高于阈值的相似性的特征矢量CCV的内容(或对应于具有最高的相似性的特征矢量CCV的内容)并将所选择的内容推荐给用户。
因此,根据第二实施例的内容推荐计算过程(在附图13中所示的步骤S102)完成,并且在附图13中所示的内容推荐过程也完成。
如上文所述,在根据第二实施例的内容推荐过程中,处理具有减小的维数的矢量,因此计算处理的复杂性比根据处理具有没有减小的维数的矢量的第一实施例的内容推荐处理的复杂性更低。
在第二实施例中,与在前文描述的第一实施例一样,与用户的当前上下文最佳匹配的内容推荐给用户。注意,在用户使用内容时,可以推荐与用户当前使用的内容最佳地匹配的另一内容。
在这种情况下,投影匹配单元101执行如下的过程。即,投影匹配单元101从元信息获取单元1中获取用户当前使用的内容的内容元信息,并将权重值分配给每条所获取的内容元信息。分配给相应条的内容元信息的权重值代入标准形式的矢量的对应元素中,由此产生用于用户当前使用的内容的特征矢量CCV。
投影匹配单元101然后将所产生的特征矢量CCV和在UPV存储单元6中存在的一个获多个用户喜好矢量UPV*在公式(4)中从左乘以分量矩阵Uk的转置阵,由此产生可用于用户当前使用的内容的具有减小维数(K维)的特征矢量CCV#和具有减小维数(K维)的一个或多个用户喜好矢量UPV*#。注意,作为投影匹配单元101的替代,用户喜好矢量(UPV)发生器23可以产生具有减小维数(K维)的一个或多个用户喜好矢量UPV*#。
投影匹配单元101然后计算具有减小维数(K维)的一个或多个用户喜好矢量UPV*#中的每个相对于与用户当前使用的内容关联的具有减小维数(K维)的特征矢量CCV#的相似性。然后基于具有等于或高于阈值的相似性的具有减小维数(K为)的用户喜好矢量UPV*产生新K维用户喜好矢量UPV*(对应于如上文所述具有减小的维数的特定上下文用户喜好矢量sCUPV*#)。在下文中,这种新K维用户喜好矢量UPV*被表示为UPV*#。匹配单元3然后计算另一内容的具有减小的维数的特征矢量相对于新K维用户喜好矢量UPV*#的相似性并将计算结果输送给推荐器9。
第三实施例现在参考附图23至25,下文描述根据第三实施例的信息处理设备。
根据第一实施例(附图1)的信息处理设备或者根据第二实施例(附图18)的信息处理设备可以直接用作根据第三实施例的信息处理设备,因此在此不再重复描述根据第三实施例的信息处理设备的结构。在下文的描述中,通过举例,假设在第三实施例中使用的信息处理设备类似于根据在附图1中所示的第一实施例的信息处理设备。
下文描述根据第三实施例通过信息处理设备(类似于在附图1中所示的信息处理设备)执行的UPV产生过程。
在根据第三实施例的UPV产生过程中,事先为各个内容定义的各个用户喜好矢量UPV*(即各个内容特定的用户喜好矢量CUPV*)设置候选内容。
附图23所示为说明根据第三实施例的UPV产生过程的实例的流程图。参考附图23,详细描述根据第三实施例的UPV产生过程。
如附图23所示,在步骤S301中,执行CCV产生过程,并在步骤S302中执行近似矩阵(空间)产生过程。在下文中,在步骤S303中,执行CUPV产生过程。在步骤S304中,在附图1中所示的相关信息获取单元8为每个用户喜好矢量CUPV*搜索要推荐的候选内容。
在这个第三实施例中,CCV产生过程、近似矩阵(空间)产生过程和CUPV产生过程都以与根据第一实施例的对应的过程相同的方式执行。即,在这个第三实施例中,CCV产生过程根据在附图4中所示的流程图执行,近似矩阵(空间)产生过程根据在附图6中所示的流程图执行。CUPV产生过程根据在附图12中所示的流程图执行。
在下文中,通过相关信息获取单元8执行的上述的过程(步骤S304)将被简单地称为与上下文相关页面获取过程。根据第三实施例的与上下文相关页面获取过程(步骤S304)的细节在附图24的流程图中示出。参考附图24,下文详细地描述根据第三实施例的上下文相关页面获取过程(步骤S304)。
首先在步骤S321中,相关信息获取单元8从通过用户喜好矢量(UPV)发生器23产生的每个内容特定的用户喜好矢量CUPV*中选择具有最高的权重值的两个元素(与内容元信息关联)。
在步骤S322中,相关信息获取单元8访问因特网等(未示),并通过使用对应于为每个内容特定的用户喜好矢量CUPV*选择的两个元素的字(例如如在附图5中的内容元信息的项目描述的“幼儿园”和“小孩”)作为关键字搜索内容(在特定的URL的站点上存储的)。
在步骤S323中,虽然在附图1中没有示出,但是相关信息获取单元8仍然将搜索的结果存储在UPV存储单元6中以便将搜索的结果链接到对应的内容特定的用户喜好矢量CUPV*。
因此,完成了根据第三实施例的与上下文相关页面获取过程。
现在,参考附图25中所示的流程图,下文描述根据第三实施例的内容推荐过程。
在步骤S341中,执行CUPV过程。在步骤S343中,在附图1中所示的推荐器9选择通过连接到特定上下文用户喜好矢量sCUPV*的搜索的结果指示的内容,即选择通过连接到特定上下文用户喜好矢量sCUPV*的搜索结果指示的并在附图24中的步骤S323中存储在UPV存储单元6中的内容,推荐器9将所选择的内容推荐给用户。
在这个第三实施例中,CUPV设置过程与根据第一实施例基本相同的方式执行。即,也是在这个第三实施例中,CUPV设置过程根据在附图14中所示的流程图执行,因此在此不再重复CUPV设置过程的描述。
在第三实施例中,如上文所述,因为对于各个上下文用户特定矢量sCUPV*已经事先指定了候选内容,因此在设置特定上下文用户喜好矢量sCUPV*时可以立即选择的候选内容,而不必计算在特定上下文用户喜好矢量sCUPV*和候选内容的特征矢量之间的相似性。
在前文描述的第一和第二实施例中,为推荐与用户的喜好匹配并与用户当前使用的内容或当前上下文匹配的内容,需要执行内容匹配过程(相似性的计算)并搜索每次推荐的内容。因此,例如,为推荐在因特网上的网页作为内容,在每次推荐时需要执行搜索。这需要较长的时间,而这通常是用户难以接受的。
在第三实施例中,上述的问题通过事先登记指示各个上下文用户喜好矢量sCUPV*的候选内容(候选网页)的数据解决。
第四实施例现在参考附图26至29,下文描述根据第四实施例的信息处理设备。
在前述的实施例(第一至第三实施例)中,假设用户对该内容感兴趣,比如通过用户接收的邮件文件。换句话说,在前述的实施例中,选择内容不涉及用户是否对该内容感兴趣的问题。
在这个第四实施例中,考虑用户是否对该内容感兴趣来选择内容。从多个候选内容中事先选择用户感兴趣(或不感兴趣)的内容,并从用户感兴趣的预先选择的候选内容中选择与用户的当前上下文匹配的候选内容,并将所选则的候选内容提供给用户。
在第四实施例中,为实现上述目的,以不同于根据第一实施例(附图1)或第二实施例(附图8)的方式构造信息处理设备。
附图26所示为根据本发明的第四实施例的信息处理设备的结构的实例。在附图26中,与根据第一实施例(附图1)的信息处理设备的部件或根据第二实施例(附图18)的信息处理设备的部件类似的部件以类似的参考标号表示。
在根据第四实施例的信息处理设备中,第一或第二实施例的空间/UPV发生器2(附图1或附图18)以空间发生器201和特定喜好UPV发生器202替代。此外,作为根据第一实施例的匹配单元3或第二实施例的投影匹配单元101的替代,提供匹配单元204。此外,根据第四实施例的信息处理设备附加地包括SVM模型存储单元203。
空间发生器201包括特征矢量(CCV)发送器211和矩阵计算器(喜好特定空间发生器)212。
特征矢量(CCV)发送器211在功能和结构上类似于根据第一或第二实施例的特征矢量(CCV)发生器21(附图1或附图18),但除了在与特定的内容关联的特征矢量CCV存储在CCV存储单元4中时,指示用户是否对与特征矢量CCV各个内容是否感兴趣的信息也存储在CCV存储单元4中,以便该信息链接到特征矢量CCV。
指示用户对与特征矢量CCV对应的内容感兴趣的信息被称为肯定喜好信息,而指示用户对与特征矢量CCV对应的内容不感兴趣的信息被称为否定喜好信息。即,在CCV存储单元4中存储的每个特征矢量CCV链接到肯定或否定喜好信息中。
换句话说,链接到肯定喜好信息的特征矢量是指示用户的喜好的肯定因素的特征矢量CCV。在另一方面,链接到否定喜好信息的特征矢量CCV是指示用户的喜好的否定因素的特征矢量CCV。
任何方法可用于将特征矢量CCV链接到肯定喜好信息或否定喜好信息。例如,在用户每次使用内容时,用户可以直接输入指示是否感兴趣的内容的信息。可替换地,例如借助于SVM(支持矢量机)对每个特征矢量CCV的所有元素或某些元素(例如,仅与上下文信息关联的元素)执行学习,并将每个特征矢量CCV分为肯定喜好或否定喜好(即,确定每个特征矢量CCV是肯定喜好特征矢量CCV还是否定喜好特征矢量CCV)。
矩阵计算器(喜好特定空间发生器)212在功能和结构上类似于根据第一或第二实施例22(附图1和附图18)的矩阵计算器(空间发生器),但除了肯定喜好特征矢量CCV(链接到肯定喜好信息的特征矢量CCV)和否定喜好特征矢量CCV(链接到否定喜好信息的特征矢量CCV)在通过矩阵计算器(喜好特定空间发生器)212执行的过程中彼此严格地区别开。
更具体地说,矩阵计算器(喜好特定空间发生器)212产生其列由存储在CCV存储单元4中的M个肯定喜好特征矢量CCV给定的矩阵CCM(具有N行和M列)(其中M是等于或大于2的整数)。在下文中,其列由肯定喜好特征矢量CCV给定的矩阵CCM被称为矩阵CCM+。
例如通过奇异值分解和维数降低,矩阵计算器(喜好特定空间发生器)212将矩阵CCM+的各个元素(指示用户喜欢(欣赏)的内容的属性的内容元信息和指示欣赏过的内容的上下文的上下文信息)投影到主轴上。
通过减小矩阵CCM+的维数获得的结果矩阵被称为近似矩阵CCM+*。元素投影到其中上的空间被称为最佳空间UPS+。
更具体地说,矩阵计算器(喜好特定空间发生器)212借助于奇异值分解将N×M矩阵CCM+分解为分量矩阵U、∑和V的乘积以满足公式(1)。
矩阵计算器(喜好特定空间发生器)212然后抽取在分量矩阵U的最左区域中的k列(左奇异值矢量)并产生其列由所抽取的k列给定的矩阵Uk(具有N行和k列)。此外,矩阵计算器(喜好特定空间发生器)212抽取在分量矩阵V的最左区域中的k列(右奇异值矢量)并产生其列由所抽取的k列给定的矩阵Vk(具有M行和k列)。此外,矩阵计算器(喜好特定空间发生器)212抽取在分量矩阵∑的最左区域中的k列并进一步抽取各个所抽取的k列的第1至第k个元素,并产生其元素由所抽取的元素(对应于在原始分量矩阵∑的左上区域中的k×k元素)给定的矩阵∑k(具有k行和k列)。
然后矩阵计算器(空间发生器)22计算公式(2)的右手侧,由此获得具有简并到k的矩阵Dk。所得的矩阵Dk作为矩阵CCM+的近似矩阵CCM*(在下文中,这种近似矩阵被称为近似矩阵CCM+*)输送到喜好特定的UPV发生器202。
将近似矩阵CCM+*(=Dk)的分量矩阵Uk(根据需要,以及Vk和∑k)输送到语法字典发生器7,并且也输送到分量矩阵存储单元5以存储在其中。
矩阵计算器(喜好特定空间发生器)212也对存储在CCV存储单元4中的特征矢量CCV的否定喜好的M个特征矢量CCV执行类似的处理。
更具体地说,矩阵计算器(喜好特定空间发生器)212产生其列通过对矩阵CCM-执行奇异值分解和维数降低产生其列由否定喜好的M个特征矢量CCV(在下文这种近似矩阵称为近似矩阵CCM-*)给定的N×M矩阵CCM-的近似矩阵CCM*,并且矩阵计算器(喜好特定空间发生器)212将所得的近似矩阵CCM-*输送给喜好特定的UPV发生器202。
近似矩阵CCM-*的分量矩阵Uk(根据需要,以及矩阵Vk和/或∑k)输送给语法字典发生器7,并也输送给分量矩阵存储单元5以存储在其中。
现在,解释喜好特定的UPV发生器202。喜好特定的UPV发生器202包括SVM分类学习单元221和用户喜好矢量(UPV)发生器222。
SVM分类学习单元221通过使用SVM(支持矢量机)通过使用从空间发生器201输送的近似矩阵CCM+*或CCM-*的列作为训练数据通过执行学习产生SVM模型(分类器)。所得的SVM模型存储在SVM模型存储单元203中。
用户喜好矢量(UPV)发生器222在功能和结构上类似于根据第一或第二实施例(附图1或附图18)的用户喜好矢量(UPV)发生器23。
然而,如上文所述,矩阵CCM+的近似矩阵CCM+*和矩阵CCM-的近似矩阵CCM-*从空间发生器201输送到用户喜好矢量(UPV)发生器222以便这两种类型的近似矩阵彼此严格地区分开。因此,用户喜好矢量(UPV)发生器222可以产生两种类型的用户喜好矢量,即基于矩阵CCM+的近似矩阵CCM+*的用户喜好矢量UPV*(或上下文用户喜好矢量CUPV*)和基于矩阵CCM-的近似矩阵CCM-*的用户喜好矢量UPV*(或上下文用户喜好矢量CUPV*)。注意,可以产生这两种类型的用户喜好矢量或可以产生它们中的一种。然而,在此,为实现从用户感兴趣的候选内容中选择内容的最终目的,用户喜好矢量(UPV)发生器222基于矩阵CCM+的近似矩阵CCM+*产生用户喜好矢量UPV*(或上下文用户喜好矢量CUPV*)并将所产生的用户喜好矢量UPV*存储在UPV存储单元6中。
现在,解释匹配单元204。匹配单元204包括SVM分类器231和匹配计算器232。
为了推荐器9推荐与用户所处的当前上下文很好地匹配的内容,SVM分类器231首先从元信息获取单元1中获取指示用户的当前上下文的上下文信息,并产生其元素由上下文信息的各个权重值给定的标准形式的特征矢量CCV,即产生当前上下文特征矢量cCCV。
在下文中,使用在SVM模型存储单元203中存储的SVM模型(分类器),SVM分类器231确定当前上下文特征矢量cCCV是否是用户感兴趣的。将分类结果和当前上下文特征矢量cCCV输送给匹配计算器232。在此,将对用户感兴趣的当前上下文特征矢量cCCV的分类称为肯定分类,而将肯定分类的当前上下文特征矢量cCCV称为肯定喜好当前上下文特征矢量cCCV。在另一方面,将对用户不感兴趣的当前上下文特征矢量cCCV的分类称为否定分类,而将否定分类的当前上下文特征矢量cCCV称为否定喜好当前上下文特征矢量cCCV。
在肯定喜好当前上下文特征矢量cCCV从SVM分类器231中输出时,匹配计算器232计算这个当前上下文特征矢量cCCV相对于在UPV存储单元6中存储的用户喜好矢量CUPV*的相似性。匹配计算器232将具有最高的相似性的上下文用户喜好矢量CUPV*用作与用户所处的当前上下文最佳地匹配的上下文用户喜好矢量CUPV*,即作为特定上下文用户喜好矢量sCUPV*。
在不是上下文用户喜好矢量CUPV*而是近似矩阵CCM+*的列(肯定喜好特征矢量cCCV*)直接作为用户喜好矢量UPV*存储在UPV存储单元6中时,匹配计算器232计算肯定喜好当前上下文特征矢量cCCV相对于在UPV存储单元6中存储的每个用户喜好矢量UPV*的相似性。匹配计算器232选择具有等于或高于阈值的相似性的某些用户喜好矢量UPV*,匹配计算器232产生其元素由所选择的用户喜好矢量UPV*的对应元素之和给定的标准形式的矢量(即,产生所选择的用户喜好矢量UPV*的和矢量),并将所产生的矢量用作用户所处的当前上下文的上下文用户喜好矢量CUPV*,即用作特定上下文用户喜好矢量sCUPV*。
SVM分类器231从元信息获取单元1中接收与候选内容关联的内容元信息,SVM分类器231产生其元素由上下文信息的各个权重值给定并且其对应于上下文信息的元素都为0的标准形式的特征矢量CCV。
在下文中,使用在SVM模型存储单元203中存储的SVM(分类器),SVM分类器231对特征矢量CCV进行分类并仅在对特征矢量CCV进行肯定分类时将特征矢量CCV输送给匹配计算器232(在下文中将这种特征矢量CCV称为特征矢量CCV+)。
一旦接收特征矢量CCV+,匹配计算器232计算特征矢量CCV+相对于特定上下文用户喜好矢量sCUPV*的相似性并将计算结果输送给推荐器9。
注意,对从空间发生器201到匹配单元204的部件没有特别限制。空间发生器201、喜好特定UPV发生器202和匹配单元204可以通过软件、硬件或软件和硬件的混合实施。
除了从空间发生器201到匹配单元204的这些部件之外的部件基于与根据在附图1的第一实施例或在附图18中所示的第二实施例的对应的部件基本相同。即,在附图26中,元信息获取单元1和从CCV存储单元4到推荐器9的部件在结果和功能上与在附图1(或附图18)中的对应的方块类似,因此在此不对它们重复描述。
现在,下文描述根据第四实施例通过信息处理设备执行的UPV产生过程。
根据第四实施例的UPV产生过程的流程在许多方面类似于根据第一实施例(附图3)在附图3中的流程图中所示的UPV产生过程。
然而,根据第四实施例的近似矩阵(空间)产生过程(步骤S2)稍稍不同于根据第一实施例(附图6)。
附图27所示为说明根据第四实施例的近似矩阵(空间)产生过程(步骤S2)的详细流程的实例的流程图,下文描述根据第四实施例的近似矩阵(空间)产生过程(步骤S2)细节。
首先,在步骤S401中,矩阵计算器(喜好特定空间发生器)212从CCV存储单元4中获取多个特征矢量CCV(连同指示这些特征矢量CCV是具备肯定喜好还是否定喜好的信息一起)。
在步骤S402中,矩阵计算器(喜好特定空间发生器)212确定各个获取的特征矢量CCV是具有肯定喜好还是否定喜好。
在步骤S402中确定所获取的特征矢量CCV具有肯定喜好时,对应于在附图6中的步骤S42至S45的步骤S403至S406被执行。更具体地说,矩阵计算器(喜好特定空间发生器)212产生矩阵CCM+的近似矩阵CCM+*并将它输送给SVM分类学习单元221。分量矩阵Uk(根据需要,以及分量矩阵∑k和分量矩阵Vk)存储在分量矩阵存储单元5中。
在另一方面,如果在步骤S402中确定所获取的特征矢量CCV具有否定喜好(不具备肯定喜好),则执行对应于步骤S42至S45的步骤S407至S410。更具体地说,矩阵计算器(喜好特定空间发生器)212产生矩阵CCM-的近似矩阵CCM-*并将它输送给SVM分类学习单元221。分量矩阵Uk(根据需要,以及分量矩阵∑k和分量矩阵Vk)存储在分量矩阵存储单元5中。
在步骤S411中,SVM分类学习单元221通过使用近似矩阵CCM*(近似矩阵CCM+*或CCM-*)作为训练数据通过执行SVM学习产生SVM模型。所得的SVM模型存储在SVM模型存储单元203中。
因此,完成了根据第四实施例的近似矩阵(空间)产生过程(在附图3的步骤S2),以及在附图2中步骤S3和后面的步骤以类似于第一实施例的方式执行,但除了在第四实施例中使用矩阵CCM+的近似矩阵CCM+*之外。
下文描述根据第四实施例的信息处理设备执行的内容推荐过程。
根据第四实施例的内容推荐处理的流程类似于根据在附图13中所示的第一实施例的流程。
然而,根据第四实施例的CUPV设置过程(步骤S101)与第一实施例(附图14)的过程稍稍不同,以及根据第四实施例的内容推荐计算过程(步骤S102)也与根据第一实施例(附图17)的过程稍稍不同。
附图28所示为根据第四的CUPV设置过程(步骤S101)的细节,附图29所示为根据第四实施例的内容推荐计算过程(步骤S102)的细节。首先,参考附图28,描述根据第四实施例的CUPV设置过程(步骤S101)的细节。在下文中,参考附图29,描述根据第四实施例的内容推荐计算过程(步骤S102)的细节。
首先,在附图28中的步骤S421中,在附图26中所示的SVM分类器231从元信息获取单元1(上下文获取单元14)中获取当前上下文信息。
在步骤S422中,SVM分类器231从当前上下文信息中产生特征矢量CCV(即产生当前上下文特征矢量cCCV)。
在步骤S423中,SVM分类器231通过使用SVM对当前上下文特征矢量cCCV进行分类。更具体地说,使用在SVM模型存储单元203中存储的SVM模型(分类器),SVM分类器231对当前上下文特征矢量cCCV进行肯定或否定地分类。
在步骤S424中,SVM分类器231确定在步骤S423中的分类的结果。
如果在步骤S424中确定当前上下文特征矢量cCCV具有否定喜好(不具备肯定喜好),则根据第一实施例的CPU设置过程结束。在这种情况下,匹配单元204可以将错误消息提供给用户。
在另一方面,在步骤S424中确定当前上下文特征矢量cCCV具备肯定喜好时,处理进行到步骤S425,在步骤S425中匹配计算器232计算当前上下文特征矢量cCCV相对于在UPV存储单元6中存储的每个用户喜好矢量CUPV*的相似性。
在步骤S426中,匹配计算器232选择具有最高的相似性的用户喜好矢量UPV*并将它用作特定上下文用户喜好矢量sCUPV*。
因此,完成了根据第四实施例的CUPV设置过程。
虽然在附图28中没有示出,在UPV存储单元6中存储的用户喜好矢量不是上下文用户喜好矢量CUPV*而是用户喜好矢量UPV*的情况下,匹配计算器232通过执行与根据第一实施例(步骤S124)的过程类似的过程设置特定上下文用户喜好矢量sCUPV*。
在完成了根据第四实施例的CUPV设置过程(在附图13中的步骤S101)之后,执行根据第四实施例的内容推荐计算过程(在附图13中的步骤S102)。
即,在附图29的步骤S441中,SVM分类器231从元信息获取单元1(文本分析器12或元数据获取单元13)中获取多个内容中的每个内容的内容元信息作为要推荐的每个候选内容的内容元信息。
在步骤S442中,SVM分类器231从每个候选内容的每个内容元信息中产生特征矢量CCV。即,SVM分类器231产生要推荐的内容的每个候选内容的每个特征矢量CCV。
在步骤S443中,SVM分类器231通过SVM对要推荐的内容的候选内容的每个特征矢量CCV进行分类。更具体地说,通过使用在SVM模型存储单元203中存储的SVM模型(分类器),SVM分类器231对特征矢量CCV进行肯定或否定分类。
在步骤S444中,SVM分类器231抽取与候选内容关联的肯定喜好特征矢量CCV作为要处理的特征矢量CCV+。
在步骤S445中,匹配计算器232计算在步骤S444中抽取的对应于各个候选内容的每个特征矢量CCV+相对于在步骤S101(附图13(其细节在附图28中示出))中在CUPV设置过程中设置的特定上下文用户喜好矢量sCUPV*的相似性,并将计算结果输送给推荐器9。
在步骤S446中,推荐器9选择对应于具有比阈值更高的相似性的特征矢量CCV的内容(或对应于具有最高的相似性的特征矢量CCV的内容)并将所选择的内容推荐给用户。
因此,完成了根据第四实施例的内容推荐计算过程(在附图13中所示的步骤S102),并且也完成了在附图13中所示的内容推荐过程。
在第四实施例中,如上文所述,使用用户特定的语法空间(通过矩阵计算器212产生的喜好特定空间)(即使用用户特定的肯定喜好的最佳空间UPS和否定喜好的最佳空间UPS)学习分类。这使得它适当地对给定的内容进行分类。
虽然在上述的实例中,处理肯定喜好的特征矢量CCV(肯定喜好特征矢量CCV+),但是在推荐内容的过程中也可以使用否定喜好的特征矢量CCV(否定喜好特征矢量CCV-)。即,虽然在上述的实例中,在内容的选择过程中仅考虑用户的肯定喜好,但是也可以考虑用户的肯定和否定喜好两者选择内容。
在这种情况下,附图26中所示的信息处理设备执行如下的过程。
空间发生器201产生矩阵CCM+的近似矩阵CCM+*以使近似矩阵CCM+*的列由M个肯定喜好特征矢量CCV+给定,以及产生矩阵CCM-的近似矩阵CCM-*以使近似矩阵CCM-*的列由M个否定喜好特征矢量CCV-给定。所得的近似矩阵CCM+*和近似矩阵CCM-*输送给喜好特定UPV发生器202。
用户喜好矢量(UPV)发生器222从所输送的近似矩阵CCM-*中产生用户喜好矢量UPV*(将所产生的用户喜好矢量UPV*称为肯定喜好用户喜好矢量UPV+*),以及用户喜好矢量(UPV)发生器222也从所输送的近似矩阵CCM-*中产生用户喜好矢量UPV*(所产生的用户喜好矢量UPV*称为否定喜好用户喜好矢量UPV-*)。所得的肯定喜好用户喜好矢量UPV+*和否定喜好用户喜好矢量UPV-*都存储在UPV存储单元6中。
虽然在附图26中没有示出,可以消除SVM分类器231以使来自元信息获取单元1的信息直接输送给匹配计算器232。一旦从元信息获取单元1中接收到新内容的内容元信息,匹配计算器232就产生该新内容的特征矢量CCV。匹配计算器232计算在UPV存储单元6中存在的每个肯定喜好用户喜好矢量UPV+*相对于与新内容关联的特征矢量CCV的第一相似性,并也计算在UPV存储单元6中存在的每个否定喜好用户喜好矢量UPV-*相对于与新内容关联的特征矢量CCV的第二相似性。计算结果(即第一相似性和第二相似性)从匹配计算器232输送给推荐器9。
推荐器9基于第一相似性和第二相似性确定新内容是否适合作为要推荐的内容。如果新内容被确定为适合,则将新内容推荐给用户。
更具体地说,如果第一相似性等于或高于第一阈值并且第二相似性低于第二阈值,则推荐器9确定新内容适合作为要推荐的内容,因此推荐器9将新内容作为推荐的内容提供给用户。
可替换地,如果第一相似性高于第二相似性并且第二相似性低于阈值,则推荐器9确定新内容适合作为要推荐的内容,因此推荐器9将新内容作为推荐的内容提供给用户。
第五实施例现在,参考附图30至33,下文描述根据第五实施例的信息处理设备。
在描述第五实施例之前,描述根据第五实施例关于信息处理设备的发明的背景技术。
通常使用的内容元数据包括类型描述的项目。在与电视广播节目关联的内容元数据的情况下,例如将内容元数据分类为主类型比如体育、戏剧、电影和各种表演。每个主类型具有子类型。例如,各种表演类型具有子类型比如喜剧、流行音乐表演、一般表演等。
然而,从上述的实例中可以理解,内容不一定分类到恰当的子类型中。对用户来说分类通常不正确。
为解决上述问题,本发明的发明人已经发明了如下的技术。
在近似矩阵CCM*(通过奇异值分解和维数降低从矩阵CCM中产生的)中,通过普通方法对内容元信息(字)进行族化(分类)并将每个族(类别)用作一种类型。这种类型在此称为UP类型以与常规的类型相区别。然后通过使用SVM使用UP类型作为训练数据通过执行学习形成SVM模型(分类器)。通过使用形成的SVM模型(分类器),确定新内容的UP类型。在UP类型的确定中,不需要与该内容关联的上下文信息。
在这种技术中,UP类型不需要具有它们的类型名称,或者可以使用字、组合或具有最高的权重的字作为类型的名称。
本技术可用于推荐特定的类型的内容,并且也可以用于将彼此类似的多个内容提供给用户。
本发明上述的技术提供了一种信息处理设备。该信息处理设备的实例在附图30中示出。
即,附图30所示为根据本发明的第五实施例的信息处理设备。在附图30中,通过类似的参考标号表示与根据第四实施例(附图26)的信息处理设备的部件类似的部件。
在根据第五实施例的信息处理设备中,以UPV/UP类型发生器302替代根据第四实施例的喜好特定UPV发生器202,以类型确定单元304替代根据第四实施例的匹配单元204,以及以在功能和结构类似于SVM模型存储单元203(但其差别在于其中存储的模型是不同的)的SVM模型存储单元303替代根据第四实施例的SVM模型存储单元203。
UPV/UP类型发生器302包括SVM分类学习单元(UP类型发生器)321和用户喜好矢量(UPV)发生器322。
SVM分类学习单元(UP类型发生器)321在功能和结构上于根据第四实施例的SVM分类学习单元221类似。然而,与形成用于将内容分类为肯定喜好组或否定喜好组的SVM模型的SVM分类学习单元221不同的是,SVM分类学习单元(UP类型发生器)321形成确定新内容的UP类型的SVM模型。
根据第五实施例的用户喜好矢量(UPV)发生器322在功能和结构上类似于根据第四实施例的用户喜好矢量(UPV)发生器222,因此在此不再描述它。
类型确定单元304包括在功能和结构上基本类似于根据第四实施例的SVM分类器231的SVM分类器331。然而,与根据第四实施例确定给定的新内容(与该内容关联的内容元信息)是否具有肯定喜好或否定喜好的SVM分类器231不同的是,根据第五实施例的SVM分类器321确定给定的新内容的UP类型(即,将给定的新内容分为UP类型中的一种类型)。
对UPV/UP类型发生器302、SVM模型存储单元303和类型确定单元304的形式没有特别限制。注意,UPV和UP类型发生器302和类型确定单元304可以通过软件、硬件和软件和硬件的混合实施。
除了UPV/UP类型发生器302、SVM模型存储单元303和类型确定单元304之外的部件与根据在附图26中所示的第四实施例的对应部件基本相同。更具体地说,在附图30中,元信息获取单元1、空间发生器201、CCV存储单元4、分量矩阵存储单元5、UPV存储单元6、语法字典发生器7、相关信息获取单元8和推荐器9每个都在功能和结构上与在附图26中所示的各个方块类似,因此在此不再重复它们的描述。
现在,参考附图31中所示的流程图,描述根据第五实施例通过信息处理设备(附图30)执行的UP产生过程。
首先,在步骤S501中,执行CCV产生过程。在步骤S502中,执行近似矩阵(空间)产生过程。在步骤S503中,执行CUPV产生过程。
CCV产生过程(步骤S501)、近似矩阵(空间)产生过程(步骤S502)和CUPV产生过程(步骤S503)以类似于根据先前的实施例的对应过程的方式执行。即,CCV产生过程(步骤S501)根据在附图4中所示的流程图执行,近似矩阵(空间)产生过程(步骤S502)根据在附图6中所示的流程图执行,以及CUPV产生过程(步骤S503)根据在附图12中所示的流程图执行。
在步骤S504中,SVM分类学习单元(UP类型发生器)321产生一个或多个UP类型。SVM分类学习单元(UP类型发生器)321然后通过使用UP类型作为训练数据通过执行SVM学习产生SVM模型。所得的SVM模型存储在SVM存储单元303中。这个SVM模型用于在步骤S544中的内容推荐过程以使如下文参考附图33进一步详细描述在给定新内容时类型确定单元304基于这个SVM模型从通过SVM分类学习单元(UP类型发生器)321产生的一个或多个UP类型中选择与该内容最佳匹配的类型并将它用作该内容的UP类型。
通过SVM分类学习单元(UP类型发生器)321执行的这种过程(步骤S504)称为UP类型产生过程。附图32所示为UP类型产生过程(步骤S504)的详细流程的实例的流程图。参考附图32,下文详细地描述UP类型产生过程(步骤S504)。
首先,在步骤S521中,SVM分类学习单元(UP类型发生器)321根据在各个元素中描述的上下文信息计算在从空间发生器201输送的近似矩阵CCM*的列中的元素的相似性,即在近似矩阵CCM*的特征矢量CCV*中的相似性。
在步骤S522中,SVM分类学习单元(UP类型发生器)321对每个特征矢量CCV*进行分类,更具体地说,SVM分类学习单元(UP类型发生器)321选择具有等于或高于阈值的相似性的特征矢量CCV*并将它们分为相同的类别。以上述方式产生的每个类别用作UP类型。因此,在上述的步骤S522中,产生UP类型。
更具体地说,例如,在附图11中所示的矩阵Dk作为近似矩阵CCM*从空间发生器201输送时,SVM分类学习单元(UP类型发生器)321检查在特征矢量中的元素(字)的相似性并进行分类以使特征矢量CCV*1、CCV*3和CCV*6(对应于文件DOC1、DOC3和DOC6)分为第一类型并将其它的特征矢量分为第二类型。因此,在本实例中,SVM分类学习单元(UP类型发生器)321产生第一类型和第二类型。
在这个具体实例中,第一类型可以命名为“幼儿园”或“小孩”,而第二类型可以命名为“公司”或“紧张”。
在步骤S523中,SVM分类学习单元(UP类型发生器)321执行属于每个类别(UP类型)的特征矢量CCV*(例如对应于属于第一类型的特征矢量CCV*1、CCV*3和CCV*6)的SVM学习以产生每个类别(UP类型)的SVM模型。所得的每种类别(UP类型)的SVM模型存储在SVM存储单元303中。
因此,完成UP类型产生过程(在附图31中步骤S504),并完成根据第五实施例(附图31)的UPV产生过程。
下文描述根据第五实施例通过信息处理设备执行的内容推荐过程。
根据第五实施例的内容推荐过程的流程类似于在附图13中所示的根据第一(或第四)实施例的流程。
然而,根据第五实施例的内容推荐计算过程(步骤S102)稍稍不同于根据第一实施例(附图17)的过程。附图33所示为根据第五实施例的内容推荐计算过程(步骤S102)的详细流程的实例。参考附图33,下文描述根据第五实施例的内容推荐计算过程(步骤S102)的细节。
首先,在步骤S541中,在附图30中所示的类型确定单元304的SVM分类器331通过使用SVM对在步骤S101(在附图13中所示,其细节在附图14中示出)的CUPV产生过程中产生的特定上下文用户喜好矢量sCUPV*进行分类,由此确定它的UP类型。即,使用存储在SVM模型存储单元203中的SVM模型(分类器),SVM分类器331将特定上下文用户喜好矢量sCUPV*分为在UP类型中的一种类型。
在步骤S541中的处理结果(即特定上下文用户喜好矢量sCUPV*的UP类型)输送给推荐器9。
在步骤S542中,SVM分类器331从元信息获取单元1(文本分析器12或元数据获取单元13)中获取要推荐的每个候选内容的内容元信息作为多个内容的每个内容的内容元信息。
在步骤S543中,SVM分类器331从与每个候选内容关联的内容元信息中产生特征矢量CCV。即,SVM分类器331产生每个候选内容的每个特征矢量CCV。
在步骤S544中,SVM分类器331通过使用SVM对与各个候选内容关联的每个特征矢量CCV进行分类,由此确定它的UP类型。更具体地说,使用在SVM模型存储单元203中存储的SVM模型(分类器),SVM分类器331将每个特征矢量CCV分为UP类型中的一种类型。
在步骤S544中的处理结果(即每个候选内容的UP类型)输送给推荐器9。
在步骤S545中,推荐器9选择其UP类型与特定上下文用户喜好矢量sCUPV*的UP类型相同的内容并将它推荐给用户。
因此,完成了根据第五实施例的内容推荐计算过程(在附图13中所示的步骤S102),并且也完成了在附图13中所示的内容推荐过程。
在第五实施例中,如上文所述,从包括上下文信息的特征矢量CCV*中产生UP类型,并将新内容分为这些UP类型中的一种类型。注意,从用户看的上下文反映在通过上文描述的过程产生的UP类型中,由此所得的UP类型与用户特定的各种各样的上下文很好地匹配,这与基于元数据形成的常规类型不同。
其它的实施例上文参考第一至第五实施例已经描述了根据本发明的信息处理设备。然而,本发明不限于这些实施例,而是本发明还可以以其它各种方式实施。
例如,本发明可以应用到单个的信息处理设备或者可以应用到包括多个信息处理设备的信息处理设备,如附图34所示。
附图34所示为根据本发明的信息处理系统的功能性结构的实例。在附图34中,与根据第一至第五实施例(附图1、附图18、附图26或附图30)中的一个的信息处理设备的部件类似的部件以类似的参考标号表示。
如附图34所示,在这个信息系统中,服务器401和客户403彼此通过网络402连接。对网络402的具体形式没有限制。例如,可以使用缆线网络或无线网络。
首先,解释服务器401。服务器401包括高计算能力处理器411、计算结果存储单元412和通信单元413。
在各种处理中,需要高计算能力处理器的处理比如矩阵的计算通过高计算能力处理器411执行。更具体地说,高计算能力处理器411执行对应于如下过程的处理通过空间/UPV发生器2执行的过程(附图1或18)、通过空间发生器201执行的过程(附图26)、通过喜好特定的UPV发生器202执行的过程(附图26或30)和通过UPV/UP类型发生器302执行的过程(附图30)(即高计算能力处理器411可以被看作包括对应于在附图34中上文所述的那些部件的方块)。
计算结果存储单元412存储通过高计算能力处理器411执行的计算的结果(和/或存储在计算中需要的信息)。即,计算结果存储单元412对应于CCV存储单元4(附图1、18、26或30)、分量矩阵存储单元5(附图1、18、26或30)、SVM存储单元303(附图26或30)和UPV存储单元6(附图1、18、26或30)。
通信单元413控制通过网络402与客户403的通信。更具体地说,如果通信单元413从客户403通过网络402接收要被高计算能力处理器411使用的信息,则通信单元413将所接收的信息传送给高计算能力处理器411。在通信单元413通过网络402从客户403接收与通过用户使用的内容关联的内容元信息和指示其中用户使用该内容的上下文的上下文信息时,通信单元413将所接收的彼此关联的信息存储在计算结果存储单元412中。通信单元413从计算结果存储单元412中获取客户403使用的信息并通过网络402将它发送给客户403。
现在,解释客户403。客户403包括元信息获取单元1、语法字典发生器7、相关信息获取单元8和推荐器9,如上文所述,并且进一步包括推荐计算单元421、通信单元422、语音输出单元423和显示器424。
推荐计算单元421执行对应于如下过程的处理通过匹配单元3执行的过程(附图1)、通过投影匹配单元101执行的过程(附图18)、通过匹配单元204执行的过程(附图26)和通过类型确定单元304执行的过程(即推荐计算单元421可以被看作包括对应于在附图34中上文所描述的部件的方块)。
通信单元422控制通过网络402与服务器401的通信。更具体地说,在通信单元422从另一信息处理设备(未示)通过网络402接收内容数据或EPG数据时,通信单元422将所接收的数据传递给元信息获取单元1。通信单元422也用于将从元信息获取单元1输送的内容元信息或上下文信息通过网络402传送给服务器401。此外,通信单元422也用于根据要求将从服务器401通过网络402接收的各种各样的信息传送给推荐计算单元421、语法字典发生器7或相关信息获取单元8。
在语音信息被包括在指示要推荐的内容的信息(从推荐器9中输出的)中时,语音输出单元423输出对应于语音信息的语音。在图像信息(静态图像或运动图像信息)包括在指示要推荐的内容的信息(从推荐器9中输出的)中时,对应于图像信息的图像显示在显示器424上。
在附图34中所示的信息处理系统执行如下的过程。
如上文所述,服务器401具有高计算能力处理器411(具有在矩阵计算过程中需要的执行复杂处理的高计算能力)并产生其中收集用户的经历的用户喜好空间UPS(近似矩阵CCM*)。
更具体地说,客户403将与用户使用的内容关联的内容元信息和指示其中用户使用该内容的上下文的上下文信息通过网络402发送给服务器401。
在累计的信息(内容元信息和上下文信息)的量足够时,服务器412产生如上文所描述的矩阵CCM并通过奇异值分解和维数降低进一步产生近似矩阵CCM*和分量矩阵Uk、∑k和Vk。所得的矩阵存储在服务器401中设置的计算结果存储单元412中。服务器412根据要求将包括从这些矩阵中产生的近似矩阵CCM*、近似矩阵CCM*的分量矩阵Uk、∑k和Vk和/或用户喜好矢量UPV*的信息通过网络402输送给客户403。
一旦接收该信息,客户403执行所需的处理比如对所接收的信息的匹配处理。
为选择要推荐的内容,如上文在第四和第五实施例所述,要求通过使用SVM等执行预滤波处理以从所有的候选内容中检测与用户的喜好匹配的候选内容。在根据本发明的信息处理系统中,虽然在附图34中没有示出,可以通过服务器401执行预滤波处理。例如,根据第四实施例的处理被如下地执行。客户403将与用户使用的内容关联的内容元信息连同指示该内容是否是用户感兴趣(即该内容是否具有肯定或否定喜好)的信息通过网络402发送给服务器401。相应地,服务器401通过执行上述的SVM学习确定分隔面(指示用户的喜好的SVM模型),并根据要求将结果通过网络402发送给客户403。
在用户不希望公开他/她隐私的情况下,分隔面的计算(SVM模型)可以通过客户403执行并将结果通过网络402发送给服务器401。在这种情况下,通过服务器401执行滤波,并且服务器401仅将与用户的喜好匹配的内容元信息发送给客户403而不是发送所有的候选内容的内容元信息。这可以减少所发送的数据量,并且也可以减少通过客户403执行的匹配计算的复杂性。
注意,上述的所有的过程都可以通过客户403执行。即,处理序列的任何步骤都可以通过服务器401或客户403执行,只要作为整体执行了处理序列即可。
上文描述的处理步骤的序列可以通过硬件或软件执行。
例如,根据第一至第五实施例(附图1、18、26或30)的信息处理设备或在附图34中所示的服务器401或客户403可以使用在个人计算机(比如在附图35中所示的)中的软件实施。
如附图35所示,根据在ROM(只读存储器502)中存储的程序或根据从存储单元508装入到RAM(随机存取存储器)503中的程序执行过程处理。RAM 503也可用于存储在执行过程处理的过程中通过CPU501使用的数据。
CPU501、ROM502和RAM503都通过总线504彼此连接。总线504也连接到输入/输出接口505。
输入/输出接口505连接到包括键盘、鼠标和/或等的输入单元506、输出单元507比如显示器、存储单元508比如硬盘和包括调制解调器、终端适配器和/或等的通信单元509。通信单元509可以通过网络比如因特网与另一信息处理设备(未示)进行通信。
此外,输入/输出接口505根据要求与驱动器510连接。根据需要,可取下的存储媒体511比如磁盘、光盘、磁光盘或半导体存储器安装在驱动器510上,并且计算机程序从可取下的存储媒体511中读取并根据需要安装到存储单元508。
在通过软件执行处理序列时,可以从媒体或通过网络将形成软件的程序安装到作为专用硬件提供的计算机或可以安装到能够根据在其上安装的各种程序执行不同的处理的通用计算机中。
适合于上述目的的存储媒体的具体实例是可取下的存储媒体511比如磁盘(比如软盘)、光盘(比如CD-ROM(只读压缩盘存储器))和DVD(数字通用盘)、磁光盘(比如MD(Mini-Disk,商标))和半导体存储器,如附图35所示。程序可以存储在这种可取下的存储媒体中(以包装媒体的形式)并可以从计算机分别输送给用户。程序也可以通过将它预安装到在计算机中设置的内置的ROM 502或存储单元508比如硬盘而将它提供给用户。
在本说明书中,在存储媒体中存储的程序的步骤可以根据在程序中描述的顺序以时间顺序执行或者并行或分离的方式执行。
注意,在本说明书中术语“系统”用于描述包括多个设备或处理单元的总体结构。
权利要求
1.一种信息处理设备,该信息处理设备包括修改装置,用于获取每个包括N条单个信息的M个信息组并至少部分地修改M个信息组中每个的N条单个信息以便突出在N条单个信息中的相关性,这里N是等于或大于2的整数,M是等于或大于1的整数;产生装置,用于从M个信息组中产生在相似性的计算中用作参考的包括N条单个信息的参考信息组,该M个信息组中每个包括通过修改装置修改的N条单个信息;和相似性计算装置,用于获取包括N个单个信息元素的新信息组作为比较信息组并计算比较信息组相对于由产生装置产生的参考信息组的相似性。
2.根据权利要求1所述的信息处理设备,其中通过修改装置获取的M个信息组每个的N条单个信息包括指示特定的内容或特定的内容的一部分或指示该内容的属性的至少一条或多条内容元信息,并且也包括指示用户使用内容的内部或外部状态的至少一条或多条上下文信息。
3.根据权利要求2所述的信息处理设备,其中上下文信息包括作为权重分配给指示用户的空间位置的位置信息的值或它的归一化值。
4.根据权利要求2所述的信息处理设备,其中上下文信息包括作为权重分配给指示用户的情绪的情绪信息的值或归一化值。
5.根据权利要求2所述的信息处理设备,其中上下文信息包括通过用户或通过设置在用户的附近的传感器获取的值或它的归一化值。
6.根据权利要求2所述的信息处理设备,其中修改装置包括矢量化装置,在每次用户使用内容时,该矢量化装置用于获取包括与该内容相关的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,以及产生其元素通过分配给各个N条单个信息的权重值给定的矢量作为该内容的特征矢量;以及矩阵产生装置,在通过矢量化装置产生M个特征矢量时,该矩阵产生装置用于产生具有N行和M列的第一矩阵以使它的元素由该M个特征矢量给定,对第一矩阵执行操作以便将第一矩阵转换为其N×M个元素至少被部分地修改的第二矩阵以便突出在M列的每列中N行元素的相关性,其中该产生装置基于通过矩阵产生装置产生的第二矩阵的M列产生包括N个元素的参考矢量作为参考信息组;以及该相似性计算装置从比较信息组中产生包括N个元素的比较矢量并计算比较矢量和由产生装置产生的参考矢量之间的相似性。
7.根据权利要求6所述的信息处理设备,其中产生装置选择第二矩阵的M列的至少一个或多个列并将在所有选择的列中的每行中的元素相加在一起,由此产生参考矢量。
8.根据权利要求7所述的信息处理设备,其中产生装置根据对应于上下文信息的元素从第二矩阵的M列中选择彼此具有较高的相似性的列,并将在所有选择的列中的每行中的元素相加在一起,由此产生参考矢量。
9.根据权利要求7所述的信息处理设备,其中产生装置根据对应于上下文信息的元素从第一矩阵的M列中选择彼此具有较高的相似性的列,并进一步从第二矩阵中选择对应于第一矩阵的所选择的列的列并将在从第二矩阵中选择的所有的列中的每行中的元素相加在一起,由此产生参考矢量。
10.根据权利要求6所述的信息处理设备,其中产生装置通过直接运用由矩阵产生装置产生的第二矩阵的各个M列产生参考矢量。
11.根据权利要求6所述的信息处理设备,其中矢量化装置将权重值分配给N条单个信息中的每个以使权重值等于相应条的单个信息在该内容中出现的次数或等于它的归一化值。
12.根据权利要求6所述的信息处理设备,其中矢量化装置产生其元素分别通过分配给各个N条单个信息的权重值和N个可变系数的乘积给定的特征矢量。
13.根据权利要求6所述的信息处理设备,其中相似性计算装置获取包括与新内容关联的N条单个信息的信息组作为比较信息,将权重值分配给N条单个信息中的每个,产生其元素通过分配给N条单个信息的权重值给定的比较矢量,以及计算比较矢量和参考矢量之间的相似性,以及其中信息处理设备进一步包括提供装置,如果通过相似性计算装置计算的相似性等于或高于阈值则该提供装置将新内容作为推荐内容提供给用户。
14.根据权利要求13所述的信息处理设备,其中在提供装置将推荐的内容提供给用户时,提供装置也提供基于参考矢量推荐的原因。
15.根据权利要求13所述的信息处理设备,其中相似性计算装置通过如下过程计算相似性在产生比较矢量之前,进一步获取包括与用户当前使用的内容关联的N条单个信息的信息组;将权重值分配给各个N条单个信息,以及产生其元素由分配给用户当前使用的内容的各个N条单个信息的权重值给定的特征矢量;计算在产生的特征矢量和由产生装置产生的一个或多个参考矢量之间的相似性;基于具有等于或高于阈值的相似性的参考矢量产生新的参考矢量;以及在产生了比较矢量之后,计算参考矢量和比较矢量之间的相似性。
16.根据权利要求13所述的信息处理设备,其中相似性计算装置通过如下过程计算相似性在产生比较矢量之前,进一步获取指示用户所在的当前上下文的一条或多条上下文信息;将权重值分配给各条的上下文信息;产生其对应于各条的上下文信息的元素由分配的权重值给定以及其它的元素由0给定的当前上下文特征矢量;计算当前上下文特征矢量和由产生装置产生的一个或多个参考矢量之间的相似性;基于具有等于或高于阈值的相似性的参考矢量产生新的参考矢量;以及在产生了比较矢量之后,计算参考矢量和比较矢量之间的相似性。
17.根据权利要求6所述的信息处理设备,其中矩阵产生装置通过如下过程产生第二矩阵将第一矩阵分解为具有N行和N列的第一分量矩阵、具有N行和M列的第二分量矩阵和具有M行和M列的第三分量矩阵的转置阵的乘积;从第一分量矩阵中产生具有N行和K列的第四分量矩阵,这里K是小于第一矩阵的等级的整数,从第二分量矩阵中产生具有K行和K列的第五分量矩阵,以及从第三分量矩阵中产生具有M行和K列的第六分量矩阵;以及产生通过第四分量矩阵、第五分量矩阵和第六分量矩阵的转置阵的乘积给定第二矩阵。
18.根据权利要求17所述的信息处理设备,其中相似性计算装置通过如下过程计算相似性获取包括与新内容关联的N条单个信息的信息组作为比较信息,将权重值分配给各个N条单个信息,产生其元素由分配给各个N条单个信息的权重值给定的比较特征矢量,通过将比较矢量和参考矢量从左边乘以第四分量矩阵的转置阵将比较矢量和参考矢量转换为其维数降低到K的矢量,以及计算维数减小到K的比较矢量和维数减小到K的参考矢量之间的相似性,以及其中信息处理设备进一步包括提供装置,如果通过相似性计算装置计算的相似性等于或高于阈值,则提供装置将新内容作为推荐的内容提供给用户。
19.根据权利要求18所述的信息处理设备,其中在提供装置将推荐的内容提供给用户时,提供装置也提供基于参考矢量推荐的原因。
20.根据权利要求18所述的信息处理设备,其中相似性计算装置通过如下过程计算相似性在产生比较矢量之前,进一步获取包括与用户当前使用的内容关联的N条单个信息的信息组,将权重值分配给各个N条单个信息,以及产生其元素由分配给用户当前使用的内容的各个N条单个信息的权重值给定的特征矢量;通过将特征矢量和一个或多个参考矢量从左边乘以第四分量矩阵的转置阵将所产生的特征矢量和一个或多个参考矢量转换为其维数降低到K的矢量;计算维数减小到K的特征矢量和维数减小到K的一个或多个参考矢量之间的相似性,以及基于具有等于或高于阈值的相似性的维数减小的参考矢量产生新的K-维参考矢量;在产生了比较矢量之后,通过将比较矢量从左边乘以第四分量矩阵的转置阵将比较矢量转换为其维数降低到K的矢量,以及计算新的K-维参考矢量和具有减小到K的维数的比较矢量之间的相似性。
21.根据权利要求18所述的信息处理设备,其中相似性计算装置通过如下过程计算相似性在产生比较矢量之前,进一步获取指示用户所在的当前上下文的一条或多条上下文信息,将权重值分配给各条的上下文信息,产生其对应于各条的上下文信息的元素由分配的权重值给定以及其它的元素由0给定的当前上下文特征矢量;通过将当前上下文特征矢量和一个或多个参考矢量从左边乘以第四分量矩阵的转置阵将当前上下文特征矢量和由产生装置产生的一个或多个参考矢量转换为其维数降低到K的矢量;计算维数减小到K的当前上下文特征矢量和维数减小到K的一个或多个参考矢量之间的相似性,以及基于具有等于或高于阈值的相似性的维数减小的参考矢量产生新的K-维参考矢量;在产生了比较矢量之后,通过将比较矢量从左边乘以第四分量矩阵的转置阵将比较矢量转换为其维数降低到K的矢量;以及计算新的K-维参考矢量和维数减小到K的比较矢量之间的相似性。
22.根据权利要求6所述的信息处理设备,其中在每次产生特征矢量时,矢量化装置将产生的特征矢量分类为指示用户的肯定喜好因素的肯定喜好特征矢量或者指示用户的否定喜好因素的否定喜好特征矢量。
23.根据权利要求22所述的信息处理设备,其中矩阵产生装置使用由矢量化装置产生的M个肯定喜好特征矢量产生第二矩阵。
24.根据权利要求23所述的信息处理设备,其中信息处理设备进一步包括通过使用矩阵产生装置产生的第二矩阵的列作为训练数据通过学习分类用于产生分类器的学习装置;和分类装置,用于通过如下过程进行分类获取包括与新内容关联的N条单个信息的信息组,将权重值分配给各个N条单个信息,产生其元素通过分配给新内容的各个N条单个信息的权重值给定的特征矢量,以及使用由学习装置产生的分类器对与新内容关联的特征矢量分类为肯定喜好特征矢量或否定喜好特征矢量。
25.根据权利要求24所述的信息处理设备,其中相似性计算装置运用通过分类装置分类为肯定喜好特征矢量的特征矢量作为比较矢量并计算比较矢量和参考矢量之间的相似性。
26.根据权利要求23所述的信息处理设备,其中信息处理设备进一步包括登记装置,该登记装置用于选择通过矩阵产生装置产生的第二矩阵的列的一个或多个特定的元素,并在用户的个人字典中登记识别每个所选择的元素的字作为用户感兴趣的字或用户不感兴趣的字。
27.根据权利要求23所述的信息处理设备,其中在通过矢量化装置产生M个否定喜好特征矢量时,矩阵产生装置进一步使用M个否定喜好特征矢量产生第二矩阵;该产生装置基于通过矩阵产生装置产生的M个肯定喜好特征矢量从通过矩阵产生装置产生的第二矩阵中产生第一参考矢量,以及进一步基于否定喜好特征矢量从通过矩阵产生装置产生的第二矩阵中产生第二参考矢量;以及该相似性计算装置计算比较矢量和第一参考矢量之间的第一相似性,也计算比较矢量和第二参考矢量之间的第二相似性。
28.根据权利要求27所述的信息处理设备,其中相似性计算装置获取包括与新内容关联的N条单个信息的信息组作为比较信息,将权重值分配给N条单个信息中的每个,产生其元素由分配给N条单个信息的权重值给定的比较矢量,以及计算第一相似性和第二相似性;和该信息处理设备进一步包括提供装置,该提供装置用于基于通过相似性计算装置计算的第一相似性和第二相似性确定新内容是否适合作为要推荐的内容,并且如果确定新内容是适合的则将新内容作为推荐的内容提供给用户。
29.根据权利要求28所述的信息处理设备,其中在提供装置将推荐的内容提供给用户时,提供装置也提供基于参考矢量推荐的原因。
30.根据权利要求28所述的信息处理设备,其中如果第一相似性等于或高于第一阈值并且第二相似性低于第二阈值,则提供装置确定新内容适合作为推荐的内容并将新内容作为推荐的内容提供给用户。
31.根据权利要求28所述的信息处理设备,其中如果第一相似性等于或高于第二相似性并且第二相似性低于阈值,则提供装置确定新内容适合作为推荐的内容并将新内容作为推荐的内容提供给用户。
32.一种信息处理方法,包括修改步骤,用于获取每个包括N条单个信息的M个信息组并至少部分地修改M个信息组中每个的N条单个信息,以便突出在N条单个信息中的相关性,这里N是等于或大于2的整数,M是等于或大于1的整数;产生步骤,用于从M个信息组中产生包括N条单个信息的参考信息组以在相似性的计算中用作参考,该M个信息组中每个包括在修改步骤中修改的N条单个信息,和相似性计算步骤,用于获取包括N个单个信息元素的新信息组作为比较信息组并计算比较信息组相对于在产生步骤中产生的参考信息组的相似性。
33.一种计算机执行的程序,包括修改步骤,用于获取每个包括N条单个信息的M个信息组并至少部分地修改M个信息组中每个的N条单个信息,以便突出在N条单个信息中的相关性,这里N是等于或大于2的整数,M是等于或大于1的整数;产生步骤,用于从M个信息组中产生包括N条单个信息的参考信息组以在相似性的计算中用作参考,该M个信息组中每个包括在修改步骤中修改的N条单个信息;和相似性计算步骤,用于获取包括N个单个信息元素的新信息组作为比较信息组并计算比较信息组相对于在产生步骤中产生的参考信息组的相似性。
34.一种信息处理设备,包括矢量化装置,用于在每次用户使用内容时,获取包括与该内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,并形成其元素通过分配给各个N条单个信息的权重值给定的矢量作为该内容的特征矢量;矩阵产生装置,用于在通过矢量化装置形成M个特征矢量时,形成具有N行和M列的第一矩阵以使它的元素由该M个特征矢量给定,对第一矩阵执行操作以便将第一矩阵转换为其N×M个元素至少被部分修改的第二矩阵以便突出在M个列中每个列的N行元素中的相关性;参考矢量产生装置,用于从通过矩阵产生装置形成的第二矩阵的M列中形成在相似性的计算中作为参考的包括N个元素的参考矢量;候选内容获取装置,用于在每次通过参考矢量产生装置形成参考矢量时,基于参考矢量获取要推荐给用户的内容的候选内容;相似性计算装置,用于获取包括与新内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,形成其元素通过由分配给N条单个信息的权重值给定的比较矢量,以及计算比较矢量和由参考矢量产生装置形成的一个或多个参考矢量之间的相似性;和提供装置,用于从通过候选内容获取装置获取的候选内容中选择对应于其通过相似性计算装置计算的相似性等于或高于阈值的参考矢量的候选内容并将所选择的候选内容作为推荐内容提供给用户。
35.一种信息处理方法,包括矢量化步骤,用于在每次用户使用内容时,获取包括与该内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,并形成其元素通过分配给各个N条单个信息的权重值给定的矢量作为该内容的特征矢量;矩阵产生步骤,当在矢量化步骤中形成M个特征矢量时,形成具有N行和M列的第一矩阵以使它的元素由该M个特征矢量给定,对第一矩阵执行操作以便将第一矩阵转换为其N×M个元素至少被部分修改的第二矩阵以便突出在M个列中每个列的N行元素中的相关性;参考矢量产生步骤,用于从在矩阵产生步骤中形成的第二矩阵的M列中形成在相似性的计算中作为参考的包括N个元素的参考矢量;候选内容获取步骤,用于每次在参考矢量产生步骤中形成参考矢量时,基于参考矢量获取要推荐给用户的内容的候选内容;相似性计算步骤,用于获取包括与新内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,形成其元素通过由分配给N条单个信息的权重值给定的比较矢量,以及计算比较矢量和在参考矢量产生步骤中形成的一个或多个参考矢量之间的相似性;和提供步骤,用于从在候选内容获取步骤中获取的候选内容中选择对应于其通过相似性计算装置计算的相似性等于或高于阈值的参考矢量的候选内容并将所选择的候选内容作为推荐内容提供给用户。
36.一种计算机执行的程序,包括矢量化步骤,用于在每次用户使用内容时,获取包括与该内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,并形成其元素通过分配给各个N条单个信息的权重值给定的矢量作为该内容的特征矢量;矩阵产生步骤,当在矢量化步骤中形成M个特征矢量时,形成具有N行和M列的第一矩阵以使它的元素由该M个特征矢量给定,对第一矩阵执行操作以便将第一矩阵转换为其N×M个元素至少被部分修改的第二矩阵以便突出在M个列中每个列的N行元素中的相关性;参考矢量产生步骤,用于从在矩阵产生步骤中形成的第二矩阵的M列中形成在相似性的计算中作为参考的包括N个元素的参考矢量;候选内容获取步骤,用于每次在参考矢量产生步骤中形成参考矢量时,基于参考矢量获取要推荐给用户的内容的候选内容;相似性计算步骤,用于获取包括与新内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,形成其元素通过由分配给N条单个信息的权重值给定的比较矢量,以及计算比较矢量和在参考矢量产生步骤中形成的一个或多个参考矢量之间的相似性;提供步骤,用于从在候选内容获取步骤中获取的候选内容中选择对应于其通过相似性计算步骤计算的相似性等于或高于阈值的参考矢量的候选内容并将所选择的候选内容作为推荐内容提供给用户。
37.一种信息处理设备,包括矢量化装置,用于在每次用户使用内容时,获取包括与该内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,并形成其元素通过分配给各个N条单个信息的权重值给定的矢量作为该内容的特征矢量;矩阵产生装置,用于在通过矢量化装置形成M个特征矢量时,形成具有N行和M列的第一矩阵以使它的元素由该M个特征矢量给定,对第一矩阵执行操作以便将第一矩阵转换为其N×M个元素至少被部分修改的第二矩阵以便突出在M个列中每个列的N行元素中的相关性;和类型设置装置,用于计算通过矩阵产生装置形成的第二矩阵的M列中的相似性,基于所计算的相似性对M个列中的每个进行分类,以及设置在分类中获得的每个类别作为类型。
38.根据权利要求37所述的信息处理设备,其中该类型设置装置通过使用属于该类型的列作为训练数据通过学习每种类型的类别形成分类器;和信息处理设备进一步包括分类装置,该分类装置用于通过如下方式进行分类获取包括与新内容关联的N条单个信息的信息组,将权重值分配给各个N条单个信息,形成其元素通过分配给新内容的各个N条单个信息的权重值给定的特征矢量,以及使用通过类型设置装置形成的分类器将与新内容关联的特征矢量分类作为由类型设置装置设定的类型中的一种类型。
39.根据权利要求37所述的信息处理设备,其中在每次类型设置装置设定一种类型时,类型设置装置从属于该类型的列中选择元素并基于所选择的元素将名字分配给该类型。
40.一种信息处理方法,包括矢量化步骤,用于在每次用户使用内容时,获取包括与该内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,并形成其元素通过分配给各个N条单个信息的权重值给定的矢量作为该内容的特征矢量;矩阵产生步骤,用于在矢量化步骤中形成M个特征矢量时,形成具有N行和M列的第一矩阵以使它的元素由该M个特征矢量给定,对第一矩阵执行操作以便将第一矩阵转换为其N×M个元素至少被部分修改的第二矩阵以便突出在M个列中每个列的N行元素中的相关性;类型设置步骤,用于计算在矩阵产生步骤中形成的第二矩阵的M列中的相似性,基于所计算的相似性对M个列中的每个进行分类,以及设置在分类中获得的每个类别作为类型。
41.一种通过计算机执行的程序,包括矢量化步骤,用于在每次用户使用内容时,获取包括与该内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,并形成其元素通过分配给各个N条单个信息的权重值给定的矢量作为该内容的特征矢量;矩阵产生步骤,用于在矢量化步骤中形成M个特征矢量时形成具有N行和M列的第一矩阵以使它的元素由该M个特征矢量给定,对第一矩阵执行操作以便将第一矩阵转换为其N×M个元素至少被部分修改的第二矩阵以便突出在M个列中每个列的N行元素中的相关性;和类型设置步骤,用于计算在矩阵产生步骤中形成的第二矩阵的M列中的相似性,基于所计算的相似性对M个列中的每个进行分类,以及设置在分类中获得的每个类别作为类型。
42.一种包括服务器和由用户使用的客户机的信息处理系统,包括矢量化装置,用于在每次用户使用内容时,获取包括与该内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,并形成其元素通过分配给各个N条单个信息的权重值给定的矢量作为该内容的特征矢量;矩阵产生装置,用于在通过矢量化装置形成M个特征矢量时,形成具有N行和M列的第一矩阵以使它的元素由该M个特征矢量给定,对第一矩阵执行操作以便将第一矩阵转换为其N×M个元素至少被部分修改的第二矩阵以便突出在M个列中每个列的N行元素中的相关性;参考矢量产生装置,用于从通过矩阵产生装置形成的第二矩阵的M列中形成在相似性的计算中作为参考的包括N个元素的参考矢量;和相似性计算装置,用于如下地计算相似性获取包括N条单个信息的新信息组,将权重值分配给各个N条单个信息,形成其元素通过由分配给各个N条单个信息的权重值给定的比较特征矢量,以及计算比较矢量和由参考矢量产生装置形成的参考矢量之间的相似性,其中在矢量化装置、矩阵产生装置、参考矢量产生装置和相似性计算装置中,至少矩阵产生装置包括在服务器中。
43.一种用于包括服务器和由用户使用的客户机的信息处理系统的信息处理方法,包括矢量化步骤,用于在每次用户使用内容时,获取包括与该内容关联的N条单个信息的信息组,将权重值分配给N条单个信息中的每个,并形成其元素通过分配给各个N条单个信息的权重值给定的矢量作为该内容的特征矢量;矩阵产生步骤,用于当在矢量化步骤中形成M个特征矢量时,形成具有N行和M列的第一矩阵以使它的元素由该M个特征矢量给定,对第一矩阵执行操作以便将第一矩阵转换为其N×M个元素至少被部分修改的第二矩阵以便突出在M个列中每个列的N行元素中的相关性;参考矢量产生步骤,用于从在矩阵产生步骤中形成的第二矩阵的M列中形成在相似性的计算中作为参考的包括N个元素的参考矢量;和相似性计算步骤,用于计算相似性,包括如下子步骤获取包括N条单个信息的新信息组,将权重值分配给各个N条单个信息,形成其元素通过由分配给各个N条单个信息的权重值给定的比较特征矢量,以及计算比较矢量和由参考矢量产生步骤形成的参考矢量之间的相似性,其中在矢量化步骤、矩阵产生步骤、参考矢量产生步骤和相似性计算步骤中,至少矩阵产生步骤由服务器执行。
全文摘要
本发明涉及信息处理设备及方法、实施信息处理方法的程序、信息处理系统及其方法,其中信息处理设备选择与用户的喜好很好地匹配的适当的内容并推荐它。矩阵计算器获取其元素由分配给总共N条(2或更大)内容元信息和上下文信息的权重值给定的M个(一个或多个)特征矢量CCV。矩阵计算器形成其列由通过M个特征矢量CCV给定的矩阵CCM并通过修改M个特征矢量CCV的各个元素的权重值将它转换为近似矩阵CCM
文档编号G06F17/30GK1624696SQ20041009796
公开日2005年6月8日 申请日期2004年12月2日 优先权日2003年12月2日
发明者山本则行 申请人:索尼株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1