内容分析系统、内容分析设备、内容分析方法以及内容分析程序的制作方法

文档序号:6361944阅读:184来源:国知局
专利名称:内容分析系统、内容分析设备、内容分析方法以及内容分析程序的制作方法
技术领域
本发明涉及内容分析技术,更具体地,涉及发现任意内容和其他内容之间的在对用户的传播模式方面的相关性的内容分析系统、内容分析设备、内容分析方法以及内容分析程序。
背景技术
相关性分析是以数值来描述两个变量之间的关系的分析方法,且用于信息推荐或市场销售。
例如,在信息推荐中,被称为协作过滤的算法是众所周知的推荐相似性或关联性高的内容的推荐方法,该推荐方法通过根据用户对内容的使用或评级的历史来获得内容或用户之间的相关性。
近年来,日益重要的是从大量内容(电子书、新闻、运动图像、音乐等等)中自动掌握使用户感兴趣的内容的推荐系统,并向用户呈现它们,该系统通过类似于在大型购物中心等等中“购买了该产品的人还购买了这种产品”之类的广告短语,来提供对高度关联的内容进行推荐的服务。
在例如非专利文献1、专利文献I和专利文献2中记载了用于信息推荐的、与利用相关性的协作过滤相关的现有技术。
非专利文献I是描述最早的基础基本协作过滤的算法的论文。
专利文献I涉及具有减少管理位置信息的工作的效果的推荐技术,包括:通过使用每个用户单独注册的位置信息(如,书签),基于每个分类推荐来自关联性高的分类的位置信息,以添加URL。
专利文献2涉及具有以下效果的协作过滤:通过基于访问历史将用户分为多个组,将用户指派到多个组中,并通过使用时间序列访问历史来提取频率高的迁移,以建立推荐规则,从而避免向初学者推荐有经验的人的物品。
这些技术的目标是:获得内容之间、用户之间、以及分类之间的相关性,以恰当地推荐相似性和关联性在相关性方面都高的内容。
然而,这些技术仅获得在内容使用的频率或评级之间的相关性。
尽管专利文献2使用了时间序列迁移的频率模式的频率,其仅使用在从内容I至内容2的迁移之前和之后的迁移模式的频率,且未能考虑与内容如何传播至用户相关的用户传播的相似性。因此不可能在对于用户恰当的传播时机推荐内容。
专利文献1:专利号4118580
专利文献2:日本专利公开N0.2008-176398
专利文献3:日本专利公开N0.2004-3662208
专利文献4:日本专利公开N0.2010-140162
非专利文献1:P.Resnick, N.1acovou, Μ.Suchak, P.Bergstrom, and J.Riedl,“GroupLens:Open Architecture for Collaborative Filtering of Netnews,,,Conference on Computer Supported Cooperative Work, p.175—186,1994。
上述现有技术的问题是无法发现特征(S卩,内容传播至用户的传播模式之间的相关性),以最佳地将其用于如信息推荐或市场销售分析之类的应用领域。
例如,在信息推荐中,由于平等地处理传播模式不同的内容,不可能在对于用户恰当的传播时机来推荐内容。
其原因在于:当获得作为内容之间的特征的相关性时,仅通过使用用户对内容的使用频率(评级)来获得相关性,而未考虑在指示内容如何传播至用户的传播模式之间的相关性。
(本发明的目的)
本发明的目的是提供解决上述问题并使得内容传播至用户的传播模式之间的相关性成为可能的内容分析系统、内容分析设备、内容分析方法和内容分析程序,可以利用作为要发现的特征的相关性进行信息推荐或市场销售分析,且在例如信息推荐中,使得能够在恰当的传播时机推荐内容。发明内容
根据本发明的示例方面,一种内容分析系统包括:
用户终端,以及
内容分析设备,从所述用户终端接收预定请求并返回结果,
其中,所述内容分析设备包括:
传播模式提取单元,提取传播模式,所述传播模式针对由多个内容的使用历史形成的历史数据中包括的每个内容,指示如何所述内容如何传播至用户,以及
相关性计算单元,获得所述内容的所述传播模式之间的相关性。
根据本发明的示例方面,从用户终端接收预定请求并返回结果的一种内容分析设备包括:
传播模式提取单元,提取传播模式,所述传播模式针对由多个内容的使用历史形成的历史数据中包括的每个内容,指示所述内容如何传播至用户,以及
相关性计算单元,获得所述内容的传播模式之间的相关性。
根据本发明的示例方面,一种从用户终端接收预定请求并返回结果的内容分析设备的内容分析方法包括:
传播模式提取步骤,提取传播模式,所述传播模式针对由多个内容的使用历史形成的历史数据中包括的每个内容,指示所述内容如何传播至用户,以及
相关性计算步骤,获得所述内容的所述传播模式之间的相关性。
根据本发明的示例方面,一种能够在充当内容分析设备的计算机上可操作的内容分析程序,所述内容分析设备从用户终端接收预定请求并返回结果,所述内容分析程序使所述计算机执行:
传播模式提取处理,提取传播模式,所述传播模式针对由多个内容的使用历史形成的历史数据中包括的每个内容,指示所述内容如何传播至用户,以及
相关性计算处理,获得所述内容的所述传播模式之间的相关性。
本发明使得能够发现作为特征的向用户传播内容的传播模式之间的相关性,能够利用所述特征来进行信息推荐或市场销售分析,并且本发明使得能够在例如信息推荐中在恰当的传播时机推荐内容。根据下文给出的具体描述,本发明的其他目的、特征和优点将变得清楚。


在附图中:图1是示出了本发明的第一示例实施例的结构的框图;图2是示出了根据第一示例实施例的历史数据的说明性示例的图;图3是示出了根据第一示例实施例的内容分析系统的操作的流程图;图4是示出了本发明的示例I的操作的流程图;图5是示出了在示例I中提取的传播模式(传播顺序)的说明性示例I的图;图6是示出了在说明性示例I中在计算示例I的传播模式之间的相关性时使用的中间数据的图;图7是示出了在示例I中提取的传播模式(传播阶段)的说明性示例2的图;图8是示出了在说明性示例2中在计算示例I的传播模式之间的相关性时使用的中间数据的图;图9是示出了在示例I中提取的传播模式(传播的网络结构)的说明性示例3的图;图10是示出了在说明性示例3中在计算示例I的传播模式之间的相关性时使用的中间数据的图;图11是示出了本发明的第二示例实施例的结构的框图;图12是示出了第二示例实施例的操作的流程图;图13是示出了本发明的示例2的操作的流程图;图14是示出了在示例2中提取的传播模式的说明性示例的图;图15是示出了本发明的第三示例实施例的结构的框图;图16是示出了第三示例实施例的操作的流程图;图17是示出了本发明的示例3的操作的流程图;图18是示出了在示例3中提取的传播模式的说明性示例的图;以及图19是示出了本发明的内容分析设备的硬件配置的示例的框图。
具体实施例方式下文中将参照附图来详细讨论本发明的优选实施例。在以下描述中,阐述了大量的特定细节,以提供对本发明的完全理解。然而对于本领域技术人员将显而易见的是:可以在没有这些特定细节的情况下实现本发明。在其它实例中,未详细示出众所周知的结构,以避免使本发明不突出。将参照附图对本发明的示例实施例进行详细描述。在所有附图中,由相同的附图标记来标识相似的组件,以恰当地省略对其的描述。(第一示例实施例)
将参照附图来详细描述本发明的第一示例实施例。在以下附图中,将恰当地省略对与本发明的主旨不相关的部分的结构的描述,且将相应地不对其进行说明。图1是示出了根据本发明的第一示例实施例的内容分析系统1000的结构的框图。参照图1,根据本示例实施例的内容分析系统1000由用户终端200和内容分析设备100形成。用户终端200是让用户使用内容等等的终端。用户终端200通过使用未示出的输入/输出单元201向内容分析设备100发送要检验其传播模式的内容的标识符。终端200还从内容分析设备100接收检验结果。内容分析设备100包括向用户终端200发送数据/从用户终端200接收数据的输入/输出单元101、基于每个内容来提取对用户的传播模式的传播模式提取单元102、以及获得预定内容传播至用户的模式之间的相关性的相关性计算单元103。简而言之,这些单元分别以下述方式工作。输入/输出单元101从用户终端200接收预定请求,并向用户终端返回与该请求相对应的输出。更具体地,当从用户接受内容的标识符时,该单元返回在所考察的内容和至少一个其他内容之间的相关性以及该其他内容的标识符,作为输出。在本示例实施例中,当接受作为输入的内容标识符时,输入/输出单元101向用户返回在内容的传播模式之间的相关性以及这些内容中的每一个。此时,可以将这些内容中的每一个的标识符一起返回。传播模式提取单元102针对历史数据中包括的每一个内容,提取对用户的传播模式。历史数据表示指示以下内容的数据:每一个预定内容的使用的状态的历史。此处,历史数据的示例在图2中示出。尽管假设历史数据记录在单独提供的预定数据库、内容信息管理服务器等中,内容分析设备100可以具有不限于这种假设的存储单元。由于历史数据存储方法本身不直接涉及本发明,因此将不对其进行详细说明。对用户的传播模式表示指示如何向用户传播内容的模式,该模式示出了传播顺序、网络结构、时间间隔以及速度。已被传播代表在用户和内容之间存在某种关联等,例如用户的使用或评级。相关性计算单元103通过使用对用户的传播模式来计算内容传播之间的相关性。仅可以获得在作为输入接受的内容和其他内容之间的对用户的传播模式的相关性。(第一示例实施例的操作的描述)接下来,将参照附图来详细描述根据本示例实施例的内容分析系统1000的操作。图3是示出了根据第一示例实施例的内容分析系统1000的操作的流程图。参照图3,输入/输出单元101首先接受作为来自用户终端200的输入的内容标识符(步骤Al)。接下来,传播模式提取单元102获得历史数据,以针对在历史数据中包括的每个内容来提取对用户的传播模式(步骤A2)。接下来,相关性计算单元103获得向用户传播作为输入接受的内容和那些其他内容中的每一个的模式之间的相关性(步骤A3)。
接下来,输入/输出单元101将相关性计算单元103获得的相关性与内容标识符一起返回(步骤A4)。此时,可以按与输入内容的相关性程度下降的顺序排序并返回内容标识符。使用向用户传播每个内容的模式和在计算单元中提前计算和记录的相应内容之间的每个相关性,当从输入/输出单元101接受请求时,可以使用内容标识符来查阅并返回在单元中记录的相关性。这消除了在接受请求之后对步骤A2和A3的处理。(第一示例)接下来,将通过特定示例来描述本示例实施例的操作。图4是示出了本发明的示例I的操作的流程图。参照图4,输入/输出单元101首先接受作为来自用户终端200的输入的项目A(指示项目A的内容标识符)(步骤Al’)。接下来,传播模式提取单元102获得历史数据,以针对历史数据中包括的每个内容来提取对用户的传播模式(步骤A2’)。历史数据至少包括使用时间和日期、用户以及使用的内容的标识符。接下来,相关性计算单元103获得向用户传播项目A和那些其他内容中的每一个内容的模式之间的相关性(步骤A3’)。对用户的传播模式表示:指示内容如何传播至用户的模式,并包括各种示例。在本示例中,将描述由传播模式提取单元102执行的对I)传播顺序、2)传播阶段、以及3)用于传播的网络结构的提取。除了如上所述的这些模式之外,考虑了用户间传播的时间间隔或速度的方法也是可能的。I)传播顺序将描述以下情况,其中,作为对向用户传播内容的模式的提取,提取向用户传播内容的顺序,以基于传播顺序来计算对用户的传播模式之间的相关性。首先,针对历史数据中包括的每个内容,传播模式提取单元102提取向每个用户传播的顺序作为传播模式。在图5的PlOO中示出了提取的传播模式的示例。参照图5的P100,在本示例中提取了项目A和项目B的传播模式。传播模式PlOl是项目A的传播模式,其中看到以用户01、用户02、用户05和用户04的顺序向用户传播项目A。传播模式P102是项目B的传播模式,其中看到以用户01、用户02和用户04的顺序向用户传播项目B。通过向PlOO添加预定改变来获得P100’,用于计算稍后将描述的Spearman的顺位相关性系数。在传播模式提取单元102提取传播模式之后,相关性计算单元103通过使用传播模式来获得向用户传播内容的模式之间的相关性。如上所述的这种计算向用户传播内容的顺序之间的相关性可以通过使用SpearmaruKendall等的相关性系数来执行。在本示例中,由于接受项目A作为输入,通过使用以项目A为中心的、向用户传播项目A和那些其他内容中的每一个(在本示例中是项目B)的传播顺序,来计算Spearman的顺位相关性系数。
使用以D表示的两个变量的顺位之间的差以及以N表示的情况数目,通过以下数值表达式I来给出Spearman的顺位相关性系数,以从I至_1之间取值。(数值表达式I)
权利要求
1.一种内容分析系统,包括: 用户终端;以及 内容分析设备,从所述用户终端接收预定请求并返回结果, 其中,所述内容分析设备包括: 传播模式提取单元,提取传播模式,所述传播模式针对由多个内容的使用历史形成的历史数据中包括的每个内容,指示所述内容如何传播至用户,以及相关性计算单元,获得所述内容的所述传播模式之间的相关性。
2.根据权利要求1所述的内容分析系统,其中,所述历史数据至少包括:使用的时间和日期、用户以及使用的内容的标识符。
3.根据权利要求1或2所述的内容分析系统,其中,所述传播模式提取单元按时间序列提取每个内容传播至用户的顺序,作为所述传播模式。
4.根据权利要求1或2所述的内容分析系统,其中,针对每个内容,所述传播模式提取单元提取所述内容传播至的用户组,作为所述传播模式,所述组基于传播顺序分为多个阶段。
5.根据权利要求1或2所述的内容分析系统,其中,针对每个内容,所述传播模式提取单元提取所述内容传播至的用户的网络结构,作为所述传播模式。
6.根据权利要求1至5中任一项所述的内容分析系统,还包括:用户分数计算单元,针对作为输入从所述用户终端接受的输入内容,通过使用所述每个内容的所述传播模式和所述内容的所述传播模式之间的相关性,来针对所述输入内容还要传播至的用户计算用户分数,所述用户分数指示所述输入内容的传播的可能性。
7.根据权利要求1至5中任一项所述的内容分析系统,还包括:内容分数计算单元,针对还要传播至输入用户的每个内容,通过使用所述每个内容的所述传播模式和所述内容的所述传播模式之间的相关性,来计算指示向所述输入用户的推荐度的内容分数,所述输入用户是作为来自所述用户终端的输入而接受的。
8.一种从用户终端接收预定请求并返回结果的内容分析设备,包括: 传播模式提取单元,提取传播模式,所述传播模式针对由多个内容的使用历史形成的历史数据中包括的每个内容,指示所述内容如何传播至用户,以及相关性计算单元,获得所述内容的所述传播模式之间的相关性。
9.一种从用户终端接收预定请求并返回结果的内容分析设备的内容分析方法,包括: 传播模式提取步骤,提取传播模式,所述传播模式针对由多个内容的使用历史形成的历史数据中包括的每个内容,指示所述内容如何传播至用户,以及相关性计算步骤,获得所述内容的所述传播模式之间的相关性。
10.一种能够在充当内容分析设备的计算机上操作的内容分析程序,所述内容分析设备从用户终端接收预定请求并返回结果,所述内容分析程序使所述计算机执行: 传播模式提取处理,提取传播模式,所述传播模式针对由多个内容的使用历史形成的历史数据中包括的每个内容,指示所述内容如何传播至用户,以及相关性计算处理,获得所述内容的所述传播模式之间的相关性。
全文摘要
本发明发现了内容之间的对用户的传播模式的特征相关性,所述相关性能够用于信息推荐或市场销售分析。例如,在信息推荐中,在恰当的传播时机推荐内容。该内容分析系统包括用户终端(200);以及从所述用户终端(200)接收预定请求并返回其结果的内容分析设备(100)。所述内容分析设备(100)包括传播模式提取装置(102)以及相关性计算装置(103)。传播模式提取装置(102)针对包括多个内容的使用历史在内的历史数据中包括的每个内容,提取传播模式,所述传播模式指示所述内容已如何被传播至用户。所述相关性计算装置(103)获得所述内容之间的所述传播模式的相关性。
文档编号G06Q30/06GK103154945SQ20118004796
公开日2013年6月12日 申请日期2011年11月17日 优先权日2010年11月29日
发明者伊藤千央, 白木孝 申请人:日本电气株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1