社区服务器系统和用于社区服务器系统的活动记录方法

文档序号:6468132阅读:191来源:国知局
专利名称:社区服务器系统和用于社区服务器系统的活动记录方法
技术领域
本发明涉及允许多个用户通过诸如社会联网服务(SNS )的网络, 利用他们自己的客户计算机登录服务器系统,以便在系统上相互通信 的联才几社区系统。
背景技术
随着Web2.0技术进入市场,许多因特网用户已经参加了诸如在 CGM (顾客生成媒体)或社会联网服务(SNS)中发表博客(联机日 记)、读新闻文章和搜索新产品信息的各种活动。
因此,已经进行了从这样的活动日志中提取每个用户的兴趣点和 关注点以便将它们用于营销和其它商业活动的几种尝试。
例如,已
公开日本专利申请第2007-241753号公开了一种系统, 服务器保存本体模式作为个人本体的模式,其中,概念性地分层个人 兴趣信息,个人本体提取设备提取本体模式的根类的直系类或实例作 为个人本体,意外信息提取设备提取包括在个人本体中但不包括在相 似度等于或大于预定值的其它个人本体中的类或实例作为意外信息, 以及意外信息展示设备向不具有提取的意外信息的用户提供由意外信 息提取设备提取的意外信息。
转让给本申请人的日本专利申请第2007-110559号的说明书公开 了一种技术,用于系统地将兴趣标记"犯罪者"、"受害者"和"受益者" 的任何一个赋予相应的公司、个人、产品和在文章中提到的其它实体, 以便抑制随着文章出现使文章的读者感到不愉快的广告。然后,控制 广告选择机构,以避免与被赋予兴趣标记的实体相关联的广告。用于 这个目的的广告选择机构可以计算文章与广告之间的亲密度或相关度作为数值。因此,可以通过减小亲密度的数值来抑制广告。最好随时 间逐渐减小抑制度。可以认为,这种公开技术是试图建立访问网页的 用户的心理状况的系统模型的例子之一 。
尤其,已
公开日本专利申请第2007-241753号的技术从用户写的 文本中提取用户的兴趣,以及描述在日本专利申请第2007-110559号 的说明书中的技术从用户读的文本中提取用户的兴趣。由于联机社区 中的用户参加各种类型的行动和活动,所以需要能够处理多种类型的 联才几活动的统一纟支术。

公开日本专利申请第2005-327105号涉及一种用于找出适当社 区的联机社区分析装置。这个联机社区分析装置具有用于从预定邮件 服务器获取包括用于至少标识出局邮件的发件人的发件人标识符和用 于标识出局邮件的收件人的收件人标识符的信息的获取部分、用于根 据获取部分所获取的信息来计算代表发件人和收件人共同的兴趣度的 兴趣度共同性的共同度分析部分、以及根据兴趣共同度分析部分所确 定的兴趣共同度来分析电子邮件用户所形成的社区的分析部分。分析 部分利用兴趣度矩阵来计算社区之间的相关度,以便分析电子邮件用 户所形成的社区。

公开日本专利申请第2005-327105号指出了一种利用矩阵来计 算社区之间的相关度的有用技术。但是,这种技术只用于分析出局邮 件,而不是以综合方式来处理多种活动的技术。
两个活动矩阵Ak和A,的相减可以通过如下所示的方程定义。这 里,矩阵的绝对值像上述那样定义。在计算如下方程之前,进行对准关键字标记的处理。换句话说,进行将集合Ak和A,的总和取作关键 字标记的算术运算。然后,在根据关键字标记结果来扩充行Ak和Ap 即,在以前未出现的关键字的行中都输入零之后,计算如下方程 [方程3]
AkeAi =
A
k
Ak| +
|Ak| + |AjAl
ii —— hi ' i乂m
这些活动矩阵的相减可被用于确定用户之间、用户与社区之间、 或社区之间的相减。应该注意到,右侧的最外面绝对值意味着矩阵的 元素被简单地转变成正值,它不同于像上述那样定义的矩阵的绝对值。


图12示出了两个活动矩阵A和B相减的例子。从这个例子可明 显看出,活动矩阵A、 B的相减是作为适当归一化值获得的。 [两个活动矩阵的相乘
这里,作为活动矩阵的相乘,考虑三种类型,即,活动关键字相 关性、活动相关性、和关键字相关性。在所有这些计算中,都在计算 之前进行排列关键字标记的处理。换句话说,进行将集合Ak和A,的 总和取作关键字标记的算术运算。然后,在根据关键字标记结果来扩 充行Ak和A,,即,在以前未出现的关键字的行中都输入零之后,计 算如下方程。
关键字相关性通过如下方程定义
广=AA ^八kwordact八l
它的特定计算如下 [方程5
0
c.. u丄l
1J
(4 4i =
0)
2 min(《ajj)
l
( 否则 )这种计算输出显示在两个活动矩阵中的兴趣和活动的重叠。这使 得提取在兴趣和活动两方面都相互关联的项。
这里,aku和a、分别是矩阵Ak、 A,的ij分量。 图13示出了计算两个活动矩阵A、 B之间的活动关键字相关性 的例子。
活动相关性定义在如下所示的方程中。这里,AT是转置矩阵。 这里,算术运算是正规矩阵的相乘。如果活动矩阵是mxn矩阵,则结 果是nxn矩阵。
A act B 二 ATB
这种计算输出显示在两个活动矩阵中的活动的重叠。这可以让人 知道什么类型的活动使用了公共关键字。
图14示出了计算两个活动矩阵A、 B的关键字相关性的例子。 关键字相关性通过如下所示的方程定义。BT是转置矩阵。这里,
算术运算是正规矩阵的相乘。如果活动矩阵是mxn矩阵,则结果是
mxm矩阵。 [方程7]
这种计算输出显示在两个活动矩阵中的关键字的重叠。这可以让 人知道什么类型的关键字参与了公共活动。
图15示出了计算两个活动矩阵A、 B之间的活动相关性的例子。 [活动矩阵的退化
活动矩阵的退化包括行方向上的退化和列方向上的退化。行方向 上的退化可被称为感兴趣关键字列表并通过如下方程给出 Vword—AWact o
其中,A是活动矩阵,Wact是活动加权向量,以及WaJ是其转 置向量。Waet的维数等于活动的种数,以及它的分量原则上取0到1 之间的值。这些值是这样决定的,将较大的值(权重)给予重要的活动。例如,将比读博客大的权重给予发表博客。因此,可以获得与个 人或社区相关的加权关键字列。
图16示出了活动矩阵A在行方向上退化的例子,即,确定感兴 趣关键字列表的例子。
列方向上的退化可被称为活动模式列表并通过如下方程给出
Vac「Wword A。
其中,A是活动矩阵,Ww。rd是关键字加权向量,以及W,/是 它的转置向量。Ww。rd的维数等于提取的关键字的数量,以及它的分 量原则上取0到l之间的值。这些值是这样决定的,将较大的值(权 重)给予特别引人注目的关键字。
图17示出了活动矩阵A在列方向上退化的例子,即,确定活动
模式列表的例子。
下面描述一些典型应用以帮助人们理解本发明。 [应用1
假设用户想在社区系统中查找与他或她的兴趣接近的社区。为了 达到这样的目的,社区系统进行算术运算,以确定用户的活动矩阵与
存储在硬盘驱动器310中的现有社区系统的活动矩阵之间的关键字相 关性。在获得的关键字相关性矩阵当中,社区系统通过适当GUI (图 形用户界面),只向相关用户呈现具有等于或大于预定值的分量的关 键字。其结果是,用户可以查找到特征在于用户过去不感兴趣但将来 想参与的关键字的社区。应用2
假设社区系统因遭到垃圾邮件攻击而受损。但是,显而易见的方 式使得难以识别谁是整个系统中的垃圾邮件发送者。因此,系统管理 者利用本发明的功能为每个用户获取活动矩阵在列方向上的退化,以 创建活动模式列表。从而,可以假定具有在博客上只出现非所需数量 评论的活动模式列表的用户为潜在垃圾邮件发送者。
[应用3
社区系统中的主要收入来源之一是广告收入。但是,传统方式使
20得难以确定在社区中哪种广告是有效的。但是,按照本实施例,生成 个人活动矩阵,并且据此可以进一步生成社区活动矩阵。然后,可以 生成社区在行方向上的退化,即,感兴趣关键字列表,以便获得加权 关键字列表。因此,可以使用现有关键字相关广告方案将有效广告显 示在社区的屏幕上。
应该注意到,像如本实施例所示的矩阵相加、相减、和相乘那样 的算术运算仅仅是实现本发明的例示性例子,本发明不局限于这些特 定方程。例如,如果相加和相减运算包括实际矩阵的相加和相减以及 在适当范围内归一化作为运算结果生成的值的运算,则可以选择任何 算法。
权利要求
1. 一种社区服务器系统,多个用户通过他们自己的客户计算机与所述社区服务器系统连接以读取或写文档等以便能够通信,该系统包含能够从系统中读取数据或将数据写入系统中的存储设备;与每个用户ID和活动内容一起将每次个体用户活动及其活动相关文档存储在存储设备中作为日志的装置;以及根据日志来分析在个体用户的每次活动中读取或写入的文档,以便为每次个体用户活动确定来自文档的关键字和它们的出现频率,以便将它们写入存储设备中的装置。
2. 按照权利要求1所述的系统,其中,以在第一方向上标记关键字以及在与第一方向垂直的第二方向上标记活动的方式,将在每次数据,并且将每个关键字的出现频率存储在这些标记所指示的交点上。
3. 按照权利要求1所述的系统,其中,所述活动包括在社区服务器内发表博客、读博客、写消息、以及读消息。
4. 按照权利要求1所述的系统,进一步包含用于将关键字的出现频率除以与活动相关联的文档的数量的装置。
5. 按照权利要求2所述的系统,进一步包含用于计算社区中的用户的矩阵数据之和,以便获取与社区中的用户相关联的矩阵数据的装置。
6. 按照权利要求5所述的系统,进一步包含用于计算社区的矩阵数据与特定用户的矩阵数据之间的差值的装置。
7. 按照权利要求2所述的系统,进一步包含用于将矩阵数据乘以退化参数的装置、和用于将新计算的矩阵数据与乘以退化参数的矩阵数据相加的装置。
8. —种用于社区服务器系统的活动记录方法,多个用户通过他们自己的客户计算机与社区服务器系统连接,以读或写文档以便能够通信,该方法包含与用户ID和活动内容一起将每次个体用户活动和与活动相关联 的文档存储在社区服务器系统的存储设备中作为日志的步骤;和:字和它的出现频率以便将它们写入存储设备中的步骤。
9.按照权利要求8所述的方法,其中,以在第一方向上标记关 :字以及在与第一方向垂直的第二方向上标记活动的方式,将在每次数据,并且将每个关键字的出现频率存储在所述标记指示的交点上。
10. 按照权利要求8所述的方法,其中,所述活动包括在社区服 务器内发表博客、读博客、写消息、和读消息。
11. 按照权利要求8所述的方法,进一步包含通过将关键字的出现频率除以活动相关文档的数量来进行归一化的步骤。
12. 按照权利要求9所述的方法,进一步包含计算社区中的用户的矩阵数据之和以便获取与社区中的用户相关联的矩阵数据的步骤。
13. 按照权利要求12所述的方法,进一步包含计算社区的矩阵 数据与特定用户的矩阵数据之间的差值的步骤。
14. 按照权利要求9所述的方法,进一步包含将矩阵数据乘以退 化参数的步骤、以及将新计算的矩阵数据与乘以退化参数的矩阵数据 相加的步骤。
全文摘要
本发明提供了一种社区服务器系统和用于社区服务器系统的活动记录方法。与用在活动中的文本信息一起存储单个用户或多个联机用户的活动,以创建用于喜好提取和匹配的数据。可以从活动和喜好的两种观点或从它们的集成观点,进行过去通过将用户信息投影成一维信息所进行的活动/喜好分析,从而能够通过更多信息量进行活动/喜好分析。为了与文本信息一起存储用户活动,将保存的数据格式称为活动矩阵。活动矩阵的数据保存在社区服务器中的硬盘驱动器中。活动矩阵是由用户活动和从与活动一起使用的文本中提取的关键字构成的矩阵,每个元素根据从与活动一起使用的文本中提取并在某个时段内存储的关键字的出现频率取值。
文档编号G06Q50/00GK101470754SQ200810178618
公开日2009年7月1日 申请日期2008年11月21日 优先权日2007年12月27日
发明者R·H·鲁迪, 安藤史郎, 村上明子, 水田秀行, 西山莉纱 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1