业务内容产品关联分析方法及装置的制造方法_2

文档序号：9376527阅读：来源：国知局

5] 图3为本发明实施例提供的协同过滤算法示意图；
[0046] 图4为本发明实施例提供的一种业务内容产品关联分析装置的结构示意图。
【具体实施方式】
[0047] 为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0048] 图1为本发明实施例提供的一种业务内容产品关联分析方法的流程示意图，当用户通过手机、PC、平板电脑等终端设备访问互联网时，服务器作为该方法的执行主体，能够执行该方法下述各个步骤，获得不同用户的不同偏好信息，从而在用户再次访问互联网时，该服务器向用户推荐与该用户偏好类似的其他内容。下面参照图1，该方法包括如下步骤：
[0049] 步骤100、建立互联网内容知识库和增值产品内容库，其中，互联网内容知识库包含用户访问互联网行为数据，增值产品内容库包含运营商提供的增值产品内容。
[0050] 具体的，其中，对于每一个运营商对应生成一个增值产品内容库，每个增值产品内容库只包含对应的运营商推出的特定类别的增值产品内容，其中，增值产品内容可以为彩铃、视频、图书、应用等。利用网络爬虫，爬取多个第三方专业网站的内容分类体系和内容。经过内部去重和人工整理，形成互联网内容知识库。以互联音乐知识库为例，表1为互联音乐知识库示意表格，参照表1 :
[0051] 表 1
[0052]
[0053] 步骤101、将互联网内容知识库与增值产品内容库建立映射；
[0054] 具体的，增值产品内容库是已定义好的。增值产品内容库和互联网内容知识库建立映射关系。以首乐库为例，表2为互联网内容知识库与增值广品内容库映射关系TK意表格，参照表2,因为内容是固定的（例：歌曲名=江南Style)，映射关系是自动映射。若互联网内容和增值产品内容存在小部分不一致的情况，可以进行人工调整。
[0055] 表 2
[0056]
[0057] 步骤102、根据用户访问互联网行为数据获取用户对每个互联网内容的偏好信息。
[0058] 步骤103、计算用户对每个增值产品内容偏好信息。
[0059] 需要说明的是，步骤102与步骤103是并列的两个步骤，即在执行步骤101之后，可以同时进行步骤102与步骤103。
[0060] 步骤104、根据用户对每个互联网内容的偏好信息和用户对每个增值产品内容偏好信息确定增值产品内容库中用户未使用的增值产品内容的预测偏好值。
[0061] 步骤105、向用户使用的用户设备发送预测偏好值最高的前N个增值产品内容，N 为大于零的整数。
[0062] 本实施例提供的业务内容产品关联分析方法，通过建立互联网内容知识库和增值产品内容库，其中，所述互联网内容知识库包含用户访问互联网行为数据，增值产品内容库包含运营商提供的增值产品内容，将所述互联网内容知识库与所述增值产品内容库建立映射，再根据用户访问互联网行为数据获取所述用户对每个互联网内容的偏好信息，并且根据所述用户对应的所述增值产品行为数据计算所述用户对每个所述增值产品内容偏好信息，根据所述用户对每个互联网内容的偏好信息和所述用户对每个所述增值产品内容偏好信息确定所述增值产品内容库中所述用户未使用的增值产品内容的预测偏好值，最终向用户使用的用户设备发送预测偏好值最高的前N个增值产品内容，所述N为大于零的整数。从而实现根据用户访问互联网行为数据获得用户在网络中对没有订购的业务的喜好信息，再根据用户对运营商提供的增值产品行为数据，需要说明的是，此处增值产品行为数据可以为订购信息，也可以为用户浏览运营商门户网站时对于不同增值产品的浏览次数、是否关注等信息，从而准确地获取没有订阅增值产品的用户的喜好，从而向这类用户推送与其喜好相同或相近的增值产品，提高预测用户偏好的准确性。
[0063] 进一步的，对于图1步骤103, 一种可行的实现方式为：
[0064] 步骤103a、获取用户对每个所述增值产品的行为数据，根据每个所述增值产品的行为数据计算所述用户对每个所述增值产品内容偏好值；
[0065] 步骤103b、获取所述增值产品内容库中不同所述增值产品之间的内容相似度，根据不同所述增值产品之间的内容相似度获取所述用户的相似特征预测值。
[0066] 其中，用户的相似特征预测值针对是两两产品的相似度值。
[0067] 具体的，通过增值业务（VAS)系统获取用户（VAS系统用户）使用内容产品行为 (点击、购买、订购等）数据，计算用户对VAS内容产品偏好值（二）。采用协同过滤数据挖掘算法（Collaborative Filtering)、购物篮分析数据挖掘算法（Apriori)、相似特征数据挖掘算法（Similar Feature)相似特征这三种挖掘算法计算增值产品内容-内容产品之间的关联度、置信度、相似度。
[0068] 而现有技术中，根据用户偏好的内容产品，到内容产品库中匹配同类别的内容产品，推荐给用户。例：彩铃业务分类库
[0069]
[0070] 用户订购了彩铃"江南Style"，根据同类推荐，可以给用户推荐彩铃"Bigbang"。但是，根据产品分类匹配推荐同类产品，匹配规则单一。根据用户偏好内容产品，在产品库中匹配同类产品推荐给用户，匹配规则单一，不能获得用户真实使用行为的关联产品。（例如：经过分析70%喜欢凤凰传奇歌曲的用户，喜欢李佳璐的歌，这2两类歌曲并不属于同一类。这个产品关联性可能是阶段性的，一旦某个电视剧过气，产品关联性就会降低）。
[0071 ] 而本实施例中，对已订购内容产品用户，推荐更换为偏好度大的内容关联自有产品。
[0072] 进一步的，针对步骤103a，一种可行的实现方式为：
[0073] 根据所述每个所述增值产品的行为数据获取协同过滤相似度，根据所述协同过滤相似度计算系统过滤预测值；
[0074] 根据所述每个所述增值产品的行为数据获取关联规则置信度，根据所关联规则置信度计算关联规则预测值。
[0075] 可见本实施例中，产品直接关联不仅是同类产品关联，需要根据所有用户使用行为，计算出产品和产品之间的关联度。
[0076] 进一步的，针对图1中步骤102, 一种可行的实现方式为：
[0077] 根据每个互联网内容的访问次数和/或每个所述互联网内容的关键字搜索次数计算所述用户对每个所述互联网内容的偏好值。
[0078] 具体的，例如，表3为用户关注互联网音乐示意表格，根据该表格可知：可以分析用户通过互联网关注音乐的数据，计算得出用户对音乐的关注次数。
[0079]
[0080] 进一步的，通过归一化公式，计算用户对每个所述互联网内容的偏好值，具体的通过如下公式（1)获得该互联网内容的偏好值：
[0081]
[0082] 其中，V1, j为第i个用户对第j个互联网内容的偏好值Max_Threshold为物联网内容最大访问次数,Min_ThreshoId为互联网内容最小访问次数。需要说明的是，互联网内容最大访问次数和互联网内容最小访问次数针对的是用户访问的所有互联网内容的最大访问次数和最小访问次数。一般地，都是针对特定某类内容，统计出最大访问次数和最小访问次数，以音乐为例，针对音乐这一类型的互联网内容，统计出所有音乐中最高点击率和最低点击率。
[0083] 以上文表3的数据为例，若有五条记录，可得出Min_Threshold = 1，Max_ Threshold = 6。其中，用户"13945632178"对《江南style》的互联网内容的偏好值L j采用公式（1)为：4-1八6-1) = 0· 6。
[0084] 在上文表3的基础上，基于公式（1)的到如下输出结果：
[0085] 表 4
[0086]
[0087] 最后，通过如下公式（2)计算获得每个所述用户偏好预测偏好值：
[0088]
艽中，所述S为所述物联丨容的所述用户偏好预测偏好值，％为互联网内容的偏好值、增值产品内容偏好值、增值产品之间的协同过滤预测值、关联规则预测值或相似特征预测值，Wh为与Vh对应的权重值。即，S为各个互联网内容的偏好值与各自权重乘积之和，M为大于零的整数。进一步的，本实施例中包含五种偏好信息（互联网内容的偏好值、增值产品内容偏好值、增值产品之间的协同过滤预测值、关联规则预测和相似特征预测值）的获取方式，因此公式⑵中的M取5,若添加其他的方式，则N的取值根据偏好信息获取方式数量的多少相应调整，此处不予限定。
[0089] 图2为本发明实施例提供的另一种业务内容产品关联分析方法的流程示意图，下面参照图2,该方法包括如下步骤：
[0090] 步骤1、获取用户VAS内容行为数据。
[0091] 步骤2、为用户VAS内容行为数据配置行为权重。
[0092] 步骤3、获取VAS产品内容偏好信息。
[0093] 具体的，该步骤3可以进一步划分为：步骤3a、获取协同过滤相似度；步骤3b，获取关联规则置信度。
[0094] 步骤4、计算VAS产品内容偏好值。
[0095] 具体的，步骤4可以进一步划分为：步骤4a、获取过协同过滤预测值；步骤4b、获取关联规则预测值；步骤4c、获取相似特征预测值。其

完整全部详细技术资料下载

当前第2页1 2 3 4