一种视频终端用户的兴趣识别方法及装置的制造方法_3

文档序号：9220132阅读：来源：国知局

其中，将二元组进行倒置例如是倒置前的二元组为〈〈jpj2>，，则倒置后的倒置二元组为<ii，〈j2>>，在该倒置二元组中，行号^为key，配对后的配对标识〈jj2>为值，用于执行后续的步骤B6。
[0076] 其中，步骤B4和步骤B5以key相同的二元组组成的二元组集合为单位进行操作，这两个步骤可以分布在不同的计算机上执行，从而实现并行操作，提高聚类的效率，以达到能够快速处理大量数据的目的。
[0077] 步骤B6 :将每个倒置二元组视为一个待配对单位、并将每个倒置二元组的值视为配对标识，返回步骤B2 ;并在循环执行指定的次数时结束操作。
[0078] 其中，返回步骤B2即循环执行步骤B2-步骤B5,循环的结束条件是：直至循环执行指定的次数时结束操作。
[0079] 4)、其中，在一个实施例中，执行步骤105 (即构建用户兴趣随时间变化模型）之后，所述方法还包括以下步骤：
[0080] 步骤C1 :对至少一个视频终端的三维对应关系进行聚类，得到三维聚类结果；其中，每一个三维聚类结果，不同视频终端的同一组合结果的同一设定时间区间的播放时长之和的差值小于等于预设时长差值，且类成员数大于预设类成员数。
[0081] 步骤C2 :对于每一个三维聚类结果，取其聚类中心的三维对应关系作为该三维聚类结果所表示的一类视频终端的用户的视频兴趣模式。
[0082] 由此，执行步骤C2之后，类似的家庭成员被进一步划分到一类，那么得到类似的家庭成员的兴趣。
[0083] 5)其中，在一个实施例中，步骤105,具体包括以下步骤：
[0084] 步骤D1 :构建维数为p*q的全0兴趣-时间分布向量，其中，p为预设兴趣模型的个数，q为所述指定时间段包括设定时间区间的个数；且预设兴趣模型在兴趣-时间分布向量的排列顺序与其在预设兴趣模型构成的兴趣列表中的排序相同；其中，组合结果按照设定顺序进行排序，预设时间区间按照时间先后进行排序。
[0085] 步骤D2 :若视频终端的第j个组合结果对应的预设兴趣模型在兴趣列表中的排序为k，且第j个组合结果在第s个预设时间区间的播放时长之和为tjs，则将兴趣-时间分布向量的第P*(k_l)+s维的值更新为tjs;其中，p、q、j、k、s均为大于等于1的整数。
[0086] 其中，例如，若有3个预设兴趣模型，分别为LpL2、和L3;组合结果有2个分别为 INPp1吧时，若其中INP#应的预设兴趣模型为L2;INP2对应的预设兴趣模型为Li，且兴趣列表中的排序为U、L2、L3;预设时间区间的个数为2时，则构建的兴趣-时间分布向量的维数为2*3 = 6维，构建的兴趣-时间分布向量可以为[1'11'21'31' 41'51'6]。则组合结果1即1 在第2个预设时间区间的值3*(2-1)+2 = 5即T5的值为INPi在第2个预设时间区间的播放时长之和。
[0087] 综上，本发明实施例中，通过构造三维对应关系（即获得用户的兴趣随时间分布的模型），实现从时间和兴趣两个维度上识别家庭成员内部的兴趣，相对于现有技术，无需特定的电视遥控器，故此，本发明的适用范围更广。
[0088] 实施例二
[0089] 如图2所示，以构建预设兴趣模型后识别视频终端用户的兴趣为例，对本发明提供的视频终端用户的兴趣识别方法进行详细说明，该方法包括以下步骤：
[0090] 步骤201 :获取至少两个视频终端中的每个视频终端的预设时长内的用户行为记录，所述用户行为记录中包括：终端标识、播放过的各视频的视频标识。
[0091] 步骤202 :根据用户行为记录中的终端标识以及视频标识，构造与所述视频终端集合对应的全局特征矩阵；其中，全局特征矩阵中各元素的取值为0或1，元素取值为0时，表示该元素对应终端标识对应的视频终端未播放过该元素对应视频标识对应的视频；元素取值为1时，表示该元素对应终端标识对应的视频终端播放过该元素对应视频标识对应的视频。
[0092] 步骤203 :针对所述全局特征矩阵的每一个元素，由该元素的值、以及该元素所在的行号和列号，组成一个三元组；并，删除元素的值为〇的三元组。
[0093] 步骤204 :对于剩余的每个三元组，将该三元组视为一个待配对单位，将该三元组的列号视为配对标识，将具有不同配对标识的待配对单位两两配为一对，生成以配对后的待配对标识为key、以行号为值的二元组。
[0094] 步骤205 :取出所有key相同的二元组组成二元组集合。
[0095] 步骤206 :针对每个二元组集合，若该二元组集合中的二元组个数小于n，则删除该二元组集合。
[0096] 步骤207 :对于执行步骤206后剩余的每个二元组集合，将该二元组集合中的每个二元组进行倒置，得到以行号为key、以配对后的配对标识为值的倒置二元组；以及，当该二元组集合中包括至少m个列号时，将该二元组集合作为一个聚类结果。
[0097] 步骤208 :将每个倒置二元组视为一个待配对单位、并将每个倒置二元组的值视为配对标识，返回步骤204 ;并在循环执行指定的次数时结束操作。
[0098] 步骤209 :针对至少一个视频终端中的每一个视频终端，获取该视频终端的指定时间段内的用户操作记录，所述用户操作记录中包括：播放过的各视频的视频标识、以及各视频的开始播放时间和结束播放时间；其中，所述指定时间段包括至少两个设定时间区间。
[0099] 其中，步骤209中的待识别视频终端可以为任意能够提供指定时间段内的用户操作记录的视频终端。
[0100] 步骤210 :根据预设兴趣模型包括的视频标识集合对操作记录中的视频标识进行组合，得到至少一个组合结果，使得每一个组合结果对应一个预设兴趣模型，且每个组合结果与对应的预设兴趣模型所包括的视频标识集合相同；其中，预设兴趣模型用于表示一类用户的兴趣点为该视频兴趣模型中的视频标识集合对应的视频。
[0101] 步骤211 :针对每个组合结果中的每个视频标识对应的视频，根据该视频的开始播放时间和结束播放时间，计算该视频在每个设定时间区间中的播放时长。
[0102] 步骤212 :计算每个组合结果中的所有视频标识对应的视频，在每个设定时间区间的播放时长之和。
[0103] 步骤213 :根据每个组合结果在每个设定时间区间的播放时长之和，构建用户兴趣随时间的变化模型，该用户兴趣随时间的变化模型中包括组合结果对应的预设兴趣模型、设定时间区间和播放时长之和之间的三维对应关系。
[0104]本发明实施例中，通过构造三维对应关系（即获得用户的兴趣随时间分布的模型），实现从时间和兴趣两个维度上识别家庭成员内部的兴趣，相对于现有技术，无需特定的电视遥控器，故此，本发明的适用范围更广。
[0105] 实施例三
[0106]基于相同的发明构思，本发明还提供一种视频终端用户的兴趣识别装置，如图3所示，所述装置包括：
[0107] 获取模块301，用于针对至少一个视频终端中的每一个视频终端，获取该视频终端的指定时间段内的用户操作记录，所述用户操作记录中包括：播放过的各视频的视频标识、以及各视频的开始播放时间和结束播放时间；其中，所述指定时间段包括至少两个设定时间区间；
[0108] 组合模块302,用于根据预设兴趣模型包括的视频标识集合对操作记录中的视频标识进行组合，得到至少一个组合结果，使得每一个组合结果对应一个预设兴趣模型，且每个组合结果与对应的预设兴趣模型所包括的视频标识集合相同；其中，预设兴趣模型用于表示一类用户的兴趣点为该视频兴趣模型中的视频标识集合对应的视频；
[0109] 时长统计模块303,用于针对每个组合结果中的每个视频标识对应的视频，根据该视频的开始播放时间和结束播放时间，计算该视频在每个设定时间区间中的播放时长；
[0110] 时长和计算模块304,用于计算每个组合结果中的所有视频标识对应的视频，在每个设定时间区间的播放时长之和；
[0111] 三维对应关系建立模块305,用于根据每个组合结果在每个设定时间区间的播放时长之和，构建用户兴趣随时间的变化模型，该用户兴趣随时间的变化模型中包括组合结果对应的预设兴趣模型、设定时间区间和播放时长之和之间的三维对应关系。
[0

完整全部详细技术资料下载

当前第3页1 2 3 4 5