一种视频终端用户的兴趣识别方法及装置的制造方法_4

文档序号：9220132阅读：来源：国知局

112] 其中，在一个实施例中，如图4所示，所述装置还包括：
[0113] 集合记录获取模块306,用于获取至少两个视频终端中的每个视频终端的预设时长内的用户行为记录，所述用户行为记录中包括：终端标识、播放过的各视频的视频标识；
[0114]全局特征向量构建模块307,用于根据用户行为记录中的终端标识以及视频标识，构造与所述视频终端集合对应的全局特征矩阵；其中，全局特征矩阵中各元素的取值为〇或1，元素取值为0时，表示该元素对应终端标识对应的视频终端未播放过该元素对应视频标识对应的视频；元素取值为1时，表示该元素对应终端标识对应的视频终端播放过该元素对应视频标识对应的视频；
[0115] 聚类模块308,用于对所述全局特征矩阵进行聚类，获得至少一个聚类结果；其中，每个聚类结果表示至少n个终端标识和至少m个视频标识的对应关系，该对应关系用于表示所述至少n个终端标识对应的视频终端均播放过所述至少m个视频标识对应的视频，其中，n、m均为大于0的整数。
[0116] 其中，在一个实施例中，所述聚类模块308,具体包括：
[0117] 优化单元309,用于当所述全局特征矩阵中每一个行号对应一个终端标识时，针对所述全局特征矩阵的每一个元素，由该元素的值、以及该元素所在的行号和列号，组成一个三元组；并，删除元素的值为0的三元组；
[0118] 配对单元310,用于对于剩余的每个三元组，将该三元组视为一个待配对单位，将该三元组的列号视为配对标识，将具有不同配对标识的待配对单位两两配为一对，生成以配对后的待配对标识为key、以行号为值的二元组；
[0119] 二元组集合形成单元311，用于取出所有key相同的二元组组成二元组集合；
[0120] 删除单元312,用于针对每个二元组集合，若该二元组集合中的二元组个数小于 n，则删除该二元组集合；
[0121] 处理单元313,用于对于剩余的每个二元组集合，将该二元组集合中的每个二元组进行倒置，得到以行号为key、以配对后的配对标识为值的倒置二元组；以及，当该二元组集合中包括至少m个列号时，将该二元组集合作为一个聚类结果；
[0122] 执行单元314,用于将每个倒置二元组视为一个待配对单位、并将每个倒置二元组的值视为配对标识，触发所述配对单元执行操作；并在循环执行指定的次数时结束操作。
[0123] 其中，在一个实施例中，如图4所示，所述装置还包括：
[0124] 优化聚类模块315,用于所述三维对应关系建立模块根据每个组合结果在每个设定时间区间的播放时长之和，构建用户兴趣随时间的变化模型之后，对所述至少一个视频终端的三维对应关系进行聚类，得到三维聚类结果；其中，每一个三维聚类结果，不同视频终端的同一组合结果的同一设定时间区间的播放时长之和的差值小于等于预设时长差值，且类成员数大于预设类成员数；
[0125] 聚类代表选择模块316,用于对于每一个三维聚类结果，取其聚类中心的三维对应关系作为该三维聚类结果所表示的一类视频终端的用户的视频兴趣模式。
[0126] 其中，在一个实施例中，如图4所示，所述三维对应关系建立模块305,具体包括：
[0127] 构建单元317,用于构建维数为p*q的全0兴趣-时间分布向量，其中，p为预设兴趣模型的个数，q为所述指定时间段包括设定时间区间的个数；且预设兴趣模型在兴趣-时间分布向量的排列顺序与在预设兴趣模型构成的兴趣列表中的排序相同；其中，组合结果按照设定顺序进行排序，预设时间区间按照时间先后进行排序；
[0128] 生成单元318,用于若视频终端的第j个组合结果对应的预设兴趣模型在兴趣列表中的排序为k，且第j个组合结果在第s个预设时间区间的播放时长之和为tjs，则将兴趣-时间分布向量的第P*(k_l)+s维的值更新为tjs;其中，p、q、j、k、s均为大于等于1的整数。
[0129] 关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。
[0130] 本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质（包括但不限于磁盘存储器、CD-ROM、光学存储器等）上实施的计算机程序产品的形式。
[0131] 本发明是参照根据本发明实施例的方法、设备（系统）、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0132] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0133] 这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0134] 尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
[0135] 显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。
【主权项】
1. 一种视频终端用户的兴趣识别方法，其特征在于，所述方法包括：针对至少一个视频终端中的每一个视频终端，获取该视频终端的指定时间段内的用户操作记录，所述用户操作记录中包括：播放过的各视频的视频标识、以及各视频的开始播放时间和结束播放时间；其中，所述指定时间段包括至少两个设定时间区间；根据预设兴趣模型包括的视频标识集合对操作记录中的视频标识进行组合，得到至少一个组合结果，使得每一个组合结果对应一个预设兴趣模型，且每个组合结果与对应的预设兴趣模型所包括的视频标识集合相同；其中，预设兴趣模型用于表示一类用户的兴趣点为该视频兴趣模型中的视频标识集合对应的视频；针对每个组合结果中的每个视频标识对应的视频，根据该视频的开始播放时间和结束播放时间，计算该视频在每个设定时间区间中的播放时长；并，计算每个组合结果中的所有视频标识对应的视频，在每个设定时间区间的播放时长之和；根据每个组合结果在每个设定时间区间的播放时长之和，构建用户兴趣随时间的变化模型，该用户兴趣随时间的变化模型中包括组合结果对应的预设兴趣模型、设定时间区间和播放时长之和之间的三维对应关系。2. 根据权利要求1所述的方法，其特征在于，根据以下方法建立预设兴趣模型：获取至少两个视频终端中的每个视频终端的预设时长内的用户行为记录，所述用户行为记录中包括：终端标识、播放过的各视频的视频标识；根据用户行为记录中的终端标识以及视频标识，构造与所述视频终端集合对应的全局特征矩阵；其中，全局特征矩阵中各元素的取值为O或1，元素取值为O时，表示该元素对应终端标识对应的视频终端未播放过该元素对应视频标识对应的视频；元素取值为1时，表示该元素对应终端标识对应的视频终端播放过该元素对应视频标识对应的视频；对所述全局特征矩阵进行聚类，获得至少一个聚类结果；其中，每个聚类结果表示至少n个终端标识和至少m个视频标识的对应关系，该对应关系用于表示所述至少n个终端标识对应的视频终端均播放过所述至少m个视频标识对应的视频，其中，n、m均为大于O的整数。3. 根据权利要求2所述的方法，其特征在于，当所

完整全部详细技术资料下载

当前第4页1 2 3 4 5