媒体内容的分类方法和装置与流程

文档序号:12465563阅读:215来源:国知局
媒体内容的分类方法和装置与流程
本发明涉及互联网领域,具体而言,涉及一种媒体内容的分类方法和装置。
背景技术
:随着互联网的不断发展,网络上的信息越来越多,图像、视频、音频、文本等媒体内容源源不断的上传至网络,导致用户在网页而进行检索信息时,通常以单一维度的信息向用户进行推送,例如,用户检索“帕萨特”,则网络向用户推送的内容是文本内容中包含“帕萨特”的媒体内容,但这样的推送方式并不准确,也就是说,文字包括“帕萨特”的媒体内容并不一定能够满足用户的需求,如果用户还需要关于大众其他系列的车型的媒体内容,则需要重新键入关键词。针对现有技术中推送的媒体内容不准确的问题,目前尚未提出有效的解决方案。技术实现要素:本发明实施例提供了一种媒体内容的分类方法和装置,以至少解决现有技术中推送的媒体内容不准确的技术问题。根据本发明实施例的一个方面,提供了一种媒体内容的分类方法,包括:根据每个媒体内容的属性信息设置多个媒体内容之间的关联度;根据多个媒体内容之间的关联度对所述媒体内容进行分类。进一步地,所述媒体内容的属性信息包括如下任意一个或多个:媒体发布源、关键词、关键词的出现频率、网络浏览量和点击率。进一步地,获取所述多个媒体内容的属性信息;确定每个属性信息对应的关联系数,并根据所述多个媒体内容的属性信息和所述每个属性信息对应的关联系数设置所述多个媒体内容之间的关联度,其中,所述关联系数用于确定每个属性信息的权重。进一步地,将关联度超过预设值的媒体内容划分为同一类媒体内容。进一步地,当访问任意媒体内容时,根据访问的媒体内容与其他媒体内容之间的关联度获取其他媒体内容。向访问任意媒体内容的页面推送获取的其他媒体内容。进一步地,将进行分类后的媒体内容存储至数据库。根据本发明实施例的另一方面,还提供了一种媒体内容的分类装置,包括:设置模块,用于根据每个媒体内容的属性信息设置多个媒体内容之间的关联度;分类模块,用于根据所述多个媒体内容之间的关联度对所述媒体内容进行分类。进一步地,所述媒体内容的属性信息包括如下任意一个或多个:媒体发布源、关键词、关键词的出现频率、网络浏览量和点击率。进一步地,所述设置模块包括:获取子模块,用于获取所述多个媒体内容的属性信息;确定子模块,用于确定每个属性信息对应的关联系数,并根据所述多个媒体内容的属性信息和所述每个属性信息对应的关联系数设置所述多个媒体内容之间的关联度,其中,所述关联系数用于确定每个属性信息的权重。进一步地,所述分类模块包括:分类子模块,用于将关联度超过预设值的媒体内容划分为同一类媒体内容。进一步地,所述装置还包括:获取模块,用于当访问任意媒体内容时,根据访问的媒体内容与其他媒体内容之间的关联度获取其他媒体内容。进一步地,所述装置还包括:存储模块,用于将进行分类后的媒体内容存储至数据库。在本发明实施例中,根据每个媒体内容的属性信息设置多个媒体内容之间的关联度,根据多个媒体内容之间的关联度对媒体内容进行分类。上述方案通过根据媒体内容之间的关联度对媒体内容进行分类,从而将网络中数量众多的媒体内容划分为不同的类别,因此在用户搜索媒体内容时能够更有针对性的向用户推送,从而解决了现有技术中媒体内容较多导致用户查找不方便的技术问题。附图说明此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:图1是根据本发明实施例的媒体内容的分类方法的流程图;以及图2是根据本发明实施例的媒体内容的分类装置的示意图。具体实施方式为了使本
技术领域
的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。实施例1根据本发明实施例,提供了一种媒体内容的分类方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。图1是根据本发明实施例的媒体内容的分类方法的流程图,如图1所示,该方法包括如下步骤:步骤S102,根据每个媒体内容的属性信息设置多个媒体内容之间的关联度。具体的,上述媒体内容可以是网络中可以由用户搜索到的媒体内容,上述媒体内容的属性可以包括如下任意一个或多个:媒体发布源、关键词、关键词的出现频率、网络浏览量和点击率。多个媒体内容之间的关联度可以根据媒体内容的属性进行设置。可选的,媒体内容的相同属性信息越多,其关联度越高。步骤S104,根据多个媒体内容之间的关联度对媒体内容进行分类。在一种可选的实施例中,可以将关联度与预设的阈值进行比对,在关联度超过预设的阈值的情况下确定多个媒体内容为同一类媒体内容。在得到多个媒体内容的分类后,再向用户推送媒体内容时,无需再获取所有媒体内容,从所有媒体内容中检索向用户推送的内容,而可以获取一个类别,在一个类别中获取向用户推送的内容,由于媒体内容的分类是根据每个内容之间的关系度进行的,因此从一个类别的媒体内容中向用户推送媒体内容能够满足用户的需求,且推送的效率和准确度都更高。由上可知,本申请上述实施例根据每个媒体内容的属性信息设置多个媒体内容之间的关联度,根据多个媒体内容之间的关联度对媒体内容进行分类。上述方案通过根据媒体内容之间的关联度对媒体内容进行分类,从而将网络中数量众多的媒体内容划分为不同的类别,因此在用户搜索媒体内容时能够更有针对性的向用户推送,从而解决了现有技术中推送的媒体内容不准确的问题。可选的,根据本申请上述实施例,媒体内容的属性信息包括如下任意一个或多个:媒体发布源、关键词、关键词的出现频率、网络浏览量和点击率。可选的,根据本申请上述实施例,步骤S102,,根据每个媒体内容的属性信息设置多个媒体内容之间的关联度,包括:步骤S1021,获取多个媒体内容的属性信息。步骤S1023,确定每个属性信息对应的关联系数,并根据多个媒体内容的属性信息和每个属性信息对应的关联系数设置多个媒体内容之间的关联度,其中,关联系数用于确定每个属性信息的权重。在一种可选的实施例中,以多个媒体内容的属性信息包括:媒体发布源、关键词、关键词的出现频率、网络浏览量和点击率为例,设置媒体发布源的关联系数为0.4,关键词的关联系数为0.3,关键词的出现频率的关联系数为0.1,网络浏览量的关联系数为0.1,点击率的关联系数为0.1,其中,按照多个媒体内容的属性信息确定单独的属性信息对应的关联度后,与关联系数结合,得到多个媒体内容之间的关联度。由上可知,本申请上述方案将每个属性信息对应的权重与属性信息进行结合得到多个媒体内容之间的关联度。可选的,根据本申请上述实施例,步骤S104,根据多个媒体内容之间的关联度对媒体内容进行分类,包括:步骤S1041,将关联度超过预设值的媒体内容划分为同一类媒体内容。在一种可选的实施例中,以四个媒体内容A、B、C、D为例,表一为A、B、C、D四个媒体内容之间的关联度,在该示例中,确定预设值为0.7,结合表一所示,A与B之间的关系度为035、A与C之间的关系度为0.47,A与D之间的关系度为0.80,B与C之间的关系度为0.72,B与D之间的关系度为0.42,C与D之间的关系度为0.59,则超过预设值的关系度为A与D以及B与C,因此将A与D划分为一类媒体内容,将C与D划分为一类媒体内容。表一关联度ABCDA10.350.470.80B0.3510.720.42C0.470.7210.59D0.800.420.591在另一种可选的实施例中,还可以以每个属性信息为一个维度,确定不同维度上多个媒体内容之间的关联度。可选的,根据本申请上述实施例,在根据多个媒体内容的关联关系对媒体内容进行分类之后,方法还包括:步骤S106,当访问任意媒体内容时,根据访问的媒体内容与其他媒体内容之间的关联度获取其他媒体内容。步骤S108,向访问任意媒体内容的页面推送获取的其他媒体内容。在一种可选的实施例中,当访问某一媒体内容时,在访问的媒体内容所属的类别中查找与该访问内容关联度最高的一个或多个媒体内容,将获取的与该访问内容关联度最高的一个或多个媒体内容推送至访问该媒体内容的页面。可选的,根据本申请上述实施例,在根据多个媒体内容的关联关系对媒体内容进行分类之后,方法还包括:步骤S1010,将进行分类后的媒体内容存储至数据库。具体的,在上述步骤中,将分类后的媒体内容按照分类结果存储至数据库,当用户进行搜索时直接从数据库中获取媒体内容向用户推送。实施例2根据本发明实施例,提供了一种媒体内容的分类装置的实施例,图2是根据本发明实施例的媒体内容的分类装置的示意图,如图2所示,该装置包括:设置模块20,用于根据每个媒体内容的属性信息设置多个媒体内容之间的关联度。具体的,上述媒体内容可以是网络中可以由用户搜索到的媒体内容,上述媒体内容的属性可以包括如下任意一个或多个:媒体发布源、关键词、关键词的出现频率、网络浏览量和点击率。多个媒体内容之间的关联度可以根据媒体内容的属性进行设置。可选的,媒体内容的相同属性信息越多,其关联度越高。分类模块22,用于根据多个媒体内容之间的关联度对媒体内容进行分类。在一种可选的实施例中,可以将关联度与预设的阈值进行比对,在关联度超过预设的阈值的情况下确定多个媒体内容为同一类媒体内容。由上可知,本申请上述实施例根据每个媒体内容的属性信息设置多个媒体内容之间的关联度,根据多个媒体内容之间的关联度对媒体内容进行分类。上述方案通过根据媒体内容之间的关联度对媒体内容进行分类,从而将网络中数量众多的媒体内容划分为不同的类别,因此在用户搜索媒体内容时能够更有针对性的向用户推送,从而解决了现有技术中媒体内容较多导致用户查找不方便的技术问题。可选的,根据本申请上述实施例,媒体内容的属性信息包括如下任意一个或多个:媒体发布源、关键词、关键词的出现频率、网络浏览量和点击率。可选的,根据本申请上述实施例,上述设置模块包括:获取子模块,用于获取多个媒体内容的属性信息。确定子模块,用于确定每个属性信息对应的关联系数,并根据多个媒体内容的属性信息和每个属性信息对应的关联系数设置多个媒体内容之间的关联度,其中,关联系数用于确定每个属性信息的权重。可选的,根据本申请上述实施例,上述分类模块包括:分类子模块,用于将关联度超过预设值的媒体内容划分为同一类媒体内容。可选的,根据本申请上述实施例,上述装置还包括:获取模块,用于当访问任意媒体内容时,根据访问的媒体内容与其他媒体内容之间的关联度获取其他媒体内容。推送模块,用于向访问任意媒体内容的页面推送获取的其他媒体内容。可选的,根据本申请上述实施例,上述装置还包括:存储模块,用于将进行分类后的媒体内容存储至数据库。上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。以上所述仅是本发明的优选实施方式,应当指出,对于本
技术领域
的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1