直播间类型识别方法、装置及数据处理设备与流程

文档序号:19183821发布日期:2019-11-20 01:17阅读:418来源:国知局
直播间类型识别方法、装置及数据处理设备与流程

本发明涉及直播技术领域,具体而言,涉及一种直播间类型识别方法、装置及数据处理设备。



背景技术:

直播服务提供商通常需要对不同直播内容在直播领域的受欢迎程度进行统计分析,并根据分析结果来改善其提供的直播服务。在统计分析过程中,需要从各类直播产品获取各个直播类型的直播间的热度数据,但目前具有直播功能的产品层出不穷,并非所有直播产品都为直播间进行了类型划分,对于没有给直播间进行类型划分的直播产品,无法利用其热度数据来分析不同直播类型的直播内容的受欢迎程度。



技术实现要素:

有鉴于此,本发明实施例的目的之一在于提供一种直播间类型识别方法、装置及数据处理设备。

为了实现上述目的,本发明实施例采用的技术方案如下:

第一方面,本发明实施例提供一种直播间类型识别方法,应用于数据处理设备,所述方法包括:

从目标直播平台获取目标直播间的直播间信息,并根据所述直播间信息识别所述目标直播间所属的直播类型;

建立所述目标直播间和所述直播类型的标签的对应关系,用于将统计的所述目标直播间的直播热度数据标识为所述指定直播品类的所述目标子类别的热度数据。

第二方面,本发明实施例提供一种直播间类型识别装置,应用于数据处理设备,所述装置包括:

识别模块,用于从目标直播平台获取目标直播间的直播间信息,并根据所述直播间信息识别所述目标直播间所属的直播类型;

标识模块,用于建立所述目标直播间和所述直播类型的标签的对应关系,用于将统计的所述目标直播间的直播热度数据标识为所述直播类型的热度数据。

第三方面,本发明实施例提供一种数据处理设备,包括处理器及机器可读存储介质,所述机器可读存储介质存储有机器可执行指令,所述机器可执行指令被执行时促使所述处理器实现前述实施方式中任意一项所述的方法。

第四方面,本发明实施例提供一种机器可读存储介质,其上存储有机器可执行指令,所述机器可执行指令被执行时实现前述实施方式中任意一项所述的方法。

本发明实施例提供的直播间类型识别方法、装置及数据处理设备,数据处理设备从目标直播平台获取目标直播间的直播间信息,根据直播间信息识别目标直播间所属的直播类型,并建立目标直播间和其所属直播类型的对应关系,用以将统计的目标直播间的直播热度数据标识为目标直播间所属直播类型的热度数据。如此,可以利用目标直播间的热度数据来分析目标直播间所属直播类型的直播内容的受欢迎程度。

为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1示出了本发明第一实施例提供的一种直播间类型识别方法的流程示意图;

图2示出了图1所示的步骤s101的一种子步骤示意图;

图3示出了图1所示的步骤s101的另一种子步骤示意图;

图4示出了图1所示的步骤s101的又一种子步骤示意图;

图5示出了本发明第二实施例提供的一种直播间类型识别方法的流程示意图;

图6示出了本发明第三实施例提供的一种直播间类型识别装置的功能模块框图;

图7示出了本发明第四实施例提供的一种数据处理设备的方框示意图。

图标:100-数据处理设备;110-处理器;120-机器可读存储介质;130-通信单元;600-直播间类型识别装置;610-识别模块;620-标识模块。

具体实施方式

下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

第一实施例

请参照图1,图1是本发明第一实施例提供的一种直播间类型识别方法的流程示意图,该方法可以应用于数据处理设备。下面对该方法包括的各个步骤进行描述。

步骤s101,从目标直播平台获取目标直播间的直播间信息,并根据所述直播间信息识别所述目标直播间所属的直播类型。

步骤s102,建立所述目标直播间和所述直播类型的标签的对应关系,用于将统计的所述目标直播间的热度数据标识为所述直播类型的热度数据。

在步骤s101中,目标直播平台可以是任意具有直播功能且没有为直播间设置类别标签的互联网产品的直播服务器,所述互联网产品例如可以是,应用程序(application,app)、网页应用等。

目标直播间可以根据实际需求确定。例如,目标直播平台上的所有直播间均可以是目标直播间;又如,可以由用户(如,相应的分析人员)指定目标直播平台上的部分直播间作为目标直播间,本实施例对此没有限制。目标直播间的直播间信息可以是任意能够用于表征目标直播间的直播类型的信息。

数据处理设备中可以存储有不同直播类型的标签,在利用直播间信息识别出目标直播间所属的直播类型之后,可以查找该直播类型的标签,并将查找到的标签和目标直播间的标识信息(如,id)建立对应关系。如,建立一条数据记录,该数据记录包括目标直播间所属直播类型的标签及目标直播间的id。

如此,当后续统计到目标直播间的直播热度数据(如,关注人数、直播观看量、点击量等)时,可以确定所统计的直播热度数据表征的是所述直播类型的直播热度。

在本实施例中,目标直播间的直播间信息可以包括目标直播间的房间名称和主播名称中的至少一个。在此情况下,步骤s101中获取目标直播间的直播间信息的方式有多种。

在一个示例中,可以利用数据获取组件从目标直播平台获取目标直播间的直播页面,从该直播页面上获取目标直播间的房间名称和/或主播名称作为所述直播间信息。其中,目标直播间的直播页面是指目标直播间的直播界面所在页面,该直播页面上通常包含目标直播间的房间名称、主播名称、直播画面及弹幕信息等,其中,弹幕信息显示于直播画面上。

考虑到各个直播平台通常都具有自己的直播列表,直播列表中包含该直播平台的各个直播间的相关信息,比如房间名称、主播名称、直播间关注人数等。基于此,在另一个示例中,步骤s101可以通过图2所示的流程实现。

步骤s201,从所述目标直播平台获取直播列表,所述直播列表包括所述目标直播平台的各直播间的房间名称和主播名称。

步骤s202,从所述直播列表中获取所述目标直播间的房间名称和/或主播名称作为所述直播间信息。

由于直播列表包含了目标直播平台的所有直播间的房间名称和主播名称,可以通过一次获取操作获取到各个目标直播间的直播间信息,减少了获取各个目标直播间的直播间信息所需的爬取操作的次数。

在实施时,数据处理设备可以调用相应的数据获取组件来获取目标直播平台的直播列表。由于直播列表通常包括多个页面,因此可以在所述数据获取组件中设置用于模拟翻页操作的指令集(又称,方法或函数),通过调用该指令集可以实现对直播列表的翻页操作,以获取每个页面上的各个直播间的房间名称和/或主播名称。

在步骤s101中,根据直播间信息识别目标直播间所属的直播类型的方式有多种。例如,可以采用经过训练的分类模型对直播间信息进行处理,以确定目标直播间所属的直播类型。其中,分类模型是采用携带有直播类型标签的多个直播间的直播间信息训练得到的。

又如,可以建立不同直播间信息和直播类型的对应关系并存储,然后再依据该对应关系,将与目标直播间的直播间信息对应的直播类型确定为目标直播间所属的直播类型。

为了提高识别速度,数据处理设备可以仅存储需要进行热度分析的直播类型和直播间信息的对应关系。

在实际应用中,直播产品虽然可以进行多种多样的直播,但通常会以指定直播品类的直播内容为主。在此情况下,直播产品的服务提供商会对该指定直播品类的直播内容所包含的各种子类别的直播内容进行热度分析,以便根据热度分析的结果对直播内容进行调整,例如增加热度较高的直播内容的比例。

示例性地,所述需要进行热度分析的直播类型可以是所述指定直播品类包含的各个子类别。在此情况下,步骤s101中根据所述直播间信息识别所述目标直播间所属的直播类型的步骤可以包括如图3所示的流程。

步骤s301,根据所述直播间信息识别所述目标直播间是否属于指定直播品类中的任一子类别。若是,则执行步骤s202;若否,则执行步骤s203。

步骤s302,将所述指定直播品类的标签以及所述目标直播间所属的目标子类别的标签确定为所述目标直播间所属的直播类型的标签。

步骤s303,将预设信息确定为所述目标直播间所属的直播类型的标签。

在本实施例中,当确定目标直播间属于指定直播品类下的任意一个子类别(后称“目标子类别”)时,数据处理设备将指定直播品类的标签及目标子类别的标签确定为目标直播间所属的直播类型的标签。在此情况下,通过步骤s102建立的对应关系实际是目标直播间与指定直播品类的标签和目标子类别的标签的对应关系。

如此,当后续获取到目标直播间的直播热度数据时,可以依据目标直播间对应的标签,确定该直播热度数据是指定直播品类中的目标子类别的热度数据。换言之,可以将采集到的热度数据归属到正确的直播类型下,从而可以对各个直播类型的直播内容在直播领域的受欢迎程度进行统计分析,以对直播服务进行改善。

可选地,本实施例中,所述直播热度数据可以包括目标直播间的关注人数、播放量、弹幕信息数量等信息。在实际应用中,还可以分别统计指定直播品类中不同子类别的目标直播间的数量,即,每个子类别的直播内容的开播数量。所述开播数量也可以用于表征相应子类别的直播内容的受欢迎程度。

在步骤s303中,预设信息可以为任意标识符,只要能够与上述指定直播品类及目标子类别各自的标签区分开即可。

在实施过程中,如果确定目标直播间不属于指定直播品类,则可以将预设信息确定为目标直播间所属的直播类型的标签。在此情况下,通过步骤s102建立的对应关系实际是目标直播间与表征“不属于指定直播品类”的标签的对应关系。

如此,在后续统计直播热度数据时,可以检测到目标直播间与预设信息对应,从而确定其直播内容不属于指定直播品类,从而不必统计目标直播间的直播热度数据,减少无效的数据统计操作。

如上描述的,在本实施例中,指定直播品类通常是需要对直播内容受欢迎程度进行统计分析的服务提供商的直播产品主要涉及的品类。例如,主要进行游戏直播的直播产品,其服务提供商可以以游戏类别为指定直播品类,利用本实施例提供的直播间类型识别方法来确定各种目标直播平台的目标直播间的直播类型。在此示例中,游戏类别的子类别为具体的游戏,每个子类别可以采用具体游戏名称来标识。

又例如,主要进行声乐直播的直播产品,其服务提供商可以以声乐类别为指定直播品类,利用本实施例提供的直播间类型识别方法来确定各种直播平台的目标直播间的直播类型。在此示例中,音乐类别的子类别可以为具体的音乐类型,也可以采用具体的歌手名字来标识一个子类别。

本实施例中,数据处理设备依据直播间信息识别目标直播间所属直播类型的方式有多种。例如,数据处理设备可以存储有与需要进行分析的直播类型对应的关键词,例如与所述指定直播品类中的各个子类别对应的关键词。请参照如下所示的表1,其中示出了作为指定直播品类的游戏直播类型所包括的各个子类别与关键词的对应关系,其中,游戏直播类型包括的每个子类别为一个具体的游戏,每个具体的游戏可以通过其游戏名称进行标识。

表1

详细地,以直播间信息包括目标直播间的房间名称和/或主播名称为例,数据处理设备可以存储有与需要进行热度分析的直播类型对应的关键词,在此情况下,步骤s101中根据所述直播间信息识别所述目标直播间所属的直播类型的步骤,可以通过图4所示的流程实现。

步骤s401,对所述直播间信息进行分词,得到包括至少一个分词结果的分词列表。

步骤s402,从存储的关键词中查找是否存在与所述分词列表中的任意一个分词结果相同的关键词。若是,则执行步骤s403;若否,则执行步骤s404。

步骤s403,将所述相同的关键词对应的直播类型确定为所述目标直播间所属的直播类型。

步骤s404,确定所述目标直播间不属于需要进行分析的直播类型。

在步骤s401中,当所述直播间信息仅包括房间名称时,仅对所述房间名称进行分词,可以得到至少一个分词结果,该至少一个分词结果组成所述分词列表。当所述直播间信息仅包括主播名称时,仅对所述主播名称进行分词,可以得到至少一个分词结果,该至少一个分词结果组成所述分词列表。当所述直播间信息同时包括房间名称和主播名称时,可以分别对房间名称和主播名称进行分词,从而可以得到至少两个分词结果,该至少两个分词结果组成所述分词列表。

值得说明的是,上述的每个分词结果可以是一个字、一个词或一个短语,本实施例对此没有限制。

例如,目标直播间a的房间名称“双狙带粉吃鸡”,通过分词处理可以被划分为“双/狙/带粉/吃鸡”,从而得到“双”、“狙”、“带粉”、“吃鸡”四个分词结果。则在步骤s302中,可以从存储的关键词中查找到相同的关键词“吃鸡”,并确定“吃鸡”对应的子类别“王者荣耀”为目标直播间a所属的目标子类别。换言之,目标直播间a属于游戏类别中的王者荣耀类别。

可选地,本实施例可以通过预设分词组件来对直播间信息进行分词。预设分词组件通常是基于其默认的词典来识别待分词信息并进行分词处理,如果待分词信息中存在默认的词典未包含的词语,可能出现分词结果不准确的问题。

为了改善上述问题,本实施例将上述的指定直播品类的关键词设置到所述预设分词组件的自定义词典中,然后再利用预设分词组件来对直播间信息进行分词。如此,预设分词组件在对直播间信息进行分词时,将能够从直播间信息中识别出自定义词典中存在的词,从而提高分词结果的准确度。

本实施例提供的直播间类型识别方法,通过从目标直播平台获取的目标直播间的直播间信息来识别目标直播间所属的直播类型,并建立目标直播间和其所属的直播类型的标签的对应关系,从而将后续统计的目标直播间的热度数据归属到正确的直播类型下,为服务提供商对各种直播类型的直播内容在直播领域的受欢迎程度的统计提供了依据。

第二实施例

请参照图5,图5是本发明第二实施例提供的一种直播间类型识别方法的流程示意图,该方法可以应用于数据处理设备。本实施例提供的直播间类型识别方法的具体流程与前述第一实施例类似,区别在于,本实施例中目标直播间的直播间信息包括目标直播间的直播画面和/或弹幕信息。

下面对本实施例提供的直播间类型识别方法的流程进行阐述。

步骤s501,从目标直播平台爬取目标直播间的直播页面,并从直播页面中获取直播画面和/或弹幕信息作为目标直播间的直播间信息。

其中,所述弹幕信息也可以通过模拟登录目标直播平台的弹幕服务器来获取。

步骤s502,根据所述直播间信息识别所述目标直播间所属的直播类型。

步骤s503,建立所述目标直播间和所述直播类型的标签的对应关系,用于将统计的所述目标直播间的直播热度数据标识为所述直播类型的热度数据。

其中,如果直播间信息包括直播画面,则可以通过图像分类模型来对获取的直播画面进行识别,以判断该目标直播间所属的直播类型,例如,根据直播画面判断目标直播间是否属于指定直播品类的某一子类别。

如果直播间信息包括弹幕信息,则可以识别获取的每个弹幕信息所属的直播类型,并统计识别出的每个直播类型的弹幕信息的数量。然后,判断识别出的直播类型中是否存在弹幕信息数量达到预设阈值的直播类型,如果存在,则将弹幕信息数量最大的直播类型确定为目标直播间所属的直播类型。如果不存在弹幕信息数量达到预设阈值的直播类型,则可以确定目标直播间不属于需要进行热度分析的直播类型。

如果直播间信息包括直播画面和弹幕信息,可以在基于直播画面和弹幕信息得到的结果均为目标直播间不属于需要进行热度分析的直播类型(例如,指定直播品类的任一子类别)时,确定目标直播间不属于需要热度分析的直播类型。

此外,图像分类模型的输出结果包括输入的直播画面所属的具体类别及属于该具体类别的概率,其中,直播画面所属的具体类别可以指示提供该直播画面的目标直播间所属的直播类型。因而,当图像分类模型基于直播画面判断出目标直播间属于各个直播类型的概率均比较低(如,低于50%)时,可以基于直播间信息中的弹幕信息来确定目标直播间所属的直播类型。

示例性地,当图像分类模型基于直播画面判断目标直播间不属于所述指定直播品类,或者属于所述指定直播品类中某个子类别的概率低于预设概率时,数据处理设备可以基于直播间信息中的弹幕信息来确定目标直播间在指定直播品类中所属的子类别。当图像分类模型基于直播画面判断目标直播间属于所述指定直播品类中某个子类别(如,子类别x)的概率达到所述预设概率时,数据处理设备可以直接确定目标直播间属于所述指定直播品类中的所述子类别x。

其中,所述预设概率可以是大于50%的任意值,例如可以是70%,本实施例对此没有限制。

本实施例提供的直播间类型识别方法,可以利用目标直播间的直播画面或弹幕信息来识别其是否属于指定直播品类中的任一子类别,从而根据识别结果将后续采集的目标直播间的直播热度数据归属到正确的直播类型中,以便为直播服务提供商分析指定直播品类中各个子类别的直播内容在直播领域的受欢迎程度提供依据。

第三实施例

请参照图6,图6是本发明第三实施例提供的一种直播间类型识别装置600的功能模块框图。直播间类型识别装置600可以应用于数据处理设备。

直播间类型识别装置600包括识别模块610以及标识模块620。

识别模块610用于从目标直播平台获取目标直播间的直播间信息,并根据所述直播间信息识别所述目标直播间所属的直播类型。

标识模块620用于建立所述目标直播间和所述直播类型的标签的对应关系,用于将统计的所述目标直播间的直播热度数据标识为所述直播类型的热度数据。

关于上述功能模块的描述具体可以参照前述第一实施例和第二实施例中对相关步骤的详细描述。

值得说明的是,所述直播间类型识别装置600可执行本发明第一实施例及第二实施例所提供的直播间类型识别方法,具备执行直播间类型识别方法对应的有益效果。

第四实施例

请参照图7,图7是本发明第四实施例提供的一种数据处理设备100的方框示意图。数据处理设备100可以是任意具有数据处理功能的电子设备,例如可以是个人计算机、服务器等。

所述数据处理设备100包括处理器110及机器可读存储介质120,所述处理器110及所述机器可读存储介质120通过系统总线通信连接,以实现数据交互。所述机器可读存储介质120存储有机器可执行指令,所述机器可执行指令被执行时促使所述处理器实现本发明第一实施例或第二实施例提供的直播间类型识别方法。

应当理解的是,图7所示的结构仅为数据处理设备100的结构示意图,所述数据处理设备100还可包括比图7中所示更多或者更少的组件,或者具有与图7所示不同的配置。例如,数据处理设备100还可以包括通信单元130,通信单元130用于建立数据处理设备100与外部设备(如,目标直播平台)的通信连接。图7中所示的各组件可以采用硬件、软件或其组合实现。

值得说明的是,机器可读存储介质120中的机器可执行指令从功能上可以划分为图6所示的各个功能模块。

综上所述,本发明实施例提供的直播间类型识别方法、装置及数据处理设备,数据处理设备从目标直播平台获取目标直播间的直播间信息,根据直播间信息识别目标直播间所属的直播类型,并建立目标直播间与其所属的直播类型的标签的对应关系,用于将统计的目标直播间的直播热度数据标识为目标直播间所属的直播类型的热度数据。如此,可以利用目标直播间的热度数据来分析目标子类别的直播内容的受欢迎程度。

在本发明所提供的几个实施例中,应该理解到,所揭露的装置、方法和设备,也可以通过其它的方式实现。以上所描述的实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

以上所述仅为本发明的选定实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1