信息处理方法、装置、终端设备及存储介质与流程

文档序号:13476649阅读:132来源:国知局
信息处理方法、装置、终端设备及存储介质与流程
本申请实施例涉及计算机技术,尤其涉及一种信息处理方法、装置、终端设备及存储介质。
背景技术
:随着终端设备普及程度的提高,越来越多的用户使用终端设备执行各种各样的功能以满足自身需求,如使用终端设备阅读文字、观看视频、听音乐、玩游戏等。当用户在使用终端设备看视频(如电影、电视剧)、直播内容或听音乐时,为了增加用户的参与度以及提升用户的使用体验,会在终端设备屏幕上同步显示弹幕信息,该弹幕信息为观看该视频、直播内容或听同一音乐时用户输入的个性化内容。现有技术中,对弹幕等用户输入的个性化内容的处理存在缺陷,需要改进。技术实现要素:本发明提供了一种信息处理方法、装置、终端设备及存储介质,使得终端设备显示信息的效率提高,显示信息的内容针对性更强,减少了无用信息对用户的干扰。第一方面,本申请实施例提供了一种信息处理方法,包括:获取用户输入的弹幕内容,依据所述弹幕内容确定当前直播内容对应的筛选数据集;获取当前准备显示的弹幕数据,依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息;将所述弹幕信息显示在终端设备当前的直播内容中。第二方面,本申请实施例还提供了一种信息处理装置,包括:获取模块,用于获取用户输入的弹幕内容;数据集确定模块,依据所述弹幕内容确定当前直播内容对应的筛选数据集;筛选模块,获取当前准备显示的弹幕数据,依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息;显示模块,将所述弹幕信息显示在终端设备当前的直播内容中。第三方面,本申请实施例还提供了一种终端设备,包括:处理器、存储器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如本申请实施例所述的信息处理方法。第四方面,本申请实施例还提供了一种包含终端设备可执行指令的存储介质,所述终端设备可执行指令在由终端设备处理器执行时用于执行本申请实施例所述的信息处理方法。本方案依据用户输入的弹幕内容进行筛选数据集的确定,并依据该确定出的筛选数据集对将要显示的弹幕进行过滤,使得终端设备显示信息的效率提高,显示信息的内容针对性更强,减少了无用信息对用户的干扰。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:图1是本申请实施例提供的一种信息处理方法的流程图;图2是本申请实施例提供的另一种信息处理方法的流程图;图3是本申请实施例提供的另一种信息处理方法的流程图;图4是本申请实施例提供的另一种信息处理方法的流程图;图5是本申请实施例提供的一种信息处理装置的结构框图;图6是本申请实施例提供的一种终端设备的结构示意图。具体实施方式下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。图1是本申请实施例提供的一种信息处理方法的流程图,本实施例可适用于用户使用终端设备观看视频、音频、直播内容时终端设备显示信息的情况,该方法可以由本申请实施例提供的终端设备来执行,该终端设备的信息处理装置可采用软件和/或硬件的方式实现,如图1所示,本实施例提供的具体方案如下:步骤s101、获取用户输入的弹幕内容,依据所述弹幕内容确定当前直播内容对应的筛选数据集。当用户使用终端设备(智能手机、平板电脑、台式电脑)进行视频(电影、电视剧)、音频(歌曲)或者观看直播时,在终端设备的显示界面会实时(延时)显示自己以及网友发送的弹幕,用户通过阅读、发送弹幕使得自身的参与性显著增强。由于弹幕内容的随机性以及不同人群的不同观点使得弹幕内容并不一定是用户需要的,针对单一用户而言,可能存在大量无用弹幕,不利于用户的观感,也不利于用户找到自己想要看到的弹幕。在一个实施例中,在终端设备显示弹幕之前,获取用户输入的弹幕内容,依据所述用户输入的弹幕内容确定当前直播内容对应的筛选数据集。其中,用户输入的弹幕内容可以是用户在弹幕输入框中录入并发送的文字信息,依据该文字信息确定对应的筛选数据集。示例性的,可以检测到直播过程中“发送”按钮被点击后,确定输入框中的文字信息,还可以是输入的弹幕内容发送后对推送至服务器的数据流进行截取以获取用户输入的弹幕内容,还可以是检测到文字录入事件触发后,对录入的弹幕内容进行记录,该文字录入事件可由输入法应用程序的被调用而触发。在一个实施例中,为了进一步提高筛选数据集的准确性,可将用户输入的弹幕内容和其它数据信息相结合以确定筛选数据集,其中,其它数据信息可以是终端设备的使用记录、终端设备关联的用户属性信息以及终端设备显示的直播画面以及播放的声音信息等。其中,该使用记录可通过预设接口获取,该使用记录包括视频播放记录、音频播放记录或网页浏览记录中的至少一种;该用户的属性信息包括用户的性别、职业或偏好内容中的至少一种。在一个实施例中,依据用户输入的弹幕内容确定直播内容对应的筛选数据集包括:依据所述用户输入的弹幕内容以及存储的映射关系表确定和直播内容对应的筛选数据集。示例性的,可对输入的弹幕内容进行关键词提取得到多个关键词,根据提取出的多个关键词以及映射关系表确定和直播内容对应的筛选数据集。其中,映射关系表记录有不同关键词对应的主题内容,该主题内容可以包括不同的生活主题,如运动类、饮食类、出行类;该主题内容还可以包括不同的职业主题,如律师类、程序员类、文案类;该主题内容还可以包括不同的年龄主题,如儿童类、青年类、成年类、老年类等;该主题内容还可以包括不同的地域主题,如北京、上海、广州、河北、山西等。其中,映射关系表中记录了不同主题以及各自对应的一个或多个关键词,示例性的,如下表所示:表1主题1关键词a1关键词b1关键词c1......主题2关键词a2关键词b2关键词c2......主题3关键词a3关键词b3关键词c3........................................................其中,依据用户输入的直播内容确定对应的关键词后可通过上述映射关系表以确定直播内容对应的一个或多个主题作为筛选数据集,即筛选数据集依据特定的用户输入的弹幕内容产生,包含符合用户需求的一个或多个主题。在一个实施例中,依据用户输入的弹幕内容确定对应的关键词包括:将所述弹幕内容作为输入,输入到训练得到的机器学习模型中以输出表征用户意图的关键词。示例性的,当用户输入的弹幕内容为“98年乔丹真是无敌!”通过该机器学习模型可以得到对应的关键词包括“明星”“体育”等,进而确定出筛选数据集中的主题包括体育类、明星类。其中,该机器学习模型可由监督式学习、非监督式学习、半监督式学习或强化学习得到,学习过程中使用的算法包括:回归算法、基于实例的算法、正则化算法、决策树算法、贝叶斯算法、基于核的算法、聚类算法、关联规则算法、人工神经网络算法、深度学习算法以及降低维度算法等。在一个实施例中,映射关系表可由服务器生成后发送至终端设备进行存储,以使终端设备依据用户关联的数据信息确定对应的筛选数据集,示例性的,该映射关系表由服务器通过对大量数据样本进行学习得到,通过学习训练建立各个主题以及每个主题对应的一个或多个关键词。步骤s102、获取当前准备显示的弹幕数据,依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息。其中,当前准备显示的弹幕数据包括服务器发送的采集的其它终端设备上传的弹幕数据,不同用户可在使用终端设备过程中输入弹幕数据,以上传至服务器,服务器在播放对应的音视频过程中可实时或分时的将弹幕数据下发至观看该音视频信息的终端设备中以进行弹幕数据的显示。在一个实施例中,当确定和直播内容对应的筛选数据集后,获取当前准备显示的弹幕数据,其中,该弹幕数据可以是在音视频资源下载过程中同步下载得到。当获取到预显示的弹幕数据后,依据确定出的筛选数据集对准备显示的弹幕数据进行筛选,在一个实施例中,在依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息之前,还包括:检测智能筛选事件是否被触发,如果是,则依据确定出的筛选数据集对准备显示的弹幕数据进行筛选。其中,该智能筛选事件可通过接收用户对预设按钮的点击操作触发。在另一个实施例中,在依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息之前,还包括:检测准备显示的弹幕数据的数据量,当数据量大于预设数据量时,依据确定出的筛选数据集对准备显示的弹幕数据进行筛选。其中,该预设数据量可以是单位时间如3秒、5秒或8秒内终端设备屏幕显示的弹幕数量,如5秒内需要显示100条弹幕数据,则依据确定出的筛选数据集对准备显示的弹幕数据进行筛选。在一个实施例中,依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息包括:去除弹幕数据中匹配到的筛选数据集中需要去除的数据内容。示例性的,筛选数据集中可以记录有需要去除的弹幕数据的特征关键词,当检测到准备显示的弹幕数据包含该特征关键词时,对该条弹幕数据进行删除。其中,特征关键词可以是不良用语。筛选数据集中还可以记录有需要去除的弹幕数据的特征主题,对准备显示的每条弹幕数据进行特征提取,以确定是否满足筛选数据集中的特征主题,如准备显示的弹幕数据中存在一条弹幕数据为“666666”,则对该条弹幕进行特征提取得到其为一条重复数字字符的弹幕数据,如果筛选数据集中存在重复数字字符的特征主题,则对该条弹幕进行去除,不进行弹幕显示。在另一个实施例中,所述依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息包括:依据所述弹幕数据确定各自对应的主题信息,依据所述主题信息以及所述筛选数据集中记录的主题内容对所述弹幕数据进行筛选得到弹幕信息。示例性的,当前准备显示的弹幕数据由n条,其中,将每一条弹幕数据作为机器学习训练模型的输入,相应的得到各自的主题信息作为输出,该机器学习训练模型可以是由服务器经过大量样本进行训练学习得到,可由监督式学习、非监督式学习、半监督式学习或强化学习得到,学习过程中使用的算法包括:回归算法、基于实例的算法、正则化算法、决策树算法、贝叶斯算法、基于核的算法、聚类算法、关联规则算法、人工神经网络算法、深度学习算法以及降低维度算法等。当确定出每条弹幕数据对应的主题信息后,查询筛选数据集进行主题信息和筛选数据集中记录的主题内容的匹配,将匹配成功的弹幕数据筛选出来组成弹幕信息以进行显示。在一个实施例中,在所述依据所述弹幕内容以及存储的映射关系表确定和所述直播内容对应的筛选数据集之前,还包括:依据屏幕的显示信息以及用户的点选操作确定映射关系表,并进行存储。该实施例中,映射关系表的建立可依据用户的点选操作生成,示例性的,在未对弹幕数据进行筛选前,终端设备正常显示弹幕数据,当弹幕数据显示在触摸屏中时,用户可对自己感兴趣的弹幕进行点击,通过对用户点击的弹幕进行机器学习以生成映射关系表。举例而言,当用户在观看nba直播时,显示屏幕中显示了一条关于“乔丹”的弹幕,如用户对篮球明星乔丹的事件非常关注,则可点击该条弹幕信息,此时相应的在后台对该点击事件进行处理,生成/添加关键词“乔丹”至映射关系表中,并相应的映射至“篮球”/“运动”主题。在另一实施例中,在所述依据所述弹幕内容以及存储的映射关系表确定和所述直播内容对应的筛选数据集之前,还包括:依据历史直播内容和对应的历史弹幕信息确定映射关系表,并进行存储。该实施例中,对历史直播内容和其对应的历史弹幕信息进行记录,并对历史弹幕信息中出现的文字内容的频率进行统计,将频率大于预设阈值(如频率大于20%)的文字内容进行保留,将该文字内容作为训练完毕的机器模型(模型训练过程如前所述,此处不再赘述)的输入,输出对应的关键词,将该关键词和对应的直播内容进行关联以生成映射关系表。步骤s103、将所述弹幕信息显示在终端设备当前的直播内容中。当用户在使用终端设备观看音视频和直播内容时,弹幕信息会随着直播内容的播放在显示屏中进行相应显示。在一个实施例中,对未处理的准备显示的弹幕数据进行筛选得到弹幕信息,将该弹幕信息按照预设格式显示在终端设备中,未被筛选出的弹幕数据按照正常显示情况进行显示,预设格式包括弹幕颜色、弹幕透明度、弹幕字体大小、弹幕持续时间和弹幕移动速度中的至少一种。在一个实施例中,预设格式为弹幕颜色时,将筛选出的弹幕信息设置为鲜艳颜色(如黄色、绿色、红色)进行显示;预设格式为弹幕透明度时,将未被筛选出的弹幕设置为透明,筛选出的弹幕信息透明度设置为0,即不进行透明设置;预设格式为字体大小时,将筛选出的弹幕信息字体设置为未被筛选出的弹幕的字体的1.5倍;预设格式为弹幕持续时间时,将筛选出的弹幕信息持续时间设置为未被筛选出的弹幕的字体的2倍;预设格式为弹幕移动速度时,将筛选出的弹幕信息持续时间设置为未被筛选出的弹幕的移动速度一半,即筛选出的弹幕信息的移动速度慢于未被筛选出的弹幕数据。通过上述设置,使得筛选出的弹幕信息显示效果更为突出,便于用户阅读,使得用户在有限时间能够抓取到自身感兴趣的信息内容。由上述内容可知,当用户使用终端设备观看直播内容时,对准备显示的弹幕数据进行筛选,其中,依据用户输入的弹幕内容进行合理筛选,并最终将筛选得出的弹幕信息显示在终端设备中,使得终端设备显示信息的效率提高,显示信息的内容针对性更强,减少了对用户的干扰。图2是本申请实施例提供的另一种信息处理方法的流程图,可选的,在所述依据所述弹幕内容确定当前直播内容对应的筛选数据集之前,还包括:获取所述终端设备的使用记录,所述使用记录包括视频播放记录、音频播放记录或网页浏览记录中的至少一种;相应的,所述依据所述弹幕内容确定当前直播内容对应的筛选数据集包括:依据所述弹幕内容、所述使用记录以及映射关系表确定当前直播内容对应的筛选数据集。如图2所示,技术方案具体如下:步骤s201、获取用户输入的弹幕内容以及终端设备的使用记录,所述使用记录包括视频播放记录、音频播放记录或网页浏览记录中的至少一种。终端设备除了电话功能外,用户还会使用终端设备观看视频(如电影、短片)、收听音乐以及上网浏览新闻。在一个实施例中,用户打开终端设备的应用程序以执行相应功能,如开启视频客户端观看电影、打开浏览器浏览网页、启动音乐客户端收听音乐,当用户在启动应用程序后,应用程序会对用户的使用操作进行记录,如播放电影的名称,收听音乐的名称,浏览网页的内容等,该实施例中,通过预设接口获取终端设备中应用程序在运行中的使用记录,依据该使用记录确定筛选数据集,其中,该预设接口可以是设置的android通用接口,还可以是设置添加的监听回调接口或者构造函数内部子接口。在一个实施例中,还可以设置一记录表,将该记录表存储在存储器中,当用户使用终端设备时,对用户的使用记录进行存储。步骤s202、依据所述弹幕内容、所述使用记录以及映射关系表确定当前直播内容对应的筛选数据集。在一个实施例中,在对弹幕内容进行关键词提取或机器学习得到关键词的同时,通过对视频播放记录、音频播放记录以及网页浏览记录进行关键词提取,示例性的,可采用基于语义的统计语言模型、基于高维聚类的中文关键词提取算法或基于分离模型的中文关键词提取算法进行关键词提取。依据弹幕内容和使用记录提取得到的关键词在映射关系表中记录的关键词进行匹配,如果匹配成功,则将匹配到的映射关系表中关键词对应的主题作为筛选主题得到筛选数据集,以用于后续对弹幕数据进行筛选。步骤s203、获取当前准备显示的弹幕数据,依据所述弹幕数据确定各自对应的主题信息。步骤s204、依据所述主题信息以及所述筛选数据集中记录的主题内容对所述弹幕数据进行筛选得到弹幕信息。步骤s205、将所述弹幕信息按照预设格式显示在终端设备中。由上述可知,本方案在对弹幕数据进行筛选时,除了依据用户输入的弹幕内容确定筛选集外,进一步引入了用户在终端设备日常使用过程中的使用记录作为柴筛选标准之一,提高了筛选数据集的准确度,使得筛选出的弹幕信息针对性更强。图3是本申请实施例提供的另一种信息处理方法的流程图,可选的,在所述依据所述弹幕内容确定当前直播内容对应的筛选数据集之前,还包括:获取和所述终端设备关联的用户属性信息,所述用户属性信息包括用户的性别、职业或偏好中的至少一种,所述用户属性信息根据所述终端设备的地理位置以及地图数据信息确定;相应的,所述依据所述弹幕内容确定当前直播内容对应的筛选数据集包括:依据所述弹幕内容、所述用户属性信息以及存储的映射关系表确定当前直播内容对应的筛选数据集。如图3所示,技术方案具体如下:步骤s301、获取用户输入的弹幕内容以及和终端设备关联的用户属性信息,所述用户属性信息包括用户的性别、职业或偏好中的至少一种。在一个实施例中,该用户属性信息可由用户在使用网站或商城时,登录、下载过程中注册填写的信息确定。在另一个实施例中,该用户属性信息可根据所述终端设备的地理位置以及地图数据信息确定。其中地理位置可由终端设备的gps数据确定,如通过gps数据得到终端设备的经纬度信息,地图数据中记录有不同经纬度的场所数据,将该终端设备的经纬度信息映射到地图数据中可得到终端设备所处的场所,与此同时,还可进一步结合终端设备在相应场所时的时间信息以最终确定用户属性。示例性的,如对终端设备的地理位置进行记录,当在工作日的工作时间确定出终端设备所处位置为写字楼,则可认定该用户为白领职员;当休息日或晚间确定出终端设备所处位置为商场、化妆品店则确定该用户的性别为女等;当确定出用户每周末所在的场所都包括健身房时,可确定该用户偏好内容为健身。步骤s302、依据所述弹幕内容、所述用户属性信息以及存储的映射关系表确定当前直播内容对应的筛选数据集。在结合用户属性信息确定筛选数据集的过程中,该映射关系表中记录有不同属性信息对应的主题内容,如映射关系表中记录有不同性别、职业、偏好内容所对应的一个或多个主题内容,依据确定出的用户的性别、职业以及偏好内容进行匹配得到直播内容对应的一个或多个主题作为筛选数据集。示例性的,映射关系如下表所示:表2主题集a性别m年龄a2职业a3......主题集b性别f年龄b2职业b3......主题集c性别m年龄c2职业c3......步骤s303、获取当前准备显示的弹幕数据,依据所述弹幕数据确定各自对应的主题信息。步骤s304、依据所述主题信息以及所述筛选数据集中记录的主题内容对所述弹幕数据进行筛选得到弹幕信息。步骤s305、将所述弹幕信息按照预设格式显示在终端设备中。由上述可知,在依据用户输入的弹幕内容确定筛选数据集的过程中,进一步结合终端设备关联的用户属性信息,使得确定出的筛选数据集的主题内容更加合理,提高了后续确定出的弹幕信息和用户需求的关联程度,提高了用户直播观看过程中的用户体验。图4是本申请实施例提供的另一种信息处理方法的流程图,可选的,在所述依据所述弹幕内容确定当前直播内容对应的筛选数据集之前,还包括:获取终端设备显示的直播画面以及播放的声音信息,对所述直播画面进行图像识别得到图像识别内容,对所述声音信息进行语音识别得到声音识别内容;相应的,所述依据所述弹幕内容确定当前直播内容对应的筛选数据集包括:依据所述弹幕内容、所述图像识别内容、所述声音识别内容以及存储的映射关系表确定当前直播内容对应的筛选数据集。如图4所示,技术方案具体如下:步骤s401、获取用户输入的弹幕内容以及终端设备显示的直播画面和播放的声音信息,对所述直播画面进行图像识别得到图像识别内容,对所述声音信息进行语音识别得到声音识别内容。在一个实施例中,在终端设备直播过程中,每隔预设时间(如1分钟、5分钟或10分钟)对直播内容画面进行内容截取,对截取到的图像内容进行图像识别以得到此刻直播画面对应的关键词,如识别出直播画面为健身房,则相应的可确定出该直播画面对应的关键词为健身、运动;如识别出的画面为餐厅,则相应的可确定出该直播画面对应的关键词为美食。该实施例中使用的图像识别算法包括:卷积神经网络算法以及基于特征匹配的图像识别算法(orb算法、sift算法)。在另一个实施例中,可依据接收到的服务器推送的信息流在后台生成对应的图像画面,该图像画面可隐藏显示在当前直播画面中,通过对该隐藏层的图像画面进行提取,进行图像识别以得到对应的关键词。在一个实施例中,可通过对播放设备扬声器发出的声音进行采集,将采集到的模拟信号转化为数字信号以得到声音信息,在另一实施例中,还可以是通过对终端设备输出的准备播放的信息流进行采集、编解码以得到声音信息。对获取到的声音信息进行语音识别得到相应的文字信息,再对文字信息进行关键词提取得到声音信息对应的关键词。其中,使用到的语音识别算法包括:隐马尔科夫模型算法或动态时间规整算法,关键词提取可采用基于语义的统计语言模型、基于高维聚类的中文关键词提取算法或基于分离模型的中文关键词提取算法进行关键词提取。步骤s402、依据所述弹幕内容、所述图像识别内容、所述声音识别内容以及存储的映射关系表确定当前直播内容对应的筛选数据集。在一个实施例中,映射关系表中记录有不同关键词对应的主题内容,当通过弹幕内容、图像识别内容和声音识别内容确定出关键词后,依据提取得到的关键词与在映射关系表中记录的关键词进行匹配,如果匹配成功,则将匹配到的映射关系表中关键词对应的主题作为筛选主题得到筛选数据集,以用于后续对弹幕数据进行筛选。步骤s403、获取当前准备显示的弹幕数据,依据所述弹幕数据确定各自对应的主题信息。步骤s404、依据所述主题信息以及所述筛选数据集中记录的主题内容对所述弹幕数据进行筛选得到弹幕信息。步骤s405、将所述弹幕信息按照预设格式显示在终端设备中。由上述可知,在筛选数据集的确定过程中,引入了直播画面内容以及直播过程中终端设备播放的声音作为参量,使得筛选数据集的确定更加合理,筛选出的弹幕信息针对性更加,和当前直播内容更加契合。图5是本申请实施例提供的一种信息处理装置的结构框图,该装置用于执行上述实施例提供的信息处理方法,具备执行方法相应的功能模块和有益效果。如图5所示,该装置具体包括:获取模块101、数据集确定模块102、筛选模块103和显示模块104。获取模块101用于获取用户输入的弹幕内容,数据集确定模块102用于依据所述弹幕内容确定当前直播内容对应的筛选数据集。在一个实施例中,在终端设备显示弹幕之前,获取用户输入的弹幕内容,依据所述用户输入的弹幕内容确定当前直播内容对应的筛选数据集。其中,用户输入的弹幕内容可以是用户在弹幕输入框中录入并发送的文字信息,依据该文字信息确定对应的筛选数据集。示例性的,可以检测到直播过程中“发送”按钮被点击后,确定输入框中的文字信息,还可以是输入的弹幕内容发送后对推送至服务器的数据流进行截取以获取用户输入的弹幕内容,还可以是检测到文字录入事件触发后,对录入的弹幕内容进行记录,该文字录入事件可由输入法应用程序的被调用而触发。在一个实施例中,为了进一步提高筛选数据集的准确性,可将用户输入的弹幕内容和其它数据信息相结合以确定筛选数据集,其中,其它数据信息可以是终端设备的使用记录、终端设备关联的用户属性信息以及终端设备显示的直播画面以及播放的声音信息等。其中,该使用记录可通过预设接口获取,该使用记录包括视频播放记录、音频播放记录或网页浏览记录中的至少一种;该用户的属性信息包括用户的性别、职业或偏好内容中的至少一种。在一个实施例中,依据用户输入的弹幕内容确定直播内容对应的筛选数据集包括:依据所述用户输入的弹幕内容以及存储的映射关系表确定和直播内容对应的筛选数据集。示例性的,可对输入的弹幕内容进行关键词提取得到多个关键词,根据提取出的多个关键词以及映射关系表确定和直播内容对应的筛选数据集。其中,映射关系表记录有不同关键词对应的主题内容,该主题内容可以包括不同的生活主题,如运动类、饮食类、出行类;该主题内容还可以包括不同的职业主题,如律师类、程序员类、文案类;该主题内容还可以包括不同的年龄主题,如儿童类、青年类、成年类、老年类等;该主题内容还可以包括不同的地域主题,如北京、上海、广州、河北、山西等。其中,依据用户输入的直播内容确定对应的关键词后可通过上述映射关系表以确定直播内容对应的一个或多个主题作为筛选数据集,即筛选数据集依据特定的用户输入的弹幕内容产生,包含符合用户需求的一个或多个主题。在一个实施例中,依据用户输入的弹幕内容确定对应的关键词包括:将所述弹幕内容作为输入,输入到训练得到的机器学习模型中以输出表征用户意图的关键词。示例性的,当用户输入的弹幕内容为“98年乔丹真是无敌!”通过该机器学习模型可以得到对应的关键词包括“明星”“体育”等,进而确定出筛选数据集中的主题包括体育类、明星类。其中,该机器学习模型可由监督式学习、非监督式学习、半监督式学习或强化学习得到,学习过程中使用的算法包括:回归算法、基于实例的算法、正则化算法、决策树算法、贝叶斯算法、基于核的算法、聚类算法、关联规则算法、人工神经网络算法、深度学习算法以及降低维度算法等。在一个实施例中,映射关系表可由服务器生成后发送至终端设备进行存储,以使终端设备依据用户关联的数据信息确定对应的筛选数据集,示例性的,该映射关系表由服务器通过对大量数据样本进行学习得到,通过学习训练建立各个主题以及每个主题对应的一个或多个关键词。筛选模块103,用于获取当前准备显示的弹幕数据,依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息。其中,当前准备显示的弹幕数据包括服务器发送的采集的其它终端设备上传的弹幕数据,不同用户可在使用终端设备过程中输入弹幕数据,以上传至服务器,服务器在播放对应的音视频过程中可实时或分时的将弹幕数据下发至观看该音视频信息的终端设备中以进行弹幕数据的显示。在一个实施例中,当确定和直播内容对应的筛选数据集后,获取当前准备显示的弹幕数据,其中,该弹幕数据可以是在音视频资源下载过程中同步下载得到。当获取到预显示的弹幕数据后,依据确定出的筛选数据集对准备显示的弹幕数据进行筛选,在一个实施例中,在依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息之前,还包括:检测智能筛选事件是否被触发,如果是,则依据确定出的筛选数据集对准备显示的弹幕数据进行筛选。其中,该智能筛选事件可通过接收用户对预设按钮的点击操作触发。在另一个实施例中,在依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息之前,还包括:检测准备显示的弹幕数据的数据量,当数据量大于预设数据量时,依据确定出的筛选数据集对准备显示的弹幕数据进行筛选。其中,该预设数据量可以是单位时间如3秒、5秒或8秒内终端设备屏幕显示的弹幕数量,如5秒内需要显示100条弹幕数据,则依据确定出的筛选数据集对准备显示的弹幕数据进行筛选。在一个实施例中,依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息包括:去除弹幕数据中匹配到的筛选数据集中需要去除的数据内容。示例性的,筛选数据集中可以记录有需要去除的弹幕数据的特征关键词,当检测到准备显示的弹幕数据包含该特征关键词时,对该条弹幕数据进行删除。其中,特征关键词可以是不良用语。筛选数据集中还可以记录有需要去除的弹幕数据的特征主题,对准备显示的每条弹幕数据进行特征提取,以确定是否满足筛选数据集中的特征主题,如准备显示的弹幕数据中存在一条弹幕数据为“666666”,则对该条弹幕进行特征提取得到其为一条重复数字字符的弹幕数据,如果筛选数据集中存在重复数字字符的特征主题,则对该条弹幕进行去除,不进行弹幕显示。在另一个实施例中,所述依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息包括:依据所述弹幕数据确定各自对应的主题信息,依据所述主题信息以及所述筛选数据集中记录的主题内容对所述弹幕数据进行筛选得到弹幕信息。示例性的,当前准备显示的弹幕数据由n条,其中,将每一条弹幕数据作为机器学习训练模型的输入,相应的得到各自的主题信息作为输出,该机器学习训练模型可以是由服务器经过大量样本进行训练学习得到,可由监督式学习、非监督式学习、半监督式学习或强化学习得到,学习过程中使用的算法包括:回归算法、基于实例的算法、正则化算法、决策树算法、贝叶斯算法、基于核的算法、聚类算法、关联规则算法、人工神经网络算法、深度学习算法以及降低维度算法等。当确定出每条弹幕数据对应的主题信息后,查询筛选数据集进行主题信息和筛选数据集中记录的主题内容的匹配,将匹配成功的弹幕数据筛选出来组成弹幕信息以进行显示。在一个实施例中,在所述依据所述弹幕内容以及存储的映射关系表确定和所述直播内容对应的筛选数据集之前,还包括:依据屏幕的显示信息以及用户的点选操作确定映射关系表,并进行存储。该实施例中,映射关系表的建立可依据用户的点选操作生成,示例性的,在未对弹幕数据进行筛选前,终端设备正常显示弹幕数据,当弹幕数据显示在触摸屏中时,用户可对自己感兴趣的弹幕进行点击,通过对用户点击的弹幕进行机器学习以生成映射关系表。举例而言,当用户在观看nba直播时,显示屏幕中显示了一条关于“乔丹”的弹幕,如用户对篮球明星乔丹的事件非常关注,则可点击该条弹幕信息,此时相应的在后台对该点击事件进行处理,生成/添加关键词“乔丹”至映射关系表中,并相应的映射至“篮球”/“运动”主题。在另一实施例中,在所述依据所述弹幕内容以及存储的映射关系表确定和所述直播内容对应的筛选数据集之前,还包括:依据历史直播内容和对应的历史弹幕信息确定映射关系表,并进行存储。该实施例中,对历史直播内容和其对应的历史弹幕信息进行记录,并对历史弹幕信息中出现的文字内容的频率进行统计,将频率大于预设阈值(如频率大于20%)的文字内容进行保留,将该文字内容作为训练完毕的机器模型(模型训练过程如前所述,此处不再赘述)的输入,输出对应的关键词,将该关键词和对应的直播内容进行关联以生成映射关系表。显示模块104,用于将所述弹幕信息显示在终端设备当前的直播内容中。当用户在使用终端设备观看音视频和直播内容时,弹幕信息会随着直播内容的播放在显示屏中进行相应显示。在一个实施例中,对未处理的准备显示的弹幕数据进行筛选得到弹幕信息,将该弹幕信息按照预设格式显示在终端设备中,未被筛选出的弹幕数据按照正常显示情况进行显示,预设格式包括弹幕颜色、弹幕透明度、弹幕字体大小、弹幕持续时间和弹幕移动速度中的至少一种。在一个实施例中,预设格式为弹幕颜色时,将筛选出的弹幕信息设置为鲜艳颜色(如黄色、绿色、红色)进行显示;预设格式为弹幕透明度时,将未被筛选出的弹幕设置为透明,筛选出的弹幕信息透明度设置为0,即不进行透明设置;预设格式为字体大小时,将筛选出的弹幕信息字体设置为未被筛选出的弹幕的字体的1.5倍;预设格式为弹幕持续时间时,将筛选出的弹幕信息持续时间设置为未被筛选出的弹幕的字体的2倍;预设格式为弹幕移动速度时,将筛选出的弹幕信息持续时间设置为未被筛选出的弹幕的移动速度一半,即筛选出的弹幕信息的移动速度慢于未被筛选出的弹幕数据。通过上述设置,使得筛选出的弹幕信息显示效果更为突出,便于用户阅读,使得用户在有限时间能够抓取到自身感兴趣的信息内容。由上述内容可知,当用户使用终端设备观看直播内容时,对准备显示的弹幕数据进行筛选,其中,依据用户输入的弹幕内容进行合理筛选,并最终将筛选得出的弹幕信息显示在终端设备中,使得终端设备显示信息的效率提高,显示信息的内容针对性更强,减少了对用户的干扰。在一个可能的实施例中,所述数据集确定模块102具体用于:依据所述弹幕内容以及存储的映射关系表确定当前直播内容对应的筛选数据集;所述数据集确定模块102还用于:在所述依据所述弹幕内容以及存储的映射关系表确定当前直播内容对应的筛选数据集之前,依据历史直播内容和对应的历史弹幕信息确定映射关系表,并进行存储。在一个可能的实施例中,所述获取模块101具体用于:通过预设接口获取和用户关联的终端设备的使用记录,所述使用记录包括视频播放记录、音频播放记录或网页浏览记录中的至少一种,所述使用记录记录在各自对应的应用程序中;所述数据集确定模块102具体用于:依据所述弹幕内容以及所述使用记录确定当前直播内容对应的筛选数据集。在一个可能的实施例中,所述获取模块101具体用于:获取和终端设备关联的用户属性信息,所述用户属性信息包括用户的性别、职业或偏好内容中的至少一种,所述用户属性信息根据所述终端设备的地理位置以及地图数据信息确定;所述数据集确定模块102具体用于:依据所述弹幕内容以及所述用户属性信息确定当前直播内容对应的筛选数据集。在一个可能的实施例中,所述获取模块101具体用于:获取终端设备显示的直播画面以及播放的声音信息,对所述直播画面进行图像识别得到图像识别内容,对所述声音信息进行语音识别得到声音识别内容;所述数据集确定模块102具体用于:依据所述弹幕内容、所述图像识别内容和所述声音识别内容确定当前直播内容对应的筛选数据集。在一个可能的实施例中,所述筛选模块103具体用于:依据所述弹幕数据确定各自对应的主题信息,依据所述主题信息以及所述筛选数据集中记录的主题内容对所述弹幕数据进行筛选得到弹幕信息。在一个可能的实施例中,所述显示模块104具体用于:将所述弹幕信息按照预设格式显示在终端设备中,所述预设格式包括弹幕颜色、弹幕透明度、弹幕字体大小、弹幕持续时间和弹幕移动速度中的至少一种。本实施例在上述各实施例的基础上提供了一种终端设备,图6是本申请实施例提供的一种终端设备的结构示意图,如图6所示,该终端设备200包括:存储器201、处理器(centralprocessingunit,cpu)202、外设接口203、rf(radiofrequency,射频)电路205、音频电路206、扬声器211、电源管理芯片208、输入/输出(i/o)子系统209、触摸屏212、其他输入/控制设备210以及外部端口204,这些部件通过一个或多个通信总线或信号线207来通信。应该理解的是,图示终端设备200仅仅是终端设备的一个范例,并且终端设备200可以具有比图中所示出的更多的或者更少的部件,可以组合两个或更多的部件,或者可以具有不同的部件配置。图中所示出的各种部件可以在包括一个或多个信号处理和/或专用集成电路在内的硬件、软件、或硬件和软件的组合中实现。下面就本实施例提供的用于多开应用的权限管理的终端设备进行详细的描述,该终端设备以智能手机为例。存储器201,所述存储器201可以被cpu202、外设接口203等访问,所述存储器201可以包括高速随机存取存储器,还可以包括非易失性存储器,例如一个或多个磁盘存储器件、闪存器件、或其他易失性固态存储器件。外设接口203,所述外设接口203可以将设备的输入和输出外设连接到cpu202和存储器201。i/o子系统209,所述i/o子系统209可以将设备上的输入输出外设,例如触摸屏212和其他输入/控制设备210,连接到外设接口203。i/o子系统209可以包括显示控制器2091和用于控制其他输入/控制设备210的一个或多个输入控制器2092。其中,一个或多个输入控制器2092从其他输入/控制设备210接收电信号或者向其他输入/控制设备210发送电信号,其他输入/控制设备210可以包括物理按钮(按压按钮、摇臂按钮等)、拨号盘、滑动开关、操纵杆、点击滚轮。值得说明的是,输入控制器2092可以与以下任一个连接:键盘、红外端口、usb接口以及诸如鼠标的指示设备。触摸屏212,所述触摸屏212是用户终端与用户之间的输入接口和输出接口,将可视输出显示给用户,可视输出可以包括图形、文本、图标、视频等。i/o子系统209中的显示控制器2091从触摸屏212接收电信号或者向触摸屏212发送电信号。触摸屏212检测触摸屏上的接触,显示控制器2091将检测到的接触转换为与显示在触摸屏212上的用户界面对象的交互,即实现人机交互,显示在触摸屏212上的用户界面对象可以是运行游戏的图标、联网到相应网络的图标等。值得说明的是,设备还可以包括光鼠,光鼠是不显示可视输出的触摸敏感表面,或者是由触摸屏形成的触摸敏感表面的延伸。rf电路205,主要用于建立手机与无线网络(即网络侧)的通信,实现手机与无线网络的数据接收和发送。例如收发短信息、电子邮件等。具体地,rf电路205接收并发送rf信号,rf信号也称为电磁信号,rf电路205将电信号转换为电磁信号或将电磁信号转换为电信号,并且通过该电磁信号与通信网络以及其他设备进行通信。rf电路205可以包括用于执行这些功能的已知电路,其包括但不限于天线系统、rf收发机、一个或多个放大器、调谐器、一个或多个振荡器、数字信号处理器、codec(coder-decoder,编译码器)芯片组、用户标识模块(subscriberidentitymodule,sim)等等。音频电路206,主要用于从外设接口203接收音频数据,将该音频数据转换为电信号,并且将该电信号发送给扬声器211。扬声器211,用于将手机通过rf电路205从无线网络接收的语音信号,还原为声音并向用户播放该声音。电源管理芯片208,用于为cpu202、i/o子系统及外设接口所连接的硬件进行供电及电源管理。上述实施例中提供的终端设备的信息处理装置及终端设备可执行本发明任意实施例所提供的终端设备的信息处理方法,具备执行该方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的终端设备的信息处理方法。本申请实施例还提供一种包含终端设备可执行指令的存储介质,所述终端设备可执行指令在由终端设备处理器执行时用于执行一种信息处理方法,该方法包括:获取用户输入的弹幕内容,依据所述弹幕内容确定当前直播内容对应的筛选数据集;获取当前准备显示的弹幕数据,依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息;将所述弹幕信息显示在终端设备当前的直播内容中。在一个可能的实施例中,所述依据所述弹幕内容确定当前直播内容对应的筛选数据集包括:依据所述弹幕内容以及存储的映射关系表确定当前直播内容对应的筛选数据集;相应的,在所述依据所述弹幕内容以及存储的映射关系表确定当前直播内容对应的筛选数据集之前,还包括:依据历史直播内容和对应的历史弹幕信息确定映射关系表,并进行存储。在一个可能的实施例中,在所述依据所述弹幕内容确定当前直播内容对应的筛选数据集之前,还包括:获取所述终端设备的使用记录,所述使用记录包括视频播放记录、音频播放记录或网页浏览记录中的至少一种;相应的,所述依据所述弹幕内容确定当前直播内容对应的筛选数据集包括:依据所述弹幕内容以及所述使用记录确定当前直播内容对应的筛选数据集。在一个可能的实施例中,在所述依据所述弹幕内容确定当前直播内容对应的筛选数据集之前,还包括:获取和所述终端设备关联的用户属性信息,所述用户属性信息包括用户的性别、职业或偏好中的至少一种,所述用户属性信息根据所述终端设备的地理位置以及地图数据信息确定;相应的,所述依据所述弹幕内容确定当前直播内容对应的筛选数据集包括:依据所述弹幕内容以及所述用户属性信息确定当前直播内容对应的筛选数据集。在一个可能的实施例中,在所述依据所述弹幕内容确定当前直播内容对应的筛选数据集之前,还包括:获取终端设备显示的直播画面以及播放的声音信息,对所述直播画面进行图像识别得到图像识别内容,对所述声音信息进行语音识别得到声音识别内容;相应的,所述依据所述弹幕内容确定当前直播内容对应的筛选数据集包括:依据所述弹幕内容、所述图像识别内容和所述声音识别内容确定当前直播内容对应的筛选数据集。在一个可能的实施例中,所述依据所述筛选数据集对所述弹幕数据进行筛选得到弹幕信息包括:依据所述弹幕数据确定各自对应的主题信息,依据所述主题信息以及所述筛选数据集中记录的主题内容对所述弹幕数据进行筛选得到弹幕信息。在一个可能的实施例中,所述将所述弹幕信息显示在终端设备当前的直播内容中包括:将所述弹幕信息按照预设格式显示在终端设备中,所述预设格式包括弹幕颜色、弹幕透明度、弹幕字体大小、弹幕持续时间和弹幕移动速度中的至少一种。存储介质——任何的各种类型的存储器设备或存储设备。术语“存储介质”旨在包括:安装介质,例如cd-rom、软盘或磁带装置;计算机系统存储器或随机存取存储器,诸如dram、ddrram、sram、edoram,兰巴斯(rambus)ram等;非易失性存储器,诸如闪存、磁介质(例如硬盘或光存储);寄存器或其它相似类型的存储器元件等。存储介质可以还包括其它类型的存储器或其组合。另外,存储介质可以位于程序在其中被执行的第一计算机系统中,或者可以位于不同的第二计算机系统中,第二计算机系统通过网络(诸如因特网)连接到第一计算机系统。第二计算机系统可以提供程序指令给第一计算机用于执行。术语“存储介质”可以包括可以驻留在不同位置中(例如在通过网络连接的不同计算机系统中)的两个或更多存储介质。存储介质可以存储可由一个或多个处理器执行的程序指令(例如具体实现为计算机程序)。当然,本申请实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的信息处理方法操作,还可以执行本发明任意实施例所提供的信息处理方法中的相关操作。注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1