1.一种推荐多媒体文件的方法,其特征在于,所述方法包括:
获取终端对应的第一多媒体文件的第一标签信息,所述第一标签信息为基于所述第一多媒体文件的第一字幕信息提取的;
根据所述第一标签信息和多媒体文件库中每个第二多媒体文件的第二标签信息,从所述多媒体文件库中选择第二标签信息与所述第一标签信息匹配的第二多媒体文件,所述每个第二多媒体文件的第二标签信息为基于所述每个第二多媒体文件的第二字幕信息提取的;
向所述终端发送所述第二多媒体文件的标识。
2.根据权利要求1所述的方法,其特征在于,所述获取终端对应的第一多媒体文件的第一标签信息,包括:
获取所述第一多媒体文件的第一字幕信息;
对所述第一字幕信息进行分词,得到第一关键词集合;
对所述第一关键词集合中的每个关键词进行分析,得到所述第一标签信息。
3.根据权利要求2所述的方法,其特征在于,所述对所述第一关键词集合中的每个关键词进行分析,得到所述第一标签信息,包括:
获取所述每个关键词在所述第一字幕信息中的概率,以及,获取所述每个关键词属于主题信息库中的每个主题信息的概率,所述主题信息库用于存储多个预设的主题信息;
根据所述每个关键词在所述第一字幕信息中的概率和所述每个关键词属于每个主题信息的概率,确定所述第一多媒体文件属于所述每个主题信息的概率;
根据所述第一多媒体文件属于所述每个主题信息的概率,从所述每个主题信息中选择概率最大的预设数目个主题信息;
将选择的预设数目个主题信息组成所述第一标签信息。
4.根据权利要求3所述的方法,其特征在于,所述根据所述每个关键词在所述第一字幕信息中的概率和所述每个关键词属于每个主题信息的概率,确定所述第一多媒体文件属于所述每个主题信息的概率,包括:
将所述每个关键词在所述第一字幕信息中的概率组成第一概率矩阵,以及,将所述每个关键词属于每个主题信息的概率组成第二概率矩阵;
将所述第二概率矩阵的逆矩阵与所述第一概率矩阵相乘,得到第三概率矩阵;
从所述第三概率矩阵中获取所述第一多媒体文件属于所述每个主题信息的概率。
5.根据权利要求3所述的方法,其特征在于,所述获取所述每个关键词属于主题信息库中的每个主题信息的概率,包括:
对于所述每个主题信息,获取所述主题信息对应的预设关键词集合;
根据所述每个关键词在所述第一字幕信息中的概率、所述预设关键词集合和所述预设关键词集合包含的关键词的数目,确定所述每个关键词属于所述主题信息的概率。
6.根据权利要求5所述的方法,其特征在于,所述根据所述每个关键词在所述第一字幕信息中的概率、所述预设关键词集合和所述预设关键词集合包含的关键词的数目,确定所述每个关键词属于所述主题信息的概率,包括:
如果所述预设关键词集合中包含所述每个关键词,将所述每个关键词在所述第一字幕信息中的概率和所述预设关键词集合包含的关键词的数目的比值作为所述每个关键词属于所述主题信息的概率;
如果所述预设关键词集合中不包含所述每个关键词,确定所述每个关键词属于所述主题信息的概率为零。
7.根据权利要求2所述的方法,其特征在于,所述对所述第一字幕信息进行分词,得到第一关键词集合,包括:
对所述第一字幕信息进行分词,将所述第一字幕信息包括的每个分词组成第二关键词集合;
将所述第二关键词集合中预设类型的关键词去除,得到所述第一关键字集合。
8.根据权利要求1所述的方法,其特征在于,所述第一标签信息包括所述第一多媒体文件所属的主题信息、制作所述第一多媒体文件的用户信息和被拍摄的用户信息中的至少一个。
9.一种推荐多媒体文件的装置,其特征在于,所述装置包括:
获取模块,用于获取终端对应的第一多媒体文件的第一标签信息,所述第一标签信息为基于所述第一多媒体文件的第一字幕信息提取的;
选择模块,用于根据所述第一标签信息和多媒体文件库中每个第二多媒体文件的第二标签信息,从所述多媒体文件库中选择第二标签信息与所述第一标签信息匹配的第二多媒体文件,所述每个第二多媒体文件的第二标签信息为基于所述每个第二多媒体文件的第二字幕信息提取的;
发送模块,用于向所述终端发送所述第二多媒体文件的标识。
10.根据权利要求9所述的装置,其特征在于,所述获取模块,包括:
获取单元,用于获取所述第一多媒体文件的第一字幕信息;
分词单元,用于对所述第一字幕信息进行分词,得到第一关键词集合;
分析单元,用于对所述第一关键词集合中的每个关键词进行分析,得到所述第一标签信息。
11.根据权利要求10所述的装置,其特征在于,
所述分析单元,还用于获取所述每个关键词在所述第一字幕信息中的概率,以及,获取所述每个关键词属于主题信息库中的每个主题信息的概率,所述主题信息库用于存储多个预设的主题信息,根据所述每个关键词在所述第一字幕信息中的概率和所述每个关键词属于每个主题信息的概率,确定所述第一多媒体文件属于所述每个主题信息的概率,根据所述第一多媒体文件属于所述每个主题信息的概率,从所述每个主题信息中选择概率最大的预设数目个主题信息,将选择的预设数目个主题信息组成所述第一标签信息。
12.根据权利要求11所述的装置,其特征在于,
所述分析单元,还用于将所述每个关键词在所述第一字幕信息中的概率组成第一概率矩阵,以及,将所述每个关键词属于每个主题信息的概率组成第二概率矩阵,将所述第二概率矩阵的逆矩阵与所述第一概率矩阵相乘,得到第三概率矩阵,从所述第三概率矩阵中获取所述第一多媒体文件属于所述每个主题信息的概率。
13.根据权利要求11所述的装置,其特征在于,
所述分析单元,还用于对于所述每个主题信息,获取所述主题信息对应的预设关键词集合,根据所述每个关键词在所述第一字幕信息中的概率、所述预设关键词集合和所述预设关键词集合包含的关键词的数目,确定所述每个关键词属于所述主题信息的概率。
14.根据权利要求13所述的装置,其特征在于,
所述分析单元,还用于如果所述预设关键词集合中包含所述每个关键词,将所述每个关键词在所述第一字幕信息中的概率和所述预设关键词集合包含的关键词的数目的比值作为所述每个关键词属于所述主题信息的概率,如果所述预设关键词集合中不包含所述每个关键词,确定所述每个关键词属于所述主题信息的概率为零。
15.根据权利要求10所述的装置,其特征在于,
所述分词单元,还用于对所述第一字幕信息进行分词,将所述第一字幕信息包括的每个分词组成第二关键词集合,将所述第二关键词集合中预设类型的关键词去除,得到所述第一关键字集合。
16.根据权利要求9所述的装置,其特征在于,所述第一标签信息包括所述第一多媒体文件所属的主题信息、制作所述第一多媒体文件的用户信息和被拍摄的用户信息中的至少一个。
17.一种推荐多媒体文件的装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:获取终端对应的第一多媒体文件的第一标签信息,所述第一标签信息为基于所述第一多媒体文件的第一字幕信息提取的;
根据所述第一标签信息和多媒体文件库中每个第二多媒体文件的第二标签信息,从所述多媒体文件库中选择第二标签信息与所述第一标签信息匹配的第二多媒体文件,所述每个第二多媒体文件的第二标签信息为基于所述每个第二多媒体文件的第二字幕信息提取的;
向所述终端发送所述第二多媒体文件。