1.一种多媒体标题显示方法,其特征在于,包括:
对多媒体标题数据集中所包括的各样本标题进行分词处理,以得到多个词语;
根据所得到的多个词语建立统计模型;
根据所建立的统计模型来计算与所得到的各个词语分别相对应的词间关联权重和词间关联度因素;
根据所计算出的词间关联权重和词间关联度因素来确定与所得到的各个词语相对应的词间关联度;以及
根据所述词间关联度对所述多媒体标题数据集中的各所述样本标题进行缩略显示,以使缩略显示后的标题长度适应终端设备的屏幕,其中,缩略显示后的标题长度小于所述样本标题的原长度;
其中,根据所计算出的词间关联权重和词间关联度因素来确定与所得到的各个词语相对应的词间关联度,包括:
根据所述词间关联度因素来计算与所得到的各个词语相对应的词权重;
根据所述词间关联权重和所述词权重来确定与所得到的各个词语相对应的词间关联度。
2.根据权利要求1所述的多媒体标题显示方法,其特征在于,根据所述词间关联权重和所述词权重来确定与所得到的各个词语相对应的词间关联度,包括:
采用下式1,来计算所述词间关联度,
其中,
3.根据权利要求2所述的多媒体标题显示方法,其特征在于,所述词间关联度因素包括词频和文档反转频率,
根据所述词间关联度因素来计算与所得到的各个词语相对应的词权重,包括:
采用下式2,根据所述词频和所述文档反转频率来计算与所得到的各个词语相对应的词权重,
其中,
4.根据权利要求2所述的多媒体标题显示方法,其特征在于,所述词间关联度因素包括词频、文档反转频率和词活跃度,
根据所述词间关联度因素来计算与所得到的各个词语相对应的词权重,包括:
采用下式3,根据所述词频、所述文档反转频率和所述词活跃度来计算与所得到的各个词语相对应的词权重,
其中,
5.根据权利要求2所述的多媒体标题显示方法,其特征在于,所述词间关联度因素包括词频、文档反转频率和词性权重,
根据所述词间关联度因素来计算与所得到的各个词语相对应的词权重,包括:
采用下式4,根据所述词频、所述文档反转频率和所述词性权重来计算与所得到的各个词语相对应的词权重,
其中,
6.根据权利要求2所述的多媒体标题显示方法,其特征在于,所述词间关联度因素包括词频、文档反转频率、词活跃度和词性权重,
根据所述词间关联度因素来计算与所得到的各个词语相对应的词权重,包括:
采用下式5,根据所述词频、所述文档反转频率、所述词活跃度和所述词性权重来计算与所得到的各个词语相对应的词权重,
其中,
7.根据权利要求1-6中任一项所述的多媒体标题显示方法,其特征在于,所述多媒体标题显示方法还包括:
根据所述词间关联度对所述多媒体标题数据集之外的其它多媒体标题进行缩略显示。
8.根据权利要求1-6中任一项所述的多媒体标题显示方法,其特征在于,在进行分词处理之前,所述多媒体标题显示方法还包括对各所述样本标题进行预处理,具体包括:
对各所述样本标题进行规范化处理;以及
对进行规范化处理后的各所述样本标题进行清洗。
9.根据权利要求1-6中任一项所述的多媒体标题显示方法,其特征在于,根据所述词间关联度对所述多媒体标题数据集中的各所述样本标题进行缩略显示,包括:
根据所述词间关联度对由对各所述样本标题进行分词而得到的各个词语进行分层;
根据分层结果对各所述样本标题进行差异化的缩略显示。
10.一种多媒体标题显示装置,其特征在于,包括:
分词单元,用于对多媒体标题数据集中所包括的各样本标题进行分词处理,以得到多个词语;
统计模型建立单元,与所述分词单元连接,用于根据所得到的多个词语建立统计模型;
计算单元,与所述分词单元和所述统计模型建立单元连接,用于根据所建立的统计模型来计算与所得到的各个词语分别相对应的词间关联权重和词间关联度因素;
确定单元,与所述计算单元连接,用于根据所计算出的词间关联权重和词间关联度因素来确定与所得到的各个词语相对应的词间关联度;以及
缩略显示单元,与所述确定单元连接,用于根据所述词间关联度对所述多媒体标题数据集中的各所述样本标题进行缩略显示,以使缩略显示后的标题长度适应终端设备的屏幕,其中,缩略显示后的标题长度小于所述样本标题的原长度;
其中,所述确定单元包括:
计算模块,用于根据所述词间关联度因素来计算与所得到的各个词语相对应的词权重;
确定模块,与所述计算模块连接,用于根据所述词间关联权重和所述词权重来确定与所得到的各个词语相对应的词间关联度。
11.根据权利要求10所述的多媒体标题显示装置,其特征在于,所述确定模块采用下式1来计算所述词间关联度,
其中,
12.根据权利要求11所述的多媒体标题显示装置,其特征在于,所述词间关联度因素包括词频和文档反转频率,
所述计算模块采用下式2来计算与所得到的各个词语相对应的词权重,
其中,
13.根据权利要求11所述的多媒体标题显示装置,其特征在于,所述词间关联度因素包括词频、文档反转频率和词活跃度,
所述计算模块采用下式3来计算与所得到的各个词语相对应的词权重,
其中,
14.根据权利要求11所述的多媒体标题显示装置,其特征在于,所述词间关联度因素包括词频、文档反转频率和词性权重,
所述计算模块采用下式4来计算与所得到的各个词语相对应的词权重,
其中,
15.根据权利要求11所述的多媒体标题显示装置,其特征在于,所述词间关联度因素包括词频、文档反转频率、词活跃度和词性权重,
所述计算模块采用下式5来计算与所得到的各个词语相对应的词权重,
其中,
16.根据权利要求10-15中任一项所述的多媒体标题显示装置,其特征在于,所述缩略显示单元还用于:
根据所述词间关联度对所述多媒体标题数据集之外的其它多媒体标题进行缩略显示。
17.根据权利要求10-15中任一项所述的多媒体标题显示装置,其特征在于,所述多媒体标题显示装置还包括预处理单元,所述预处理单元与所述分词单元连接,用于对各所述样本标题进行预处理,
其中,所述预处理单元具体用于:
对各所述样本标题进行规范化处理;以及
对进行规范化处理后的各所述样本标题进行清洗。
18.根据权利要求10-15中任一项所述的多媒体标题显示装置,其特征在于,所述缩略显示单元用于:
根据所述词间关联度对由对各所述样本标题进行分词而得到的各个词语进行分层;
根据分层结果对各所述样本标题进行差异化的缩略显示。