一种社交信息展示方法、装置及服务器的制造方法_2

文档序号:8487774阅读:来源:国知局
军金 牛巨蟹座双鱼座天秤座天蝎座双子座水瓶座狮子座白羊座射手"。
[0038] 步骤S110、根据预设的分词字符与各信息类别的概率对应关系,确定分词操作所 得到的各分词字符与各信息类别的概率值;
[0039]本发明实施例可预先设置分词字符与各信息类别的概率对应关系;信息类别可预 先的设定,如可利用现有的社交网络频道类别(美女、搞笑、语录、时尚、杂谈、资讯、明星、动 漫、设计、生活等);概率对应关系表示的是不同的分词字符与每个信息类别的所属概率值; 以分词字符为"刘德华",信息类别为"明星","生活"这两类为例,则概率对应关系中将记录 "刘德华"这一分词字符属于明星这一信息类别的概率值,及"刘德华"属于"生活"这一信 息类别的概率值;
[0040]在步骤S100得到社交信息的各分词字符后,可通过预设的概率对应关系,确定各 分词字符与各信息类别的概率值;如分词字符为"刘德华",信息类别为"明星","生活"这两 类,则可从预设的概率对应关系中得到"刘德华"属于明星这一信息类别的概率值,及属于 "生活"这一信息类别的概率值,多个分词字符,多个信息类别的情况可同理类推。
[0041] 步骤S120、根据各分词字符与各信息类别的概率值,计算所述社交信息与各信息 类别的概率值;
[0042]步骤S130、将所计算的概率值最大的信息类别确定为所述社交信息所属的信息类 别;
[0043]步骤S140、将所述社交信息归属到所述概率值最大的信息类别中进行展示。
[0044]本发明实施例提供的社交信息展示方法可将社交信息进行分词操作后,根据预设 的分词字符与各信息类别的概率对应关系,确定分词操作所得到的各分词字符与各信息类 别的概率值,根据各分词字符与各信息类别的概率值,计算所述社交信息与各信息类别的 概率值,将社交信息归属到概率值最大的信息类别中进行展示,从而实现了社交信息的分 类展示。相比于现有按照发布时间的顺序展示社交信息的方式,本发明实施例可按照信息 类别,将社交信息归属到所属的信息类别中进行展示,从而使得用户可通过信息类别便捷 的查找到自己感兴趣的社交信息,解决了用户查找自己感兴趣的社交信息较为麻烦的问 题,并使得社交信息的展示具有明确的分类,使得社交信息的展示更为直观。
[0045] 可选的,各信息类别下的社交信息可按照发布时间的顺序进行排序。
[0046] 可选的,图2示出了确定预设的分词字符与各信息类别的概率对应关系的一种可 选实现方法,参照图2,该确定方法可以包括 :
[0047] 步骤S200、选择多条社交信息,对所选择的各条社交信息所属的信息类别进行预 先判定;
[0048] 可选的,本发明实施例可随机的选择多条(如几万条)社交信息作为训练集,通过 人工的方式对所选择的各条社交信息所属的信息类别进行预先判定;可选的,服务器可在 人工判断完成后,接收包含判断结果的信息,从而对所选择的各条社交信息所属的信息类 别完成预先判定。
[0049] 步骤S210、对所选择的各条社交信息进行分词操作,得到多个分词字符;
[0050] 可选的,可对所选取的各条社交信息分别进行分词操作,得到各条社交信息对应 的分词字符,从而得到多个分词字符。
[0051] 步骤S220、通过预先判定的各条社交信息所属的信息类别,确定所述多条社交信 息对应的分词字符与各信息类别的所属概率值,通过所述所属概率值确定分词字符与各信 息类别的概率对应关系。
[0052] 可选的,可通过哈希表记录分词字符与各信息类别的概率对应关系。
[0053] 如社交信息有两条,社交信息1和社交信息2,其中社交信息1属于类别1,社交信 息2属于类别2 ;社交信息1具有分词字符:字符1,字符2 ;社交信息2具有分词字符:字符 3和字符4。则通过社交信息1属于类别1的预先判定,本发明实施例可计算出字符1,字 符2,字符3和字符4,与类别1所属的概率值;及通过社交信息2属于类别2的预先判定, 本发明实施例可计算出字符1,字符2,字符3和字符4,与类别2所属的概率值。
[0054] 可选的,步骤S220中通过预先判定的各条社交信息所属的信息类别,确定多条社 交信息对应的分词字符与各信息类别的所属概率值可通过图3所示方法实现,图3为本发 明实施例提供的确定多条社交信息对应的分词字符与各信息类别的所属概率值的方法流 程图,参照图3,该方法可以包括:
[0055] 步骤S300、对于第一信息类别,若第一信息类别所属的社交信息的第一分词字符 不在其他信息类别所属的社交信息中出现,则确定第一分词字符与第一信息类别的所属概 率值为1 ;
[0056] 可选的,第一信息类别可以是预定信息类别中的任一类别,其他信息类别是指预 定信息类别中的非第一信息类别的信息类别,第一分词字符是指第一信息类别所属的社交 信息中的任一分词字符。
[0057] 步骤S310、对于第一信息类别,若第一信息类别所属的社交信息的第一分词字符, 在其他信息类别所属的社交信息中出现,则将第一信息类别所属的社交信息的分词字符数 的倒数作为第一概率值,将第一概率值,除以,该其他信息类别所属的社交信息的分词字符 数的倒数和第一概率值的和,得到第二概率值,将第二概率值确定为第一分词字符与第一 信息类别的所属概率值;
[0058] 步骤S320、对于第一信息类别,若第一信息类别所不属的社交信息的第二分词字 符,不在第一信息类别所属的社交信息中出现,则确定第二分词字符与第一信息类别的所 属概率值为零。
[0059] 第二分词字符是指第一信息类别所不属的社交信息中的任一分词字符。
[0060] 通过图3所示方法可计算出所有的信息类别下,各分词字符的所属概率。
[0061]对应的,步骤S120根据各分词字符与各信息类别的概率值,计算所述社交信息与 各信息类别的概率值的实现方式可以是:将所述社交信息的各分词字符属于第一信息类别 的概率值的乘积,除以,各分词字符属于其他信息类别的概率值的乘积和各分词字符属于 第一信息类别的概率值的乘积的和,将所得到的值作为所述社交信息与第一信息类别的概 率值。循环的执行这种实现方式,可得到社交信息与各信息类别的概率值。
[0062]为便于理解本发明实施例提供的社交信息展示方法,下面假设信息类别具有星座 C1和非星座NC1这两类,社交信息具有两条,分别为社交信息1 :"【心地最纯的星座】冠军 (双鱼座)、亚军(天秤座)、季军(射手座)、第四名(巨蟹座)";社交信息2 :"我跑步得冠军喽"。 社交信息1的分词结果为:"心地星座冠军双鱼座亚军天秤座季军射手巨蟹座";社交信息2 的分词结果为:"跑步冠军"。通过预先判定后,可确定社交信息1属于星座C1这一信息类 另IJ,社交信息2属于非星座NC1这一信息类别。
[0063]对于星座C1类别而言,社交信息2并不属于星座C1类别,由于社交信息2具有"跑 步"和"冠军"两个分词字符,而分词字符"冠军"在属于星座C1类别的社交信息1中出现, 因此对于"冠军"字符而言,可将社交信息1的分词字符数的倒数(1/9=0. 11)作为第一概率 值,将第一概率值,除以社交信息2的分词字符数的倒数(1/2=0. 5)和第一概率值的和,即 0.
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1