网络信息获取工具对用户生成内容的过滤方法

文档序号:9810589阅读:852来源:国知局
网络信息获取工具对用户生成内容的过滤方法
【技术领域】
[0001]本发明公开一般的涉及对于网络信息获取工具对于用户生成内容的显示,更具体涉及用于对用户生成内容进行过滤的过滤方法。
【背景技术】
[0002]当前用户经常通过网络信息获取工具生成大量的用户生成内容(后文简称为UGC,即:User Generated Content),用户通过阅读其他用户的UGC来进行社交和信息获取。当出现某热点事件时,大量用户往往会转发相同的信息,造成用户生成实质上相同UGC。当用户期望通过阅读他人的UGC来达到信息获取目的时,大量本质上相同的UGC会影响用户的阅读效率。
[0003]另外,转发了某个信息的用户有时不希望看到因其他用户转发同样信息而产生的UGC0
[0004]在服务器端进行本质上相同的UGC内容的聚合会加大服务器的负载压力。
[0005]为此,本发明提出一种网络信息获取工具在用户本地实现信息汇总显示的方法,以防止用户被相同内容的UGC刷屏。

【发明内容】

[0006]鉴于相同内容的UGC会降低用户有效获取信息的速度、在网络服务器端进行UGC内容的汇总会加大服务器的负载的问题,本发明提出一种在用户本地实现对他人产生的UGC进行信息过滤显示的方法。此方法分为两个子方法。
[0007]1.对他人产生的同质UGC进行过滤显示的方法
[0008]本方法的原理是:将用户生成内容分为实质性内容和辅助性内容,且此网络信息获取工具在用户终端上缓存了最近预定时间范围内的此用户收到的所有的用户生成内容,当此网络信息获取工具从服务器收到要显示的用户生成内容时,把新收到的用户生成内容与当前缓存的用户生成内容进行“逻辑或”方式的汇总,再将汇总后的所有用户生成内容按照其实质性内容进行分组,并以分组中某个用户生成内容的生成时间作为此分组的生成时间,最后按照分组的生成时间从近到远的顺序,逐个显示各个分组所包含的用户生成内容、且每个分组所包含的实质性内容被显示的次数不超过I次。
[0009]具体的说,在本方法中,将UGC分为CONTENT, 0THER_PART两部分,其中CONTENT包括用户在生成内容时所输入的文字、语音、视频、图片信息等信息;0THER_PART为UGC中除去CONTENT之外的信息;网络信息获取工具包含DISPLAY_HIS数据库,该数据库缓存了最近预定时间段长度内、网络信息获取工具所收到的UGC信息;当网络信息获取工具收到网络服务器发送的UGC集合USet后,将USet中UGC和DISPLAY_HIS数据库中的UGC根据其包含的CONTENT内容相同情况进行汇总、并按照时间轴由近到远的顺序向用户显示汇总后的内容。
[0010]针对用户有时希望临时将某个UGC内容由汇总显示模式切换为非汇总显示模式,所述网络信息获取工具可以在汇总显示UGC内容时,同时提供一个切换选项。当所述网络信息获取工具获知用户希望以非汇总方式查看某CONTENT对应的各个UGC时,向用户显示具有所有或特定包含该CONTENT的UGC。
[0011]在实现上,可以将UGC解析为〈CONTENT,PRODUCER, AUXILIARY〉序偶,其中 CONTENT包括用户在生成内容时所输入的文字、语音、视频、图片信息等信息;PR0DUCER为生成此UGC的用户;AUXILIARY可包括用户在生成此UGC时所直接或间接输入的生成时间、终端类型、地理位置等信息;AUXILIARY还可包括在用户生成CONTENT后,所有用户关于本CONTENT进一步生成的点赞、评论等信息。用户事先将所述网络信息获取工具设置为希望以汇总方式显示具有相同CONTENT的UGC。所述网络信息获取工具内部包含DISPLAY_HIS数据库。
[0012]DISPLAY_HIS数据库记录了集合DSet.。DSet的定义如下:
[0013]DSet= {〈content, producer_set, earliest_tm> I
[0014]存在曾经收到过的一个UGC Ugc =〈C, P, aux>,满足条件:①Ugc的生成时间落在最近预定时间段长度内?’②c的值等于content ;
[0015]对任意两个曾经收到过的UGC Ugcl和ugc2,满足条件:若Ugcl和ugc2的生成时间均落在最近预定时间段长度内、且ugcl和ugc2的CONTENT值均为content,则ugcl和ugc2 的 PRODUCER 均在 producer_set 内、且 ugcl 和 ugc2 的生成时间不早于 earliest_tm ;
[0016]对于集合producer_set中的任意一个元素prod,总存在一个曾经收到过的UGCugc_y,满足条件:①ugc_y的生成时间落在最近预定时间段长度内;@ugc_y的CONTENT值是 content !③ ugc_y 的 PRODUCER 值为 prod ;
[0017]存在一个曾经收到过的UGC ugc_x,满足条件:①ugc_x的生成时间落在最近预定时间段长度内!②ugc_x的CONTENT值为content !③ugc_x的生成时间等于earliest_tm} ο
[0018](I)当所述网络沟通工具在收到对应网络服务器发送的UGC的集合后,针对集合中的每个UGC ugc,执行包括如下步骤的流程对数据进行预处理:
[0019]MPR0D1将Ugc的CONTENT值记为cont,将Ugc的生成时间记为gentime,将Ugc的 PRODUCER 记为 uprod ;
[0020]MPR0D2获取所述DSet中,cont对应的元素elem,记elem的producer_set域为pset,earliest_tm ±或为 e_tm ;
[0021 ] MPR0D3若步骤MPR0D2找到的elem为空,则执行步骤MPR0D4,否则执行MPR0D7 ;
[0022]MPR0D4将cont标记为“标准显示模式”;
[0023]MPR0D5 在 DSet 中添加 Ugc 对应的元素〈cont, {uprod}, gentime〉;
[0024]MPR0D6 处理结束;
[0025]MPR0D7 修改 DSet 中元素 elem 的 producer_set 域,将 uprod 加入到集合 pset 中;
[0026]MPR0D8若elem的e_tm早于gentime、且cont被标记为“标准显示模式”,则执行步骤MPR0D9,否则执行MPR0D11;
[0027]MPR0D9将cont的标记改为“汇总显示模式”,
[0028]MPROD1 处理结束;
[0029]MPROD11 若 elem 的 e_tm 晚于 gentime,则执行步骤 MPR0D12,否则执行 MPR0D15 ;
[0030]MPROD12 修改 DSet 中 elem 元素:将其 earliest_tm 域修改为 gentime ;[0031 ] MPROD13将cont标记为“汇总显示模式”;
[0032]MPROD14 处理结束;
[0033]MPROD15若uprod为elem当前producer_set域中的中唯一元素,则将cont标记为“标准显示模式”,否则将cont标记为“汇总显示模式”;
[0034]MPR0D16 处理结束。
[0035]2.对他人产生的、与用户自己产生过的UGC本质上相同的UGC进行过滤的方法
[0036]本方法的原理是:将用户生成内容分为实质性内容和辅助性内容,且此网络信息获取工具在用户终端上缓存了用户在最近预定时间范围内所生成的所有的用户生成内容,当此网络信息获取工具从服务器收到要显示的用户生成内容集合后,从此集合中减去与网络信息获取工具缓存的用户自己生成的用户生成内容具有相同实质性内容的用户生成内容,然后再按照普通方式显示此集合中剩余的用户生成内容。
[0037]具体的说,在本方法中,UGC被解析为序偶〈CONTENT、0THER_PART>,其中CONTENT可包括用户在生成内容时所输入的文字、语音、视频、图片信息;0THER_PART为所述UGC中除CONTENT之外的部分;所述网络信息获取工具包含MYJJGC数据库,该数据库记录了用户生成的、满足如下性质的UGC的CONTENT值:
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1