一种信息筛选方法及装置制造方法

文档序号:6500451阅读:212来源:国知局
一种信息筛选方法及装置制造方法
【专利摘要】本发明实施例公开了一种信息筛选方法及装置,用于为用户筛选在社交网络中接收到的信息。本发明实施例方法包括:获取第一用户的用户关注历史;使用所述用户关注历史对所述第一用户接收到的社交网络信息进行关键词匹配;根据所述关键词匹配的匹配结果推送所述社交网络信息。
【专利说明】一种信息筛选方法及装置
【技术领域】
[0001]本发明涉及信息处理领域,尤其涉及一种信息筛选方法及装置。
【背景技术】
[0002]在现有的一些社交网络的应用中,一些名人或专家往往会收到很多网友发出的问题或信息,由于数量太多,这些名人或专家往往没办法一一查阅并答复,并且,这些问题或信息的内容有可能是一些广告信息或骚扰信息,这些五花八门的内容使得名人或专家们无法有效的区分。
[0003]如微博这种社交网络应用,由于转发和查阅内容的方式方便,且信息的传播迅速,因此,微博的用户众多,许多名人或专家们都开通了微博的应用,在微博平台上与网友们互动交流。这些名人或专家们的关注者众多,因而也就会收到许多的网友们发送的信息,而这么庞大繁杂的信息量往往让这些名人或专家们无所适从,只能随意的挑选回复,导致很多有价值的问题或名人或专家们感兴趣的内容会被忽略。

【发明内容】

[0004]本发明实施例提供了一种信息筛选方法及装置,用于为用户筛选在社交网络中接收到的信息。
[0005]本发明实施例提供的信息筛选方法,包括:
[0006]获取第一用户的用户关注历史;使用所述用户关注历史对所述第一用户接收到的社交网络信息进行关键词匹配;根据所述关键词匹配的匹配结果推送所述社交网络信息。
[0007]可选的,所述用户关注历史包括:用户搜索历史,和/或用户常用词汇。
[0008]可选的,所述获取第一用户的用户关注历史,包括:
[0009]从所述第一用户的搜索日志中提取所述用户搜索历史;
[0010]和/ 或,
[0011]从所述第一用户的发布内容或输入信息中提取所述用户常用词汇。
[0012]可选的,所述使用用户关注历史对所述第一用户接收到的社交网络信息进行关键词匹配之前,还包括:
[0013]对所述第一用户接收到的社交网络信息进行信息过滤。
[0014]可选的,所述对社交网络信息进行信息过滤,包括:
[0015]获取发送所述社交网络信息的用户标识,判断所述用户标识对应的第二用户是否为被盗用户,若是,则滤除所述社交网络信息;
[0016]和/ 或,
[0017]对所述社交网络信息进行质量评分,若所述社交网络信息的评分值小于标准阈值,则滤除所述社交网络信息。
[0018]可选的,所述使用用户关注历史对所述第一用户接收到的社交网络信息进行关键词匹配之前,还包括:[0019]获取发送所述社交网络信息的用户标识,判断所述用户标识对应的第二用户是否为所述第一用户的关注用户,若否,则滤除所述社交网络信息。
[0020]可选的,所述使用用户关注历史对所述第一用户接收到的社交网络信息进行关键词匹配之后,还包括:
[0021]根据所述关键词匹配的匹配结果对所述社交网络信息进行匹配评分,得到匹配值。
[0022]可选的,所述根据所述关键词匹配的匹配结果对所述社交网络信息进行匹配评分之前,包括:
[0023]获取发送所述社交网络信息的用户标识,判断所述用户标识对应的第二用户是否为所述第一用户的关注用户;
[0024]所述根据所述关键词匹配的匹配结果对所述社交网络信息进行匹配评分,包括:
[0025]根据所述关注用户的判断结果以及所述关键词匹配的匹配结果对所述社交网络信息分别进行匹配评分,将两个得到所述匹配评分的结果相加,得到匹配值;
[0026]或,
[0027]根据所述关注用户的判断结果为所述社交网络信息设置好友权重值,根据所述关键词匹配的匹配结果对所述社交网络信息进行匹配评分,将所述好友权重值与所述匹配评分的结果相乘,得到匹配值。
[0028]可选的,所述根据关键词匹配的匹配结果推送所述社交网络信息,包括:
[0029]判断所述匹配值是否大于匹配阈值,若是,则推送所述社交网络信息,若否,则不推送所述社交网络信息。
[0030]可选的,所述根据关键词匹配的匹配结果推送所述社交网络信息,包括:
[0031]根据所述匹配值对所述社交网络信息进行排序,推送所述匹配值最高的前N个所述社交网络信息,所述N为大于零的正整数。
[0032]可选的,所述根据关键词匹配的匹配结果推送所述社交网络信息之后,还包括:
[0033]判断发送所述社交网络信息的第二用户是否匿名,若是,则当所述第一用户回复所述社交网络信息时,向第一用户推送匿名回复选择界面,所述匿名回复选择界面用于提示所述第一用户是否选择对所述社交网络信息进行匿名回复。
[0034]本发明实施例提供的信息筛选装置,包括:
[0035]获取单元,用于获取第一用户的用户关注历史;
[0036]匹配单元,用于使用所述用户关注历史对所述第一用户接收到的社交网络信息进行关键词匹配;
[0037]推送单元,用于根据所述关键词匹配的匹配结果推送所述社交网络信息。
[0038]可选的,所述用户关注历史包括:用户搜索历史,和/或用户常用词汇。
[0039]所述获取单元包括:
[0040]第一获取模块用于从所述第一用户的搜索日志中提取所述用户搜索历史;
[0041]和/或,第二获取模块用于从所述第一用户的发布内容或输入信息中提取所述用户常用词汇。
[0042]可选的,所述装置还包括:
[0043]信息过滤单元,用于对所述第一用户接收到的社交网络信息进行信息过滤。[0044]可选的,所述信息过滤单元包括:
[0045]盗号过滤单元,用于获取发送所述社交网络信息的用户标识,判断所述用户标识对应的第二用户是否为被盗用户,若是,则滤除所述社交网络信息;
[0046]和/ 或,
[0047]质量过滤单元,用于对所述社交网络信息进行质量评分,若所述社交网络信息的评分值小于标准阈值,则滤除所述社交网络信息。
[0048]可选的,所述装置还包括:
[0049]好友过滤单元,用于获取发送所述社交网络信息的用户标识,判断所述用户标识对应的第二用户是否为所述第一用户的关注用户,若否,则滤除所述社交网络信息。
[0050]可选的,所述装置还包括:
[0051]匹配评分单元,用于根据所述关键词匹配的匹配结果对所述社交网络信息进行匹配评分,得到匹配值。
[0052]可选的,所述推送单元包括:
[0053]第一推送模块,用于判断所述匹配值是否大于匹配阈值,若是,则推送所述社交网络信息,若否,则不推送所述社交网络信息。
[0054]或,
[0055]第二推送模块,用于根据所述匹配值对所述社交网络信息进行排序,推送所述匹配值最高的前N个所述社交网络信息,所述N为大于零的正整数。
[0056]可选的,所述装置还包括:
[0057]匿名回复单元,用于判断发送所述社交网络信息的第二用户是否匿名,若是,则当所述第一用户回复所述社交网络信息时,向第一用户推送匿名回复选择界面,所述匿名回复选择界面用于提示所述第一用户是否选择对所述社交网络信息进行匿名回复。
[0058]从以上技术方案可以看出,本发明实施例具有以下优点:
[0059]本发明实施例会获取用户关注历史,使用用户关注历史对所述第一用户接收到的社交网络信息进行关键词匹配,再根据关键词匹配的匹配结果推送所述社交网络信息;由于用户关注历史有很强的用户兴趣指向性,因此,以用户关注历史作为关键词对社交网络信息进行匹配的结果,能够较为准确的反应出用户感兴趣的内容,从而能够有效地对接收到的社交网络信息进行筛选,提高了用户查阅以及回复社交网络信息的效率。
【专利附图】

【附图说明】
[0060]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0061]图1是本发明实施例信息筛选方法的一个流程示意图;
[0062]图2是本发明实施例信息筛选方法的另一个流程示意图;
[0063]图3是本发明实施例信息筛选方法的另一个流程示意图;
[0064]图4是本发明实施例信息筛选方法的另一个流程示意图;
[0065]图5是本发明实施例信息筛选装置的逻辑结构示意图。【具体实施方式】
[0066]本发明实施例提供了一种信息筛选方法及装置,用于为用户筛选在社交网络中接收到的信息。
[0067]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0068]请参阅图1,本发明实施例中信息筛选方法的一个实施例包括:
[0069]101、获取第一用户的用户关注历史;
[0070]信息筛选装置获取第一用户的用户关注历史;所述用户关注历史用于指示所述第一用户的兴趣以及其所关注的信息。
[0071]可选的,所述用户关注历史具体可以为:用户搜索历史,和/或用户常用词汇。
[0072]示例性的,信息筛选装置可以从所述第一用户的搜索日志中提取所述用户搜索历史;进一步的,还可以对提取到的用户搜索历史进行数据筛选,去除无实际意义的词汇和有搜索无点击的数据。
[0073]示例性的,信息筛选装置可以从所述第一用户的发布内容或输入信息中提取所述用户常用词汇;具体的,所述发布内容可以为所述第一用户原创的或转发的博文,第一用户可以设定一个使用频率阈值,当一个实体词在该用户的发布内容或输入信息(具体可以从聊天记录中获取用户的输入信息)中出现的次数超过该使用频率阈值时,则可以确定该实体词为所述用户常用词汇;所述实体词指的是具有实际含义的词汇,可以包括名称、动词或动宾短语。
[0074]上述信息筛选装置为具有本发明实施例所述的信息筛选方法的功能的软件单元,可以一个软件中的功能模块,也可以以单独软件的形式或以插件的形式存在。
[0075]可以理解的是,在本发明实施例中的第一用户是相对于第二用户而言的,即第一用户仅表示当前对目标社交网络应用的账号进行信息筛选的用户,而第二用户则指的是发送所述社交网络信息的用户;其中,“第一”和“第二”没有任何大小、程度或次序上的含义。
[0076]102、使用所述用户关注历史对所述第一用户接收到的社交网络信息进行关键词匹配;
[0077]信息筛选装置使用所述用户关注历史对所述第一用户接收到的社交网络信息进行关键词匹配,所述社交网络信息可以为以问题或叙述形成存在的文字内容,也可以为呼叫或提示用户关注的内容(如,微博中的功能)。
[0078]示例性的,信息筛选装置可以使用所述用户关注历史逐条地对所有接收到的社交网络信息进行关键词匹配,当某条社交网络信息中出现所述用户关注历史中所提到的关键词时,可以初步的确认该社交网络信息匹配成功;进一步的,还可以通过评分或计数的方式记录一条社交网络信息被不同的关键词匹配成功的次数。
[0079]103、根据所述关键词匹配的匹配结果推送所述社交网络信息。
[0080]信息筛选装置根据所述关键词匹配的匹配结果推送所述社交网络信息,其中,推送的方式可以为有选择性推送(如,匹配成功则推送),或按优先级的次序依次推送(如,根据评分或计数值排序,再按排序的结果依次推送)可以理解的是,在实际应用中还有其它的推送方式,具体可以根据用户的需求而定,此处不作限定。
[0081]本发明实施例会获取用户关注历史,使用用户关注历史对所述第一用户接收到的社交网络信息进行关键词匹配,再根据关键词匹配的匹配结果推送所述社交网络信息;由于用户关注历史有很强的用户兴趣指向性,因此,以用户关注历史作为关键词对社交网络信息进行匹配的结果,能够较为准确的反应出用户感兴趣的内容,从而能够有效地对接收到的社交网络信息进行筛选,提高了用户查阅以及回复社交网络信息的效率。
[0082]本发明实施例中还进一步的提供了其它的社交网络信息的筛选条件,具体请参阅图2,本发明实施例中信息筛选方法的另一个实施例包括:
[0083]201、获取第一用户的用户关注历史;
[0084]信息筛选装置获取第一用户的用户关注历史;所述用户关注历史用于指示所述第一用户的兴趣以及其所关注的信息。具体的,为了提高数据检索的速度,可以使用key-value (一种分布式存储系统查询方式)的形式保存用户的关注历史,但不限于此种方式。
[0085]可选的,所述用户关注历史具体可以为:用户搜索历史,和/或用户常用词汇。
[0086]示例性的,信息筛选装置可以从所述第一用户的搜索日志中提取所述用户搜索历史;进一步的,还可以对提取到的用户搜索历史进行数据筛选,去除无实际意义的词汇和有搜索无点击的数据。
[0087]示例性的,信息筛选装置可以从所述第一用户的发布内容或输入信息中提取所述用户常用词汇;具体的,所述发布内容可以为所述第一用户原创的或转发的博文,第一用户可以设定一个使用频率阈值,当一个实体词在该用户的发布内容或输入信息中出现的次数超过该使用频率阈值时,则可以确定该实体词为所述用户常用词汇;所述实体词指的是具有实际含义的词汇,可以包括名称、动词或动宾短语。
[0088]示例性的,信息筛选装置还可以设置关键词的评分机制,当一个实体词的分值大于或等于某一阈值时,就可以确定该实体词为关键词。如,History (i) = a *soso (i) + β *weibo (i) ; α , β 为参数;soso(i)为根据用户的搜索历史的打分函数,soso(i)的一种最简单形式为soso(i)=x, x为用户搜索的次数;weibo(i)为根据用户的历史微博博文的打分函数,weibo(i)的一种最简单形式为weibo(i)=X,X为用户微博中出现该词的次数;当α+β=1时,若α=1、β=0,则该词只在搜索历史中存在,没有在历史微博博文中的存在;若α=0、β=1,则该词只在历史微博博文中存在,没有在搜索历史中的存在。当搜索日志中的实体词和微博的实体词有包含关系时,以信息量大的实体词为准。
[0089]上述用户搜索历史和用户常用词汇的确定步骤为数据准备过程,可以离线执行,进一步的,还可以设置每隔预置周期确定一次。
[0090]202、对所述第一用户接收到的社交网络信息进行信息过滤;
[0091]可选的,信息筛选装置可以对所述第一用户接收到的社交网络信息进行信息过滤;具体的,需要过滤的社交网络信息可以为被盗号的用户所发出的社交网络信息,和/或,质量评分低于标准预置的社交网络信息。
[0092]示例性的,信息筛选装置可以获取发送所述社交网络信息的用户标识,判断所述用户标识对应的第二用户是否为被盗用户,若是,则滤除所述社交网络信息;在实际应用中,通过一些网络的惯用手段(如,判断是否在常用网络地址登陆,是否频繁发消息等)可以判断出所述第二用户是否有被盗号的嫌疑,由于被盗号的社交网络账号一般只会发生一些垃圾信息(如,广告、带有木马或病毒的链接网址、欺诈信息等),因此,可以对这类社交网络信息进行过滤。
[0093]所述用户标识可以为用户账号(如,微博账号)、用户邮箱或用户昵称等。
[0094]示例性的,信息筛选装置可以对所述社交网络信息进行质量评分,若所述社交网络信息的评分值小于标准阈值,则滤除所述社交网络信息。用户可以设置一些流行的或自定义的规则(如,社交网络信息的长短,包含的专有名词的数量等)对社交网络信息进行质量评分,为避免搔扰用户,低质量的社交网络信息及广告性质的社交网络信息将不进行推送。对社交网络信息进行打分,本发明中用q_sCOre(X)表示社交网络信息的打分函数。第二用户的社交网络信息用Quest1n,来表示,下标k为第二用户的社交网络信息的序号。当q_score(x)<T时,社交网络信息不会被推送,τ为参数,需根据具体情况取值。
[0095]203、使用所述用户关注历史对滤除后的社交网络信息进行关键词匹配;
[0096]信息筛选装置使用所述用户关注历史对所述第一用户接收到的社交网络信息进行关键词匹配。
[0097]示例性的,信息筛选装置可以使用所述用户关注历史逐条地对所有接收到的社交网络信息进行关键词匹配,当某条社交网络信息中出现所述用户关注历史中所提到的关键词时,可以初步的确认该社交网络信息匹配成功。
[0098]204、根据所述关键词匹配的匹配结果对社交网络信息进行匹配评分;
[0099]信息筛选装置根据所述关键词匹配的匹配结果对所述社交网络信息进行匹配评分,得到匹配值。
[0100]205、根据所述关键词匹配的匹配结果推送所述社交网络信息。
[0101]信息筛选装置根据所述关键词匹配的匹配结果推送所述社交网络信息,其中,推送的方式可以为有选择性推送(如,匹配成功则推送),或按优先级的次序依次推送(如,根据评分或计数值排序,再按排序的结果依次推送)可以理解的是,在实际应用中还有其它的推送方式,具体可以根据用户的需求而定,此处不作限定。
[0102]示例性的,在获取到各个社交网络信息的匹配值之后,信息筛选装置可以判断所述匹配值是否大于匹配阈值,若是,则推送所述社交网络信息,若否,则不推送所述社交网络信息。可选的,信息筛选装置还可以根据所述匹配值对所述社交网络信息进行排序,推送所述匹配值最高的前N个所述社交网络信息,所述N为大于零的正整数,所述N可以根据所述第一用户预设的信息接收数量而定。
[0103]为了便于理解,下面以一具体应用场景对上述的实施例中的信息筛选方法进行具体描述,下面以微博的应用为例,请参阅图3,本发明实施例中信息筛选方法的另一个实施例包括:
[0104]301、获取第一用户的用户关注历史;
[0105]信息筛选装置获取第一用户的用户关注历史;所述用户关注历史用于指示所述第一用户的兴趣以及其所关注的信息。具体的,为了提高数据检索的速度,可以使用key-value (一种分布式存储系统查询方式)的形式保存用户的关注历史,但不限于此种方式。
[0106]可选的,所述用户关注历史具体可以为:用户搜索历史,和/或用户常用词汇。
[0107]示例性的,信息筛选装置可以从所述第一用户的搜索日志中提取所述用户搜索历史;进一步的,还可以对提取到的用户搜索历史进行数据筛选,去除无实际意义的词汇和有搜索无点击的数据。
[0108]示例性的,信息筛选装置可以从所述第一用户的发布内容或输入信息中提取所述用户常用词汇;具体的,所述发布内容可以为所述第一用户原创的或转发的博文,第一用户可以设定一个使用频率阈值,当一个实体词在该用户的发布内容或输入信息中出现的次数超过该使用频率阈值时,则可以确定该实体词为所述用户常用词汇;所述实体词指的是具有实际含义的词汇,可以包括名称、动词或动宾短语。
[0109]示例性的,信息筛选装置还可以设置关键词的评分机制,当一个实体词的分值大于或等于某一阈值时,就可以确定该实体词为关键词。如,History (i) = a *soso (i) + β *weibo (i) ; α , β 为参数;soso(i)为根据用户的搜索历史的打分函数,soso(i)的一种最简单形式为soso(i)=x, x为用户搜索的次数;weibo(i)为根据用户的历史微博博文的打分函数,weibo(i)的一种最简单形式为weibo(i)=X,x为用户微博中出现该词的次数;当α+β=1时,若α=1、β=0,则该词只在搜索历史中存在,没有在历史微博博文中的存在;若α=0、β=1,则该词只在历史微博博文中存在,没有在搜索历史中的存在。当搜索日志中的实体词和微博的实体词有包含关系时,以信息量大的实体词为准。
[0110]上述用户搜索历史和用户常用词汇的确定步骤为数据准备过程,可以离线执行,进一步的,还可以设置每隔预置周期确定一次。
[0111]302、滤除不是所述第一用户的关注用户发送的社交网络信息;
[0112]信息筛选装置获取发送所述社交网络信息的用户标识,判断所述用户标识对应的第二用户是否为所述第一用户的关注用户,若否,则滤除所述社交网络信息。
[0113]可选的,所述用户标识可以为用户账号(如,微博账号)、用户邮箱或用户昵称等。
[0114]示例性的,信息筛选装置可以根据第一用户的登陆账号获取该第一用户的关注用户列表,并用此关注用户列表和所述用户关注历史进行匹配,得到与所述关注用户相关的用户关注历史(简称,好友关注历史)。把第二用户(即发送社交网络信息的用户)的好友关注历史和第二用户的社交网络信息进行匹配,并得到相应的分数。好友关注历史与社交网络信息的匹配分数计算如下:用户关注历史和用户提问的Quest1n,(即第二用户发送的社交网络信息)进行匹配并计算 Match_score 的分值。Match_score (Quest1nk) =match (History (i))表示筛选出好友关注历史中的History (i)能够和Quest1nk匹配上的分数。Match_score (Quest1n,)分数不为O的用户,我们认为是可以进行社交网络信息推送的第二用户。当第二用户的关注用户列表中有多个可以进行社交网络信息推送的第二用户时,优先选择Match_score (Quest1nk)最大的前η名回答者进行推送(η为正整数,可以根据实际情况进行调整)。
[0115]在实际的微博应用中,第一用户往往对自己的关注用户所发出的社交网络信息比较感兴趣,因此可以对不是所述第一用户的关注用户发送的社交网络信息进行过滤。
[0116]303、对所述第一用户接收到的社交网络信息进行信息过滤;[0117]可选的,信息筛选装置可以对所述第一用户接收到的社交网络信息进行信息过滤;具体的,需要过滤的社交网络信息可以为被盗号的用户所发出的社交网络信息,和/或,质量评分低于标准预置的社交网络信息。
[0118]示例性的,信息筛选装置可以获取发送所述社交网络信息的用户标识,判断所述用户标识对应的第二用户是否为被盗用户,若是,则滤除所述社交网络信息;在实际应用中,通过一些网络的惯用手段可以判断出所述第二用户是否有被盗号的嫌疑,由于被盗号的社交网络账号一般只会发生一些垃圾信息(如,广告、带有木马或病毒的链接网址、欺诈信息等),因此,可以对这类社交网络信息进行过滤。
[0119]所述用户标识可以为用户账号(如,微博账号)、用户邮箱或用户昵称等。
[0120]示例性的,信息筛选装置可以对所述社交网络信息进行质量评分,若所述社交网络信息的评分值小于标准阈值,则滤除所述社交网络信息。用户可以设置一些流行的或自定义的规则对社交网络信息进行质量评分,为避免搔扰用户,低质量的社交网络信息及广告性质的社交网络信息将不进行推送。对社交网络信息进行打分,本发明中用q_SCOre(X)表示社交网络信息的打分函数。第二用户的社交网络信息用Quest1n,来表示,下标k为第二用户的社交网络信息的序号。当q_score (X)〈 τ时,社交网络信息不会被推送,τ为参数,需根据具体情况取值。
[0121]可以理解的是,上述步骤302和303没有严格的时序关系,即可以先执行步骤303,后执行步骤302。
[0122]304、使用所述用户关注历史对滤除后的社交网络信息进行关键词匹配;
[0123]信息筛选装置使用所述用户关注历史对所述第一用户接收到的社交网络信息进行关键词匹配。
[0124]示例性的,信息筛选装置可以使用所述用户关注历史逐条地对所有接收到的社交网络信息进行关键词匹配,当某条社交网络信息中出现所述用户关注历史中所提到的关键词时,可以初步的确认该社交网络信息匹配成功。
[0125]305、根据所述关键词匹配的匹配结果对社交网络信息进行匹配评分;
[0126]信息筛选装置根据所述关键词匹配的匹配结果对所述社交网络信息进行匹配评分,得到匹配值。
[0127]306、根据所述关键词匹配的匹配结果推送所述社交网络信息;
[0128]信息筛选装置根据所述关键词匹配的匹配结果推送所述社交网络信息,其中,推送的方式可以为有选择性推送(如,匹配成功则推送),或按优先级的次序依次推送(如,根据评分或计数值排序,再按排序的结果依次推送)可以理解的是,在实际应用中还有其它的推送方式,具体可以根据用户的需求而定,此处不作限定。
[0129]示例性的,在获取到各个社交网络信息的匹配值之后,信息筛选装置可以判断所述匹配值是否大于匹配阈值,若是,则推送所述社交网络信息,若否,则不推送所述社交网络信息。可选的,信息筛选装置还可以根据所述匹配值对所述社交网络信息进行排序,推送所述匹配值最高的前N个所述社交网络信息,所述N为大于零的正整数,所述N可以根据所述第一用户预设的信息接收数量而定。
[0130]307、提示第一用户选择是否匿名回复。
[0131]信息筛选装置判断发送所述社交网络信息的第二用户是否匿名(即获取不到用户标识),若是,则当所述第一用户回复所述社交网络信息时,向第一用户推送匿名回复选择界面,所述匿名回复选择界面用于提示所述第一用户是否选择对所述社交网络信息进行匿名回复。
[0132]在实际应用中,由于有些问题可能是用户不想让其好友知道的,或者好友回答问题时,不想让提问者(即第二用户)知道自己也遇到过相似问题时,用户可以选择匿名提问,回答者(即第一用户)也可以选择匿名回答。当提问者是匿名提问时向回答者推送时,回答者侧仅提示该问题为其好友所提,但不显示好友具体昵称。当提问者是非匿名提问时,回答者侧显示问题为其好友某某所提。
[0133]在实际的微博应用中,可能出现第二用户非第一用户的关注用户,但该第二用户发送的社交网络信息却是该第一用户非常感兴趣的内容或非常有价值的问题,但图3实施例的方法却会将这种该第一用户非常感兴趣的内容或非常有价值的问题给滤除,为了避免这种情况,本发明实施例提出了相应的解决方案,请参阅图4,本发明实施例中信息筛选方法的另一个实施例包括:
[0134]401、获取第一用户的用户关注历史;
[0135]信息筛选装置获取第一用户的用户关注历史;所述用户关注历史用于指示所述第一用户的兴趣以及其所关注的信息。具体的,为了提高数据检索的速度,可以使用key-value (一种分布式存储系统查询方式)的形式保存用户的关注历史,但不限于此种方式。
[0136]可选的,所述用户关注历史具体可以为:用户搜索历史,和/或用户常用词汇。
[0137]示例性的,信息筛选装置可以从所述第一用户的搜索日志中提取所述用户搜索历史;进一步的,还可以对提取到的用户搜索历史进行数据筛选,去除无实际意义的词汇和有搜索无点击的数据。
[0138]示例性的,信息筛选装置可以从所述第一用户的发布内容或输入信息中提取所述用户常用词汇;具体的,所述发布内容可以为所述第一用户原创的或转发的博文,第一用户可以设定一个使用频率阈值,当一个实体词在该用户的发布内容或输入信息中出现的次数超过该使用频率阈值时,则可以确定该实体词为所述用户常用词汇;所述实体词指的是具有实际含义的词汇,可以包括名称、动词或动宾短语。
[0139]示例性的,信息筛选装置还可以设置关键词的评分机制,当一个实体词的分值大于或等于某一阈值时,就可以确定该实体词为关键词。如,History (i) = a *soso (i) + β *weibo (i) ; α , β 为参数;soso(i)为根据用户的搜索历史的打分函数,soso(i)的一种最简单形式为soso(i)=x, x为用户搜索的次数;weibo(i)为根据用户的历史微博博文的打分函数,weibo(i)的一种最简单形式为weibo(i)=X,X为用户微博中出现该词的次数;当α+β=1时,若α=1、β=0,则该词只在搜索历史中存在,没有在历史微博博文中的存在;若α=0、β=1,则该词只在历史微博博文中存在,没有在搜索历史中的存在。当搜索日志中的实体词和微博的实体词有包含关系时,以信息量大的实体词为准。
[0140]上述用户搜索历史和用户常用词汇的确定步骤为数据准备过程,可以离线执行,进一步的,还可以设置每隔预置周期确定一次。
[0141]402、对所述第一用户接收到的社交网络信息进行信息过滤;[0142]可选的,信息筛选装置可以对所述第一用户接收到的社交网络信息进行信息过滤;具体的,需要过滤的社交网络信息可以为被盗号的用户所发出的社交网络信息,和/或,质量评分低于标准预置的社交网络信息。
[0143]示例性的,信息筛选装置可以获取发送所述社交网络信息的用户标识,判断所述用户标识对应的第二用户是否为被盗用户,若是,则滤除所述社交网络信息;在实际应用中,通过一些网络的惯用手段可以判断出所述第二用户是否有被盗号的嫌疑,由于被盗号的社交网络账号一般只会发生一些垃圾信息(如,广告、带有木马或病毒的链接网址、欺诈信息等),因此,可以对这类社交网络信息进行过滤。
[0144]所述用户标识可以为用户账号(如,微博账号)、用户邮箱或用户昵称等。
[0145]示例性的,信息筛选装置可以对所述社交网络信息进行质量评分,若所述社交网络信息的评分值小于标准阈值,则滤除所述社交网络信息。用户可以设置一些流行的或自定义的规则对社交网络信息进行质量评分,为避免搔扰用户,低质量的社交网络信息及广告性质的社交网络信息将不进行推送。对社交网络信息进行打分,本发明中用q_SCOre(X)表示社交网络信息的打分函数。第二用户的社交网络信息用Quest1n,来表示,下标k为第二用户的社交网络信息的序号。当q_score (X)〈 τ时,社交网络信息不会被推送,τ为参数,需根据具体情况取值。
[0146]403、确定第二用户是否为所述第一用户的关注用户;
[0147]获取发送所述社交网络信息的用户标识,判断所述用户标识对应的第二用户是否为所述第一用户的关注用户。
[0148]404、使用所述用户关注历史对滤除后的社交网络信息进行关键词匹配;
[0149]信息筛选装置使用所述用户关注历史对所述第一用户接收到的社交网络信息进行关键词匹配。
[0150]示例性的,信息筛选装置可以使用所述用户关注历史逐条地对所有接收到的社交网络信息进行关键词匹配,当某条社交网络信息中出现所述用户关注历史中所提到的关键词时,可以初步的确认该社交网络信息匹配成功。
[0151]405、根据所述关键词匹配的匹配结果和关注用户的判定结果对社交网络信息进行匹配评分;
[0152]可选的,信息筛选装置可以根据所述关注用户的判断结果以及所述关键词匹配的匹配结果对所述社交网络信息分别进行匹配评分,将两个得到所述匹配评分的结果相加,得到匹配值。如,若发送所述社交网络信息的第二用户为第一用户的关注用户,则给予所述社交网络信息50分,假设该社交网络信息的关键词匹配的评分为100分,则最后该社交网络信息的匹配值为150分。
[0153]可选的,信息筛选装置也可以根据所述关注用户的判断结果为所述社交网络信息设置好友权重值,根据所述关键词匹配的匹配结果对所述社交网络信息进行匹配评分,将所述好友权重值与所述匹配评分的结果相乘,得到匹配值。如,假设,若第二用户为第一用户的关注用户,则为所述社交网络信息设置1.3的好友权重值;若第二用户不是第一用户的关注用户,则为所述社交网络信息设置I的好友权重值;假设该社交网络信息的关键词匹配的评分为100分,发送所述社交网络信息的第二用户为第一用户的关注用户,则最后该社交网络信息的匹配值为130分。[0154]406、根据所述关键词匹配的匹配结果推送所述社交网络信息。
[0155]信息筛选装置根据所述关键词匹配的匹配结果推送所述社交网络信息,其中,推送的方式可以为有选择性推送(如,匹配成功则推送),或按优先级的次序依次推送(如,根据评分或计数值排序,再按排序的结果依次推送)可以理解的是,在实际应用中还有其它的推送方式,具体可以根据用户的需求而定,此处不作限定。
[0156]示例性的,在获取到各个社交网络信息的匹配值之后,信息筛选装置可以判断所述匹配值是否大于匹配阈值,若是,则推送所述社交网络信息,若否,则不推送所述社交网络信息。可选的,信息筛选装置还可以根据所述匹配值对所述社交网络信息进行排序,推送所述匹配值最高的前N个所述社交网络信息,所述N为大于零的正整数,所述N可以根据所述第一用户预设的信息接收数量而定。
[0157]上面仅以一些例子对本发明实施例中的应用场景进行了说明,可以理解的是,在实际应用中,还可以有更多的应用场景,具体此处不作限定。
[0158]下面对用于执行上述信息筛选方法的本发明信息筛选装置的实施例进行说明,其逻辑结构请参考图5,本发明实施例中的信息筛选装置一个实施例包括:
[0159]获取单元501,用于获取第一用户的用户关注历史;
[0160]匹配单元502,用于使用所述用户关注历史对所述第一用户接收到的社交网络信息进行关键词匹配;
[0161]推送单元503,用于根据所述关键词匹配的匹配结果推送所述社交网络信息。
[0162]可选的,所述用户关注历史包括:用户搜索历史,和/或用户常用词汇。
[0163]所述获取单元501包括:
[0164]第一获取模块5011用于从所述第一用户的搜索日志中提取所述用户搜索历史;
[0165]和/或,第二获取模块5012用于从所述第一用户的发布内容或输入信息中提取所述用户常用词汇。
[0166]可选的,本发明实施例中的信息过滤装置还包括:
[0167]信息过滤单元504,用于对所述第一用户接收到的社交网络信息进行信息过滤。
[0168]可选的,本发明实施例中的所述信息过滤单元504包括:
[0169]盗号过滤单元5041,用于获取发送所述社交网络信息的用户标识,判断所述用户标识对应的第二用户是否为被盗用户,若是,则滤除所述社交网络信息;
[0170]和/ 或,
[0171]质量过滤单元5042,用于对所述社交网络信息进行质量评分,若所述社交网络信息的评分值小于标准阈值,则滤除所述社交网络信息。
[0172]可选的,本发明实施例中的信息过滤装置还包括:
[0173]好友过滤单元505,用于获取发送所述社交网络信息的用户标识,判断所述用户标识对应的第二用户是否为所述第一用户的关注用户,若否,则滤除所述社交网络信息。
[0174]可选的,本发明实施例中的信息过滤装置还包括:
[0175]匹配评分单元506,用于根据所述关键词匹配的匹配结果对所述社交网络信息进行匹配评分,得到匹配值。
[0176]可选的,本发明实施例中的推送单元503包括:
[0177]第一推送模块5031,用于判断所述匹配值是否大于匹配阈值,若是,则推送所述社交网络信息,若否,则不推送所述社交网络信息。
[0178]或,
[0179]第二推送模块5032,用于根据所述匹配值对所述社交网络信息进行排序,推送所述匹配值最高的前N个所述社交网络信息,所述N为大于零的正整数。
[0180]可选的,本发明实施例中的信息过滤装置还包括:
[0181]匿名回复单元507,用于判断发送所述社交网络信息的第二用户是否匿名,若是,则当所述第一用户回复所述社交网络信息时,向第一用户推送匿名回复选择界面,所述匿名回复选择界面用于提示所述第一用户是否选择对所述社交网络信息进行匿名回复。
[0182]上述各个单元/模块的具体操作过程请参阅方法实施例,此处不再赘述。
[0183]本发明实施例的信息过滤装置会获取用户关注历史,使用用户关注历史对所述第一用户接收到的社交网络信息进行关键词匹配,再根据关键词匹配的匹配结果推送所述社交网络信息;由于用户关注历史有很强的用户兴趣指向性,因此,以用户关注历史作为关键词对社交网络信息进行匹配的结果,能够较为准确的反应出用户感兴趣的内容,从而能够有效地对接收到的社交网络信息进行筛选,提高了用户查阅以及回复社交网络信息的效率。
[0184]在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0185]所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0186]另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0187]所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM, Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0188]以上所述,仅为本发明的【具体实施方式】,但本发明的保护范围并不局限于此,任何熟悉本【技术领域】的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
【权利要求】
1.一种信息筛选方法,其特征在于,包括: 获取第一用户的用户关注历史; 使用所述用户关注历史对所述第一用户接收到的社交网络信息进行关键词匹配; 根据所述关键词匹配的匹配结果推送所述社交网络信息。
2.根据权利要求1所述的方法,其特征在于,所述用户关注历史包括: 用户搜索历史,和/或用户常用词汇。
3.根据权利要求2所述的方法,其特征在于,所述获取第一用户的用户关注历史,包括: 从所述第一用户的搜索日志中提取所述用户搜索历史; 和/或, 从所述第一用户的发布内容或输入信息中提取所述用户常用词汇。
4.根据权利要求1所述的方法,其特征在于,所述使用用户关注历史对所述第一用户接收到的社交网络信息进行关键词匹配之前,还包括: 对所述第一用户接 收到的社交网络信息进行信息过滤。
5.根据权利要求4所述的方法,其特征在于,所述对社交网络信息进行信息过滤,包括: 获取发送所述社交网络信息的用户标识,判断所述用户标识对应的第二用户是否为被盗用户,若是,则滤除所述社交网络信息; 和/或, 对所述社交网络信息进行质量评分,若所述社交网络信息的评分值小于标准阈值,则滤除所述社交网络信息。
6.根据权利要求1所述的方法,其特征在于,所述使用用户关注历史对所述第一用户接收到的社交网络信息进行关键词匹配之前,还包括: 获取发送所述社交网络信息的用户标识,判断所述用户标识对应的第二用户是否为所述第一用户的关注用户,若否,则滤除所述社交网络信息。
7.根据权利要求1所述的方法,其特征在于,所述使用用户关注历史对所述第一用户接收到的社交网络信息进行关键词匹配之后,还包括: 根据所述关键词匹配的匹配结果对所述社交网络信息进行匹配评分,得到匹配值。
8.根据权利要求7所述的方法,其特征在于,所述根据所述关键词匹配的匹配结果对所述社交网络信息进行匹配评分之前,包括: 获取发送所述社交网络信息的用户标识,判断所述用户标识对应的第二用户是否为所述第一用户的关注用户; 所述根据所述关键词匹配的匹配结果对所述社交网络信息进行匹配评分,包括:根据所述关注用户的判断结果以及所述关键词匹配的匹配结果对所述社交网络信息分别进行匹配评分,将两个得到所述匹配评分的结果相加,得到匹配值; 或, 根据所述关注用户的判断结果为所述社交网络信息设置好友权重值,根据所述关键词匹配的匹配结果对所述社交网络信息进行匹配评分,将所述好友权重值与所述匹配评分的结果相乘,得到匹配值。
9.根据权利要求7或8所述的方法,其特征在于,所述根据关键词匹配的匹配结果推送所述社交网络信息,包括: 判断所述匹配值是否大于匹配阈值,若是,则推送所述社交网络信息,若否,则不推送所述社交网络信息。
10.根据权利要求7或8所述的方法,其特征在于,所述根据关键词匹配的匹配结果推送所述社交网络信息,包括: 根据所述匹配值对所述社交网络信息进行排序,推送所述匹配值最高的前N个所述社交网络信息,所述N为大于零的正整数。
11.根据权利要求1至8任意一项所述的方法,其特征在于,所述根据关键词匹配的匹配结果推送所述社交网络信息之后,还包括: 判断发送所述社交网络信息的第二用户是否匿名,若是,则当所述第一用户回复所述社交网络信息时,向第一用户推送匿名回复选择界面,所述匿名回复选择界面用于提示所述第一用户是否选择对所述社交网络信息进行匿名回复。
12.一种信息筛选装置,其特征在于,包括: 获取单元,用于获取第一用户的用户关注历史; 匹配单元,用于使用所述用户关注历史对所述第一用户接收到的社交网络信息进行关键词匹配; 推送单元,用于根据所述关键词匹配的匹配结果推送所述社交网络信息。
13.根据权利要求12所述的装置,其特征在于,所述用户关注历史包括:用户搜索历史,和/或用户常用词汇。 所述获取单元包括: 第一获取模块用于从所述第一用户的搜索日志中提取所述用户搜索历史; 和/或,第二获取模块用于从所述第一用户的发布内容或输入信息中提取所述用户常用词汇。
14.根据权利要求12所述的装置,其特征在于,所述装置还包括: 信息过滤单元,用于对所述第一用户接收到的社交网络信息进行信息过滤。
15.根据权利要求14所述的装置,其特征在于,所述信息过滤单元包括: 盗号过滤单元,用于获取发送所述社交网络信息的用户标识,判断所述用户标识对应的第二用户是否为被盗用户,若是,则滤除所述社交网络信息; 和/或, 质量过滤单元,用于对所述社交网络信息进行质量评分,若所述社交网络信息的评分值小于标准阈值,则滤除所述社交网络信息。
16.根据权利要求12所述的装置,其特征在于,所述装置还包括: 好友过滤单元,用于获取发送所述社交网络信息的用户标识,判断所述用户标识对应的第二用户是否为所述第一用户的关注用户,若否,则滤除所述社交网络信息。
17.根据权利要求12所述的装置,其特征在于,所述装置还包括: 匹配评分单元,用于根据所述关键词匹配的匹配结果对所述社交网络信息进行匹配评分,得到匹配值。
18.根据权利要求17所述的装置,其特征在于,所述推送单元包括:第一推送模块,用于判断所述匹配值是否大于匹配阈值,若是,则推送所述社交网络信息,若否,则不推送所述社交网络信息。 或, 第二推送模块,用于根据所述匹配值对所述社交网络信息进行排序,推送所述匹配值最高的前N个所述社交网络信息,所述N为大于零的正整数。
19.根据权利要求12至17任意一项所述的装置,其特征在于,所述装置还包括:匿名回复单元,用于判断发送所述社交网络信息的第二用户是否匿名,若是,则当所述第一用户回复所述社交网络信息时,向第一用户推送匿名回复选择界 面,所述匿名回复选择界面用于提示所述第一用户是否选择对所述社交网络信息进行匿名回复。
【文档编号】G06F17/30GK104035941SQ201310073617
【公开日】2014年9月10日 申请日期:2013年3月8日 优先权日:2013年3月8日
【发明者】程刚, 赵艳, 林松, 潘璇, 庄子明, 王谷丹, 周霄骁, 李鹤, 芦方 申请人:腾讯科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1