网络社区交互方法、装置及网络社区平台的制作方法

文档序号:6502379阅读:140来源:国知局
网络社区交互方法、装置及网络社区平台的制作方法
【专利摘要】本发明涉及一种网络社区交互方法、装置及网络社区平台,其方法包括:对提问者在网络社区平台提出的当前问题进行挖掘分类,获取分类信息;根据分类信息,获取对应分类的历史问题;计算获取历史问题与当前问题的相似度,并计算获取所述问题相似度排名靠前的前预定数量的历史问题对应的答案与当前问题的相关性,将相关性最高的历史问题对应的答案作为智能推荐答案;将智能推荐答案推送给提问者。本发明可以使提问者快速获取问题答案,提高问答社区问题答案匹配准确率以及用户活跃度;此外,还可以使用户通过在线求助获得问题答案,更进一步提高了提问问题的解答效率,并能够增进用户之间的互动,进一步提高问答社区用户的活跃度。
【专利说明】网络社区交互方法、装置及网络社区平台

【技术领域】
[0001]本发明涉及互联网【技术领域】,尤其涉及一种网络社区交互方法、装置及网络社区
T D ο

【背景技术】
[0002]在互联网中,一些问答社区(比如qq问问、微博社区、朋友网等)可以提供问答类服务,用户可以在问答社区中提出自己的问题,由问答社区提供相应的答案。对于互联网社区而言,其问问主题涵盖女性、娱乐、汽车、体育、文化、生活、社会、时事、历史、文学、情感、旅游、星座等各项领域。
[0003]通常用户都希望在提出问题后,可以快速得到解答。目前,一些问答社区虽然可以快速推荐答案,但大都是根据问题题干来进行关键词匹配,其匹配准确率低,使得用户满意度也比较低,而且问题覆盖率也较低。


【发明内容】

[0004]本发明实施例的主要目的在于提供一种网络社区交互方法、装置及网络社区平台,旨在提高问答社区问题答案匹配准确率以及用户活跃度。
[0005]为了达到上述目的,本发明实施例提出一种网络社区交互方法,包括:
[0006]对提问者在网络社区平台提出的当前问题进行挖掘分类,获取分类信息;
[0007]根据所述分类信息,获取对应分类的历史问题;
[0008]计算获取所述历史问题与当前问题的相似度,并计算获取所述问题相似度排名靠前的前预定数量的历史问题对应的答案与当前问题的相关性,将相关性最高的历史问题对应的答案作为智能推荐答案;
[0009]将所述智能推荐答案推送给提问者。
[0010]本发明实施例还提出一种网络社区交互装置,包括:
[0011]分类模块,用于对提问者在网络社区平台提出的当前问题进行挖掘分类,获取分类信息;
[0012]历史问题获取模块,用于根据所述分类信息,获取对应分类的历史问题;
[0013]计算获取模块,用于计算获取所述历史问题与当前问题的相似度,并计算获取所述问题相似度排名靠前的前预定数量的历史问题对应的答案与当前问题的相关性,将相关性最高的历史问题对应的答案作为智能推荐答案;
[0014]推送模块,用于将所述智能推荐答案推送给提问者。
[0015]本发明实施例还提出一种网络社区平台,包括如上所述的装置。
[0016]本发明实施例提出的一种网络社区交互方法、装置及网络社区平台,通过对提问者在网络社区平台提出的当前问题进行挖掘分类,获取分类信息;根据所述分类信息,获取对应分类的历史问题;计算获取所述历史问题与当前问题的相似度,并计算获取所述问题相似度排名靠前的前预定数量的历史问题对应的答案与当前问题的相关性,将相关性最高的历史问题对应的答案作为智能推荐答案推送给提问者,由此可以使提问者快速获取问题答案,提高问答社区问题答案匹配准确率以及用户活跃度;此外,还可以使用户通过在线求助获得问题答案,更进一步提高了提问问题的解答效率,并能够增进用户之间的互动,进一步提高问答社区用户的活跃度。

【专利附图】

【附图说明】
[0017]图1是本发明网络社区交互方法第一实施例的流程示意图;
[0018]图2a是本发明实施例向用户展示推荐答案的一个具体实例示意图;
[0019]图2b是本发明实施例中计算获取所述历史问题与当前问题的相似度,并计算获取所述问题相似度排名靠前的前预定数量的历史问题对应的答案与当前问题的相关性,将相关性最高的历史问题对应的答案作为智能推荐答案的流程示意图;
[0020]图3是本发明网络社区交互方法第二实施例的流程示意图;
[0021]图4a是本发明实施例中向提问者推送在线求助对象的流程示意图;
[0022]图4b是本发明实施例中一种选择求助对象的实例示意图;
[0023]图5是本发明网络社区交互方法第三实施例的流程示意图;
[0024]图6是本发明网络社区交互方法第四实施例的流程示意图;
[0025]图7是本发明网络社区交互装置第一实施例的结构示意图;
[0026]图8是本发明实施例中计算获取模块的一种结构示意图;
[0027]图9是本发明实施例中计算获取模块的另一种结构示意图;
[0028]图10是本发明实施例中推送模块的一种结构示意图;
[0029]图11是本发明网络社区交互装置第二实施例的结构示意图。
[0030]为了使本发明的技术方案更加清楚、明了,下面将结合附图作进一步详述。

【具体实施方式】
[0031]本发明实施例解决方案主要是:通过对提问者在网络社区平台提出的当前问题进行挖掘分类,获取分类信息;根据分类信息,获取对应分类的历史问题;计算获取历史问题与当前问题的相似度,并计算获取问题相似度排名靠前的前预定数量的历史问题对应的答案与当前问题的相关性,将相关性最高的历史问题对应的答案作为智能推荐答案推送给提问者,由此可以使提问者快速获取问题答案,提高问答社区问题答案匹配准确率以及用户活跃度;此外,还可以使用户通过在线求助获得问题答案,更进一步提高提问问题的解答效率,并能够增进用户之间的互动。
[0032]如图1所示,本发明第一实施例提出一种网络社区交互方法,包括:
[0033]步骤S101,对提问者在网络社区平台提出的当前问题进行挖掘分类,获取分类信息;
[0034]其中,网络社区平台是指为用户提供问答类服务的社区平台,比如qq问问或者其他具有“提问-回答”特征的问答类社区或产品。
[0035]提问者是指在问问社区中提出问题的人。
[0036]为了对提问者提出的问题快速推荐答案,本实施例首先针对提问者提出的当前问题,根据问题的问题题干(即问题标题)和问题内容进行分类(提问者也可以自己修改分类),以获取分类信息,该分类信息包括当前问题的类型,比如化妆品类、娱乐类等等。
[0037]其中,对提问者提出的当前问题进行分类的方式可以包括但不限于以下几种:米用 SVM (SupportVectorMachine,向量机支持向量机)、KNN (k-Nearest Neighboralg0rithm,K最邻近结点算法)或线性分类等模型进行分类,或者根据当前问题所包含的词进行分类。
[0038]其中,根据当前问题所包含的词进行分类的过程如下:
[0039]预先对各种已知问题进行分词,并基于已知问题所包含的词及各词的分类属性建立词库。之后,对当前问题进行分类时,从当前问题中提取其所包含的词,将当前问题所包括的各词与词库进行匹配,从而得到各词相应的分类属性,然后根据各词的分类属性进行相应的加权计算得到当前问题的分类类型,从而得到分类信息。
[0040]通过SVM、KNN或线性分类等模型进行分类,现有技术已有成熟方案,在此简介如下:
[0041]KNN算法的基本思路是:在给定新文本后,考虑在训练文本集中与该新文本距离最近(最相似)的K篇文本,根据这K篇文本所属的类别判定新文本所属的类别,具体的算法步骤如下:
[0042]一、根据特征项集合重新描述训练文本向量;
[0043]二、在新文本到达后,根据特征词分词新文本,确定新文本的向量表示;
[0044]三、在训练文本集中选出与新文本最相似的K个文本;
[0045]其中,K值的确定目前一般采用先定一个初始值,然后根据实验测试的结果调整K值,一般初始值定为几百到几千之间。
[0046]四、在与新文本最相似的K个文本中,依次计算每类的权重,计算公式如下:
[0047]/m' ) - TSimixJ^ IyidstCi I
[0048]其中,X为新文本的特征向量,Sim(x,di)为相似度,而y(di,Cj)为类别属性函数,即如果di属于类Cj,那么函数值为1,否则为O。
[0049]五、比较类的权重,将新文本分到权重最大的那个类别中。
[0050]除此以外,支持向量机和神经网络算法在文本分类系统中应用得也较为广泛,支持向量机的基本思想是使用简单的线形分类器划分样本空间。对于在当前特征空间中线形不可分的模式,则使用一个核函数把样本映射到一个高维空间中,使得样本能够线形可分。
[0051]而神经网络算法采用感知算法进行分类。在这种模型中,分类知识被隐式地存储在连接的权值上,使用迭代算法来确定权值向量。当网络输出判别正确时,权值向量保持不变,否则进行增加或降低的调整,因此也称为奖惩法。
[0052]具体的分类方式在这里不进行详细阐述。
[0053]步骤S102,根据所述分类信息,获取对应分类的历史问题;
[0054]在获取当前问题的分类信息后,查找对应分类的历史问题,从历史问题中挑选出与当前问题分类相同且具有满意类答案的历史问题。
[0055]其中,满意类答案是指被历史问题的提问者认可并采纳的答案,或者是由网络社区平台设定的答案,还可以是采用其他方式获取的答案,比如从其他服务器获取的较佳答案等。
[0056]上述历史问题可以从网络社区平台的后台服务器获取,也可以从其他网络服务器获取。
[0057]步骤S103,计算获取所述历史问题与当前问题的相似度,并计算获取所述问题相似度排名靠前的前预定数量的历史问题对应的答案与当前问题的相关性,将相关性最高的历史问题对应的答案作为智能推荐答案;
[0058]步骤S104,将所述智能推荐答案推送给提问者。
[0059]在查找到对应分类的历史问题后,计算历史问题和当前问题的相似度,计算问题相似度排名靠前的前预定数量的历史问题对应的答案与当前问题的相关性,并找到历史问题的满意回答中和当前问题相关性最高的一个作为推荐答案推给提问者。如图2a所示,其为采用本实施例方案向用户展示推荐答案的一个具体实例示意图。
[0060]具体地,如图2b所示,作为一种实施方式,上述步骤S103计算获取所述历史问题与当前问题的相似度,并基于所述相似度获取智能推荐答案可以包括:
[0061]步骤S1031,计算当前问题的题干与历史问题的题干之间的相似度,得到题干相似度;
[0062]本实施例将题干相似度用title_score (quest1n_id)来表示,其中,quest1n_i d为当前问题的唯一标识。
[0063]步骤S1 3 2,计算当前问题的内容与历史问题的内容之间的相似度,得到内容相似度;
[0064]本实施例将问题内容之间的相似度用content_score (quest1n_id)来表示。
[0065]步骤S1033,根据所述题干相似度及内容相似度计算获取问题相似度;
[0066]这里将问题相似度用Quest1n_like_score (quest1n_id)来进行表示,
[0067]问题相似度公式如下所示:
[0068]Quest1n」ike_score (quest1n_id) = a *title_socre (quest1n_id) + β *content_score (quest1n_id),其中,α 和 β 为系数,并且 α >0, β >0, α+β=1。
[0069]步骤S1034,筛选出问题相似度排名靠前的前预定数量的历史问题及对应的满意类答案,作为候选集;
[0070]选出Quest1n_like_score (quest1n_id)最高的前 η (η>0)个历史问题及答案进入候选集,η为常量视具体情况而定。
[0071]步骤S1035,计算所述当前问题与所述候选集中历史问题的满意类答案的相关性,得到相关性结果;
[0072]当前问题与所述候选集中历史问题的满意类答案的相关性用 quest1n_answer_score (quest1n_id)表示,其计算公式的表现形式可以有很多种。
[0073]步骤S1036,根据所述问题相似度及所述相关性结果计算获取总相关性分数;
[0074]步骤S1037,将所述总相关性分数最高的历史问题对应的满意类答案作为智能推荐答案。
[0075]总相关性分数用Total_score (quest1n_id)表示,其计算公式如下:
[0076]Total_score(quest1n_id)=Quest1n_like_score(quest1n_id) + Y*quest1n_answer_score (quest1n_id),其中,Y 为系数,并且 Y e (0,1]。
[0077]然后,把Total_score(quest1n_id)得分最高的历史问题的满意类答案作为智能推荐答案推荐给提问者。
[0078]以上计算 title_score (quest1n_id)、content_score (quest1n_id)、quest1n_answer_score (quest1n_id)时均可采用计算相关性的方法得到。
[0079]其中,计算文本相关性的方法有很多,例如可以把句子进行分词,然后抽取特征向量,计算特征向量之间的余弦值,由此计算当前问题题干、内容和历史问题题干、内容,以及满意回答之间的相关性;或者,采用计算文本包含的公共子串的方式计算相关性;或者还可以利用tfidf算法来计算问题题干、内容和历史问题题干、内容,以及满意回答之间的相关性。在此不做详细描述。
[0080]此外,需要说明的是,上述总相关性分数Total_score (quest1n_id)需要大于一定的阈值τ时方可向用户推荐,如果不存在大于阈值τ的满意答案时,则不进行智能推荐。这里的τ>0,具体取值视具体情况而定。
[0081]本实施例通过上述方案,对提问者在网络社区平台提出的当前问题进行挖掘分类,获取分类信息;根据所述分类信息,查找对应分类的历史问题;计算获取所述历史问题与当前问题的相似度,并基于所述相似度获取智能推荐答案;将所述智能推荐答案推送给提问者,由此可以使提问者快速获取问题答案,提高问答社区问题答案匹配准确率以及用户活跃度。
[0082]如图3所示,本发明第二实施例提出一种网络社区交互方法,在上述第一实施例的基础上,在上述步骤S103或步骤S104之后还包括:
[0083]步骤S105,当获取不到所述智能推荐答案,或者所述提问者对推荐的智能推荐答案不满意时,向所述提问者推送在线求助对象供所述提问者选择,由所述提问者选择的在线求助对象向所述提问者提供当前问题的答案。
[0084]其中图3是以提问者对推荐的智能推荐答案不满意举例说明。
[0085]本实施例与上述第一实施例的区别在于,本实施例在获取不到智能推荐答案,或者提问者对推荐的智能推荐答案不满意时,提问者可以向在线朋友或其他人求助获取问题答案。
[0086]具体地,在本实施例中,所述在线求助对象为当前已登录网络社区平台且具有满意类答案或可提供推荐答案的用户,该用户可以为所述提问者的关联人,比如qq好友,微博好友等,也可以为其他不相关联的人。
[0087]当网络社区平台找不到可向提问者推荐的满意答案或者找到的满意答案不让提问者满意时,可以让提问者选择向当前在线的相关联的人求助。
[0088]具体地,如图4a所示,上述步骤S105中向提问者推送在线求助对象的步骤可以包括:
[0089]步骤S1051,根据所述提问者在所述网络社区平台的登录用户标识,获取所述提问者的关联人列表;
[0090]其中,用户标识用户是用户的唯一标识id,可以是qq号等。
[0091]步骤S1052,根据所述提问者的关联人的在线状况,从所述关联人列表中获取在线关联人列表;
[0092]步骤S1053,将所述在线关联人列表与预先获取的用户标签及分类信息进行匹配,得到所述提问者的关联人的标签及分类信息;
[0093]步骤S1054,将所述提问者的关联人的标签及分类信息与所述当前问题进行匹配,得到匹配分数;
[0094]步骤S1055,将所述匹配分数大于预定值的前M个对应的关联人作为在线求助对象推送给提问者;所述M为自然数。
[0095]本实施例以向提问者的qq好友、微博好友等朋友求助获得问题回答为例,对上述过程进行详细阐述。
[0096]首先,根据提问者的登陆id (qq号或社区帐号等),获取提问者的朋友列表,包含但不限于qq好友、微博好友等。
[0097]然后根据提问者的朋友在线情况进行筛选,得到在线朋友列表,并用此在线朋友列表和预先得到的用户标签及分类信息进行匹配,得到提问者朋友的标签及分类信息。
[0098]然后把提问者的朋友的标签及分类信息和提问者的当前问题进行匹配,并得到相应的匹配分数。
[0099]其中,提问者朋友的标签及分类信息与提问者的当前问题Quest1nk匹配分数Match_score的计算过程如下:
[0100]首先,将所述提问者的朋友的标签与所述当前问题进行匹配,计算获取关联人(朋友)的标签匹配值:



η
[0101]tag_score (Quest1n_id) =叹(/+))错误!未找到引用源。,tag (i)表



I=O
示第i个标签,match(tag(i))表示筛选出的提问者朋友的标签中的tag(i)能够和Quest1nk匹配上的分数。
[0102]将所述提问者的关联人(朋友)的分类信息与所述当前问题进行匹配,计算获取关联人(朋友)的分类匹配值;




η
[0103]category —score (Quest1n—id) = ^n?a/ch(ca/egory(i))错误!未找到引用源。,




i=0
category (i)表示第i个分类,match (category (i))表示筛选出的提问者朋友的分类中的category (i)能够和Quest1nk匹配上的分数。
[0104]然后根据所述标签匹配值和分类匹配值计算获取所述匹配分数Match_score (Quest1n_idk):
[0105]Match_score(Quest1n_idk)=A*tag_score(Quest1n_id) +B*category_score(Quest1n_id),其中,A 和 B 为系数,并且 A>0, B>0, A +B=I。
[0106]在本实施例中,设定Match_score(Quest1n_id)分数不为O的用户认为是回答者。当有多个回答者能够回答问题Quest1n_id时,用集合表示为{Al (Quest1n_id), A2(Quest1n_id), A3 (Quest1n_id)......}。
[0107]当提问者的朋友列表中有多个回答者时,优先选择Match_score (Quest1n_id)最大的前top_n名回答者推送给提问者(top_n为正整数,可以根据实际情况进行调整)。提问者从top_n个回答者中进行选择求助对象。
[0108]采用本实施例的上述方案实现的一种选择求助对象的实例示意图如图4b所示。
[0109]其中,提问者可以选择匿名向朋友求助,被求助的朋友也可以选择匿名回答。
[0110]另外,需要说明的是,提问者的每次求助需要消耗一定的积分,因此,可以限定一个用户某一个时间段内,只能向一定数量的朋友求助。例如,每个用户每天只能向N个以内的朋友进行求助,其中,N为自然数,本实施例优选值设定为Ne [5,10]。
[0111]本实施例通过上述方案,对提问者在网络社区平台提出的当前问题进行挖掘分类,获取分类信息;根据所述分类信息,获取对应分类的历史问题;计算获取所述历史问题与当前问题的相似度,并计算获取所述问题相似度排名靠前的前预定数量的历史问题对应的答案与当前问题的相关性,将相关性最高的历史问题对应的答案作为智能推荐答案;将所述智能推荐答案推送给提问者,由此可以使提问者快速获取问题答案,提高问答社区问题答案匹配准确率以及用户活跃度;此外,在获取不到智能推荐答案,或者提问者对推荐的智能推荐答案不满意时,还可以使用户通过在线求助获得问题答案,更进一步提高了提问问题的解答效率,并能够增进用户之间的互动,进一步提高问答社区用户的活跃度。
[0112]如图5所示,本发明第三实施例提出一种网络社区交互方法,在上述第二实施例的基础上,在上述步骤101之前还包括:
[0113]步骤100,对提问者在网络社区平台提出的当前问题进行广告过滤处理。
[0114]本实施例与上述第二实施例的区别在于,本实施例在为提问者推荐答案之前,还需要对提问者在网络社区平台提出的当前问题进行广告过滤处理,如果判断用户的提问带有广告性质,则不进入求助流程,以防止广告类提问造成用户的骚扰,以及减少广告等危害。
[0115]如图6所示,本发明第四实施例提出一种网络社区交互方法,在上述第三实施例的基础上,在上述步骤101之前还包括:
[0116]步骤90,根据用户的历史信息对用户进行标签及分类挖掘,得到所述用户的标签及分类信息。
[0117]本实施例与上述第三实施例的区别在于,本实施例在为提问者推荐答案之前,需要根据用户的历史信息对用户进行标签及分类挖掘,得到所有用户的标签及分类信息,以便后续在获取不到智能推荐答案,或者提问者对推荐的智能推荐答案不满意,提问者向在线朋友或其他人求助获取问题答案时,将在线关联人列表与上述获取的所有用户的标签及分类信息进行匹配,得到提问者的关联人的标签及分类信息,进而得到在线求助对象推送给提问者。
[0118]具体地,根据用户的历史信息对用户进行标签及分类挖掘,可以采用包括但不限于:用户历史回答过的问题、用户的微博信息、用户的搜索日志、用户的群聊天信息等。
[0119]对用户进行添加标签及分类信息的一般做法是:先对带有用户id的内容进行分词,然后对词进行统计学上的分析,找出具有一定意义的、能够代表用户的词作为用户的标签,比如用户感兴趣或擅长的领域、话题,如化妆品等,还比如具体到某一个品牌等,并根据这些内容对用户标注分类信息。具体的标签及分类方式在这里不进行详细阐述。
[0120]本实施例通过上述方案,根据用户的历史信息对用户进行标签及分类挖掘,得到用户的标签及分类信息;对提问者在网络社区平台提出的当前问题进行挖掘分类,获取分类信息;根据所述分类信息,获取对应分类的历史问题;计算获取所述历史问题与当前问题的相似度,并计算获取所述问题相似度排名靠前的前预定数量的历史问题对应的答案与当前问题的相关性,将相关性最高的历史问题对应的答案作为智能推荐答案;将所述智能推荐答案推送给提问者,由此可以使提问者快速获取问题答案,提高问答社区问题答案匹配准确率以及用户活跃度;此外,还可以结合用户的标签及分类信息,使用户通过在线求助获得问题答案,更进一步提高了提问问题的解答效率,并能够增进用户之间的互动,进一步提高问答社区用户的活跃度。
[0121]如图7所示,本发明第一实施例提出一种网络社区交互装置,包括:分类模块201、历史问题获取模块202、计算获取模块203以及推送模块204,其中:
[0122]分类模块201,用于对提问者在网络社区平台提出的当前问题进行挖掘分类,获取分类信息;
[0123]历史问题获取模块202,用于根据所述分类信息,获取对应分类的历史问题;
[0124]计算获取模块203,用于计算获取所述历史问题与当前问题的相似度,并计算获取所述问题相似度排名靠前的前预定数量的历史问题对应的答案与当前问题的相关性,将相关性最高的历史问题对应的答案作为智能推荐答案;
[0125]推送模块204,用于将所述智能推荐答案推送给提问者。
[0126]其中,网络社区平台是指为用户提供问答类服务的社区平台,比如qq问问或者其他具有“提问-回答”特征的问答类社区或产品。
[0127]提问者是指在问问社区中提出问题的人。
[0128]为了对提问者提出的问题快速推荐答案,本实施例首先针对提问者提出的当前问题,根据问题的问题题干(即问题标题)和问题内容进行分类(提问者也可以自己修改分类),以获取分类信息,该分类信息包括当前问题的类型,比如化妆品类、娱乐类等等。
[0129]其中,对提问者提出的当前问题进行分类的方式可以包括但不限于以下几种:采用SVM、KNN或线性分类等模型进行分类,或者根据当前问题所包含的词进行分类。
[0130]其中,根据当前问题所包含的词进行分类的过程如下:
[0131]预先对各种已知问题进行分词,并基于已知问题所包含的词及各词的分类属性建立词库。之后,对当前问题进行分类时,从当前问题中提取其所包含的词,将当前问题所包括的各词与词库进行匹配,从而得到各词相应的分类属性,然后根据各词的分类属性进行相应的加权计算得到当前问题的分类类型,从而得到分类信息。
[0132]通过SVM、KNN或线性分类等模型进行分类,现有技术已有成熟方案,在此简介如下:
[0133]KNN算法的基本思路是:在给定新文本后,考虑在训练文本集中与该新文本距离最近(最相似)的K篇文本,根据这K篇文本所属的类别判定新文本所属的类别,具体的算法步骤如下:
[0134]一、根据特征项集合重新描述训练文本向量;
[0135]二、在新文本到达后,根据特征词分词新文本,确定新文本的向量表示;
[0136]三、在训练文本集中选出与新文本最相似的K个文本;
[0137]其中,K值的确定目前一般采用先定一个初始值,然后根据实验测试的结果调整K值,一般初始值定为几百到几千之间。
[0138]四、在与新文本最相似的K个文本中,依次计算每类的权重,计算公式如下:
[0139]P、C;— X SinHxiit ly\Iil?C; I
1.
[0140]其中,X为新文本的特征向量,Sim(x,di)为相似度,而y(di,Cj)为类别属性函数,即如果di属于类Cj,那么函数值为1,否则为O。
[0141]五、比较类的权重,将新文本分到权重最大的那个类别中。
[0142]除此以外,支持向量机和神经网络算法在文本分类系统中应用得也较为广泛,支持向量机的基本思想是使用简单的线形分类器划分样本空间。对于在当前特征空间中线形不可分的模式,则使用一个核函数把样本映射到一个高维空间中,使得样本能够线形可分。
[0143]而神经网络算法采用感知算法进行分类。在这种模型中,分类知识被隐式地存储在连接的权值上,使用迭代算法来确定权值向量。当网络输出判别正确时,权值向量保持不变,否则进行增加或降低的调整,因此也称为奖惩法。
[0144]具体的分类方式在这里不进行详细阐述。
[0145]在获取当前问题的分类信息后,查找对应分类的历史问题,从历史问题中挑选出与当前问题分类相同且具有满意类答案的历史问题。
[0146]其中,满意类答案是指被历史问题的提问者认可并采纳的答案,或者是由网络社区平台设定的答案,还可以是采用其他方式获取的答案,比如从其他服务器获取的较佳答案等。
[0147]上述历史问题可以从网络社区平台的后台服务器获取,也可以从其他网络服务器获取。
[0148]在查找到对应分类的历史问题后,计算历史问题和当前问题的相似度,计算问题相似度排名靠前的前预定数量的历史问题对应的答案与当前问题的相关性,并找到满意回答中和当前问题相关性最高的一个作为推荐答案推给提问者。
[0149]具体地,如图8所示,所述计算获取模块203可以包括:第一相似度计算单元2031、第二相似度计算单元2032、第三相似度计算单元2033、第一筛选单元2034、第一相关性计算单元2035、第二相关性计算单元2036、第二筛选单元2037,其中:
[0150]第一相似度计算单元2031,用于计算当前问题的题干与历史问题的题干之间的相似度,得到题干相似度;
[0151]本实施例将题干相似度用title_score (quest1n_id)来表示,其中,quest1n_i d为当前问题的唯一标识。
[0152]第二相似度计算单元2032,用于计算当前问题的内容与历史问题的内容之间的相似度,得到内容相似度;
[0153]本实施例将问题内容之间的相似度用content_score (quest1n_id)来表示。
[0154]第三相似度计算单元2033,用于根据所述题干相似度及内容相似度计算获取问题相似度;
[0155]这里将问题相似度用Quest1n_like_score (quest1n_id)来进行表示。
[0156]问题相似度公式如下所示:
[0157]Quest1n」ike_score (quest1n_id) = a *title_socre (quest1n_id) + β *content_score (quest1n_id),其中,α 和 β 为系数,并且 α >0, β >0, α+β=1。
[0158]第一筛选单元2034,用于筛选出问题相似度排名靠前的前预定数量的历史问题及对应的满意类答案,作为候选集;
[0159]选出Quest1n_like_score (quest1n_id)最高的前 η (η>0)个历史问题及答案进入候选集,η为常量视具体情况而定。
[0160]第一相关性计算单元2035,用于计算所述当前问题与所述候选集中历史问题的满意类答案的相关性,得到相关性结果;
[0161]当前问题与所述候选集中历史问题的满意类答案的相关性用 quest1n_answer_score (quest1n_id)表示,其计算公式的表现形式可以有很多种。
[0162]第二相关性计算单元2036,用于根据所述问题相似度及所述相关性结果计算获取总相关性分数;
[0163]第二筛选单元2037,用于将所述总相关性分数最高的历史问题对应的满意类答案作为智能推荐答案。
[0164]总相关性分数用Total_score (quest1n_id)表示,其计算公式如下:
[0165]Total_score(quest1n_id)=Quest1n_like_score(quest1n_id) + Y*quest1n_answer_score (quest1n_id),其中,Y 为系数,并且 Y e (0,1]。
[0166]然后,把Total_score(quest1n_id)得分最高的历史问题的满意类答案作为智能推荐答案推荐给提问者。
[0167]以上计算 title_score (quest1n_id)、content_score (quest1n_id)、quest1n_answer_score (quest1n_id)时均可采用计算相关性的方法得到。
[0168]其中,计算文本相关性的方法有很多,例如可以把句子进行分词,然后抽取特征向量,计算特征向量之间的余弦值,由此计算当前问题题干、内容和历史问题题干、内容,以及满意回答之间的相关性;或者,采用计算文本包含的公共子串的方式计算相关性;或者还可以利用tfidf算法来计算问题题干、内容和历史问题题干、内容,以及满意回答之间的相关性。在此不做详细描述。
[0169]如图9所示,作为另一种实施方式,所述计算获取模块203还包括:
[0170]判断单元2038,用于判断所述智能推荐答案对应的总相关性分数是否大于预置阀值,若是,则由所述推送模块204执行推送步骤;否则不进行推荐。
[0171]具体地,上述总相关性分数Total_score (quest1n_id)需要大于一定的阈值τ时方可向用户推荐,如果不存在大于阈值τ的满意答案时,则不进行智能推荐。这里的τ >0,具体取值视具体情况而定。
[0172]本实施例通过上述方案,对提问者在网络社区平台提出的当前问题进行挖掘分类,获取分类信息;根据所述分类信息,查找对应分类的历史问题;计算获取所述历史问题与当前问题的相似度,并基于所述相似度获取智能推荐答案;将所述智能推荐答案推送给提问者,由此可以使提问者快速获取问题答案,提高问答社区问题答案匹配准确率以及用户活跃度。
[0173]进一步地,所述推送模块204还用于当获取不到所述智能推荐答案,或者所述提问者对推荐的智能推荐答案不满意时,向所述提问者推送在线求助对象供所述提问者选择,由所述提问者选择的在线求助对象向所述提问者提供当前问题的答案。
[0174]也就是说,在获取不到智能推荐答案,或者提问者对推荐的智能推荐答案不满意时,提问者可以向在线朋友或其他人求助获取问题答案。
[0175]具体地,在本实施例中,所述在线求助对象为当前已登录网络社区平台且具有满意类答案或可提供推荐答案的用户,该用户可以为所述提问者的关联人,比如qq好友,微博好友等,也可以为其他不相关联的人。
[0176]当网络社区平台找不到可向提问者推荐的满意答案或者找到的满意答案不让提问者满意时,可以让提问者选择向当前在线的相关联的人求助。
[0177]更为具体地,如图10所示,所述推送模块204可以包括:第一列表获取单元2041、第二列表获取单元2042、第一匹配单元2043、第二匹配单元2044及推送单元2045,其中:
[0178]第一列表获取单元2041,用于根据所述提问者在所述网络社区平台的登录用户标识,获取所述提问者的关联人列表;
[0179]第二列表获取单元2042,用于根据所述提问者的关联人的在线状况,从所述关联人列表中获取在线关联人列表;
[0180]第一匹配单元2043,用于将所述在线关联人列表与预先获取的用户标签及分类信息进行匹配,得到所述提问者的关联人的标签及分类信息;
[0181]第二匹配单元2044,用于将所述提问者的关联人的标签及分类信息与所述当前问题进行匹配,得到匹配分数;
[0182]推送单元2045,用于将所述匹配分数大于预定值的前M个对应的关联人作为在线求助对象推送给提问者;所述M为自然数。
[0183]其中,用户标识用户是用户的唯一标识id,可以是qq号等。
[0184]本实施例以向提问者的qq好友、微博好友等朋友求助获得问题回答为例,对上述过程进行详细阐述。
[0185]首先,根据提问者的登陆id (qq号或社区帐号等),获取提问者的朋友列表,包含但不限于qq好友、微博好友等。
[0186]然后根据提问者的朋友在线情况进行筛选,得到在线朋友列表,并用此在线朋友列表和预先得到的用户标签及分类信息进行匹配,得到提问者朋友的标签及分类信息。
[0187]然后把提问者的朋友的标签及分类信息和提问者的当前问题进行匹配,并得到相应的匹配分数。
[0188]其中,提问者朋友的标签及分类信息与提问者的当前问题Quest1nk匹配分数Match_score的计算过程如下:
[0189]首先,将所述提问者的朋友的标签与所述当前问题进行匹配,计算获取关联人(朋友)的标签匹配值:




η
[0190]tag—score (Quest1n—id)= 1"?貌./?(/%(/.))错误!未找到引用源。,tag(i)表




2二U
示第i个标签,match(tag(i))表示筛选出的提问者朋友的标签中的tag(i)能够和Quest1nk匹配上的分数。
[0191]将所述提问者的关联人(朋友)的分类信息与所述当前问题进行匹配,计算获取关联人(朋友)的分类匹配值;




η
[0192]category —score (Quest1n—id) = I服错误!未找到引用源。,




f=u
category (i)表示第i个分类,match (category (i))表示筛选出的提问者朋友的分类中的category (i)能够和Quest1nk匹配上的分数。
[0193]然后根据所述标签匹配值和分类匹配值计算获取所述匹配分数Match—score(Quest1n—idk):
[0194]Match_score(Quest1n_idk)=A*tag_score(Quest1n_id) +B*category_score(Quest1n_id),其中,A 和 B 为系数,并且 A>0, B>0, A +B=I ;
[0195]在本实施例中,设定Match_score(Quest1n_id)分数不为O的用户认为是回答者。当有多个回答者能够回答问题Quest1n_id时,用集合表示为{Al (Quest1n_id), A2(Quest1n_id), A3 (Quest1n_id)......}。
[0196]当提问者的朋友列表中有多个回答者时,优先选择Match_score (Quest1n_id)最大的前top_n名回答者推送给提问者(top_n为正整数,可以根据实际情况进行调整)。提问者从top_n个回答者中进行选择求助对象。
[0197]上述方案中,提问者可以选择匿名向朋友求助,被求助的朋友也可以选择匿名回答。
[0198]另外,需要说明的是,提问者的每次求助需要消耗一定的积分,因此,可以限定一个用户某一个时间段内,只能向一定数量的朋友求助。例如,每个用户每天只能向N个以内的朋友进行求助,其中,N为自然数,本实施例优选值设定为Ne [5,10]。
[0199]本实施例通过上述方案,对提问者在网络社区平台提出的当前问题进行挖掘分类,获取分类信息;根据所述分类信息,获取对应分类的历史问题;计算获取所述历史问题与当前问题的相似度,并计算获取所述问题相似度排名靠前的前预定数量的历史问题对应的答案与当前问题的相关性,将相关性最高的历史问题对应的答案作为智能推荐答案;将所述智能推荐答案推送给提问者,由此可以使提问者快速获取问题答案,提高问答社区问题答案匹配准确率以及用户活跃度;此外,在获取不到智能推荐答案,或者提问者对推荐的智能推荐答案不满意时,还可以使用户通过在线求助获得问题答案,更进一步提高了提问问题的解答效率,并能够增进用户之间的互动,进一步提高问答社区用户的活跃度。
[0200]如图11所示,本发明第二实施例提出一种网络社区交互装置,在上述第一实施例的基础上,还包括:
[0201]过滤模块205,用于对提问者在网络社区平台提出的当前问题进行广告过滤处理。
[0202]本实施例与上述第二实施例的区别在于,本实施例在为提问者推荐答案之前,还需要对提问者在网络社区平台提出的当前问题进行广告过滤处理,如果判断用户的提问带有广告性质,则不进入求助流程,以防止广告类提问造成用户的骚扰,以及减少广告等危害。
[0203]进一步地,所述分类模块201还用于根据用户的历史信息对用户进行标签及分类挖掘,得到所述用户的标签及分类信息。
[0204]在为提问者推荐答案之前,需要根据用户的历史信息对用户进行标签及分类挖掘,得到所有用户的标签及分类信息,以便后续在获取不到智能推荐答案,或者提问者对推荐的智能推荐答案不满意,提问者向在线朋友或其他人求助获取问题答案时,将在线关联人列表与上述获取的所有用户的标签及分类信息进行匹配,得到提问者的关联人的标签及分类信息,进而得到在线求助对象推送给提问者。
[0205]具体地,根据用户的历史信息对用户进行标签及分类挖掘,可以采用包括但不限于:用户历史回答过的问题、用户的微博信息、用户的搜索日志、用户的群聊天信息等。
[0206]对用户进行添加标签及分类信息的一般做法是:先对带有用户id的内容进行分词,然后对词进行统计学上的分析,找出具有一定意义的、能够代表用户的词作为用户的标签,比如用户感兴趣或擅长的领域、话题,如化妆品等,还比如具体到某一个品牌等,并根据这些内容对用户标注分类信息。具体的标签及分类方式在这里不进行详细阐述。
[0207]本实施例通过上述方案,根据用户的历史信息对用户进行标签及分类挖掘,得到用户的标签及分类信息;对提问者在网络社区平台提出的当前问题进行挖掘分类,获取分类信息;根据所述分类信息,获取对应分类的历史问题;计算获取所述历史问题与当前问题的相似度,并计算获取所述问题相似度排名靠前的前预定数量的历史问题对应的答案与当前问题的相关性,将相关性最高的历史问题对应的答案作为智能推荐答案;将所述智能推荐答案推送给提问者,由此可以使提问者快速获取问题答案,提高问答社区问题答案匹配准确率以及用户活跃度;此外,还可以结合用户的标签及分类信息,使用户通过在线求助获得问题答案,更进一步提高了提问问题的解答效率,并能够增进用户之间的互动,在好友之间展示问答社区中的成就(包括但不限于等级、头衔、荣耀等),以增强用户的成就感,从而进一步提高问答社区用户的活跃度。
[0208]此外,本发明实施例还提出一种网络社区平台,该网络社区平台包括上述各实施例所述的装置,在此不再赘述。
[0209]需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
[0210]上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
[0211]通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如R0M/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,月艮务器,或者网络设备等)执行本发明各个实施例所述的方法。
[0212]以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或流程变换,或直接或间接运用在其它相关的【技术领域】,均同理包括在本发明的专利保护范围内。
【权利要求】
1.一种网络社区交互方法,其特征在于,包括: 对提问者在网络社区平台提出的当前问题进行挖掘分类,获取分类信息; 根据所述分类信息,获取对应分类的历史问题; 计算获取所述历史问题与当前问题的相似度,并计算获取所述问题相似度排名靠前的前预定数量的历史问题对应的答案与当前问题的相关性,将相关性最高的历史问题对应的答案作为智能推荐答案; 将所述智能推荐答案推送给所述提问者。
2.根据权利要求1所述的方法,其特征在于,所述根据分类信息,获取对应分类的历史问题的步骤包括: 从历史问题中挑选出与当前问题分类相同且具有满意类答案的历史问题;所述满意类答案是指被历史问题的提问者认可并采纳的答案,或者是由网络社区平台设定的答案。
3.根据权利要求2所述的方法,其特征在于,所述计算获取所述历史问题与当前问题的相似度的步骤包括: 计算当前问题的题干与历史问题的题干之间的相似度,得到题干相似度; 计算当前问题的内容与历史问题的内容之间的相似度,得到内容相似度; 根据所述题干相似度及内容相似度计算获取问题相似度。
4.根据权利要求3所述的方法,其特征在于,所述计算获取所述问题相似度排名靠前的前预定数量的历史问题对应的答案与当前问题的相关性,将相关性最高的历史问题对应的答案作为智能推荐答案的步骤包括: 筛选出问题相似度排名靠前的前预定数量的历史问题及对应的满意类答案,作为候选集; 计算所述当前问题与所述候选集中历史问题的满意类答案的相关性,得到相关性结果; 根据所述问题相似度及所述相关性结果计算获取总相关性分数; 将所述总相关性分数最高的历史问题对应的满意类答案作为智能推荐答案。
5.根据权利要求4所述的方法,其特征在于,所述将智能推荐答案推送给提问者的步骤之前还包括: 判断所述智能推荐答案对应的总相关性分数是否大于预置阀值,若是,则执行推送步骤;否则不进行推荐。
6.根据权利要求1-5中任一项所述的方法,其特征在于,还包括: 当获取不到所述智能推荐答案,或者所述提问者对推荐的智能推荐答案不满意时,向所述提问者推送在线求助对象供所述提问者选择,由所述提问者选择的在线求助对象向所述提问者提供当前问题的答案;所述在线求助对象为当前已登录所述网络社区平台且具有满意类答案或可提供推荐答案的用户,该用户至少包括所述提问者的关联人。
7.根据权利要求6所述的方法,其特征在于,所述求助对象为所述提问者的关联人,所述向提问者推送在线求助对象的步骤包括: 根据所述提问者在所述网络社区平台的登录用户标识,获取所述提问者的关联人列表; 根据所述提问者的关联人的在线状况,从所述关联人列表中获取在线关联人列表; 将所述在线关联人列表与预先获取的用户标签及分类信息进行匹配,得到所述提问者的关联人的标签及分类信息; 将所述提问者的关联人的标签及分类信息与所述当前问题进行匹配,得到匹配分数;将所述匹配分数大于预定值的前M个对应的关联人作为在线求助对象推送给提问者;所述M为自然数。
8.根据权利要求7所述的方法,其特征在于,所述将提问者的关联人的标签及分类信息与所述当前问题进行匹配,得到匹配分数的步骤包括: 将所述提问者的关联人的标签与所述当前问题进行匹配,计算获取关联人的标签匹配值; 将所述提问者的关联人的分类信息与所述当前问题进行匹配,计算获取关联人的分类匹配值; 根据所述标签匹配值和分类匹配值计算获取所述匹配分数。
9.根据权利要求7所述的方法,其特征在于,所述向提问者推送在线求助对象的步骤进一步还包括: 在预定时间段内向所述提问者推送的在线求助对象的数量不超过N个,其中,N为自然数。
10.根据权利要求1所述的方法,其特征在于,所述对提问者在网络社区平台提出的当前问题进行挖掘分类,获取分类信息的步骤之前还包括: 对提问者在网络社区平台提出的当前问题进行广告过滤处理。
11.根据权利要求7所述的方法,其特征在于,所述对提问者在网络社区平台提出的当前问题进行挖掘分类,获取分类信息的步骤之前还包括: 根据用户的历史信息对用户进行标签及分类挖掘,得到所述用户的标签及分类信息。
12.—种网络社区交互装置,其特征在于,包括: 分类模块,用于对提问者在网络社区平台提出的当前问题进行挖掘分类,获取分类信息; 历史问题获取模块,用于根据所述分类信息,获取对应分类的历史问题; 计算获取模块,用于计算获取所述历史问题与当前问题的相似度,并计算获取所述问题相似度排名靠前的前预定数量的历史问题对应的答案与当前问题的相关性,将相关性最高的历史问题对应的答案作为智能推荐答案; 推送模块,用于将所述智能推荐答案推送给所述提问者。
13.根据权利要求12所述的装置,其特征在于, 所述历史问题获取模块,还用于从历史问题中挑选出与当前问题分类相同且具有满意类答案的历史问题;所述满意类答案是指被历史问题的提问者认可并采纳的答案,或者是由网络社区平台设定的答案。
14.根据权利要求12所述的装置,其特征在于,所述计算获取模块包括: 第一相似度计算单元,用于计算当前问题的题干与历史问题的题干之间的相似度,得到题干相似度; 第二相似度计算单元,用于计算当前问题的内容与历史问题的内容之间的相似度,得到内容相似度; 第三相似度计算单元,用于根据所述题干相似度及内容相似度计算获取问题相似度; 第一筛选单元,用于筛选出问题相似度排名靠前的前预定数量的历史问题及对应的满意类答案,作为候选集; 第一相关性计算单元,用于计算所述当前问题与所述候选集中历史问题的满意类答案的相关性,得到相关性结果; 第二相关性计算单元,用于根据所述问题相似度及所述相关性结果计算获取总相关性分数; 第二筛选单元,用于将所述总相关性分数最高的历史问题对应的满意类答案作为智能推荐答案。
15.根据权利要求14所述的装置,其特征在于,所述计算获取模块还包括: 判断单元,用于判断所述智能推荐答案对应的总相关性分数是否大于预置阀值,若是,则由所述推送模块执行推送步骤;否则不进行推荐。
16.根据权利要求12-15中任一项所述的装置,其特征在于, 所述推送模块,还用于当获取不到所述智能推荐答案,或者所述提问者对推荐的智能推荐答案不满意时,向所述提问者推送在线求助对象供所述提问者选择,由所述提问者选择的在线求助对象向所述提问者提供当前问题的答案;所述在线求助对象为当前已登录所述网络社区平台且具有满意类答案或可提供推荐答案的用户,该用户至少包括所述提问者的关联人。
17.根据权利要求16所述的装置,其特征在于,所述推送模块包括: 第一列表获取单元,用于根据所述提问者在所述网络社区平台的登录用户标识,获取所述提问者的关联人列表; 第二列表获取单元,用于根据所述提问者的关联人的在线状况,从所述关联人列表中获取在线关联人列表; 第一匹配单元,用于将所述在线关联人列表与预先获取的用户标签及分类信息进行匹配,得到所述提问者的关联人的标签及分类信息; 第二匹配单元,用于将所述提问者的关联人的标签及分类信息与所述当前问题进行匹配,得到匹配分数; 推送单元,用于将所述匹配分数大于预定值的前M个对应的关联人作为在线求助对象推送给提问者;所述M为自然数。
18.根据权利要求17所述的装置,其特征在于,所述第二匹配单元还用于将所述提问者的关联人的标签与所述当前问题进行匹配,计算获取关联人的标签匹配值;将所述提问者的关联人的分类信息与所述当前问题进行匹配,计算获取关联人的分类匹配值;根据所述标签匹配值和分类匹配值计算获取所述匹配分数。
19.根据权利要求17所述的装置,其特征在于,所述推送单元还用于在预定时间段内向所述提问者推送的在线求助对象的数量不超过N个,其中,N为自然数。
20.根据权利要求12所述的装置,其特征在于,还包括: 过滤模块,用于对提问者在网络社区平台提出的当前问题进行广告过滤处理。
21.根据权利要求12所述的装置,其特征在于,所述分类模块还用于根据用户的历史信息对用户进行标签及分类挖掘,得到所述用户的标签及分类信息。
22.—种网络社区平台,其特征在于,包括权利要求12-21中任一项所述的装置。
【文档编号】G06F17/30GK104133817SQ201310159377
【公开日】2014年11月5日 申请日期:2013年5月2日 优先权日:2013年5月2日
【发明者】程刚, 林松, 姜爱荣, 潘璇, 庄子明, 赵艳 申请人:深圳市世纪光速信息技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1