对问答论坛中讨论话题的排名的制作方法

文档序号:10557170阅读:297来源:国知局
对问答论坛中讨论话题的排名的制作方法
【专利摘要】提供了用于对具有以问答形式的帖子的讨论话题进行评分的系统。系统接收查询,并且接着对可以包括一个或多个术语特征和一个或多个非术语特征的讨论话题的特征进行标识。术语特征可以是将多个帖子的术语进行组合以将其视为单个文档的组合的帖子特征。术语特征可以是包含讨论话题的问题的问题特征。术语特征还可以是包含与帖子的问题有关的帖子的术语的问题帖子特征。系统接着针对每个特征而生成特征分数,并且将特征分数组合成指示讨论话题与查询之间的相关性的相关性分数。系统还可以在对讨论话题进行排名时使用该相关性分数。
【专利说明】对问答论坛中讨论话题的排名
【背景技术】
[0001] 许多搜索引擎服务(例如,Google和Bing)都提供对能够经由互联网获取的信息的 搜索。这些搜索引擎服务允许用户针对他们可能感兴趣的显示页面(例如,网页)进行搜索。 在用户提交包括搜索术语的搜索请求(也被称为"查询")之后,搜索引擎服务对可以与那些 搜索术语有关的网页进行标识。为了快速识别有关网页,搜索引擎服务可保存关键词到网 页的映射。该映射可以通过对网络(即万维网)进行"爬取(crawl)"以对每个网页的关键词 进行标识而生成。为了对网络进行爬取,搜索引擎服务可使用基础网页的列表来对可以通 过那些基础网页而访问的所有网页进行标识。可以使用各种公知的技术来对任何特定的网 页的关键词进行标识,例如对标题中的词语进行标识、对在网页的元数据中所提供的词语 进行标识、对突出显示的词语进行标识等。搜索引擎服务可以生成相关性分数来指示网页 的信息可以与搜索请求有多相关。搜索引擎服务接着以基于网页的相关性的顺序来向用户 显示到那些网页的链接。
[0002] 讨论话题是人们利用互联网进行沟通的一种流行的方式。一种特定的流行的类型 的讨论话题服务是网络论坛。网络论坛是允许网站的用户发布可用于由网站的其他用户查 看的信息的网站。讨论话题(例如,新闻讨论组)允许人们参与关于具体的主题的讨论。讨论 话题通常在某人创建了针对主题的初始消息,并且将该消息作为新的讨论话题而发布时被 发起。其他人可以阅读该初始消息并且发布对该讨论话题的回复消息。例如,初始消息可以 提出诸如"有人遇到过Acme软件产品以错误代码456异常结束的情况吗? "之类的问题。想要 参与讨论的人可以发布回复消息,例如"这种事总是发生在我身上"或者"我通过重新安装 软件解决了该问题"。
[0003] 问答(Q&A)论坛被定制为这样的讨论话题,其以问题开始并且可以包括表示Q&A形 式的讨论话题的一个或多个回答。例如,销售某软件产品的公司内的客户支持小组可以为 其客户提供Q&A,以创建并且参与有关该软件产品的讨论话题。客户可通过发布提出问题 (例如,在上文中所提及的那个问题)的初始消息而发起讨论话题。可以通过由另一个客户 或客户服务代表发布回复消息来回答那个问题。当发布对问题的回答时,每个发布者可以 将该发帖指定为具有所建议的回答。由于发布者的知识会有显著差异,因此所建议的回答 可能是错误的。论坛管理员可以检查所建议的回答,并且将一个或多个帖子标记为具有经 验证的回答一一即,经验证为正确的回答。同样,Q&A论坛可以具有针对本质上相同的初始 问题的不同的讨论话题。为了帮助客户挑选提供与初始问题有关的最佳讨论的讨论话题, 论坛管理员可以将那些讨论话题中的一些指定为重要的。
[0004] 公司的讨论话题的语料库(corpus)可以提供与客户会遇到的问题和担忧有关的 大量的知识以及合适的回复,例如对所提出的问题的回答。公司可以允许客户使用通用搜 索引擎来搜索讨论话题的语料库。客户通常输入问题来寻找其回答。然而,这样的通用搜索 引擎可能不会以特别有帮助的顺序对搜索结果进行排名。例如,这样的通用搜索引擎可能 将包含与其初始问题相同的问题的帖子的网页排名得相对高,而将仅包含回答却不包含问 题的帖子的网页排名得相对低。

【发明内容】

[0005] 提供了用于对具有以问答形式的帖子的讨论话题进行评分的方法和系统。系统接 收到查询并且接着对可以包括一个或多个术语特征和一个或多个非术语特征的讨论话题 的特征进行标识。术语特征可以是组合的帖子特征,该组合的帖子特征将讨论话题的多个 帖子中的术语进行组合以将其看作单个文档。术语特征可以是包含讨论话题的问题(例如, 讨论话题的第一个帖子的主题)的问题特征。术语特征还可以是包含与帖子的问题相关的 帖子的术语(例如,讨论话题的第一个帖子的文本)的问题帖子特征。非术语特征可以是回 答特征、热门度特征、权威特征、重要性特征、或者点击链接特征。系统接着针对每个特征生 成特征分数,并且将特征分数组合成指示讨论话题与查询之间的相关性的相关性分数。当 对讨论话题进行排名时,系统也可以使用该相关性分数。
【附图说明】
[0006] 图1是示出了一些实施例中的Q&A排名系统的组件的框图。
[0007] 图2是示出了一些实施例中的Q&A排名系统的训练排名器组件的处理的流程图。 [0008]图3是示出了一些实施例中的Q&A排名系统的排名话题组件的处理的流程图。
[0009] 图4是示出了一些实施例中的Q&A排名系统的计算特征分数组件的处理的流程图。
[0010] 图5是示出了一些实施例中的Q&A排名系统的计算术语特征分数组件的处理的流 程图。
[0011] 图6是示出了一些实施例中的Q&A排名系统的检索特征组件的处理的流程图。
【具体实施方式】
[0012] 提供了用于对具有以问答形式的帖子的讨论话题进行评分的方法和系统。在一些 实施例中,Q&A排名系统接收到查询,并且针对讨论话题而生成指示讨论话题与查询之间的 相关性的相关性分数。为了针对讨论话题生成相关性分数,Q&A排名系统从每个讨论话题中 提取特征,并且针对每个特征而生成特征分数。例如,特征可以包括术语特征,例如问题特 征(例如,讨论话题的第一个帖子的主题)、问题帖子特征(例如,讨论话题的第一个帖子的 文本)、以及组合的帖子特征。特征还可以包括一个或多个非术语特征,例如在下文中所描 述的回答特征、热门度特征、权威特征、重要性特征、以及点击链接(c 1 i ckthrough)特征。接 着,Q&A排名系统对讨论话题的特征分数进行组合以生成相关性分数。Q&A排名系统可以使 用特征权重来对特征分数进行加权,所述特征权重是使用从Q&A论坛中得出的训练数据、经 由机器学习算法(例如,神经网络或自适应增强)而学习到的。在下文中,将术语特征与非术 语特征描述为影响讨论话题与查询之间的相关性。可替代地,不含非术语特征的术语特征 可以被认为确定术语特征的内容与查询之间的相关性,而非术语特征可以被认为指示讨论 话题的整体相关性而无论帖子的内容。例如,具有经验证的回答的讨论话题更有可能是相 关的而无论其内容。
[0013] 在一些实施例中,从讨论话题的术语中得出术语特征,以用于与查询的术语进行 比较。问题特征表示讨论话题的主要问题。主要问题可以是当讨论话题开始时最初提出的 问题。例如,讨论话题的初始帖子的主题可以包含该问题。可替代地,Q&A论坛可以保存问题 分区(field)以用于存储讨论话题的主要问题。问题特征可以包含问题的全部词语、仅问题 的关键词、仅问题的非噪声词语等。问题帖子特征表示与问题的发帖(例如,讨论话题的初 始帖子)有关的讨论话题的帖子的术语。讨论话题的初始帖子可以包含作为其主体的问题, 或者可以与在初始帖子之外的问题分区所提出的问题相关。问题帖子特征还可以包含帖子 中的所有术语或者可以仅包含帖子的正文中的术语(例如,不包括存储在帖子的主题中的 问题)。问题帖子特征还可以表示初始帖子的发布者的其他帖子,这是因为发布者可以已经 在后续的帖子中阐明了问题。问题特征和问题帖子特征可以被认为是基于问题的特征,这 是因为它们与帖子的问题相关。组合的帖子特征表示将讨论话题的帖子的术语组合成单个 文档。组合的帖子特征可以包括来自以下帖子的术语:讨论话题的所有帖子、除了问题帖子 之外的所有帖子、或者讨论话题的经挑选的帖子。例如,可以基于帖子的新近度、帖子是否 有回答等来选择帖子。
[0014] 针对问题、问题帖子、以及组合的帖子使用分离的术语特征有几个优点。例如,将 问题与问题帖子分离,允许分离于与对问题的讨论的查询的相关性而评估与对问题的查询 的相关性。同样,将多个帖子组合成组合的帖子特征允许对整体的讨论话题与查询之间的 相关性进行评估,而不是仅仅对讨论话题的单个帖子之间的相关性进行评估。将问题帖子 与组合的帖子分离允许分离于后续的帖子而评估与对发布者的初始评论的查询的相关性。 尽管术语特征被看作是分离的特征,但是Q&A排名系统可以针对全部三个术语特征而生成 组合的特征分数,该组合的特征分数基于组合的帖子特征分数、问题帖子特征分数、以及问 题特征分数的加权求和。
[0015] 在一些实施例中,非术语特征允许将讨论话题与查询之间的相关性作为因素而计 入标准中,而非仅将查询和讨论话题的术语作为因素而计入标准中。从讨论话题的帖子的 元数据中得出指示该帖子是否有回答的回答特征。帖子可以具有由发布者指示的建议的回 答和/或由管理员指示的经验证的回答。具有经验证的回答的讨论话题可以被认为比仅具 有建议的回答的讨论话题更相关,而仅具有建议的回答的讨论话题可以被认为比没有回答 的讨论话题更相关。热门度特征表示讨论话题的热门度,并且可以从讨论话题已经被查看 的次数中得出。热门的讨论话题可以被认为比不热门的讨论话题更相关。权威特征表示回 答的发布者的权威。权威指示由发布者在其他讨论话题中所给出的回答的质量,并且可以 基于由该发布者给出的已经经验证的回答的数量来确定。具有由经常给出经验证的回答的 发布者所给出的回答的讨论话题可以被认为比具有来自没有经验证的回答的发布者的回 答的讨论话题更相关。重要性特征表示讨论话题相对于论坛中的其他讨论话题的重要性, 并且可以由管理员来指示。一些Q&A论坛允许管理员指定讨论话题的重要性。具有高重要性 的讨论话题可以被认为比具有低重要性的讨论话题更相关。点击链接特征是从指示用户何 时已经选择或点击了来自搜索结果中的讨论话题的点击链接数据中得出的。点击链接数据 可以是讨论话题被点击的次数的计数。点击链接数据可以由Q&A论坛本身提供(例如,内部 点击链接特征)和/或可以由外部搜索引擎提供(例如,外部点击链接特征)。具有高点击链 接计数的讨论话题被认为比具有低点击链接计数的讨论话题更相关。
[0016] Q&A排名系统可以根据以下等式而生成指示讨论话题与查询之间的相关性的相关 性分数:
[0017] RS= E iWiFSi (1)
[0018]其中,RS表示相关性分数,?51表示特征i的特征分数,并且^表示特征i的权重。权 重可以使用机器学习算法而学习到,并且可以表示特征分数的非线性组合(例如,神经网络 或者加权树的集合hQ&A排名系统可以根据以下等式针对术语特征而生成组合的特征分 数:
(2)
[0020]其中,t表示查询的术语,TF't表示针对术语t的子分数,N表示讨论话题的数量,而 n表示包含术语t的讨论话题的数量。等式2是被称为BM25F的术语频率乘以逆向文档频率 (tf*idf)度量的变型。术语的子分数是根据以下等式而生成的:
[0022]其中,cp、q以及qp分别表示组合的帖子特征、问题特征以及问题帖子特征;TFt,^ 示术语t在特征x中出现的次数;口"表示特征x中的术语的数量;AVDLX表示包含术语t的所有 讨论话题的特征x中的术语的平均数量;而^表示特征x的可调的权重。
[0023] 回答特征可以具有由以下等式所表示的特征分数FSa:
[0024] ^ %如果讨论话题没有回答 &如果讨论话题有所建议的回答,但没有经验证的回答 .、 = 乂 (4) ip2如果讨论话题有经验证的回答,但没有所建议的回答 〇?3如果讨论话题有经验证的回答以及所建议的回答
[0025]其中,vy表示条件y的可调的参数。
[0026] 热门度特征可以具有由以下等式所表示的特征分数FSP: \〇^(Nv + bS\i ^ ^ ^maxv
[0027] RSp 二、p pJ 1 ,P (5) ,l〇§(^max,'p + ^V),如果.~>
[0028] 其中具表示讨论话题已经被查看的次数,而Nmax,P、bP表示可调的参数。
[0029]权威特征可以具有由以下等式所表示的特征分数FSau:
(6)
[0031] 其中,Na表示该讨论话题中经验证的回答(或者,如果没有经验证的回答则是所建 议的回答)的发布者跨所有讨论话题的经验证的回答的数量,而k a表示可调的参数。
[0032]重要性特征可以具有这样的特征分数FS1:如果讨论话题已经被标记为重要,则其 被设置为1,否则其被设置为LQ&A论坛可以允许管理员将重要性设置为例如在0到1之间的 某个数值。在这样的情况下,特征分数FSi可以取该值。
[0033]点击链接特征可以具有由以下等式所表示的特征分数FS。:
[0034] FS = (l〇g^Vc + bc),0 - Nc ^ Nmax,c (7) C ^max>c + bc), mNc> Nmax:c
[0035]其中,N。表示讨论话题(或者其帖子中的一个)被点击的次数,而Nmax,。、b。是可调的 参数。
[0036]图1是示出了一些实施例中的Q&A排名系统的组件的框图。Q&A排名系统100可以包 括讨论话题存储110和讨论话题元数据存储120。讨论话题存储包含Q&A论坛的讨论话题的 每一个的帖子。讨论话题元数据存储包含针对讨论话题而保存的诸如重要性、点击链接数 据等之类的元数据。Q&A排名系统包括训练排名器组件130,其输入来自训练数据存储140的 训练数据、学习从该训练数据中所提取的特征的权重、并且将所述权重存储在权重存储150 中。Q&A排名系统还包括排名话题组件160、计算特征分数组件170、计算术语特征分数组件 180、以及检索特征组件190。排名话题组件输入查询、针对每个讨论话题而生成相关性分 数、并且接着基于相关性分数来对讨论话题进行排名。计算特征分数组件针对查询的讨论 话题而生成特征分数。计算术语特征分数组件针对查询的讨论话题而生成术语特征分数。 检索特征组件提取术语特征和非术语特征。
[0037]其上可以实现Q&A排名系统的计算设备和系统可以包括中央处理单元、输入设备、 输出设备(例如,显示设备和扬声器)、存储设备(例如,存储器和磁盘驱动器)、网络接口、图 形处理单元、加速度计、蜂窝式无线电链接接口、全球定位系统设备等。输入设备可以包括 键盘、定点设备、触摸屏、手势识别设备(例如,针对空中手势的)、头部和眼部追踪设备、用 于语音识别的麦克风等。计算设备可以包括台式计算机、膝上型计算机、平板计算机、电子 阅读器、个人数字助理、智能电话、游戏设备、服务器、以及计算机系统(例如,大规模并行系 统)。计算设备可以访问包括计算机可读存储介质和数据传输介质的计算机可读介质。计算 机可读存储介质是有形的存储单元,其不包括瞬时性的、传播的信号。计算机可读存储介质 的示例包括诸如主存储器、高速缓冲存储器、二级存储器(例如,DVD)等之类的存储器,并且 包括其他存储单元。计算机可读存储介质可以具有记录在其上的或者可以编码有实现Q&A 排名系统的计算机可执行指令或逻辑。数据传输介质用于通过经由有线或无线连接的易失 性的、传播的信号或载波(例如,电磁波)来传输数据。
[0038]可以在由一个或多个计算机、处理器、或其它设备所执行的计算机可执行指令(例 如,程序模块和组件)的一般性的上下文中描述Q&A排名系统。通常而言,程序模块或组件包 括执行特定的任务或实现特定的数据类型的例程、程序、对象、数据结构等。通常而言,程序 模块的功能可以如在各种实施例中所期望的那样组合或分布。可以使用例如专用集成电路 ("ASIC")的硬件来实现Q&A排名系统的方面。
[0039]图2是示出了一些实施例中的Q&A排名系统的训练排名器组件的处理的流程图。训 练排名器组件200输入训练数据,该训练数据可以包括讨论话题(和相关联的元数据)、查 询、以及针对每个查询的指示该查询的每个讨论话题的期望的排名的标签。组件使用多种 机器学习技术中的任何一种而学习特征的权重,并且将所述权重存储在权重存储中。在方 框201中,组件收集训练数据。可以通过要求用户对每个查询的讨论话题手动地进行排名来 收集训练数据。在方框202-206中,组件针对每个查询而循环计算每个讨论话题的特征分 数。在方框202中,组件在训练数据中选择下一个查询。在决策框203中,如果所有的查询都 已经被选择,则组件在方框207处继续,否则,组件在方框204处继续。在方框204中,组件选 择下一个讨论话题。在决策框205中,如果所有的讨论话题都已经被选择,则组件循环至方 框202来选择下一个查询,否则,组件在方框206处继续。在方框206中,组件调用计算特征分 数组件来计算特征分数,并且接着循环至方框204来选择下一个讨论话题。在方框207中,组 件基于所计算的特征分数而学习特征的权重,并且接着完成。组件可以使用通过利用例如 梯度上升方法来调整权重的迭代过程而学习权重,从而改善优化度量(例如,误差函数)。
[0040] 图3是示出了一些实施例中的Q&A排名系统的排名话题组件的处理的流程图。向排 名话题组件300传递查询,并且排名话题组件300基于讨论话题存储的讨论话题与查询之间 的相关性来对讨论话题进行排名。在方框301中,组件选择下一个讨论话题。在决策框302 中,如果所有的讨论话题都已经被选择,则组件在方框305处继续,否则,组件在方框303处 继续。在方框303中,组件调用计算特征分数组件来计算所选择的讨论话题的特征分数。在 方框304中,组件通过根据等式1的使用权重存储中的权重来将特征分数进行组合从而计算 所选择的讨论话题的相关性,并且接着循环至方框301以选择下一讨论话题。在方框305中, 组件根据讨论话题的相关性分数来对讨论话题进行排名。
[0041] 图4是示出了一些实施例中的Q&A排名系统的计算特征分数组件的处理的流程图。 向计算特征分数组件400传递查询和讨论话题,并且计算特征分数组件400针对讨论话题的 特征中的每个特征而生成特征分数。在方框401中,组件调用检索特征组件来提取针对该讨 论话题的特征。在方框402中,组件调用计算术语特征分数组件来计算术语特征分数。在方 框403中,组件使用等式4来计算回答特征分数。在方框404中,组件使用等式5来计算热门度 特征分数。在方框405中,组件使用等式6来计算权威特征分数。在方框406中,组件计算重要 性特征分数。在方框407中,组件使用等式7来计算点击链接特征分数,并且接着返回该特征 分数。
[0042]图5是示出了一些实施例中的Q&A排名系统的计算术语特征分数组件的处理的流 程图。向组件500传递查询和讨论话题,并且组件500针对该查询而返回该讨论话题的术语 特征分数。在方框501中,组件对术语特征分数进行初始化。在方框502-508中,组件针对查 询的每个术语而循环计算术语特征子分数。在方框502中,组件选择查询的下一个术语。在 决策框503中,如果所有的术语都已经被选择,则组件返回术语特征分数,否则组件在方框 504处继续。在方框504中,组件根据等式3来计算组合的帖子特征分数。在方框505中,组件 根据等式3来计算所选择的术语的问题特征分数。在方框506中,组件根据等式3来计算所选 择的术语的问题帖子特征分数。在507中,组件根据等式3将组合的帖子特征分数、问题特征 分数、以及问题帖子特征分数组合成所选择的术语的组合的特征分数。在方框508中,组件 根据等式2将组合的特征分数与术语特征分数相加,并且接着循环至方框502来选择查询的 下一个术语。
[0043]图6是示出了一些实施例中的Q&A排名系统的检索特征组件的处理的流程图。向检 索特征组件600传递讨论话题,并且检索特征组件600提取并返回特征。在方框601中,组件 通过收集讨论话题的多个帖子(例如,所有帖子)并且将它们组合成单个集合或文件,来提 取组合的帖子特征。在方框602中,组件从讨论话题的初始帖子的正文中提取问题帖子特 征。在方框603中,组件从初始帖子的主题中提取问题特征。在方框604中,组件从讨论话题 的元数据中提取回答特征。在方框605中,组件从讨论话题的元数据中提取热门度特征。在 方框606中,组件从讨论话题的元数据中提取权威特征。在方框607中,组件从讨论话题的元 数据中提取重要性特征。在方框608中,组件从讨论话题的元数据中提取点击链接特征,并 且接着返回特征。
[0044]尽管已经用特定于结构特征和/或行为的语言描述的主题,但应当理解的是,在所 附权利要求中所限定的主题非必须限于在上文中所描述的具体的特征或行为。相反,在上 文中所描述的具体的特征或行为是作为实现权利要求的示例形式而公开的。从而,除了所 附权利要求之外,本发明不受限制。
【主权项】
1. 一种存储计算机可执行指令的计算机可读存储介质,所述计算机可执行指令用于控 制计算系统以对以问答形式的讨论话题进行评分,每个讨论话题都有具有术语的主题,所 述计算机可执行指令包括: 提供查询的组件; 标识讨论话题的特征的组件,所述特征包括表示讨论话题的多个帖子的术语的集合的 组合的帖子特征; 针对所述特征而生成特征分数的组件,所述组合的帖子特征的所述特征分数指示所述 集合的术语与所述查询之间的相关性,以及 基于将讨论话题的特征分数进行组合而生成所述讨论话题的相关性分数的组件。2. 根据权利要求1所述的计算机存储介质,其中,所述讨论话题的特征是作为所述讨论 话题的主题的问题。3. 根据权利要求2所述的计算机可读存储介质,其中,所述问题是从所述讨论话题的初 始帖子的主题分区中得出的。4. 根据权利要求1所述的计算机可读存储介质,其中,所述讨论话题的特征是所述讨论 话题的初始帖子。5. 根据权利要求1所述的计算机可读存储介质,其中,所述讨论话题的特征基于所述讨 论话题的点击链接。6. 根据权利要求1所述的计算机可读存储介质,其中,所述讨论话题的特征基于所述讨 论话题的新近性。7. -种用于基于与查询之间的相关性来对讨论话题进行评分的计算系统,所述讨论话 题是以问答形式的,所述计算系统包括: 存储计算机可执行指令的计算机可读存储介质,所述计算机可执行指令包括: 标识讨论话题的特征的指令,所述特征包括基于问题的特征,所述基于问题的特征包 括与所述讨论话题的所述问题的发帖有关的术语; 针对所述特征而生成特征分数的指令,其中,所述基于问题的特征的所述特征分数指 示与所述讨论话题的所述问题的发帖有关的所述术语的相关性;以及 基于将讨论话题的特征分数进行组合而生成所述讨论话题的相关性分数的指令;以及 执行由所述计算机可读存储介质所存储的所述计算机可执行指令的处理器。8. 根据权利要求7所述的计算系统,其中,所述讨论话题的特征包括组合的帖子特征。9. 根据权利要求7所述的计算系统,其中,所述讨论话题的所述基于问题的特征是问题 特征。10. 根据权利要求9所述的计算系统,其中,所述问题特征是从所述讨论话题的初始帖 子的主题分区中得出的。11. 根据权利要求7所述的计算系统,其中,所述基于问题的特征是问题帖子特征。12. 根据权利要求11所述的计算系统,其中,所述问题帖子特征包含包括所述问题的帖 子的正文的术语。13. 根据权利要求7所述的计算系统,其中,所述讨论话题的特征是回答特征。14. 根据权利要求7所述的计算系统,其中,所述讨论话题的特征是点击链接特征。15. -种用于对问答论坛的讨论话题进行排名的方法,所述方法包括: 接收包括术语的查询; 针对多个讨论话题中的每个, 标识所述讨论话题的特征,所述特征包括表示来自讨论话题的多个帖子的术语的集合 的组合的帖子特征、表示所述讨论话题的问题的问题特征、表示所述讨论话题的问题帖子 的术语的问题帖子特征、以及从由回答特征、热门度特征、权威特征、重要性特征、内部点击 链接特征、以及外部点击链接特征组成的分组中所选择的一个或多个特征; 针对所标识的特征中的每个而生成特征分数;并且 基于所述讨论话题的所述特征分数的加权的组合而生成所述讨论话题的相关性分数; 以及 基于所述讨论话题的整体的分数而对所述讨论话题进行排名。
【文档编号】G06F17/30GK105917364SQ201480071854
【公开日】2016年8月31日
【申请日】2014年12月12日
【发明人】N·沃伦可夫, D·梅耶泽
【申请人】微软技术许可有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1