一种反馈答案的方法和装置与流程

文档序号：12364000阅读：327来源：国知局

本发明涉及计算机技术领域，特别涉及一种反馈答案的方法和装置。

背景技术：

随着计算机以及信息检索技术的发展，人们越来越倾向于借助计算机来寻求某个问题的答案，相应的，问答系统的使用越来越广泛。

现有的社区问答系统的实现一般是：用户通过终端输入一个问题，服务器从答案查询库中获取预存的所有答案，确定用户输入的问题与其中的某个答案公有的词汇，计算公有的每个词汇在该答案中出现的次数之和，将其作为此答案与用户输入的问题的文本接近度，按照此方法，计算答案查询库中每个答案与用户输入的问题的文本接近度，将与问题文本接近度最大的答案推送给用户。

在实现本发明的过程中，发明人发现现有技术至少存在以下问题：

基于上述的社区问答系统的实现方法，服务器在向用户推送答案时，主要是基于问题和答案之间的词汇匹配程度来计算问题和答案之间的文本接近度，但是用户所需要的答案可能与用户输入的问题不存在共同的词汇(即存在词汇鸿沟)，或者共同的词汇出现的次数较少，这样，推送给用户的答案与用户需求匹配的可能性较低，从而，导致服务器进行答案反馈的准确率较低。

技术实现要素：

为了解决现有技术的问题，本发明实施例提供了一种反馈答案的方法和装置。所述技术方案如下：

第一方面，提供了一种反馈答案的方法，所述方法包括：

根据训练样本库中存储的问题、最佳答案及其它答案的对应关系，基于问题与对应的最佳答案的语义接近度大于问题与对应的其它答案的语义接近度的训练条件，对预设的语义提取公式中的语义提取参数进行训练，得到所述语义提取参数的训练值；

当接收到携带有目标问题的解答请求时，根据所述目标问题、答案查询库中的各答案、所述语义提取公式、以及所述语义提取参数的训练值，分别确定所述各答案与所述目标问题的语义接近度；

根据所述各答案与所述目标问题的语义接近度，在所述各答案中选取目标答案，对所述解答请求进行反馈。

第二方面，提供了一种反馈答案的装置，所述装置包括：

训练模块，用于根据训练样本库中存储的问题、最佳答案及其它答案的对应关系，基于问题与对应的最佳答案的语义接近度大于问题与对应的其它答案的语义接近度的训练条件，对预设的语义提取公式中的语义提取参数进行训练，得到所述语义提取参数的训练值；

确定模块，用于当接收到携带有目标问题的解答请求时，根据所述目标问题、答案查询库中的各答案、所述语义提取公式、以及所述语义提取参数的训练值，分别确定所述各答案与所述目标问题的语义接近度；

反馈模块，用于根据所述各答案与所述目标问题的语义接近度，在所述各答案中选取目标答案，对所述解答请求进行反馈。

本发明实施例提供的技术方案带来的有益效果是：

本发明实施例中，根据训练样本库中存储的问题、最佳答案及其它答案的对应关系，基于问题与对应的最佳答案的语义接近度大于问题与对应的其它答案的语义接近度的训练条件，对预设的语义提取公式中的语义提取参数进行训练，得到所述语义提取参数的训练值，当接收到携带有目标问题的解答请求时，根据所述目标问题、答案查询库中的各答案、所述语义提取公式、以及所述语义提取参数的训练值，分别确定所述各答案与所述目标问题的语义接近度，根据所述各答案与所述目标问题的语义接近度，在所述各答案中选取目标答案，对所述解答请求进行反馈。这样，基于语义接近度进行答案选取，避免了问题和答案存在的词汇鸿沟问题，从而，可以提高针对问题反馈的答案的准确度。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种反馈答案的方法流程图；

图2是本发明实施例提供的一种训练过程的示意图；

图3是本发明实施例提供的一种反馈答案的装置结构示意图；

图4是本发明实施例提供的一种服务器的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

实施例一

本发明实施例提供了一种反馈答案的方法，如图1所示，该方法的处理流程可以包括如下的步骤：

步骤101，根据训练样本库中存储的问题、最佳答案及其它答案的对应关系，基于问题与对应的最佳答案的语义接近度大于问题与对应的其它答案的语义接近度的训练条件，对预设的语义提取公式中的语义提取参数进行训练，得到语义提取参数的训练值。

步骤102，当接收到携带有目标问题的解答请求时，根据目标问题、答案查询库中的各答案、语义提取公式、以及语义提取参数的训练值，分别确定各答案与目标问题的语义接近度。

步骤103，根据各答案与目标问题的语义接近度，在各答案中选取目标答案，对解答请求进行反馈。

实施例二

本发明实施例提供了一种反馈答案的方法，该方法的执行主体可以为服务器，该服务器可以是社区问答网站或应用的服务器，该服务器中可以设置有处理器、存储器、收发器，处理器可以用于对语义提取参数的训练和针对问题反馈答案的处理，存储器可以用于存储下述处理过程中需要的数据以及产生的数据，收发器可以用于接收和发送数据，。下面将结合具体实施方式，对图1所示的处理流程进行详细的说明，内容可以如下：

其中，在大数据处理时，可以对语句(如问题、答案等)的语义进行量化，语义提取公式可以是用于提取问题或者答案的语义的公式。语义提取参数可以是语义提取公式中的常数系数，可以通过训练过程确定。语义接近度可以是问题与答案在语义(即语句的表达意思)层面的接近程度。

在实施中，服务器可以从互联网上获取一些问题及其对应的答案，将其存储在训练样本库中，例如可以在某些社区问答系统中获取一些问题及对应的答案，其中，对于训练样本库中的每个问题都对应有一定数量的答案，其中包括对应于每个问题的最佳答案(一般可以是由提出问题的用户选出的答案)和其他答案。对于词库中存在的每个词都对应有词向量(可以称为分布向量)，其中，词向量可以是d维的向量(d可以是50)，其中的某一维的数值可以用来表示该词对应某一语义项的取值，例如，宝马一词的词向量可以是[0.5；0.8；……]，其中，词向量的第一维对应的语义项可以是“该词用于表示动物的可能性”，0.5表示该可能性的数值，第二维对应的语义项可以是“该词用于表示车辆的可能性”，0.8表示该可能性的数值。服务器可以获取问题和答案中的每个词的词向量。针对训练样本库中的每个问题及其对应的答案，服务器可以得到其对应的包含词向量的矩阵(可称为词矩阵)，词矩阵的每一列对应词库中的每个词的词向量。例如，目前词库中有V个词，词矩阵的维数可以是d×V，服务器获取到训练样本库中某个问题或答案后，可以得到获取的问题或答案中出现的词的词向量，并将其放在词矩阵中的对应的位置，词矩阵的其它位置可以设置为零(即问题或答案中没有出现的词对应在词矩阵中的列为零)，这样，每个不同的问题或答案都有其对应的词矩阵。

服务器可以将训练样本库中的每个问题或答案对应的词矩阵向量化，得到表征问题或答案的向量，可以用E_x表示，下标x可以是问题(可以用q表示问题)或者答案(可以用a表示答案)，即E_q表示问题对应的词矩阵向量化后的向量，E_a表示答案对应的词矩阵向量化后的向量。服务器得到训练样本库中的每个问题和答案的E_q、E_a后，对其进行一定比例的损毁，即可以将其中的一些值强制设置为零(可以随机的在其中选取一些值)，得到E～_x，进而可以利用下面的语义提取公式提取问题或答案所表征的语义：

$<mrow> <mi>z</mi> <mo>=</mo> <mi>f</mi> <mrow> <mo>(</mo> <mi>W</mi> <mo>*</mo> <mover> <mi>E</mi> <mo>~</mo> </mover> <mi>x</mi> <mo>+</mo> <mi>b</mi> <mo>)</mo> </mrow> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>$

其中，z可称为语义向量，可以表征问题或答案的语义，W可以称为加权矩阵，用于对的语义提取和降维，b可以称为偏置向量，与W共同用于提取问题或答案所表征的语义，W、b可称为语义提取参数，f()是非线性函数，用于提取问题或答案所表征的语义，可以选取为S函数、双曲线函数或者整流函数等等，本文中f()以整流函数为例，即f()、W和b共同作用来提取问题或答案所表征的语义。

针对训练样本库中的每个问题及其对应的答案，服务器得到向量z后，可以计算问题和答案之间的语义接近度，可以用向量之间的余弦夹角来表示问题和答案之间的语义接近度，根据问题与对应的最佳答案的语义接近度大于问题与对应的其它答案的语义接近度的条件，训练公式(1)中的加权矩阵和偏置矩阵，得到最终的训练值。

可选的，可以通过增大问题与对应的最佳答案的语义接近度减去问题与对应的其它答案的语义接近度的差值总和的方式，得到上述公式(1)中的语义提取参数，相应的，步骤101的处理过程可以如下：根据训练样本库中存储的问题、最佳答案及其它答案的对应关系，基于增大问题与对应的最佳答案的语义接近度减去问题与对应的其它答案的语义接近度的差值总和的训练条件，对预设的语义提取公式中的语义提取参数进行训练，得到所述语义提取参数的训练值。

在实施中，获取样本训练库中的一个问题及其对应的最佳答案和其他答案，其中，问题对应的最佳答案可以记为a⁺，问题对应的其他答案可以记为a_j^—，j表示问题对应的第j个其他答案，可以是1到该问题对应的其他答案的总数中的任一整数，例如，问题对应的最佳答案之外的其他答案有N个，j＝1,2，…N。将获取的样本训练库中的一个问题及其对应的最佳答案和其他答案作为训练数据，建立目标函数，并对建立的目标函数进行训练，得到语义提取参数的训练值。

以样本训练库中的一个问题及其对应的最佳答案和其他答案为训练数据的训练过程如下：问题和答案按照公式(1)进行语义提取得到问题对应的语义向量，可分别可以记为z_q和z_a，得到问题和其对应的所有答案的语义向量后，可以按照公式(2)计算答案和问题之间的语义接近度，

$<mrow> <mi>sim</mi> <mrow> <mo>(</mo> <mi>q</mi> <mo>,</mo> <mi>a</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>cos</mi> <mrow> <mo>(</mo> <msub> <mi>z</mi> <mi>q</mi> </msub> <mo>,</mo> <msub> <mi>z</mi> <mi>a</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <msub> <mi>z</mi> <mi>q</mi> </msub> <mo>·</mo> <msub> <mi>z</mi> <mi>a</mi> </msub> </mrow> <mrow> <mo>|</mo> <mo>|</mo> <msub> <mi>z</mi> <mi>q</mi> </msub> <mo>|</mo> <mo>|</mo> <mo>·</mo> <mo>|</mo> <mo>|</mo> <msub> <mi>z</mi> <mi>a</mi> </msub> <mo>|</mo> <mo>|</mo> </mrow> </mfrac> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>$

其中，sim(q,a)表示问题及其对应的所有答案的预计接近度，本文采用的公式(2)是采用问题和答案对应的语义向量之间的余弦夹角来表示问题及其对应的所有答案的语义接近度。服务器可以按照公式(3)建立损失函数，

$<mrow> <mi>L</mi> <mrow> <mo>(</mo> <mi>q</mi> <mo>,</mo> <mi>a</mi> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mi>Σ</mi> <mi>j</mi> </munder> <mrow> <mo>(</mo> <mi>sim</mi> <mrow> <mo>(</mo> <msup> <mrow> <mi>q</mi> <mo>,</mo> <mi>a</mi> </mrow> <mo>+</mo> </msup> <mo>)</mo> </mrow> <mo>-</mo> <mi>sim</mi> <mrow> <mo>(</mo> <mi>q</mi> <mo>,</mo> <msubsup> <mi>a</mi> <mi>j</mi> <mo>-</mo> </msubsup> <mo>)</mo> </mrow> <mo>)</mo> </mrow> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>$

其中，L(q,a)表示问题与对应的最佳答案的语义接近度减去问题与对应的其它答案的语义接近度的差值总和，sim(q,a⁺)表示问题与对应的最佳答案的语义接近度，表示问题与对应的每个其它答案的语义接近度，公式(3)即是进行训练的第一目标函数。对公式(3)中包含的语义提取参数设置初始值，利用梯度下降法，训练第一目标函数，得到公式(3)中包含的语义提取参数W、b的训练值，此时，将样本训练库中的一个问题及其对应的答案作为训练数据，对基于该训练数据建立的目标函数的训练过程结束，结束后得到了语义提取参数W、b的训练值。

服务器获取样本训练库中的下一个问题及其对应的最佳答案和其它答案，将其作为训练数据，并按照上述的训练过程建立第一目标函数，并利用BP算法(Back Propagation，反向传播)将上述得到的语义提取参数W、b的训练值，作为训练该第一目标函数的初始值，训练第一目标函数，得到此次的语义提取参数W、b的训练值，将其作为下一次训练的初始值，依次递推，直到样本训练库中的所有问题及其对应的最佳答案和其它答案训练完毕，整个的训练过程结束，并得到最终的语义提取参数W、b的训练值，并将其存储。

另外的，为降低去目标函数的梯度时的复杂度，在上述的训练过程中，目标函数也可以采用公式(4)所示的公式，

$<mrow> <mi>L</mi> <mrow> <mo>(</mo> <msup> <mrow> <mi>q</mi> <mo>,</mo> <mi>a</mi> </mrow> <mo>+</mo> </msup> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mi>Σ</mi> <mi>j</mi> </munder> <mi>max</mi> <mo>{</mo> <mn>0</mn> <mo>,</mo> <mi>δ</mi> <mo>-</mo> <mi>sim</mi> <mrow> <mo>(</mo> <msup> <mrow> <mi>q</mi> <mo>,</mo> <mi>a</mi> </mrow> <mo>+</mo> </msup> <mo>)</mo> </mrow> <mo>+</mo> <mi>sim</mi> <mrow> <mo>(</mo> <msubsup> <mrow> <mi>q</mi> <mo>,</mo> <mi>a</mi> </mrow> <mi>j</mi> <mo>-</mo> </msubsup> <mo>)</mo> </mrow> <mo>}</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>$

其中，公式(4)表示的物理含义与公式(3)近似相同，训练的依据都是使问题与对应的最佳答案的语义接近度大于问题与对应的其他答案的语义接近度， $<mrow> <mi>δ</mi> <mo>=</mo> <mn>1</mn> <mo>/</mo> <mn>2</mn> <mo>-</mo> <mi>sim</mi> <mrow> <mo>(</mo> <msubsup> <mrow> <mi>q</mi> <mo>,</mo> <mi>a</mi> </mrow> <mi>j</mi> <mo>-</mo> </msubsup> <mo>)</mo> </mrow> <mo>.</mo> </mrow>$

可选的，还可以通过另一个训练过程确定上述训练过程的初值，相应的，训练过程可以如下：步骤一，根据训练样本库中存储的各问题和各答案，基于减小对语句顺序执行语义提取和语义提取的逆处理后得到的语句与语义提取前的语句的差异度的训练条件，对预设的语义提取公式中的语义提取参数进行训练，得到所述语义提取参数的中间训练值；其中，所述语句为问题或答案；步骤二，根据训练样本库中存储的问题、最佳答案及其它答案的对应关系，基于问题与对应的最佳答案的语义接近度大于问题与对应的其它答案的语义接近度的训练条件，将所述语义提取参数的中间训练值作为初始输入值，对所述语义提取公式中的语义提取参数进行训练，得到所述语义提取参数的训练值。

其中，顺序执行语义提取可以是按照公式(1)所示的公式进行语句的语义提取，可以称为是对语句的编码过程，语义提取的逆处理可以是对公式(1)的逆处理，可以得到与编码前的E_x具有相同维数的E’_x，此处理可以称作是解码过程，可以利用去噪自动编码机实现编码过程和解码过程的整个过程，可以将去噪自动编码机看作是一种特殊的神经网络。

在实施中，如图2所示，步骤一的处理过程如下：获取样本训练库中的各问题各答案中的某一个问题或答案，得到其对应的E_x，之后对其进行一定比例的损毁，可以将其中的一些值强制设置为零，得到按照公式(1)对其进行语义提取，得到每个问题和每个答案的语义向量z，其中z包含语义提取参数W、b，即对进行编码后得到相应的语义向量z，之后服务器利用g(z)对z进行逆变换，即对编码后得到的语义向量z进行逆变换得到g(f())，此过程为解码过程。基于减小解码之后得到的E’_x与编码前的E_x的差异度的训练条件，建立如下公式(5)为第二目标函数：

L(g(f()),E_x)＝||g(f())-E_x||₂……(5)

其中，公式(5)表示利用选用的语义提取参数对编码，再对其解码，得到的E’_x与损毁前的E_x的差异向量的模，公式(5)的值越小，得到的语义提取参数越能准确表达语句的语义，对公式(5)中包含的语义提取参数设置初始值，利用梯度下降法训练第二目标函数，得到语义提取参数的训练值。

服务器获取样本训练库中的其它问题或答案，将其作为训练数据，并按照上述的训练过程建立第二目标函数，并利用BP算法将上述得到的语义提取参数W、b训练值，作为训练该第二目标函数的初始值，训练第二目标函数，依次递推，直到样本训练库中的所有问题和答案训练完毕，整个的训练过程结束，并得到最终的语义提取参数W、b的训练值。

将步骤一得到的语义提取参数的训练值作为整个训练过程的中间训练值，将其作为步骤二的训练过程的初始值，按照步骤二继续训练得到最终的语义提取参数W、b，并将其存储，其中步骤二的训练过程可以是上述步骤101中基于增大问题与对应的最佳答案的语义接近度减去问题与对应的其它答案的语义接近度的差值和的训练条件进行训练的训练过程，相应的处理方式可以参见步骤101中的具体描述，此处不再累述。

可选的，训练语义提取参数时，可以对样本训练库中的问题和答案分别进行训练，得到问题和答案各自的语义提取参数，相应的，上述步骤一的处理过程可以如下：根据训练样本库中存储的各问题，基于减小对问题顺序执行语义提取和语义提取的逆处理后得到的语句与语义提取前的语句的差异度的训练条件，对预设的问题语义提取公式中的问题语义提取参数进行训练，得到所述问题语义提取参数的中间训练值；根据训练样本库中存储的各答案，基于减小对语句顺序执行语义提取和语义提取的逆处理后得到的语句与语义提取前的语句的差异度的训练条件，对预设的答案语义提取公式中的答案语义提取参数进行训练，得到所述答案语义提取参数的中间训练值；上述步骤二的处理流程可以如下：根据训练样本库中存储的问题、最佳答案及其它答案的对应关系，基于问题与对应的最佳答案的语义接近度大于问题与对应的其它答案的语义接近度的训练条件，将所述问题语义提取参数的中间训练值和所述答案语义提取参数的中间训练值作为初始输入值，对所述问题语义提取公式中的问题语义提取参数和所述答案语义提取公式中的答案语义提取参数进行训练，得到所述问题语义提取参数的训练值和所述答案语义提取参数的训练值。

在实施中，在上述步骤一的训练过程中，样本训练库中的问题或答案可以采用不同的W和b，分别按照公式(1)进行语义提取，即样本训练库中的问题可以采用一对W和b(可以记为W₁、b₁)进行语义提取，样本训练库中的问题对应的答案可以采用另一对W和b(可以记为W₂、b₂)进行语义提取，并按照步骤一所述的方式分别建立目标函数并训练，得到W₁、b₁和W₂、b₂的训练值，作为整个训练过程的中间训练值，并将其作为步骤二的初始值，按照步骤二所述的处理流程继续训练得到最终的语义提取参数W₁、b₁和W₂、b₂，并将其存储，其中，在步骤二的训练过程中，计算问题以及对应的最佳答案和其它答案的语义向量，并根据得到的语义向量按照公式(2)计算语义相似度时，语义相似度中包含着W₁、b₁和W₂、b₂四个语义提取参数，相应的处理方式可以参见步骤一、二中的具体描述，此处不再累述。

其中，目标问题可以是用户通过终端输入的想要获知答案的问题，答案查询库可以是上述的样本训练库，也可以是存储服务器从互联网上获取的一些答案的库，用于服务器从中选取匹配目标问题的答案。

在实施中，用户通过终端输入目标问题并向服务器发送解答请求后，服务器会接收到用户发送的解答请求，进而服务器对其进行解析，获取其中携带的目标问题，将服务器存储的语义提取参数的训练值代入公式(1)中，可以按照公式(1)计算目标问题以及答案查询库中的各答案的语义向量，得到目标问题以及答案查询库中的各答案的语义向量后，可以按照公式(2)计算答案查询库中的各答案分别与目标问题的语义接近度。

可选的，针对上述问题和答案分别进行训练的情况；相应的，当服务器接收到终端发送的解答请求时的处理过程可以如下：当接收到携带有目标问题的解答请求时，根据所述目标问题、答案查询库中的各答案、所述问题语义提取公式、所述答案语义提取公式、以及所述问题语义提取参数的训练值和所述答案语义提取参数的训练值，分别确定所述各答案与所述目标问题的语义接近度。

在实施中，服务器获得问题和答案分别的语义提取参数后，接收到携带有目标问题的解答请求时，可以根据问题和答案分别对应的语义提取参数，按照公式(1)分别计算目标问题以及答案查询库中的各答案的语义向量，确定了各自的语义向量后，可以按照公式(2)计算答案查询库中的各答案与目标问题的语义相似度。

步骤103，根据各答案与目标问题的语义接近度，在各答案中选取目标答案，对解答请求进行反馈。

其中，目标答案可以是答案查询库中的各答案匹配于目标问题的答案，可以是其中的一个答案，也可以是其中的几个答案。

在实施中，服务器获得答案查询库中的各答案分别与目标问题的语义接近度后，可以按照从大到小的顺序将得到的语义接近度进行排序，可以将最大的语义接近度对应的答案选取为目标答案，或者将排序后的前几个语义接近度对应的答案选取为目标答案，选取到目标答案后，将目标答案通过终端反馈给用户。

可选的，还可以将得到的语义接近度与基于词汇匹配的一些特征进行结合，相应的，步骤103的处理流程可以如下：根据所述各答案与所述目标问题的语义接近度，以及所述各答案与所述目标问题的文本接近度，在所述各答案中选取目标答案，对所述解答请求进行反馈。

其中，文本接近度可以是各答案和目标问题基于词汇匹配的接近度。

在实施中，服务器获得答案查询库中的各答案与目标问题的语义接近度后，将其存储，并按照公式(6)-(16)所示的公式计算答案查询库中的各答案与目标问题基于词汇匹配的文本接近度，

$<mrow> <msub> <mi>F</mi> <mn>1</mn> </msub> <mo>=</mo> <msub> <mi>Σ</mi> <mrow> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>&Element;</mo> <mi>q</mi> <mo>∩</mo> <mi>a</mi> </mrow> </msub> <mi>c</mi> <mrow> <mo>(</mo> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>,</mo> <mi>a</mi> <mo>)</mo> </mrow> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mrow> <mo>(</mo> <mn>6</mn> <mo>)</mo> </mrow> </mrow>$

$<mrow> <msub> <mi>F</mi> <mn>2</mn> </msub> <mo>=</mo> <msub> <mi>Σ</mi> <mrow> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>&Element;</mo> <mi>q</mi> <mo>∩</mo> <mi>a</mi> </mrow> </msub> <mi>log</mi> <mrow> <mo>(</mo> <mi>c</mi> <mrow> <mo>(</mo> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>,</mo> <mi>a</mi> <mo>)</mo> </mrow> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mrow> <mo>(</mo> <mn>7</mn> <mo>)</mo> </mrow> </mrow>$

$<mrow> <msub> <mi>F</mi> <mn>3</mn> </msub> <mo>=</mo> <msub> <mi>Σ</mi> <mrow> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>&Element;</mo> <mi>q</mi> <mo>∩</mo> <mi>a</mi> </mrow> </msub> <mi>c</mi> <mrow> <mo>(</mo> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>,</mo> <mi>a</mi> <mo>)</mo> </mrow> <mo>/</mo> <mo>|</mo> <mi>a</mi> <mo>|</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mrow> <mo>(</mo> <mn>8</mn> <mo>)</mo> </mrow> </mrow>$

$<mrow> <msub> <mi>F</mi> <mn>4</mn> </msub> <mo>=</mo> <msub> <mi>Σ</mi> <mrow> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>&Element;</mo> <mi>q</mi> <mo>∩</mo> <mi>a</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>c</mi> <mrow> <mo>(</mo> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>,</mo> <mi>a</mi> <mo>)</mo> </mrow> <mo>/</mo> <mo>|</mo> <mi>a</mi> <mo>|</mo> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mrow> <mo>(</mo> <mn>9</mn> <mo>)</mo> </mrow> </mrow>$

$<mrow> <msub> <mi>F</mi> <mn>5</mn> </msub> <mo>=</mo> <msub> <mi>Σ</mi> <mrow> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>&Element;</mo> <mi>q</mi> <mo>∩</mo> <mi>a</mi> </mrow> </msub> <mi>log</mi> <mrow> <mo>(</mo> <mo>|</mo> <mi>C</mi> <mo>|</mo> <mo>/</mo> <mi>df</mi> <mrow> <mo>(</mo> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>)</mo> </mrow> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mrow> <mo>(</mo> <mn>10</mn> <mo>)</mo> </mrow> </mrow>$

$<mrow> <msub> <mi>F</mi> <mn>6</mn> </msub> <mo>=</mo> <msub> <mi>Σ</mi> <mrow> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>&Element;</mo> <mi>q</mi> <mo>∩</mo> <mi>a</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>log</mi> <mrow> <mo>(</mo> <mo>|</mo> <mi>C</mi> <mo>|</mo> <mo>/</mo> <mi>df</mi> <mrow> <mo>(</mo> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>)</mo> </mrow> <mo>)</mo> </mrow> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mrow> <mo>(</mo> <mn>11</mn> <mo>)</mo> </mrow> </mrow>$

$<mrow> <msub> <mi>F</mi> <mn>7</mn> </msub> <mo>=</mo> <msub> <mi>Σ</mi> <mrow> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>&Element;</mo> <mi>q</mi> <mo>∩</mo> <mi>a</mi> </mrow> </msub> <mi>log</mi> <mrow> <mo>(</mo> <mo>|</mo> <mi>C</mi> <mo>|</mo> <mo>/</mo> <mi>df</mi> <mrow> <mo>(</mo> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>)</mo> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mrow> <mo>(</mo> <mn>12</mn> <mo>)</mo> </mrow> </mrow>$

$<mrow> <msub> <mi>F</mi> <mn>8</mn> </msub> <mo>=</mo> <msub> <mi>Σ</mi> <mrow> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>&Element;</mo> <mi>q</mi> <mo>∩</mo> <mi>a</mi> </mrow> </msub> <mi>log</mi> <mrow> <mo>(</mo> <mi>c</mi> <mrow> <mo>(</mo> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>,</mo> <mi>a</mi> <mo>)</mo> </mrow> <mo>/</mo> <mo>|</mo> <mi>a</mi> <mo>|</mo> <mo>)</mo> </mrow> <mi>log</mi> <mrow> <mo>(</mo> <mo>|</mo> <mi>C</mi> <mo>|</mo> <mo>/</mo> <mi>df</mi> <mrow> <mo>(</mo> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mrow> <mo>(</mo> <mn>13</mn> <mo>)</mo> </mrow> </mrow>$

$<mrow> <msub> <mi>F</mi> <mn>9</mn> </msub> <mo>=</mo> <msub> <mi>Σ</mi> <mrow> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>&Element;</mo> <mi>q</mi> <mo>∩</mo> <mi>a</mi> </mrow> </msub> <mi>c</mi> <mrow> <mo>(</mo> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>,</mo> <mi>a</mi> <mo>)</mo> </mrow> <mi>log</mi> <mrow> <mo>(</mo> <mo>|</mo> <mi>C</mi> <mo>|</mo> <mo>/</mo> <mi>df</mi> <mrow> <mo>(</mo> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>)</mo> </mrow> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mrow> <mo>(</mo> <mn>14</mn> <mo>)</mo> </mrow> </mrow>$

$<mrow> <msub> <mi>F</mi> <mn>10</mn> </msub> <mo>=</mo> <msub> <mi>Σ</mi> <mrow> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>&Element;</mo> <mi>q</mi> <mo>∩</mo> <mi>a</mi> </mrow> </msub> <mi>log</mi> <mrow> <mo>(</mo> <mi>c</mi> <mrow> <mo>(</mo> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>,</mo> <mi>a</mi> <mo>)</mo> </mrow> <mo>/</mo> <mo>|</mo> <mi>a</mi> <mo>|</mo> <mo>·</mo> <mo>|</mo> <mi>C</mi> <mo>|</mo> <mo>/</mo> <mrow> <mo>(</mo> <mi>c</mi> <mrow> <mo>(</mo> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>,</mo> <mi>C</mi> <mo>)</mo> </mrow> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mrow> <mo>(</mo> <mn>15</mn> <mo>)</mo> </mrow> </mrow>$

$<mrow> <msub> <mi>L</mi> <mn>1</mn> </msub> <mo>=</mo> <msub> <mi>Σ</mi> <mrow> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>&Element;</mo> <mi>q</mi> <mo>∩</mo> <mi>a</mi> </mrow> </msub> <mi>log</mi> <mrow> <mo>(</mo> <mo>|</mo> <mi>a</mi> <mo>|</mo> <mo>-</mo> <mi>c</mi> <mrow> <mo>(</mo> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>,</mo> <mi>a</mi> <mo>)</mo> </mrow> <mo>+</mo> <mn>0.5</mn> <mo>)</mo> </mrow> <mo>/</mo> <mrow> <mo>(</mo> <mi>c</mi> <mrow> <mo>(</mo> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>,</mo> <mi>a</mi> <mo>)</mo> </mrow> <mo>+</mo> <mn>0.5</mn> <mo>)</mo> </mrow> <mi>c</mi> <mrow> <mo>(</mo> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>,</mo> <mi>a</mi> <mo>)</mo> </mrow> <mo>*</mo> <mrow> <mo>(</mo> <msub> <mi>k</mi> <mn>1</mn> </msub> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>/</mo> <mrow> <mo>(</mo> <mi>c</mi> <mrow> <mo>(</mo> <msub> <mi>q</mi> <mi>i</mi> </msub> <mo>,</mo> <mi>a</mi> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>k</mi> <mn>1</mn> </msub> <mo>*</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>-</mo> <mi>b</mi> <mo>+</mo> <mi>b</mi> <mo>*</mo> <mo>|</mo> <mi>a</mi> <mo>|</mo> <mo>/</mo> <mi>avg</mi> <mo>|</mo> <mi>C</mi> <mo>|</mo> </mrow> <mo>)</mo> </mrow> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mo>.</mo> <mrow> <mo>(</mo> <mn>16</mn> <mo>)</mo> </mrow> </mrow>$

其中，c(q_i,a)可以是q_i在a中出现的次数，df(q_i)可以是q_i在答案查询库中的各答案中出现的次数，|a|可以是答案a中包含的词的数目，|C|可以是答案查询库中的各答案包含的词的数目，C可以是答案查询库中的各答案，k₁∈[1.2,2.0]，b＝0.75，avg|C|可以是答案查询库中的各答案包含的词的数目的平均值，得到各答案与目标问题文本相似度后，将其与上述确定的各答案与目标问题的语义相似度共同放入学习排序框架中，例如是SVM排序算法，得到答案查询库中各答案与目标问题的综合排序，即综合利用语义相似度特征和上述11个公式所示的基于词汇匹配的文本相似度特征而得到的各答案与目标问题的相似度，其中此12个特征的权重可以根据经验值进行人为赋值，也可以利用样本训练库中的样本根据SVM排序算法进行训练得到各个特征对应的权重，将最大的相似度对应的答案通过终端反馈给用户，也可以将排序中的前几个相似度对应的答案通过终端反馈给用户。

实施例三

基于相同的技术构思，本发明实施例还提供了一种反馈答案的装置，如图3所示，该装置包括：

训练模块310，用于根据训练样本库中存储的问题、最佳答案及其它答案的对应关系，基于问题与对应的最佳答案的语义接近度大于问题与对应的其它答案的语义接近度的训练条件，对预设的语义提取公式中的语义提取参数进行训练，得到所述语义提取参数的训练值；

确定模块320，用于当接收到携带有目标问题的解答请求时，根据所述目标问题、答案查询库中的各答案、所述语义提取公式、以及所述语义提取参数的训练值，分别确定所述各答案与所述目标问题的语义接近度；

反馈模块330，用于根据所述各答案与所述目标问题的语义接近度，在所述各答案中选取目标答案，对所述解答请求进行反馈。

可选的，所述训练模块310，用于：

根据训练样本库中存储的问题、最佳答案及其它答案的对应关系，基于增大问题与对应的最佳答案的语义接近度减去问题与对应的其它答案的语义接近度的差值总和的训练条件，对预设的语义提取公式中的语义提取参数进行训练，得到所述语义提取参数的训练值。

可选的，所述训练模块310，用于：

根据训练样本库中存储的各问题和各答案，基于减小对语句顺序执行语义提取和语义提取的逆处理后得到的语句与语义提取前的语句的差异度的训练条件，对预设的语义提取公式中的语义提取参数进行训练，得到所述语义提取参数的中间训练值；其中，所述语句为问题或答案；

根据训练样本库中存储的问题、最佳答案及其它答案的对应关系，基于问题与对应的最佳答案的语义接近度大于问题与对应的其它答案的语义接近度的训练条件，将所述语义提取参数的中间训练值作为初始输入值，对所述语义提取公式中的语义提取参数进行训练，得到所述语义提取参数的训练值。

可选的，所述训练模块310，用于：

根据训练样本库中存储的各问题，基于减小对问题顺序执行语义提取和语义提取的逆处理后得到的语句与语义提取前的语句的差异度的训练条件，对预设的问题语义提取公式中的问题语义提取参数进行训练，得到所述问题语义提取参数的中间训练值；

根据训练样本库中存储的各答案，基于减小对语句顺序执行语义提取和语义提取的逆处理后得到的语句与语义提取前的语句的差异度的训练条件，对预设的答案语义提取公式中的答案语义提取参数进行训练，得到所述答案语义提取参数的中间训练值；

根据训练样本库中存储的问题、最佳答案及其它答案的对应关系，基于问题与对应的最佳答案的语义接近度大于问题与对应的其它答案的语义接近度的训练条件，将所述问题语义提取参数的中间训练值和所述答案语义提取参数的中间训练值作为初始输入值，对所述问题语义提取公式中的问题语义提取参数和所述答案语义提取公式中的答案语义提取参数进行训练，得到所述问题语义提取参数的训练值和所述答案语义提取参数的训练值；

所述确定模块320，用于：

当接收到携带有目标问题的解答请求时，根据所述目标问题、答案查询库中的各答案、所述问题语义提取公式、所述答案语义提取公式、以及所述问题语义提取参数的训练值和所述答案语义提取参数的训练值，分别确定所述各答案与所述目标问题的语义接近度。

可选的，所述反馈模块330，用于：

根据所述各答案与所述目标问题的语义接近度，以及所述各答案与所述目标问题的文本接近度，在所述各答案中选取目标答案，对所述解答请求进行反馈。

需要说明的是：上述实施例提供的反馈答案的装置在反馈答案时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的反馈答案的装置与反馈答案的方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

实施例四

图4是本发明实施例提供的服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(central processing units，CPU)1922(例如，一个或一个以上处理器)和存储器1932，一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中，存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对统计服务器中的一系列指令操作。更进一步地，中央处理器1922可以设置为与存储介质1930通信，在统计服务器1900上执行存储介质1930中的一系列指令操作。

服务器1900还可以包括一个或一个以上电源1926，一个或一个以上有线或无线网络接口1950，一个或一个以上输入输出接口1958，一个或一个以上键盘1956，和/或，一个或一个以上操作系统1941，例如Windows ServerTM，Mac OS XTM，UnixTM，LinuxTM，FreeBSDTM等等。

服务器1900可以包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：

根据所述各答案与所述目标问题的语义接近度，在所述各答案中选取目标答案，对所述解答请求进行反馈。

可选的，所述根据训练样本库中存储的问题、最佳答案及其它答案的对应关系，基于问题与对应的最佳答案的语义接近度大于问题与对应的其它答案的语义接近度的训练条件，对预设的语义提取公式中的语义提取参数进行训练，得到所述语义提取参数的训练值，包括：

可选的，所述根据训练样本库中存储的各问题和各答案，基于减小对语句顺序执行语义提取和语义提取的逆处理后得到的语句与语义提取前的语句的差异度的训练条件，对预设的语义提取公式中的语义提取参数进行训练，得到所述语义提取参数的中间训练值，包括：

所述根据训练样本库中存储的问题、最佳答案及其它答案的对应关系，基于问题与对应的最佳答案的语义接近度大于问题与对应的其它答案的语义接近度的训练条件，将所述语义提取参数的中间训练值作为初始输入值，对所述语义提取公式中的语义提取参数进行训练，得到所述语义提取参数的训练值，包括：

所述当接收到携带有目标问题的解答请求时，根据所述目标问题、答案查询库中的各答案、所述语义提取公式、以及所述语义提取参数的训练值，分别确定所述各答案与所述目标问题的语义接近度，包括：

可选的，所述根据所述各答案与所述目标问题的语义接近度，在所述各答案中选取目标答案，对所述解答请求进行反馈，包括：

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：周光有;肖磊;张小鹏;王巨宏;管刚;刘婷婷;
技术所有人：华中师范大学;腾讯科技（深圳）有限公司;
我是此专利的发明人

上一篇：异种材料复合焊接方法与流程
上一篇：一种网页图标的显示方法和装置与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。