数学问题求解模型的训练方法和装置、推理方法和装置的制造方法_2

文档序号：9217299阅读：来源：国知局

从样本空间中剔除了假阳性样本，因而样本空间中样本的数量大大减少。
[0049] S22,提取所述训练文本的特征向量。
[0050] 所述特征向量是所述训练文本的特征参数。由于本实施例中公式模板不再考虑未知量本身，所以可以通过对从所述训练文本中提取的特征向量的设计，解决文本中的数字与所述公式模板中系数槽位之间的最优对齐的问题。
[0051] 在提取所述训练文本的特征向量的过程中，可以通过提取所述训练文本中数字的上下文特征确定所述训练文本的特征向量元素，也可以通过所述训练文本中不同数字的上下文之间的相似程度来确定所述训练文本的特征向量元素，还可以通过所述训练文中不同数字的上下文之间的相关程度来确定所述训练文本的特征向量元素，最后还可以通过所述训练文本中数字与所述训练文本中问句之间的相关程度来确定所述训练文本的特征向量元素。
[0052] 通过提取所述训练文本中数字的上下文特征确定所述训练文本的特征向量元素时，可以提取数字的上下文的词性标签、词语标签以及依存特征，并将上述三种上下文特征作为该数字在所述训练文本中的上下文特征。
[0053] 在通过数字的上下文之间的相似程度确定所述训练文本的特征向量元素之时，可以通过提取所述训练文本中每个数字的上下文中的词语、词性标签以及依存特征，计算不同数字的上下文的上述三种属性之间的相似程度，并将计算得到的相似程度作为所述数字的上下文之间的相似程度。
[0054] 进一步优选的，可以提取所述训练文本中每个数字[_5,5]大小的窗口内的上下文中的词语、词性标签及依存特征，并依据上述三种特征计算所述数字的上下文之间的相似程度。
[0055] 在通过数字的上下文之间的相关程度确定所述训练文本的特征向量元素之时，可以获取与所述数字相关的名词词组，再依据所述名词词组中各个名词的出现次序，确定所述数字的上下文之间的相关程度。
[0056] 在通过所述训练文本中数字与所述训练文本中问句之间的相关程度来确定所述训练文本的特征向量元素之时，假设名词词组NPi是与数字ni相关联的名词词组，noun」是名词词组NPi中按照与数字的依存关系排序的第j个名词，并且noun」是在问句中首先出现的名词，则可以确定数字^与问句之间的相关程度为1/j。数字与问句的相关程度的取值越大，数字更大程度的与被查询主体相联系。
[0057] S23,通过求解由最大化正确解与错误解之间的边际而规约得到的二次规划问题，确定所述数学问题求解模型的权重向量。
[0058] 由于每个数学问题可能对应多个公式模板，并且用同一个公式模板之时，文本中的数字又存在多个不同的对齐方案，所以对于同一个数学问题，其可能的解的数量十分巨大。这样，就造成式（2)的搜索空间中搜索样本的数量十分巨大，精确的求解最大似然估计问题的难度。如果采用折中的近似解法，则有可能产生局部收敛的问题，导致计算效果的下降。
[0059] 在本实施例中，定义y。是对自然语言描述的数学问题的正确的解，而y6是对自然语言描述的数学问题的错误的解。本实施例给出数学问题自动求解模型的训练目标是：
[0060] P(yc |x) >p(ye |x) (3)
[0061] 在式（3)中，p(ycJx)表示对于问题x，获得正确解y。的概率，p(ye|x)表示对于问题X，获得错误解I的概率。
[0062] 对式（3)的两端取对数，则有：
[0063] Inp(yc|x) >Inp(ye |x) (4)
[0064] 将式（1)代入上式，则有：
[0065] 0 ?伞（x，yc) > 0 ?伞（x，ye) (5)
[0066] 其中，0是所述数学问题求解模型的模型参数，也就是权重向量。它表示不同的公式模板及不同的数字对齐方式在所述数学问题的最优解中所占的权重比例。巾则表示问题x的特征向量。并且巾（X，y。）表示问题x与正确解y。之间的特征向量，巾（X，ye)表示问题x与错误解之间的特征向量。
[0067] 加入对0的约束条件，则有如下的约束优化问题：
[0069] 该约束优化问题是一个典型的二次规划问题。所以，在模型训练过程中，可以通过对式（6)的求解确定模型中的权重向量0，进而完成对数学问题自动求解模型的训练。其中，I是一个大于零的变量。
[0070] -旦所述模型中的权重向量一一确定，则所述数学问题求解模型确定，也就是所述数学问题求解模型训练完毕。
[0071] 在使用训练完成的数学问题自动求解模型解决实际的自然语言描述的数学问题时，可以根据如下公式确定所述数学问题的最优解y。：
[0073] 应该理解的是，二次规划问题是一个凸优化问题，具有全局最优解。因此，通过求解二次规划问题来确定数学问题求解模型中的模型参数，也就是权重向量，能够保证得到的模型参数是全局最优解，不存在局部收敛的问题。
[0074] 本实施例通过确定针对训练文本的简化的公式模板库，提取所述训练文本的特征向量，以及通过求解由最大化正确解与错误解之间的边际而规约得到的二次规划问题，确定所述数学问题求解模型的权重向量，不仅有效的缩小了模型的搜索空间，降低了运算量，而且克服了现有技术中存在的局部收敛问题。
[0075] 第二实施例
[0076] 本实施例以本发明的上述实施例为基础，进一步的提供了数学问题求解模型的训练方法中特征向量提取的一种技术方案。在该技术方案中，根据所述训练文本中不同数字的上下文之间的相关程度确定所述训练文本的特征向量元素包括：获取与所述数字相关联的名词词组；根据所述名词词组中不同名词的出现次序，确定所述训练文本的特征向量元素。
[0077] 参见图5,根据所述训练文本中数字之间的相关程度确定所述训练文本的特征向量元素包括：
[0078] S51，获取与所述数字相关联的名词词组。
[0079] 为了正确的解决所述数学问题，我们需要根据不同数字之间的关系建立方程。
[0080] 应该理解的是，在所述训练文本中，每个数字都有与之相关联的名词词组，在根据数字之间的相关程度确定所述训练文本的特征向量元素之时，首先应当获取与这些数字相关联的名词词组。一般情况下，所述名词词组中包括至少两个名词，但是，也不排除所述名词词组中只包括一个名词的情况。
[0081] S52,根据所述名词词组中不同名词的出现次序，确定所述训练文本的特征向量元素。
[0082] 假设^及^是在所述训练文本中出现的两个数字，与它们最为相关的名词词组分别是NP^NP2。在NPi中出现的名词分别根据依存路径的长度而排序。这样，数字n#n2 之间的关系可以通过如下公式表示：
[0084] 其中，斯是名词词组NP^的名词，也即与数字相关的名词。ord(X)函数用于计算名词的出现次序，这种次序由名词与同它相关的数字之间的路径长度所决定。根据式（8)计算得到的r(ni，n2)的取值越大，表明数字ni与数字112之间的相关程度越高。
[0085] 这种特征参数有助于对训练操作引入一些基本的规则。例如，与被加数相关联的名词应当相同。另外，这种特征参数体现了一些非显性的关系。参见图6,尽管数字6100与数字405相关联的名词都是"dollar"，但是数字6100与7%、6%通过名词"fund"相关联，而数字405与7 %、6 %通过名词"interest"相关联。这种不同有助于将上述两个数字对齐至模板中的正确槽位。
[0086] 本实施例通过获取与所述数字相关联的名词，以及根据所述不同数字与所述相同名词之间相关联的次序，确定所述训练文本的特征向量元素，实现了根据所述训练文本中数字与所述训练文本中问句之间的相关程度确定所述训练文本的特征向量元素。
[0087] 第三实施例
[0088] 本实施例以本发明的上述实施例为基础，进一步的提供了所述数学问

完整全部详细技术资料下载

当前第2页1 2 3 4