数学问题求解模型的训练方法和装置、推理方法和装置的制造方法_2

文档序号:9217299阅读:来源:国知局
从样本空间中剔除了假阳性 样本,因而样本空间中样本的数量大大减少。
[0049] S22,提取所述训练文本的特征向量。
[0050] 所述特征向量是所述训练文本的特征参数。由于本实施例中公式模板不再考虑未 知量本身,所以可以通过对从所述训练文本中提取的特征向量的设计,解决文本中的数字 与所述公式模板中系数槽位之间的最优对齐的问题。
[0051] 在提取所述训练文本的特征向量的过程中,可以通过提取所述训练文本中数字的 上下文特征确定所述训练文本的特征向量元素,也可以通过所述训练文本中不同数字的上 下文之间的相似程度来确定所述训练文本的特征向量元素,还可以通过所述训练文中不同 数字的上下文之间的相关程度来确定所述训练文本的特征向量元素,最后还可以通过所述 训练文本中数字与所述训练文本中问句之间的相关程度来确定所述训练文本的特征向量 元素。
[0052] 通过提取所述训练文本中数字的上下文特征确定所述训练文本的特征向量元素 时,可以提取数字的上下文的词性标签、词语标签以及依存特征,并将上述三种上下文特征 作为该数字在所述训练文本中的上下文特征。
[0053] 在通过数字的上下文之间的相似程度确定所述训练文本的特征向量元素之时,可 以通过提取所述训练文本中每个数字的上下文中的词语、词性标签以及依存特征,计算不 同数字的上下文的上述三种属性之间的相似程度,并将计算得到的相似程度作为所述数字 的上下文之间的相似程度。
[0054] 进一步优选的,可以提取所述训练文本中每个数字[_5,5]大小的窗口内的上下 文中的词语、词性标签及依存特征,并依据上述三种特征计算所述数字的上下文之间的相 似程度。
[0055] 在通过数字的上下文之间的相关程度确定所述训练文本的特征向量元素之时,可 以获取与所述数字相关的名词词组,再依据所述名词词组中各个名词的出现次序,确定所 述数字的上下文之间的相关程度。
[0056] 在通过所述训练文本中数字与所述训练文本中问句之间的相关程度来确定所述 训练文本的特征向量元素之时,假设名词词组NPi是与数字ni相关联的名词词组,noun」是 名词词组NPi中按照与数字的依存关系排序的第j个名词,并且noun」是在问句中首先出现 的名词,则可以确定数字^与问句之间的相关程度为1/j。数字与问句的相关程度的取值 越大,数字更大程度的与被查询主体相联系。
[0057] S23,通过求解由最大化正确解与错误解之间的边际而规约得到的二次规划问题, 确定所述数学问题求解模型的权重向量。
[0058] 由于每个数学问题可能对应多个公式模板,并且用同一个公式模板之时,文本中 的数字又存在多个不同的对齐方案,所以对于同一个数学问题,其可能的解的数量十分巨 大。这样,就造成式(2)的搜索空间中搜索样本的数量十分巨大,精确的求解最大似然估计 问题的难度。如果采用折中的近似解法,则有可能产生局部收敛的问题,导致计算效果的下 降。
[0059] 在本实施例中,定义y。是对自然语言描述的数学问题的正确的解,而y6是对自然 语言描述的数学问题的错误的解。本实施例给出数学问题自动求解模型的训练目标是:
[0060] P(yc |x) >p(ye |x) (3)
[0061] 在式(3)中,p(ycJx)表示对于问题x,获得正确解y。的概率,p(ye|x)表示对于问 题X,获得错误解I的概率。
[0062] 对式(3)的两端取对数,则有:
[0063] Inp(yc|x) >Inp(ye |x) (4)
[0064] 将式(1)代入上式,则有:
[0065] 0 ?伞(x,yc) > 0 ?伞(x,ye) (5)
[0066] 其中,0是所述数学问题求解模型的模型参数,也就是权重向量。它表示不同的 公式模板及不同的数字对齐方式在所述数学问题的最优解中所占的权重比例。巾则表示问 题x的特征向量。并且巾(X,y。)表示问题x与正确解y。之间的特征向量,巾(X,ye)表示问 题x与错误解之间的特征向量。
[0067] 加入对0的约束条件,则有如下的约束优化问题:
[0069] 该约束优化问题是一个典型的二次规划问题。所以,在模型训练过程中,可以通过 对式(6)的求解确定模型中的权重向量0,进而完成对数学问题自动求解模型的训练。其 中,I是一个大于零的变量。
[0070] -旦所述模型中的权重向量一一确定,则所述数学问题求解模型确定,也就是所 述数学问题求解模型训练完毕。
[0071] 在使用训练完成的数学问题自动求解模型解决实际的自然语言描述的数学问题 时,可以根据如下公式确定所述数学问题的最优解y。:
[0073] 应该理解的是,二次规划问题是一个凸优化问题,具有全局最优解。因此,通过求 解二次规划问题来确定数学问题求解模型中的模型参数,也就是权重向量,能够保证得到 的模型参数是全局最优解,不存在局部收敛的问题。
[0074] 本实施例通过确定针对训练文本的简化的公式模板库,提取所述训练文本的特征 向量,以及通过求解由最大化正确解与错误解之间的边际而规约得到的二次规划问题,确 定所述数学问题求解模型的权重向量,不仅有效的缩小了模型的搜索空间,降低了运算量, 而且克服了现有技术中存在的局部收敛问题。
[0075] 第二实施例
[0076] 本实施例以本发明的上述实施例为基础,进一步的提供了数学问题求解模型的训 练方法中特征向量提取的一种技术方案。在该技术方案中,根据所述训练文本中不同数字 的上下文之间的相关程度确定所述训练文本的特征向量元素包括:获取与所述数字相关联 的名词词组;根据所述名词词组中不同名词的出现次序,确定所述训练文本的特征向量元 素。
[0077] 参见图5,根据所述训练文本中数字之间的相关程度确定所述训练文本的特征向 量元素包括:
[0078] S51,获取与所述数字相关联的名词词组。
[0079] 为了正确的解决所述数学问题,我们需要根据不同数字之间的关系建立方程。
[0080] 应该理解的是,在所述训练文本中,每个数字都有与之相关联的名词词组,在根据 数字之间的相关程度确定所述训练文本的特征向量元素之时,首先应当获取与这些数字相 关联的名词词组。一般情况下,所述名词词组中包括至少两个名词,但是,也不排除所述名 词词组中只包括一个名词的情况。
[0081] S52,根据所述名词词组中不同名词的出现次序,确定所述训练文本的特征向量元 素。
[0082] 假设^及^是在所述训练文本中出现的两个数字,与它们最为相关的名词词组分 别是NP^NP2。在NPi中出现的名词分别根据依存路径的长度而排序。这样,数字n#n2 之间的关系可以通过如下公式表示:
[0084] 其中,斯是名词词组NP^的名词,也即与数字相关的名词。ord(X)函数 用于计算名词的出现次序,这种次序由名词与同它相关的数字之间的路径长度所决定。根 据式(8)计算得到的r(ni,n2)的取值越大,表明数字ni与数字112之间的相关程度越高。
[0085] 这种特征参数有助于对训练操作引入一些基本的规则。例如,与被加数相关联的 名词应当相同。另外,这种特征参数体现了一些非显性的关系。参见图6,尽管数字6100与 数字405相关联的名词都是"dollar",但是数字6100与7%、6%通过名词"fund"相关联, 而数字405与7 %、6 %通过名词"interest"相关联。这种不同有助于将上述两个数字对齐 至模板中的正确槽位。
[0086] 本实施例通过获取与所述数字相关联的名词,以及根据所述不同数字与所述相同 名词之间相关联的次序,确定所述训练文本的特征向量元素,实现了根据所述训练文本中 数字与所述训练文本中问句之间的相关程度确定所述训练文本的特征向量元素。
[0087] 第三实施例
[0088] 本实施例以本发明的上述实施例为基础,进一步的提供了所述数学问
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1