数学问题求解模型的训练方法和装置、推理方法和装置的制造方法_4

文档序号:9217299阅读:来源:国知局
>[0132] 进一步的,所述特征向量提取模块112根据所述训练文本中不同数字的上下文之 间的相似程度确定所述训练文本的特征向量元素包括:提取不同数字在所述训练文本中的 特征参数;根据不同数字在所述训练文本中的特征参数的相似程度,确定所述训练文本的 特征向量元素。
[0133] 进一步的,所述特征参数包括:所述数字的上下文中的词语、所述数字的上下文的 词性标签以及所述数字的上下文的依存特征。
[0134] 进一步的,所述特征向量提取模块112根据所述训练文本中数字的上下文之间的 相关程度确定所述训练文本的特征向量元素包括:获取与所述数字相关联的名词词组;根 据所述名词词组中不同名词的出现次序,确定所述训练文本的特征向量元素。
[0135] 进一步的,所述特征向量提取模块112根据数字与所述训练文本中的问句之间的 相关程度确定所述训练文本的特征向量元素包括:根据与所述数字相关联的名词词组中的 名词在问句中的出现次序,确定所述训练文本的特征向量元素。
[0136] 第七实施例
[0137] 本实施例提供了数学问题求解模型的推理装置的一种技术方案。在该技术方案 中,所述数学问题求解模型的推理装置包括:特征提取模块121以及求解模块122。
[0138] 所述特征提取模块121用于利用所述数学问题求解模型提取用于描述数学问题 的输入文本的特征向量,其中,所述数学问题求解模型是根据用于解决数学问题的简化的 公式模板,并根据二次规划方法构建的求解模型。
[0139] 所述求解模块122用于利用所述数学问题求解模型,根据所述特征向量获取所述 数学问题的最优解。
[0140] 本领域普通技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计 算装置来实现,它们可以集中在单个计算装置上,或者分布在多个计算装置所组成的网络 上,可选地,他们可以用计算机装置可执行的程序代码来实现,从而可以将它们存储在存储 装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多 个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和 软件的结合。
[0141] 本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与 其他实施例的不同之处,各个实施例之间的相同或相似的部分互相参见即可。
[0142] 以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员 而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同 替换、改进等,均应包含在本发明的保护范围之内。
【主权项】
1. 一种数学问题求解模型的训练方法,其特征在于,包括: 确定针对训练文本的简化的公式模板库,所述公式模板库包含用于解决所述数学问题 的经过简化的公式模板; 提取所述训练文本的特征向量; 通过求解由最大化正确解与错误解之间的边际而规约得到的二次规划问题,确定所述 数学问题求解模型的权重向量。2. 根据权利要求1所述的方法,其特征在于,提取所述训练文本的特征向量包括: 根据数字的上下文特征、所述训练文本中不同数字的上下文之间的相似程度及相关程 度,和/或数字与所述训练文本中的问句之间的相关程度确定所述训练文本的特征向量元 素。3. 根据权利要求2所述的方法,其特征在于,根据数字的上下文特征确定所述训练文 本的特征向量元素包括: 提取所述数字的上下文中的词语、词性标签以及依存特征。4. 根据权利要求2所述的方法,其特征在于,根据所述训练文本中不同数字的上下文 之间的相似程度确定所述训练文本的特征向量元素包括: 提取不同数字在所述训练文本中的特征参数; 根据不同数字在所述训练文本中的特征参数的相似程度,确定所述训练文本的特征向 量元素。5. 根据权利要求4所述的方法,其特征在于,所述特征参数包括:所述数字的上下文中 的词语、所述数字的上下文的词性标签以及所述数字的上下文的依存特征。6. 根据权利要求2所述的方法,其特征在于,根据所述训练文本中不同数字的上下文 之间的相关程度确定所述训练文本的特征向量元素包括: 获取与所述数字相关联的名词词组; 根据所述名词词组中不同名词的出现次序,确定所述训练文本的特征向量元素。7. 根据权利要求2所述的方法,其特征在于,根据数字与所述训练文本中的问句之间 的相关程度确定所述训练文本的特征向量元素包括: 根据与所述数字相关联的名词词组中的名词在问句中的出现次序,确定所述训练文本 的特征向量元素。8. -种数学问题求解模型的训练装置,其特征在于,包括: 模板库确定模块,用于确定针对训练文本的简化的公式模板库,所述公式模板库包含 用于解决所述数学问题的经过简化的公式模板; 特征向量提取模块,用于提取所述训练文本的特征向量; 模型确定模块,用于通过求解由最大化正确解与错误解之间的边际而规约得到的二次 规划问题,确定所述数学问题求解模型的权重向量。9. 根据权利要求8所述的装置,其特征在于,所述特征向量提取模块具体用于: 根据数字的上下文特征、所述训练文本中不同数字的上下文之间的相似程度及相关程 度,和/或数字与所述训练文本中的问句之间的相关程度确定所述训练文本的特征向量元 素。10. 根据权利要求9所述的装置,其特征在于,根据数字的上下文特征确定所述训练文 本的特征向量元素包括: 提取所述数字的上下文中的词语、词性标签以及依存特征。11. 根据权利要求9所述的装置,其特征在于,所述特征向量提取模块根据所述训练文 本中不同数字的上下文之间的相似程度确定所述训练文本的特征向量元素包括: 提取不同数字在所述训练文本中的特征参数; 根据不同数字在所述训练文本中的特征参数的相似程度,确定所述训练文本的特征向 量元素。12. 根据权利要求11所述的装置,其特征在于,所述特征参数包括:所述数字的上下文 中的词语、所述数字的上下文的词性标签以及所述数字的上下文的依存特征。13. 根据权利要求9所述的装置,其特征在于,所述特征向量提取模块根据所述训练文 本中数字的上下文之间的相关程度确定所述训练文本的特征向量元素包括: 获取与所述数字相关联的名词词组; 根据所述名词词组中不同名词的出现次序,确定所述训练文本的特征向量元素。14. 根据权利要求9所述的装置,其特征在于,所述特征向量提取模块根据数字与所述 训练文本中的问句之间的相关程度确定所述训练文本的特征向量元素包括: 根据与所述数字相关联的名词词组中的名词在问句中的出现次序,确定所述训练文本 的特征向量元素。15. -种数学问题求解模型的推理方法,其特征在于,包括: 利用所述数学问题求解模型提取用于描述数学问题的输入文本的特征向量,其中,所 述数学问题求解模型是根据用于解决数学问题的简化的公式模板,并根据二次规划方法构 建的求解模型; 利用所述数学问题求解模型,根据所述特征向量获取所述数学问题的最优解。16. -种数学问题求解模型的推理装置,其特征在于,包括: 特征向量提取模块,用于利用所述数学问题求解模型提取用于描述数学问题的输入文 本的特征向量,其中,所述数学问题求解模型是根据用于解决数学问题的简化的公式模板, 并根据二次规划方法构建的求解模型; 求解模块,用于利用所述数学问题求解模型,根据所述特征向量获取所述数学问题的 最优解。
【专利摘要】本发明实施例公开了一种数学问题求解模型的训练方法和装置、推理方法和装置。所述训练方法包括:确定针对训练文本的简化的公式模板库;提取所述训练文本的特征向量;以及通过求解由最大化正确解与错误解之间的边际而规约得到的二次规划问题,确定所述数学问题求解模型的权重向量。本发明实施例提供的数学问题求解模型的训练方法和装置、推理方法和装置缩小了模型的搜索空间,降低了运算量。
【IPC分类】G06F17/30
【公开号】CN104933158
【申请号】CN201510363088
【发明人】周力普, 戴帅湘, 周晓
【申请人】百度在线网络技术(北京)有限公司
【公开日】2015年9月23日
【申请日】2015年6月26日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1