数学问题求解模型的训练方法和装置、推理方法和装置的制造方法_3

文档序号:9217299阅读:来源:国知局
题求解模型 的训练方法中特征向量提取的一种技术方案。在该技术方案中,根据所述训练文本中不同 数字的上下文之间的相似程度确定所述训练文本的特征向量元素包括:提取不同数字在所 述训练文本中的特征参数;根据不同数字在所述训练文本中的特征参数的相似程度,确定 所述训练文本的特征向量元素。
[0089] 参见图7,根据所述训练文本中不同数字之间的相似程度确定所述训练文本的特 征向量元素包括:
[0090] S71,提取不同数字在所述训练文本中的特征参数。
[0091] 在本实施例中,提取每个数字的[_5,5]窗口内中的词语、词性标签以及依存特 征,作为所述数字在所述训练文本中的特征参数。
[0092] S72,根据不同数字在所述训练文本中的特征参数的相似程度,确定所述训练文本 的特征向量元素。
[0093] 假设数字&及n2分别对应于特征参数ST:及ST2,则两个数字之间的相似程度 simO^,]^)可以依据如下公式确定:
[0095] 确定两个数字之间的相似程度之后,可以依据所述两个数字之间的相似程度确定 所述特征向量中相应位置上的元素的取值。
[0096] 本实施例通过提取所述数字在所述训练文本中的特征参数,以及根据不同数字在 所述训练文本中的特征参数的相似程度,确定所述训练文本的特征向量元素,实现了根据 所述训练文本中数字之间的相似程度确定所述训练文本的特征向量元素。
[0097] 第四实施例
[0098] 本实施例提供了数学问题求解模型的推理方法的一种技术方案。在该技术方案 中,所述数学问题求解模型的推理方法包括:利用所述数学问题求解模型提取用于描述数 学问题的输入文本的特征向量,其中,所述数学问题求解模型是根据用于解决数学问题的 简化的公式模板,并根据二次规划方法构建的求解模型;利用所述数学问题求解模型,根据 所述特征向量获取所述数学问题的最优解。
[0099] 参见图8,所述数学问题求解模型的推理方法包括:
[0100] S81,利用所述数学问题求解模型提取用于描述数学问题的输入文本的特征向量, 其中,所述数学问题求解模型是根据用于解决数学问题的简化的公式模板,并根据二次规 划方法构建的求解模型。
[0101] 一旦所述数学问题求解模型训练完成,所述数学问题求解模型即可以被用于解决 实际的自然语言描述的数学问题。
[0102] 在将描述待求解的数学问题的输入文本输入至所述数学问题求解模型中以后,所 述模型首先提取所述输入文本的特征向量,也就是式(5)中的(i)参数。
[0103] 同样,所述模型可以通过提取输入文本中数字的上下文之间的相似程度的方式提 取特征向量元素,也可以通过提取输入文本中数字与问句之间的相关程度的方式提取特征 向量元素。
[0104] S82,利用所述数学问题求解模型,根据所述特征向量获取所述数学问题的最优 解。
[0105] 由于所述数学问题求解模型中的权重向量已经在训练过程中完全确定,也就是 说,所述数学问题求解模型已经完全确定,因此,在提取所述输入文本的特征向量之后,所 述数学问题求解模型可以根据所述特征向量给出所述数学问题的最优解。
[0106] 本实施例通过利用所述数学问题求解模型提取用于描述数学问题的输入文本的 特征向量,并利用所述数学问题求解模型,根据所述特征向量获取所述数学问题的最优解, 实现里通过较小的计算了对自然语言描述的数学问题的准确求解。
[0107] 第五实施例
[0108] 本实施例提供了采用上述实施例训练的数学问题求解模型解决自然语言描述的 数学问题的方法的一种技术方案。在该技术方案中,数学问题的求解方法包括:获取包含用 来描述数学问题的自然语言的网页、语音或者图片;利用训练的数学问题求解模型求解所 述网页、语音或者图片中描述的数学问题;获取所述数学问题求解模型给出的答案或者相 关知识点提示。
[0109] 参见图9,所述数学问题的求解方法包括:
[0110] S91,获取包含用来描述数学问题的自然语言的网页、语音或者图片。
[0111] 在获取到的网页中应该包含描述待解决的数学问题的文字。在获取到的语音中应 该包含描述待解决的数学问题的语音。同样,在获取到的图片中也应该包含描述待解决的 数学问题的文字。
[0112] S92,利用训练的数学问题求解模型求解所述网页、语音或者图片中描述的数学问 题。
[0113] 在利用所述数学问题求解模型求解所述数学问题之前,应该从所述网页、语音或 者图片中提取描述所述数学问题的文本。从所述网页中提取描述所述数学问题的文本之 时,应当依据对网页中文本的分析,选择描述所述数学问题的文本。从语音中提取描述所 述数学问题的文本之时,应当通过对所述语音的语音识别,来提取描述所述数学问题的文 本。从图片中提取描述所述数学问题的文本之时,应当通过对图片中文字的光学字符识别 (Opticalcharacterrecognition,OCR)来提取描述所述数学问题的文本。
[0114] 完成对文本的提取操作之后,利用训练好的数学问题求解模型求解所述数学问 题。
[0115] S93,获取所述数学问题自动求解模型给出的答案或者相关知识点提示。
[0116] 利用所述数学问题自动求解模型求解所述数学问题之后,能够获取到所述模型给 出的数学问题的答案或者相关知识点提示。
[0117] 进一步的,还可以依据所述数学问题求解模型给出的答案,以及对描述所述数学 问题的文本的处理,生成对所述数学问题进行求解的推导过程,并通过自然语言的形式展 示给用户。
[0118] 图10示出了依据上述方式生成的所述数学问题的解答过程的一个示例。参见图 10,待求解的数学问题是:梨的框数是苹果的3/4,又是橘子的4/5,苹果有80框,橘子多少 框?解决该数学问题的公式为:
[0120] 其中,N、kba和k/为参数。通过本申请上述实施例描述的算法计算得到了权重向 量之后,可以通过公式(7)求取y,同时获得N、kba和k/所对应的取值。
[0121] 同时,通过是(10),我们可以知道该问题为如下比例问题的实例化:
[0122] a是b的kba,是c的kca,已知b为N,求c。
[0123] 将a、b、c替换为梨、苹果和橘子,kba与k/替换为3/4和4/5,即可生成如图10所 示的该数学问题的求解方法。
[0124] 本实施例通过获取包含用来描述数学问题的自然语言的网页、语音或者图片,利 用训练的数学问题自动求解模型求解所述网页、语音或者图片中描述的数学问题,以及获 取所述数学问题自动求解模型给出的答案或者相关知识点提示,从而实现了利用预先训练 的模型对自然语言描述的数学问题的自动求解。
[0125] 第六实施例
[0126] 本实施例提供了数学问题求解模型的训练装置的一种技术方案。参见图11,在该 技术方案中,所述数学问题自动求解模型的训练装置包括:模板库确定模块111、特征向量 提取模块112以及模型确定模块113。
[0127] 所述模板库确定模块111用于确定针对训练文本的简化的公式模板库,所述公式 模板库包含用于解决所述数学问题的经过简化的公式模板。
[0128] 所述特征向量提取模块112用于提取所述训练文本的特征向量。
[0129] 所述模型确定模块113用于通过求解由最大化正确解与错误解之间的边际而规 约得到的二次规划问题,确定所述数学问题求解模型的权重向量。
[0130] 进一步的,所述特征向量提取模块112具体用于:根据数字的上下文特征、所述训 练文本中不同数字的上下文之间的相似程度及相关程度,和/或数字与所述训练文本中的 问句之间的相关程度确定所述训练文本的特征向量元素。
[0131] 进一步的,根据数字的上下文特征确定所述训练文本的特征向量元素包括:提取 所述数字的上下文中的词语、词性标签以及依存特征。
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1