文本语义理解方法、装置和系统与流程

文档序号:12733635阅读:来源:国知局

技术特征:

1.一种文本语义理解方法,其特征在于,包括:

接收待语义理解的文本;

根据预先构建的深度残差网络模型,对所述待语义理解的文本进行语义理解,得到语义理解结果。

2.根据权利要求1所述的方法,其特征在于,对所述待语义理解的文本进行语义理解之前,所述方法还包括:

对所述待语义理解的文本进行预处理。

3.根据权利要求2所述的方法,其特征在于,还包括:构建深度残差网络模型,所述构建深度残差网络模型,包括:

收集训练文本,并对所述训练文本进行预处理,以及,获取所述训练文本的标注信息,所述标注信息包括语义理解结果;

确定深度残差网络模型的拓扑结构;

基于预处理后的训练文本、所述标注信息和所述拓扑结构进行模型训练,构建得到深度残差网络模型。

4.根据权利要求3所述的方法,其特征在于,当存在多任务时,所述模型训练基于多任务同步处理机制进行。

5.根据权利要求4所述的方法,其特征在于,所述模型训练时,通过对整体损失函数进行最小化确定模型参数,其中,所述整体损失函数为各个任务的损失函数的线性加权函数。

6.根据权利要求1所述的方法,其特征在于,所述深度残差网络模型的拓扑结构中包括:辅助输入层,所述辅助输入层用于输入先验信息。

7.根据权利要求6所述的方法,其特征在于,所述辅助输入层包括:

输入部分,用于输入先验信息,并对先验信息进行向量化;

变换部分,用于对向量化后的先验信息进行向量变换。

8.根据权利要求1所述的方法,其特征在于,所述深度残差网络模型的拓扑结构中包括:注意力层,所述注意力层包括:

非线性变换部分,用于对输入矩阵进行非线性变换,得到非线性变换后的矩阵,所述输入矩阵由各个词组的词向量组成;

权重控制部分,用于采用预设向量分别与非线性变换后的矩阵中的各个词组的词向量做内积,得到控制向量;

权重分配部分,用于对所述控制向量进行权重分配,得到权重向量;

组合部分,用于采用所述权重向量对所述输入矩阵中不同词组的词向量进行线性组合,得到注意力层的输出。

9.根据权利要求1所述的方法,其特征在于,所述深度残差网络模型的拓扑结构中包括:残差单元层,所述残差单元层包括卷积层级联部分和捷径部分,所述卷积层级联部分包括多个相互级联的卷积层,所述捷径部分用于将输入直接或对输入进行线性变换后与卷积层级联部分的输出相加,再对相加后的值进行激活。

10.一种文本语义理解装置,其特征在于,包括:

接收模块,用于接收待语义理解的文本;

语义理解模块,用于根据预先构建的深度残差网络模型,对所述待语义理解的文本进行语义理解,得到语义理解结果。

11.根据权利要求10所述的装置,其特征在于,还包括:

预处理模块,用于对所述待语义理解的文本进行预处理。

12.根据权利要求11所述的装置,其特征在于,还包括:用于构建深度残差网络模型的构建模块,所述构建模块具体用于:

收集训练文本,并对所述训练文本进行预处理,以及,获取所述训练文本的标注信息,所述标注信息包括语义理解结果;

确定深度残差网络模型的拓扑结构;

基于预处理后的训练文本、所述标注信息和所述拓扑结构进行模型训练,构建得到深度残差网络模型。

13.根据权利要求12所述的装置,其特征在于,所述构建模块在存在多任务时,基于多任务同步处理机制进行模型训练。

14.根据权利要求13所述的装置,其特征在于,所述构建模块在模型训练时,通过对整体损失函数进行最小化确定模型参数,其中,所述整体损失函数为各个任务的损失函数的线性加权函数。

15.根据权利要求10所述的装置,其特征在于,所述语义理解模块采用的深度残差网络模型的拓扑结构中包括:辅助输入层,所述辅助输入层用于输入先验信息。

16.根据权利要求15所述的装置,其特征在于,所述辅助输入层包括:

输入部分,用于输入先验信息,并对先验信息进行向量化;

变换部分,用于对向量化后的先验信息进行向量变换。

17.根据权利要求10所述的装置,其特征在于,所述语义理解模块采用的深度残差网络模型的拓扑结构中包括:注意力层,所述注意力层包括:

非线性变换部分,用于对输入矩阵进行非线性变换,得到非线性变换后的矩阵,所述输入矩阵由各个词组的词向量组成;

权重控制部分,用于采用预设向量分别与非线性变换后的矩阵中的各个词组的词向量做内积,得到控制向量;

权重分配部分,用于对所述控制向量进行权重分配,得到权重向量;

组合部分,用于采用所述权重向量对所述输入矩阵中不同词组的词向量进行线性组合,得到注意力层的输出。

18.根据权利要求10所述的装置,其特征在于,所述语义理解模块采用的深度残差网络模型的拓扑结构中包括:残差单元层,所述残差单元层包括卷积层级联部分和捷径部分,所述卷积层级联部分包括多个相互级联的卷积层,所述捷径部分用于将输入直接或对输入进行线性变换后与卷积层级联部分的输出相加,再对相加后的值进行激活。

19.一种文本语义理解系统,其特征在于,包括:

客户端,用于接收用户输入的待语义理解的文本;

服务端,用于接收客户端发送的所述待语义理解的文本,以及,根据预先构建的深度残差网络模型,对所述待语义理解的文本进行语义理解,得到语义理解结果。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1