文本分类模型的训练方法、系统、设备及文本分类方法与流程

文档序号：33183677发布日期：2023-02-04 05:40阅读：来源：国知局

技术特征：
1.一种文本分类模型的训练方法，其特征在于，包括以下步骤：基于第一训练语料与预设语言模型，训练得到第一文本分类模型，其中，所述第一文本分类模型包括语言模型层和第一线性连接层，且所述第一线性连接层的节点个数与所述第一训练语料的标签类别个数对应；将所述第一训练语料输入至所述第一文本分类模型的语言模型层，得到第一语义向量；在获取到第二训练语料时，确定所述第二训练语料与所述第一训练语料之间的增量训练语料，以及初始化所述预设语言模型得到第二线性连接层；将所述增量训练语料输入至所述第一文本分类模型的语言模型层，得到第二语义向量；基于所述第一语义向量、所述第二语义向量和所述第二线性连接层，训练得到第二文本分类模型，其中所述第二文本分类模型包括所述语言模型层和所述第二线性连接层，且所述第二线性连接层的节点个数与所述第二训练语料的标签类别个数对应。2.根据权利要求1所述的文本分类模型的训练方法，其特征在于，所述基于第一训练语料与预设语言模型，训练得到第一文本分类模型，包括：将所述第一训练语料划分为预设个数的语料组；将每组语料分别输入所述预设语言模型的令牌解析器，以得到与该组语料对应的令牌序列；将与该组语料对应的令牌序列输入所述语言模型层，以得到语义向量；将所述语义向量输入至所述第一线性连接层，以得到所述初始文本分类模型；基于第一交叉熵损失函数反向传播至所述语言模型层和第一线性连接层，以调整所述语言模型层和所述第一线性连接层的参数权重，对所述初始文本分类模型进行调优处理，得到所述第一文本分类模型，所述第一交叉熵损失函数是对所述初始文本分类模型的节点的值进行softmax函数处理得来。3.根据权利要求1所述的文本分类模型的训练方法，其特征在于，所述将所述第一训练语料输入至预设的第一文本分类模型的语言模型层，得到第一语义向量包括：将所述第一训练语料输入至第一文本分类模型中的第一令牌解析器，得到第一令牌序列；将所述第一令牌序列输入至第一文本分类模型中的语言模型层，得到第一语义向量。4.根据权利要求1所述的文本分类模型的训练方法，其特征在于，所述将所述增量训练语料输入至所述第一文本分类模型的语言模型层，得到第二语义向量包括：将所述增量训练语料输入至第一文本分类模型中的第二令牌解析器，得到第二令牌序列；将所述第二令牌序列输入至第一文本分类模型中的语言模型层，得到第二语义向量。5.根据权利要求1所述的文本分类模型的训练方法，其特征在于，所述基于所述第一语义向量、所述第二语义向量和所述第二线性连接层，训练得到第二文本分类模型包括：将所述第一语义向量和第二语义向量组合得到第三语义向量；将所述第三语义向量输入至所述第二线性连接层，训练得到第二文本分类模型。6.根据权利要求5所述的文本分类模型的训练方法，其特征在于，将所述第三语义向量
输入至所述第二线性连接层，训练得到第二文本分类模型包括：将所述第三语义向量输入至所述第二线性连接层，以得到每条向量的预设个数的节点的值，其中，所述预设个数为第二训练语料的标签类别个数；将第二交叉熵损失函数反向传播至所述第二线性连接层，以调整所述第二线性连接层的参数权重，得到所述第二文本分类模型，其中，所述第二交叉熵损失函数是对所述每条向量的预设个数的节点的值进行softmax函数处理得来。7.一种文本分类方法，其特征在于，所述文本分类方法包括：接收来自用户的用户问；基于第二文本分类模型对所述用户问进行分类，确定与所述用户问所属的类别标签，其中，所述第二文本分类模型包括多个节点，每个节点包括有类别标签及类别标签的概率值；输出与所述用户问所属类别标签对应的标准答。8.一种文本分类模型的训练系统，其特征在于，包括：第一训练单元，用于基于第一训练语料与预设语言模型，训练得到第一文本分类模型，其中，所述第一文本分类模型包括语言模型层和第一线性连接层，且所述第一线性连接层的节点个数与所述第一训练语料的标签类别个数对应；第一执行单元，用于将所述第一训练语料输入至所述第一文本分类模型的语言模型层，得到第一语义向量；增量获取单元，用于在获取到第二训练语料时，确定所述第二训练语料与所述第一训练语料之间的增量训练语料，以及初始化所述预设语言模型得到第二线性连接层；第二执行单元，用于将所述增量训练语料输入至所述第一文本分类模型的语言模型层，得到第二语义向量；第二训练单元，用于基于所述第一语义向量、所述第二语义向量和所述第二线性连接层，训练得到第二文本分类模型，其中所述第二文本分类模型包括所述语言模型层和所述第二线性连接层，且所述第二线性连接层的节点个数与所述第二训练语料的标签类别个数对应。9.一种文本分类模型的训练设备，其特征在于，包括存储器和处理器；所述存储器用于存储可执行程序代码；所述处理器用于读取所述存储器中存储的可执行程序代码，以执行权利要求1-6中任一项所述的一种文本分类模型的训练方法。10.一种存储介质，其特征在于，所述存储介质存储有权利要求9中所述的可执行程序代码。

技术总结
本发明公开了一种文本分类模型的训练方法、系统、设备、介质及文本分类方法，文本分类模型的训练方法包括：基于第一训练语料与预设语言模型，训练得到第一文本分类模型；将第一训练语料输入至第一文本分类模型的语言模型层，得到第一语义向量；在获取到第二训练语料时，确定第二训练语料与第一训练语料之间的增量训练语料，以及初始化预设语言模型得到第二线性连接层；将增量训练语料输入至第一文本分类模型的语言模型层，得到第二语义向量；基于第一语义向量、第二语义向量和第二线性连接层，训练得到第二文本分类模型。本发明可以在较少的算力成本下，使文本分类模型既能快速调整标签类别体系，又能保持较高的准确率，花费时间少，灵活性强。灵活性强。灵活性强。

技术研发人员：简仁贤李龙威马永宁
受保护的技术使用者：竹间智能科技（上海）有限公司
技术研发日：2022.09.30
技术公布日：2023/2/3

完整全部详细技术资料下载

当前第2页1 2