一种小样本文本分类方法及模型与流程

文档序号：29086499发布日期：2022-03-02 01:31阅读：来源：国知局

技术特征：
1.一种小样本文本分类方法，其特征在于，包括以下步骤：步骤a.对输入语料信息中的词汇进行词向量转换，得到词向量矩阵；步骤b.通过双向长短期记忆层处理所述词向量矩阵，得到所述词向量矩阵对应的隐层状态序列；并基于所述隐层状态序列提取自注意力特征向量e，得到自注意力特征向量矩阵e；步骤c.基于所述自注意力特征向量矩阵e，通过胶囊网络来表征类别向量c，得到所有已知类别的类别向量c；步骤d.基于所有已知类别的类别向量c对所述输入语料信息进行关系打分，所述关系打分指的是将所述输入语料信息与类别向量c进行相似度判断，得到与所述输入语料信息相似度最高的类别向量c，则该类别向量c对应的类别为所述输入语料信息的分类结果。2.根据权利要求1所述的一种小样本文本分类方法，其特征在于：在所述步骤a之前还包括数据读取步骤：将支持集和查询集的样本按c-way k-shot的方式从原始语料信息中随机选择样本，构造训练集；并将支持集和查询集的样本分别按c-way q-shot的方式从原始语料信息中随机选择样本，构造验证集；其中，c表示类别数量，k表示训练集样本数量，q表示验证集样本数量。3.根据权利要求2所述的一种小样本文本分类方法，其特征在于：所述输入语料信息是对训练集进行数据处理后得到的；所述数据处理包括以下步骤：步骤一：对训练集内的训练样本进行预处理，并构建字表，所述字表为所述训练样本中包含的所有汉字所组成的列表；基于所述字表对所述训练样本中的每个字进行数字化，得到数字化训练样本；步骤二：对数字化训练样本的句子文本进行文本意图分类，得到每个句子文本的所属意图类别，分批读取句子文本以及其对应的所属类别；并将所述句子文本进行分词得到标注标签；步骤三：将所述标注标签与句子文本长度、文本掩码进行拼接，形成所述输入语料信息。4.根据权利要求1所述的一种小样本文本分类方法，其特征在于：所述步骤a通过bert预训练模型、skip-gram模型或cbow模型中的一种来实现。5.根据权利要求1所述的一种小样本文本分类方法，其特征在于：所述步骤a中，将所述输入语料信息中的句子最大长度设置为n，词向量维度设置为k，所述词向量矩阵为n*k的矩阵；所述句子最大长度n设置为32或64，所述词向量维度k设置为128或256。6.根据权利要求1所述的一种小样本文本分类方法，其特征在于：所述步骤b包括如下步骤：b1.通过双向长短期记忆层处理所述词向量矩阵，得到所述词向量矩阵对应的隐层状态序列q1；b2.将隐层状态序列q1与k1进行点乘运算，得到词向量矩阵的相关性，其中，k1表示第一权重序列向量；
b3.对所述相关性进行求和并取平均值，得到自注意力特征向量矩阵e。7.根据权利要求1所述的一种小样本文本分类方法，其特征在于：将所述输入语料信息与类别向量c进行相似度判断，是指计算自注意力特征向量e和类别向量c的相似度；通过计算内积、计算余弦相似度或计算皮尔森相关系数其中一种来实现。8.根据权利要求1所述的一种小样本文本分类方法，其特征在于：所述步骤c包括如下步骤：c1.将自注意力特征向量矩阵e进行一次线性映射得到映射注意力特征向量矩阵e’，再将映射注意力特征向量矩阵e’压缩成胶囊尺寸的单位向量；c2.初始化变量b＝0，对变量b进行求和、归一化处理得到向量d，所述向量d为路由索引的权重；c3.将向量d与映射注意力特征向量矩阵e’进行点乘运算，并将运算结果再与映射注意力特征向量矩阵e’进行点乘运算得到变量b’；c4.用变量b’更新向量b，并重复步骤c1和c2，迭代m次，直到得到各个类别样本对类别归纳向量的映射；c5.对各个类别样本对类别归纳向量的映射进行归一化处理，得到对应类别的表示概率。9.根据权利要求1所述的一种小样本文本分类方法，其特征在于：所述步骤d包括如下步骤：d1.将所述类别向量c和自注意力特征向量e做内积运算，得到类别向量c和自注意力特征向量e的关系矩阵；d2.将所述关系矩阵进行神经网络建模后再利用激活函数进行激活，将所述关系矩阵的计算结果压缩至(0，1)的范围内；d3.对压缩后的关系矩阵进行独热编码处理，得到输入语料信息的分类结果。10.一种小样本文本分类模型，其特征在于，包括：文本表示层：用于对输入语料信息中的词汇进行词向量转换，得到词向量矩阵；bilstm层：用于处理所述词向量矩阵，得到所述词向量矩阵对应的隐层状态序列；自注意力机制层：基于所述隐层状态序列提取注意力特征向量，得到注意力特征向量矩阵e；动态路由层：基于所述注意力特征向量矩阵e，通过胶囊网络来表征类别向量c，得到所有已知类别的类别向量c；关系层：基于所有已知类别的类别向量c对所述输入语料信息进行关系打分，所述关系打分指的是将所述输入语料信息与类别向量c进行相似度判断，得到与所述输入语料信息相似度最高的类别向量c，则该类别向量c对应的类别为所述输入语料信息的分类结果。

技术总结
本发明公开了一种小样本文本分类方法及模型，包括以下步骤：步骤a.对输入语料信息中的词汇进行词向量转换，得到词向量矩阵；步骤b.通过双向长短期记忆层处理词向量矩阵，得到词向量矩阵对应的隐层状态序列；并基于隐层状态序列提取自注意力特征向量e，得到自注意力特征向量矩阵E；步骤c.基于自注意力特征向量矩阵E，通过胶囊网络来表征类别向量c，得到所有已知类别的类别向量c；步骤d.基于所有已知类别的类别向量c对输入语料信息进行关系打分，得到与所述输入语料信息相似度最高的类别向量c，则该类别向量c对应的类别为输入语料信息的分类结果。本发明能够学习文本空间特征的归纳网络模型，对于文本语义的类表示进行更有效的归纳。效的归纳。效的归纳。

技术研发人员：宋正博肖龙源李稀敏李威
受保护的技术使用者：厦门快商通科技股份有限公司
技术研发日：2021.11.08
技术公布日：2022/3/1

完整全部详细技术资料下载

当前第2页1 2