一种小样本文本分类方法及模型与流程

文档序号:29086499发布日期:2022-03-02 01:31阅读:来源:国知局

技术特征:
1.一种小样本文本分类方法,其特征在于,包括以下步骤:步骤a.对输入语料信息中的词汇进行词向量转换,得到词向量矩阵;步骤b.通过双向长短期记忆层处理所述词向量矩阵,得到所述词向量矩阵对应的隐层状态序列;并基于所述隐层状态序列提取自注意力特征向量e,得到自注意力特征向量矩阵e;步骤c.基于所述自注意力特征向量矩阵e,通过胶囊网络来表征类别向量c,得到所有已知类别的类别向量c;步骤d.基于所有已知类别的类别向量c对所述输入语料信息进行关系打分,所述关系打分指的是将所述输入语料信息与类别向量c进行相似度判断,得到与所述输入语料信息相似度最高的类别向量c,则该类别向量c对应的类别为所述输入语料信息的分类结果。2.根据权利要求1所述的一种小样本文本分类方法,其特征在于:在所述步骤a之前还包括数据读取步骤:将支持集和查询集的样本按c-way k-shot的方式从原始语料信息中随机选择样本,构造训练集;并将支持集和查询集的样本分别按c-way q-shot的方式从原始语料信息中随机选择样本,构造验证集;其中,c表示类别数量,k表示训练集样本数量,q表示验证集样本数量。3.根据权利要求2所述的一种小样本文本分类方法,其特征在于:所述输入语料信息是对训练集进行数据处理后得到的;所述数据处理包括以下步骤:步骤一:对训练集内的训练样本进行预处理,并构建字表,所述字表为所述训练样本中包含的所有汉字所组成的列表;基于所述字表对所述训练样本中的每个字进行数字化,得到数字化训练样本;步骤二:对数字化训练样本的句子文本进行文本意图分类,得到每个句子文本的所属意图类别,分批读取句子文本以及其对应的所属类别;并将所述句子文本进行分词得到标注标签;步骤三:将所述标注标签与句子文本长度、文本掩码进行拼接,形成所述输入语料信息。4.根据权利要求1所述的一种小样本文本分类方法,其特征在于:所述步骤a通过bert预训练模型、skip-gram模型或cbow模型中的一种来实现。5.根据权利要求1所述的一种小样本文本分类方法,其特征在于:所述步骤a中,将所述输入语料信息中的句子最大长度设置为n,词向量维度设置为k,所述词向量矩阵为n*k的矩阵;所述句子最大长度n设置为32或64,所述词向量维度k设置为128或256。6.根据权利要求1所述的一种小样本文本分类方法,其特征在于:所述步骤b包括如下步骤:b1.通过双向长短期记忆层处理所述词向量矩阵,得到所述词向量矩阵对应的隐层状态序列q1;b2.将隐层状态序列q1与k1进行点乘运算,得到词向量矩阵的相关性,其中,k1表示第一权重序列向量;
b3.对所述相关性进行求和并取平均值,得到自注意力特征向量矩阵e。7.根据权利要求1所述的一种小样本文本分类方法,其特征在于:将所述输入语料信息与类别向量c进行相似度判断,是指计算自注意力特征向量e和类别向量c的相似度;通过计算内积、计算余弦相似度或计算皮尔森相关系数其中一种来实现。8.根据权利要求1所述的一种小样本文本分类方法,其特征在于:所述步骤c包括如下步骤:c1.将自注意力特征向量矩阵e进行一次线性映射得到映射注意力特征向量矩阵e’,再将映射注意力特征向量矩阵e’压缩成胶囊尺寸的单位向量;c2.初始化变量b=0,对变量b进行求和、归一化处理得到向量d,所述向量d为路由索引的权重;c3.将向量d与映射注意力特征向量矩阵e’进行点乘运算,并将运算结果再与映射注意力特征向量矩阵e’进行点乘运算得到变量b’;c4.用变量b’更新向量b,并重复步骤c1和c2,迭代m次,直到得到各个类别样本对类别归纳向量的映射;c5.对各个类别样本对类别归纳向量的映射进行归一化处理,得到对应类别的表示概率。9.根据权利要求1所述的一种小样本文本分类方法,其特征在于:所述步骤d包括如下步骤:d1.将所述类别向量c和自注意力特征向量e做内积运算,得到类别向量c和自注意力特征向量e的关系矩阵;d2.将所述关系矩阵进行神经网络建模后再利用激活函数进行激活,将所述关系矩阵的计算结果压缩至(0,1)的范围内;d3.对压缩后的关系矩阵进行独热编码处理,得到输入语料信息的分类结果。10.一种小样本文本分类模型,其特征在于,包括:文本表示层:用于对输入语料信息中的词汇进行词向量转换,得到词向量矩阵;bilstm层:用于处理所述词向量矩阵,得到所述词向量矩阵对应的隐层状态序列;自注意力机制层:基于所述隐层状态序列提取注意力特征向量,得到注意力特征向量矩阵e;动态路由层:基于所述注意力特征向量矩阵e,通过胶囊网络来表征类别向量c,得到所有已知类别的类别向量c;关系层:基于所有已知类别的类别向量c对所述输入语料信息进行关系打分,所述关系打分指的是将所述输入语料信息与类别向量c进行相似度判断,得到与所述输入语料信息相似度最高的类别向量c,则该类别向量c对应的类别为所述输入语料信息的分类结果。

技术总结
本发明公开了一种小样本文本分类方法及模型,包括以下步骤:步骤a.对输入语料信息中的词汇进行词向量转换,得到词向量矩阵;步骤b.通过双向长短期记忆层处理词向量矩阵,得到词向量矩阵对应的隐层状态序列;并基于隐层状态序列提取自注意力特征向量e,得到自注意力特征向量矩阵E;步骤c.基于自注意力特征向量矩阵E,通过胶囊网络来表征类别向量c,得到所有已知类别的类别向量c;步骤d.基于所有已知类别的类别向量c对输入语料信息进行关系打分,得到与所述输入语料信息相似度最高的类别向量c,则该类别向量c对应的类别为输入语料信息的分类结果。本发明能够学习文本空间特征的归纳网络模型,对于文本语义的类表示进行更有效的归纳。效的归纳。效的归纳。


技术研发人员:宋正博 肖龙源 李稀敏 李威
受保护的技术使用者:厦门快商通科技股份有限公司
技术研发日:2021.11.08
技术公布日:2022/3/1
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1