数据分析方法、训练数据分析模型的方法及电子设备与流程

文档序号：26588673发布日期：2021-09-10 20:09阅读：来源：国知局

技术特征：
1.一种数据分析方法，其特征在于，包括：将至少一条第一设定语句输入至数据分析模型，得到所述至少一条第一设定语句中每条第一设定语句中的设定词语对应的预测类别、起始位置标识和截止位置标识；其中，第一设定语句由设定实体和设定语句拼接得到，设定语句表征设定实体的评价信息；所述设定词语为评价设定实体的关键词；利用设定损失函数，基于所述至少一条第一设定语句中每条第一设定语句中的设定词语对应的标定类别、第一标定位置标识和第二标定位置标识，以及基于对应的设定词语对应的预测类别、起始位置标识和截止位置标识，计算出所述数据分析模型的损失值；基于所述损失值更新所述数据分析模型的模型参数；输出训练后的数据分析模型，得到第一模型；将第一语句输入至所述第一模型，得到所述第一语句中的第一关键词对应的情感类别、起始位置标识和截止位置标识；所述第一语句由第一实体和对应的评价信息拼接得到。2.根据权利要求1所述的方法，其特征在于，所述设定损失函数包括第一子函数、第二子函数、第三子函数、第一权重、第二权重和第三权重；所述利用设定损失函数，基于所述至少一条第一设定语句中每条第一设定语句中的设定词语对应的标定类别、第一标定位置标识和第二标定位置标识，以及基于对应的设定词语对应的预测类别、起始位置标识和截止位置标识，计算出所述数据分析模型的损失值，包括：基于所述第一子函数和所述第一权重，计算出第一设定语句中设定词语对应的标定类别与对应的预测类别之间的第一损失值；基于所述第二子函数和所述第二权重，计算出第一设定语句中设定词语对应的第一标定位置标识与对应的起始位置标识之间的第二损失值；基于所述第三子函数和所述第三权重，计算出第一设定语句中设定词语对应的第二标定位置标识与对应的截止位置标识之间的第三损失值；基于第一设定语句对应的第一损失值、第二损失值和第三损失值，计算出所述数据分析模型的损失值；其中，第二权重和第三权重均大于第一权重。3.根据权利要求1或2所述的方法，其特征在于，所述数据分析模型包括特征提取模型和全连接层；所述将至少一条第一设定语句输入至数据分析模型，得到所述至少一条第一设定语句中每条第一设定语句中的设定词语对应的预测类别、起始位置标识和截止位置标识，包括：将至少一条第一设定语句输入至所述特征提取模型进行处理，得到所述至少一条第一设定语句中每条第一设定语句对应的第一向量序列；其中，所述第一向量序列中包括第一向量和第一子序列，所述第一向量表征第一设定语句的全局特征，第一子序列由设定语句中每个字对应的向量构成；将每条第一设定语句对应的第一向量输入至所述全连接层，得到每条第一设定语句中的设定词语对应的预测类别；基于每条第一设定语句对应的第一子序列，确定出每条第一设定语句中的设定词语对应的起始位置标识和截止位置标识。4.根据权利要求3所述的方法，其特征在于，所述基于每条第一设定语句对应的第一子
序列，确定出每条第一设定语句中的设定词语对应的起始位置标识和截止位置标识，包括：将第一设定语句对应的第一子序列，转换为至少两个第二向量；将第一设定语句对应的第一子序列中每个向量与第三向量相加，得到第二子序列；所述第三向量为所述模型参数，表征随机初始化的向量；基于第一设定语句对应的每个第二向量和第二子序列，计算出对应的第二子序列中每个向量对应的关注度向量对；关注度向量对包括表征起始位置概率的第一关注度向量和表征截止位置概率的第二关注度向量；基于第一设定语句对应的第二子序列中每个向量对应的第一关注度向量的均值，确定出第一设定语句中的设定词语对应的起始位置标识；基于第一设定语句对应的第二子序列中每个向量对应的第二关注度向量的均值，确定出第一设定语句中的设定词语对应的截止位置标识。5.根据权利要求4所述的方法，其特征在于，所述将第一设定语句对应的第一子序列，转换为至少两个第二向量，包括以下至少两种：计算出第一设定语句对应的第一子序列中的向量的均值，得到第二向量；从第一设定语句对应的第一子序列中的向量中，确定出每个维度对应的最小值，得到第二向量；从第一设定语句对应的第一子序列中的向量中，确定出每个维度对应的最大值，得到第二向量。6.根据权利要求5所述的方法，其特征在于，所述基于第一设定语句对应的每个第二向量和第二子序列，计算出对应的第二子序列中每个向量对应的关注度向量对，包括：采用第一设定函数和第二设定函数，基于第一设定语句对应的第二向量和第二子序列，分别计算出对应的第二子序列中每个向量对应的第一关注度向量和第二关注度向量；其中，所述第一设定函数和所述第二设定函数中的模型参数不共享。7.根据权利要求1所述的方法，其特征在于，所述方法还包括：基于第二设定语句中第二关键词对应的起始位置标识和截止位置标识，从第二设定语句中确定出第二关键词；基于第二设定语句对应的第一字数和第二字数，计算出所述数据分析模型的准确度；在所述准确度大于或等于设定阈值的情况下，输出训练后的数据分析模型；其中，第一字数表征第二设定语句对应的设定词语与第二关键词的交集包括的字数；第二字数表征第二设定语句对应的设定词语与第二关键词的并集包括的字数。8.一种训练数据分析模型的方法，其特征在于，包括：将至少一条第一设定语句输入至数据分析模型，得到所述至少一条第一设定语句中每条第一设定语句中的设定词语对应的预测类别、起始位置标识和截止位置标识；其中，第一设定语句由设定实体和设定语句拼接得到，设定语句表征设定实体的评价信息；所述设定词语为评价设定实体的关键词；基于所述至少一条第一设定语句中每条第一设定语句中的设定词语对应的标定类别、第一标定位置标识和第二标定位置标识，以及基于对应的设定词语对应的预测类别、起始位置标识和截止位置标识，计算出所述数据分析模型的损失值；
基于所述损失值更新所述数据分析的模型参数。9.一种电子设备，其特征在于，包括：训练单元，用于将至少一条第一设定语句输入至数据分析模型，得到所述至少一条第一设定语句中每条第一设定语句中的设定词语对应的预测类别、起始位置标识和截止位置标识；其中，第一设定语句由设定实体和设定语句拼接得到，设定语句表征设定实体的评价信息；所述设定词语为评价设定实体的关键词；计算单元，用于基于所述至少一条第一设定语句中每条第一设定语句中的设定词语对应的标定类别、第一标定位置标识和第二标定位置标识，以及基于对应的设定词语对应的预测类别、起始位置标识和截止位置标识，计算出所述数据分析模型的损失值；更新单元，用于基于所述损失值更新所述数据分析的模型参数；输出单元，用于输出训练后的数据分析模型，得到第一模型；提取单元，用于将第一语句输入至所述第一模型，得到所述第一语句中的第一关键词对应的情感类别、起始位置标识和截止位置标识；所述第一语句由第一实体和对应的评价信息拼接得到。10.一种电子设备，其特征在于，包括：处理器和用于存储能够在处理器上运行的计算机程序的存储器，其中，所述处理器用于运行所述计算机程序时，执行以下至少之一：权利要求1至7任一项所述的方法的步骤；权利要求8所述的方法的步骤。

技术总结
本发明实施例提供了一种数据分析方法、训练数据分析模型的方法及电子设备，数据分析方法包括：将至少一条第一设定语句输入至数据分析模型，得到每条第一设定语句中的设定词语对应的预测类别、起始位置标识和截止位置标识；利用设定损失函数，基于每条第一设定语句中的设定词语对应的标定类别、第一标定位置标识和第二标定位置标识，以及基于对应的设定词语对应的预测类别、起始位置标识和截止位置标识，计算出数据分析模型的损失值；基于所述损失值更新数据分析模型的模型参数；输出训练后的数据分析模型，得到第一模型；将第一语句输入至第一模型，得到第一语句中的第一关键词对应的情感类别、起始位置标识和截止位置标识。起始位置标识和截止位置标识。起始位置标识和截止位置标识。

技术研发人员：郑少杰彭明
受保护的技术使用者：深圳前海微众银行股份有限公司
技术研发日：2021.06.28
技术公布日：2021/9/9

完整全部详细技术资料下载

当前第2页1 2