问卷生成方法、分类模型的训练方法、装置和计算机设备与流程

文档序号：25349668发布日期：2021-06-08 13:06阅读：来源：国知局

技术特征：
1.一种问卷生成方法，其特征在于，所述方法包括：获取临床试验招募数据；将所述临床试验招募数据输入第一分类模型，根据所述第一分类模型的分类结果确定所述临床试验招募数据的适应症类型；将所述临床试验招募数据输入对应的适应症类型的第二分类模型，得到所述适应症类型对应的临床试验招募数据中入排标准对应的结构化字段和问题关键词；根据所述结构化字段和所述问题关键词，在题目数据库中抽取问卷问题题目，根据每一所述问题题目对应的题目格式，生成调查问卷。2.根据权利要求1所述的方法，其特征在于，所述获取临床试验招募数据，包括：获取待处理的临床试验招募文本数据；将待处理的所述临床试验招募文本数据通过训练好的词向量化模型进行向量化处理，得到所述临床试验招募文本数据的向量化结果，将所述向量化结果作为所述临床试验招募数据。3.一种分类模型的训练方法，其特征在于，所述方法包括：获取第一临床试验招募训练样本，所述第一临床试验招募训练样本中包含每一临床试验招募训练数据的整句向量化值；将所述第一临床试验招募训练样本中的整句向量化值输入至分类模型中，通过所述分类模型得到初始分类结果；根据所述第一临床试验招募训练样本携带的适应症类别标签和适应症细分特征标签对应的基准分类结果对所述初始分类结果进行验证，若所述初始分类结果与所述基准分类结果不一致，则对所述分类模型进行模型参数调整。4.根据权利要求3所述的方法，其特征在于，所述获取第一临床试验招募训练样本，包括：获取临床试验招募文本数据；根据词向量化模型以及预设的加权平均算法，得到每一条所述临床试验招募文本数据的整句向量化值；根据分类基准向量化值，对所述临床试验招募数据进行分类处理，得到所述临床试验招募文本数据的整句向量化值的分类结果；针对每一所述分类结果进行适应症类别和适应症细分特征的标注，得到携带所述适应症类别标签和所述适应症细分特征标签的第一临床试验招募训练样本。5.一种分类模型的训练方法，其特征在于，所述方法包括获取第二临床试验招募训练样本；所述第二临床试验招募训练样本中包含每一临床试验招募训练数据的入排标准向量化值；将所述第二临床试验招募训练样本输入分类模型中，得到所述临床试验招募数据的分类结果；根据所述第二临床试验招募训练样本携带的入排标准结构化字段标签和问题关键词标签对应的基准分类结果对所述分类模型得到的分类结果进行验证，若所述分类结果与所述基准分类结果不一致，则对所述分类模型进行模型参数调整。6.根据权利要求5所述的方法，其特征在于，所述获取第二临床试验招募训练样本，包
括：根据适应症类别获取对应的临床试验招募文本数据；对每一适应症类别的所述临床试验招募文本数据进行向量化处理，得到所述临床试验招募文本数据对应的向量化结果；根据基准向量化结果，对所述临床试验招募文本数据中的向量化结果进行分类处理，得到对应的分类结果；针对每一分类结果进行入排标准的结构化字段和对应的问题关键词的标注，得到携带有入排标准结构化字段标签和问题关键词标签的第二临床试验招募数据样本。7.一种问卷生成装置，其特征在于，所述装置包括：获取模块，用于获取临床试验招募数据；第一分类模块，用于将所述临床试验招募数据输入第一分类模型，根据所述第一分类模型的分类结果确定所述临床试验招募数据的适应症类型；第二分类模块，用于将所述临床试验招募数据输入对应的适应症类型的第二分类模型，得到所述适应症类型对应的临床试验招募数据中入排标准对应的结构化字段和问题关键词；生成模块，用于根据所述结构化字段和所述问题关键词，在题目数据库中抽取问卷问题题目，根据每一所述问题题目对应的题目格式，生成调查问卷。8.根据权利要求7所述的装置，其特征在于，所述获取模块还用于获取待处理的临床试验招募文本数据；将待处理的所述临床试验招募文本数据通过训练好的词向量化模型进行向量化处理，得到所述临床试验招募文本数据的向量化结果，将所述向量化结果作为所述临床试验招募数据。9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至4，5至6中任一项所述的方法的步骤。10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至4，5至6中任一项所述的方法的步骤。

完整全部详细技术资料下载

当前第2页1 2 3