1.一种基于机器学习反馈规则增强的医疗保险智能审核系统,其特征在于,所述基于机器学习反馈规则增强的医疗保险智能审核系统,包括:
数据结构化模块,用于对待审核的医疗保险记录进行结构化处理,得到带有索引值的结构化数据;
记录分词模块,用于根据索引值从结构化数据中选取部分或全部信息,拼接形成长文本信息,并对长文本信息进行分词操作得到分词表达;
文本特征提取模块,用于根据所述分词表达,采用词向量模型将词转化为向量,得到文本特征;
神经网络模块,用于根据所述文本特征输出预测概率值,并根据预测概率值对当前的医疗保险记录进行划分,若划分为高置信度记录,则将所述结构化数据以及预测概率值输入至规则引擎模块;若划分为低置信度记录,则将结构化数据输入至专家审核模块;
专家审核模块,用于接收神经网络模块输出的为低置信度记录的结构化数据,并接收专家根据该结构化数据输入的审核结果,将当前的医疗保险记录以及接收的审核结果作为反馈数据用于神经网络模块的训练;
规则引擎模块,用于接收神经网络模块输出的为高置信度记录的结构化数据以及预测概率值,根据预定义的规则引擎输出医疗保险记录的审核结果。
2.如权利要求1所述的基于机器学习反馈规则增强的医疗保险智能审核系统,其特征在于,所述结构化数据的表达式为:r={c1:″t1″,c2:″t2″,...,ck:″tk″},其中r为一条医疗保险记录,ci为索引值,ti为索引值ci对应的文本信息,i∈(1,k),k是索引的条目数。
3.如权利要求1所述的基于机器学习反馈规则增强的医疗保险智能审核系统,其特征在于,所述词向量模型可以是word2vec模型、fasttext模型或bert模型。
4.如权利要求1所述的基于机器学习反馈规则增强的医疗保险智能审核系统,其特征在于,所述神经网络模块包括一个二分类神经网络,所述二分类神经网络从输入侧至输出侧包括第一卷积层、第一池化层、第二卷积层、第二池化层、第一全连接层和第二全连接层;
所述二分类神经网络输入文本特征,输出0到1之间的预测概率值。
5.如权利要求4所述的基于机器学习反馈规则增强的医疗保险智能审核系统,其特征在于,所述二分类神经网络在训练过程中,采用根据审核结果添加标签后的医疗保险记录作为样本数据进行训练,计算预测概率值与真实的标签值之间的误差值,通过最小化二值交叉熵损失函数对二分类神经网络进行优化,所述最小化二值交叉熵损失函数的表达式为:
其中,xn为预测概率值,yn为真实的标签值,wn为对于不同类型的样本数据的权重分配,n为样本数量。
6.如权利要求5所述的基于机器学习反馈规则增强的医疗保险智能审核系统,其特征在于,所述不同类型的样本数据包括两个部分:第一部分由专家审核模块产生的反馈数据生成,第二部分由各医疗机构产生的带有审核结果的医疗保险记录生成。
7.如权利要求5所述的基于机器学习反馈规则增强的医疗保险智能审核系统,其特征在于,所述审核结果为通过或拒绝;
根据审核结果对医疗保险记录添加标签包括:若审核结果为通过,则该医疗保险记录添加的标签的标签值为1;若审核结果为拒绝,则该医疗保险记录添加的标签的标签值为0。
8.如权利要求1所述的基于机器学习反馈规则增强的医疗保险智能审核系统,其特征在于,所述神经网络模块根据预测概率值对当前的医疗保险记录进行划分,执行如下操作:
设定上限阈值为thh,下限阈值为thl;
若预测概率值大于上限阈值thh,则判定当前的医疗保险记录为正样本,并划分为高置信度记录;若预测概率值小于下限阈值thl,则判定当前的医疗保险记录为负样本,并划分为高置信度记录;若预测概率值在上限阈值thh和下限阈值thl之间,则判定当前的医疗保险记录为混淆样本,并划分为低置信度记录。
9.如权利要求1所述的基于机器学习反馈规则增强的医疗保险智能审核系统,其特征在于,所述规则引擎基于符号主义ai实现。