一种医生在线推荐方法及系统与流程

文档序号:20361590发布日期:2020-04-10 23:43阅读:196来源:国知局
一种医生在线推荐方法及系统与流程

本公开涉及医疗技术领域,特别是涉及一种医生在线推荐方法及系统。



背景技术:

本部分的陈述仅仅是提到了与本公开相关的背景技术,并不必然构成现有技术。

随着医疗行业的快速发展,医疗信息过载的现象愈发严重。同时,人们对就医的质量要求也在不断提高,而医院的医疗资源尤其是专业科室和医生信息等都具有高度专业化的特点,对于普通患者来说不具有专业的医疗认知,往往会在面对庞大的医生科室检索信息时无法根据自己的病情进行快速恰当的选择。这一方面加大了医院导医的工作量,同时降低了医院资源的合理分配,另一方面也降低了患者本身的就医质量。

在实现本公开的过程中,发明人发现现有技术中存在以下技术问题:

如何在医疗信息系统中充分利用各种医疗数据,并进行合理开发与分析,为患者和医院带来最大程度的价值,是医疗信息发展中具有重要研究意义的课题。



技术实现要素:

为了解决现有技术的不足,本公开提供了一种医生在线推荐方法及系统;旨在克服医疗导诊系统中医疗信息过载患者选择难和医院资源分配不均的问题,能够向患者快速、准确的在线推荐医生。

第一方面,本公开提供了一种医生在线推荐方法;

一种医生在线推荐方法,包括:

获取待推荐患者的基本属性信息和病情主诉文本;

对待推荐患者的基本属性和病情主诉文本进行向量化表示;

根据病情主诉文本的向量化表示,获取初步推荐的科室;

根据待推荐患者病情主诉文本特征,从疾病症状实体词数据库中提取待推荐患者的疾病症状实体词;

将待推荐患者的疾病症状实体词与初步推荐的科室的每个医生的擅长诊断疾病描述进行匹配,筛选出匹配的第一类医生;并输出第一类医生中每个医生的历史患者评分;

根据待推荐患者的基本属性和病情主诉文本进行向量化表示与所述历史患者的基本属性和病情主诉文本进行向量化表示之间的相似度,和第一类医生中每个医生的历史患者评分;计算每个医生的最终推荐得分;输出得分最高的若干个医生作为推荐结果。

第二方面,本公开还提供了一种医生在线推荐系统;

一种医生在线推荐系统,包括:

获取模块,其被配置为:获取待推荐患者的基本属性信息和病情主诉文本;

向量化表示模块,其被配置为:对待推荐患者的基本属性和病情主诉文本进行向量化表示;

科室推荐模块,其被配置为:根据病情主诉文本的向量化表示,获取初步推荐的科室;

实体词提取模块,其被配置为:根据待推荐患者病情主诉文本特征,从疾病症状实体词数据库中提取待推荐患者的疾病症状实体词;

初筛模块,其被配置为:将待推荐患者的疾病症状实体词与初步推荐的科室的每个医生的擅长诊断疾病描述进行匹配,筛选出匹配的第一类医生;并输出第一类医生中每个医生的历史患者评分;

输出模块,其被配置为:根据待推荐患者的基本属性和病情主诉文本进行向量化表示与所述历史患者的基本属性和病情主诉文本进行向量化表示之间的相似度,和第一类医生中每个医生的历史患者评分;计算每个医生的最终推荐得分;输出得分最高的若干个医生作为推荐结果。

第三方面,本公开还提供了一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成第一方面所述方法的步骤。

第四方面,本公开还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成第一方面所述方法的步骤。

与现有技术相比,本公开的有益效果是:

本发明根据患者和医生的特征属性为每位患者推荐出最适合的医生,可以帮助患者通过导诊系统快速准确的选择最适合自己病情的医生,提高用户对医生的满意度,同时也可以提高患者对医院产品的粘度。

附图说明

构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。

图1为第一个实施例的方法流程图。

具体实施方式

应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

实施例一,本实施例提供了一种医生在线推荐方法;

如图1所示,一种医生在线推荐方法,包括:

s1:获取待推荐患者的基本属性信息和病情主诉文本;

s2:对待推荐患者的基本属性和病情主诉文本进行向量化表示;

s3:根据病情主诉文本的向量化表示,获取初步推荐的科室;

s4:根据待推荐患者病情主诉文本特征,从疾病症状实体词数据库中提取待推荐患者的疾病症状实体词;

s5:将待推荐患者的疾病症状实体词与初步推荐的科室的每个医生的擅长诊断疾病描述进行匹配,筛选出匹配的第一类医生;并输出第一类医生中每个医生的历史患者评分;

s6:根据待推荐患者的基本属性和病情主诉文本进行向量化表示与所述历史患者的基本属性和病情主诉文本进行向量化表示之间的相似度,和第一类医生中每个医生的历史患者评分;计算每个医生的最终推荐得分;输出得分最高的若干个医生作为推荐结果。

作为一个或多个实施例,所述s2中,对待推荐患者的病情主诉文本进行向量化表示的具体步骤,包括:对待推荐患者的病情主诉文本进行分词处理;利用预训练的语言神经网络模型对分词处理后的数据进行向量化表示,得到待推荐患者病情主诉文本特征。

作为一个或多个实施例,所述s3中,根据病情主诉文本的向量化表示,获取初步推荐的科室;具体步骤包括:

将待推荐患者病情主诉文本特征进行组合得到待推荐患者病情主诉文本的句向量表示,将待推荐患者病情主诉文本的句向量表示输入到预训练的科室推荐神经网络模型中,输出初步推荐的科室;根据初步推荐的科室,从医生数据库中调取初步推荐科室对应的所有医生数据和每个医生的擅长诊断疾病描述。

作为一个或多个实施例,所述s5,还包括:根据筛选出的第一类医生,从医生数据库中查询第一类医生的历史就诊患者的基本属性信息;并对第一类医生历史就诊患者的基本属性信息进行向量化表示。

作为一个或多个实施例,所述s6的具体步骤包括:

计算待推荐患者的基本属性向量化表示结果与第一类医生历史就诊患者的基本属性向量化表示结果的第一相似度;

计算待推荐患者的病情主诉文本特征与第一类医生历史就诊患者的病情主诉文本特征的第二相似度;

根据第一相似度、第二相似度和每个医生的历史患者评分,计算每个医生的最终推荐得分;将每个医生的最终推荐得分,按照从大到小进行排序,输出排名靠前的n个医生,n为正整数。

作为一个或多个实施例,所述待推荐患者的基本属性信息,包括:患者的年龄和性别。

作为一个或多个实施例,所述病情主诉文本,是患者根据自身的病情,诉述的病情文本。

作为一个或多个实施例,所述对待推荐患者的基本属性(患者的年龄和性别)进行向量化表示;具体是指:

对患者年龄向量化处理,处理方式为将年龄按年龄段进行分割,其中0到10岁表示为1,11到20岁表示为2,21到30岁表示为3,31到40岁表示为4,41到50岁表示为5,51到60岁表示为6,60岁以上表示为7;

对患者性别向量化处理,处理方式为男性表示为[0,1],女性表示为[1,0]。

作为一个或多个实施例,所述对待推荐患者的病情主诉文本进行分词处理,具体包括:

首先利用特殊符号对患者病情主诉信息进行粗分词,然后利用中文分词工具jieba结合自定义疾病症状词库进行细分词,得到病情主诉单词集合;

所述特殊符号,包括:逗号、冒号、分号、&、百分号、等号和空格;

所述自定义疾病症状词库,是从专业的医疗网站获取的疾病症状词构建的词库;

所述jieba分词工具与疾病症状词库结合方式,jieba分词工具提供行业领域词库接口,将自定义的疾病症状词库添加,保证患者病情主诉信息中专业的疾病、症状术语不会被错误分开。

作为一个或多个实施例,所述对待推荐患者的病情主诉文本进行分词处理之前还包括:数据去噪和数据去重。

作为一个或多个实施例,所述预训练的语言神经网络模型的训练步骤包括:

构建第一神经网络模型;

构建第一训练集,所述第一训练集为已知文本特征的患者病情主诉文本;

将第一训练集输入到第一神经网络模型中进行训练,输出训练好的第一神经网络模型。

进一步地,所述第一神经网络模型,允许是word2vec神经网络模型。

所述word2vec是一个单隐层的神经网络,在本发明中,输入为患者病情主诉文本,输出为维度为词表大小的向量,向量每一维度的值是预测输出的概率(0<p<1)。

作为一个或多个实施例,所述将待推荐患者病情主诉文本特征进行组合得到待推荐患者病情主诉文本的句向量表示;具体步骤包括:

采用加和平均法对患者病情主诉文本句子进行句向量表示,句向量的维度为300维;

所述加和平均法,设待推荐患者病情主诉文本特征数为n,设待推荐患者病情主诉文本特征分别为[v1,v2,v3……vn],设句向量为s得到句向量表示为

作为一个或多个实施例,所述预训练的科室推荐神经网络模型的训练步骤包括:

构建第二神经网络模型;

构建第二训练集,所述第二训练集为已知最终选择科室的患者病情主诉句向量表示;

将第二训练集输入到第二神经网络模型中进行训练,输出训练好的第二神经网络模型。

进一步地,所述第二神经网络模型,采用textcnn神经网络。

textcnn神经网络包括:第一层为输入层,用于输入句子向量表示,第二层为卷积层,维度为2*2、3*3、4*4三种不同维度大小的卷积核,每种卷积核数量为128个,第三层为池化层,最后一层为softmax层。

进一步地,textcnn神经网络的工作原理为:

步骤(301):将句向量作为模型的输入层,进入步骤(302);

步骤(302):卷积层通过卷积操作提取输入层句子向量的特征,每个卷积核都输出一个一维特征向量,进入步骤(303);

步骤(303):池化层对卷积层输出的句子特征向量做池化操作,该操作是对句子做更加抽象的特征提取,取每个特征向量的最大值,然后将所有特征向量取最大值后进行拼接,输出一个一维特征向量,进入步骤(304);

步骤(304):将步骤(303)输出的特征向量输入到最后的softmax层,该层输出一个一维向量,向量的维度为科室的类别数,每一维对应预测当前患者病情主诉属于每一个科室的概率,该计算方式为

其中pi为每个科室类别的预测概率值,ej为softmax层输出向量的每一维度的值;

步骤(305):设置模型的参数,包括训练次数和学习率;

所述模型训练次数为将整个训练集进行输入后的迭代计算次数;

所述学习率为在模型进行参数更新时所采用的梯度下降算法中计算系数。

作为一个或多个实施例,所述医生数据库,包括:医院所有的科室、每个科室对应的所有的医生、每个医生的姓名、医生id、性别、职称、简介、擅长诊断疾病描述和每个医生的历史诊治患者数据。

进一步地,所述每个医生的历史诊治患者数据,包括:患者的性别、年龄、历史病情主诉文本、患者就诊过的医生id和患者对医生的评分。

作为一个或多个实施例,所述s4中,根据待推荐患者病情主诉文本特征,从疾病症状实体词数据库中提取待推荐患者的疾病症状实体词;是通过正向最大匹配算法来实现。

所述正向最大匹配算法具体操作为从左到右将患者病情主诉文本中的几个连续字符与自定义的疾病症状词表匹配,如果匹配上,则切分出一个词,切分出的词为专业的疾病症状术语。

作为一个或多个实施例,所述s5中,将待推荐患者的疾病症状实体词与每个医生的擅长诊断疾病描述进行匹配,筛选出匹配的第一类医生;具体步骤包括:如果待推荐患者的疾病症状实体词在每个医生的擅长诊断疾病描述中找到匹配成功的若干个词,则匹配成功的词进行计数,将计数量最大的前n个医生作为匹配的第一类医生,n为正整数。

作为一个或多个实施例,所述s6中,第一相似度和第二相似度的计算均采用余弦相似度。

余弦相似计算:

其中,向量a与向量b表示当前患者的基本属性特征向量与历史患者的基本属性特征向量,当前患者的病情主诉向量与历史患者的病情主诉向量,cosθ表示两个向量的余弦值,余弦值越接近1,就表明两个向量夹角越接近0度,也就是两个向量越相似,即患者越相似。

作为一个或多个实施例,所述s6中,根据第一相似度、第二相似度和第一类医生中每个医生的推荐指数,计算每个医生的最终推荐得分;具体步骤包括:

步骤(601):根据第一相似度和第二相似度计算得出当前患者与历史患者的最终相似度;

设第一相似度为sim1,第二相似度为sim2,最终相似度计算方法为

sim(p1,p2)=w1×sim1+w2×sim2(4)

其中,p1表示当前患者,p2表示历史患者,w1表示基本属性相似度的权重,w2表示病情主诉相似度的权重;

优选的,经过多次实验与效果评估确定权重参数w1为0.3,w2为0.7;

步骤(602):根据筛选出的第一类医生结合预先建立的历史患者-医生评分数据表,查询出筛选出的第一类医生中每个医生诊断过的历史患者对该医生的评分score,计算第一类医生中每个医生的推荐指数,计算方法为:

doctori=∑jsimj×scorej(5)

其中,doctori为获得第一类医生中的第i位医生的推荐值,∑jsimj×scorej为该医生所诊断过的所有历史患者,simj表示当前患者与第j位历史患者的相似度,scorej表示第j位患者对该医生的评分;

步骤(603):根据计算得到每位医生的最终推荐值,按照降序进行排序,取top-n个医生推荐给当前患者,结束。

实施例二,本实施例还提供了一种医生在线推荐系统;

一种医生在线推荐系统,包括:

获取模块,其被配置为:获取待推荐患者的基本属性信息和病情主诉文本;

向量化表示模块,其被配置为:对待推荐患者的基本属性和病情主诉文本进行向量化表示;

科室推荐模块,其被配置为:根据病情主诉文本的向量化表示,获取初步推荐的科室;

实体词提取模块,其被配置为:根据待推荐患者病情主诉文本特征,从疾病症状实体词数据库中提取待推荐患者的疾病症状实体词;

初筛模块,其被配置为:将待推荐患者的疾病症状实体词与初步推荐的科室的每个医生的擅长诊断疾病描述进行匹配,筛选出匹配的第一类医生;并输出第一类医生中每个医生的历史患者评分;

输出模块,其被配置为:根据待推荐患者的基本属性和病情主诉文本进行向量化表示与所述历史患者的基本属性和病情主诉文本进行向量化表示之间的相似度,和第一类医生中每个医生的历史患者评分;计算每个医生的最终推荐得分;输出得分最高的若干个医生作为推荐结果。

实施例三,本实施例还提供了一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成实施例一所述方法的步骤。

实施例四,本实施例还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例一所述方法的步骤。

以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1