一种电子病历自动生成方法及装置与流程

文档序号:11583262阅读:3363来源:国知局
一种电子病历自动生成方法及装置与流程

本发明涉及信息处理及医疗卫生技术领域,尤其涉及一种电子病历自动生成方法及装置。



背景技术:

随着社会的不断发展和生活水平的不断提高,人们对健康的重视程度也越来越高,医院求医问药的人逐年增多,如何利用相对匮乏的医疗资源满足人们对健康的需求,是当前迫切需要解决的问题。病历作为患者的医疗记录,是医疗机构诊治过程中记录的非常重要的文档,在现有技术中,为了提高医生的工作效率,逐渐抛弃了传统的纸质病历而改用电子病历,医生在给患者看病时或者看病结束后,可以在电脑等电子设备中的病历系统上录入、整理患者的诊断治疗信息,得到电子病历,从而更加便于保存、管理和重现。

然而,发明人在实现本发明的过程中发现,现有的电子病历系统仍属于半自动系统,仍然需要医生进行人工手动录入和整理,消耗了医生很多的工作时间,令医生不能将精力完全集中在治病救人上,例如,为了防止患者信息被遗忘或出现混乱,医生一般都是在给患者看病的同时进行电子病历的填写,这就容易造成医生的注意力难以集中在患者本身,最终可能会影响诊断效果,并降低了看病效率。



技术实现要素:

本发明实施例提供一种电子病历自动生成方法及装置,以提高生成电子病历的效率。

根据本发明实施例的第一方面,提供一种电子病历自动生成方法,所述方法包括:

获取病情数据,其中所述病情数据包括病情描述数据和\或病情诊断数据;

提取所述病情数据中每个分析单元的病历条目识别特征;

根据所述病历条目识别特征及预先构建的病历条目识别模型,确定每个分析单元所属的病历条目;

根据每个分析单元所属的病历条目将每个分析单元分别填写到对应的病历条目中,以生成电子病历。

可选的,所述获取病情数据,包括:

获取医生与患者的对话内容;

将所述对话内容作为病情描述数据;

获取医生的描述内容;

将所述描述内容作为病情诊断数据。

可选的,当所述对话内容或描述内容为语音时,获取医生与患者的对话内容或医生的描述内容之后,所述方法还包括:

将所述语音转换为文本。

可选的,所述病历条目识别特征包括医疗特征,以及以下特征中的一种或多种:字特征、词特征、词性特征、拼音特征;

其中,所述医疗特征为根据当前分析单元中出现的医学术语的频度而生成的向量,所述医学术语包括以下一种或多种:药名、器械名、医学检查名词、部位名。

可选的,当所述病情数据为语音时,所述病历条目识别特征还包括语音特征;

所述语音特征为根据当前分析单元所对应的语音片段的描述特征生成的向量,其中所述语音片段的描述特征包括以下一种或多种:语速、能量置信度、音频质量、所处的场景。

可选的,所述病历条目识别模型的拓扑结构包括输入层、卷积层、池化层、全连接层和输出层;

其中,所述输入层的输入为每条分析单元的病历条目识别特征;所述卷积层用于根据病历条目识别特征中各特征的维数对各特征使用相应数量的卷积滤波窗口进行卷积滤波;所述输出层的输出为当前分析单元的病历条目分类结果,或者是当前分析单元属于各病历条目的概率。

可选的,生成电子病历之后,所述方法还包括:

接收外部输入的修改信息;

根据所述修改信息修改所述电子病历。

根据本发明实施例的第二方面,提供一种电子病历自动生成装置,所述装置包括:

数据获取模块,用于获取病情数据,其中所述病情数据包括病情描述数据和\或病情诊断数据;

特征提取模块,用于提取所述病情数据中每个分析单元的病历条目识别特征;

条目确定模块,用于根据所述病历条目识别特征及预先构建的病历条目识别模型,确定每个分析单元所属的病历条目;

条目填写模块,用于根据每个分析单元所属的病历条目将每个分析单元分别填写到对应的病历条目中,以生成电子病历。

可选的,所述数据获取模块在获取病情数据时,用于:

获取医生与患者的对话内容;

将所述对话内容作为病情描述数据;

获取医生的描述内容;

将所述描述内容作为病情诊断数据。

可选的,当所述对话内容或描述内容为语音时,获取医生与患者的对话内容或医生的描述内容之后,所述数据获取模块还用于:

将所述语音转换为文本。

可选的,所述病历条目识别特征包括医疗特征,以及以下特征中的一种或多种:字特征、词特征、词性特征、拼音特征;

其中,所述医疗特征为根据当前分析单元中出现的医学术语的频度而生成的向量,所述医学术语包括以下一种或多种:药名、器械名、医学检查名词、部位名。

可选的,当所述病情数据为语音时,所述病历条目识别特征还包括语音特征;

所述语音特征为根据当前分析单元所对应的语音片段的描述特征生成的向量,其中所述语音片段的描述特征包括以下一种或多种:语速、能量置信度、音频质量、所处的场景。

可选的,所述病历条目识别模型的拓扑结构包括输入层、卷积层、池化层、全连接层和输出层;

其中,所述输入层的输入为每条分析单元的病历条目识别特征;所述卷积层用于根据病历条目识别特征中各特征的维数对各特征使用相应数量的卷积滤波窗口进行卷积滤波;所述输出层的输出为当前分析单元的病历条目分类结果,或者是当前分析单元属于各病历条目的概率。

可选的,所述装置还包括:

修改模块,用于接收外部输入的修改信息;根据所述修改信息修改所述电子病历。

本发明实施例提供的技术方案可以包括以下有益效果:

本发明实施例提出了一种电子病历自动生成方法,先获取病情数据,如医生与患者的对话内容等,然后提取病情数据中每个分析单元(如每个句子)的病历条目识别特征,再根据病历条目识别特征及预先构建的病历条目识别模型,将每个分析单元分别填写到对应的病历条目中,自动生成电子病历,从而大大提高了填写病历时的效率,节省了医生浪费在撰写病历上的时间,提高了工作效率,使得医生可以将更多的注意力集中在治病救人上。同时,本发明实施例中的方法借助医疗特征、语音特征等病历条目识别特征及预先训练的病历条目识别模型,对病例条目的识别率非常高,具有很好的实用性。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。此外,这些介绍并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。

图1是根据本发明一示例性实施例示出的一种电子病历自动生成方法的流程图;

图2是根据本发明一示例性实施例示出的病历条目识别模型拓扑结构示意图;

图3是根据本发明一示例性实施例示出的一种电子病历自动生成方法的流程图;

图4是根据本发明一示例性实施例示出的一种电子病历自动生成方法的流程图;

图5是根据本发明一示例性实施例示出的一种电子病历自动生成装置的示意图;

图6是根据本发明一示例性实施例示出的一种电子病历自动生成装置的示意图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

图1是根据本发明一示例性实施例示出的一种电子病历自动生成方法的流程图。作为示例该方法可用于手机、平板电脑、台式机电脑、笔记本电脑、服务器等设备。

参见图1所示,该方法可以包括:

步骤s101,获取病情数据,其中所述病情数据包括病情描述数据和\或病情诊断数据。

病情数据是自动生成电子病历的基础,可以来自医生诊治病人的过程,也可以来自诊治后,可以包括病情描述数据和\或病情诊断数据。

作为示例,在本实施例或本发明其他某些实施例中,所述获取病情数据,可以包括:

获取医生与患者的对话内容;

将所述对话内容作为病情描述数据;

获取医生的描述内容;

将所述描述内容作为病情诊断数据。

另外对于病情数据的载体本发明实施例也并不进行限制,例如可以是语音数据,也可以是文本数据。

当所述对话内容或描述内容为语音时,获取医生与患者的对话内容或医生的描述内容之后,所述方法还可以包括:

将所述语音转换为文本。

步骤s102,提取所述病情数据中每个分析单元的病历条目识别特征。

患者的病历中通常应包括若干病历条目,例如“主诉”、“现病史”、“治疗计划”、“处置”等。当然病历中具体包括哪些病历条目可由实际应用需求确定,对此本发明实施例并不进行限制。分析单元可以是词、短语、句子、句子族等,对此本发明实施例也并不进行限制。

为了将病情数据中的每个分析单元自动填写到相应的病历条目中,需要先提取每个分析单元的病历条目识别特征。对于病历条目识别特征的具体定义本实施例并不进行限制,本领域技术人员可以根据不同需求\不同场景而自行选择、设计,可以在此处使用的这些选择和设计都没有背离本发明的精神和保护范围。

步骤s103,根据所述病历条目识别特征及预先构建的病历条目识别模型,确定每个分析单元所属的病历条目。

作为示例,病历条目识别模型可以是分类模型,也可以是回归模型,如svm、dnn、rnn、cnn等,对此本实施例并不进行限制。

可以通过样本训练确定病历条目识别模型,然后在使用时可以将一个个分析单元的病历条目识别特征输入到该模型中,然后根据该模型的输出确定当前分析单元属于哪个病历条目。

步骤s104,根据每个分析单元所属的病历条目将每个分析单元分别填写到对应的病历条目中,以生成电子病历。

需要说明的是,对于病情数据中的每个分析单元,可能并非都属于某个病历条目,例如医生与患者的对话中可能含有一些寒暄话语等与病情无关的内容,这些内容其实并不属于病历内容,不过在本发明实施例中,为了统一描述,可以将这些非病历内容也看作是一类病历条目,并参与到分类中,而在自动生成电子病历时,该病历条目通常是不出现在电子病历中的,当然在一些情况下该病历条目也可以出现在电子病历中,例如附在电子病历的末尾,以避免丢失重要内容。

经过上面一系列步骤便可以最终自动生成电子病历,从而大大提高了填写病历时的效率,节省了医生浪费在撰写病历上的时间,提高了工作效率,使得医生可以将更多的注意力集中在治病救人上。

下面对病历条目识别特征再进行举例说明。

在本实施例或本发明其他某些实施例中,所述病历条目识别特征可以包括医疗特征,以及以下特征中的一种或多种:字特征、词特征、词性特征、拼音特征;

其中,所述医疗特征为根据当前分析单元中出现的医学术语的频度而生成的向量,所述医学术语可以包括以下一种或多种:药名、器械名、医学检查名词、部位名。

具体来讲:

1)字特征:一个分析单元中所有字的字向量。因汉字较多,因此字向量的维度相对较多,例如可以取128维。

2)词特征:一个分析单元中所有词的词向量。例如参照字特征,词特征也可以取128维。

进一步地,在提取词特征之前,还可对病情数据文本中意义相近但表现形式不同的词进行抽象化,如对于“右上后牙疼痛两周加重五天”,将其中“两”、“五”这些表示数字含义的词进行抽象,抽象为“#数字”;此外,还可以先将文本中停用词进行滤除处理,此处不再阐述。

3)词性特征:一个分析单元中所有词的词性,并向量化,例如可以为一个64维向量。

4)拼音特征:一个分析单元中所有词的拼音,并向量化,例如可以为一个64维向量。

5)医疗特征:一个分析单元中出现的药名(比如万应胶囊)、器械名(比如固定桥、银汞充填、根管)、医学检查名词(比如血常规)和部位名(比如左颊、舌背)等的频度,作为示例向量化后可以为一个4维的特征向量。比如“舌侧颈部银汞充填”一句话,对应的医疗特征可以为“药名频度0器械名频度1医学检查名词频度0部位频度1”,即医疗特征的向量为[0101]。

此外,当所述病情数据为语音时,所述病历条目识别特征还可以包括语音特征;

所述语音特征为根据当前分析单元所对应的语音片段的描述特征生成的向量,其中所述语音片段的描述特征可以包括以下一种或多种:语速、能量置信度、音频质量、所处的场景,等等。

比如“右上后牙疼痛两周加重五天”这句话,对应的语音特征为“室内中速670.860.83”,向量化后可以为一个8维的向量。

下面再对病历条目识别模型的拓扑结构进行举例说明。

在本实施例或本发明其他某些实施例中,以multi-windowcnn模型为例,所述病历条目识别模型的拓扑结构可以包括输入层、卷积层、池化层、全连接层和输出层,可参见图2所示。

其中,所述输入层的输入为每条分析单元的病历条目识别特征;所述卷积层用于根据病历条目识别特征中各特征的维数对各特征使用相应数量的卷积滤波窗口进行卷积滤波(例如维数较多的特征使用较多的卷积滤波窗口、维数较少的特征使用较少的卷积滤波窗口、维数很少的特征不使用卷积滤波窗口,等等);所述输出层的输出为当前分析单元的病历条目分类结果,或者是当前分析单元属于各病历条目的概率。

参见图2,具体来讲:

a)输入层:输入为一个分析单元的病历条目识别特征。例如可以共9606个节点(以包含语音特征为例)。节点具体说明:每个分析单元规整为最多包含10个词、40个字,则输入层的节点包括10个词,每个词的词特征128维,即10*128;每个词的词性特征64维,即10*64;40个字,每个字的字特征128维,即40*128;每个字的拼音特征64维,即40*64;每个分析单元的语音特征和医疗特征各4维。

b)卷积层:针对字特征、词特征这两种维数比较多的特征,采用多个不同卷积滤波窗口(简称窗口)进行卷积滤波,如2个,以得到更高层的抽象特征;针对词性特征、拼音特征这两种维数较少的特征,采用较少卷积滤波窗口进行卷积滤波,如1个;针对语音特征、医疗特征这种维数很少的特征,无需经过卷积、池化,可直接进行线性变换,与其他特征经过卷积池化后的输出,一起作为全连接层的输入,可参见图2所示。

c)池化层:具体实现同现有技术,不再赘述。

d)全连接层:具体实现同现有技术,不再赘述。

e)输出层:输出层可以是一个节点,输出为当前分析单元所属病历条目的标号(分类模型);也可以是多个节点,输出为属于各病历条目的结果(分类模型),如属于为1,不属于为0,例如[00100]代表当前分析单元属于第三个病历条目;输出还可以为属于各病历条目的概率(回归模型),一般取概率最大的病历条目作为当前分析单元的识别结果。

病历条目识别模型可以预先通过训练得到,例如参见图3所示,训练过程可以包括

步骤s301,收集大量病历和非病历数据,作为训练数据。

收集的训练数据可以是语音数据,也可以是文本数据。如果是语音数据,需要将其进行识别得到相应的文本。

步骤s302,对训练数据进行标注,并提取训练数据的病历条目识别特征。

所述标注是指标注出训练数据每个分析单元所属的病历条目。

步骤s303,设计病历条目识别模型的结构。例如病历条目识别模型可以是分类模型,也可以是回归模型,如svm、dnn、rnn、cnn等,对此本实施例并不进行限制。

步骤s304,使用步骤s302处理后的训练数据对步骤s303设计的病历条目识别模型进行训练。模型训练方法例如可以同现有神经网络(如bp)模型的训练方法,在此不再阐述。

此外参见图4所示,在本实施例或本发明其他某些实施例中,生成电子病历之后,所述方法还可以包括:

步骤s401,接收外部输入的修改信息;根据所述修改信息修改所述电子病历。

也即对生成的电子病历引入人工的外部修改操作,以进一步确保病历的准确性。

本实施例提出了一种电子病历自动生成方法,先获取病情数据,如医生与患者的对话内容等,然后提取病情数据中每个分析单元(如每个句子)的病历条目识别特征,再根据病历条目识别特征及预先构建的病历条目识别模型,将每个分析单元分别填写到对应的病历条目中,从而自动生成电子病历,大大提高了填写病历时的效率,节省了医生浪费在撰写病历上的时间,提高了工作效率,使得医生可以将更多的注意力集中在治病救人上。同时,本发明实施例中的方法借助医疗特征、语音特征等病历条目识别特征及预先训练的病历条目识别模型,对病例条目的识别率非常高,具有很好的实用性。

下述为本发明装置实施例,可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节,请参照本发明方法实施例。

图5是根据本发明一示例性实施例示出的一种电子病历自动生成装置的示意图。作为示例该装置可用于手机、平板电脑、台式机电脑、笔记本电脑、服务器等设备。

参见图5所示,该装置可以包括:

数据获取模块501,用于获取病情数据,其中所述病情数据包括病情描述数据和\或病情诊断数据。

病情数据是自动生成电子病历的基础,可以来自医生诊治病人的过程,也可以来自诊治后,可以包括病情描述数据和\或病情诊断数据。

另外对于病情数据的载体本发明实施例也并不进行限制,例如可以是语音数据,也可以是文本数据。

特征提取模块502,用于提取所述病情数据中每个分析单元的病历条目识别特征。

为了将病情数据中的每个分析单元自动填写到相应的病历条目中,需要先提取每个分析单元的病历条目识别特征。对于病历条目识别特征的具体定义本实施例并不进行限制,本领域技术人员可以根据不同需求\不同场景而自行选择、设计,可以在此处使用的这些选择和设计都没有背离本发明的精神和保护范围。

条目确定模块503,用于根据所述病历条目识别特征及预先构建的病历条目识别模型,确定每个分析单元所属的病历条目。

作为示例,病历条目识别模型可以是分类模型,也可以是回归模型,如svm、dnn、rnn、cnn等,对此本实施例并不进行限制。

可以通过样本训练确定病历条目识别模型,然后在使用时可以将一个个分析单元的病历条目识别特征输入到该模型中,然后根据该模型的输出确定当前分析单元属于哪个病历条目。

条目填写模块504,用于根据每个分析单元所属的病历条目将每个分析单元分别填写到对应的病历条目中,以生成电子病历。

经过上面一系列步骤便可以最终自动生成电子病历,从而大大提高了填写病历时的效率,节省了医生浪费在撰写病历上的时间,提高了工作效率,使得医生可以将更多的注意力集中在治病救人上。

在本实施例或本发明其他某些实施例中,所述数据获取模块在获取病情数据时,可以用于:

获取医生与患者的对话内容;

将所述对话内容作为病情描述数据;

获取医生的描述内容;

将所述描述内容作为病情诊断数据。

在本实施例或本发明其他某些实施例中,当所述对话内容或描述内容为语音时,获取医生与患者的对话内容或医生的描述内容之后,所述数据获取模块还可以用于:

将所述语音转换为文本。

在本实施例或本发明其他某些实施例中,所述病历条目识别特征包括医疗特征,以及以下特征中的一种或多种:字特征、词特征、词性特征、拼音特征;

其中,所述医疗特征为根据当前分析单元中出现的医学术语的频度而生成的向量,所述医学术语包括以下一种或多种:药名、器械名、医学检查名词、部位名。

在本实施例或本发明其他某些实施例中,当所述病情数据为语音时,所述病历条目识别特征还包括语音特征;

所述语音特征为根据当前分析单元所对应的语音片段的描述特征生成的向量,其中所述语音片段的描述特征包括以下一种或多种:语速、能量置信度、音频质量、所处的场景。

在本实施例或本发明其他某些实施例中,所述病历条目识别模型的拓扑结构包括输入层、卷积层、池化层、全连接层和输出层;

其中,所述输入层的输入为每条分析单元的病历条目识别特征;所述卷积层用于根据病历条目识别特征中各特征的维数对各特征使用相应数量的卷积滤波窗口进行卷积滤波;所述输出层的输出为当前分析单元的病历条目分类结果,或者是当前分析单元属于各病历条目的概率。

参见图6所示,在本实施例或本发明其他某些实施例中,所述装置还可以包括:

修改模块601,用于接收外部输入的修改信息;根据所述修改信息修改所述电子病历。

也即对生成的电子病历引入人工的外部修改操作,以进一步确保病历的准确性。

本实施例提出了一种电子病历自动生成方法,先获取病情数据,如医生与患者的对话内容等,然后提取病情数据中每个分析单元(如每个句子)的病历条目识别特征,再根据病历条目识别特征及预先构建的病历条目识别模型,将每个分析单元分别填写到对应的病历条目中,从而自动生成电子病历,大大提高了填写病历时的效率,节省了医生浪费在撰写病历上的时间,提高了工作效率,使得医生可以将更多的注意力集中在治病救人上。同时,本发明实施例中的方法借助医疗特征、语音特征等病历条目识别特征及预先训练的病历条目识别模型,对病例条目的识别率非常高,具有很好的实用性。

关于上述实施例中的装置,其中各个单元\模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由所附的权利要求指出。

应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1