一种基于语音识别的医疗健康记录自动填写方法与流程

文档序号：12473154阅读：1564来源：国知局

本发明涉及电子信息技术领域，尤其是一种基于语音识别的医疗健康记录自动填写方法。

背景技术：

语音识别技术现在已经进入了成熟期，可以准确的识别人们的语句。然而这种先进的技术仍未被广泛的应用到医疗系统中。与此同时，机器学习方法在当今社会再有了蓬勃的发展，但是在医疗系统中，它也没有被充分利用。

目前，国内外大部分医院都使用电子信息系统来存储病人的健康医疗信息。这种健康记录通常是在医生为病人看病或者护士查房时手动记录，并手动输入电脑进行存储的。这种生成健康记录的方式不仅费时费力，而且容易因为疏忽而导致记录发生错误。医生在做门诊时，一方面要进行望闻问切来确定病人的健康状况，一方面还需要手动将这些信息输入到电脑中。对于那些对计算机不熟悉的医生，将病人信息填写到电脑就是一件很耗时且分散注意力的工作。这样在进行诊断时，尤其是在长时间工作后进行诊断时，就可能因为一心二用而造成诊断失误，从而影响到病人的康复。如何在保证准确性的前提下，解决病人健康记录的自动填写问题就成为了新的研究重点。

但是将现有语音识别与机器学习相结合，并将其应用到病人健康记录的自动填写上存在以下主要难点：(1)不同医务工作者说话的语音、语调和习惯不同，如果用同一个模型进语音识别，势必会降低识别的准确度；(2)将机器学习的方法应用到病人病历的自动生成上的关键问题是如何保证生成文件的准确率，而造成准确率升降的主要原因是选用哪些特征来进行模型训练。医疗文本有诸多特征，哪些特征能够最大程度的提高结果的准确率是研究者比较头疼的问题。因此目前亟需一种能够适应多种不同语音语调习惯用户的语音输入及识别方法，提高病历输入的效率和准确率。

技术实现要素：

本发明提出了一种基于语音识别的医疗健康记录自动填写方法，包括如下步骤：

训练集获取步骤：预先获取用于语音识别训练的训练集文件，包括预录制的语音文件及其对应的文本文件，以及已标注特征和标签的文本特征文件；

识别模型训练步骤：调用深度神经网络语音识别模型，利用所述语音文件及所述文本文件作为输入训练所述深度神经网络语音识别模型，得到适合识别语音语调的改进语音识别模型；

抽取模型训练步骤：调用条件随机场模型，利用所述文本特征文件和模型训练指令作为控制输入训练所述条件随机场模型，得到用于抽取标签的信息抽取模型；

识别录入步骤：输入待识别的语音数据，经所述改进语音识别模型自动识别后转换成文本数据；获取所述文本数据中每个词的特征形成文本特征数据，利用所述信息抽取模型对所述文本特征数据进行标注，得到所述文本特征数据中每个词语的标签，根据标签将每个词语录入相应的数据中，得到自动填写的记录。

本发明提出的所述基于语音识别的医疗健康记录自动填写方法中，所述文本特征文件所标注的特征包括：词频、命名实体标签、.词性/词类、从根节点到这个词的解析树、依赖于这个词的词、这个词依赖的词、是否有短语包含这个词、统一化医学语言映射后的词、是否是医药、词在文本中的位置信息、用MetaMap映射后的词的SegType标签信息。提高条件随机场模型标注准确率的重点在于训练特征的选取，本发明创新的对以上特征进行了组合应用，同时结合了语义特征、语境特征、语法特征及其医疗领域的相关特征，大大提高了标注的准确率。

本发明提出的所述基于语音识别的医疗健康记录自动填写方法中，识别模型训练步骤中，预先将常用医学专业词汇、医学名词缩写词表加入到所述深度神经网络语音识别模型中。

本发明提出的所述基于语音识别的医疗健康记录自动填写方法中，抽取模型训练步骤中，进一步将MetaMap中的医疗标签加入到所述模型训练指令中。

本发明的有益效果在于：本发明利用成熟的语音识别技术，实时识别医生或者护士对病人健康情况的描述，并且以文本的形式保存结果。然后利用训练好的条件随机场模型来自动填写预设的病历表格，以帮助医务工作者生成规范化的病历，方便查询和归档。本发明提出的信息抽取方法在特征选取时创新性的结合了语义特征，语境特征，语法特征以及医疗领域相关特征，同时引入外部数据MetaMap作为训练特征，大大提高了抽取的准确率。此外，此种方法的程序运行效率较高，可以实现实时抽取。

附图说明

图1为本发明基于语音识别的医疗健康记录自动填写方法的流程示意图。

具体实施方式

结合以下具体实施例和附图，对本发明作进一步的详细说明。实施本发明的过程、条件、实验方法等，除以下专门提及的内容之外，均为本领域的普遍知识和公知常识，本发明没有特别限制内容。

参阅附图1，一种基于语音识别的医疗健康记录自动填写方法，其特征在于利用成熟的语音识别技术，实时识别医生或者护士对病人健康情况的描述，并且以文本的形式保存结果。然后利用训练好的条件随机场模型来自动填写预设的病历表格，以帮助医务工作者生成规范化的病历，方便查询和归档。具体操作按下述步骤进行：

(一)、获取训练集

本方法的实现需要提前获取两种训练集：(1)医生录制的语音文件，及对应的文本文件。语音文件是医生用正常语音语调来复述病人病情的音频文件，文本文件是与此音频文件对应的文本，此训练集主要用于训练语音识别模型。(2)标注好的文本文件。此文件应来自于医生平时看病时，对病人健康状况描述的文本文件。文件中每个词成一行，其后是这个词对应的11维特征和这个词的标签，这些特征分别是：

(a).词频；

(b).命名实体标签(如：时间，数字，姓名等)；

(c).词性/词类；

(d).从根节点到这个词的解析树；

(e).依赖于这个词的词，这个词依赖的词；

(f).是否有短语包含这个词；

(g).统一化医学语言映射后的词(UMLS)；

(h).是否是医药；

(i).词在文本中的位置信息；

(j).用MetaMap映射后的词的SegType标签信息。

每个词的标签可以由医生自定义，同时也可以用预设标签，预设标签根据医疗健康记录表格设计了病人个人信息，病情描述，治疗方法等基本信息，预设标签有：

Appointment/Procedure_City看病城市

Appointment/Procedure_ClinicianGivenNames/Initials临床医生的名

Appointment/Procedure_ClinicianLastname；临床医生的姓

Appointment/Procedure_Day看病日期

Appointment/Procedure_Description病情描述

Appointment/Procedure_Status病人看病时状态

Appointment/Procedure_Time看病时间

Appointment/Procedure_Ward病人病房

Future_Alert/Warning/AbnormalResult病人异常状况

Future_Discharge/TransferPlan出院时间

Future_Goal/TaskToBeCompleted/ExpectedOutcome预期结果

Medication_Dosage医药用量

Medication_Medicine用药

Medication_Status用药后状态

MyShift_ActivitiesOfDailyLiving病人日常生活描述

MyShift_Contraption病人使用的医疗设备

MyShift_Input/Diet病人日常饮食

MyShift_OtherObservation病人其他观测症状

MyShift_Output/Diuresis/BowelMovement病人排便情况

MyShift_RiskManagement紧急应对策略

MyShift_Status病人日常状态描述

MyShift_Wounds/Skin病人伤口描述

NA无

PatientIntroduction_AdmissionReason/Diagnosis病人确诊信息

PatientIntroduction_Ageinyears病人年龄

PatientIntroduction_Allergy病人过敏反应

PatientIntroduction_CarePlan治疗方法

PatientIntroduction_ChronicCondition病人慢性病状态描述

PatientIntroduction_CurrentBed病床号

PatientIntroduction_CurrentRoom病房号

PatientIntroduction_Disease/ProblemHistory病史

PatientIntroduction_Gender病人性别

PatientIntroduction_GivenNames/Initials病人名

PatientIntroduction_Lastname病人姓

PatientIntroduction_UnderDr_GivenNames/Initials主治医生名

PatientIntroduction_UnderDr_Lastname主治医生姓

训练集二可以通过专业医生的手动标注或者众包平台获取。

(二)、语音识别软件的训练

利用Kaldi开源语音识别工具来进行语音识别，在使用前需要对其中的深度神经网络(DNN)语音识模型进行训练，以得到适合医生语音语调的语音识别模型。可以通过已经取得的训练集一和Kaldi的模型训练命令自动的进行模型训练；

(三)、信息抽取模型的训练

利用条件随机场(CRF)模型来进行信息抽取。本方法采用开源的CRF++0.58来实现。通过已经获得的训练集二和CRF++0.58的模型训练命令来自动的进行模型训练；在进行模型训练时，将语义特征，语法特征，语境特征以及医疗领域的相关特征相结合，同时引入外部数据MetaMap，作为输入特征对CRF进行训练，提高了最终的标注准确度。

调用kaldi语音识别工具包进行语音识别，进行语音识别的语段如下：

“Vera Abbott on bed four eats fair at work 93years old under Dr Lee and she came in with chest pain in with a history of stroke in the previous chest pains is a she is in also Cataract asthma in glaucoma and she is almost blind in she needs assistance with her nitros she had tonight yesterday but still No effects and she is under monitoring underdone that she is down all of her also fine in that all for her。”

通过统计和人工标注可以得到此文本对应的抽取训练样本如以下表1所示：

表1抽取训练样本的人工标注结果

利用这种已标注好的文本来训练CRF++0.58。文本的特征的值分别通过以下工具获取CoreNLP(用于获得特征b,c,d,e)，NICTA(用于获得特征i)，MetaMap(用于获得特征f,g,h,j)

(四)病人健康记录的自动填写

医生口述病人的健康情况，并通过麦克风进行输入。利用已经训练好的语音识别模型来自动地将音频文件转化为文本文件，并进行保存。获取文本文件中每个词的11维特征，并将文本以训练集二的格式保存，形成目标文件。利用训练好的CRF模型对目标文件进行标注，从而得到每个词的标签。根据每个词的标签，将其填写到健康记录表格对应的每一项处，从而自动生成病人的医疗健康记录，并将其存储在系统数据库中。

(五)、病人健康记录的可视化

通过调用系统数据库中病人的医疗信息，将其展示在屏幕上使得医务工作者能对表格内容进行修改和完善。

本发明的保护内容不局限于以上实施例。在不背离发明构思的精神和范围下，本领域技术人员能够想到的变化和优点都被包括在本发明中，并且以所附的权利要求书为保护范围。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：胡琴敏;宋扬;贺樑;
技术所有人：华东师范大学;
我是此专利的发明人

上一篇：一种森林火灾监控系统的制作方法与工艺
上一篇：一种基于SoPC的视频图像火灾检测装置的制作方法