一种电子病历的语意识别方法与流程

文档序号:17478118发布日期:2019-04-20 06:15阅读:405来源:国知局
一种电子病历的语意识别方法与流程
本发明涉及对电子病历的数据处理,尤其涉及一种电子病历的语意识别方法。
背景技术
:随着时代信息化的发展,电子病历的使用在医疗活动中逐渐普及。通过分析和挖掘电子病历,可以从中获得大量关于病人个体信息的医疗数据,而这些数据中危急值是最需要医生和患者关注的一部分。危急值是指某项或某类检验异常结果,当这种检验异常结果出现时,表明患者可能处于危险状态,需要临床医生及时得到检验信息,迅速给予患者有效的干预措施和治疗。目前危急值由专门的医技科室人工负责检查电子病历并将结论报告给相应的科室,由科室医生作出进一步的诊断,这样的诊断方式对检查人员的专业要求过高,普通的医生无法对各种科目的病症都非常精通,对于诊断结果并不能给出确定的答案,他们在选择科室时做出的判断也许并不准确,这不仅会增加医院的沟通成本和效率,更严重的是可能会延误治疗时机。技术实现要素:本发明要解决的技术问题是:为了解决目前人工判断电子病历不仅消耗医生的时间和精力较大,而且判断结果准确性无法保证的问题,本发明提供了一种电子病历的语意识别方法来解决上述问题。本发明解决其技术问题所采用的技术方案是:一种电子病历的语意识别方法,包括以下步骤:s1、收集若干份电子病历建立专业语料库和专业领域词典,所述专业领域词典包括若干个专业单词、停用词和专业单词在所述专业语料库中的词频,所述专业单词包括危急单词和普通单词;建立转送表单,所述转送表单的条件为至少一个危急单词,结果为目标科室;s2、提取电子病历中的检查内容;s3、根据所述专业领域词典对所述检查内容进行分词;s4、建立评价函数其中为平衡因子,mi(w)表示字串w中字与字之间的互信息,hl(w)表示字串w的左信息熵,hr(w)表示字串w的左信息熵;s5、将rank(w)与阈值p进行比较,如果rank(w)≥p,则认定字串w为一个单词,如果rank(w)<p,则认定字串w不是一个单词;s6、将所有为单词的字串w作为条件放入转送表单中查找目标科室。作为优选,还包括步骤s7、通过查找到的目标科室在转送表单中反查得到对应条件中包含的危急单词,对这些危急单词进行否定检测,如果否定检测的结果为未检测出否定则将电子病历发送至目标科室,如果结果为检测出否定则将电子病历标记为待处理。作为优选,所述专业领域词典还包括否定术语,所述电子病历的语意识别方法还包括步骤:建立否定检测表单,所述否定检测表单的条件包括一个否定术语和至少一个危急单词,结果为待定;以逗号为分隔,提取检查报告中将包含危急单词的危急短语,并将危急短语中分词得到的所有单词作为条件放入否定检测表单查找结果,如果结果为待定,则表示此危急短语为否定描述,则将电子病历标记为待处理;如果未查到结果,则表示此危急短语为肯定描述,如果所有的危急短语均为肯定描述,则将电子病历发送至目标科室。作为优选,在步骤s5中,如果判断字串w为一个单词,则将该字串w作为新的专业单词添加到所述专业领域词典中。本发明的有益效果是,这种电子病历的语意识别方法能够准确的识别出电子病历中跟相关病症紧密相连的危急单词,然后根据转送表单快速的找到对应的目标科室,大大提高了找到目标科室的准确性和效率。附图说明下面结合附图和实施例对本发明进一步说明。图1是一种电子病历的语意识别方法的一个实施例的流程图。图2是一种电子病历的语意识别方法的另一个实施例的流程图。具体实施方式下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属
技术领域
的技术人员所理解。如图1所示,是一种电子病历的语意识别方法的实施例,包括以下步骤:s1、收集若干份电子病历建立专业语料库和专业领域词典,所述专业领域词典包括若干个专业单词、停用词和专业单词在所述专业语料库中的词频,所述专业单词包括危急单词和普通单词;危急单词例如移动性浊音、乏力、纳差、尿黄、渗血、咳嗽、咳血等,普通单词为病历中常用的其它词语,停用词为电子病历中对于判断病症没有作用的词,例如吧、啊、除非、并且等;建立转送表单,所述转送表单的条件为至少一个危急单词,结果为目标科室;表1给出了转送表单的一个示例:危急单词目标科室咳嗽、咳血呼吸科关节积水外骨科结石内科口腔溃疡口腔科表1s2、提取电子病历中的检查内容;s3、通过jieba分词工具根据专业领域词典对所述检查内容进行分词,分词后去除停用词得到若干个字串w,建立公式:其中mi(w)表示字串w中所有字与字之间的互信息,字串w一共由n个字组成,x1,x2,x3,…,xn表示组成字串w的第1个字、第2个字、第3个字…第n个字,n(xn)表示专业语料库中字xn出现的频次,n(x1,x2,x3,…,xn)表示字串w作为一个整体在专业语料库中出现的频次;s4、建立评价函数其中为平衡因子,mi(w)表示字串w中字与字之间的互信息,hl(w)表示字串w的左信息熵,hr(w)表示字串w的左信息熵;其中,p(xiw)和p(wxi)分别表示在单词xi在专业语料库中出现在w左侧和右则时的条件概率,xi表示专业语料库中,vl和vr表示专业语料库中w左边和右边所有出现的词集合;s5、将rank(w)与预设的阈值p进行比较,如果rank(w)≥p,则认定字串w为一个单词,如果rank(w)<p,则认定字串w不是一个单词并且舍弃它;如果判断字串w为一个单词,则将该字串w作为新的专业单词添加到所述专业领域词典中;s6、将所有为单词的字串w作为条件放入转送表单中查找目标科室。考虑到病历中常常在危急单词所在的短语中出现否定的描述,表达并没有出现此种危急情况,所以在其它的一些实例中,如图2所示,还包括步骤:s7、通过查找到的目标科室在转送表单中反查得到对应条件中包含的危急单词,对这些危急单词进行否定检测:建立否定检测表单,专业领域词典包括否定术语,所述否定检测表单的条件包括一个否定术语和至少一个危急单词,结果为待定,例如表2展示的是一个否定检测表单的部分内容:否定术语危急单词结果无乏力、纳差、尿黄待定无唇紫绀、牙龈渗血待定未出现咳嗽、咳血待定未闻及干啰音、湿啰音待定否认肿瘤、结节待定不伴关节肿胀待定排除sars待定阴性移动性浊音待定表2以逗号为分隔,提取检查报告中将包含危急单词的危急短语,并将危急短语中分词得到的所有单词作为条件放入否定检测表单查找结果,如果结果为待定,则表示此危急短语为否定描述,则将电子病历标记为待处理;如果为查询到结果,则表示此危急短语为肯定描述,如果所有的危急短语均为肯定描述,则将电子病历发送至目标科室。在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对所述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1