基于自由词检索的电子病历快速检索系统的制作方法

文档序号:11514891阅读:379来源:国知局
基于自由词检索的电子病历快速检索系统的制造方法与工艺
本发明涉及医疗
技术领域
,特别是指一种基于自由词检索的电子病历快速检索系统。
背景技术
:自由词检索与主题词检索是一对相对的概念,自由词检索指的是用户输入所要检索的任意词语,系统在其限定的字段内进行检索;而主题词检索指的是用户根据主题词表查找特定的主题词,进行主题词与副主题词之间的组配,从而有针对性地查找所要检索的对象。两者互有长短,能够实现互补的功能,自由词检索检索门槛低,检索方便快速,对检索词的限定条件较少,但查全率和查准率不如主题词检索;而主题词检索查全率和查准率高,但缺点在于检索门槛较高,使用方便程度不如自由词检索。目前应用于电子病历检索这一领域的检索方法尚未得到开发,检索常常需要人工进行查阅,效率极低。因此,急需开发两种互补的自由词快速检索与主题词检索系统,从而实现电子病历系统的检索功能。技术实现要素:针对
背景技术
中存在的问题,本发明的目的是提供一种基于自由词检索的电子病历快速检索系统,构成电子病历系统检索功能的主要检索之一,使得用户能够根据所要检索的目标词语以及选择的目标字段,进行快速检索,从而查找到符合检索要求的目标电子病历。本发明的技术方案是这样实现的:一种基于自由词检索的电子病历快速检索系统,包括控件属性定义单元、检索结构化预处理单元和智能排序单元,其中,所述属性定义单元:用于对电子病历表单中的各个控件定义saveforsearch属性,规定各个控件是否需要进行检索结构化预处理;如果saveforsearch属性为真,则进行检索结构化预处理;如果saveforsearch属性为假,则不进行检索结构化预处理;所述检索结构化预处理单元:首先需要对表单中的各个控件进行判断,如果一个控件saveforsearch属性为假,则进入下一个控件的判断;如果一个控件saveforsearch属性为真,则对该控件内的数据部分进行分词处理,分词处理采用分词表进行,如果根据分词表某个词语被区分出来,则在三维索引数据库的该字段对应的维度,该电子病历病案号的该词语下计数加一,依此类推,一直到所有控件都被判断完毕,得到一个三维索引数据库;所述智能排序单元:系统接到用户检索请求后,在三维索引数据库中匹配到用户限定的字段对应的维度,找到该检索词对应的纵列,随后对于纵列中计数为0的单元,相关度记为0;对于纵列中计数不为0的单元,计数记为k,计数值最大值记为n,进行相关度的换算,相关度计算公式为:随后,将各个维度下的各个病案号对应的χ值进行求和,并进行降序排列,自上往下病案号的排列便是呈现给用户的检索结果排序;如果自由词有多个,则将多个自由词的相关度χ值求和,并进行降序排列,自上往下病案号的排列便是呈现给用户的检索结果排序。在上述技术方案中,在电子病历表单中,不同字段的数据都是存储在不同的控件中,主诉的数据存储在主诉对应的richbox控件中,而姓名存储在姓名对应的textbox控件中。在上述技术方案中,所述三维索引数据库具有三个维度,第一个维度是字段;第二个维度是病案号;第三个维度是词语。在上述技术方案中,所述第一个维度的字段包括主诉、现病史、生活史、家族史;第二个维度的病案号由各个病历的病案号构成;第三个维度的词语通过分词统计得到不同词语在不同电子病历下不同字段某个词语的出现次数。本发明基于自由词检索的电子病历快速检索系统,对电子病历进行检索结构化的预处理方法与三维索引数据库的构建,将一份电子病历经过检索结构化预处理流水线,从而构建一个三维的索引数据库,使得用户能够同时对检索词汇与检索字段进行限定,系统通过对三维数据库的查询快速得到检索结果。如此达到进行快速检索,从而查找到符合检索要求的目标电子病历,提高使用便利性。附图说明图1为本发明检索系统中控件属性定义、检索结构化预处理流程图;图2为本发明检索系统中智能排序流程图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本发明所述的一种基于自由词检索的电子病历快速检索系统,包括控件属性定义单元、检索结构化预处理单元和智能排序单元,以下是对上述各单元具体执行进行的详细说明。(1)控件属性定义单元:在电子病历表单中,不同字段的数据都是存储在不同的控件中的,例如主诉的数据存储在主诉对应的richbox控件中,而姓名存储在姓名对应的textbox控件中。要进行检索结构化预处理,前提条件是对需要结构化的字段进行定义,保留下来有检索价值的数据,抛弃掉冗余信息。为此,需要对电子病历表单中的各个控件进行saveforsearch属性的定义,如果saveforsearch属性为真,则在检索结构化预处理该控件需要整理入三维索引数据库中;如果saveforsearch属性为假,则不进行检索结构化预处理。在这一步中,开发者需要为一份电子病历表单模版中的各个控件定义saveforsearch属性,规定各个控件是否需要进行检索结构化预处理。(2)检索结构化预处理单元:当医院电子病历系统新生成一份电子病历时,电子病历系统首先对整份电子病历文档作为整体存储到数据库中,作为业务之用。随后再将该份电子病历文表单送入检索结构化预处理流水线上进行处理。对于该份电子病历表单,首先需要对表单中的各个控件进行判断。如果一个控件saveforsearch属性为假,则进入下一个控件的判断;如果一个控件saveforsearch属性为真,则对该控件内的数据部分进行分词处理,分词处理采用分词表进行,如果根据分词表某个词语被区分出来,则在三维索引数据库的该字段对应的维度,该电子病历病案号的该词语下计数加一。依此类推,一直到所有控件都被判断完毕。saveforsearch属性的判断意义在于在一份电子病历表单中会有很多冗余的信息,比如记录时间、其表达作用的label等,在检索过程中没有任何贡献。saveforsearch属性的规定使得检索字段得到极大的简化,存储的空间也得到优化,从而保留下来检索价值最高的字段。检索结构化预处理的结果是得到一个三维索引数据库。与大多数搜索引擎建立的索引数据库相比,本索引数据库具有三个维度,适应于电子病历搜索。第一个维度是字段,包括主诉、现病史、生活史、家族史等;第二个维度是病案号,由各个病历的病案号构成;第三个维度是词语,通过分词统计得到不同词语在不同电子病历下不同字段某个词语的出现次数。三维索引数据库的构成示例如下:第一层:主诉:病案号头疼疼痛乏力发热201703121120170312122017031213第二层:现病史病案号高血压糖尿病冠心病201703121120170312122017031213第三层:生活史病案号201703121120170312122017031213上述流程如图1所示。(3)智能排序单元:用户在检索框中输入所要检索的一个或多个自由词,选定所要检索的一个或多个字段,向系统发送检索请求。假定用户输入了一个自由词,系统接到检索请求后,在三维索引数据库中匹配到用户限定的字段对应的维度,找到该检索词对应的纵列。随后,对于纵列中计数为0的单元,相关度记为0;对于纵列中计数不为0的单元,计数记为k,计数值最大值记为n,进行相关度的换算,相关度计算公式为:随后,将各个维度下的各个病案号对应的χ值进行求和,并进行降序排列,自上往下病案号的排列便是呈现给用户的检索结果排序。如果自由词有多个,则将多个自由词的相关度χ值求和,并进行降序排列,自上往下病案号的排列便是呈现给用户的检索结果排序。其流程如图2所示。以下是结合一具体实例进行进一步的说明:用户在检索框中输入了自由词是:消化道出血,选择检索字段是:现病史、既往病史与家族史。根据检索词“消化道出血”,系统在三维索引数据库中调取了三个维度的数据,分别是现病史、既往病史与家族史。在三个维度下找到该检索词对应的纵列,并计算对应的相关度,分别为:现病史:病案号消化道出血相关度201703121111.72201703121200201703121311.72最大值22既往病史:家族史:病案号消化道出血201703121111.60201703121211.60201703121300最大值32三个字段求和,并排序得到:病案号消化道出血相关度201703121115.19201703121303.44201703121213.13则检索结果排序即为如上表所示。本发明基于自由词检索的电子病历快速检索系统,具有以下有益效果:1.主题词检索对用户提出了较高的要求,用户需要对医学主题词表(mesh)有一定的了解,掌握主题词之间的组配方法,因此使用门槛较高。而自由词检索不要求用户对检索对象有基础性认识,用户只需要向检索框中输入所要检索的对象,选择是否对检索字段进行限定,便能完成一次检索请求,使用门槛不高。2.主题词检索虽然查全率和查准率高,但是用户进行检索时,需要对检索的对象进行主题词的匹配,匹配到主题词之后再进行副主题词的组配,检索难度较大,使用不够便捷。而自由词检索只需要输入检索对象,选择是否限定检索字段,不需要进行复杂的检索词组配,用户使用起来简明快捷。因此在现实中常需要根据现实需要,对主题词检索和自由词检索进行搭配使用。3.本系统采用了对数函数模型对检索病历的相关度进行了计算,优点在于只要在该字段中出现了检索词,相关度至少是1;而随着检索词出现次数的增加,相关度也随之增加,但最高不超过2,避免了某个字段因检索词反复出现占据检索主导地位。对不同检索词不同字段的相关度进行求和,便得到不同病历的相关度排序。以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1