一种病人姓名模糊语义查询的方法

文档序号:6502179阅读:246来源:国知局
一种病人姓名模糊语义查询的方法
【专利摘要】本发明提供一种病人姓名模糊语义查询的方法,包括:(1)为拼音字母设置对应的整型常量权值;(2)根据所述整型常量权值,分别计算病人的姓和名的拼音形式的整型常量权值和;(3)将所述权值和进行向右移位操作,建立所述病人相对应的姓索引和名索引;(4)将待匹配病人的姓名和所述病人的姓索引和名索引进行匹配查询,若匹配,则查询结束;若不匹配,则根据所述步骤(2)和步骤(3)建立所述待匹配病人的姓索引和名索引,查询结束。本发明通过建立权值表和索引模型,不仅查询速度快、匹配性强,而且能有效地屏蔽了发音不准、口音、位置和大小写等因素。
【专利说明】一种病人姓名模糊语义查询的方法

【技术领域】
[0001] 本发明涉及一种病人姓名查询的方法,尤其涉及一种对DIC0M影像服务器中病人 姓名模糊语义查询的方法。

【背景技术】
[0002] 对于DIC0M影像生成前的病人姓名登录,常见的场景有:(1)病人在纸上写上或者 说出自己中文姓名;(2)医院预约登记人员录入原始姓名的中文汉字或者拼音;(3)医院预 约登记人员根据录入系统反馈结果,或者自行判断增加内容,比如BB (表示婴儿)。以上场 景都存在一定的问题,场景(1)由于病人口音,录入人员理解偏差,可能录入错误;场景(2) 由于影像设备的中文汉字支持功能弱,必须用拼音做病人姓名,中文汉字到拼音的转换过 程可能会出现差错;场景(3)增加的内容会有差异。而在实际医用环境中,病人很多,要求 DIC0M影像服务器操作人员在较短时间内,一次查询找到相近的目标病人记录供选择确认。
[0003] DIC0M3. 0规范要求的常用查询检索匹配有:单值匹配、唯一标识符列表匹配、通 用匹配、通配符匹配、范围匹配和序列匹配。当病人、检查、序列和图像等信息确定时,查询 操作是非常容易的,而且数据库也能够用通用语句轻易实现。但是当上述信息部确定时,通 常的匹配方法有两种,一种方法是通用匹配、通配符匹配和范围匹配组合查询,这种方式的 缺点是计算运算量大,用户往往需要多次反复,才能得到需要的记录,用户体验差;二是单 值匹配下的病人姓名模糊语义,这种方式的实现需要屏蔽大小写、位置、口音和字符编码, 甚至语音。比如,DIC0M3. 0规范提供的例子就是:查询"Swain"需要返回"Swayne",查询 "Smith~Mary" 需要返回"Mary'Smith" 或"Mary Smith" 或"Smith,Mary"。
[0004] 在查询、检索、设备工作清单、设备完成检查步骤等服务中,明确要求提供病人姓 名模糊语义匹配方法。对于病人姓名模糊语义匹配,很多影像服务器系统是通过数据库结 构化查询语言SQL的like模糊查询语句实现,即是在一个字符型字段列中检索所包含的对 应关键字。但是,Like语句查询效率低,基本无法优化性能,而且查询结果匹配性也不好。


【发明内容】

[0005] 本发明解决的问题是提供一种病人姓名模糊语义查询的方法,不仅查询速度快、 匹配性强,而且能有效地屏蔽了发音不准、口音、位置和大小写等因素。
[0006] 为了解决上述问题,本发明提供了一种病人姓名模糊语义查询的方法,包括:
[0007] (1)为拼音字母设置对应的整型常量权值;
[0008] (2)根据所述整型常量权值,分别计算病人的姓和名的拼音形式的整型常量权值 和;
[0009] (3)将所述权值和进行向右移位操作,建立所述病人相对应的姓索引和名索引; [0010] (4)将待匹配病人的姓名和所述病人的姓索引和名索引进行匹配查询,若匹配,则 查询结束;若不匹配,则根据所述步骤(2)和步骤(3)建立所述待匹配病人的姓索引和名索 弓丨,查询结束。 toon] 上述所述的病人姓名模糊语义查询方法,其中,所述拼音字母为声母、单韵母和复 韵母。
[0012] 上述所述的病人姓名模糊语义查询方法,其中,将所述拼音字母中易出错的拼音 字母设置为相同的或差额小的整形常量权值。
[0013] 上述所述的病人姓名模糊语义查询方法,其中,所述声母的整型常量权值大于所 述复韵母的整型常量权值,所述复韵母的整型常量权值大于所述单韵母的整型常量权值。
[0014] 上述所述的病人姓名模糊语义查询方法,其中,所述单韵母在常用汉字中出现的 次数和所述单韵母的整型权值成反比。
[0015] 上述所述的病人姓名模糊语义查询方法,其中,所述拼音字母的整型权值以质数 序列按位分布。
[0016] 上述所述的病人姓名模糊语义查询方法,其中,若所述病人姓名的字符集是中文, 则将所述病人的姓名转换为标准拼音形式。
[0017] 上述所述的病人姓名模糊语义查询方法,其中,上述所述的病人姓名模糊语义查 询方法,其中,所述向右移位操作可配置。
[0018] 与现有技术相比,本发明以病人中文姓名对应的拼音字母集合为输入值,建立索 引模型,该索引模型不仅算法简洁、可实现性强、运算量小,还能有效地屏蔽发音不准、口 音、位置和大小写等因素。而且查询速度快、匹配性强、用户体验好,可以适应不同的方言环 境和操作场景。

【专利附图】

【附图说明】
[0019] 图1所示为本发明实施例病人姓名模糊语义查询方法的流程示意图;
[0020] 图2所示为本发明实施例拼音字母的整型常量权值表。

【具体实施方式】
[0021] 在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以 很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况 下做类似推广,因此本发明不受下面公开的具体实施的限制。
[0022] 其次,本发明利用示意图进行详细描述,在详述本发明实施例时,为便于说明,所 述示意图只是实例,其在此不应限制本发明保护的范围。
[0023] 下面结合附图和实施例对本发明进行详细地说明。本发明病人姓名模糊语义查询 方法如图1所示,首先,执行步骤S1,为拼音字母设置对应的整型常量权值。具体地,在本实 施例中,如图2所示,所述拼音字母为声母、单韵母和复韵母。对于拼音字母中易出错的拼 音字母设置为相同的或差额小的整型常量权值。比如对于声母L和N,ZH和Z,CH和C,SH 和Η以及Η和F,由于方言等因素容易出错,则将它们的整型常量权值设置为相同。需要说 明的是,也可以将它们设置为差额小的整型常量权值。比如,L和Ν的整型常量权值的差额 的绝对值小于e,e为正整数(如e = 1)。对于单韵母和复韵母也和声母一样,对于易出错 的,设置相同的或差额小的整型常量权值。
[0024] 此外,对于除了易出错拼音字母的拼音字母,由于声母出错几率应小于复韵母,复 韵母出错几率应小于单韵母,因此,所述声母的整型常量权值大于复韵母的整型常量权值, 所述复韵母的整型常量权值大于单韵母的整型常量权值。而且,单韵母出现几率越高,出错 几率越高,因此,单韵母在常用汉字中出现的次数和其整型常量权值成反比,即出现次数越 高的单韵母,其整形常量权值越小。为了减少权值相加后重合的几率,拼音字母的整型常量 权值以质数序列按位分布。在本实施例中,所述质数序列为(3,5,7,B...),如图2所示,对 于声母,出现几率较高的声母,其整型常量权值越小,如声母N、G、F和B,N出现的几率比较 高,其整型常量权值在这四个声母中最小,而且,声母N、G、F和B按照质数序列分布。需要 说明的是,对于长度为N的整型常量权值,只要其中一位按照质数序列分布即可。对于单韵 母和复韵母,也和声母一样,按照质数序列进行分布。需要说明的是,整型常量权值表可以 根据实际的情况进行配置。
[0025] 接着,执行步骤S2,根据所述整型常量权值,分别计算病人的姓和名的拼音形式的 整型常量权值和。其中,如果所述病人姓名的字符集是中文,则将所述病人的姓名转换为标 准拼音形式。其中,所述病人为数据库中记录的病人。具体地,根据步骤S1中各个拼音字 母对应的整型常量权值,分别确定病人姓名的姓和名的拼音形式所对应的整型常量权值, 并分别计算病人的姓和名的权值和。在本实施例中,所计算的是十六进制权值和。需要说 明的是,根据实际的需要,也可以是二进制、八进制、十进制等。
[0026] 接着,执行步骤S3,将所述权值和进行向右移位操作,建立所述病人相对应的姓索 引和名索引。其中,向右位移操作是可配置的,若需要精确匹配,则向右位移的位数就比较 少;若需要模糊匹配,则向右位移的位数就比较多。具体地,在本实施例中,将步骤S2得到 的病人姓和名的权值和向右移位4位后,转换为字符串形式存储,即建立了所述病人相对 应的姓索引和名索引。在本实施例中,字符串按照B树的形式存储。需要说明的是,也可以 按照其他优化的形式存储。
[0027] 接着,执行步骤S4,将待匹配病人的姓名和所述病人的姓索引和名索引进行匹配 查询,若匹配,则执行步骤S5,查询结束;若不匹配,则执行步骤S6,根据上述步骤S2和S3, 为所述待匹配病人建立相对应的姓索引和名索引,建立索引后则执行步骤S5,查询结束。 具体地,根据待匹配病人的姓、名和姓名三种方式分别姓索引或名索引匹配查询,若索引相 同,则是类似病人,查询结束;若索引不相同,则为待匹配病人建立姓索引和名索引,从而存 储在数据库中。
[0028] 本发明虽然已以较佳实施例公开如上,但其并不是用来限定本发明,任何本领域 技术人员在不脱离本发明的精神和范围内,都可以利用上述揭示的方法和技术内容对本发 明技术方案做出可能的变动和修改,因此,凡是未脱离本发明技术方案的内容,依据本发明 的技术实质对以上实施例所作的任何简单修改、等同变化及修饰,均属于本发明技术方案 的保护范围。
【权利要求】
1. 一种病人姓名模糊语义查询的方法,其特征在于,包括如下步骤: (1) 为拼音字母设置对应的整型常量权值; (2) 根据所述整型常量权值,分别计算病人的姓和名的拼音形式的整型常量权值和; (3) 将所述权值和进行向右移位操作,建立所述病人相对应的姓索引和名索引; (4) 将待匹配病人的姓名和所述病人的姓索引和名索引进行匹配查询,若匹配,则查询 结束;若不匹配,则根据所述步骤(2)和步骤(3)建立所述待匹配病人的姓索引和名索引, 查询结束。
2. 如权利要求1所述的病人姓名模糊语义查询的方法,其特征在于,所述拼音字母为 声母、单韵母和复韵母。
3. 如权利要求2所述的病人姓名模糊语义查询的方法,其特征在于,将所述拼音字母 中易出错的拼音字母设置为相同的或差额小的整形常量权值。
4. 如权利要求2所述的病人姓名模糊语义查询的方法,其特征在于,所述声母的整型 常量权值大于所述复韵母的整型常量权值,所述复韵母的整型常量权值大于所述单韵母的 整型常量权值。
5. 如权利要求2所述的病人姓名模糊语义查询的方法,其特征在于,所述单韵母在常 用汉字中出现的次数和所述单韵母的整型常量权值成反比。
6. 如权利要求2所述的病人姓名模糊语义查询的方法,其特征在于,所述拼音字母的 整型权值以质数序列按位分布。
7. 如权利要求1所述的病人姓名模糊语义查询的方法,其特征在于,若所述病人姓名 的字符集是中文,则将所述病人的姓名转换为标准拼音形式。
8. 如权利要求1所述的病人姓名模糊语义查询的方法,其特征在于,所述向右移位操 作可配置。
【文档编号】G06F17/30GK104123295SQ201310148778
【公开日】2014年10月29日 申请日期:2013年4月25日 优先权日:2013年4月25日
【发明者】张绪广, 陈文娟 申请人:上海联影医疗科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1