一种病人姓名模糊语义查询的方法

文档序号：6502179阅读：246来源：国知局

一种病人姓名模糊语义查询的方法
【专利摘要】本发明提供一种病人姓名模糊语义查询的方法，包括：(1)为拼音字母设置对应的整型常量权值；(2)根据所述整型常量权值，分别计算病人的姓和名的拼音形式的整型常量权值和；(3)将所述权值和进行向右移位操作，建立所述病人相对应的姓索引和名索引；(4)将待匹配病人的姓名和所述病人的姓索引和名索引进行匹配查询，若匹配，则查询结束；若不匹配，则根据所述步骤(2)和步骤(3)建立所述待匹配病人的姓索引和名索引，查询结束。本发明通过建立权值表和索引模型，不仅查询速度快、匹配性强，而且能有效地屏蔽了发音不准、口音、位置和大小写等因素。
【专利说明】一种病人姓名模糊语义查询的方法

【技术领域】
[0001] 本发明涉及一种病人姓名查询的方法，尤其涉及一种对DIC0M影像服务器中病人姓名模糊语义查询的方法。

【背景技术】
[0002] 对于DIC0M影像生成前的病人姓名登录，常见的场景有：（1)病人在纸上写上或者说出自己中文姓名；（2)医院预约登记人员录入原始姓名的中文汉字或者拼音；（3)医院预约登记人员根据录入系统反馈结果，或者自行判断增加内容，比如BB (表示婴儿）。以上场景都存在一定的问题，场景（1)由于病人口音，录入人员理解偏差，可能录入错误；场景（2) 由于影像设备的中文汉字支持功能弱，必须用拼音做病人姓名，中文汉字到拼音的转换过程可能会出现差错；场景（3)增加的内容会有差异。而在实际医用环境中，病人很多，要求 DIC0M影像服务器操作人员在较短时间内，一次查询找到相近的目标病人记录供选择确认。
[0003] DIC0M3. 0规范要求的常用查询检索匹配有：单值匹配、唯一标识符列表匹配、通用匹配、通配符匹配、范围匹配和序列匹配。当病人、检查、序列和图像等信息确定时，查询操作是非常容易的，而且数据库也能够用通用语句轻易实现。但是当上述信息部确定时，通常的匹配方法有两种，一种方法是通用匹配、通配符匹配和范围匹配组合查询，这种方式的缺点是计算运算量大，用户往往需要多次反复，才能得到需要的记录，用户体验差；二是单值匹配下的病人姓名模糊语义，这种方式的实现需要屏蔽大小写、位置、口音和字符编码，甚至语音。比如，DIC0M3. 0规范提供的例子就是：查询"Swain"需要返回"Swayne"，查询 "Smith~Mary" 需要返回"Mary'Smith" 或"Mary Smith" 或"Smith，Mary"。
[0004] 在查询、检索、设备工作清单、设备完成检查步骤等服务中，明确要求提供病人姓名模糊语义匹配方法。对于病人姓名模糊语义匹配，很多影像服务器系统是通过数据库结构化查询语言SQL的like模糊查询语句实现，即是在一个字符型字段列中检索所包含的对应关键字。但是，Like语句查询效率低，基本无法优化性能，而且查询结果匹配性也不好。

【发明内容】

[0005] 本发明解决的问题是提供一种病人姓名模糊语义查询的方法，不仅查询速度快、匹配性强，而且能有效地屏蔽了发音不准、口音、位置和大小写等因素。
[0006] 为了解决上述问题，本发明提供了一种病人姓名模糊语义查询的方法，包括：
[0007] (1)为拼音字母设置对应的整型常量权值；
[0008] (2)根据所述整型常量权值，分别计算病人的姓和名的拼音形式的整型常量权值和；
[0009] (3)将所述权值和进行向右移位操作，建立所述病人相对应的姓索引和名索引； [0010] (4)将待匹配病人的姓名和所述病人的姓索引和名索引进行匹配查询，若匹配，则查询结束；若不匹配，则根据所述步骤（2)和步骤（3)建立所述待匹配病人的姓索引和名索弓丨，查询结束。 toon] 上述所述的病人姓名模糊语义查询方法，其中，所述拼音字母为声母、单韵母和复韵母。
[0012] 上述所述的病人姓名模糊语义查询方法，其中，将所述拼音字母中易出错的拼音字母设置为相同的或差额小的整形常量权值。
[0013] 上述所述的病人姓名模糊语义查询方法，其中，所述声母的整型常量权值大于所述复韵母的整型常量权值，所述复韵母的整型常量权值大于所述单韵母的整型常量权值。
[0014] 上述所述的病人姓名模糊语义查询方法，其中，所述单韵母在常用汉字中出现的次数和所述单韵母的整型权值成反比。
[0015] 上述所述的病人姓名模糊语义查询方法，其中，所述拼音字母的整型权值以质数序列按位分布。
[0016] 上述所述的病人姓名模糊语义查询方法，其中，若所述病人姓名的字符集是中文，则将所述病人的姓名转换为标准拼音形式。
[0017] 上述所述的病人姓名模糊语义查询方法，其中，上述所述的病人姓名模糊语义查询方法，其中，所述向右移位操作可配置。
[0018] 与现有技术相比，本发明以病人中文姓名对应的拼音字母集合为输入值，建立索引模型，该索引模型不仅算法简洁、可实现性强、运算量小，还能有效地屏蔽发音不准、口音、位置和大小写等因素。而且查询速度快、匹配性强、用户体验好，可以适应不同的方言环境和操作场景。

【专利附图】

【附图说明】
[0019] 图1所示为本发明实施例病人姓名模糊语义查询方法的流程示意图；
[0020] 图2所示为本发明实施例拼音字母的整型常量权值表。

【具体实施方式】
[0021] 在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本发明内涵的情况下做类似推广，因此本发明不受下面公开的具体实施的限制。
[0022] 其次，本发明利用示意图进行详细描述，在详述本发明实施例时，为便于说明，所述示意图只是实例，其在此不应限制本发明保护的范围。
[0023] 下面结合附图和实施例对本发明进行详细地说明。本发明病人姓名模糊语义查询方法如图1所示，首先，执行步骤S1，为拼音字母设置对应的整型常量权值。具体地，在本实施例中，如图2所示，所述拼音字母为声母、单韵母和复韵母。对于拼音字母中易出错的拼音字母设置为相同的或差额小的整型常量权值。比如对于声母L和N，ZH和Z，CH和C，SH 和Η以及Η和F，由于方言等因素容易出错，则将它们的整型常量权值设置为相同。需要说明的是，也可以将它们设置为差额小的整型常量权值。比如，L和Ν的整型常量权值的差额的绝对值小于e，e为正整数（如e = 1)。对于单韵母和复韵母也和声母一样，对于易出错的，设置相同的或差额小的整型常量权值。
[0024] 此外，对于除了易出错拼音字母的拼音字母，由于声母出错几率应小于复韵母，复韵母出错几率应小于单韵母，因此，所述声母的整型常量权值大于复韵母的整型常量权值，所述复韵母的整型常量权值大于单韵母的整型常量权值。而且，单韵母出现几率越高，出错几率越高，因此，单韵母在常用汉字中出现的次数和其整型常量权值成反比，即出现次数越高的单韵母，其整形常量权值越小。为了减少权值相加后重合的几率，拼音字母的整型常量权值以质数序列按位分布。在本实施例中，所述质数序列为（3,5,7，B...)，如图2所示，对于声母，出现几率较高的声母，其整型常量权值越小，如声母N、G、F和B，N出现的几率比较高，其整型常量权值在这四个声母中最小，而且，声母N、G、F和B按照质数序列分布。需要说明的是，对于长度为N的整型常量权值，只要其中一位按照质数序列分布即可。对于单韵母和复韵母，也和声母一样，按照质数序列进行分布。需要说明的是，整型常量权值表可以根据实际的情况进行配置。
[0025] 接着，执行步骤S2,根据所述整型常量权值，分别计算病人的姓和名的拼音形式的整型常量权值和。其中，如果所述病人姓名的字符集是中文，则将所述病人的姓名转换为标准拼音形式。其中，所述病人为数据库中记录的病人。具体地，根据步骤S1中各个拼音字母对应的整型常量权值，分别确定病人姓名的姓和名的拼音形式所对应的整型常量权值，并分别计算病人的姓和名的权值和。在本实施例中，所计算的是十六进制权值和。需要说明的是，根据实际的需要，也可以是二进制、八进制、十进制等。
[0026] 接着，执行步骤S3,将所述权值和进行向右移位操作，建立所述病人相对应的姓索引和名索引。其中，向右位移操作是可配置的，若需要精确匹配，则向右位移的位数就比较少；若需要模糊匹配，则向右位移的位数就比较多。具体地，在本实施例中，将步骤S2得到的病人姓和名的权值和向右移位4位后，转换为字符串形式存储，即建立了所述病人相对应的姓索引和名索引。在本实施例中，字符串按照B树的形式存储。需要说明的是，也可以按照其他优化的形式存储。
[0027] 接着，执行步骤S4,将待匹配病人的姓名和所述病人的姓索引和名索引进行匹配查询，若匹配，则执行步骤S5,查询结束；若不匹配，则执行步骤S6,根据上述步骤S2和S3，为所述待匹配病人建立相对应的姓索引和名索引，建立索引后则执行步骤S5,查询结束。具体地，根据待匹配病人的姓、名和姓名三种方式分别姓索引或名索引匹配查询，若索引相同，则是类似病人，查询结束；若索引不相同，则为待匹配病人建立姓索引和名索引，从而存储在数据库中。
[0028] 本发明虽然已以较佳实施例公开如上，但其并不是用来限定本发明，任何本领域技术人员在不脱离本发明的精神和范围内，都可以利用上述揭示的方法和技术内容对本发明技术方案做出可能的变动和修改，因此，凡是未脱离本发明技术方案的内容，依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化及修饰，均属于本发明技术方案的保护范围。
【权利要求】
1. 一种病人姓名模糊语义查询的方法，其特征在于，包括如下步骤： (1) 为拼音字母设置对应的整型常量权值； (2) 根据所述整型常量权值，分别计算病人的姓和名的拼音形式的整型常量权值和； (3) 将所述权值和进行向右移位操作，建立所述病人相对应的姓索引和名索引； (4) 将待匹配病人的姓名和所述病人的姓索引和名索引进行匹配查询，若匹配，则查询结束；若不匹配，则根据所述步骤（2)和步骤（3)建立所述待匹配病人的姓索引和名索引，查询结束。
2. 如权利要求1所述的病人姓名模糊语义查询的方法，其特征在于，所述拼音字母为声母、单韵母和复韵母。
3. 如权利要求2所述的病人姓名模糊语义查询的方法，其特征在于，将所述拼音字母中易出错的拼音字母设置为相同的或差额小的整形常量权值。
4. 如权利要求2所述的病人姓名模糊语义查询的方法，其特征在于，所述声母的整型常量权值大于所述复韵母的整型常量权值，所述复韵母的整型常量权值大于所述单韵母的整型常量权值。
5. 如权利要求2所述的病人姓名模糊语义查询的方法，其特征在于，所述单韵母在常用汉字中出现的次数和所述单韵母的整型常量权值成反比。
6. 如权利要求2所述的病人姓名模糊语义查询的方法，其特征在于，所述拼音字母的整型权值以质数序列按位分布。
7. 如权利要求1所述的病人姓名模糊语义查询的方法，其特征在于，若所述病人姓名的字符集是中文，则将所述病人的姓名转换为标准拼音形式。
8. 如权利要求1所述的病人姓名模糊语义查询的方法，其特征在于，所述向右移位操作可配置。
【文档编号】G06F17/30GK104123295SQ201310148778
【公开日】2014年10月29日申请日期:2013年4月25日优先权日:2013年4月25日
【发明者】张绪广, 陈文娟申请人:上海联影医疗科技有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张绪广;陈文娟
技术所有人：上海联影医疗科技有限公司
我是此专利的发明人

上一篇：一种采用二维码进行电子产品自动检测的系统和方法
上一篇：显示设备和用于操作显示设备的方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。