用于促进对健康护理记录的计算机辅助的链接的系统和方法与流程

文档序号:18219530发布日期:2019-07-19 22:53阅读:128来源:国知局
用于促进对健康护理记录的计算机辅助的链接的系统和方法与流程

本公开涉及用于促进对健康护理记录的计算机辅助的链接的系统和方法。



背景技术:

计算机辅助的数据链接系统通常被用于通过使匹配和链接数据的一个或多个操作自动化来促进对数据的匹配和链接。然而,典型的数据链接系统例如当剩余数个未确定的匹配(相对于已经发现的匹配的量)时浪费大量的计算资源(例如,处理资源、存储器资源、网络带宽等)继续处理记录的集合以进行匹配。尽管可以严格地实施任意预定义阈值以停止处理来限制计算资源浪费,但是对任意预定义阈值的严格使用常常导致不足的匹配。特别地,例如,尽管严格使用特定预定义阈值来处理记录的第一集合可以产生足够完全的匹配,但是使用相同预定义阈值来处理记录的另一集合将产生不足够完全的匹配是非常可能的,其中,其他记录集合具有与第一记录集合中的那些记录不同的记录不一致、与第一记录集合中的那些记录不同的记录属性或者其他差异。



技术实现要素:

因此,本公开的一个方面涉及一种被配置用于使用强标识符来促进对健康护理记录的计算机辅助的链接的系统。所述系统包括一个或多个硬件处理器,所述一个或多个硬件处理器由机器可读指令配置为使用对应于强标识符的记录属性组来处理个体的健康护理记录集合的第一集合部分以预测所述第一集合部分中的哪些健康护理记录具有相对于所述记录属性组的匹配值。对应于强标识符的记录属性组包括一个或多个对应于强标识符的记录属性。所述预测指示所述第一集合部分中的健康护理记录之间的第一匹配组。确定所述第一匹配组中的匹配的数量。使用另一记录属性组,对个体的所述健康护理记录集合的至少一个其他集合部分执行处理。完成该操作以预测所述其他集合部分中的哪些健康护理记录具有相对于另一记录属性组的匹配值。所述另一记录属性组包括与一个或多个对应于强标识符的记录属性不同的一个或多个记录属性。基于所述第一匹配组中的匹配的数量,使相对于预测健康护理记录匹配而对所述其他集合部分的处理停止。

本公开的另一方面涉及一种用于使用强标识符来促进对健康护理记录的计算机辅助的链接的方法。所述方法包括使用对应于强标识符的记录属性组来处理个体的健康护理记录集合的第一集合部分以预测所述第一集合部分中的哪些健康护理记录具有相对于所述记录属性组的匹配值。对应于强标识符的记录属性组包括一个或多个对应于强标识符的记录属性。所述预测指示所述第一集合部分中的健康护理记录之间的第一匹配组。确定所述第一匹配组中的匹配的数量。使用另一记录属性组,对个体的所述健康护理记录集合的至少一个其他集合部分执行处理。完成该操作以预测所述其他集合部分中的哪些健康护理记录具有相对于另一记录属性组的匹配值。所述另一记录属性组包括与一个或多个对应于强标识符的记录属性不同的一个或多个记录属性。基于所述第一匹配组中的匹配的数量,使相对于预测健康护理记录匹配而对所述其他集合部分的处理停止。

本公开的又一方面涉及一种被配置用于使用强标识符来促进对健康护理记录的计算机辅助的链接的系统。所述系统包括用于使用对应于强标识符的记录属性组来处理个体的健康护理记录集合的第一集合部分以预测所述第一集合部分中的哪些健康护理记录具有相对于所述记录属性组的匹配值的单元(means)。对应于强标识符的记录属性组包括一个或多个对应于强标识符的记录属性。所述预测指示所述第一集合部分中的健康护理记录之间的第一匹配组。确定所述第一匹配组中的匹配的数量。使用另一记录属性组,对个体的所述健康护理记录集合的至少一个其他集合部分执行处理。完成该操作以预测所述其他集合部分中的哪些健康护理记录具有相对于另一记录属性组的匹配值。所述另一记录属性组包括与一个或多个对应于强标识符的记录属性不同的一个或多个记录属性。基于所述第一匹配组中的匹配的数量,使相对于预测健康护理记录匹配而对所述其他集合部分的处理停止。

参考附图,考虑以下描述和随附的权利要求,本公开的这些和其他特征和特性,以及结构的相关元件的操作方法和功能以及各部分的组合和制造的经济性将变得更加显见,所有附图形成本说明书的部分,其中,在各图中相似的附图标记表示对应的部分。然而,显然可以理解,附图仅仅是出于例示和描述的目的,而非旨在限定本公开的范围。

附图说明

图1图示了根据一个或多个实施例的被配置用于促进对健康护理记录的计算机辅助的链接的系统;

图2是根据一个或多个实施例的数据库的分割的示意图;

图3图示了根据一个或多个实施例的以表格形式对隐藏匹配的分类;

图4图示了根据一个或多个实施例的预测匹配的分类算法的使用;

图5图示了根据一个或多个实施例的距离检查的使用;

图6图示了根据一个或多个实施例的被用于k基数分配问题的等式的范例;

图7图示了根据一个或多个实施例的用于促进对健康护理记录的计算机辅助的链接的一种方法;并且

图8图示了根据一个或多个实施例的用于促进对健康护理记录的计算机辅助的链接的一种方法。

具体实施方式

如在本文中所使用的,单数形式的“一”、“一个”和“该”包括复数指代,除非上下文另有明确说明。如在本文中所使用的,两个或更多个部分或部件被“耦合”的陈述应当意指这些部分被直接地或间接地(即,通过一个或多个中间部分或部件,只要发生链接)接连在一起或者一起操作。如在本文中所使用的,“直接耦合”意指两个元件彼此直接接触。如在本文中所使用的,“固定地耦合”或“固定”意指两个部件被耦合以便一体地移动,同时保持相对于彼此的恒定取向。

如在本文中所使用的,单词“单一”意指部件被创建为单件或单元。亦即,包括单独创建并且被耦合在一起作为单元的件的部件不是“单一”部件或主体。如在本文中所采用的,两个或更多个部分或部件彼此“接合”的陈述应当意指这些部分直接地或者通过一个或多个中间部分或部件彼此施加力。如在本文中所采用的,术语“数量”应当意指一或大于一的整数(即,多个)。

在本文中所使用的方向性短语,诸如,例如但不限于:顶部、底部、左侧、右侧、上部、下部、前部、后部以及其衍生物,涉及在附图中所示的元件的取向,而不限制权利要求,除非在本文中明确记载。

图1图示了根据一个或多个实施例的一种被配置用于促进对健康护理记录的计算机辅助的链接的系统100。在一些实施例中,系统100可以包括一个或多个服务器102。(一个或多个)服务器102可以被配置为根据客户端/服务器架构、对等架构和/或其他架构与一个或多个计算平台104通信。用户可以经由(一个或多个)计算平台104来访问系统100。(一个或多个)服务器102可以被配置为运行机器可读指令106。机器可读指令106可以包括以下中的一项或多项:数字匹配确定部件108、匹配部件110、匹配预测停止部件112、数据链接部件114和/或其他机器可读指令部件。

如在本文中所提到的,典型的数据链接系统例如当剩余数个未确定的匹配(相对于已经发现的匹配的量)时浪费大量的计算资源继续处理记录的集合以进行匹配。尽管可以严格地实施任意预定义阈值以停止处理来限制计算资源浪费,但是对任意预定义阈值的严格使用常常导致不足的匹配(例如,当对数据的不同集合严格地使用相同预定义阈值时)。特别地,例如,尽管严格使用特定预定义阈值来处理记录的第一集合可以产生足够完全的匹配,但是使用相同预定义阈值来处理记录的另一集合将产生不足够完全的匹配是非常可能的,其中,其他记录集合具有与第一记录集合中的那些记录不同的记录不一致、与第一记录集合中的那些记录不同的记录属性或其他差异。额外地或备选地,许多数据链接系统被配置为确定匿名数据记录之间的匹配,并且因此,不依赖于个人可标识信息或者用于对数据记录的匹配和/或链接的其他强标识符。因此,这样的数据链接系统未被优化以处理非匿名数据记录或者具有强标识符的其他数据记录的集合。

在一些情况下,可以对包括个人可标识信息(诸如社会安全号码、电话号码、姓名、家庭地址等或者其他强标识符)的记录的集合执行记录匹配和/或链接。强标识符能够单独使用或者与其他信息一起使用以标识、联系或者定位个体或者标识上下文中的个体(例如,在医学设施的数据库中)。强标识符的存在例如可以使得记录的相当大的部分能够匹配。在一些实施例中,“相当大的部分”指代至少百分之80。在一些实施例中,“相当大的部分”指代至少百分之50。然而,破坏和缺失的标识符不可避免地导致在数据库中剩余潜在大量的隐藏匹配。数据链接在不考虑破坏和缺失的强标识符的情况下可能导致不足的链接,这将在数据库中剩余潜在大量的隐藏匹配。通过标识破坏的标识符并且考虑具有缺失的标识符的记录,隐藏匹配可以是未覆盖的。在一些实施例中,其他记录属性(例如,不对应于强标识符的记录属性)可以额外地或备选地被用于对应于强标识符的记录属性的使用。作为范例,这些其他记录属性可以包括患者人口统计学资料、剧烈度、驻留时间(例如,在医院)或者其他属性。在一些实施例中,健康护理记录可以包括多个记录属性(例如,信息的类别,诸如社会安全号码、姓名、地址、出生日期、医生姓名、处置设施、处置描述、处置日期等)以及针对属性的对应值(例如,社会安全号码123-45-6789、姓名johnp.doe、321主街道、1960年1月1日等)。在一些实施例中,对应的属性和值是属性-值对。在一些实施例中,所述属性-值对可以是姓名-值对、键-值对、字段-值对等。

在一些实施例中,数量匹配确定部件108被配置用于使用对应于强标识符的记录属性组来处理个体的健康护理记录集合的第一集合部分以预测所述第一集合部分中的哪些健康护理记录具有相对于所述记录属性组的匹配值。作为范例,两个健康护理记录可以响应于确定这两个记录具有针对一记录属性的相同值(例如,这两个记录都包括“ssn=212-12-1234”的属性-值对)而被确定为具有相对于该记录属性的匹配值。作为另一范例,两个健康护理记录可以响应于确定这两个记录具有针对一记录属性的相似值而被确定为具有相对于该记录属性的匹配值,其中,相似值满足相似性阈值(例如,距彼此的特定编辑距离、距彼此的特定欧几里德距离等)。作为另外的范例,响应于两个记录具有相对于特定记录属性(例如,ssn)或者记录属性的组合(例如,姓名和姓氏)的匹配值,可以确定这两个记录对应于相同的个体。作为范例,对应于强标识符的记录属性组可以包括一个或多个对应于强标识符的记录属性。所述预测可以指示所述第一集合部分中的健康护理记录之间的第一匹配组。在一些实施例中,数量匹配确定部件108被配置用于确定所述第一匹配组中的匹配的数量。作为范例,匹配的数量可以包括所述第一匹配组中的匹配的百分比、所述第一匹配组中的匹配的量等。在一些实施例中,数据链接部件114被配置用于基于所述第一匹配组来链接所述第一集合部分中的健康护理记录。

在一种使用情况中,相对于图2,可以处理起源于数据库a202和数据库b204的健康护理记录集合。在处理期间,所述健康护理记录集合可以根据强标识符(例如,社会安全号码或者其他强标识符)被分割为各种部分。所分割的部分例如可以包括缺失的部分206、观察到并且匹配的部分208以及观察到但是并不匹配的部分210。作为范例,缺失的部分206可以包括各自缺少社会安全号码的记录(例如,没有对应于社会安全号码的记录属性的记录、从未针对其输入社会安全号码的记录等)。观察到并且匹配的部分208可以包括具有社会安全号码并且基于具有相同社会安全号码的相应匹配记录与记录集合中的至少一个其他记录(或者至少预定义阈值数量的记录)相匹配的记录。观察到并且不匹配的部分210可以包括具有社会安全号码但是尚未与记录集合(例如,具有不匹配记录集合中的其他记录或者不匹配相对于其社会安全号码的阈值数量的任何社会安全号码的记录)中的至少一个其他记录(或者至少预定义数值数量的记录)相匹配的记录。针对观察到并且匹配的部分208,可以假定标识符破坏不导致假阳性(即,由于数据输入错误造成的被不正确地被指定为具有相同社会安全号码的不同的个体)。尽管已经针对观察到并且匹配的部分208确定了匹配,但是在缺失的部分206和观察到但是不匹配的部分210中可能存在隐藏匹配。

在另外的使用情况中,图3的表300示出了在匹配对来自何处方面的四种类型的隐藏匹配。特别地,如果个人将仅考虑观察到但是不匹配的部分(在表300的四个单元的左上角中所指示的),那么其中隐藏匹配可能归因于标识符破坏,例如,因为已经在那些记录中的每个记录中观察到给定强标识符(即,针对强标识符属性的值字段被填充并且未缺失)。

参照图4和图5,例如,系统100可以处理所观察到但是不匹配的部分。在一个场景中,如果社会安全号码是被用于确定所述观察到并且匹配的部分的匹配记录的强标识符,则匹配得分引擎400可以执行相对于所述观察到但是不匹配的部分的记录的社会安全号码的编辑距离技术以确定额外的记录匹配。在另一场景中,针对数据库a202和数据库b204的其他记录属性的值能够被用于辅助标识具有错误标记的社会安全号码之间的记录的匹配。作为范例,匹配得分引擎400可以使用记录对的所观察到的社会安全号码是否是匹配的确定作为二进制结果,并且可以使用其他记录属性(诸如患者人口统计学资料、剧烈度、驻留时间等)的值之间的相似性或差异作为额外信息来确定记录对之间的匹配是否存在(例如,确认或覆盖根据社会安全号码用作强标识符而导出的二进制结果)。取决于数据字段的类型,存在对测量的不同的选择。例如,欧几里德距离可能对于特定数值字段(诸如,例如个体的年龄和医学设施中的驻留时间)是更适当的。作为另一范例,编辑距离可以被用于特定字符串字段。在一些情况下,机器学习分类模型可以被用于执行记录匹配预测,并且能够返回与作为针对每对的匹配的可能性有关的得分。分类算法的范例包括以下中的一项或多项:逻辑回归、支持向量机、随机森林和/或其他算法。

如所讨论的,在一些情况下,参照图5,距离检查(例如,编辑距离检查)可以被用于确定记录匹配。作为范例,绘图500和示意图502可以涉及由于标识由于标识符破坏造成的隐藏匹配的过程。在一些实施例中,分类算法被用于筛查候选匹配,并且然后执行对相应的强标识符的距离检查。错误标记的假阴性匹配记录对可以具有高匹配得分。系统100首先标识具有高匹配得分的不匹配的对(或者等效地,分类边界504附近的对,诸如图5中具有围绕其的框的点506、508和510)。还注意到,所述点中的一些点具有垂直交叉影线,并且所述点中的一些点具有对角线交叉影线,以便将其区别为与不同的数据库有关。该筛查提供了可能的隐藏匹配的列表。然后,检查这些潜在隐藏匹配的强标识符,并且如果所述强标识符足够地接近(例如,与社会安全号码123-54-6789相比较的社会安全号码123-45-6789),其由于标识符破坏被声明为隐藏匹配并且被重新标记为匹配。

在一些实施例中,匹配部件110被配置用于使用另一记录属性组来处理个体的健康护理记录集合的至少一个其他集合部分。作为范例,可以完成该操作以预测所述其他集合部分中的哪些健康护理记录具有相对于另一记录属性组的匹配值。所述另一记录属性组可以包括与对应于强标识符的记录属性不同的一个或多个记录属性(被用于处理第一集合部分)。数据链接部件114还基于从对其他集合部分的处理而导出的第二匹配组来链接所述其他集合部分的健康护理记录,所述第二匹配组是在停止对所述其他集合部分的处理之前导出的。

在一种使用情况中,例如,健康护理记录集合可以包括1000000个或更多个健康护理记录,其中,健康护理记录集合的第一集合部分可以包括100000个记录,并且健康护理记录集合部分的另一其他部分可以包括900000个记录。对应于强标识符的记录属性可以被用于处理所述第一集合部分的100000个记录,并且所述记录属性(与对应于强标识符的记录属性不同的)可以被用于处理其他集合部分的900000个记录。在一些实施例中,所述其他集合部分可以不包括所述第一集合部分(例如,所述其他集合部分不包括所述第一集合部分中的一个或多个记录,所述第一集合部分中的记录以及所述其他集合部分的记录互相排斥等)。在一些实施例中,所述其他集合部分可以包括第一集合部分。作为范例,所述第一集合部分可以是所述其他集合部分的子集。

在一些实施例中,匹配预测停止部件112被配置用于基于所述第一匹配组中的匹配的数量(基于对所述第一集合部分的处理而预测的)而使相对于预测健康护理记录匹配而对所述其他集合部分的处理停止。作为范例,匹配预测停止部件可以基于所述第一匹配组中的匹配的数量来确定一个或多个停止准则,基于所述停止准则来监测对所述其他集合部分的处理,并且基于所述停止准则来停止相对于预测健康护理记录匹配而对所述其他集合部分的处理。

在一些实施例中,匹配预测停止部件112被配置用于基于匹配的数量(在所述第一匹配组中)来确定第一阈值作为停止准则。在所述停止之前,匹配预测停止部件112可以基于所述第一阈值来确定是否继续对所述其他集合部分的所述处理。如果例如确定所述其他集合部分中的健康护理记录之间的匹配的数量已经满足了第一阈值,则匹配预测停止部件112可以使相对于预测健康护理记录匹配而对所述其他集合部分的处理停止。另一方面,如果确定所述其他集合部分中的健康护理记录之间的匹配的数量尚未满足所述第一阈值,则匹配预测停止部件112可以继续对所述其他集合部分的处理。

作为范例,如果所述第一集合部分中的记录的给定百分比(例如,70%)匹配,则一旦在以下情况下就可以停止对所述其他集合部分的所述处理:(i)匹配的数量至少在70%匹配预测的10个百分点内(针对所述第一集合部分)(例如,至少60%)以及(ii)已经针对给定时间量执行了对所述其他集合部分的所述处理。作为另一范例,所述第一匹配组中的匹配的数量可以被用于设定对所述其他集合部分的处理的绝对停止点。在一个场景中,例如,一旦匹配的数量是70%匹配预测的超过10个百分点就可以停止对所述其他集合部分的处理(针对所述第一集合部分)。在另外的场景中,一个或多个其他停止准则可以被用于使得在预定绝对停止点之前停止对所述其他集合部分的所述处理。应当注意,这些数量仅是范例,并且设想到了其他数量(例如,其他百分比、其他量等)的使用。

作为另外的范例,匹配预测停止部件112可以响应于在后续时间处确定匹配的数量(在所述其他集合部分中的健康护理记录之间)尚未满足达到所述第一阈值,而使(对所述其他集合部分的)所述处理停止。在一种使用情况中,例如,所述后续时间可以是对所述其他集合部分的所述处理被预设为结束的时间。在另外的使用情况中,匹配预测停止部件112可以基于匹配的数量(在所述第一匹配组中)来设定所述后续时间(作为对所述其他集合部分的所述处理的结束时间)。

在一些实施例中,匹配预测停止部件112可以基于匹配的数量(在所述第一匹配组中)来确定第二阈值作为停止准则,其中,所述第二阈值与所述第一阈值不同。作为范例,如果在第一时间处(例如,停止确定将被实现的时间t1)确定所述其他集合部分中的健康护理记录之间的匹配的数量尚未满足所述第一阈值,则匹配预测停止部件112可以继续对所述其他集合部分的所述处理。在第二时间处(例如,停止确定将被实现的时间t2),匹配预测停止部件112可以确定所述其他集合部分中的健康护理记录之间的匹配的数量是否满足所述第二阈值(例如,相对于所述第一阈值的较低阈值)。如果在第二时间处确定所述其他集合部分中的健康护理记录之间的匹配的数量满足第二阈值,则匹配预测停止部件112可以使相对于预测健康护理记录匹配而对所述其他集合部分的所述处理停止。否则,在一些实施例中,可以继续针对健康护理记录匹配而对所述其他集合部分的处理。

以这种方式,例如,基于匹配的数量(在所述第一匹配组中)停止针对健康护理记录匹配(或者其他数据记录匹配)而对一个或多个集合部分的处理可以节省计算资源,诸如处理资源、存储器资源、网络资源等,同时解决与针对不同的记录集合严格使用相同预定义阈值的相关联的问题。作为范例,针对记录集合(或者其一部分)对记录匹配的另外的预测的停止可以针对基于通过首先处理小集合子集而导出的匹配的数量(在记录集合的该小子集中)针对所述记录集合被个体化。作为另一范例,使用强标识符执行对小集合子集中的记录的匹配可以促进对存在于小集合子集中的记录匹配的数量的足够准确的计数,并且因此,当记录匹配的该数量被用于确定对记录集合的一个或多个其他子集的后续处理将基于的一个或多个停止准则,从这样的处理导出的所得到的匹配可以是足够完全的(例如,少量的假阳性和/或假阳性、大量的真阳性和/或真阴性等)。

在一些实施例中,相对于至少一部分的匹配的总数量可以被如下确定,例如,相对于具有一个或多个观察到和匹配的部分以及观察到但是不匹配的部分的在本文中所描述的范例。在归因于标识符破坏的隐藏匹配已经恢复时,系统100已经获得针对数据库a202和数据库b204的所观察到的部分的所有匹配。匹配率能够被定义如下。

该匹配率测量数据库a202与数据库b204之间的自然地发生的匹配率。将该发生率一般化到整个数据库,系统100通过以下等式来估计跨数据库a202和数据库b204的所有部分的匹配的数量k。

k=α×#{a}×#{b}

该数量k给出了如果所有标识符被完美地观察到则可以找到多少更多匹配的想法。

图6图示了根据一个或多个实施例的被用于求解k基数分配问题的等式的范例。在已经确定了匹配的总数k的情况下,数据链接问题可以再形成为经典组合优化问题(即,k基数分配问题)。在数据库a202与数据库b204中的记录之间标识k个链接,其给出了最小距离,其中,所述距离被定义在记录的字段上。在此,可以使用在先前步骤中所使用的距离测量。能够首先移除已经标识的那些匹配。在图6中给出了数学描述。dij表示数据库a202中的记录i与数据库b204中的记录j之间的距离。iij表示具有指示数据库a202中的记录i和数据库b204中的记录j相匹配的数量1的指示器变量。数量0指示其他方面。在一些实施例中,约束使得给定记录不能够被匹配到其他数据库中的超过一个记录,并且总计存在k个匹配。在其他实施例中,给定记录能够被匹配到其他数据库中的两个或两个以上记录。#符号指示在考虑中的组的大小,诸如,例如数据库a202中的记录的数量。

在一些实施例中,系统100包括一个或多个数据库(例如,临床数据库116)、一个或多个计算平台104、一个或多个处理器120、电子存储装置122、外部资源118和/或其他部件。

(一个或多个)临床数据库116被配置为电子地存储个体的健康护理记录和/或其他信息。如先前所提到的,所述健康护理记录可以包括多个记录属性以及针对所述属性的对应值。

在一些实施例中,数据库(例如,临床数据库116)与一个或多个实体相关联,所述实体诸如是医学设施(例如,医院、医生办公室等)、健康护理管理提供者(例如,退伍军人医疗系统、卫生部)、健康保险提供者和/或其他实体。数据库12包括电子地存储信息的电子存储介质。在一些实施例中,数据库116是和/或被包括在计算机、服务器和/或与所述一个或多个实体相关联的其他数据存储系统中。数据库116的所述电子存储介质可以包括与这样的系统整体地(即,基本上不可移除的)提供的系统存储装置。数据库116可以包括以下中的一项或多项:光学可读存储介质(例如,光盘等)、磁性可读存储介质(例如,磁带、磁性硬盘驱动器、软盘驱动器等)、基于电荷的存储介质(例如,eprom、ram等)、固态存储介质(例如,闪盘驱动器等)和/或其他电子可读存储介质。数据库116被配置为与计算平台104、处理器120、电子存储装置122、外部资源118和/或系统100的其他部件通信,使得由数据库116存储的信息可以由系统100的其他部件和/或其他系统访问(例如,如在本文中所描述的)。应当注意,术语“数据库”的使用并不旨在是限制性的。数据库可以是存储健康护理记录并且允许系统100如在本文中所描述地工作的任何电子存储系统。

计算平台104被配置为提供用户与系统100之间的接口。在一些实施例中,计算平台104与数据库116、处理器120和/或包括处理器120的服务器、健康护理提供者、与所述健康护理提供者相关联的个体用户、所述健康护理提供者的服务提供者(例如,顾问)、系统100的个体用户和/或其他用户和/或实体相关联。计算平台104被配置为向这样的用户和/或实体提供信息和/或从这样的用户和/或实体接收信息。计算平台104包括用户接口和/或其他部件。所述用户接口可以是和/或包括:图形用户接口,其被配置为呈现视图;和/或字段,其被配置为接收对健康护理记录和/或与健康护理记录相关联的信息的输入和/或选择、呈现与匹配的健康护理记录有关的信息(例如,匹配概率、f得分、记录属性)和/或提供和/或接收其他信息。在一些实施例中,所述用户接口例如包括与多个计算平台104、处理器120和/或系统100的其他部件相关联的多个分离的接口。

在一些实施例中,一个或多个计算平台104被配置为向系统100提供用户接口、处理能力、数据库和/或电子存储装置。这样,计算平台104可以包括处理器120、电子存储装置122、外部资源118和/或系统100的其他部件。在一些实施例中,计算平台104被连接到网络(例如,因特网)。在一些实施例中,计算平台104不包括处理器120、电子存储装置122、外部资源118和/或系统100的其他部件,而是替代地经由网络与这些部件通信。网络的链接可以是无线的或有线的。例如,处理器120可以被定位在远程服务器中并且可以从一个或多个健康护理提供者无线地接收用于匹配的健康护理记录。在一些实施例中,计算平台104是膝上型电脑、台式计算机、智能电话、平板计算机和/或其他计算设备。

适于包括在所述用户接口中的接口设备的范例包括触摸屏、小键盘、触敏和/或物理按钮、开关、键盘、旋钮、操纵杆、显示器、扬声器、麦克风、指示器灯、声音警报、打印机和/或其他接口设备。本公开还设想到了,计算平台104包括可移除的存储装置接口。在该范例中,信息可以从使得用户能够定制计算平台104的实施的可移除存储装置(例如,智能卡、闪盘驱动器、可移动磁盘)中加载到计算平台104中。适于与计算平台104和/或所述用户接口一起使用的其他示范性输入设备和技术包括但不限于:rs-232端口、rf链路、ir链路、调制解调器(电话、线缆等)和/或其他设备。

如在图1中所示的,处理器120经由机器可读指令被配置为运行一个或多个计算机程序部件。处理器120可以被配置为通过软件;硬件;固件;软件、硬件和/或固件的某种组合;和/或用于在处理器120上配置处理能力的其他机构,来运行部件108、110、112和/或114。

应当意识到,尽管部件108、110、112和114在图1中被图示为共同定位在单个处理单元内,但是在其中处理器120包括多个处理单元的实施例中,部件108、110、112和/或114中的一个或多个部件可以与其他部件远程地定位。由下文所描述的不同的部件108、110、112和/或114提供的功能的描述是出于说明性目的,而并不旨在是限制性的,因为部件108、110、112和/或114中的任意部件可以提供比所描述的更多或更少的功能。例如,可以消除部件108、110、112和/或114中的一个或多个部件,并且其功能中的一些或全部功能可以由其他部件108、110、112和/或114来提供。作为另一范例,处理器120可以被配置为运行一个或多个额外部件,其可以执行下文归因于部件108、110、112和/或114中的一个部件的功能中的一些或全部功能。

图7图示了根据一个或多个实施例的用于使用强标识符来促进对健康护理记录的计算机辅助的链接的一种方法。下文呈现的方法700的操作旨在是说明性的。在一些实施例中,方法700可以在具有未描述的一个或多个额外操作的情况下和/或在没有所讨论的操作中的一个或多个操作的情况下完成。另外,在图7中图示的并且在下文中描述的方法700的操作的次序并非旨在是限制性的。

在一些实施例中,方法700的一个或多个操作可以被实施在一个或多个处理设备中(例如,数字处理器、模拟处理器、被设计为处理信息的数字电路、被设计为处理信息的模拟电路、状态机、和/或用于电子地处理信息的其他机构)。所述一个或多个处理设备可以包括响应于被电子地存储在电子存储介质上的指令而运行方法100的操作中的一些或全部操作的一个或多个设备。所述一个或多个处理设备可以包括通过硬件、固件和/或软件被配置为特别地被设计用于运行方法700的操作中的一个或多个操作的一个或多个设备。

在操作702处,来自数据库a202和数据库b204的数据是由(一个或多个)服务器102接收的。根据一个或多个实施方案,操作702可以由被配置为运行与部件108、110、112和/或114(如结合图1所描述的)相同或相似的机器可读指令部件的一个或多个硬件处理器120来执行。

在操作704处,来自数据库a202和数据库b204的数据根据强标识符被分割为三个部分,如在本文中所讨论的。根据一个或多个实施方案,操作704可以由被配置为运行与部件108、110、112和/或114(如结合图1所描述的)相同或相似的机器可读指令部件的一个或多个硬件处理器120来执行。

在操作706处,数据通过分类算法来分类以基于数据库a202和数据库b204的各种字段中的信息来预测匹配。根据一个或多个实施方案,操作706可以由被配置为运行与部件108、110、112和/或114(如结合图1所描述的)相同或相似的机器可读指令部件的一个或多个硬件处理器120来执行。

在操作708处,标识可能的隐藏匹配。作为范例,这些隐藏匹配可以归因于破坏的标识符。根据一个或多个实施方案,操作708可以由被配置为运行与部件108、110、112和/或114(如结合图1所描述的)相同或相似的机器可读指令部件的一个或多个硬件处理器120来执行。

在操作710处,执行对编辑距离的检查。如果强标识符之间的所述编辑距离在潜在匹配之间是远的,那么潜在匹配被标记为真实非匹配。如果所述强标识符之间的距离在潜在匹配之间是近的,那么潜在匹配被标记为隐藏匹配。根据一个或多个实施方案,操作710可以由被配置为运行与部件108、110、112和/或114(如结合图1所描述的)相同或相似的机器可读指令部件的一个或多个硬件处理器120来执行。

在操作712处,确定匹配率。确定产生数据库a202与数据库b204之间的自然地发生的匹配率的量。根据一个或多个实施方案,操作712可以由被配置为运行与部件108、110、112和/或114(如结合图1所描述的)相同或相似的机器可读指令部件的一个或多个硬件处理器120来执行。

在操作714处,计算数量k。该数量给出了如果所有标识符被完美地观察到则可以找到多少更多匹配的估计。换言之,估计匹配的总数量。根据一个或多个实施方案,操作714可以由被配置为运行与部件108、110、112和/或114(如结合图1所描述的)相同或相似的机器可读指令部件的一个或多个硬件处理器120来执行。

在操作716处,在已经确定了匹配的总数量k的情况下,数据链接问题再形成为经典的组合优化问题(即,k基数分配问题)。在数据库a202与数据库b204中的记录之间标识k个链接,其给出了最小距离,其中,所述距离被定义在所述记录的字段上。根据一个或多个实施方案,操作716可以由被配置为运行与部件108、110、112和/或114(如结合图1所描述的)相同或相似的机器可读指令部件的一个或多个硬件处理器120来执行。

图8图示了根据一个或多个实施例的用于使用强标识符来促进对健康护理记录的计算机辅助的链接的一种方法800。下文呈现的方法800的操作旨在是说明性的。在一些实施例中,方法800可以在具有未描述的一个或多个额外操作的情况下和/或在没有所讨论的操作中的一个或多个操作的情况下完成。另外,在图8中图示的并且在下文中所描述的方法800的操作的次序并不旨在是限制性的。

在一些实施例中,方法800的一个或多个操作可以被实施在一个或多个处理设备中(例如,数字处理器、模拟处理器、被设计为处理信息的数字电路、被设计为处理信息的模拟电路、状态机、和/或用于电子地处理信息的其他机构)。所述一个或多个处理设备可以包括响应于被电子地存储在电子存储介质上的指令而运行方法800的操作中的一些或全部操作的一个或多个设备。所述一个或多个处理设备可以包括通过硬件、固件和/或软件被配置为特别地被设计用于运行方法800的操作中的一个或多个操作的一个或多个设备。

在操作802处,个体的健康护理记录集合的第一集合部分可以使用对应于强标识符的记录属性组来处理。作为范例,可以完成该操作以预测第一集合部分中的哪些健康护理记录具有相对于记录属性组的匹配值。对应于强标识符的记录属性组可以包括一个或多个对应于强标识符的记录属性。所述预测可以指示所述第一集合部分中的健康护理记录之间的第一匹配组。根据一个或多个实施方案,操作802可以由被配置为运行与部件108、110、112和/或114(如结合图1所描述的)相同或相似的机器可读指令部件的一个或多个硬件处理器120来执行。

在操作804处,确定所述第一匹配组中的匹配的数量。根据一个或多个实施方案,操作804可以由被配置为运行与部件108、110、112和/或114(如结合图1所描述的)相同或相似的机器可读指令部件的一个或多个硬件处理器120来执行。

在操作806处,个体的健康护理记录集合的至少一个其他集合部分可以使用另一记录属性组来处理。作为范例,可以完成该操作以预测所述其他集合部分中的哪些健康护理记录具有相对于另一记录属性组的匹配值。所述另一记录属性组可以包括与一个或多个对应于强标识符的记录属性不同的一个或多个记录属性。根据一个或多个实施方案,操作806可以由被配置为运行与部件108、110、112和/或114(如结合图1所描述的)相同或相似的机器可读指令部件的一个或多个硬件处理器120来执行。

在操作808处,基于所述第一匹配组中的匹配的数量使(相对于预测健康护理记录匹配)对所述其他集合部分的处理停止。根据一个或多个实施方案,操作808可以由被配置为运行与部件108、110、112和/或114(如结合图1所描述的)相同或相似的机器可读指令部件的一个或多个硬件处理器120来执行。

在权利要求中,被放置在圆括号之间的任何附图标记不应当被解释为对权利要求的限制。词语“包括”或“包含”不排除除了在权利要求中所列出的那些之外的元件或步骤的存在。在枚举若干单元的设备权利要求中,可以通过硬件的同一项来实现这些单元中的若干单元。在元件前面的词语“一”或“一个”不排除多个这样的元件的存在。在枚举若干装置的设备权利要求中,可以通过硬件的同一项来实现这些单元中的若干单元。互不相同的从属权利要求中记载了特定元件的仅有事实并不指示不能组合使用这些元件。

尽管基于什么当前被认为是最实际和优选的实施例,本发明已经出于图示的目的详细描述,但是将理解,这样的细节仅仅用于该目的并且本发明不限于所公开的实施例,但是相反,旨在覆盖在权利要求书的精神和范围内的修改和等效布置。例如,将理解,本发明设想到了,在可能的程度上,任何实施例的一个或多个特征可以与任何其他实施例的一个或多个特征相组合。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1