药品信息差异处理方法及系统与流程

文档序号:11276665阅读:283来源:国知局
药品信息差异处理方法及系统与流程
本公开涉及大数据领域,具体而言,涉及一种药品信息差异处理方法、药品信息差异处理系统、电子设备以及计算机可读存储介质。
背景技术
:随着互联网技术的发展,医疗行业正加速医疗信息化建设,药品信息管理是医疗信息化建设的重要组成部分。目前,医疗机构使用的数据库中的药品信息数据不仅数据量较大例如药品信息数据中的药品信息有17.2万多种,每种药品信息还包括多项参考系信息,而且由于医疗机构从业人员的用语格式复杂多变,造成医疗信息系统中存在大量非标准不统一的药品信息数据。现有技术方案中,参照图1所示,为了将非标准的药品记录数据识别为标准药品数据,需要将m条非标准药品记录数据与n条标准药品数据一一构成匹配对,然后通过计算匹配对中的非标准药品记录数据与标准药品数据的匹配分值来确定是否匹配。然而,采用现有技术方案经常会出现下述情况:一个非标准药品记录数据与多个标准药品数据的匹配分值分差太小从而难以进行有效区分,这不仅容易造成匹配错误,还会降低匹配效率。需要说明的是,在上述
背景技术
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。技术实现要素:本公开的目的在于提供一种药品信息差异处理方法及药品信息差异处理系统,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。根据本公开的一个方面,提供了一种药品信息差异处理方法,包括:获取由药品记录数据与标准药品数据组成的匹配对;基于药品信息编码计算所述匹配对中所述药品记录数据与所述标准药品数据的各参考项的相似值;基于各参考项的相似值以及与各参考项对应的判断阈值计算各参考项的差异值;以及对各参考项的差异值进行加权平均得到所述匹配对的综合匹配分值。在本公开的一种示例性实施例中,基于各参考项的相似值以及与各参考项对应的判断阈值计算各参考项的差异值包括:将参考项的相似值与和所述参考项对应的判断阈值进行比较;根据比较结果结合对应的判断阈值、相容概率以及排斥概率对所述相似值采用指数放大方式得到所述参考项的差异值。在本公开的一种示例性实施例中,将参考项的相似值与和所述参考项对应的判断阈值进行比较包括:将参考项的相似值与通过纠正因子对所述参考项对应的判断阈值进行纠正之后的结果进行比较。在本公开的一种示例性实施例中,根据比较结果结合对应的判断阈值、相容概率以及排斥概率对所述相似值采用指数放大方式得到所述参考项的差异值包括:在参考项的相似值大于对应的判断阈值时,通过下式对所述相似值进行指数放大得到各参考项的差异值:差异值=相似值*log(c/d,n)*e其中,f为判断阈值、c为相容概率、d为排斥概率、n为差异因子数以及e为放大系数;以及在参考项的相似值小于对应的判断阈值时,通过下式对所述相似值进行指数缩小得到各参考项的差异值:差异值=相似值*log((1-c)/(1-d),n)*e其中,其中,f为判断阈值、c为相容概率、d为排斥概率、n为差异因子数以及e为放大系数。在本公开的一种示例性实施例中,所述药品信息编码包括字符编码、字形编码以及发音编码中的一种或多种。根据本公开的一个方面,提供一种药品信息差异处理系统,包括:匹配对获取单元,用于获取由药品记录数据与标准药品数据组成的匹配对;相似值计算单元,用于基于药品信息编码计算所述匹配对中所述药品记录数据与所述标准药品数据的各参考项的相似值;差异值计算单元,用于基于各参考项的相似值以及与各参考项对应的判断阈值计算各参考项的差异值;以及匹配分值计算单元,用于对各参考项的差异值进行加权平均得到所述匹配对的综合匹配分值。在本公开的一种示例性实施例中,基于各参考项的相似值以及与各参考项对应的判断阈值计算各参考项的差异值包括:将参考项的相似值与和所述参考项对应的判断阈值进行比较;根据比较结果结合对应的判断阈值、相容概率以及排斥概率对所述相似值采用指数放大方式得到所述参考项的差异值。在本公开的一种示例性实施例中,将参考项的相似值与和所述参考项对应的判断阈值进行比较包括:将参考项的相似值与通过纠正因子对所述参考项对应的判断阈值进行纠正之后的结果进行比较。根据本公开的一个方面,提供一种电子设备,所述电子设备包括处理器;以及存储器,所述存储器上存储有计算机程序,所述程序被所述处理器执行时实现上述任意一项所述的药品信息差异处理方法。根据本公开的一个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现根据上述任意一项所述的药品信息差异处理方法。本公开的一种示例性实施例中的药品信息差异处理方法及药品信息差异处理系统,通过药品信息编码计算所获取的匹配对中的各参考项的相似值;基于各参考项的相似值以及判断阈值计算各参考项的差异值;对各参考项的差异值进行加权平均得到所述匹配对的综合匹配分值。根据本示例实施例中的药品信息差异处理系统,一方面,通过药品信息编码计算所获取的匹配对中的各参考项的相似值,能够准确地得到匹配对中各参考项的相似值;另一方面,基于各参考项的相似值以及判断阈值计算各参考项的差异值,能够根据相似值与判断阈值的比较结果对相似值进行区别性放大处理,从而能够有效区分各参考项的相似值;再一方面,对各参考项的差异值进行加权平均得到所述匹配对的综合匹配分值,能够显著提高各匹配对的匹配分值之间的差异,从而能够对各匹配对进行有效区分,使匹配结果更准确,进一步提高了匹配效率。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明通过参照附图来详细描述其示例实施例,本公开的上述和其它特征及优点将变得更加明显。图1示意性示出了由m条药品记录数据和n条标准药品数据组成的匹配对的示意图;图2示意性示出了根据本公开一示例性实施例的药品信息差异处理方法的流程图;图3示意性示出了根据本公开一示例性实施例的具有多个参考系的药品信息数据;图4示意性示出了根据本公开一示例性实施例计算的匹配对的综合匹配分值与一种技术方案计算的匹配对的综合匹配分值的比较示意图;以及图5示意性示出了根据本公开一示例性实施例的药品信息差异处理系统的框图。具体实施方式现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本公开将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有所述特定细节中的一个或更多,或者可以采用其它的方法、组元、材料、装置、步骤等。在其它情况下,不详细示出或描述公知结构、方法、装置、实现、材料或者操作以避免模糊本公开的各方面。附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个软件硬化的模块中实现这些功能实体或功能实体的一部分,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。本示例实施例中,首先提供了一种药品信息差异处理方法。参考图2中所示,该药品信息差异处理方法可以包括以下步骤:步骤s210.获取由药品记录数据与标准药品数据组成的匹配对;步骤s220.基于药品信息编码计算所述匹配对中所述药品记录数据与所述标准药品数据的各参考项的相似值;步骤s230.基于各参考项的相似值以及与各参考项对应的判断阈值计算各参考项的差异值;以及步骤s240.对各参考项的差异值进行加权平均得到所述匹配对的综合匹配分值。根据本示例实施例中的药品信息差异处理方法,一方面,通过药品信息编码计算所获取的匹配对中的各参考项的相似值,能够准确地得到匹配对中各参考项的相似值;另一方面,基于各参考项的相似值以及判断阈值计算各参考项的差异值,能够根据相似值与判断阈值的比较结果对相似值进行区别性放大处理,从而能够有效区分各参考项的相似值;再一方面,对各参考项的差异值进行加权平均得到所述匹配对的综合匹配分值,能够显著提高各匹配对的匹配分值之间的差异,从而能够对各匹配对进行有效区分,使匹配结果更准确,进一步提高了匹配效率。下面,将对本示例实施例中的药品信息差异处理方法进行详细的说明。在步骤s110中,获取由药品记录数据与标准药品数据组成的匹配对。在本示例实施例中,可以从医院的his(医院信息系统)、emr(电子病历)等医疗信息系统中获取药品记录数据,但是本公开的示例实施例中还可以从医院的cis(临床信息系统)或者医院的药品信息数据库中获取药品记录数据,本公开对此不进行特殊限定。此外,在本示例实施例中,标准药品数据可以为根据《中国药典》制定的标准药品数据,也可以为根据其他医药标准例如《美国药典》、《欧洲药典》、《who国际药典》、卫生部发布的《中药成方制剂》以及《国家中成药标准汇编》等制定的标准药品数据,本公开对此不进行特殊限定。在本示例性实施例中,可以对医院数据系统中的不同类型数据库如mysql、sqlserver、oracle、db2等设计统一接口,可以通过该统一接口获取各数据库中的药品记录数据和标准药品数据。进一步地,在本示例实施例中,药品记录数据和标准数据均包含多个参考项,每个参考项与一参考系对应。参照图3所示,在图3中浅色区域表示待处理的非标准的药品记录数据,深色区域表示标准药品数据。在图3中每条药品记录数据可以包括7个参考项,每个参考项与一个参考系对应,例如在图3中的与7个参考项分别对应的参考系为:药品编号、批准文号、药品名称(中文)、药品名称(英文)、制剂规格、药品剂型、厂商名称。需要说明的是,虽然在本示例实施例中示出了上述7个参考系,但是本公开的示例实施例中的参考系不限于此,例如参考系还可以为药品成分、药品功能以及贮藏方式等参考系,这同样在本公开的保护范围内。接下来,在步骤s220中,基于药品信息编码计算所述匹配对中所述药品记录数据与所述标准药品数据的各参考项的相似值。在本示例实施例中,药品信息编码可以包括字符编码、字形编码以及发音编码中的一种或多种,此外,在本公开的示例实施例中,药品信息编码还可以包括音形编码以及词组编码等,这同样在本公开的保护范围内。进一步地,在本示例实施例中,可以通过编辑距离计算匹配对中各参考项的相似值,但是本公开的示例实施例不限于此,例如,还可以通过n元模型(n-gram)算法以及soundex算法等算法计算匹配对中各参考项的相似值,本公开对此不进行特殊限定。具体而言,下表1示出了通过编辑距离计算出的各参考项的相似值。在下表1中,nid所在的列表示标准药品数据,mid所在的列表示非标准的药品记录数据,r1至r6表示不同的参考系,例如参考系可以为药品编号、批准文号、药品名称(中文)、药品名称(英文)、制剂规格、药品剂型。表1.匹配对中各参考项的相似值nidmidr1r2r3r4r5r6n102m18591.0642783.0268955.7659885.3851142.8757383.00242n102m42367.8804167.0760589.1640475.729475.6888560.30778n102m90286.8419463.7583988.7193558.8421866.2400565.45528n102m58076.6391684.7670462.6767764.9701172.4570662.17329n102m102256.8825593.8525149.1513491.1698182.7349949.01752n102m27645.3950849.5227480.392939.760373.9061440.16648n102m98656.0756647.075148.2359755.1544957.273556.68381n102m55621.6706750.9062921.725557.9710529.4584132.19147n102m85138.6917722.6707532.3527836.7441739.3838334.78763n102m26513.6318175.1238423.1175660.247345.90557624.16077n102m89728.8690184.5168816.0853616.2275517.1747524.42942接下来,在步骤s230中,基于各参考项的相似值以及与各参考项对应的判断阈值计算各参考项的差异值。在本示例实施例中,为了更好地对各参考项的相似值进行区别性处理,可以根据各参考系内容的重要程度来预设各参考系的相似值的判断阈值,此外,还可以根据本示例实施例的药品信息差异处理方法的处理结果来修正各参考系对应的判断阈值,例如可以根据处理结果设置纠正系数来对参考系对应的判断阈值进行纠正。在预设了各参考系的相似值的判断阈值之后,可以将各参考项的相似值与和参考项对应的判断阈值进行比较,在参考项的相似值大于对应的判断阈值时,对参考项的相似值进行正向放大处理,在参考项的相似值小于对应的判断阈值时,对参考项的相似值进行负向放大处理。举例而言,在本示例实施例中,假设参考项的判断阈值为f、纠正系数为h、相容概率为c、排斥概率为d、差异因子数为n以及放大系数为e,则可以直接将参考项的相似值与和参考项对应的判断阈值f进行比较,也可以将参考项的相似值与对应的判断阈值和纠正系数之和例如f+h进行比较,此外,还可以将参考项的相似值与数学式f+h*(f+h)的值进行比较,这同样在本公开的保护范围内。下表2示出了根据本示例实施例与各参考系对应的判断阈值f、纠正系数h、相容概率c、排斥概率d的预设值:参考项判断阀值纠正系数相容概率排斥概率r153.058390.050318340.77031450.2933824r265.66332-0.19134430.84283670.0861728r351.58069-0.02406760.95101120.0806468r458.38195-0.07717130.96763090.1304032r551.19081-0.03693490.7854520.2617031r648.397810.037099610.98665280.3030836需要说明的是,上述预设值仅是本示例实施例中的举例说明,还可以根据处理结果对与各参考系对应的判断阈值f、纠正系数h、相容概率c、排斥概率d的预设值进行修正,这同样在本公开的本公开的保护范围内。进一步地,将参考项的相似值与对应的判断阈值进行比较之后,可以根据比较结果结合对应的判断阈值、相容概率以及排斥概率对相似值采用指数放大方式得到所述参考项的差异值。例如,在参考项的相似值大于对应的判断阈值时,通过下式对所述相似值进行指数放大得到各参考项的差异值:差异值=相似值*log(c/d,n)*e(1)其中,f为判断阈值、c为相容概率、d为排斥概率、n为差异因子数以及e为放大系数;以及在参考项的相似值小于对应的判断阈值时,通过下式对所述相似值进行指数缩小得到各参考项的差异值:差异值=相似值*log((1-c)/(1-d),n)*e(2)其中,其中,f为判断阈值、c为相容概率、d为排斥概率、n为差异因子数以及e为放大系数。举例而言,下表3示出了对参考项的相似值进行指数放大之后得到的参考项的差异值。在下表3中,nid所在的列表示标准药品数据,mid所在的列表示非标准的药品记录数据,r1至r6表示不同的参考系,例如参考系可以为药品编号、批准文号、药品名称(中文)、药品名称(英文)、制剂规格、药品剂型。表3.对相似值进行指数放大之后得到的差异值nidmidr1r2r3r4r5r6n102m185126.8221273.154268198.5142246.8891-76.4432141.3387n102m42394.5347220.676804317.4037218.9698120.0116102.6937n102m902120.9418209.761874315.8207170.1408105.0297111.459n102m580106.7327278.879278223.115187.8596114.8873105.8703n102m102279.21836308.769993-207.915263.6154131.1839-279.712n102m276-73.5977-125.77079286.1804-188.768117.185-229.205n102m98678.09464-119.55462-204.043159.47890.8123996.52271n102m556-35.134-129.28452-91.901167.622-52.5214-183.697n102m851-62.7298-57.575931-136.855-174.449-70.2174-198.511n102m265-22.1008247.15363-97.7895174.2038-10.5291-137.87n102m897-46.8045278.056272-68.0426-77.0429-30.6209-139.403接下来,在步骤s240中,对各参考项的差异值进行加权平均得到所述匹配对的综合匹配分值。在本示例实施例中,可以直接计算各参考项的差异值的平均值来得到匹配对的综合匹配分值,也可以对各参考项的差异值进行加权平均来得到匹配对的综合匹配分值,各参考项的差异值的权重可以根据各参考系的内容的重要程度来确定。具体而言,下表4示出了对参考项的相似值直接求平均值得到的综合匹配分值和对参考项的差异值直接求平均值得到的综合匹配分值。在下表4中,nid所在的列表示标准药品数据,mid所在的列表示非标准的药品记录数据,r1至r6表示不同的参考系,例如参考系可以为药品编号、批准文号、药品名称(中文)、药品名称(英文)、制剂规格、药品剂型,avg为各参考项的相似值的平均值即综合匹配分值,pow为各参考项的差异值的平均值即综合匹配分值。通过表4可以看出,采用了本示例实施例的药品信息差异处理方法计算的综合匹配分值之间的差异明显地扩大了,从而能够对各匹配对进行有效区分,能够提高匹配的准确性,进一步提高了匹配效率。表4.采用本示例实施例计算的匹配分值pow与一种技术方案技术的匹配分值avg的比较nidmidr1r2r3r4r5r6avgpown102m18591.0642783.0268955.7659885.3851142.8757383.0024273.52007151.7125n102m42367.8804167.0760589.1640475.729475.6888560.3077872.64109179.0484n102m90286.8419463.7583988.7193558.8421866.2400565.4552871.64287172.1923n102m58076.6391684.7670462.6767764.9701172.4570662.1732970.6139169.5574n102m102256.8825593.8525149.1513491.1698182.7349949.0175270.4681249.19343n102m27645.3950849.5227480.392939.760373.9061440.1664854.85727-35.6627n102m98656.0756647.075148.2359755.1544957.273556.6838153.4164216.88505n102m55621.6706750.9062921.725557.9710529.4584132.1914735.6539-54.1526n102m85138.6917722.6707532.3527836.7441739.3838334.7876334.10515-116.723n102m26513.6318175.1238423.1175660.247345.90557624.1607733.6978225.51128n102m89728.8690184.5168816.0853616.2275517.1747524.4294231.21716-13.9763更直观地,参照图4所示,在图4中较平缓的曲线表示各参考项的相似值的平均值avg,较陡峭的曲线表示各参考项的差异值的平均值pow,因此,采用本示例实施例中的药品信息差异处理方法,可以显著地增大匹配对的匹配分值之间的差异,从而可以提高匹配的准确性。进一步地,在本示例实施例中,还可以根据所得到的匹配对的综合匹配分值的大小来对匹配对进行排序,从而可以快速地得到与非标准的药品记录数据的匹配分值最高的标准药品数据。需要说明的是,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。进一步地,在本示例实施例中,还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现根据上述实施例中任一项所述的药品信息差异处理方法。此外,在本示例实施例中,还提供了一种药品信息差异处理系统。参照图5所示,该药品信息差异处理系统500可以包括:匹配对获取单元510、相似值计算单元520、差异值计算单元530以及匹配分值计算单元540。其中:匹配对获取单元510用于获取由药品记录数据与标准药品数据组成的匹配对;相似值计算单元520用于基于药品信息编码计算所述匹配对中所述药品记录数据与所述标准药品数据的各参考项的相似值;差异值计算单元530用于基于各参考项的相似值以及与各参考项对应的判断阈值计算各参考项的差异值;以及匹配分值计算单元540用于对各参考项的差异值进行加权平均得到所述匹配对的综合匹配分值。进一步地,在本示例实施例中,基于各参考项的相似值以及与各参考项对应的判断阈值计算各参考项的差异值可以包括:将参考项的相似值与和所述参考项对应的判断阈值进行比较;根据比较结果结合对应的判断阈值、相容概率以及排斥概率对所述相似值采用指数放大方式得到所述参考项的差异值。进一步地,在本示例实施例中,将参考项的相似值与和所述参考项对应的判断阈值进行比较可以包括:将参考项的相似值与通过纠正因子对所述参考项对应的判断阈值进行纠正之后的结果进行比较。由于本公开的示例实施例的药品信息差异处理系统500的各个功能模块与上述药品信息差异处理方法的示例实施例的步骤对应,因此在此不再赘述。此外,在本示例实施例中,还提供了一种电子设备,该电子设备包括处理器;以及存储器,所述存储器上存储有计算机程序,所述程序被所述处理器执行时实现上述实施例中任意一项所述的药品信息差异处理方法。应当注意,尽管在上文详细描述中提及了药品信息差异处理系统的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本公开实施例的方法。本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本
技术领域
中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1