医疗数据转化方法、装置、计算机设备和存储介质与流程

文档序号:16587444发布日期:2019-01-14 18:38阅读:201来源:国知局
医疗数据转化方法、装置、计算机设备和存储介质与流程

本申请涉及计算机技术领域,特别是涉及一种医疗数据转化方法、装置、计算机设备和存储介质。



背景技术:

随着计算机技术的发展,用户越来越多的行为可以通过计算机来实现,如为用户建立对应的医疗健康档案,从而记录相应的医疗行为。

传统地,由于记录的医疗行为可能会采用不同的名称进行记录,所以在建立医疗健康档案时,会将医疗行为中的疾病数据或药品数据人工转化为通用的数据,这样工作量大且转换效率低。



技术实现要素:

基于此,有必要针对上述技术问题,提供一种能够提高转换效率的医疗数据转换方法、装置、计算机设备和存储介质。

一种医疗数据转化方法,所述方法包括:

获取待转化数据与医疗数据转化库;

将所述待转化数据进行拆分得到拆分后的待转化数据;

将所述拆分后的待转化数据与所述医疗数据转化库中包含的待匹配数据进行匹配得到初始转化结果;

根据所述初始转化结果中的不同词语准确程度计算词语匹配得分,并根据所述初始转化结果中的不同词语关联程度计算关联度得分;

根据所述词语匹配得分与所述关联度得分计算最终转化评分;

根据所述最终转化评分得到并输出所述待转化数据的最终转化结果。

在其中一个实施例中,所述根据所述初始转化结果中的不同词语准确程度计算所述初始转化结果中词语匹配得分,包括:

查询所述初始转化结果中的词语所对应的第一得分;

查询所述初始转化结果中的词语所对应的匹配范围的第二得分;

根据所述第一得分与所述第二得分得到所述初始转化结果的词语匹配得分。

在其中一个实施例中,所述根据所述初始转化结果中的不同词语关联程度计算所关联度得分,包括:

提取所述初始转化结果中包含的词语;

计算不同的所述词语之间的关联度作为关联度得分。

在其中一个实施例中,所述将所述待转化数据进行拆分得到拆分后的待转化数据,包括:

获取所述待转化数据的分词逻辑,并根据所述分词逻辑对所述待转化数据进行拆分得到分词序列;

计算所述分词序列所对应的拆分正确率;

获取与所述拆分正确率最大的所述分词序列作为所述拆分后的待转化数据。

在其中一个实施例中,所述将所述拆分后的待转化数据与所述医疗数据转化库中包含的待匹配数据进行匹配得到初始转化结果,包括:

获取所述待转化数据所对应的转化范围;

从所述医疗数据转化库中获取所述转化范围中所包含的明细数据作为待匹配数据;

将所述拆分后的待转化数据与待匹配数据进行匹配得到初始转化结果。

在其中一个实施例中,所述根据所述最终转化评分得到并输出所述待转化数据的最终转化结果之后,包括:

获取标准转化评分范围;

判断所述最终转化结果所对应的所述最终转化评分是否在所述标准评分范围内;

当所述最终转化结果所对应的所述最终转化评分未在所述标准转化评分范围时,则获取更新所述医疗数据转化库的更新指令;

根据所述更新指令对所述医疗数据转化库进行更新。

一种医疗数据转化装置,所述装置包括:

获取模块,用于获取待转化数据与医疗数据转化库;

拆分模块,用于将所述待转化数据进行拆分得到拆分后的待转化数据;

匹配模块,用于将所述拆分后的待转化数据与所述医疗数据转化库中包含的待匹配数据进行匹配得到初始转化结果;

计算模块,用于根据所述初始转化结果中的不同词语准确程度计算词语匹配得分,并根据所述初始转化结果中的不同词语关联程度计算关联度得分;

最终转化评分计算模块,用于根据所述词语匹配得分与所述关联度得分计算最终转化评分;

输出模块,用于根据所述最终转化评分得到并输出所述待转化数据的最终转化结果。

在其中一个实施例中,所述计算模块包括:

第一得分查询单元,用于查询所述初始转化结果中的词语所对应的第一得分;

第二得分查询单元,用于查询所述初始转化结果中的词语所对应的匹配范围的第二得分;

词语匹配得分计算单元,用于根据所述第一得分与所述第二得分得到所述初始转化结果的词语匹配得分。

一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。

上述医疗数据转化方法、装置、计算机设备及存储介质,当有待转化数据时,无需人工对待转化数据进行分析,可以直接获取到待转化数据与医疗数据转化库,从而对待转化数据进行拆分得到拆分后的待转化数据,将拆分后的待转化数据与医疗数据库中包含的待匹配数据进行匹配得到初始转化结果,进而根据初始转化结果中的不同词语匹配程度计算词语匹配得分,并根据初始转化结果中的不同词语关联程度计算关联度得分,进而根据词语匹配得分与关联度得分计算最终转化评分,从而根据最终转化评分得到并输出待转化数据的最终转化结果,使得转化效率提高。

附图说明

图1为一个实施例中医疗数据转化方法的应用场景图;

图2为一个实施例中医疗数据转化方法的流程示意图;

图3为一个实施例中词语匹配得分计算步骤的流程示意图;

图4为一个实施例中医疗数据转化装置的结构框图;

图5为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请提供的医疗数据转化方法,可以应用于如图1所示的应用环境中。其中,转化平台102通过网络与服务器104进行通信。当在建立医疗档案的过程中,需要表述不同但实际相同的医疗数据进行转化得到通用医疗数据,将该需要转化的医疗数据作为待转化数据;或者是,当得到某种医疗数据,如相应的疾病名称,查询该疾病名称所对应的症状或治疗手段时,则可以将该疾病名称进行转化,得到不同的其他通用名称,从而查询到的对应症状以及治疗手段更为全面,则该种医疗数据即疾病名称则为待转化数据。转化平台102获取到待转化数据,并从服务器104获取到医疗数据转化库,进而转化平台102将待转化数据进行拆分得到拆分后的待转化数据,将拆分后的待转化数据与从服务器104中获取到的医疗数据转化库中包含的待匹配数据进行匹配得到初始转化结果,转化平台102根据初始转化结果中的不同词语匹配程度计算词语匹配得分,并根据初始转化结果中的不同词语关联程度计算关联度得分,进而转化平台102根据词语匹配得分与关联度得分计算最终转化评分,根据最终转化评分得到待转化数据的最终转化结果,并将最终转化结果输出至对应的显示界面上。其中,转化平台102可以用独立的服务器或者是多个服务器组成的服务器集群来实现,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中,如图2所示,提供了一种医疗数据转化方法,以该方法应用于图1中的转化平台为例进行说明,包括以下步骤:

s202:获取待转化数据与医疗数据转化库。

具体地,待转化数据是指需要转化为预设的通用医疗数据的相关数据,从而根据转化完成的数据,可以进行相应的数据分析与存储的操作,如可以根据转化完成的数据建立相应的健康档案,其中健康档案是指存储有用户的相关医疗行为的记录日志,可以是用户对应的疾病数据,与疾病数据对应的诊疗信息以及处方信息等,还可以根据转化完成的数据获取到全面的症状或者医疗手段等。医疗数据转化库是指建立完成的存储有不同的医疗数据的数据库,医疗数据可以是人体组织结构,医疗数据可以是疾病数据,医疗数据可以是药品数据等,且医疗数据转化库可以包含有不同的数据层级,可以是包含有基表数据以及对应的明细数据,通过基表数据与明细数据形成相应的语义树,通过该基表数据以及明细数据,可以对待转化数据进行转化,其中,基表数据为语义树中的第一级数据,也即为基础数据,基表数据有对应存在的明细数据,不同的明细数据为第二级数据,也即是对基表数据进行进一步细化的数据。具体地,转化平台获取到待转化数据,进而从服务器获取到预存的医疗数据转化库。

s204:将待转化数据进行拆分得到拆分后的待转化数据。

具体地,转化平台当获取到待转化数据时,则获取待转化数据所对应的分词逻辑,根据获取到的分词逻辑,进而根据分词逻辑将待转化数据进行拆分,当对待转化数据进行拆分得到不同的拆分后的待转化数据时,则查询不同的拆分后的待转化数据所对应的得分,将得分最高的拆分后的待转化数据作为最终的拆分后的待转化数据。例如,得到的待转化数据为“脑膜脓肿引流术”,则获取该待转化数据所对应的分词逻辑,从而进行拆分,得到的拆分后的待转化数据为“脑膜”“脓肿”“引流术”。或者是,得到不同的两个拆分后的待转化数据,如得到第一拆分后的待转化数据为“脑膜”“脓肿”引流术”,得到第二拆分后的待转化数据为“脑”“膜”“脓肿”引流术”,从而分别计算第一拆分后的待转化数据的得分与第二拆分后的待转化数据的得分,当得到第一拆分后的待转化数据的得分高于第二拆分后的待转化数据的得分,则将“脑膜”“脓肿”引流术”作为拆分后的待转化数据。

s206:将拆分后的待转化数据与医疗数据转化库中包含的待匹配数据进行匹配得到初始转化结果。

具体地,待匹配数据是指包含在医疗数据转化库中的医疗数据,医疗数据可以是人体组织结构,医疗数据可以是疾病数据,医疗数据可以是药品数据等。具体地,当转化平台根据分词逻辑将待转化数据进行拆分后得到拆分后的待转化数据,且拆分后的待转化数据中包含有不同的词语,则将拆分后的待转化数据与医疗数据中包含的待匹配数据进行匹配,也即可以是将拆分后的待转化数据中包含的不同的词语分别与待匹配数据进行匹配,当匹配成功时,则将匹配成功的待匹配数据作为初始转化结果,其中,对拆分后的待转化数据中包含的词语与医疗数据转化库中的待匹配数据的匹配,可以是采用字符匹配的方式,例如,拆分后的待转化数据中包含的词语的字符与待匹配数据的字符完全一致时,则匹配成功;也可以是查询与匹配到的字符所关联的字符的方式进行匹配。例如,转化平台得到拆分后的待转化数据为“脑膜”“脓肿”引流术”,从而将拆分后的待转化数据与医疗数据转化库中存储的待匹配数据逐一匹配,从而得到相应的匹配结果可以是“硬脑膜”“脓肿”“引流术”,进而采用匹配到的字符相关联的字符,匹配结果可以是“脑膜”“脓肿”“切除术”,也即是将拆分后的待转化数据中包含的不同的词语分别与医疗数据转化库中包含的待匹配数据进行匹配,可以是进行字符匹配,也可以是查询到匹配成功的字符所关联的字符的方式进行匹配。

s208:根据初始转化结果中的不同词语准确程度计算词语匹配得分,并根据初始转化结果中的不同词语关联程度计算关联度得分。

具体地,词语匹配得分是指按照拆分后的待转化数据包含的词语中的字符与医疗数据转化库中存储的待匹配数据进行匹配时匹配到的不同词语的得分,且得分越高,则匹配程度越高,也即得分越高则初始转化结果中的词语的准确度越高,可以是,词语匹配得分为拆分后的待转化数据包含的词语中的字符与医疗数据转化库中包含的字符是否匹配正确的得分标准,从而得到初始转化结果中的不同词语的准确度。关联度得分是指拆分后的待转化数据中包含的词语是否相互关联的得分,是否关联可以为语义是否关联等,且得分越高则相互关联的程度越高。具体地,转化平台获取到初始转化结果时,则查询拆分后的待转化数据与待匹配数据进行匹配时,得到的包含在初始转化结果中不同词语的得分作为词语匹配得分,进而查询到初始转化结果中包含的不同词语之间的相互关联程度,也即是否关联的得分,作为关联度得分。例如,转化平台获取到待转化数据“脑膜脓肿引流术”的初始转化结果之一是“脑膜”“脓肿”“切除术”,进而,分别获取当采用待转化数据与医疗数据转化库中包含的待匹配数据进行匹配时得到的“脑膜”“脓肿”“切除术”的不同得分,进而将不同得分求和作为词语匹配得分,进而分别获取“脑膜”“脓肿”“切除术”关联程度,也即“脑膜”与“脓肿”是相互关联的词语的得分,“脓肿”与“切除术”是相互关联的词语的得分,从而将也即“脑膜”与“脓肿”是相互关联的词语的得分以及“脓肿”与“切除术”是相互关联的词语的得分进行求和得到关联度得分。待匹配数据的字符与拆分后的待转化数据包含的词语中的字符的数量是否一致为第一计算标准,字符是否完全一致为第二计算标准,根据第一计算标准与第二计算标准,可以得到词语匹配得分。关联度得分可以是,且字符完全一致的情况下得分最高,

s210:根据词语匹配得分与关联度得分计算最终转化评分。

具体地,最终转化评分是指将待转化数据进行转化得到相应的数据的评分,且该评分越高,则得到的相应的数据为待转化数据所对应的转化结果的可靠性越高。转化平台根据得到的词语匹配得分与关联度得分,计算最终转化评分,可以是,转化平台将词语匹配得分与关联度得分求和,从而得到最终转化评分。还可以是,词语匹配得分对应有词语匹配得分权重,关联度得分对应有关联度得分权重,进而计算词语匹配得分与词语匹配得分权重的第一乘积,计算关联度得分与关联度得分权重的第二乘积,计算第一乘积与第二乘积的和得到最终转化评分。s212:根据最终转化评分得到并输出待转化数据的最终转化结果。

具体地,转化平台得到最终转化评分时,则得到不同的初始转化结果的不同的得分,转化平台根据得到的最终转化评分,得到待转化数据所对应的最终转化结果。可以是,转化平台得到不同的最终转化评分时,则将最终转化评分最高的初始转化结果作为最终转化结果,并将最终转化结果输出,显示在转化平台对应的显示界面上,也可以是,转化平台获取到标准最终转化评分,将得到的不同最终转化评分与标准最终转化评分进行比较,当超过标准最终转化评分的所有初始转化结果均作为最终转化结果,并将最终转化结果输出,显示在转化平台对应的显示界面上。

本实施例中,无需人工对待转化数据进行分析,进而转化,只需转化平台获取到待转化数据与医疗数据转化库,从而将待转化数据进行拆分得到拆分后的待转化数据,进而将拆分后的待转化数据与医疗数据转化库中包含的待匹配数据进行匹配得到初始转化结果,且得到初始转化结果时,计算词语匹配得分以及关联度得分,从而根据词语匹配得分以及关联度得分得到最终转化评分,根据最终转化评分得到并输出待转化数据的最终转化结果,采用计算最终转化评分的方式得到最终转化结果,保证得到转化结果的准确性,且整体过程可以提高转化效率。

在其中一个实施例中,请参见图3,提供一词语匹配得分计算步骤的流程示意图,词语匹配得分计算步骤,也即根据所述初始转化结果中的不同词语准确程度计算所述初始转化结果中词语匹配得分,包括:查询初始转化结果中的词语所对应的第一得分;查询初始转化结果中的词语所对应的匹配范围的第二得分;根据第一得分与第二得分得到初始转化结果的词语匹配得分。

具体地,第一得分是拆分后的待转化数据与医疗数据转化库中包含的待匹配数据进行匹配得到的初始转化结果中的词语的准确度的评价标准,第一得分可以包含有两个计算标准,也即初始转化结果中的词语的字符与拆分后的待转化数据包含的词语中的字符的数量是否一致为第一计算标准评分,初始转化结果中的词语的字符与拆分后的带转化数据包含的词语中的字符是否完全一致为第二计算标准评分,根据第一计算标准评分与第二计算标准评分则可以得到第一得分,从而判断初始转化结果中的不同词语的准确程度。第二得分是初始转化结果中包含的词语是否为预设的匹配范围的评价标准,也即表示得到的初始转化结果中包含的词语与待转化数据所包含的词语为相同种类的相同程度,例如,待转化数据包含的词语有“脑膜”“脓肿”“引流术”,则“脑膜”所表示的为组织结构,“脓肿”表示的为病理,“引流术”表示的为治疗方式,从而得到的初始转化结果中包含的词语也应该分别为组织结构、病理以及治疗方式,从而采用第二得分评价初始转化结果中包含的词语是否与拆分后的待转化数据包含的词语的种类的相同程度。

具体地,转化平台得到初始转化结果,则查询初始转化结果中包含的不同词语,根据初始转化结果中包含的不同词语,查询得到的不同词语的字符与拆分后的待转化数据中包含的词语的字符的数量,从而根据查询到的数量,得到第一计算标准评分,进而查询不同词语的字符与拆分后的待转化数据中包含的词语的字符的一致程度,从而得到第二标准评分,将第一标准评分与第二标准评分求和得到第一评分,进而转化平台查询初始转化结果中包含的不同词语,与拆分后的待转化数据中包含的词语所对应的词语种类的相同程度,从而得到第二得分,进而转化平台将第一得分与第二得分求和,得到词语匹配得分。其中,得到第一得分与第二得分,还可以获取第一得分所对应的第一得分权重,进而获取到第二得分对应的第二得分权重,计算第一得分与第一得分权重所对应的乘积,计算第二得分与第二得分权重对应的乘积,将第一得分与第一得分权重所对应的乘积和第二得分与第二得分权重对应的乘积求和,得到词语匹配得分。

本实施例中,转化平台通过计算初始转化结果中的词语所对应的第一得分以及词语所对应的匹配范围的第二得分,从而得到词语匹配得分,从不同的维度考虑到初始转化结果中的不同词语准确程度,从而使得计算的词语匹配得分更全面准确。

在其中一个实施例中,根据所述初始转化结果中的不同词语关联程度计算所关联度得分,包括:提取初始转化结果中包含的词语;计算不同的词语之间的关联度作为关联度得分。

具体地,关联度是指不同词语之间的联系程度,也即关联度是指不同词语之间按照正确的语义进行连接的评价指标,关联度可以预存储,且预存储的关联度是根据不同词语之间是否可以直接关联而得到的,例如,有不同的词语为“脑膜”“脓肿”“切除术”,则“脑膜”与“脓肿”之间预存储有关联度,且“脑膜”与“脓肿”可以直接顺序相连,从而“脑膜”与“脓肿”之间的关联度设置为较高关联度,而“脑膜”与“切除术”直接顺序相连不合理,从而“脑膜”与“切除术”之间的预设的关联度为较低关联度。

具体地,转化平台提取初始转化结果中包含的不同的词语,分别查询每个词语分别与初始转化结果中包含顺序相连的其他的词语的预设关联度,从而将得到的关联度作为关联度得分。可以是,转化平台提取初始转化结果中包含的不同的词语为三个,且三个词语为顺序相连,则查询第一个词语与第二词语之间的预设的第一关联度,进而查询第二个词语与第三个词语的预设的第二关联度,从而将第一关联度与第二关联度求和计算得到最终关联度作为关联度得分。例如,得到的初始转化结果中包含的三个词语为“脑膜”“脓肿”“切除术”,且得到的三个词语可以顺序相连,从而查询“脑膜”与“脓肿”之间的预设第一关联度,再查询“脓肿”与“切除术”之间的预设第二关联度,将第一关联度与第二关联度进行求和,得到最终关联度作为关联度得分。

转化平台通过计算初始转化结果中的词语所对应的第一得分以及词语所对应的匹配范围的第二得分,从而得到词语匹配得分,从不同的维度考虑到初始转化结果中的不同词语准确程度,从而使得计算的词语匹配得分更全面准确

本实施例中,转化平台通过计算初始转化结果中不同词语之间的关联度,从而得到关联度得分,计算过程简单易行,节省运算资源。

在其中一个实施例中,将待转化数进行拆分得到拆分后的待转化数据,包括:获取待转化数据的分词逻辑,并根据分词逻辑对待转化数据进行拆分得到分词序列;计算分词序列所对应的拆分正确率;获取与拆分正确率最大的分词序列作为拆分后的待转化数据。

具体地,分词逻辑是将待转化数据拆分成数个标准术语,该标准术语是指具有独立语义的术语,其不受其之后或之前的文字的影响,仅通过术语内容的文字即可以确定完整的专业概念,例如对待转化数据“脑膜脓肿引流术”按照使每个拆分数据具有独立的语义,且每个拆分数据为最短的进行拆分,得到“脑膜”、“脓肿”和“引流术”三个个拆分数据。分词序列是指对待转化数据进行拆分得到的不同的候选字段,也即得到不同的标准术语,例如,获取到的待转化数据为“脑膜脓肿引流术”,则可以得到不同的分词序列有第一分词序列“脑膜”、“脓肿”和“引流术”,得到的第二分词序列为“脑”“膜”“脓肿”引流术”。拆分正确率是指经过将待转化数据进行拆分得到的候选字段的正确程度,也即将待转化数据进行拆分得到的不同的标准术语的正确程度,当拆分正确率越高则表示将待转化数据进行拆分得到的候选字段正确率越高。

进一步地,获取多个预存储的分词逻辑,进而根据预设的分词逻辑,将获取到的待转化数据进行拆分,根据分词逻辑,将待转化数据拆分得到不同的分词序列,进而计算每一个分词序列对应的拆分正确率,将拆分正确率最大的分词序列中的分词词组作为拆分后的待转化数据。其中,计算拆分正确率可以是当获取到不同的分词序列时,则获取预设的每个分词序列中的不同的分词词组的正确率,进而计算不同的分词词组的正确率乘积,从而得出每一个分词序列对应的拆分正确率,

例如,终端接收到待转化数据为“脑膜脓肿引流术”,进而获取不同的分词逻辑,根据不同的分词逻辑,将获取到的待拆分数据拆分为不同的分词序列,可以拆分为第一分词序列“脑膜”、“脓肿”和“引流术”,拆分的第二分词序列为“脑”“膜”“脓肿”引流术”,进而获取第一分词序列中的不同的分词词组的正确率,如获取到“脑膜”的正确率为1,“脓肿”的正确率为“1”,“引流术”的正确率为1,获取第二分词序列中不同的分词词组的正确率,如获取“脑”的正确率为0.8,“膜”的正确率为“0.8”,脓肿的正确率为“1”,“引流术”的正确率为1,进而计算得到第一序列中的分词词组的正确率的乘积为1,则第一分词序列对应的拆分正确率为1,进而计算得到第二序列中的分词词组的正确率的乘积为0.64,则第二分词序列对应的拆分正确率为0.64,则第一分词序列的拆分正确率为最大的拆分正确率,进而将第一分词序列中的分词词组“脑膜”、“脓肿”和“引流术”作为拆分后的待转化数据。需要说明的是,不同的分词词组的概率为预设的概率,该预设概率根据可以预设为不同的值。

本实施例中,转化平台可以将待转化数据进行拆分得到不同的分词序列,进而选取拆分正确率最大的分词序列作为拆分后的待转化数据,保证可以得到准确的拆分后的待转化数据,从而可以提高对待转化数据进行转化的准确率。

在其中一个实施例中,将拆分后的待转化数据与医疗数据转化库中包含的待匹配数据进行匹配得到初始转化结果,包括:获取待转化数据所对应的转化范围;从医疗数据转化库中获取转化范围中所包含的明细数据作为待匹配数据;将拆分后的待转化数据与待匹配数据进行匹配得到初始转化结果。

具体地,转化范围是指包含在医疗数据转化库中的最大的数据层级,也即当对待转化数据进行转化时,得到经过转化的数据包含在转化范围内。明细数据是指包含医疗数据转化库中的,可以进一步细化相应的基表数据的数据。例如,人体组织结构为“眼球”,眼球还包括“眼球壁”与“内容物”,则“眼球”可以为基表数据,且“眼球”可以作为最大转化范围,则“眼球壁”与“内容物”可以分别作为两个明细数据,需要说明的是,由于明细数据中包含的数据可以进一步细化,则被进一步细化的数据则可以继续作为基表数据,进一步细化得到的数据可以为新的明细数据。

具体地,当转化平台对待转化数据进行转化时,则先获取预存的转化范围,也即可以是,查询待转化数据中包含的不同词语所对应的预存的基表数据,所得到的基表数据可以作为转化范围,进而根据获取到的转化范围,从医疗数据转化库中查询对应的转化范围中的明细数据,也即可以是,根据基表数据作为转化范围,则将作为转化范围的基表数据与存储在医疗数据转化库中的基表数据进行匹配,当匹配成功时,则获取到匹配成功的存储在医疗数据转化库中存储的基表数据所关联的明细数据,将明细数据作为待匹配数据,从而将拆分后的待转化数据逐一与待匹配数据进行匹配,从而得到初始转化结果。

需要说明的是,当根据最终转化评分,得到最终转化结果之后,还可以查询最终转化结果是否包含在转化范围中,也即转化平台可以提取最终转化结果中包含的词语,查询最终转化结果中包含的词语所对应的明细数据,从而查询明细数据所关联的基表数据,进而转化平台查询基表数据是否与转化范围一致,当基表数据与转化范围一致时,则得到的最终转化结果为可靠的最终转化结果,当查询的基表数据与转化范围不一致时,则最终转化结果可能为不可靠的转化结果,也即需要用户进一步查询,如可以查询是否在匹配环节上出现错误,或者是查询相应的医疗数据转化库是否包含有错误的明细数据等,且得到的最终转化结果也需要用户进一步确认是否接收,则在转化平台对应的显示界面上显示是否接收转化结果的提示信息,用户可以根据提示信息,选择是否接受该最终转化数据。

本实施例中,在对待转化数据进行转化之前,可以先获取待转化数据所对应的转化范围,从而根据转化范围,查询医疗数据转化库中包含的明细数据,从而对待转化数据进行转化,保证得到的最终转化数据准确,且在转化之前则规定转化范围,从而提高转化效率。

在其中一个实施例中,根据最终转化评分得到并输出待转化数据的最终转化结果之后,包括:获取标准转化评分范围;判断最终转化结果所对应的最终转化评分是否在标准评分范围内;当最终转化结果所对应的最终转化评分未在标准转化评分范围时,则获取更新医疗数据转化库的更新指令;根据更新指令对医疗数据转化库进行更新。

具体地,标准转化评分范围是指最终转化结果所对应的最终转化评分的标准值范围,也即当得到的最终转化结果所对应的最终转化评分在标准转化评分范围时,则该最终转化结果为可以采用的最终转化结果。具体地,转化平台得到最终转化结果时,虽然最终转化结果所对应的最终转化评分为相对较高的结果,但仍未在标准转化评分范围内,从而该最终转化结果是由于医疗数据转化库仍未旧版本从而得到的匹配结果,则需要对医疗数据转化库进行更新,转化平台获取预存储的标准转化评分范围,进而查询最终转化结果所对应的最终转化评分,判断最终转化评分是否在标准转化评分范围中,当最终转化评分未在标准转化评分范围中,则得到该最终转化结果的医疗数据转化库中包含的信息可能不齐全,无法匹配得到相对较准确的转化结果,则在转化平台所对应的界面上显示相应的提示信息,将该最终转化评分未在标准转化评分范围的最终转化结果以及是否对医疗数据转化库进行更新的提示信息进行显示,用户根据显示的提示信息,可以输入相应的更新信息,其中该更新信息可以是增加医疗数据转化库中的数据,如输入将准确数据添加至医疗数据转化库中的添加信息,从而根据用户进行的输入,生成更新指令,更新指令上携带有用户的输入的信息,转化平台接收到该更新指令,则对医疗数据转化库进行更新。

本实施例中,转化平台可以判断最终转化结果的最终转化评分是否在标准评分范围中,也即如果未在标准评分范围中,则虽然得到的是较高的最终转化评分的最终转化结果,但是该最终转化结果也不可用,也即当前的医疗数据转化库存在数据缺失,则对当前的医疗数据转化库进行更新,使得后续对待转化数据进行转化得到的最终转化结果准确。

应该理解的是,虽然图2-3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图4所示,提供了一种医疗数据转化装置,包括:获取模块410、拆分模块420、匹配模块430、计算模块440、最终转化评分计算模块450和输出模块460,其中:

获取模块410,用于获取待转化数据与医疗数据转化库。

拆分模块420,用于将待转化数据进行拆分得到拆分后的待转化数据。

匹配模块430,用于将拆分后的待转化数据与医疗数据转化库中包含的待匹配数据进行匹配得到初始转化结果。

计算模块440,用于根据初始转化结果中的不同词语准确程度计算词语匹配得分,并根据初始转化结果中的不同词语关联程度计算关联度得分。

最终转化评分计算模块450,用于根据词语匹配得分与关联度得分计算最终转化评分。

输出模块460,用于根据最终转化评分得到并输出待转化数据的最终转化结果。

在其中一个实施例中,计算模块440包括:

第一得分查询单元,用于查询初始转化结果中的词语所对应的第一得分。

第二得分查询单元,用于查询初始转化结果中的词语所对应的匹配范围的第二得分。

词语匹配得分计算单元,用于根据第一得分与第二得分得到初始转化结果的词语匹配得分。

在其中一个实施例中,计算模块440还可以包括:

提取单元,用于提取初始转化结果中包含的词语。

关联度得分计算单元,用于计算不同的词语之间的关联度作为关联度得分。

在其中一个实施例中,拆分模块420,包括:

拆分单元,用于获取待转化数据的分词逻辑,并根据分词逻辑对待转化数据进行拆分得到分词序列。

拆分正确率计算单元,用于计算分词序列所对应的拆分正确率。

待转化数据获取单元,用于获取与拆分正确率最大的分词序列作为拆分后的待转化数据。

在其中一个实施例中,匹配模块430,包括:

转化范围获取单元,用于获取待转化数据所对应的转化范围。

明细数据获取单元,用于从医疗数据转化库中获取转化范围中所包含的明细数据作为待匹配数据。

初始转化结果获得单元,用于将拆分后的待转化数据与待匹配数据进行匹配得到初始转化结果。

在其中一个实施例中,输出模块460,包括:

转化评分范围获取单元,用于获取标准转化评分范围。

判断单元,用于判断最终转化结果所对应的最终转化评分是否在标准评分范围内。

更新指令获取单元,用于当最终转化结果所对应的最终转化评分未在标准转化评分范围时,则获取更新医疗数据转化库的更新指令。

更新单元,用于根据更新指令对医疗数据转化库进行更新。

关于医疗数据转化装置的具体限定可以参见上文中对于医疗数据转化方法的限定,在此不再赘述。上述医疗数据转化装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储医疗数据转化数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种医疗数据转化方法。

本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取待转化数据与医疗数据转化库。将待转化数据进行拆分得到拆分后的待转化数据。将拆分后的待转化数据与医疗数据转化库中包含的待匹配数据进行匹配得到初始转化结果。根据初始转化结果中的不同词语准确程度计算词语匹配得分,并根据初始转化结果中的不同词语关联程度计算关联度得分。根据词语匹配得分与关联度得分计算最终转化评分。根据最终转化评分得到并输出待转化数据的最终转化结果。

在其中一个实施例中,处理器执行计算机程序时实现根据初始转化结果中的不同词语准确程度计算初始转化结果中词语匹配得分,包括:查询初始转化结果中的词语所对应的第一得分。查询初始转化结果中的词语所对应的匹配范围的第二得分。根据第一得分与第二得分得到初始转化结果的词语匹配得分。

在其中一个实施例中,处理器执行计算机程序时实现根据初始转化结果中的不同词语关联程度计算所关联度得分,包括:提取初始转化结果中包含的词语。计算不同的词语之间的关联度作为关联度得分。

在其中一个实施例中,处理器执行计算机程序时实现将待转化数据进行拆分得到拆分后的待转化数据,包括:获取待转化数据的分词逻辑,并根据分词逻辑对待转化数据进行拆分得到分词序列。计算分词序列所对应的拆分正确率。获取与拆分正确率最大的分词序列作为拆分后的待转化数据。

在其中一个实施例中,处理器执行计算机程序时实现将拆分后的待转化数据与医疗数据转化库中包含的待匹配数据进行匹配得到初始转化结果,包括:获取待转化数据所对应的转化范围。从医疗数据转化库中获取转化范围中所包含的明细数据作为待匹配数据。将拆分后的待转化数据与待匹配数据进行匹配得到初始转化结果。

在其中一个实施例中,处理器执行计算机程序时实现根据最终转化评分得到并输出待转化数据的最终转化结果之后,包括:获取标准转化评分范围。判断最终转化结果所对应的最终转化评分是否在标准评分范围内。当最终转化结果所对应的最终转化评分未在标准转化评分范围时,则获取更新医疗数据转化库的更新指令。根据更新指令对医疗数据转化库进行更新。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取待转化数据与医疗数据转化库。将待转化数据进行拆分得到拆分后的待转化数据。将拆分后的待转化数据与医疗数据转化库中包含的待匹配数据进行匹配得到初始转化结果。根据初始转化结果中的不同词语准确程度计算词语匹配得分,并根据初始转化结果中的不同词语关联程度计算关联度得分。根据词语匹配得分与关联度得分计算最终转化评分。根据最终转化评分得到并输出待转化数据的最终转化结果。

在其中一个实施例中,计算机程序被处理器执行时实现根据初始转化结果中的不同词语准确程度计算初始转化结果中词语匹配得分,包括:查询初始转化结果中的词语所对应的第一得分。查询初始转化结果中的词语所对应的匹配范围的第二得分。根据第一得分与第二得分得到初始转化结果的词语匹配得分。

在其中一个实施例中,处理器执行计算机程序时实现根据初始转化结果中的不同词语关联程度计算所关联度得分,包括:提取初始转化结果中包含的词语。计算不同的词语之间的关联度作为关联度得分。

在其中一个实施例中,计算机程序被处理器执行时实现将待转化数据进行拆分得到拆分后的待转化数据,包括:获取待转化数据的分词逻辑,并根据分词逻辑对待转化数据进行拆分得到分词序列。计算分词序列所对应的拆分正确率。获取与拆分正确率最大的分词序列作为拆分后的待转化数据。

在其中一个实施例中,计算机程序被处理器执行时实现将拆分后的待转化数据与医疗数据转化库中包含的待匹配数据进行匹配得到初始转化结果,包括:获取待转化数据所对应的转化范围。从医疗数据转化库中获取转化范围中所包含的明细数据作为待匹配数据。将拆分后的待转化数据与待匹配数据进行匹配得到初始转化结果。

在其中一个实施例中,计算机程序被处理器执行时实现实现根据最终转化评分得到并输出待转化数据的最终转化结果之后,包括:获取标准转化评分范围。判断最终转化结果所对应的最终转化评分是否在标准评分范围内。当最终转化结果所对应的最终转化评分未在标准转化评分范围时,则获取更新医疗数据转化库的更新指令。根据更新指令对医疗数据转化库进行更新。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1