索赔分析引擎的制作方法

文档序号：6608107阅读：174来源：国知局

专利名称：索赔分析引擎的制作方法
索赔分析引擎
背景技术：
医疗保健索赔付款人所使用的过程是人工密集型的并且执行不一致，并且易遭受错误、欺诈和滥用。结果，医疗保健管理员难于识别并且防止索赔付款错误。目前，管理索赔的大约30%的花费与后端的操作和支持相关联，尤其是与“返工”索赔相关联的活动。也就是说，大量的花费与审计索赔相关联，该审计索赔用于识别付款错误；当产生缴付不足时，处理提供者和患者的抱怨；以及联系提供者和患者来收回超额缴付。这些费用最终由客户 (提供者和患者两者)来承担，并且处理索赔中的错误也可能会导致令客户更加不满。

发明内容
根据本发明的实施方式涉及例如可以在医疗保健产业中利用的分析工具，并且该分析工具还可以在医疗保健产业之外应用。使用医疗保健作为示例，分析工具用于解决具有返工索赔的问题，诸如但不限于付款问题(例如，索赔的超额缴付或缴付不足)。重要地，分析工具旨在识别出现问题具有较高可能性的索赔，使得那些索赔可以预应地 (proactively)进行调解，从而避免或降低返工错误索赔的费用和精力。一般而言，分析工具的特征为预测性的、学习性的以及实时性的模型系统。为了开发该工具，从多个异构源收集信息并且将其转换成有用的格式。信息可以包括从多个源收集到的相对非结构化的文本和语义数据，以及从标准索赔表格读取的结构化的(例如，数值的、统计的)数据。使用诸如分割、分类等方法来分析信息用于创建具有不断学习能力的预测模型，也就是说，随着新信息的收集和更多索赔的评估，该模型可以不断被改进。作为示例，实际中导致付款错误的已知索赔可以使用本发明的分析工具进行分析，并且可以将那些索赔的属性与其他索赔的那些属性相比较，来识别也可能会导致付款错误的附加索赔。可以将那些附加索赔识别给审计器(自动的或人工的)，使得在付款之前可以对索赔中的任何错误进行纠正；如果已经进行付款，那么可以主动将错误改正。将来自审计器的反馈并入分析工具，以这种方式改善应用到随后索赔的工具的准确度。通过事先自动检测可能要求返工(纠正或调整)的索赔，可以改进客户关系，并且可以降低管理精力和成本。在阅读了下文的详细描述之后，本领域技术人员应当理解本发明的这些和其他目的及优势，这些在多个附图中也进行了说明。

并入了本说明书并形成其一部分的附图示出了本发明的实施方式，并且和说明书一起用于阐述本发明的原理。贯穿附图和说明书，相同的标号表示相同的元件。图1是根据可以实现的本发明实施方式的计算机系统示例的框图；图2是可以由根据本发明的分析工具实现的训练过程的实施方式；图3是可以由根据本发明的分析工具实现的部署过程的实施方式；图4是示出了根据本发明的计算机实现的分析工具的实施方式的框图；以及
图5和图6是示出了根据本发明的实施方式的、用于处理索赔的计算机实现的方法中步骤的流程图。
具体实施例方式在下文根据本发明的实施方式的详细描述中，阐明了多个特定细节以便提供对那些实施方式的彻底理解。然而，本领域技术人员应当认识到，在不利用这些特定细节或利用其等效项的情况下也可以实践本发明。在其他实例中，为了不必要地混淆本发明的多个方面，没有详细描述公知的方法、过程、组件和电路。下面详细描述的某些部分用过程、逻辑块、处理和对计算机存储器中数据位操作的其他符号化表示来呈现。这些描述和表示是数据处理领域的技术人员将他们工作的实质最有效传达给本领域其他技术人员所使用的手段。在本申请中，将过程、逻辑块、处理等认为是通向期望结果的自洽的步骤或指令序列。该步骤要求对物理量进行物理操纵。通常，但不是必须地，这些量表现为能够在计算机系统中进行存储、转移、组合、比较等操纵的电信号或磁信号的形式。然而，应当注意，所有这些以及相似术语都与适当的物理量相关联，并且只是应用于这些量的方便标签。除非特别指出，则从下文论述中容易理解的是，贯穿本申请应当理解利用术语(诸如，“访问”、“组合”、“并入”、“识别”、“提取”、“预测”、“导出”、“标记”、“评估”、 “更新”、“比较”、“应用”、“量化”、“关联”、“选择”等)的论述可以指计算机系统或相似电子计算设备的动作和处理，该设备操纵表示为计算机系统的寄存器和存储器中物理(电)量的数据，并且将其转换成相似地表示为计算机系统存储器或寄存器或其他这种信息存储、传输或显示设备中物理量的其他数据。这里描述的实施方式可以在驻留在某些形式的计算机可用介质(诸如，程序模块)上的、可由一个或多个计算机或者其他设备执行的计算机可执行指令的一般上下文中进行讨论。通常，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等。在各种实施方式中，程序模块的功能性可以根据期望的进行组合或分布。图1示出了根据这里描述可以实现的实施方式的计算机系统100示例的框图。在其最基本的配置中，系统100包括至少一个处理单元102和存储器104。这种最基本的配置在图1中由虚线106示出。系统100还可以具有附加特征/功能。例如，系统100还可以包括附加存储(可移除的和/或非可移除的)，包括但不限于磁盘或光盘或者磁带。这种附加存储在图1中由可移除存储108和非可移除存储120示出。系统100还可以包含允许设备与其他设备通信的通信连接122。一般而言，系统100包括至少某些形式的计算机可用介质。计算机可用介质可以是能由系统100访问的任何可获得的介质。通过示例而非限制的方式，计算机可用介质可以包括计算机存储介质和通信介质。计算机存储介质包括用于存储信息(诸如，计算机可读指令、数据结构、程序模块或其他数据)的、以任何方法或技术实现的易失性和非易失性、可移除和非可移除的介质。计算机存储介质包括但不限于随机访问存储器(RAM)、只读存储器(ROM)、电可擦除可编程ROM(EEPROM)、快闪存储器或其他存储器技术、压缩盘ROM(CD-ROM)、数字多功能盘(DVD)或其他光存储、磁卡带、磁带、磁盘存储或其他磁存储设备、或者可以用于存储期望信息并且可以由系统100访问的任何其他介质。任何这种计算机存储介质可以是系统100的一部分。存储器104、可移除存储108和非可移除存储120都是计算机存储介质的示例。通信介质可以体现计算机可读指令、数据结构、程序模块或者经调制的数据信号 (诸如，载波或其他传输机制)中的其他数据，并且包括任何信息传递介质。术语“经调制的数据信号”是指具有已经以一种方式设置或者改变的一个或者多个其特征以便编码信号中的信息的信号。通过示例而非限制的方式，通信介质包括有线介质(诸如，有线网络或直接有线连接)和无线介质(诸如，声波、射频(RF)、红外和其他无线介质)。上文介质的任何组合也可以包括在计算机可读介质的范围中。通信连接122是通信介质的示例。系统100还可以具有输入设备124，诸如，键盘、鼠标、笔、语音输入设备、触摸输入设备等。还可以包括输出设备126，诸如，显示器、扬声器、打印机等。系统100可以在使用逻辑上连接到一个或多个远程计算机的联网环境中进行操作。当在网络化环境中使用时，可以将系统100通过通信连接122连接到网络。在图1的示例中，存储器104包括与分析引擎150相关联的计算机可读指令、数据结构、程序模块等。然而，分析引擎150除了可以驻留于由系统100使用的任何一个计算机存储介质中，还可以分布于计算机存储介质的某些组合上，或者可以分布于联网的计算机的某些组合上。一般而言，分析引擎150的特征为预测性的、学习性的以及实时性的模型系统。在概述中，分析引擎(或分析工具)150例如可以在医疗保健产业中进行利用，包括但不限于医疗保险索赔付款人、医院和医师群体。然而，根据本发明的实施方式不限于医疗保健应用。一般而言，本发明的实施方式可以用于如下行业、产业等，其定期地利用索赔和其他类型的记录、文件和表格(索赔表格以外的)。除了医疗保健，根据本发明的实施方式例如还可以用来评估用于工人的赔偿、财产保险和意外保险的索赔、记录、文件等。例如，当处理索赔时，分析引擎150可以用于识别出现问题具有高概率的索赔，使得那些索赔可以主动进行调解，从而避免或降低返工错误索赔的成本和精力。在实际中，已知包括错误、或已导致错误的索赔可以使用分析引擎150进行分析，并且可以将那些索赔的属性与其他索赔相比较，来识别可能与相同类型的错误相关联的任何其他索赔。例如，已知的已导致付款错误的索赔可以使用分析引擎150进行分析，并且可以将那些索赔的属性用作基础，来识别也可能导致付款错误的任何其他索赔。可以将识别为潜在会出现问题的索赔提交给审计器(人工的或自动的)，使得在完成索赔处理之前(例如，在付款之前)，可以对任何错误进行纠正。如果索赔已经解决或完成(例如，已经执行付款)，那么可以主动将错误改正。将来自审计器的反馈并入分析引擎150，以这种方式改善应用到随后索赔的工具的准确度。下面详细呈现了与分析引擎150相关联的元件和功能。分析引擎150可以用于训练过程(见图2)和/或开发过程(见图3)。图2示出了根据本发明可以使用分析引擎150实现的训练过程200的实施方式。可以将过程200实现为存储在计算机可用介质中的计算机可读指令。在图2的实施方式中，分析引擎150访问索赔数据库202。索赔数据库202可以包括已付款的索赔和/或未付款的索赔、已审计的索赔、尚未审计的索赔、已经完成/解决的索赔和未决的索赔。在训练过程中，对已审计的索赔的考虑是重要的，这是因为可以将从那些索赔中学到的教训并入下面讨论的预测模型214。在医疗保健实现中，通常将索赔以标准化的、计算机可用的(计算机可读)格式进行存储，诸如基于医疗保健财政管理局(HCFA)表格1500或统一票据(UB)表格92的格式。索赔数据库202中的信息这里可以被称为“第一历史信息”。分析引擎150还可以访问诸如非结构化的文本数据204和外部数据206的信息。一般而言，非结构化的文本数据204和外部数据206包括索赔数据库202中不包括的信息。从下面的论述中将会看到，训练过程200的目的是开发可以用于预测索赔是否包含准确信息的模型，通常，分析引擎150的目的是用于识别潜在会有问题的索赔并且在付款之前拦截那些索赔(如上文所指出的，工具还可以用于在付款之后识别潜在会有问题的索赔)。可以通过将索赔中的信息与已知正确的信息和/或已知不正确的信息进行关联来做出预测，并且可以借助于将信息值作为错误预测符或标记符，通过对发现感兴趣的其他类型信息来对预测进行加权。通常，非结构化的文本数据204和外部数据206构成那些“其他类型的信息”，并且同样它们包括各种不同类型的信息。例如，非结构化的文本数据204和外部数据206可以是基于争论信息、提供者呼叫信息、恢复信息和审计结果信息。非结构化的文本数据204可以进一步包括但不限于如下信息，诸如医生的记录、审计器的记录、来自客户服务呼叫的记录等。通常，外部数据206 包括索赔中不包括的并且尚未包括在非结构化的文本数据204中的其他信息。外部数据 206可以包括但不限于如下信息，诸如基于Web的信息或来自最新的其他源的信息，例如，可以将国家或世界的某个区域正遭受流感爆发的信息包括在外部数据中。外部数据206还可以包括来自可以免费获得或可以被商业销售的各种公共或私有数据库中的信息。包括在非结构化的文本数据204和外部数据206中的信息的类型、以及信息本身可以是动态的。例如，可以将关于前面提到的流感爆发的信息认为是与时间段相关，但可能变得越来越不相关，因此可能被较小加权或丢弃。在此，将非结构化的文本数据204和外部数据206、以及索赔数据库202中不包括的或从索赔数据库中信息没有导出的任何其他信息共同称为“第二历史信息”。将数据源(索赔数据库202、非结构化的文本数据204和外部数据206)中的信息用作用于识别期望在识别会有问题的索赔中是有用的特征的基础。一般而言，“特征”是被命名的参数或变量；特征的值从基于每个索赔的前面提到的数据源中获得或从其导出(虽然特征可能对于一组索赔具有相同的值)。特征可以基于包括在数据源中的条目的类型，例如，患者的年龄、医生的名字、合同号、保险代码、货币金额和可以从数据源直接读取的地址。特征还可以从包括在数据源中的信息的多种类型中导出，例如，在执行医疗过程的时间与提交索赔的时间之间的天数、在收到索赔与数据处理之间的天数、具有索赔中最高记账额的过程代码、为特定过程支付的金额减去过去六个月期间为过程支付的平均金额、然后除以相同的过去六个月期间为过程支付的金额的标准差，或者特定类型药物在一个时段期间在一组医生或特定地理区域上平均的费用，可以将其视为可以使用包括在数据源中的信息来确定的有用的特征。已转换数据208包括选定特征的值。已转换数据208可以包括索赔本身(已付款和未付款、已审计和未审计、已解决和未决)、从前述数据源中解析的真实数据和通过操纵、转换或挖掘该真实数据导出的数据。可以单独地和共同地使用各种分析技术来生成已转换数据208。这些技术包括但不限于机器学习技术。机器学习技术包括文本挖掘、数据挖掘、神经网络和自然语言处理。机器学习技术的示例包括但不限于线性知觉、支持向量机、决策树和朴素贝叶斯(Naive Bayes)。这些技术中的每一个可以用于更快地评估非结构化数据；识别并描绘数据中感兴趣分割、分组和模式；以及进一步促进人们对大的数据集的理解和解释。机器学习技术可以依赖于高级统计方法(比如，线性和非线性的回归技术)，以及非统计方法(比如，决策树、分割、分类和神经网络)。使用机器学习技术，例如可以对非结构化数据204和外部数据206进行搜索，来寻找匹配或满意地匹配指定文本字符串的数据。实质上，就此描述处理200的部分构成了 ETL(提取、转换、加载)处理的多个方面。因而，可以将以来自多个不同源的各种不同格式的异构数据转换为有用并且相对标准化的格式。在图2的示例中，将已转换数据208分成训练数据210和验证数据212。训练数据 210可以用于开发模型214。模型214是基本上合格的或回归的模型，其实现机器学习技术来评估已转换数据208，以便计算索赔包含错误的概率以及也可能是相关联的置信度。一旦开发，模型214便可以使用验证数据212进行验证。更具体地，将训练数据210用于在已转换数据208中包括的特征与特定索赔正确或错误的可能性之间建立关联。可以将根据本发明的实施方式用于检测各种类型的错误，而不只是与付款/赔偿相关联的错误。例如，可以识别一个或多个索赔属性中的错误，例如，索赔中指定的合同号、过程代码等中的错误，同样可以检测和识别索赔中包括的任何货币金额。然而，可能只是索赔的某个特性是有意义的。例如，如果期望的目标是对属于提供者或患者的钱的准确赔偿，那么只有当包括在索赔中的货币金额不正确时、或当影响适当赔偿的某些其他索赔不正确时、或当作为潜在赔偿错误的准确预测符的某些索赔属性具有某个值或其本身是错误时，才可以将索赔分类为不正确。因此，在一个实现中，可以过滤经识别的各种类型的错误，以便关注于特定类型的错误(例如，付款/赔偿错误)。可以使用上文提到的各种分析技术适当地考虑并访问训练数据210中包括的每个特征，直到产生一个或多个模型214。在实际中，产生许多不同的模型。模型214使用与特定特征相关联的值、或与特定特征组合相关联的值，来计算特定索赔是有问题(例如，索赔可能包含错误，或可能包含导致错误的信息)的概率。模型214还可以用于计算与所计算的概率相关联的置信度。一旦可以使用模型214满意地预测训练数据210 (也就是说，一旦可以将有问题的索赔识别到满意的置信度)，便可以将验证数据212用于对模型的准确度进行独立地测试和验证。模型开发是训练与验证之间的迭代过程，该过程一直持续到验证数据212被满意地预测。现在参考图3，示出了根据本发明可以使用分析引擎150实现的开发过程300的实施方式。可以将处理300实现为存储在计算机可用介质中的计算机可读指令。在图3的实施方式中，分析引擎150访问索赔数据库302。索赔数据库302中的内容类型类似于索赔数据库202(图2)中的内容类型，但是开发过程300中的索赔有别于(或增补)训练处理200中使用的索赔。在医疗保健索赔付款人的示例中，索赔数据库302可以包括已付款的索赔以及尚未付款的索赔。通常，索赔数据库302可以包括已经处理的/完成的索赔和尚未处理或正在处理中的索赔。更一般地，分析引擎150可以用于评估任何实例化的索赔。分析引擎150还可以访问如下信息，诸如图3的非结构化的文本数据304和外部数据306。通常，非结构化的文本数据304和外部数据306类似于上文结合图2关于内容类型描述的相应元素，但是开发过程300中使用的非结构化的文本数据304和外部数据306 可以有别于(或增补)训练过程200中使用的信息。基于在图2的训练过程200期间识别的特征，将来自图3的数据源302、304和306 中的数据转换成已转换数据308。换言之，已转换数据308可以包括索赔本身、从图3数据源解析的真实数据和通过操纵、转换或挖掘该真实数据导出的数据。因此，一般而言，相对较大的并且不同的数据集合(在内容和源方面不同)得以被调整和管理。继续参考图3，对于从索赔数据库302选出的每个索赔，将模型214应用到对应的已转换数据308来计算该索赔是不正确(或者相反，是正确的)的概率。实质上，对每个评估的索赔进行评分。可以将单个得分作为整体分派给索赔，或者可能存在与索赔相关联的多个得分。例如，对于后一种的情况，可以对索赔的一个或多个属性进行单独评分。在一个实施方式中，可以将索赔的得分与条件值(诸如，指定的阈值)相比较；如果得分满足条件值(例如，超过阈值)，那么可以将索赔转发到审计器312用于进一步评估(例如，审计)。审计可以通过遵从先前建立的审计规则以自动形式(例如，以软件)来实现。备选地，人类审计者也可以执行审计。如这里先前提到的，可以存在许多不同类型的模型214。例如，模型214可以是基于神经网络、回归逻辑(例如，基于线性回归、逻辑回归、多项式回归和/或内核回归)和决策树。可以使用一个或多个模型214来评定索赔。模型本身可以对各种索赔属性进行加权来计算结果，并且还可以对来自每个模型的结果进行加权。在审计中，可以查看潜在有问题的索赔，并且做出关于该索赔实际上是否有错误的决策。可以将来自审计器312的反馈并入模型214以便改善那些模型的准确度。例如，如果索赔确实是错误的，那么审计器的反馈可以用于加强模型214的准确度；如果索赔事实上没有问题(虽然预测有问题)，那么审计器的反馈可以用于改善模型214，使得在随后索赔的评估期间较少地发生错误预测。如图3中所示，可以使用来自审计器312的反馈重复训练过程200，来改善(更新)现有的模型214或开发(创建)新的附加模型。一般而言，分析引擎150可以被不断地更新，因为新的结果从开发过程300中生成，可以重复训练过程 200来更新模型214。以这种方式，审计过程通过加强正确的决定并且识别不正确的决定来帮助教导分析引擎150。由于暂时的改变，分析引擎150也可以被更新。例如，付款人实践或过程可能会因某些原因而改变(例如，在合同方面可能改变)，并且可以将分析引擎150进行相应地更新。此外，随着通过开发过程300获得经验，可以识别新的索赔属性或相关的特征，并将其添加到模型214，从而可以开发新的模型。在一个实施方式中，除了生成感兴趣索赔的得分，分析引擎150还生成伴随索赔并且特定于该索赔的评论或解释。评论可以采取诸如下面描述的各种形式。
在一个实现中，向人类审计者呈现索赔表格的在线(电子的、显示的)版本和以某种方式突出显示的索赔中潜在有问题的项目。例如，索赔中的潜在错误可以相对于该索赔中的其他项目以不同颜色呈现或以不同的背景颜色来呈现。颜色的程度可以是多样的以便反映潜在错误的概率度。例如，相对于错误可能性较小的项目，使用更深或更亮的颜色来显示更有可能是错误的项目。例如，如果分析引擎150指示索赔中货币金额可能错误，那么除了突出显示该金额，还可以将触发识别错误的索赔的属性以各种程度突出显示。在另一实施方式中，向审计器提供索赔或索赔的属性为何可能是不正确的基于文本的解释。随着由分析引擎150评估的索赔数量的提高，可以将重现的问题/错误进行识别并且统一描述。换言之，在一个实施方式中，生成标准的评论集合；这些标准的评论中的每一个可以与相应数字码或键相关联，该相应数字码或键继而与适当的基于文本的解释相关联。这些标准的评论提供了对索赔中潜在问题或错误的普通语言解释。一旦识别了错误，便可以自动查看标准的评论集合来确定哪个评论(如果有的话)可能是最适当的，并且可以随着潜在有问题的索赔将选定的评论提供给审计器。当审计索赔时，审计器还可以审计选定评论的适当性，并且就此向分析引擎150提供反馈。关于评论的反馈可以用于改善选择评论的分析引擎150的部分，使得在随后的索赔评估中，更准确地选择适当的评论。没必要将向审计器提供的附加信息限制于突出显示索赔的一个或多个属性的解释。解释还可以与从那些属性导出的信息(例如，一个或多个特征)相关联。通常，解释还可以与索赔相关联，以便广泛地特性化索赔；例如，解释可以将索赔标记为缴付不足或超额缴付。因此，一般而言，可以向审计器呈现信息，以帮助它们识别为什么标记索赔以及索赔的哪些方面应当可能是审计的关注点。这种信息可以关于索赔、关于索赔的属性或者关于从索赔的属性导出的特征。在一个实施方式中，不是向审计器提供所有的潜在有问题的索赔，而仅转发某些索赔。更具体地，可以仅将认为是更重要的或最重要的那些索赔提供给审计器。可以应用不同的标准来识别哪些索赔是最重要的。在一个实施方式中，认为将对分析引擎150产生最大改进的那些索赔是最重要的索赔。例如，认为将在预测准确度方面产生最大改进的那些索赔是最重要的。例如，最重要的索赔可以是表示大量相同或相似的索赔，或者具有迷惑分析引擎的潜在性的索赔的那些索赔，这是因为它们是错误的概率非常接近上文提到的阈值。如果将可能产生最大成本节约(直接地或间接地)的索赔正确地识别为有错误的，那么也可以被认为是重要的。例如，在付款寄出之前，如果拦截和纠正了较有可能产生向服务中心的电话呼叫的错误索赔，那么通过减少这种索赔的数量可节约大量成本，或许可以将呼叫中心的规模减小来降低成本。在一个实施方式中，假设那些索赔是正确预测的，将在分析引擎150的准确度方面的改进的测量量化来识别最重要的有问题的索赔。例如，对于这种识别为潜在有问题的索赔，利用基于假设所讨论的索赔已经被正确地描述为正确/不正确的仿真，可以在后台对分析引擎150的作用进行仿真(例如，通过与开发过程300并行地执行训练过程200)。将对系统准确度具有最大影响的索赔转发给审计器。例如，如上文提到的，可以针对每个索赔计算改进的测量；在这种实现中，仅向审计器转发测量大于阈值的那些索赔。在另一实施方式中，一旦识别了适当预测的索赔(也就是说，适当预测为正确或者可能更感兴趣的索赔、适当预测为有问题的索赔)，审计器可以请求类似于该索赔的附加索赔。类似的索赔可以包括至少某些程度等同于该适当预测索赔的属性。例如，如果将适当预测的有问题索赔的特定属性或特征识别为错误源，那么审计器可以请求针对该属性或特征具有相同值的其他索赔。例如，审计器可以备选地请求与接收的已处理索赔相同或相似得分的其他索赔。如这里先前指出的，可以对索赔的属性单独评分；因而，审计器可以请求的其他索赔，该其他索赔的一个或多个属性具有与接收的已处理索赔中属性相同或相似得分。同样，如这里先前指出的，附加信息(例如，或许基于文本或由数字码识别的标准解释)可以与处理过的索赔相关联；因而，审计器可以请求与处理过的索赔相关联的相同或相似附加信息相关联的其他索赔。通常，审计器可以使用任何感兴趣索赔的一个或多个属性和/或与处理过的索赔相关联的结果，来定义可以用于识别和选择审计器可能会感兴趣的其他索赔的搜索标准。更一般而言，与任何感兴趣索赔相关联的任何信息都可以用于搜索、识别和选择来自索赔数据库202或302中的另一索赔。图4是示出了根据本发明的分析引擎150的实施方式的元件的框图。在一个实施方式中，将分析引擎150实现为位于计算机可用介质上的计算机可读组件。在图4的示例中，分析引擎150包括数据提取模块404和一个或多个预测模型 214。数据提取模块404可以访问已转换数据308，并且提取与正被评估的每个索赔相关联的信息。选定评估的索赔可以是已付款的或未付款的、已审计的或未审计的、未决的或解决的；通常，无论索赔的状态，索赔的任何实例都可以被评估。可以通过各种方式选择索赔进行评估。在一个实现中，对所有索赔进行评估。在其他实现中，仅对选定的索赔进行评估。在后一实现中，索赔可以是随机选定的，或者它们可以是响应于查询、规则或其他指定的选择(搜索)标准而选定的。例如，一旦将索赔识别为潜在有问题的，或在这种索赔已经被审计并确认为有问题的之后，便可以基于该索赔定义参数来执行已转换数据308(或索赔数据库302)的搜索，以便识别可能有类似问题的其他索赔。上文已经提到了用于选择要处理的索赔的其他机制的示例。由这种搜索选定的索赔可以绕开模型214，直接进入审计阶段 (例如，审计器312)。如上文所述，模型214可以用于预测索赔是正确的还是不正确的。例如，模型214 可以预测每个索赔中指定的货币值是否正确。此外，如这里先前所述，模型214可以标记被预测为不正确的用于审计的索赔；生成与每个索赔相关联的评论；以及突出显示审计器可能特别感兴趣的索赔的方面。在一个实施方式中，如这里之前所述，分析引擎150还包括数据转换模块402，该数据转换模块402可以用于训练过程200来访问数据源202、204和206并生成已转换数据 208，并且可以用于开发过程300来访问数据源302、304和306并生成已转换数据308。例如，数据转换模块402可以使用机器学习技术。如这里之前所述，审计可以由人来执行。然而，在一个实施方式中，分析引擎150 还可以包括可以使用预建立的审计规则自动地审计经标记的索赔的审计器312。在一个这种实施方式中，如这里之前提到的，审计器312用于识别可能比其他索赔更重要的经标记的索赔。也就是说，事实上，审计器312可以过滤经标记的索赔，使得只向人类审计者转发选定的索赔。通常来自审计器312或来自审计处理的结果可以用于识别要评估的其他索赔。如这里之前所述，通常还可以将来自审计器312或来自审计处理的结果反馈给训练过程200来更新模型214。除了刚刚描述的功能，分析引擎150可以提供其他功能。例如，分析引擎150可以合并允许追踪需要恢复或调整的未付款索赔或已付款索赔的状态的功能。例如，分析引擎 150可以包括允许一旦识别了错误索赔就自动联系患者和提供者的功能；换言之，分析引擎可以生成并且或许发送标准化形式的信件。同样，例如，分析引擎150可以提供管理和财务报告功能。此外，关于错误类型和频率的信息可以由分析引擎150进行记录，使得这种信息可以随后用于执行根本原因分析或找到新兴趋势。图5和图6是示出了用于处理索赔的计算机实现方法的实施方式的流程图。虽然在流程图中公开了特定步骤，但这种步骤仅是示例。也就是说，可以执行各种其他步骤或流程图中所述步骤的变化。流程图中的步骤可以通过不同于所呈现的顺序来执行。此外，流程图描述的各种实施方式的特征可以单独使用或彼此组合使用。在一个实施方式中，可以将该流程图实现为存储在计算机可用介质中的计算机可读指令。首先参考图5，在块502中，访问与索赔集合相关联的第一历史信息。该第一历史信息包括索赔的属性以及从该索赔属性导出的信息。具体地，在训练过程期间，第一历史信息包括图2的索赔数据库202中的信息。在块504中，访问第二历史信息。该第二历史信息包括前面提到的第一历史信息以外的信息。具体地，在训练过程期间，第二历史信息包括图2的非结构化的文本数据204 和外部数据206。在块506中，使用诸如上文所述的训练过程200 (图2)，可以将第一历史信息和第二历史信息组合到开发模型214，这对预测索赔是否正确非常有用。在块508中，将来自索赔审计的反馈并入模型214中。现在参考图6，在块602中，访问索赔的属性。在块604中，使用模型214(图3)来评估索赔的属性用于确定该索赔是错误的概率。例如，对正被评估的索赔计算得分。在块606中，如果概率(得分)满足阈值，那么标记索赔用于进一步评估(例如，审计)来确定索赔是否真的错误。在块608中，在一个实施方式中，如果索赔被标记用于审计，那么将附加信息(例如，评论或解释)与索赔相关联来促进审计。一般而言，附加信息用于以某种方式突出显示可能触发审计的索赔的一个或多个属性。例如，附加信息可以是基于文本的评论或非文本的可视提示(例如，可以使用不同的颜色或亮度来突出显示属性)。在块610中，在一个实施方式中，如果索赔被标记用于审计，那么在审计之前确定对模型214改进的测量。只有当测量满足阈值时，才会执行审计。换言之，可以做出努力来识别重要的索赔，其中重要性可以通过许多方法来定义，并且只审计更重要的索赔。总之，根据本发明的实施方式提供了自动化的系统/工具，其允许索赔数据与包括来自各种源(包括基于Web的源和数据库)的非结构化的文本/语义数据的其他数据集的无缝集成。使用该信息，可以执行自动化的索赔分析来在索赔解决之前识别问题，或者在索赔解决之后调解识别的错误。此外，系统/工具可以从索赔分析的结果不断地学习。从长远来看，将会需要更少的返工，从而降低成本。同样，随着准确度的提高，客户(患者和提供者)满意度将会提高。错误可以是无意的或故意的(例如，欺诈)，通过系统地改进准确识别错误的能力，可以更容易地识别出欺诈索赔。虽然是在医疗产业中保险索赔的上下文中进行描述，但是根据本发明的实施方式不限于此。例如，本发明的多个方面可以应用于其他产业中的保险索赔。同样，本发明的多个方面可以应用于在各种类型的产业中可以定期利用的记录、文件和其他类型的表格(除了索赔表格)。已经为说明和描述的目的呈现上文对根据本发明的特定实施方式的描述。它们没有旨在穷尽本发明或将本发明限制于明确公开的形式，并且根据上文教导可能进行许多修改和变化。对实施方式进行选择和描述以便最好地阐明本发明的原理和其实际应用，从而使本领域的其他技术人员能够最好地利用本发明和具有适于特定使用预期的各种修改的各种实施方式。本发明的范围旨在由所附的权利要求及其等效项来限定。
权利要求
一种计算机可用介质，其具有用于处理索赔的计算机可读组件，所述组件包括数据提取模块，操作用于访问索赔数据库以及用于提取与其相关联的信息，所述信息包括所述索赔的属性；以及多个预测模型，用于评估从所述索赔数据库中选择的索赔，其中所述预测模型可操作用于预测索赔的属性是否不正确，以及如果与所述索赔相关联的属性被预测为不正确的，那么标记所述索赔用于审计，其中所述预测模型基于来自先前评估过的索赔的审计的反馈进行更新。
2.根据权利要求1所述的计算机可用介质，其中所述预测模型使用所述索赔的所述属性以及还使用从所述属性导出的数据来评估所述索赔。
3.根据权利要求1所述的计算机可用介质，其中所述预测模型确定所述索赔的得分，其中如果所述得分满足阈值，那么所述索赔被标记用于所述审计。
4.根据权利要求1所述的计算机可用介质，其中如果所述索赔被标记用于所述审计，那么在执行所述审计之前确定对所述预测模型改进的测量，其中如果所述测量满足阈值，那么执行所述索赔的所述审计。
5.根据权利要求1所述的计算机可用介质，其中与所述索赔相关联的信息用于从所述索赔数据库中选择另一索赔。
6.一种处理索赔的计算机实现的方法，所述方法包括访问针对多个索赔的第一历史信息，所述第一历史信息包括所述索赔的属性和从所述属性中导出的信息；访问包括不是所述多个索赔的属性或从所述多个索赔导出的信息的第二历史信息；组合所述第一历史信息和第二历史信息来产生模型用于预测与索赔相关联的属性是否正确；以及将来自所述索赔的审计的反馈并入所述模型。
7.根据权利要求6所述的方法，其中所述第二历史信息包括非结构化的基于文本的数据和外部数据，所述外部数据包括没有包括在所述索赔中的信息。
8.根据权利要求6所述的方法，其中所述预测包括确定所述索赔的得分；以及如果所述得分满足阈值，那么标记所述索赔用于所述审计。
9.根据权利要求6所述的方法，其中将所述第一历史信息和第二历史信息分成用于开发所述模型的训练数据和用于测试所述模型的验证数据。
10.根据权利要求6所述的方法，进一步包括使用与所述索赔相关联的信息来定义用于选择另一索赔的搜索参数。
11.一种计算机可用介质，其中嵌入了用于促使计算机系统执行处理索赔的方法的计算机可读程序代码，所述方法包括访问索赔的属性，包括货币金额的付款请求；使用所述属性来确定与所述索赔相关联的属性是错误的概率；如果所述概率满足阈值，那么标记所述索赔用于进一步评估来确定所述属性是否错误；以及如果所述索赔被标记用于所述进一步评估，那么将附加信息与所述索赔相关联，其中所述附加信息用于识别所述索赔的属性，其中所述索赔的属性潜在地是在所述属性方面出现错误的原因。
12.根据权利要求11所述的计算机可用介质，其中所述方法进一步包括从所述属性导出数据，以及使用从所述属性导出的所述数据来确定所述概率。
13.根据权利要求11所述的计算机可用介质，其中从包括以下的组中选择所述附加信息基于文本的评论；以及非文本的可视提示。
14.根据权利要求11所述的计算机可用介质，其中所述方法进一步包括如果所述索赔被标记用于所述进一步评估，那么在执行所述进一步评估之前确定对所述模型改进的测量，其中如果所述测量满足阈值，那么执行所述进一步的评估。
15.根据权利要求11所述的计算机可用介质，进一步包括基于来自所述进一步评估的反馈来更新所述模型。
全文摘要
本发明涉及索赔分析引擎。描述了用于处理索赔(例如，医疗保险索赔)的方法和系统。例如，在未付款索赔的付款之前，对索赔中指定的属性是否正确做出预测。根据预测结果，索赔可以被标记用于审计。来自审计的反馈可以用于更新预测模块，以便改善那些模块的准确度。
文档编号G06Q40/00GK101996385SQ20101026064
公开日2011年3月30日申请日期2010年8月20日优先权日2009年8月25日
发明者A·K·埃索, D·菲弗曼, L·J·利扎迪, L·J·简特曾, L·R·瓦朗斯, M·S·艾里斯, M·库玛, N·F·霍维尔, R·格哈尼, Z-S·梅申请人:埃森哲环球服务有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：Ｒ.格哈尼;Ｌ.Ｒ.瓦朗斯;Ｍ.Ｓ.艾里斯;Ａ.Ｋ.埃索;Ｍ.库玛;Ｚ－Ｓ.梅;Ｄ.菲弗曼;Ｎ.Ｆ.霍维尔;Ｌ.Ｊ.利扎迪;Ｌ.Ｊ.简特曾
技术所有人：埃森哲环球服务有限公司
我是此专利的发明人

上一篇：信息处理系统、信息处理器、成像装置和信息处理方法
上一篇：触控式显示装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。