风险评估系统及数据处理方法与流程

文档序号：12271875阅读：277来源：国知局

本发明涉及一种对于被评估者信息进行数据统计及风险评估的技术，且特别涉及一种风险评估系统以及数据处理方法。

背景技术：

如何利用历史数据来研判人的特定行为是否会对人自身的身体或是心理状态产生几率性的病变或犯罪行为，是自古以来希望实现的目标，进而希望通过收集人群的数据来降低人群中的患病风险或预防犯罪。就医疗角度而言，如果能够通过人群的病例数据来得知特定疾病很有可能与哪些特定条件有直接性地相关的话，医生便可以针对不同病人的生活行为或某些疾病提出建议或提供对应药物，进而让病人能够通过改善生活行为或服用特定药物来改善获得疾病的几率或是延缓疾病带来的痛苦。

以往的风险评估技术都是以专家学者所提出的评分计量系统，配合被评估者(如，病患)的病例或问卷等方式模型公式来说明被评估者针对特定疾病的发病可能性或是犯罪几率的风险评估。然而，上述这些模型公式仅仅采用专家学者的意见或观点，但却难以通过其中的条件来说明为何会诱发特定疾病或是提升犯罪风险。例如，医生仅能够模糊地通过评分计量系统来跟病患解释特定病症的几率高低或风险程度，但无法明确地向病人解释，到底是由于哪些判断条件而提高了患病几率。另一方面，目前的风险评估技术通常采用较为繁杂与不精确的演算法(例如，贪心建构法(greedy construction method)、分类及回归树(classification and regression trees)演算法、决策树学习演算法…等)来获得演算结果。但在实务上，贪心演算法很有可能因为数据类型的不足而仅仅获得局部优化(local optimization)的结果，无法达到全局优化。

技术实现要素：

本发明提供一种风险评估系统及数据处理方法，通过数据中的上下文特征以及低复杂度的模型演算法来达到风险评估的效果，并提升使用效率。

本发明的风险评估系统包括分析设备以及电子设备。分析设备通过多条数据以及这些数据中的上下文特征以产生至少一个决策表单。每个决策表单具备多个条目，每个条目包括至少一个判断条件以及对应于特定结果的几率信息。电子设备与所述分析设备相互通信。电子设备接收所述决策表单，并依据被评估者的至少一个当前条件来对比所述决策表单中每个条目的判断条件。并且，当所述当前条件与特定条目的所述判断条件相同时，电子设备将显示特定条目所对应的判断条件以及此几率信息。

本发明的数据处理方法包括下列步骤。通过多条数据以及这些数据中的上下文特征以产生至少一个决策表单。每个决策表单中具备多个条目，每个条目包括至少一个判断条件以及对应于特定结果的几率信息。依据被评估者的至少一个当前条件来对比所述决策表单中每个条目的判断条件。并且，当所述当前条件与特定条目的所述判断条件相同时，显示所述特定条目所对应的所述判断条件以及所述几率信息。

基于上述，本发明实施例所述的风险评估系统及数据处理方法可通过数据中的上下文特征以及低复杂度的模型演算法来达到风险评估的效果，并可提升使用效率。另一方面，可通过判断条件让医生等该领域专业人员向被评估者或病患说明特定事件的风险评估理由跟防范方式，藉以使本风险评估系统易于使用。

为让本发明的上述特征和优点能更明显易懂，下文特举实施例，并配合说明书附图作详细说明如下。

附图说明

图1是依照本发明实施例所述的风险评估系统的示意图。

图2是依照本发明实施例所述的数据处理方法的流程图。

图3是依照本发明实施例所述的数据处理方法中寻找各个判断条件的步骤流程图。

图4是依照本发明实施例所述的数据处理方法中寻找各个应对方案/建议动作/解决方案的步骤流程图。

附图标记说明：

100：风险评估系统

110、140：分析设备

112：通信接口

114：机器学习模块

116：认知分析模块

120：电子设备

122：通信模块

124：显示屏幕

126：对比模块

130：风险评估信息交换平台

S210～S240、S310～S340、S410～S440：步骤

具体实施方式

本发明实施例希望通过决策同步(decision alignment)的方式来评估被评估者在特定领域(例如，医疗领域或犯罪防治领域)中对应于特定情况(如，特定疾病或特定犯罪的再发生几率)的风险。本发明实施例主要以医疗保健领域为例，希望建立一个风险评估平台、系统以及数据处理方法，并基于少数的判断条件来使医生能够轻易地将病人对于某些疾病的发生几率以高风险至低风险的优先次序来排序，进而对每个病人依照其自身的条件来提出相对应的改善建议或提供医药或疗程。并且，此风险评估平台也可应用于其他希望整合针对人们行为或情况进行统计与风险评估的技术领域，例如犯罪防治领域。换句话说，此风险评估平台及其系统希望能够降低医疗用途或犯罪防治用途中的建置成本，并可通过降低模型演算法的运算困难度来降低对于硬件运算的依赖程度，从而增加领域专业人员对于此平台的使用效率。

图1是依照本发明实施例所述的风险评估系统100的示意图。风险评估系统100可以通过认知分析运算的相应结构来实现，并可以通过软件定义风险评估(Software defined risk assessment)来做为主要实现手段。风险评估系统100主要包括分析设备110以及电子设备120。分析设备110可以是特定建筑物(例如，医院)内的主机服务器或相关电脑设备。于本实施例中，分析设备110主要包括通信接口112、机器学习模块114以及认知分析模块116。通信接口112可以是实体的网络协议或通信协议接口卡，分析设备110通过通信接口112来与其他设备进行通信以及数据传递。

机器学习模块114以及认知分析模块116可以是分别由各自的硬件来实现的芯片结构，也可以是通过分析设备110中的处理器配合相应程序来实现的软件模块。机器学习模块114可通过通信接口112与风险评估信息交换平台130以及其他的分析设备140来相互交换新的数据或是其他分析设备140所产生的决策表单，并通过机器学习模型来通过共享信息而进行交互学习(Co-learning)，藉以让认知分析模块116可自动地且动态地产生或更新自身产生的决策表单。另一方面，机器学习模块114也可经由时间经过来自动地且动态地产生或更新自身产生的决策表单，藉以让分析设备110在此建筑物(如，医院)所获得的信息(如，人群的病历数据)上能够进行自我学习(Self-learning)。换句话说，数据的来源可以是从病例或网络上其他医院的网络数据库、本地数据库、信息交换平台、问卷调查所获得、由病历输入来获得或是通过风险评估交换平台130所获得，应用本实施例者并不限制数据的获得来源。另外，分析设备还会将自行计算得出的决策表单作为上述数据以自我回馈，藉以不断地更新数据。

认知分析模块116可通过所获得的多条数据以及这些数据中的上下文特征以针对特定结果分别产生至少一个决策表单。每个决策表单可具备多个条目，且每个条目包括至少一个判断条件以及对于此特定结果的几率信息。认知分析模块116可以通过多种演算法来对这些数据进行分析及分类，例如K平均值分类(k-means clustering)演算法、凝聚分类(agglomerative clustering)演算法、简化分类(reductionist clustering)演算法…等。

电子设备120则可以是例如手机、平板电脑、笔记本电脑…等消费型设备。电子设备120包括通信模块122、显示屏幕124以及对比模块126。每个分析设备110可以连接多个电子设备120，以使医生等多个领域专业人员都能够通过电子设备120来实现本发明实施例。对比模块126可以是电子设备120中的处理器或中央处理单元(CPU)，并通过载入程序以实现本发明实施例所述的各种步骤流程。电子设备120中的对比模块126可通过通信模块122以与分析设备110相互通信。通信模块122例如是特定的通信协议(如，无线通信、蓝牙通信、第三代无线通信、LTE…等)的数据接口卡或通信芯片。显示屏幕124则用以显示决策表单以及决策表单中各条目的判断条件以及几率信息。电子设备120可以是以执行远端应用程序、爪哇(Java)应用程序、图形化用者接口程序、C语言应用程序…等的硬件平台来实现本发明实施例。

图2是依照本发明实施例所述的数据处理方法的流程图。于本实施例中所述的数据处理方法以及风险评估系统100皆可适用于不同领域中，例如医疗领域或犯罪防治领域。为了方便说明，以下主要以医疗领域作为主要实施例。然而，应用本实施例者应可依照本发明实施例的精神来适度地调整应用领域。请同时参照图1及图2，并假设此数据处理方法以及风险评估系统100应用于医疗领域中。于步骤S210时，分析设备110获得多条数据，并通过这些数据以及这些数据中的上下文特征来产生对应于特定疾病或特定情况下的决策表单。于本实施例中所述的决策表单可以是贝氏法则表单(Bayesian Rule Tables)，且这些数据中的上下文特征包括各个数据中的对应样本的建立时间、地点、工作、生活历史、简历信息中的一种信息或这些信息中多种信息的组合。

认知分析模块116可以根据每笔数据当中的上述信息做为参考或是判断条件，进而建立决策表单。换句话说，认知分析模块116可通过各个数据中多个样本所具备的各种信息(如，建立时间、地点…等等信息)来产生这些数据中的上下文特征，并通过这些上下文特征来计算并形成样本训练模型。认知分析模块116通过这些样本训练模型来建立决策表单，并通过样本训练模型来计算决策选单中在不同判断条件下可能发生特定结果(如，疾病发生)的几率。当有单一样本符合多个判断条件时，这个样本便可同时做为这些判断条件下的分母或是参考信息。例如，当有两个判断条件分别是『年龄大于60』以及『年龄大于70』，并且有个样本的年龄为75岁而皆符合上述两个判断条件时，则认知分析模块116便会把此样本同时作为这两个判断条件的分母。如此一来，由于单一样本的信息能够准备的分类到适当的判断条件下，便可让决策表单中的各项数据更为准确。

本实施例以下述的表单来做为决策表单的举例。

[表单一]

于本实施例中所述的表单一具备多个条目(如，条目1至条目3)，每个条目以表单中的每个直栏来呈现。每个条目包括至少一个判断条件以及对应于特定结果的几率信息。例如，在表单一中具备许多判断条件，例如：是否半身不遂、是否年龄大于60、是否具备脑血管疾病、脑缺氧或是年龄大于70…等判断条件。表单一中的特定结果便是「特定疾病发生的可能性」。

特别说明的是，在表单一中的每个条目还具备基于此条目之下的应对方案/建议动作(也就是表单一中的方案一至方案三)。例如，分析设备110可通过从诸多来源所提供的数据中获得特定疾病的应对方案(例如，建议动作或解决方案)，让医生得以通过这些方案来向被评估者提供建议。这些方案可以是医生建议被评估者在日后可进行的行动(例如，少吃油腻、多吃蔬菜)或是建议可以开出何种药方给被评估者服用。这些方案可通过分析设备110来进行柏拉图最适(Pareto optimum)运算，藉以让医生以及被评估者有准确的依据来进行该项行动。在表单一中的建议动作栏列中将会对不同的方案具备标号「1」、「2」，这些标号可以表示为医生提供方案给被评估者的重要性。例如，当被评估者符合条目1时，医生或电子设备120可优先向被评估者建议具备标号「1」的方案一，之后再向被评估者建议具备标号「2」的方案二。当被评估者符合条目3时，医生或电子设备120可优先向被评估者建议同时具备标号「1」的方案一以及方案二，并且说明出方案一跟方案二最好同时进行，将可获得较大的功效。之后，再向被评估者建议同时具备标号「2」的方案二以及方案三。再者，机器学习模块114以及认知分析模块116还可通过网络与其他分析设备共享数据以及决策表单，以便于通过自我学习及共享学习方式来更新这些决策表单。

于步骤S220中，当有被评估者(如，病患)向特定领域专业人员(如，医生)询问某些假设性问题，例如「特定疾病的发生可能性」时，医生可通过电子设备120来与分析设备110相互通信，并将上述的决策表单(例如，表单一)显示在显示屏幕124上，然后医生或是电子设备120中的对比模块126便通过电子设备120且根据被评估者的至少一个当前条件来对比在决策表单中每个条目的判断条件。例如，表单一中每个条目上对于判断条件的标记【O】是让医生判断此病患是否有此判断条件。于本实施例中，电子设备120中的对比模块126可自动将被评估者的至少一个当前条件对比在决策表单中每个条目的判断条件上。并且，在被评估者的当前条件与某些条目的判断条件相同时，电子设备120中的对比模块126便通过显示屏幕124来显示这些表单及其中的至少一个特定条目。如此一来，医生便只需要输入被评估者的相应信息，电子设备120中的对比模块126便会自动地进行评估者的至少一个当前条件与决策表单中每个条目的判断条件之间的对比，并显示其对比结果。本实施例的『当前条件』可以是被评估者(如，病患)的病历数据、通过特定领域专业人员查验所获得的判断数据(如，通过医生进行观察诊断后的数据或信息)。『当前条件』也可以是被评估者自行填写的个人数据以及问卷…等相应信息所统整而得到的、跟被评估者相关的条件信息。应用本实施例者可依照其需求而设定『当前条件』的信息来源。

于步骤S230中，医生或对比模块126将会依据被评估者的至少一个当前条件(例如，当前的病历数据)来对比决策表单中每个条目的判断条件。当被评估者(病患)的当前条件与特定条目中的一或多个判断条件相同时，便从步骤S230进入步骤S240，电子设备120中的对比模块126便会通过显示屏幕124来显示所述特定条目所对应的判断条件以及对应的几率信息。因此，医生便可通过这些判断条件以及几率信息来向病患解释疾病发生的几率缘由。例如，当某个病患同时具备判断条件「半身不遂」以及「年龄大于60」的时候，表示此病患可同时符合条目1以及条目3。并且，医生会判断条目1以及条目3针对特定疾病发生几率的高低，从而针对发生几率较高的条目来向病患进行说明。例如，在条目1中特定疾病发生的可能性为58.9％，而在条目3中特定疾病发生的可能性为23.1％，如此一来，医生便通过发生几率较高的条目1来向病患进行说明。在另一实例中，当某个病患仅具备判断条件「年龄大于60」但并不具备其他判断条件的时候，则表示此病患符合条目3，特定疾病发生的可能性便为23.1％。因此，医生便通过条目3来向病患进行说明。另外，若是病患具备判断条件「年龄大于60」以及「脑血管疾病」时，表示此病患可分别符合条目2以及条目3。此时，医生便针对发生几率较高的条目2(特定疾病发生的可能性为47.6％)来向病患进行说明。

因此，医生便可通过上述表单一以及判断条件向病患解释，特定疾病发生的可能性可能是因为某些判断条件来增加的，并且，医生也可通过每个条目下方的建议动作/解决方案来向病患提出建议或是提供药品、疗程…等手段，让医生便于向病患解释病情。特别说明的是，虽然上述实施例是说明由特定领域专业人员来进行步骤S220～S240，但应用本实施例者亦可通过电子装置120本身的应用软件或是特别设立给被评估者使用的使用者设备(如，询问机台)来实现上述步骤S220～S240。应用本实施例者应可知晓，步骤S220～S240主要还是以电子设备120、对比模块126及其运算能力来辅助特定领域专业人员。

于本实施例中，分析设备110可将所有数据都经由包装来使任何数据成为多条数据、或是符合贝氏法则表单规格的决策表单。本实施例的分析设备110可以通过预先计算来统计这些数据以及这些数据中样本的诸多特征，并且从这些特征中寻找出现频率超过门限频率值的频繁项集(frequent itemsets)来作为所述的判断条件。并且，分析设备110通过这些判断条件来建立决策表单中每个条目，以及计算对应的几率信息。图3是依照本发明实施例所述的数据处理方法中寻找各个判断条件的步骤流程图。请参照图3，于步骤S310中，分析设备110使用前期开采(antecedent mining)以寻找频繁项集，藉以降低样本中特征空间(feature space)的数据数目。于步骤S320中，分析模块110中的认知分析模块116可使用并行马尔可夫链蒙特卡罗(Parallel Markov Chain Monte Carlo)演算法以将多条数据以及其中的样本来整理为决策表单并收敛速度进行加速。详细来说，认知分析模块116可使用分区和权重估计等方案，并结合不同处理器中所呈现的独立模拟结果来进行蒙特卡罗估计(Monte Carlo estimation)，藉以利用多个处理器以及通过单调性限制来进行加速。于步骤S330中，分析模块116统计这些数据以及样本中的诸多特征，并计算这些特征出现的频率，以从这些特征中寻找出现频率超过门限频率值的频繁项集来作为决策表单中的判断条件。于本实施例中，上述判断条件的数量并不仅限于上述表单一所呈现的1项或2项，而是可以端视超过所述门限频率值的频繁项集的数量多寡来决定。于步骤S340中，分析设备110对这些决策表单中的每个条目对应的几率信息进行排序，藉以使具备高几率信息的条目排列于决策表单的前方。电子设备120可以通过上述几率信息的数值高低来排序这些条目。电子设备120中的对比模块126可通过显示屏幕124而在决策表单上显示已排序后的这些条目，其中具备高数值的几率信息的条目将优先被电子设备120显示。也就是说，决策表单当中的判断条件的数量可以是由分析设备110依照数据中各个样本的信息以及其出现频率来判断得出。因此，分析设备110便可产生上述的决策表单，以使特定领域专业人员便可通过电子装置120来实现本发明实施例。

另一方面，若是以软件来实现本发明实施例的话，可通过单层判断式来增加每笔数据对于多个条目的比重，避免单一笔数据仅能作为到单一条目的风险评估。于本实施例中，每个决策表单对应一个特定结果，例如每个决策表单对应至不同的疾病发生率，但也可在单个决策表单中将多个特定结果进行整合，藉以完善决策表单的内容。

图4是依照本发明实施例所述的数据处理方法中寻找各个应对方案/建议动作/解决方案的步骤流程图。请参照图1及图4，于步骤S410中，分析设备110中的认知分析模块116从诸多来源所提供的多条数据中获得特定结果(如，特定疾病)的多个应对数据；于步骤S420中，认知分析模块116使用分类演算法以识别这些应对数据中的应对数据上下文特征；于步骤S430中，认知分析模块116通过这些应对数据上下文特征来建立联合特征函数，并通过这些应对数据来计算这些应对数据上下文特征对应的出现几率；于步骤S440中，认知分析模块116利用柏拉图最适(Pareto optimality)、上述的联合特征函数以及应对数据上下文特征的出现几率来建立及排序决策表单中各个条目对应的应对方案。举例来说，当某个应对数据中的应对数据上下文特征的出现几率超过一预设几率值的时候，本发明实施例的认知分析模块116便可能会将此应对数据视作为其中一个条目的应对方案。

认知分析模块116可利用多种方式来计算应对数据中的应对数据上下文特征对应的出现几率，或是对于决策表单的各个条目中对应的这些应对方案进行排序。例如，认知分析模块116可针对每个应对数据上下文特征设定对应的权重值，并通过这些权重值来调整这些应对数据上下文特征对应的出现几率，进而决定这些应对方案的优先顺序。详细来说，分析设备110中的认知分析模块116可通过这些应对数据中应对数据上下文特征的频繁项集的出现次数来计算这些应对数据所对应的权重值，并通过这些应对数据所对应的权重值来调整这些应对数据上下文特征对应的出现几率，藉以调整某个条目中所要推荐的多个应对方案的先后排序次序。

此外，有些新出现的应对数据可能会由于其频繁项集的出现次数过低而导致被认知分析模块116所忽略或无视，因此本发明实施例亦可通过调整权重值的方式来提高新进应对数据成为应对方案的几率。详细来说，分析设备110中的认知分析模块116通过这些应对数据的出现时间点来计算这些应对数据所对应的权重值。当这些应对数据的出现时间点已经经过预设时间点的时候，表示此应对数据似乎为较旧的应对数据/应对方案，因此认知分析模块116便可降低这些应对数据所对应的权重值，藉以让新进的应对数据/应对方案能够出现。另一方面，当这些应对数据的出现时间点尚未经过某一预设时间点时，表示此应对数据似乎为较新出现的应对数据/应对方案，因此认知分析模块116便可提高这些应对数据的所对应的权重值。认知分析模块116便可通过这些应对数据所对应的权重值来调整应对数据上下文特征对应的出现几率。

综上所述，本发明实施例所述的风险评估系统及数据处理方法可通过数据中的上下文特征以及低复杂度的模型演算法来达到风险评估的效果，并可提升使用效率。另一方面，可通过判断条件让医生等该领域专业人员向被评估者或病患说明特定事件的风险评估理由跟防范方式，藉以使本风险评估系统易于使用。

虽然本发明已以实施例公开如上，然其并非用以限定本发明，任何所属技术领域中技术人员，在不脱离本发明的精神和范围内，当可作些许的变动与润饰，故本发明的保护范围当视权利要求所界定者为准。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈志明;
技术所有人：纬创资通股份有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。