经年变化预测系统以及经年变化预测方法

文档序号:10553152阅读:535来源:国知局
经年变化预测系统以及经年变化预测方法
【专利摘要】本发明涉及一种经年变化预测系统以及经年变化预测方法。实现基于图形模型的高精度且控制了计算成本的预测。经年变化预测系统将第一时间点的证据群作为输入,将表示从第一时间点开始经过第一期间后概率变量的状态的信息作为输出,保持图形模型,关于第一时间点的证据群中包括的概率分布,根据从该概率分布计算出的特征量和/或在上述图形模型中定义的该概率分布所对应的概率变量的特征量,决定是否进行从该概率分布向该概率分布所对应的概率变量的确定状态的转换,将该转换后的第一时间点的证据群输入给图形模型。
【专利说明】
经年变化预测系统以及经年变化预测方法
技术领域
[0001 ]本发明涉及一种经年变化预测系统以及经年变化预测方法。
【背景技术】
[0002]作为援助保险事业运营的【背景技术】,有日本特开2014-225176号公报(专利文献I)。在该公报中记载了“具备:因果/迀移结构计算部,其生成根据有向边或无向边来定义表示病态的概率变量所对应的节点和表示对病态变化有影响的因子的概率变量所对应的节点之间的概率依存性的图表结构;节点生成部,其生成上述概率变量的现象空间;概率表计算部,其计算上述图表结构的条件概率;模型再构筑部,其通过由指定的概率变量组成的图表结构、事件空间以及条件概率来再构筑模型;病态迀移/医疗费预测部,其预测病态迀移概率以及医疗费;以及保健指导支持部,其选定保健指导的对象以及保健指导内容”的技术。
[0003]专利文献I:日本特开2014-225176号公报

【发明内容】

[0004]专利文献I中记载的技术例如使用某一年及其第二年的数据,构筑预测一年以后的生病率和医疗费的贝叶斯网络。另外,在输入到贝叶斯网络等图形模型中的证据中有将概率变量的确定状态设为证据的硬证据、在虽然没有确定概率变量的状态为一个但判明该概率变量所遵循的概率分布的情况下将该概率分布设为证据的软证据。
[0005]专利文献I中记载的技术将当前的状态作为硬证据而输入给贝叶斯网络,进行一年以后的状态预测。因此,在当前状态中包括(没有判明概率变量的确定状态)概率分布的情况下,为了使用专利文献I所记载的技术来进行预测,需要将该概率分布转换为确定状
??τ O
[0006]作为从概率分布向确定状态的转换方法,例如有选择概率分布上概率变得最高的状态即最频值的方法、根据概率分布计算期望值来选择相应的状态的方法等。但是,输入从概率分布转换而得的确定状态的情况与输入该概率分布的情况相比较,预测精度下降。
[0007]特别是例如在重复将图形模型的输出结果作为该图形模型的下一个输入的预测的情况下,得到与实际情况相反的结果的可能性很高。例如生病率和医疗费一般有随年龄上升的倾向,但是如果将医疗费和生病率的概率分布转换为确定状态来进行经年变化预测,则会得到每年医疗费和生病率减少的预测结果。
[0008]这是由于概率分布有偏差。一般患有某种病的人会比没有患病的人要少很多,因此如果关于将是否患有该病的概率分布转换为确定状态,则选择没有患该病的状态。其结果为,每次重复第二年的预测时会收敛在几乎所有人没有病的健康状态。
[0009]另外,在将软证据输入到图形模型中时,例如计算成本根据概率变量的状态数等而增大。因此本发明的一个方式为提供一种经年变化预测系统,从证据群中包括的概率分布适当地选择从该概率分布转换为与该概率分布对应的概率变量的确定状态的概率分布,由此能够以高精度且低计算成本进行预测。
[0010]为了解决上述问题,本发明的一个方式例如采用以下的结构。一种经年变化预测系统,包括处理器和存储装置,使用图形模型来预测概率变量的状态,上述存储装置保持上述图形模型,上述图形模型将第一时间点的证据群作为输入,将表示从上述第一时间点开始经过第一期间后上述概率变量的状态的信息作为输出,上述证据群的证据是上述概率变量遵循的概率分布或上述概率变量的确定状态,上述处理器使用上述图形模型执行预测处理,并在上述预测处理中取得上述第一时间点的证据群,关于上述取得的证据群中包括的概率分布,根据从该概率分布计算出的特征量和/或在上述图形模型中定义的该概率分布所对应的概率变量的特征量,决定是否进行从该概率分布向该概率分布所对应的概率变量的确定状态的转换,将决定为上述转换的对象的概率分布转换为与该概率分布对应的概率变量的确定状态,将上述转换后的上述第一时间点的证据群输入到上述图形模型,输出表示从上述第一时间点经过上述第一期间后上述概率变量的状态的信息。
[0011]根据本发明的一个方式,使用预测一定期间后的概率变量的状态的图形模型,能够进行高精度且控制了计算成本的预测。
[0012]另外,通过以下实施方式的说明能够明确上述以外的课题、结构以及效果。
【附图说明】
[0013]图1是表示疾病发病预测装置的结构例的框图。
[0014]图2A是概率变量表的数据结构的一例。
[0015]图2B是链接表的数据结构的一例。
[0016]图2C是概率表的数据结构的一例。
[0017]图3是输出用变量的概率分布表的数据结构的一例。
[0018]图4是S/Η选择表的数据结构的一例。
[0019]图5是混合证据表的数据结构的一例。
[0020]图6是表示疾病发病预测处理的一例的流程图。
[0021 ]图7是表示S/Η选择决定处理的一例的流程图。
[0022]图8是表示S/Η选择条件设定部的设定用接口的例子。
[0023]图9A是以概率方式分割为从属的变量集合的贝叶斯网络的例子。
[0024]图9B是路径被切断的模式的例子。
[0025 ]图9C是路径未被切断的模式的例子。
[0026]图1OA是用于预测将来的疾病发病和预测医疗费的输入输出例。
[0027]图1OB是用于根据生活习惯预测将来的测定值的输入输出例。
[0028]图1OC是用于推定生活习惯的输入输出例。
[0029]图1lA是显示疾病发病预测装置的输出的接口的例子。
[0030]图1lB是显示疾病发病预测装置的输出的接口的例子。
[0031]符号的说明
[0032]100疾病发病预测装置、101单年预测执行部、102年度预测结果存储部、103 SAtife择决定部、104 S/Η选择表存储部、105 S/Η转换部、108单年预测模型存储部、113运算装置、114存储器、115存储介质、201预测模型输入部、202概率分布输入部、203医疗知识存储部、204预测计算成本评价部、205 S/Η判定部、206 S/Η选择表输出部。
【具体实施方式】
[0033]以下,参照【附图说明】本发明的实施方式。应该注意本实施方式不过是用于实现本发明的一例,不限定本发明的技术范围。在各图中对共同的结构标注相同的参照符号。
[0034]本实施方式的经年变化预测系统使用将概率变量遵循的概率分布作为输入而进行概率推论的软证据推论,由此实现使用了第二年的预测模型的经年变化预测。经年变化预测系统在将概率分布输入到预测模型的情况下,不需要将概率变量遵循的概率分布转换为概率变量的确定状态,因此能够高精度地进行预测。经年变化预测系统甚至能够避免重复将输出的概率分布再次输入到预测模型的预测的情况下的概率变量所采用的值收敛的问题。
[0035]另一方面,作为使用了软证据的概率推论处理的特征,会有计算成本根据被输入软证据的所有概率变量的状态数等而增大的问题。因此,经年变化预测系统例如在针对所有的输入用概率变量输入软证据时,计算成本会增大。
[0036]因此,本实施方式的经年变化预测系统针对各输入用概率变量,例如按照各个输入概率变量的特征量和/或与各输入用变量对应的输出用概率变量遵循的概率分布的特征量,选择是输入软证据还是输入硬证据。进一步,本实施方式的经年变化预测系统可以按照各输入用概率变量的特征量来决定从软证据向硬证据的转换方法。本实施方式的经年变化预测系统通过上述处理实现提高预测精度的同时控制了计算量的预测。
[0037][实施例1]
[0038]本实施例作为经年变化预测系统的一例,说明基于健康检查结果、问诊结果、病历以及诊断治疗记录等医疗数据,预测分析对象的疾病发病概率在每个预定期间的经年变化的疾病发病预测装置的例子。在本实施例中将该预定时间设为一年进行说明。
[0039]医疗数据是例如包括每个对象的诊断治疗记录或检查值等与每个人的医疗以及健康相关的信息的数据。另外,例如医疗数据也可以包括身高、体重、BM1、血压、胆固醇值以及血糖值等健康检查和问诊时所测定的检查值等。另外,例如医疗数据也可以包括有无吸烟、有无日常的出汗运动、有无饮酒以及睡眠状态等与生活习惯相关的数据。例如医疗数据还可以包括病历即接受医疗机关的诊断时的伤病名的履历等数据。另外,例如医疗数据也可以包括处方医药品、实施的诊断治疗行为以及医疗费等与诊断治疗记录相关的数据。
[0040]图1表示本实施例的疾病发病预测装置的结构例。疾病发病预测装置100包括输入部111、输出部112、运算装置113、存储器114以及存储介质115。输入部111例如是鼠标、键盘等人机接口,从用户接受数据等的输入。输出部112例如是显示器或打印机等,输出疾病发病预测装置100的运算结果。存储介质115例如存储实现疾病发病预测装置100进行的处理的各种程序以及处理结果等各种数据。
[0041 ]运算装置113例如是CPU、GPU等。运算装置113例如包括按照程序进行动作的处理器和/或逻辑电路,进行数据的输入/输出、读入/写入,还执行各个程序。运算装置113执行以下说明的处理以及运算。
[0042]存储器114例如暂时加载并存储由运算装置113执行的各种程序以及数据。存储介质115所保持的程序以及数据的一部分或全部可以存储在存储器114中。另外,各种程序例如可以存储在CD-ROM等计算机可读取的可携带的非临时存储介质中,也可以根据需要,经由处理该非临时存储介质的外部存储装置从该非临时存储介质加载到存储器114中。
[0043]存储介质115包括程序即单年预测执行部101、S/H选择决定部103、S/H转换部105、递归预测执行部106、预测结果输出部107以及证据输入部109。另外,存储介质115包括存储数据等的区域即年度预测结果存储部102、医疗知识存储部203、S/H选择条件存储部208、S/H选择表存储部104以及单年预测模型存储部108。
[0044]通过运算装置113执行程序,由此一边使用存储装置和通信端口(通信设备)一边进行预定的处理。因此,在该实施方式中将程序作为主语的说明也可以是将运算装置113作为主语的说明。或者,由程序执行的处理是该程序进行动作的计算机以及计算机程序所进行的处理。
[0045]运算装置113通过按照程序进行动作,作为实现预定的功能的功能部(单元)进行动作。例如,运算装置113通过按照单年预测执行部101进行动作而作为单年预测执行部(单年预测执行单元)发挥功能,通过按照S/Η选择决定部103进行动作而作为S/Η选择决定部(S/Η选择决定单元)发挥功能。关于其他的程序也同样。运算装置113还作为实现各程序所执行的多个处理的各处理的功能部(单元)进行动作。计算机以及计算机系统是包括这些功能部(单元)的装置以及系统。
[0046]单年预测模型存储部108例如保持基于通过用户等预先输入的、表示某个时间点的状态的医疗数据来预测从该某个时间点开始一年以后的状态的贝叶斯网络的信息。以下也将该贝叶斯网络称为单年预测模型。单年预测模型存储部108保持后述的概率变量表、链接表以及概率表。单年预测模型被以统计的方式根据过去的医疗数据构筑,记述医疗数据内的各项目之间的统计概率的因果关系。
[0047]各项目之间的因果关系例如是疾病和针对该疾病开出的药品之间的关系、检查值的异常和该以上所表示的疾病的征兆之间的关系、疾病和由该疾病发病所带来的医疗费增加之间的关系等。
[0048]另外,单年预测模型至少包括两种概率变量,该至少两种概率变量包括表示某个时间点的状态的输入用概率变量和表示一年后的该状态的输出用概率变量。例如,单年预测模型在包括在某个时间点疾病A是否发病的输入用概率变量的情况下,包括从该某个时间点开始一年后是否发生了疾病A的该输入用概率变量所对应输出用概率变量。
[0049]单年预测执行部101使用由单年预测模型存储部108所保持的单年预测模型,将表示某个时间点的状态的医疗数据等作为输入,进行输出从该某个时间点开始一年后的状态的预测处理。其中将成为输入的、表示某个时间点的状态的医疗数据等称为证据。证据被输入到输入用概率变量中。
[0050]证据中存在硬证据和软证据两种。硬证据是将某个概率变量的状态确定为一个时表示其确定状态的信息。表示“疾病A发病”的状态的信息是硬证据的一例。另外,例如像表示“血糖值为80mg/dl?100mg/dl。”的状态的信息那样,表示已确定在预定的多个阶段范围中的特定一个范围内包括测量值的状态的信息也是硬证据的一例。
[0051]软证据是虽然某个概率变量的状态没有确定为一个,但判明该概率变量遵循的概率分布时表示该概率分布的信息。“疾病A以15%的概率发病”、“血糖值在80mg/dl以下的概率为10%、80mg/dl?100mg/dl的概率为50%、100mg/dl以上的概率为40%”等信息是软证据的例子。
[0052]年度预测结果存储部102存储由单年预测执行部101输出的预测结果即表示输出用概率变量各自的概率分布的概率分布表。关于概率分布表的数据结构在后面描述。在疾病发病预测装置100进行经年变化推移的预测的情况下,年度预测结果存储部102例如分别存储每个年度的预测结果。
[0053]S/Η选择决定部103选择分别对单年预测模型存储部108所保持的单年预测模型内的输入用概率变量输入软证据还是输入硬证据,生成表示该选择结果的S/Η选择表。关于S/H选择表的数据结构在后面描述。S/Η选择决定部103在选择了硬证据的输入的情况下,可以决定将软证据或概率分布转换为硬证据的转换方式。
[0054]另外,S/Η选择决定部103包括预测模型输入部201、概率分布输入部202、预测计算成本评价部204、S/H判定部205、S/H选择表输出部206以及S/Η选择条件设定部207。
[0055]预测模型输入部201从单年预测模型存储部108接受单年预测模型的输入。概率分布输入部202从年度预测结果存储部102接受输入用概率变量的概率分布的输入。预测计算成本评价部204根据单年预测模型和S/Η选择表来评价单年预测所需要的计算成本。S/Η判定部205判定对于单年预测模型内的输入用概率变量是分别输入软证据还是输入硬证据,生成S/Η选择表。S/Η选择表输出部206例如将所生成的S/Η选择表输出给输出部112^/H选择条件设定部207例如经由输入部111从用户接受用于由S/Η判定部205进行判定的条件设定。
[0056]医疗知识存储部203例如保持通过用户等预先输入的、表示单年预测模型内的概率变量之间的相关性的信息。例如,表示该相关性的信息可以包括与单年预测模型中包括的表示相关性的信息不同的信息。另外,例如概率变量间的相关系数等是该相关性一例。另夕卜,各个概率变量间有无关系等也是该相关性的一例。医疗知识存储部203也可以保持表示输入用概率变量之间的相关性、输出用变量之间的相关性的信息。
[0057]S/Η选择条件存储部208保持由S/Η选择条件设定部207接受的选择条件。S/Η选择表存储部104存储由S/Η选择决定部103生成的S/Η选择表。
[0058]S/Η转换部105根据由S/Η选择表存储部104保持的S/Η选择表,将年度预测结果存储部102所保持的预测结果转换为硬证据。没有进行转换的预测结果直接以概率分布的形式被处理为软证据。进行了转换的硬证据和软证据成为接着由单年预测执行部101进行预测处理时的输入。
[0059]递归预测执行部106例如使用单年预测执行部101、年度预测结果存储部102、S/H选择决定部103、S/H选择表存储部104、S/H转换部105、预测结果输出部107以及单年预测模型存储部108等进行递归的经年变化推移预测。预测结果输出部107将记录在年度预测结果存储部102中的每个年度的预测结果输出给输出部112。证据输入部109例如经由输入部111从用户等接受用于单年预测执行部101进行的初次预测的证据输入。
[0060]接着,说明疾病发病预测转置100所保持的各个表的结构例。图2A、图2B以及图2C表示单年预测模型即贝叶斯网络的数据结构。例如由单年预测模型存储部108所保持的概率变量表900、链接表910以及概率表920这3个要素来确定贝叶斯网络。
[0061 ]图2A表示概率变量表900的数据结构的一例。概率变量表900表示贝叶斯网络中包括的节点即各概率变量的特征。概率变量表900例如包括概率变量901、状态数902、状态903、顺序性904、输入/输出905以及对应变量906。
[0062 ] 概率变量901表示贝叶斯网络中包括的节点即概率变量。状态数90 2表示存储在概率变量901中的概率变量能够取得的值的模式数。状态数902表示该概率变量能够取得的状态的内容。顺序性904表示该概率变量的状态是否具有顺序性。
[0063]输入/输出905表示该概率变量是输入用概率变量还是输出用概率变量。如果该概率变量是输入用概率变量则对应变量906表示与该概率变量对应的输出用概率变量,如果该概率变量是输出用概率变量则对应变量906表示与该概率变量对应的输入用概率变量。在不存在与该概率变量对应的输入用/输出用变量的情况下,对应变量906例如保持空(Null)值或“无”的值等。
[0064]图2B表示链接表910的数据结构的一例。链接表910表示贝叶斯网络中包括的概率变量之间的因果关系。链接表910例如包括链接911、起点912以及913。链接911表示存储在起点912中的概率变量和存储在终点913中的概率变量之间有因果关系。另外,在2个概率变量间的关系中,将成为起点的概率变量称为母变量,将成为终点的概率变量称为子变量。
[0065 ]图2C表示概率表90 2的数据结构的一例。概率表920表示贝叶斯网络中包括的概率变量的与该概率变量的母变量的状态对应的概率分布。概率表920例如包括表921、子变量922、母变量923以及概率分布924。表921表示用于识别概率表920的各个记录的信息。子变量922表示子变量。母变量923表示母变量。
[0066]概率分布924表示将分别与存储在母变量923中的母变量的状态对应的、存储在子变量922中的子变量遵循的概率分别设为行的行列。在母变量923中存储“无”的情况下,概率分布924表不子变量遵循的先验分布。另外,与子变量对应的母变量的数量可以是O个,也可以存在2个以上。
[0067]图3表示预测结果输出部107输出的输出用变量的概率分布表的数据结构的一例。概率分布表1000例如包括概率变量1001以及概率分布1002。概率变量1001表示输出用概率变量。概率分布1002表不该输出用概率变量遵循的概率分布。
[0068]图4表示S/Η选择表的数据结构的一例。S/Η选择表1100例如包括概率变量1101、S/H选择1102以及转换方法1103。概率变量1101表示输入用概率变量。S/Η选择1102表示向该输入了用概率变量输入软证据和硬证据的哪一个。另外,“软”表示软证据,“硬”表示硬证据。转换方法1103表示S/Η选择1102在存储“硬”的情况下的从概率分布到硬证据的转换方法。
[0069]图5表示混合证据表的数据结构的一例。混合证据表1200例如包括概率变量1201、S/Η选择1202、状态1203以及概率分布1204。概率变量1201表示输入用概率变量。S/Η选择1202表示向该输入用概率变量输入了软证据和硬证据的哪一个。
[0070]状态1203表示S/Η选择1202存储“硬”时的该输入用概率变量的确定状态。在S/Η选择1202保持“软”的情况下,状态1203保持“无” ο概率分布1204表示在S/Η选择1202保持“软”的情况下,该输入用概率变量遵循的概率分布。在S/Η选择1202保持“硬”的情况下,概率分布1204保持“无”。
[0071]接着,说明疾病发病预测装置100的动作例。图6表示疾病发病预测装置100的到N年以后的疾病发生率的经年变化的预测处理的一例。疾病发病预测装置100通过重复使用单年预测模型进行N年以后的预测。另外,疾病发病预测装置100根据单年预测模型内的概率变量的特征量,分别使用软证据和硬证据,由此抑制计算量的增大的同时能够提高预测精度。疾病发病预测装置100甚至会防止由于重复预测处理造成的预测结果向错误值收敛。
[0072]首先,在步骤S301中,预测模型输入部201接受单年预测模型的信息即概率变量表900、链接表910以及概率表920的信息的输入。接着,在步骤S302中,证据输入部109接受预测的初始输入即由预测对象第O年的一个以上的概率变量的确定状态组成的集合H(O)的输入。设H( O)的各个要素是硬证据。
[0073]接着,在步骤S303中,单年预测执行部101使用单年预测模型进行第一次预测。第一次预测的输入是H(O),得到的输出是表示一年后的预测结果的由一个以上的概率分布组成的集合S(I)oS(l)中包括的概率分布分别被存储在概率分布表1000中。另外,在步骤S304中,单年预测执行部101针对单年预测模型的输入用概率变量,在没有输入的状态下进行预测,作为输出得到由I个以上的先验分布组成的集合Sp。
[0074]在步骤S305中,递归预测执行部106将经过年数y设定为y= l,开始递归预测。在步骤S306中,S/Η选择决定部103根据单年预测模型、S(y)、Sp来生成S/Η选择表1100。后面描述S/Η选择表1100的具体生成处理。
[0075]在步骤S307中,S/Η转换部105根据S/Η选择表1100,将第7年的预测结果即5(7)转换为第y年的混合证据M(y)。混合证据M(y)是分别针对输入用概率变量输入的软证据或硬证据的集合,M(y)的信息被存储在混合证据表1200中,
[0076]具体地说,在步骤S307中,S/Η转换部105将S/Η选择表1100的概率变量1101以及S/H选择1102分别存储在混合证据表1200的概率变量1201以及S/Η选择1202中。
[0077]S/Η转换部105针对S/Η选择1202是“软”的输入用概率变量的每一个,分别在混合证据表1200的状态1203中存储“无”,在概率分布1204中存储S (y)的该输入用概率数遵循的概率分布。
[0078]S/Η转换部105针对S/Η选择1202是“软”的输入用概率变量的每一个,通过转换方法1103所指定的方法将S(y)的该输入用概率变量遵循的概率分布转换为确定状态。S/Η转换部105针对S/Η选择1202是“硬”的输入用概率变量的每一个,分别在混合证据表1200的状态1203中存储该确定状态,在概率分布1204中存储“无”。
[0079]在步骤S308中,单年预测执行部101将混合证据M(y)作为输入,进行第y+Ι年的预测。在步骤S309,递归预测执行部106判定是否是y+l=N。在递归预测执行部106判定为是y+1〈N的情况下(S309:否),进入步骤S310。在步骤S310中,递归预测执行部106在y上加1,再次返回步骤S306继续处理。
[0080]在步骤S309中,在递归预测执行部106判定为是y+l=N的情况下(S309:是),即得到目的的第N年的预测结果的情况下,进入步骤S311。在步骤S311中,预测结果输出部107输出预测结果S(1)、S(2)、……、S(N),结束疾病发病预测装置100进行的疾病发生预测处理。
[0081]另外,在步骤S302,假设H(O)的各个要素全部是硬证据,但是H(O)中也可以包括概率变量遵循的概率分布即软证据。这时,S/Η选择决定部103也可以判定是否将H(O)中包括的软证据分别转换为硬证据,并根据该判定结果进行S/Η转换。
[0082]接着,说明S/Η选择决定部103的动作例。图7表示S/Η选择决定部103的动作例。在步骤S401中,预测模型输入部201从单年预测模型存储部108接受单年预测模型即概率变量表900、链接表910以及概率表920的信息。在步骤S402,概率分布输入部202从年度预测结果存储部102接受S (y)中包括的概率分布即概率分布表1000的信息。
[0083]在步骤S403,S/H判定部205读入由S/Η选择条件存储部208保持的S/Η选择条件。S/H选择条件例如是用于生成通过用户预先设定的S/Η选择表1100的条件。S/Η选择条件例如包括用于决定优先度的规则,该优先度用于选择一次预测的计算成本的上限、特别是要高精度地预测的输出用概率变量等软证据。
[0084]图8是用于由S/Η选择条件设定部207接受S/Η选择条件的设定的用户接口的例子。设定用用户接口 600例如包括输入接受区域601?602、选择框603以及确定按钮604。输入接受区域601接受推论速度的输入。该推论速度可以表示步骤S306?步骤S310的一次循环处理的推论速度,也可以表示步骤S301?步骤S311的处理的推论速度。
[0085]输入接受区域602接受输出用概率变量中特别要高精度地预测的项目的输入。选择框603是用于将检查值全部转换为硬证据的选择框。确定按钮604是用于确定被输入到输入接受区域601?602以及选择框603中的S/Η选择条件的按钮。
[0086]返回到图7的说明。在步骤S404,S/Η判定部205将概率变量表900中包括的输入用概率变量分别存储在S/Η选择表1100的概率变量1101中,例如将S/Η选择1102的所有值设定为“硬”。另外,S/Η判定部205参照概率变量表900,根据S(y)确定与输入用概率变量对应的输出用概率分布遵循的概率分布。
[0087]S/Η判定部205参照概率变量表900,按照存储在概率变量1101中的概率变量各自的特征,分别决定转换方法1103。例如,在该概率变量的状态具有顺序性的情况下,S/Η判定部205将转换方法1103决定为期望值。另外,在转换方法1103是期望值的情况下,S/Η转换部105将概率分布转换为最接近该概率分布的期望值的状态。
[0088]另外,在该概率变量的状态具有顺序性的情况下,例如S/Η判定部205在该顺序性所表示的顺序关系中,可以计算出全部相邻值之间的差。这时,如果该差的方差在预定以上、或从最大的该差减去最小的该差之后的差在预定以上,则即使在该概率变量的状态具有顺序性的情况下,S/Η判定部205也可以将转换方法1103决定为最频值。
[0089]另外,例如在该概率变量的状态不具有顺序性的情况下,S/Η判定部205将转换方法1103决定为最频值。S/Η判定部205如上述那样决定转换方法,从而提高预测精度。另外,例如可以在概率变量表900上预先决定转换为输入用概率变量的硬证据的转换方法,也可以是S/Η判定部205将该预定的转换方法存储在转换方法1103中。
[0090]在步骤S405,S/H判定部205例如生成空的列表作为选择完毕概率变量的列表。在步骤S406,S/H判定部205例如根据单年预测模型、S(y)中包括的概率分布以及S/Η选择条件,从没有包括在选择完毕概率变量的列表中的输入用概率变量来选择输入软证据的优先度高的输入用概率变量。S/Η判定部205将S/Η选择表1100的该选择出的输入用概率变量所对应的S/Η选择1102的值设定为“软”。在该时间点S/Η选择1102的值为“硬”的概率变量遵循的概率分布是变换候补概率分布。另外,在存在优先度最高的多个输入用概率变量的情况下,S/Η判定部205例如从该多个输入用概率变量随机地选择一个输入用概率变量即可。[0091 ]另外,S/Η判定部205例如根据输入用概率变量的状态数、输入用概率变量遵循的先验分布的偏差以及输入用概率变量状态的顺序性等输入用概率变量的特征量来决定该优先度。另外,S/Η判定部205也可以根据输入用概率变量的平均信息量等与输入用概率变量对应的概率分布的特征量来决定该优先度。S/Η判定部205例如能够通过输入用概率变量的状态数越小越提高该优先度,选择计算成本的增加量小的软证据。
[0092]另外,S/Η判定部205例如在输入用概率变量的平均信息量、或该输入用概率变量遵循的先验分布的偏差越大,该输入用概率变量的状态越没有顺序性的情况下,通过较高地决定该优先度,能够选择对提高预测精度贡献度高的软证据。
[0093]另外,S/Η判定部205例如从概率变量表900取得输入用概率变量的状态数以及输入用概率变量的状态顺序性等特征量。另外,S/Η判定部205例如根据从概率表920取得的概率分布计算输入用概率变量的先验分布的偏差。另外,S/Η判定部205从概率分布表1000取得输出用概率变量的概率分布,并计算该概率分布的平均信息量,将该计算出的平均信息量作为与该输出用概率变量对应的输入用概率变量的平均信息量即可。
[0094]例如,在具有有无用药A的概率变量X、检查值B的值的概率变量Y的情况下,SA^lJ定部205提高概率变量X的优先度。概率变量X的状态数至少是“有”、“无”2个,进一步由于“有”的概率极其小,因此平均信息量大。
[0095]对此,概率变量Y是数值数据,因此状态数多,进一步概率分布的偏差也不是那么极端,从而平均信息量小。进一步概率变量Y的状态具有顺序性,因此能够计算期望值。因此,S/Η判定部205将概率变量X的优先度设得比概率变量Y的优先度要高,由此预计能够抑制预测精度低下,并且能够使计算成本下降。
[0096]另外,S/Η判定部205在使用多个特征量决定优先度的情况下,例如按照通过将该多个特征量分别设为变量的预定函数而计算出的值从大到小的顺序较高地设定优先度即可。在该多个特征量由状态数、平均信息量以及顺序性的有无组成的情况下,该预定的函数例如是状态数以及顺序性的有无(例如将有顺序性设为1,将无顺序性设为O)的减少函数且平均信息量的增加函数即可。
[0097]另外,S/Η判定部205在使用多个特征量决定优先度的情况下,例如可以根据该多个特征量间的预定优先顺序,将该多个特征量作为关键来排序输入用概率变量,从而决定优先度。考虑该多个特征量由状态数、平均信息量以及顺序性的有无组成,按照特征量间的优先顺序从高到低的顺序是状态数、平均信息量以及顺序性的有无的情况。这时,S/Η判定部205例如按照将状态数设为第一关键的升序、将平均信息量设为第二关键的降序、将状态数设为第三关键的升序,将输入用概率变量进行排序,将该排序后的顺序设为优先度。
[0098]另外,在要高精度地预测的项目被特别指定为S/Η选择条件的情况下,S/Η判定部205例如也可以提高与该项目对应的概率变量、和/或存储在医疗知识存储部203中的信息表示的与该项目关联的项目所对应的概率变量的优先度。具体地说,S/Η判定部205例如可以将作为提高优先度的对象而选择出的概率变量的优先度设为最高,另外,也可以在通过上述预定的函数值计算出优先度的情况下,在该概率变量中将预定值与根据函数计算出来的值相加。S/Η判定部205通过使用存储在医疗知识存储部203中的信息,能够使用与贝叶斯网络表不的相关性不同的相关性,因此提尚预测精度。
[0099]在步骤S407中,预测计算成本评价部204根据单年预测模型和其时间点的S/Η选择表1100,评价用于进行预测处理的计算成本。在步骤S408中,预测计算成本评价部204判定所评价的计算成本是否是在通过S/Η选择条件决定的计算成本的上限以内。
[0?00]在预测计算成本评价部204判定为所评价的计算成本不在该上限以内的情况下(S408:否),在步骤S409,S/Η判定部205进行将在S/Η选择表1100中通过步骤S406选择出的输入用概率变量的S/Η选择1102返回到“硬”的处理,转移到步骤S410。另外,预测计算成本评价部204在判定为所评价的计算成本不在该上限以内的情况下(S408:是),转移到步骤S411o
[0101 ] 接着在步骤S410中,S/Η判定部205将通过步骤S406选择出的输入用概率变量加到选择完毕概率变量的列表中。在步骤S411中,S/Η判定部205判定是否有选择完毕概率变量的列表中没有包括的输入用概率变量。
[0102]S/Η判定部205在判定为有选择完毕概率变量的列表中没有包括的输入用概率变量的情况下(S411:是),继续返回步骤S406的处理。在S/Η判定部205判定为没有选择完毕概率变量的列表中没有包括的输入用概率变量的情况下(S411:否),在步骤S413,S/Η选择表输出部206将S/Η选择表1100输出给S/Η选择表存储部104,并结束S/Η选择决定部103的处理。
[0103]另外,S/Η选择决定部103可以不对所有的预测年度生成S/Η选择表1100。例如,S/H选择决定部103生成到第M年(M是满足I ^ M〈N的自然数)为止的S/Η选择表1100,S/H转换部105可以使用第M年的S/Η选择表1100来进行第M+1年以后的S/Η转换。
[0104]另外,特别是状态数、先验概率分布的偏差、顺序性的有无在哪个年度中都是不变的。因此,S/Η判定部205在根据从这些特征量选择出的一个以上的特征量而生成S/Η选择表1100的情况下,可以只生成第一年的S/Η选择表1100。另外,S/Η选择决定部103可以按照每个预测年度来变更S/Η选择表1100的S/Η选择1102以及转换方法1103的决定方法。
[0105]以下,说明评价进行预测处理情况下的计算成本的步骤S408的处理的一例。图9A表示以概率的方式被分割为从属变量的集合的贝叶斯网络的例子。另外,在图9A以及后述的图9B和图9C中,各个圆圈表不节点,各个箭头表不各个节点间的因果关系,各个圆圈是否被点涂抹表示输入到各个节点中的证据的种类。图中没有被点涂抹的节点表示第一种节点,图中被点涂抹的节点表示第二种节点。第一种节点是被输入软证据的节点或没有被输入证据的节点。第二种节点是被输入硬证据的节点。
[0106]贝叶斯网络501是具有由链接表910定义的结构,按照在当前时间点的S/Η选择表1100来确定输入到各个节点中的证据的种类的贝叶斯网络的一例。预测计算成本评价部204按照各个节点的种类以及连接各个节点的路径,分别确定由贝叶斯网络501中包括的概率变量(被输入硬证据以外的节点),即以概率方式从属的概率变量组成的集合即概率变量集合502。概率变量集合502的确定方法将在后面描述。
[0107]预测计算成本评价部204例如针对概率变量集合502分别计算被输入软证据的变量的状态数的积,将该积设为该概率变量集合502的计算成本。预测计算成本评价部204例如将计算出的概率变量集合502的计算成本的总和设为用于推论所有的概率变量的计算成本即步骤S408中的计算成本。
[0108]以下说明确定概率变量集合的方法。贝叶斯网络503包括通过链接的路径连接的概率变量504和概率变量505。贝叶斯网络只包括上述路径,因此概率变量504和概率变量505相对于其他的概率变量相互独立。因此,预测计算成本评价部204在贝叶斯网络503中,将概率变量504和概率变量505组成的集合确定为概率变量集合。
[0109]S卩,预测计算成本评价部204重复将由通过路径连接的概率变量组成集合确定为概率变量集合的作业。但是,即使在存在概率变量间的路径的情况下,也会有根据路径中有无被输入硬证据的节点、图表的结构而切断该路径的情况。在概率变量间的路径被切断的情况下,该概率变量相互独立。
[0110]图9B表示路径被切断的模式的例子。模式511?513都是通过虚线部分切断路径。模式511是被称为尾到尾(tail-to-tail)的包括从母节点到多个子节点的路径的模式。模式511中的母节点是第二种节点,子节点是第一种节点。
[O111 ] 模式512被称为头到尾(head-to-tail)的包括从母节点到子节点以及从子节点到孙子节点的路径的模式。模式512中的母节点是第一种节点,子节点是第二种节点,孙子节点是第一种节点。模式513是被称为头到头(head-to-head)的包括从多个母节点到子节点的路径的模式。模式513中的母节点以及子节点是第一种节点。
[0112]图9C表示路径没有被切断的模式的例子。尾到尾的模式521中的母节点以及子节点是第一种节点。头到尾的模式522中的母节点、子节点以及孙子节点是第一种节点。头到头的模式523以及模式524在第一种节点即母节点、子孙节点中包括第二种节点。如模式523以及模式524那样,在头到头的模式,即子节点或子节点的子孙节点的任意一个是第二种节点的模式中,解除切断。
[0113]接着,说明本实施例的疾病发病预测装置100的输入输出例。图1OA表示将本实施例的疾病发病预测装置100应用到将来的疾病发病预测和医疗费预测中的情况下的输入输出例。疾病发病预测装置100例如可以将体重、身高等当前测量值、生活习惯以及病历等作为输入,输出各个疾病的将来发病概率等概率以及医疗费的期望值等。
[0114]图1OB表示将本实施例的疾病发病预测装置100应用到根据生活习惯进行将来的测量值预测中的情况下的输入输出例。疾病发病预测装置100例如可以将体重、身高等当前测量值以及生活习惯作为输入,输出体重、血压等将来的预测值。另外,疾病发病预测装置100也可以将体重、血压等测量值的预测值不作为具体的数值,而是作为以多个阶段分割的测量值的范围进行输出。
[0115]图1OC表示将本实施例的疾病发病预测装置100应用到生活习惯的推定中的情况下输入输出例。疾病发病预测装置100例如可以将体重、身高等当前测定值以及病历作为输入,输出当前的生活习惯。
[0116]图1lA是通过预测结果输出部107而显示在输出部112上的个人的预测结果输出画面的例子。预测结果输出画面700例如包括标签701以及显示区域702?708。显示区域702?708分别显示通过标签701指定的年度的值。显示区域702显示该个人的年度医疗费的期望值。显示区域703?708分别显示该个人的各个疾病的发生率。
[0117]如图1lB是多人的团体预测结果输出画面的例子。预测结果输出画面800例如包括标签801以及显示区域802?808。显示区域802?808分别显示通过标签801指定的年度的值。显示区域702显示该团体的年度医疗费的期望值。显示区域703?708分别显示该团体的发生各个疾病的预测人数。
[0118]另外,输出内容可以不限于概率推论进行的预测的信息,而在显示部112中显示S/H选择表1100的信息、输入软证据的优先度高但因计算成本的限制而没有被输入软证据的概率变量的信息等。
[0119]如上所述,本实施例的疾病发病预测装置100输入与分析对象相关的已知医疗数据,并通过贝叶斯网络即单年预测模型上的概率推论来预测一年以后的医疗数据的状态。疾病发病预测装置100能够将所预测的一年以后的状态作为输入并再次通过单年预测模型预测2年以后的医疗数据的状态,还能够通过递归地进行N次预测来预测到N年后的医疗数据的年度推移。
[0120]这时,疾病发病预测装置100根据概率变量的特征量,选择对输入用概率变量分别输入软证据和硬证据中的任意一个,由此能够通过小的计算成本高精度地进行预测。特别是疾病发病预测装置100能够通过预测处理的重复避免概率分布中有偏差的医疗数据的值收敛。
[0121]另外,本实施例的疾病发病预测装置100进行使用了贝叶斯网络的预测处理,但是也可以代替贝叶斯网络,例如使用马尔科夫网络等其他图形模型进行同样的预测处理。
[0122]另外,本发明不限定于上述实施例,而包括各种变形例。例如,上述实施例是为了容易理解地说明本发明而详细进行说明的例子,不一定限定于具备所说明的全部的结构。另外,也能够将某个实施例的结构的一部分置换为其他实施例的结构,另外,也能够在某个实施例的结构上追加其他实施例的结构。另外,关于各个实施例的结构的一部分,能够进行其他结构的追加/删除/置换。
[0123]另外,关于上述各个结构、功能、处理部、处理单元等可以通过例如由集成电路设计等由硬件来实现其中的一部分或全部。另外,上述各个结构、功能等也可以通过由处理器解释实现各自的功能的程序并执行,而由软件来实现。实现各个功能的程序、表、文件等的信息能够放在存储器、硬盘、SSD(Solid State Drive固态驱动器)等记录装置或IC卡、SD卡、DVD等记录介质中。
[0124]另外,控制线和信息线表示认为说明上需要的线,产品上不一定限于表示所有的控制线和信息线。实际上可以认为几乎所有的结构相互连接。
【主权项】
1.一种经年变化预测系统,其包括处理器和存储装置,使用图形模型预测概率变量的状态,其特征在于, 上述存储装置保持上述图形模型, 上述图形模型将第一时间点的证据群作为输入,将表示从上述第一时间点起经过第一期间后上述概率变量的状态的信息作为输出, 上述证据群的证据是上述概率变量遵循的概率分布或上述概率变量的确定状态, 上述处理器使用上述图形模型执行预测处理, 在上述预测处理中,执行如下处理: 取得上述第一时间点的证据群, 关于上述取得的证据群中包括的概率分布,根据从该概率分布计算出的特征量和/或在上述图形模型中定义的、该概率分布所对应的概率变量的特征量,决定是否进行从该概率分布向该概率分布所对应的概率变量的确定状态的转换, 将决定为上述转换的对象的概率分布转换为该概率分布所对应的概率变量的确定状态, 将上述转换后的上述第一时间点的证据群输入给上述图形模型, 输出表示从上述第一时间点起经过上述第一期间后上述概率变量的状态的信息。2.根据权利要求1所述的经年变化预测系统,其特征在于, 上述处理器重复上述预测处理, 在第二次以后的预测处理中,取得上次预测处理中的表示经过上述第一期间后的状态的信息作为上述第一时间点的证据群。3.根据权利要求1所述的经年变化预测系统,其特征在于, 在上述图形模型中定义的、该概率分布所对应的概率变量的特征量是该概率变量的状态数。4.根据权利要求1所述的经年变化预测系统,其特征在于, 在上述图形模型中定义的、该概率分布所对应的概率变量的特征量是该概率变量的状态有无顺序性。5.根据权利要求1所述的经年变化预测系统,其特征在于, 在上述图形模型中定义的、该概率分布所对应的概率变量的特征量是该概率变量遵循的先验分布的偏差。6.根据权利要求1所述的经年变化预测系统,其特征在于, 从该概率分布计算出的特征量是该概率分布所对应的概率变量的平均信息量。7.根据权利要求1所述的经年变化预测系统,其特征在于, 上述处理器执行以下处理: 根据从上述概率分布计算出的特征量和/或在上述图形模型中定义的上述概率分布所对应的概率变量的特征量,从上述取得的证据群中选择表示成为上述转换的对象的概率分布的候补的转换候补概率分布, 根据在上述图形模型中定义的上述概率变量间的相关性和包括在上述取得的证据群中且不同于上述转换候补概率分布的概率分布所对应的概率变量的、在上述图形模型中定义的状态数,计算出计算成本,该计算成本是在针对上述转换候补概率分布进行了上述转换的情况下,将上述转换后的上述第一时间点的证据群输入给上述图形模型并输出表示从上述第一时间点起经过上述第一期间后上述概率变量的状态的信息的情况下的计算成本,在上述计算成本超过阈值的情况下,再次选择上述转换候补概率分布, 在上述计算成本是上述阈值以下的情况下,将上述转换候补概率分布决定为上述转换的对象。8.根据权利要求1所述的经年变化预测系统,其特征在于, 上述处理器进行如下处理: 根据决定为上述转换的对象的概率分布所对应的概率变量的、在上述图形模型中定义的状态有无顺序性,决定将决定为上述转换的对象的概率分布转换为该概率分布所对应的概率变量的确定状态的方法, 通过上述决定的方法将决定为上述转换的对象的概率分布转换为该概率分布所对应的概率变量的确定状态。9.根据权利要求8所述的经年变化预测系统,其特征在于, 上述处理器进行如下处理: 针对决定为上述转换的对象的概率分布即对应的概率变量的状态具有顺序性的概率分布,计算上述图形模型中定义的该概率变量能够取得的状态中包括的、在上述顺序性所表示的顺序关系中相互相邻的状态的间隔, 根据上述计算出的间隔,决定将决定为上述转换的对象的概率分布转换为该概率分布所对应的概率变量的确定状态的方法。10.根据权利要求1所述的经年变化预测系统,其特征在于, 在上述图形模型中定义了上述概率变量间的相关性, 上述存储装置保持表示与上述定义的相关性不同的、上述概率变量间的相关性的相关性信息, 上述处理器接受上述相关性信息中包括的概率变量的指定,关于上述取得的证据群中包括的概率分布,根据上述相关性信息所表示的该概率分布所对应的概率变量和上述指定的概率变量之间的相关性,决定是否进行从该概率分布向该概率分布所对应的概率变量的确定状态的转换。11.一种经年变化预测方法,其是经年变化预测系统使用图形模型预测概率变量的状态的方法,其特征在于, 上述经年变化预测系统保持上述图形模型, 上述图形模型将第一时间点的证据群作为输入,将表示从上述第一时间点起经过第一期间后上述概率变量的状态的信息作为输出, 上述证据群的证据是上述概率变量遵循的概率分布或上述概率变量的确定状态,在上述方法中,上述经年变化预测系统使用上述图形模型执行预测处理,在上述预测处理中进行如下处理: 取得上述第一时间点的证据群, 关于上述取得的证据群中包括的概率分布,根据从该概率分布计算出的特征量和/或在上述图形模型中定义的该概率分布所对应的概率变量的特征量,决定是否进行从该概率分布向该概率分布所对应的概率变量的确定状态的转换, 将决定为上述转换的对象的概率分布转换为该概率分布所对应的概率变量的确定状态, 将上述转换后的上述第一时间点的证据群输入给上述图形模型,输出表示从上述第一时间点起经过上述第一期间后上述概率变量的状态的信息。
【文档编号】G06F19/00GK105912832SQ201610084432
【公开日】2016年8月31日
【申请日】2016年2月14日
【发明人】广木桂, 广木桂一, 三好利升
【申请人】株式会社日立制作所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1