脑活动训练装置以及脑活动训练系统的制作方法_4

文档序号:9437117阅读:来源:国知局
或特征提取)"。在本实施方式中,将W下处理称为"提取缩略表 达":从"脑区域间(关注区域间)的活动度的多个相关值(多个连接)"中进行变量选择 (特征提取)使得在用于预测作为对象的疾病的判别标签的判别器的机器学习中能够W更 少的相关值构成判别器,即,选择更重要的相关值来作为解释变量。
[0164] 而且,在本实施方式中,作为特征提取法,使用正则化法。运样,在典型相关分析 中,执行正则化并且执行稀疏化,来留下更重要的变量来作为解释变量,在W运种方式进行 处理的意义上,将运种处理称为"稀疏典型相关分析"。更具体地说,例如,作为用于同时实 现稀疏化的正则化法,能够使用如W下说明那样的称为"LI正则化"的、对典型相关分析的 参数的绝对值的大小加W惩罚(penalty)的方法。
[0165] 目P,参照图6,当开始判别器生成的处理时(SlOO),数据处理部32从存储部36读 出各受验者的rs-fcMRI数据(S102),通过SCCA进行特征提取(S104)。
[0166] 下面,说明Ll正则化典型相关分析。在W下的文献中公开了该Ll正则化典型相 关分析。
[0167] 文南犬:WittenDM,TibshiraniR,andTHastie.Apenalizedmatrix decomposition,withapplicationstosparseprincipalcomponentsandcanonical correlationanalysis.Biostatistics,Vol. 10,No. 3,pp. 515-534, 2009.
[016引 首先,在一般的典型相关分析(CanonicalCorrelationAnalysis:CCA)中,考虑 如W下那样的数据对Xi和X2。其中,设各个变量Xi和X2被标准化成具有平均值0、标准偏 差1。另外,设数据对Xi和X2的数据数量分别为n。
[0169][数U
[01 70]关于XiGRnxPl,RnXP2,
[01川在CCA中,求出使Zi=W而、Z2=W2?的相关性最大化的参数
[0172] WiGRP1,WzGRP2。目P,对如下那样的优化问题进行求解:
[0173] 在 }的条件下,職仪 、; } ' 点 占WW巧、; >钱'.2; 口
[0174] 与此相对,当导入Ll正则化时,对如下那样的优化问题进行求解。
[0175] [数引
[0176] 对如下那样的优化问题进行求解:
[0177] 在IIWiII1,IIW2II1,IIW1II1《Cl,II讯2II1《的条件下,
[0179] 在此,Cl和c2是表示Ll正则化的强度的参数,能够通过周知的各种方法来根据 数据而适当地设定。I|wiIIi和Iw2!Ii的右下的"1"表示IIwi|I和IwzM是Ll范数。
[0180] 通过附加用于Ll正则化的约束条件,参数Wi和W2的元素中的重要度低的元素的 值变为0,特征量(解释变量)变得稀疏化。
[018。 接着,数据处理部32基于SCCA的结果,通过SLR来进行判别分析(S106)。
[0182] SLR是将逻辑回归分析扩展到贝叶斯估计的框架内的方法,是将特征矢量的维数 压缩与用于判别的权重估计同时进行的方法。SLR在数据的特征矢量的维数非常高、包含大 量不需要的特征量的情况下有用。针对不需要的特征量,将线性判别分析中的权重参数设 为零(即进行变量选择),仅取出与判别相关联的极少数的特征量(稀疏性)。
[0183] 针对通过SLR得到的特征数据,按分出的每个类别求出该特征数据属于该类别的 概率P,将该特征数据分配到输出了最大值的类别。P是通过逻辑回归式来输出的。权重的 估计是通过A畑(AutomaticRelevancedetermination:自动相关性确定)来进行的,通过 使对类别判别的贡献少的特征量的权重接近0来将该特征量从计算中排除。
[0184] 目P,将使用上述的Ll正则化CCA提取出的特征量作为输入,使用基于接下来的分 层贝叶斯估计的判别器,来进行疾病/健康标签的预测。
[0185] 在此,例如,当将通过CCA导出的特征量Zi=W声1作为向化R的输入、将S= {0, U设为疾病(S= 1) /健康(S= 0)的标签时,如下面的式(1)那样定义化R的输出为S= 1的概率。
[0186][数引
[018引将此时的参数矢量W的分布设定为如W下那样的正态分布。此外,下面的式子中 的a是表现矢量W的正态分布的方差的超参数矢量化yperparametervector)。
[0189] [数"
[0190] P(w|a) =N(w|〇,diag(曰))
[0191] 并且,如W下那样设定超参数矢量a的分布,由此通过进行分层贝叶斯估计来估 计各个参数的分布。
[0192][数引
[0194] 在此,符号"r"表示r分布,a°、b诣决定超参数矢量a的伽玛分布的参数。矢 量a的第i个元素是ai。
[0195] 此外,在W下的文献中公开了运种化R。
[0196] 文献:0kitoYamashita,MasaakiSato,TakuYoshioka,FrankTong,and YukiyasuKamitani."SparseEstimationautomaticallyselectsvoxelsrelevant forthedecodingoffMRIactivitypatterns. "Neuroimage,Vol. 42,No.4, pp.1414-1429, 2008.
[0197] 基于运种判别分析的结果,生成对输入的特征量进行疾病/健康标签(疾病的判 别标签)的判别的判别器(S108)。用于确定所生成的判别器的信息(与函数形式和参数有 关的数据)被保存到存储部36,在之后被输入测试数据时,该信息使用于执行对于测试数 据的疾病的判别标签的估计时的判别处理。
[019引目P,基于事前的医师的诊断,将受验者分为健康组、患者组。测定运些受验者的脑 区域间(关注区域间)的活动度的相关性(连接)。通过对测定结果的机器学习,来生成 判别器W判别与不同于运些受验者的新的受验者有关的测试数据是相当于疾病还是相当 于健康。该判别器作为精神疾病的生物标记物而发挥功能。此时,由于判别器是通过逻辑 回归而生成的,因此作为生物标记物的输出的"疾病的判别标签"也可W包含有疾病的概率 (或者健康的概率)。能够将运种概率用作"诊断标记物"。
[0199] 目P,运样生成的判别器作为精神疾病的生物标记物而发挥功能。
[0200] 目P,在生物标记物的学习(制作)中,为了制作精神疾病的生物标记物,将静息态 功能性连接MRI(rs-fcMRI)数据作为输入,使用上述的LI正则化CA来进行特征提取,将提 取出的特征量作为输入,通过SLR来进行疾病/健康标签判别。
[020。 此外,在W上的说明中,设将通过CCA导出的特征量Zi=WA用作成为向化R的 输入的特征量来进行了说明。
[0202] 但是,作为成为向化R的输入的特征量,并不限定于运种情况。
[0203] 图7~图9是表示通过SCCA得到的特征量(通过SCCA得到的特征空间)W及W 此为输入通过SLR来生成判别器的过程的概念的图。
[0204] 首先,如图7所示,作为第一方法,将健康/疾病的标签用作受验者的属性,在该标 签与基于rs-fcMRI的相关矩阵的元素之间执行SCCA。
[020引将由此得到的特征量(中间表达)Zi=WA(二维典型变量)作为化R的输入,来 生成判别器(W下,将该过程称为"方式A")。
[0206] 在此,"二维典型变量"是指有疾病(1,0)运样的二维矢量、健康(0, 1)运样的二维 矢量。
[0207] 在该情况下,通过SCCA,选择相关矩阵的4278个非对角元素中的例如约700个元 素(连接)。
[020引目P,使用疾病/健康的诊断结果的某个数据,预先利用SCCA、SLR等机器学习法来 决定判别器的参数。通过将所决定出的该参数泛化到未知的rs-fcMRI数据来使其作为"生 物标记物"而发挥功能。作为判别器的输入,提供rs-fCMRI中的所选择的连接的线性和,判 别器的输出对应疾病标签(1,0)、健康标签(0, 1)。
[0209] 另一方面,如图8所示,作为第二方法,也可W如W下那样。作为受验者的属性,使 用疾病/健康标签、受验者的年龄、受验者的性别、进行了测定的机关(测定装置的设置场 所,称为测定地点。在后述的例子中测定地点的数量为3。)、fMRI摄像装置的施加磁场强 度(相当于摄像装置的分辨率等性能的指标之一)、睁眼/闭眼等拍摄时的实验条件。在运 些属性与基于rs-fCMRI的相关矩阵的元素之间执行SCCA。此外,作为fMRI摄像装置的性 能的指标,也可W不仅使用施加磁场强度,还使用其它指标。
[0210] 也就是说,作为典型相关分析中的"解释变量",取基于rs-fCMRI的相关矩阵的独 立元素,作为"基准变量",取如上所述的受验者的属性。
[0211] 将由此得到的特征量(中间表达)Zi=WiXi(在本例中,为11维典型变量)作为 SLR的输入,来生成判别器(W下,将该过程称为"方式B")。
[021引此外,在此,11维典型变量是指疾病/健康(二维)、3个地点(立维:(1,0, 0)、 (0, 1,0)、(0, 0, 1))、年龄(一维)、性别(二维:(1,0)、(0, 1))、性能(一维)、睁眼闭眼(二 维:(1,0)、(0, 1))共计 11 维。
[0213] 并且,在图9中示出第=方法。在第=方法中,作为受验者的属性,使用疾病/健 康标签、受验者的年龄、受验者的性别、进行了测定的机关(测定地点)、fMRI摄像装置的性 能(例:施加磁场强度)、睁眼/闭眼等拍摄时的实验条件,在该属性与基于rs-fCMRI的相 关矩阵的独立元素之间执行SCCA。该过程与方式B相同。
[0214] 作为SLR的输入,使用作为SCCA的结果的稀疏地选择出的rs-fcMRI的非对角元 素,来生成判别器(W下,称为"方式C")。
[0215] 在该情况下,设在SCCA中仅选择与疾病/健康标签有关的rs-fCMRI的相关矩阵 的非对角元素。由此,过滤掉表现其它因素的rs-fcMRI数据,实现不依赖于获取数据的设 施的生物标记物。
[0216] 通过取入不同的地点、实验条件的影响等来进行SCCA,能够获知哪个连接与哪个 因素有关系,排除与疾病/健康标签没有关联的连接,导出仅与疾病/健康标签相关联的连 接。其结果,有利于作为生物标记物的"泛化(generalization)"。
[0217] 并且,通过利用SLR进行的稀疏化,W运种方式C来例如将通过SCCA稀疏化后得 到的约700个连接中的21个连接使用于判别器。
[021引此外,在W上所说明的方式B、方式C中,受验者的属性例如也可W包括表示是否 给予了规定的药物的标签或者该药物的用量或给予期间等信息。
[0219] 图10是表示运种生物标记物的生成过程的概念的图。
[0220] 在地点1~地点3运S个测定机关中,使用各不相同的测定性能的MRI装置,使用 健康组114人、患者组74人的rs-fCMRI数据,如上所述,作为相关矩阵存在4000多个连接, 在运样的状态下,通过SCCA处理和SLR处理来生成判别器。
[0221] (生物标记物的验证)
[0222] 图11是表示如W上那样生成的生物标记物的验证过程的概念图。
[0223] 使用基于在日本国内的地点1~地点3得到的数据并通过学习而得到的用于特征 提取和判别的参数,对未用在该参数学习中的数据进行疾病/健康标签的预测,评价与实 际的疾病的判别标签的一致性。
[0224] 图12是表示运种生物标记物的特性的图。
[0225] 上述的一致性评价的结果是,例如在使用了上述的方式C的情况下,对于日本国 内的S个不同的地点的数据示出了最高79%W上的判别性能。另外,在使用利用了相同的 参数的生物标记物、并将在美国的六个地点处测量出的rs-fcMRI数据用作输入的情况下, 示出了 66%W上的判别性能。
[0226]
当前第4页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1