信息处理设备、信息处理方法和存储介质的制作方法

文档序号:6351434阅读:124来源:国知局
专利名称:信息处理设备、信息处理方法和存储介质的制作方法
技术领域
本发明涉及ー种信息处理设备、ー种信息处理方法以及ー种存储介质,其在给定说明变量的情况下,估计响应变量的均值和方差。
背景技术
存在ー种分析方法,该方法使用回归模型、在假定随机变量y依赖于另一随机变量X的情况下,分析随机变量y对随机变量X的依赖度。该方法被称作回归分析。在回归分析中,随机变量y被称作响应变量(response variable)或因变量(dependent variable)。随机变量X被称作说明变量(explanatory variable)或自变量(independent variable)。非专利文献I中描述了回归分析的ー个示例。非专利文献I中的回归分析在如下条件下执行假定响应变量y的方差是恒定的,不依赖于说明变量X的值。換言之,非专利文献I中的回归分析在如下条件下执行在说明变量的定义域中,假定响应变量的方差是齐性的(homogeneity)。此外,在假定随机变量j的均值和方差都依赖于观测响应变量y的观测时间t的情况下,存在一种通过使用一般状态空间模型来分析依赖度(随机变量y依赖于另ー随机变量X的程度)的方法。一般状态空间模型是利用时间序列数据来表达响应变量y的均值和方差的依赖度的模型,其中响应变量y的均值和方差都依赖于观测时间t。非专利文献2中描述了该分析的示例。引用列表非专利文献I. S. Konishi & G. Kitagawa :“ Information Criterion, Series ;Scienceof Prediction and Discovery,,,Asakura Publishing Co. , Ltd. , pp. 16-22 and35-37 (September 25,2004)2.S.Morishita & S.Miyano :“bit, separate volume ;Discovery and DataMining” and KYORITSU SHUPPAN Co.,LTD.,pp.159-168(May 5,2000)

发明内容
技术问题在非专利文献I描述的技术中,假定响应变量的均值和方差在说明变量的定义域中都是齐性的。因此,如果响应变量的均值和方差都依赖于说明变量,非专利文献I的技术不能估计响应变量的均值和方差。換言之,非专利文献I的技术具有以下问题其不能获得回归分析的准确結果。另ー方面,在非专利文献2描述的技术中,在将预先确定的每个时间观测的离散时间序列数据作为说明变量的值的情况下,执行回归分析。因此,如果响应变量的均值和方差依赖于具有连续值的说明变量,那么非专利文献2的技术不能估计响应变量的均值和方差中的任ー项。換言之,非专利文献2的技术具有以下问题其不能获得回归分析的准确结果。本发明的主要目的是提供解决上述问题的ー种信息处理设备、ー种信息处理方法以及ー种存储介质。技术方案—种信息处理设备,包括參数估计单元,根据划分候选而确定的每一个范围,基于观测数据,计算响应变量的均值和方差,所述划分候选是与将说明变量的定义域划分为多个范围有关的信息,所述观测数据包括表示所述说明变量的信息和表示所述响应变量的信息,所述响应变量是取决于所述说明变量的观测值,所述均值和所述方差依赖于所述说明变量;最优划分指定単元,通过使用根据所述观测数据以及所计算的所述响应变量的均 值和方差而计算的信息准则,从多个划分候选中选择特定的划分候选;以及平滑単元,基于所述特定的划分候选而确定的每一个范围而计算的均值和方差,计算表示所述说明变量的定义域中的响应变量的方差的平滑函数以及表示所述说明变量的定义域中的响应变量的均值的平滑函数。—种处理信息的方法,包括根据划分候选而确定的每一个范围,基于观测数据,计算响应变量的均值和方差,所述划分候选是与将说明变量的定义域划分为多个范围有关的信息,所述观测数据包括表示所述说明变量的信息和表示所述响应变量的信息,所述响应变量是取决于所述说明变量的观测值,所述均值和所述方差依赖于所述说明变量;通过使用根据所述观测数据以及所计算的所述响应变量的均值和方差而计算的信息准则,从多个划分候选中选择特定的划分候选;以及基于所述特定的划分候选而确定的每一个范围而计算的均值和方差,计算表示所述说明变量的定义域中的响应变量的方差的平滑函数以及表示所述说明变量的定义域中的响应变量的均值的平滑函数。一种存储有计算机程序的存储介质,所述计算机程序使计算机执行以下过程,所述过程包括參数估计过程,根据划分候选而确定的每一个范围,基于观测数据来计算响应变量的均值和方差,所述划分候选是与将说明变量的定义域划分为多个范围有关的信息,所述观测数据包括表示所述说明变量的信息和表示所述响应变量的信息,所述响应变量是取决于所述说明变量的观测值,所述均值和所述方差依赖于所述说明变量;最优划分指定过程,通过使用根据所述观测数据以及所计算的所述响应变量的均值和方差而计算的信息准则,从多个划分候选中选择特定的划分候选;以及平滑过程,基于所述特定的划分候选而确定的每一个范围而计算的均值和方差,计算表示所述说明变量的定义域中的响应变量的方差的平滑函数以及表示所述说明变量的定义域中的响应变量的均值的平滑函数。有益效果根据本发明,即使在响应变量的均值和方差依赖于连续值的说明变量时,也能够获得回归分析的准确結果。


图I是示出了根据本发明的第一示例实施例中的信息处理设备的配置的方框图。图2是示出了函数Wi(X)与说明变量X的位置和离散度的关系的图。图3是示出了根据本发明的第一示例实施例中的信息处理设备的操作的流程图。图4是示出了基于仿真产生的伪数据的仰角和信号误差之间的关系的示例。图5是示出了第二示例实施例中的信息处理设备的操作的流程图。图6是示出了第二示例实施例中估计的信号误差的方差的结果示例的图。
图7是示出了第三示例实施例的信息处理设备的配置的方框图。
具体实施例方式下面,參考附图详细描述根据本发明的示例实施例。在描述根据本发明的示例实施例之前,描述用于估计一般回归模型中的回归模型的參数的方法。在以下情况中,作为响应变量y和说明变量X的组合的观测数据的n个片段分别表示为(ya,xa),ya对ん的依赖程度(依赖度)由回归模型中的数学方程式I表示。其中,a表示大于或等于I并且小于或等于n的整数。u(xa ;w)表示回归函数。w表示回归函数的參数。e a表示误差项。数学方程式Iya = u(xa ;w)+ e a在回归模型中,通常假定误差项e a依赖于均值为0(零)且方差O 2的正态分布N(0, O2)彼此独立。在这种情况下,如果说明变量X表示为X = (X1,…,XnV ,则响应变fiy1:n= (Y1, -,yn)/的概率密度函数f由数学方程式2表示。数学方程式权利要求
1.ー种信息处理设备,包括 參数估计单元,根据划分候选而确定的每一个范围,基于观测数据,计算响应变量的均值和方差,所述划分候选是与将说明变量的定义域划分为多个范围有关的信息,所述观测数据包括表示所述说明变量的信息和表示所述响应变量的信息,所述响应变量是取决于所述说明变量的观测值,所述均值和所述方差依赖于所述说明变量; 最优划分指定単元,通过使用根据所述观测数据以及所计算的所述响应变量的均值和方差而计算的信息准则,从多个划分候选中选择特定的划分候选;以及 平滑単元,基于所述特定的划分候选而确定的每一个范围而计算的均值和方差,计算表示所述说明变量的定义域中的响应变量的方差的平滑函数以及表示所述说明变量的定义域中的响应变量的均值的平滑函数。
2.根据权利要求I所述的信息处理设备,其中,所述參数估计单元假定每一个范围的均值和方差具有正态分布,并且针对由所述划分候选确定的每ー个范围,计算所述响应变量的均值和方差。
3.根据权利要求I或2所述的信息处理设备,其中,所述最优划分指定単元选择所计算的信息准则最小的划分候选,作为所述特定的划分候选。
4.根据权利要求I至3中任意一项所述的信息处理设备,其中,所述平滑単元基于每ー个范围中所述说明变量的位置、以及通过使用所述特定的划分候选而确定的每一个范围的所计算的均值和方差,计算所述平滑函数。
5.根据权利要求I至4中任意一项所述的信息处理设备,其中,所述平滑単元基于每ー个范围中所述说明变量的离散度、以及通过使用所述特定的划分候选而确定的每一个范围的所计算的均值和方差,计算所述平滑函数。
6.根据权利要求I至5中任意一项所述的信息处理设备,其中,所述平滑単元根据所述特定的划分候选而确定的每一个范围,计算相对于所计算的均值和方差的核函数,并基于所述核函数,计算所述平滑函数。
7.根据权利要求I至6中任意一项所述的信息处理设备,还包括 划分候选管理単元,基于所述观测数据、表示所述说明变量的定义域的信息、在将所述说明变量的定义域划分为多个范围的情况下划分个数的最大值、以及针对每ー个范围的最小块,计算所述划分候选,其中 所述參数估计单元根据所述特定的划分候选而确定的姆一个范围,计算所述响应变量的均值和方差。
8.根据权利要求I至7中任意一项所述的信息处理设备,其中,所述信息准则是赤池信息准则和贝叶斯信息准则中的任ー项。
9.一种处理信息的方法,包括 根据划分候选而确定的每一个范围,基于观测数据,计算响应变量的均值和方差,所述划分候选是与将说明变量的定义域划分为多个范围有关的信息,所述观测数据包括表示所述说明变量的信息和表示所述响应变量的信息,所述响应变量是取决于所述说明变量的观测值,所述均值和所述方差依赖于所述说明变量; 通过使用根据所述观测数据以及所计算的所述响应变量的均值和方差而计算的信息准则,从多个划分候选中选择特定的划分候选;以及基于所述特定的划分候选而确定的每一个范围而计算的均值和方差,计算表示所述说明变量的定义域中的响应变量的方差的平滑函数以及表示所述说明变量的定义域中的响应变量的均值的平滑函数。
10.一种存储有计算机程序的存储介质,所述计算机程序使计算机执行以下过程,所述过程包括 參数估计过程,根据划分候选而确定的每一个范围,基于观测数据,计算响应变量的均值和方差,所述划分候选是与将说明变量的定义域划分为多个范围有关的信息,所述观测数据包括表示所述说明变量的信息和表示所述响应变量的信息,所述响应变量是取决于所述说明变量的观测值,所述均值和所述方差依赖于所述说明变量; 最优划分指定过程,通过使用根据所述观测数据以及所计算的所述响应变量的均值和方差而计算的信息准则,从多个划分候选中选择特定的划分候选;以及 平滑过程,基于所述特定的划分候选而确定的每一个范围而计算的均值和方差,计算表示所述说明变量的定义域中的响应变量的方差的平滑函数以及表示所述说明变量的定义域中的响应变量的均值的平滑函数。
全文摘要
一种信息处理设备,即使在响应变量的均值和方差依赖于具有连续变量的说明变量时,仍能获得回归分析的准确结果。一种信息处理设备,根据划分候选而确定的每一个范围,基于观测数据,计算响应变量的均值和方差,所述划分候选是与将说明变量的定义域划分为多个范围有关的信息,所述观测数据包括表示所述说明变量的信息和表示所述响应变量的信息,所述响应变量是取决于所述说明变量的观测值,所述均值和所述方差依赖于所述说明变量。该信息处理设备通过使用根据所述观测数据以及所计算的所述响应变量的均值和方差而计算的信息准则,从多个划分候选中选择特定的划分候选。该信息处理设备基于所述特定的划分候选而确定的每一个范围而计算的均值和方差,计算表示所述说明变量的定义域中的响应变量的方差的平滑函数以及表示所述说明变量的定义域中的响应变量的均值的平滑函数。
文档编号G06F17/18GK102656581SQ20108005654
公开日2012年9月5日 申请日期2010年12月7日 优先权日2009年12月15日
发明者中田贵之, 青木健儿 申请人:日本电气株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1