数据处理设备、数据处理方法和程序的制作方法

文档序号:6425441阅读:87来源:国知局
专利名称:数据处理设备、数据处理方法和程序的制作方法
技术领域
本发明涉及一种数据处理设备、数据处理方法和程序,具体而言,涉及一种能够更精确地预测到目的地的路线和所需时间的数据处理设备、数据处理方法和程序。
背景技术
近些年来,已经积极地研究了使用从作为附着到用户身体的传感器的可佩带传感器获得的时间序列数据来建模和学习用户的状态,并使用从该学习获得的模型来识别用户的当前状态(例如,日本未审查专利申请公开No. 2006-134080、日本未审查专利申请公开 No. 2008-204040 禾口" LifePatterns-Structure from Wearable Sensors" ,Brian Patrick Clarkson, Doctor Thesis, MIT,2002)。此前,作为日本专利申请No. 2009-180780,申请人提出了一种用于随机地估计在期望的未来时间点的用户活动状态的多个概率的方法。在日本专利申请No. 2009-180780 中,从时间序列数据学习用户的活动状态作为随机状态转换模型,并使用所学习的随机状态转换模型来识别当前的活动状态,使得可以随机地预测“在预定时间之后”的用户的活动状态。在日本专利申请No. 2009-180780中,作为估计“在预定时间之后”的用户的活动状态的示例,示出下述示例使用通过学习用户的移动历史的时间序列数据而获得的随机状态转换模型来识别用户的当前位置,并预测在预定时间之后的用户的目的地(位置)。此外,申请人进一步发展了日本专利申请No. 2009-180780,并且作为日本专利申请No. 2009-208064,提出了一种方法,在所述方法中,即使在没有指定从当前时间点起过去的时间(诸如“在预定时间之后”)的情况下,也预测对于多个目的地的到达概率、路线和时间。在日本专利申请No. 2009-208064的方法中,向构成随机状态转换模型的节点提供“移动状态”或“静止状态”的属性。然后,通过从构成随机状态转换模型的节点中找出作为目的地节点的“静止状态”节点,可以自动地检测候选目的地。

发明内容
然而,在日本专利申请No. 2009-208064的预测方法中,出现以下现象。首先,预测出的目的地不是实际目的地,而是中途停留地。由此,未预测出从中途停留地到实际目的地的路线(第一问题)。例如,存在以下情况在回家的路上由于在车站换乘另一辆火车、在书店逗留等而静止预定时间的位置被识别为目的地,并且不能预测出作为正确目的地的回家路线。其次,向客户示出通过实质上相同的路线的多个类似路线作为估计结果,而未向用户示出有益于用户的其他路线(第二问题)。这是由于不能适当地辨别频繁地被通过并且经常有变化的路线和不频繁地被通过并且较少有变化的路线。期望能够更精确地预测到目的地的路线和所需时间。根据本发明的一个实施例的一种数据处理设备具有学习装置,其将作为学习数据获得的用户移动历史数据表达为概率模型,并学习所述模型的参数,其中,所述概率模型表达用户的活动;目的地和中途停留地估计装置,其从所述概率模型的状态节点中估计与移动的目的地和中途停留地等同的目的地节点和中途停留地节点,所述概率模型使用通过学习获得的所述参数;当前位置估计装置,其在使用通过学习获得的所述参数的所述概率模型中输入与所述学习数据不同并且在从当前时间起的预定时间内的用户移动历史数据, 并估计与所述用户的当前位置等同的当前位置节点;搜索装置,其使用关于所估计的目的地节点、中途停留地节点和当前位置节点的信息以及通过学习获得的所述概率模型来搜索从所述用户的当前位置至目的地的路线;以及计算装置,其计算到所搜索到的目的地的到达概率和所需时间。根据本发明的另一个实施例的一种数据处理设备的数据处理方法,所述数据处理设备处理用户的移动历史数据,所述方法包括以下步骤将作为学习数据获得的所述移动历史数据表达为概率模型,并学习所述模型的参数,其中,所述概率模型表达用户的活动; 从所述概率模型的状态节点中估计与移动的目的地和中途停留地等同的目的地节点和中途停留地节点,所述概率模型使用通过学习获得的所述参数;在使用通过学习获得的所述参数的所述概率模型中输入与所述学习数据不同并且在从当前时间起的预定时间内的用户移动历史数据,并估计与所述用户的当前位置等同的当前位置节点;使用关于所估计的目的地节点、中途停留地节点和当前位置节点的信息以及通过学习获得的所述概率模型来搜索从所述用户的当前位置至目的地的路线;以及计算到所搜索到的目的地的到达概率和所需时间。根据本发明的另一个实施例的一种程序,使得计算机作为学习装置,其将作为学习数据获得的用户移动历史数据表达为概率模型,并学习所述模型的参数,其中,所述概率模型表达用户的活动;目的地和中途停留地估计装置,其从所述概率模型的状态节点中估计与移动的目的地和中途停留地等同的目的地节点和中途停留地节点,所述概率模型使用通过学习获得的所述参数;当前位置估计装置,其在使用通过学习获得的所述参数的所述概率模型中输入与所述学习数据不同并且在从当前时间起的预定时间内的用户移动历史数据,并估计与所述用户的当前位置等同的当前位置节点;搜索装置,其使用关于所述估计的目的地节点、中途停留地节点以及当前位置节点的信息和通过学习获得的所述概率模型来搜索从所述用户的当前位置至目的地的路线;以及计算装置,其计算到所搜索到的目的地的到达概率和所需时间。根据本发明的所述实施例,将作为学习数据获得的用户移动历史数据表达为概率模型,并且学习所述模型的参数,其中,所述概率模型表达用户的活动;从使用通过学习获得的所述参数的所述概率模型的状态节点估计与移动的目的地和中途停留地等同的目的地节点和中途停留地节点;在使用通过学习获得的所述参数的所述概率模型中输入与所述学习数据不同并且在从当前时间起的预定时间内的用户移动历史数据,并估计与所述用户的当前位置等同的当前位置节点;使用关于所述估计的目的地节点、中途停留地节点和当前位置节点的信息以及通过学习获得的所述概率模型来搜索从所述用户的当前位置至目的地的路线;以及计算到所搜索到的目的地的到达概率和所需时间。根据本发明的所述实施例,可以更精确地预测到目的地的路线和所需时间。


图1是图示根据本发明的一个实施例的预测系统的配置示例的框图;图2是图示所述预测系统的硬件配置示例的框图;图3是图示移动历史数据示例的图;图4是图示HMM示例的图;图5是图示从左到右型HMM示例的图;图6A和6B是图示应用了稀疏限制的HMM示例的图;图7是图示学习预处理部件的详细配置示例的框图;图8是描述学习预处理部件的处理的图;图9是图示移动属性辨别和赋予部件的详细配置示例的框图;图10是图示移动属性辨别部件的学习单元的配置示例的框图;图11是图示在将行为状态分割到每一个类别的情况下的属性示例的图;图12是描述行为状态标注部件的处理示例的图;图13是描述行为状态标注部件的处理示例的图;图14是图示图10的行为状态学习部件的配置示例的框图;图15是图示移动属性辨别部件的详细配置示例的框图;图16是图示移动属性辨别部件的学习单元的不同配置示例的框图;图17是图示移动属性辨别部件的不同配置示例的框图;图18是描述学习预处理部件的处理的流程图;图19是描述学习主处理的处理的流程图;图20是图示学习后处理部件的详细配置示例的框图;图21是描述状态系列校正部件的状态系列数据校正处理的图;图22是描述状态系列校正部件的状态系列数据校正处理的图;图23是描述状态系列校正部件的状态系列数据校正处理的图;图M是描述状态系列校正部件的状态系列数据校正处理的图;图25是描述状态系列校正部件的状态系列数据校正处理的图;图沈至26(是描述目的地和中途停留地检测部件的处理的图;图27是描述整个学习块的处理的流程图;图28是描述树搜索处理的流程图;
图四是进一步描述树搜索处理的图;图30A至30D是进一步描述树搜索处理的图;图31是图示树搜索处理的搜索结果列表示例的图;图32是描述代表性路线选择处理的流程图;图33是描述整个预测块的处理的流程图;以及图34是图示根据本发明的所述实施例的计算机的配置示例的框图。
具体实施例方式本发明的一个实施例提供了一种数据处理设备,包括学习装置,其将作为学习数据获得的用户移动历史数据表达为概率模型,并学习所述模型的参数,其中,所述概率模型表达用户的活动;目的地和中途停留地估计装置,其从所述概率模型的状态节点中估计与
7移动的目的地和中途停留地等同的目的地节点和中途停留地节点,所述概率模型使用通过学习获得的所述参数;当前位置估计装置,其在使用通过学习获得的所述参数的所述概率模型中输入与所述学习数据不同并且在从当前时间起的预定时间内的用户移动历史数据, 并估计与所述用户的当前位置等同的当前位置节点;搜索装置,其使用关于所估计的目的地节点、中途停留地节点和当前位置节点的信息以及通过学习获得的所述概率模型来搜索从所述用户的当前位置至目的地的路线;以及计算装置,其计算到所搜索到的目的地的到达概率和所需时间。本发明的另一个实施例提供了一种数据处理设备的数据处理方法,所述数据处理设备处理用户的移动历史数据,所述方法包括以下步骤将作为学习数据获得的所述移动历史数据表达为概率模型,并学习所述模型的参数,其中,所述概率模型表达用户的活动; 从所述概率模型的状态节点中估计与移动的目的地和中途停留地等同的目的地节点和中途停留地节点,所述概率模型使用通过学习获得的所述参数;在使用通过学习获得的所述参数的所述概率模型中输入与所述学习数据不同并且在从当前时间起的预定时间内的用户移动历史数据,并估计与所述用户的当前位置等同的当前位置节点;使用关于所估计的目的地节点、中途停留地节点和当前位置节点的信息以及通过学习获得的所述概率模型来搜索从所述用户的当前位置至目的地的路线;以及计算到所搜索到的目的地的到达概率和所需时间。本发明的另一个实施例提供了一种数据处理设备,包括学习部件,其将作为学习数据获得的用户移动历史数据表达为概率模型,并学习所述模型的参数,其中,所述概率模型表达用户的活动;目的地和中途停留地估计部件,其从所述概率模型的状态节点中估计与移动的目的地和中途停留地等同的目的地节点和中途停留地节点,所述概率模型使用通过学习获得的所述参数;当前位置估计部件,其在使用通过学习获得的所述参数的所述概率模型中输入与所述学习数据不同并且在从当前时间起的预定时间内的用户移动历史数据,并估计与所述用户的当前位置等同的当前位置节点;搜索部件,其使用关于所述估计的目的地节点、中途停留地节点和当前位置节点的信息以及通过学习获得的所述概率模型来搜索从所述用户的当前位置至目的地的路线;以及计算部件,其计算到所搜索到的目的地的到达概率和所需时间。预测系统的配置示例图1示出根据本发明的一个实施例的预测系统的配置示例。图1的预测系统1由学习块11、个体用户模型参数存储部件12和预测块13构成。在学习块11中,提供时间序列数据,所述时间序列数据示出在预定时间点的用户的位置(经度和纬度),并在诸如GPS (全球定位系统)传感器的传感器设备(未示出)中在确定的时间中被获得。更确切地说,在学习块11中,提供时间序列数据(以下称为移动历史数据),所述时间序列数据由位置数据(经度和纬度)和在该时间的时间点三维地形成, 并示出用户的移动路径,所述位置数据以恒定时间间隔(15秒间隔)依序被获得。另外,构成时间序列数据的包括经度、纬度和时间的一单元数据被任意地称为三维数据。学习块11执行学习处理,在学习处理中,使用用户移动历史数据来学习用户活动模型(状态模型,其表达用户的行为/活动模式),作为随机状态转换模型。例如可以采用包括隐含状态的概率模型,比如遍历型HMM(隐马尔可夫模型),作为在学习中使用的随机状态转换模型。在预测系统1中,采用应用了稀疏限制的遍历型HMM 作为随机状态转换模型。在此,将参考图4至6B在以后描述应用了稀疏限制的遍历型HMM 和遍历型HMM的参数的计算方法等。个体用户模型参数存储部件12存储通过在学习块11中的学习获得的、并表达用户活动模型的参数。预测块13从个体用户模型参数存储部件12获得通过学习块11中的学习获得的用户活动模型的参数。然后,预测块13估计用户的当前位置,并使用用户活动模型来预测目的地,所述目的地是从当前位置起的另一个移动点,所述用户活动模型使用通过针对新获得的用户移动历史数据进行学习而获得的参数。此外,预测块13也计算到预测目的地的到达概率、路线和到达时间(所需时间)。在此,目的地不限于仅一个,而是可以预测多个目的地。将描述学习块11和预测块13的细节。学习块11由历史数据累积部件21、学习预处理部件22、学习主处理部件23、学习后处理部件M以及目的地和中途停留地检测部件25构成。历史数据累积部件21累积(存储)从传感器设备提供的用户移动历史数据作为学习数据。历史数据累积部件21在需要时向学习预处理部件22提供移动历史数据。学习预处理部件22解决在传感器设备中出现的问题。具体地说,学习预处理部件 22将移动历史数据整形,并通过执行插值处理等来补充暂时丢失的数据。另外,学习预处理部件22对构成移动历史数据的每单元三维数据赋予在一个位置静止(停止)的“静止状态”或移动的“移动状态”的移动属性。赋予移动属性之后的移动历史数据被提供到学习主处理部件23以及目的地和中途停留地检测部件25。学习主处理部件23建模用户活动模型作为随机状态转换模型。更确切地说,学习主处理部件23确定将用户移动历史被建模为随机状态转换模型时的参数。通过学习获得的用户活动模型的参数被提供到学习后处理部件M和个体用户模型参数存储部件12。学习后处理部件M使用通过学习主处理部件23的学习获得的用户活动模型来将构成移动历史数据的每单元三维数据转换为用户活动模型的状态节点。更确切地说,学习后处理部件M产生由与移动历史数据对应的用户活动模型的状态节点组成的时间序列数据(状态节点序列数据)。此时,学习后处理部件M通过基于公知常识添加偏移来执行状态节点序列数据的部分校正。学习后处理部件M向目的地和中途停留地检测部件25提供转换和校正后的状态节点序列数据。目的地和中途停留地检测部件25在从学习预处理部件22提供的赋予移动属性后的移动历史数据和从学习后处理部件M提供的状态节点序列数据之间建立联系。更确切地说,目的地和中途停留地检测部件25向用户活动模型的状态节点指定构成移动历史数据的相应单元三维数据。然后,目的地和中途停留地检测部件25向状态节点序列数据中的每个状态节点中与移动属性是“静止状态”的三维数据对应的状态节点赋予目的地或中途停留地属性。据此,将用户移动历史中的预定位置(与所述预定位置对应的状态节点)指定为目的地或中途停留地。利用目的地和中途停留地检测部件25,关于向状态节点赋予的目的地或中途停留地的属性的信息被提供到个体用户模型参数存储部件12并被存储。
预测块13由缓冲部件31、预测预处理部件32、预测主处理部件33和预测后处理部件;34构成。缓冲部件31缓冲(存储)用于预测处理的、实时地获得的移动历史数据。在此,作为用于预测处理的移动历史数据,在比学习处理时的移动历史数据短的时间段中的数据, 例如大约100步的移动历史数据,就足够了。缓冲部件31通常存储预定时间量的最近移动历史数据,并在获得新数据时从所存储的数据中删除最旧的数据。预测预处理部件32以与学习预处理部件22相同的方式来解决在传感器设备中出现的问题。更确切地说,预测预处理部件32将移动历史数据整形,并通过执行插值处理等来补充暂时丢失的数据。预测主处理部件33由当前位置节点估计部件41以及目的地和中途停留地预测部件42构成。在预测主处理部件33中,从个体用户模型参数存储部件12提供表达用户活动模型并由学习块11获得的参数。当前位置节点估计部件41使用从预测预处理部件32提供的移动历史数据和通过学习块11的学习获得的用户活动模型来估计与用户的当前位置对应的状态节点(当前位置节点)。在状态节点的估计中,可以采用维特比(Viterbi)最大似然度估计或软判决维特比估计。目的地和中途停留地预测部件42在由多个状态节点形成的树结构中计算到目的地状态节点(目的地节点)的节点系列及其发生概率,所述多个状态节点是有可能从由当前位置节点估计部件41估计的当前位置节点转换到的状态节点。在此,由于存在到目的地状态节点的节点系列(路线)中包括中途停留地节点的情况,因此目的地和中途停留地预测部件42在预测目的地的同时也预测中途停留地。预测后处理部件34将到一个目的地的多个路线的选择概率(发生概率)的总和确定为到达概率。另外,预测后处理部件34从到目的地的路线中选择一个或多个路线作为代表(以下称为代表性路线),并计算所述代表性路线的所需时间。然后,预测后处理部件 34输出到预定目的地的代表性路线、到达概率和所需时间作为预测结果。在此,可以输出路线的频率而不是发生概率以及到目的地的到达频率而不是到达概率作为预测结果。预测系统的硬件配置示例如上配置的预测系统1可以采用例如图2中所示的硬件配置。更确切地说,图2 是图示预测系统1的硬件配置示例的框图。在图2中,预测系统1由三个移动终端51-1至51-3以及服务器52构成。移动终端51-1至51-3是具有相同功能的相同移动终端51,但是移动终端51-1至51_3由不同的用户持有。因此,在图2中,仅示出三个移动终端51-1至51-3,但是实际上存在取决于用户数量的多个移动终端51。移动终端51可以使用无线通信或经由诸如因特网的网络的通信来与服务器52进行数据传送。服务器52接收从移动终端51发送的数据,并对所接收的数据进行预定处理。 然后,服务器52使用无线通信等来向移动终端51发送数据处理的处理结果。因此,移动终端51和服务器52都至少具有通信部件,所述通信部件进行无线或有线通信。此外,可以采用以下配置移动终端51具有图1的预测块13,而服务器52具有图
101的学习块11和个体用户模型参数存储部件12。在例如在学习处理中采用该配置的情况下,向服务器52发送使用移动终端51的传感器设备获得的移动历史数据。服务器52基于所接收的用于学习的移动历史数据来学习并存储用户活动模型。然后,在预测处理中,移动终端51获得通过学习获得的用户活动模型的参数,从实时获得的移动历史数据估计用户的当前位置节点,并进一步计算目的地节点以及到目的地节点的到达概率、代表性路线和所需时间。然后,移动终端51在诸如液晶显示器的显示部件(未示出)上显示预测结果。可以根据数据处理设备的相应处理能力和通信环境来任意地确定诸如以上的移动终端51和服务器52之间的功能分配。学习处理中的每一个处理所需的时间相当长,但是不必频繁地执行处理。相应地, 由于服务器52通常具有比能够被携带的移动终端51更高的处理能力,因此可以使服务器 52基于累积的移动历史数据来大致每天一次地执行学习处理(参数的更新)。另一方面,由于期望与在每一个时间点实时更新的移动历史数据对应地迅速处理和显示预测处理,因此期望在移动终端51中执行预测处理。如果通信环境良好,则使服务器52也执行预测处理并且仅从服务器52接收预测结果将减少移动终端51的负担,对于移动终端51而言,要求并且期望减小尺寸以便能够被携带。另外,在可以仅使用移动终端51作为数据处理设备来高速地执行学习处理和预测处理的情况下,当然可以在移动终端51中设置图1的预测系统1的所有配置。输入移动历史数据的示例图3示出由预测系统1获得的移动历史数据的示例。在图3中,水平轴表示经度, 垂直轴表示纬度。图3中所示的移动历史数据示出由试验者在大约一个半月的时间段中的移动历史数据累积。如图3中所示,移动历史数据是主要在家附近和到四个其他目的地比如去工作的移动的数据。在此,移动历史数据不能被卫星捕获,并且也包括位置有跳跃的数据。遍历型HMM接下来,将描述预测系统1用作学习模型的遍历型HMM。图4示出HMM示例。HMM是具有状态节点和状态节点之间的转换的状态转换模型。图4示出三个状态的HMM示例。在图4(以与以下附图相同的方式)中,圆圈表示状态节点,箭头表示状态节点转换。另外,在以下,可以将状态节点简称为节点或状态。另外,在图4中,Si (在图4中,i = 1、2、3)表示状态,表示从状态Si到状态~ 的状态转换概率。此外,bj(x)表示输出概率密度函数,其中,在向状态~的状态转换期间观察到观察值X,、表示Si是初始状态的初始概率。在此,例如可以使用正态概率分布等作为输出概率密度函数bj(x)。在此,通过状态转换概率、输出概率密度函数…⑴和初始概率、来限定 HMM(连续HMM)。状态转换概率£tu、输出概率密度函数和初始概率^是!^入= {aij; bj (x), Jii, i = 1,2,... ,Μ, j = 1,2,... ,Μ}的参数。M 表示 HMM 的状态的数量。广泛使用鲍姆-韦尔奇(Baum-Welch)最大似然度估计方法作为估计HMM的参数
11λ的方法。Baum-Welch最大似然度估计方法是基于EM(期望最大化)算法的参数估计方法。根据Baum-Welch最大似然度估计方法,执行HMM的参数λ的估计,以使得基于观察到的时间序列数据X = Xl,X2, ...,&来最大化根据发生概率确定的似然度,其中,发生概率是在时间序列数据中观察到(出现)的概率。在此,^ct表示在时间点t观察到的信号 (采样值),T表示时间序列数据的长度(采样的数量)。例如在〃 Pattern Recognition and Machine Learning (InformationScience and Statistics)" ,Christopher M. Bishop, Springer, New York, 2006 的第 333 页中描述了 Baum-Welch最大似然度估计方法。在此,Baum-Welch最大似然度估计方法是基于似然度最大化的参数估计方法,但是不保证最优,而是依赖于HMM的配置和参数λ的初始值,可以收敛到局部最小值。在声音识别中广泛使用ΗΜΜ,但是在声音识别中使用的HMM中,通常预先确定状态的数量和状态转换的方法等。图5示出在声音识别中使用的HMM示例。图5的HMM被称为从左到右型。在图5中,状态的数量是3,并且状态转换限于以下配置仅允许自我转换(从状态Si到状态Si的状态转换)和从左状态到右状态的状态转换。相对于象在图5的HMM中那样有状态转换限制的HMM而言,在图4中所示的没有状态转换限制的ΗΜΜ,即其中从任意状态Si到任意状态~的状态转换都可能的ΗΜΜ,被称为遍历型ΗΜΜ。遍历型HMM是在结构上具有最高自由度的ΗΜΜ,但是当状态的数量增加时,变得难以估计参数入。例如,在遍历型HMM的状态的数量是1000的情况下,状态转换的数量变为 1000000( = 1000X1000)。因此,在这种情况下,在参数λ中,例如对于状态转换概率 」,必须估计1000000 个状态转换概率hj。因此,在对状态设置的状态转换中,可以应用例如作为稀疏配置的限制(稀疏限制)。在此,稀疏限制是可以针对其执行从特定状态的状态转换的状态显著受限的配置,而不是诸如对于遍历型HMM而言的可以从任意状态到任意状态的状态转换的密集状态转换。在此,即使对于稀疏配置,也存在至少一个向其他状态的状态转换,并且也存在自我转换。图6A和6B示出应用稀疏限制的HMM示例。在此,在图6A和6B中,连接两个状态的双方向箭头表示从两个状态中的一个状态到另一个状态的状态转换和从所述另一个状态到所述一个状态的状态转换。另外,在图6A 和6B中,自我转换对于每一个状态都是可能的,省略了表示自我转换的箭头的图形表示。在图6A和6B中,在二维空间中以网格形式布置了 16个状态。更确切地说,在图 6A和6B中,在水平方向上布置了四个状态,并且也在垂直方向上布置了四个状态。在此,当在水平方向上相邻的状态之间的距离和在垂直方向上相邻的状态之间的距离都被设置为1时,图6A示出应用了稀疏限制的HMM,其中,到距离为1或更小的状态的状态转换是可能的,到其他状态的状态转换是不可能的。另外,图6B示出应用了稀疏限制的HMM,其中,到距离是7 或更小的状态的状态转换是可能的,到其他状态的状态转换是不可能的。在图1的示例中,预测系统1提供移动历史数据χ = Xl,χ2,...,χτ,学习块11使用移动历史数据χ = X1, &,. . .,xT,并估计用于表示用户活动模型的HMM的参数λ。更确切地说,关于在每一个时间点的位置(经度和纬度)的数据被视为随机变量的观察数据,所述在每一个时间点的位置表示用户的移动轨迹,所述随机变量是正态分布的,相对于地图上的一点具有预定方差的扩展,所述点对应于HMM的任意一个状态~。学习块11优化与每个状态~对应的地图上的点(平均μ j)、方差σ /以及状态转换概率^ijjt5在此,可以将状态Si的初始概率π 1设置为统一值。例如,M个状态Si中每一个状态的初始概率η i可以被设置为1/M。对于通过学习获得的用户活动模型(HMM),当前位置节点估计部件41应用维特比算法,并确定使观察到移动历史数据X = X1,X2,. . . 的似然度最大化的状态转换路径(状态系列)(以下称为最大似然度路径)。据此,识别与用户的当前位置对应的状态Si。在此,维特比算法是确定下述路径(最大似然度路径)的算法该路径使得在以每一个状态Si为起点的状态转换路径中,在时间点t从状态Si到状态~的状态转换的状态转换概率和在状态转换中在移动历史数据χ = X1, &,. . .,&中采样值^ct在时间点t被观察到的概率(从输出概率密度函数确定的输出概率)在处理之后在时间序列数据X 的长度T上的累积值(发生概率)最大化。在上述〃 Pattern Recognition and Machine Learning(Information Science and Statistics)" , Christopher M. Bishop, Springer, New York, 2006的第347页中描述了维特比算法的细节。学习预处理部件22的配置示例图7是图示学习块11的学习预处理部件22的详细配置示例的框图。学习预处理部件22由数据连接和分割部件71、数据异常去除部件72、重新采样处理部件73、移动属性辨别和赋予部件74以及静止状态加工部件75构成。数据连接和分割部件71执行移动历史数据的连接和分割。在数据连接和分割部件71中,从传感器设备以预定单位比如一日这样的单位来提供作为日志文件的移动历史数据。因此,在向特定目的地的移动期间通常是连续的移动历史数据由于其跨日期而被分割,并且被获得。数据连接和分割部件71连接以这种方式分割的移动历史数据。具体地说, 如果在一个日志文件中的最后一个三维数据(经度、纬度和时间)和紧接在所述一个日志文件之后建立的日志文件中的第一个三维数据的时间差在预定时间内,则数据连接和分割部件71连接这些文件中的移动历史数据。另外,例如,由于GPS传感器在隧道或地下不能捕获卫星,因此获得移动历史数据的时间之间的间隔可能变长。在移动历史数据长时间丢失的情况下,难以估计用户去了哪里。因此,在所获得的移动历史数据的获得时间前后的间隔等于或大于预定时间间隔(以下称为丢失阈值时间)的情况下,数据连接和分割部件71分割在该间隔之前和之后的移动历史数据。在此,丢失阈值时间是5分钟、10分钟或1小时等。数据异常去除部件72执行从移动历史数据中去除明显异常的处理。例如,在存在
13跳跃并且在特定时间点的位置数据与前一个和下一个位置隔开IOOm或更大的情况下,该位置数据是异常。因此,在特定时间点的位置数据与前一个和下一个位置都隔开预定距离或更远的情况下,数据异常去除部件72从移动历史数据中去除该三维数据。重新采样处理部件73执行以下处理使用线性插值等来补充在获得时间的时间间隔小于丢失阈值时间情况下的丢失数据。更确切地说,在获得时间的时间间隔等于或大于丢失阈值时间的情况下,使用数据连接和分割部件71来分割移动历史数据,但是仍然存在小于丢失数据阈值时间的丢失数据。因此,重新采样处理部件73补充在获得时间的时间间隔小于丢失阈值时间情况下的丢失数据。移动属性辨别和赋予部件74辨别每一单元三维移动历史数据的移动属性为在一个位置静止(停止)的“静止状态”或移动的“移动状态”,并向每一单元三维移动历史数据赋予所述移动属性。据此,在向各单元三维移动历史数据赋予移动属性的情况下,产生具有移动属性的移动历史数据。静止状态加工部件75基于从移动属性辨别和赋予部件74提供的具有移动属性的移动历史数据来加工具有“静止状态”移动属性的三维数据。更具体地,在“静止状态”移动属性持续预定时间(以下称为静止阈值时间)或更久的情况下,静止状态加工部件75分割之前和之后的移动历史数据。另外,在“静止状态”移动属性持续短于静止阈值时间的情况下,静止状态加工部件75在静止阈值时间内的预定时间上连续地存储多个三维“静止状态”数据的位置数据(校正为在一个位置的位置数据)。据此,可以防止针对同一目的地或中途停留地的移动历史数据分配多个“静止状态”节点。换句话说,可以防止同一目的地或中途停留地被表达为多个节点。学习预处理部件22的处理图8是在概念上图示学习预处理部件22的学习预处理的处理的图像示图。在图8的上层中所示的通过重新采样处理部件73的数据补充后,移动属性辨别和赋予部件74针对移动历史数据81辨别并向移动历史数据81赋予“静止状态”或“移动状态”的移动属性。结果,产生在图8的中层中所示的具有移动属性的移动历史数据82。在图8的中层中的具有移动属性的移动历史数据82中,“1<’和“m2”表示“移动状态”移动属性,“U”表示“静止状态”移动属性。在此,即使“m/’和“m2”是相同的“移动状态”,移动手段(汽车、公共汽车、火车或步行等)也不同。然后,静止状态加工部件75对图8的中层的具有移动属性的移动历史数据82执行移动历史数据的分割或保存的处理,产生在图8的下层中所示的具有移动属性的移动历史数据83 (83A和83B)。在具有移动属性的移动历史数据83中,在具有移动属性的移动历史数据82中第二个产生的“移动状态”位置(三维数据)处执行分割处理,分割具有移动属性的移动历史数据83A和83B。在分割处理中,最初,在具有移动属性的移动历史数据82中第二个出现的“移动状态”和剩余的三维数据之间分割上述多个三维数据,因而有具有移动属性的两个移动历史数据83A和83B。接下来,从已经分割的具有移动属性的移动历史数据83A和83B中,将在时间上较早的具有移动属性的移动历史数据83A中的关于等于或长于静止阈值的多个 “移动状态”的最后部分三维数据分组为关于一个“静止状态”的三维数据。根据这一点,可以缩短学习时间,因为去除了不必要的移动历史数据。另外,在图8中,在具有移动属性的移动历史数据82中第三个出现的关于“多个移动状态”的三维数据也是等于或长于静止阈值时间的“移动状态”持续的数据,因而执行相同方式的分割处理。然而,由于在分割后没有随后的三维数据,因此将关于等于或大于静止阈值时间的多个“移动状态”的三维数据仅分组为关于一个“静止状态”的三维数据。另一方面,在来自具有移动属性的移动历史数据83A的具有第一个“移动状态”的移动历史数据中,执行保存处理。在保存处理后,关于三个“移动状态”的三维数据Ktk+ Xk-1,Yk-1),(、,Xk,Yk),(tk+1,Xk+1, yk+1)}变为 KtH,Xh,Yk^1) , (tk, Xk-1,Yk-1),(tk+1,Xk-1, yH)}。更确切地说,位置数据被校正为初始“移动状态”的位置数据。在此,在保存处理中, 可以将位置数据更新为平均值位置的位置数据,而不是更新为初始“移动状态”的位置数据等,所述平均值位置是“移动状态”时间中的中间时间点。移动属性辨别和赋予部件74的配置示例图9是图示移动属性辨别和赋予部件74的详细配置示例的框图。移动属性辨别和赋予部件74由移动速度计算部件91、移动属性辨别部件92和移动属性赋予部件93构成。移动速度计算部件91根据所提供的移动历史数据计算移动速度。具体地说,当将以静止时间间隔在第k步中获得的三维数据表示为时间tk、经度yk 和纬度&时,可以使用等式(1)来计算第k步的在χ方向上的移动速度^k和在y方向上的移动速度vyk。
权利要求
1.一种数据处理设备,包括学习装置,其将作为学习数据获得的用户移动历史数据表达为概率模型,并学习所述模型的参数,其中,所述概率模型表达用户的活动;目的地和中途停留地估计装置,其从所述概率模型的状态节点中估计与移动的目的地和中途停留地等同的目的地节点和中途停留地节点,所述概率模型使用通过学习获得的所述参数;当前位置估计装置,其在使用通过学习获得的所述参数的所述概率模型中输入与所述学习数据不同并且在从当前时间起的预定时间内的用户移动历史数据,并估计与所述用户的当前位置等同的当前位置节点;搜索装置,其使用关于所估计的目的地节点、中途停留地节点和当前位置节点的信息以及通过学习获得的所述概率模型来搜索从所述用户的当前位置至目的地的路线;以及计算装置,其计算到所搜索到的目的地的到达概率和所需时间。
2.根据权利要求1所述的数据处理设备,进一步包括移动属性辨别装置,其针对构成所述移动历史数据的每一单元三维数据的至少辨别静止状态和移动状态,其中,所述目的地和中途停留地估计装置将与其中所述静止状态已经持续预定阈值时间或更久的所述移动历史数据对应的状态节点估计为所述目的地节点,并将与其中所述静止状态的持续时间小于预定阈值时间的所述移动历史数据对应的状态节点估计为所述中途停留地节点。
3.根据权利要求2所述的数据处理设备,进一步包括数据加工装置,其将其中所述静止状态已经持续所述预定阈值时间或更久的所述移动历史数据校正为同一位置的数据,其中,所述学习装置使用利用所述数据加工装置加工的所述学习数据来学习所述概率模型的参数。
4.根据权利要求1所述的数据处理设备,其中,所述学习装置采用隐马尔可夫模型作为表达所述用户的活动的概率模型,并学习所述参数,以使得当使用所述隐马尔可夫模型来建模所述移动历史数据时似然度最大化。
5.根据权利要求1所述的数据处理设备,其中,所述当前位置估计装置计算使用通过学习获得的所述参数的所述概率模型的状态节点系列数据,并将所计算的状态节点系列数据中的最后一个节点设置为与所述用户的当前位置等同的节点,其中,所述概率模型的状态节点系列数据对应于在从所述当前时间起的预定时间内的所述用户的所述移动历史数据。
6.根据权利要求1所述的数据处理设备,其中,在由有可能从所述用户的当前位置节点转换到的状态节点形成的树结构中,所述搜索装置以所述当前位置节点为起点,搜索到目的地节点或到没有转换目的地情况下的终端节点的所有状态节点,或进行搜索直到搜索的次数达到作为完成条件的预定次数,并将从所述用户的当前位置至所述目的地的路线确定为从所述当前位置节点起的状态节点系列。
7.根据权利要求6所述的数据处理设备,其中,所述搜索装置使用深度优先算法来执行处理,所述深度优先算法从具有较高选择概率的分支组成的路线中进行搜索。
8.根据权利要求1所述的数据处理设备,其中,所述计算装置通过计算到所搜索到的目的地节点的所述状态节点系列的标准化转换概率的联合概率,来计算到所述目的地的路线的选择概率。
9.根据权利要求8所述的数据处理设备,其中,在存在到所述目的地的多个路线的情况下,所述计算装置使用多个选择概率的总和来计算到所述目的地的到达概率。
10.根据权利要求8所述的数据处理设备,其中,所述计算装置将搜索结果中从所述用户的当前位置至所述目的地的路线中对于各个目的地来说具有最高选择概率的路线计算为每一个目的地的代表性路线,并计算所述代表性路线的所需时间作为到所述目的地的所需时间。
11.根据权利要求8所述的数据处理设备,其中,在存在没有中途停留地的路线和具有中途停留地的路线作为到所述目的地的路线的情况下,所述计算装置将所述没有中途停留地的路线和具有中途停留地的路线计算为到每一个目的地的代表性路线,并将每一个路线的所需时间计算为到所述目的地的所需时间。
12.根据权利要求1所述的数据处理设备,其中,所述计算装置将到目的地的所需时间计算为从当前时间点到当在紧接在所述目的地节点之前的状态节点处移动到目的地节点时的时间的预期值。
13.一种数据处理设备的数据处理方法,所述数据处理设备处理用户的移动历史数据, 所述方法包括以下步骤将作为学习数据获得的所述移动历史数据表达为概率模型,并学习所述模型的参数, 其中,所述概率模型表达用户的活动;从所述概率模型的状态节点中估计与移动的目的地和中途停留地等同的目的地节点和中途停留地节点,所述概率模型使用通过学习获得的所述参数;在使用通过学习获得的所述参数的所述概率模型中输入与所述学习数据不同并且在从当前时间起的预定时间内的用户移动历史数据,并估计与所述用户的当前位置等同的当前位置节点;使用关于所估计的目的地节点、中途停留地节点和当前位置节点的信息以及通过学习获得的所述概率模型来搜索从所述用户的当前位置至目的地的路线;以及计算到所搜索到的目的地的到达概率和所需时间。
14.一种程序,使得计算机用作学习装置,其将作为学习数据获得的用户移动历史数据表达为概率模型,并学习所述模型的参数,其中,所述概率模型表达用户的活动;目的地和中途停留地估计装置,其从所述概率模型的状态节点中估计与移动的目的地和中途停留地等同的目的地节点和中途停留地节点,所述概率模型使用通过学习获得的所述参数;当前位置估计装置,其在使用通过学习获得的所述参数的所述概率模型中输入与所述学习数据不同并且在从当前时间起的预定时间内的用户移动历史数据,并估计与所述用户的当前位置等同的当前位置节点;搜索装置,其使用关于所述估计的目的地节点、中途停留地节点以及当前位置节点的信息和通过学习获得的所述概率模型来搜索从所述用户的当前位置至目的地的路线;以及计算装置,其计算到所搜索到的目的地的到达概率和所需时间。
15. 一种数据处理设备,包括学习部件,其将作为学习数据获得的用户移动历史数据表达为概率模型,并学习所述模型的参数,其中,所述概率模型表达用户的活动;目的地和中途停留地估计部件,其从所述概率模型的状态节点中估计与移动的目的地和中途停留地等同的目的地节点和中途停留地节点,所述概率模型使用通过学习获得的所述参数;当前位置估计部件,其在使用通过学习获得的所述参数的所述概率模型中输入与所述学习数据不同并且在从当前时间起的预定时间内的用户移动历史数据,并估计与所述用户的当前位置等同的当前位置节点;搜索部件,其使用关于所述估计的目的地节点、中途停留地节点和当前位置节点的信息以及通过学习获得的所述概率模型来搜索从所述用户的当前位置至目的地的路线;以及计算部件,其计算到所搜索到的目的地的到达概率和所需时间。
全文摘要
一种数据处理设备包括学习部件,其将作为学习数据获得的用户移动历史数据表达为概率模型,并学习所述模型的参数,其中,所述概率模型表达用户的活动;目的地和中途停留地估计部件,其从所述概率模型的状态节点中估计目的地节点和中途停留地节点;当前位置估计部件,其在所述概率模型中输入用户移动历史数据,并估计与用户的当前位置等同的当前位置节点;搜索部件,其使用关于所估计的目的地节点、中途停留地节点和当前位置节点的信息以及通过学习获得的所述概率模型来搜索从用户的当前位置至目的地的路线;以及计算部件,其计算到所搜索到的目的地的到达概率和所需时间。
文档编号G06N99/00GK102270191SQ20111014750
公开日2011年12月7日 申请日期2011年5月27日 优先权日2010年6月3日
发明者井手直纪, 伊藤真人, 佐部浩太郎 申请人:索尼公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1