信息处理系统的制作方法

文档序号:11935192阅读:212来源:国知局
信息处理系统的制作方法与工艺

本国际申请要求2014年8月8日在日本专利局提交的日本发明专利申请第2014-162623号的优先权,以及2015年1月6日在日本专利局提交的日本发明专利申请第2015-000945号的优先权,所述日本发明专利申请的全部内容通过引用而并入本文。

技术领域

本公开涉及对数据库进行处理的信息处理系统。



背景技术:

以往,基于商品的销售数据对顾客的购买行为进行分析。为了利于商业活动,还对顾客接触大众传媒或网络内容的行为进行分析。

还通过问卷形式或面对面提问的形式,对顾客的购买行为、接触大众传媒/网络内容的行为、以及生活方式等多种信息进行收集。

近年来,每个企业都拥有这种具备有关顾客的数据的庞大的数据库。然而,每个企业以保护个人信息为主要理由,不愿向外部提供这些有关顾客的数据。当这些数据从持有该数据的企业被提供给外部时,或被加密处理后加以提供,或在将牵扯到确定顾客方面的信息大幅削除后加以提供,或有意地在变更为含有错误(杂讯)的状态下加以提供(参照专利文献1)。

现有技术文献

专利文献

专利文献1:日本特开第2014-109647号公报



技术实现要素:

发明要解决的问题

如上所述,从数据持有企业提供有关顾客的数据出于保护个人信息的观点而受到限制。不仅对于有关顾客的数据,即使对于粒度精细的数据,由于担心因该信息的价值高度或提供而引起不利,因此数据持有企业容易在数据提供方面变得消极。所以,根据以往的技术,难以有效地利用社会上存在的各种数据。

因此,本公开的一个方面在于希望能够提供一种可有效地利用社会上存在的各种数据的、有关数据库的新技术。

解决问题的技术方案

本公开一个方面的信息处理系统包括:储存单元,构成为储存第一数据库以及第二数据库;以及合并单元,构成为对第一数据库和第二数据库进行合并。在本公开的一个方面,信息处理系统还可以具备构成为生成第一数据库的生成单元。

第一数据库是具备与第一组的结构体有关的每个虚拟结构体的特征数据的数据库。该每个虚拟结构体的特征数据可基于第一组的每个结构体的特征数据,将特征一致或相似的多个结构体的特征数据进行统合而生成。结构体的特征数据表示与该结构体有关的特征。例如,生成单元可构成为,在第一组中,以特征一致或相似的多个结构体为单位,对该多个结构体的特征数据进行统计处理,由此对特征一致或相似的多个结构体的特征数据进行统合,从而生成每个虚拟结构体的特征数据。

第二数据库具备第二组的每个结构体的特征数据。第二组是与第一组相同或不同的组。第一数据库以及第二数据库所具备的每一个特征数据构成为均包含参照数据,该参照数据为合并时供参照的参照数据,并且表示第一数据库与第二数据库之间共同种类的特征。

合并单元以将第一数据库与第二数据库之间参照数据所表示的特征一致或相似的特征数据彼此合并的方式,对第一数据库和第二数据库进行合并。

根据本公开一个方面的信息处理系统,对多个特征数据进行统合,从而生成具备上述每个虚拟结构体的特征数据的数据库。虚拟结构体的特征数据是混合有多个结构体的特征的数据。例如,第一组为顾客的集合,当统合前的特征数据为表示一个顾客的特征的单一顾客的特征数据时,虚拟结构体的特征数据则对应于将多个顾客的特征进行混合而成的数据。

若将每个结构体的特征数据转换成每个虚拟结构体的特征数据,则能够扩大特征数据的信息粒度,由此能够实现对于具体信息的信息保护。所以,根据本公开的一个方面,能够减小数据持有者以信息保护为由而在数据提供上制造的障碍。因此,根据本公开的一个方面,能够提供可有效利用社会上存在的各种数据的系统。

上述特征一致或相似的多个结构体可以是特征一致的结构体和特征相似的结构体这两者混合存在的集合。本说明书中的用语“相似”可理解成是包含“一致”作为下位概念的广义用语。

对特征一致或相似的多个结构体的特征数据进行统合时,可利用周知的聚类技术(分类技术)。作为聚类技术,在语言处理、模式识别、以及人工智能等领域已知有各种聚类技术。作为广为人知的聚类技术,已知有k-means(k平均算法)、和BIRCH(利用层次方法的平衡迭代规约和聚类)等硬聚类技术、以及LSA(潜在语义分析)、pLSA(概率潜在语义分析)、和LDA(隐含狄利克雷分布)等软聚类技术。

在本公开的一个方面,生成单元可构成为,利用这些周知的聚类技术,或利用其他聚类技术,以如下方式使与第一组有关的特征数据的集合集群化,即,按照特征一致或相似的多个特征数据为单位,将与第一组有关的特征数据的集合分类。该生成单元可构成为以每个集群为单位,对与该集群对应的多个特征数据进行统合。

在本公开的一个方面,生成单元可构成为,以每个集群为单位,对与集群相对应的多个特征数据进行统计处理。具体地,生成单元可构成为,对每个集群计算与集群相对应的多个特征数据所具有的各参数的统计量。统计量的示例包括平均值、最大值、最小值、以及表示分布的值(比例等)。特征数据的参数值及其统计量可以是标量,也可以是向量。可以对每个集群生成虚拟结构体的特征数据。在本公开的一个方面,虚拟结构体的特征数据可生成为包含上述统计量作为表示与虚拟结构体有关的特征的参数值。

上述第一数据库可通过上述生成单元生成,也可通过人工操作生成,还可通过其他方法(例如计算机信息处理与人工操作的组合)生成。

在本公开的一个方面,上述第二数据库也可以与第一数据库同样地进行生成。第二数据库具备的每个结构体的特征数据可以是有关每个虚拟结构体的特征数据。该每个虚拟结构体的特征数据可基于与第一组相同或不同的组的每个结构体的特征数据,将特征一致或相似的多个结构体的特征数据进行统合而生成。在本公开的一个方面,信息处理系统可以具备生成第二数据库的生成单元。

在本公开的一个方面,第二数据库可以是具备未进行上述统合的特征数据的数据库。第二数据库可具备单一来源数据(single-souroe data)作为特征数据。每个单一来源数据是基于从单一信息源收集的信息的数据。单一来源数据可以是未进行统计化以及模型化的结构体的特征数据,可以是表示与单一结构体有关的特征的数据。

上述第一组以及第二组各自可以是人、物、服务、以及地点的至少一者的集合。上述结构体可以是该集合的元素。即,上述结构体可以是人、物、服务、以及地点的任一者。物、服务、以及地点可以是与人相关的物、服务、以及地点。

根据本公开的一个方面,第一组以及第二组的一方可以是人的集合,第一组以及第二组的另一方可以是物、服务、以及地点的至少一者的集合。第一组以及第二组各自可以是物、服务、以及地点的至少一者的集合。

根据本公开的一个方面,信息处理系统可构成为包括多个生成单元、以及合并单元,所述多个生成单元构成为生成与彼此相同或不同的组有关的数据库,所述合并单元构成为对由多个生成单元生成的多个数据库进行合并。每一个生成单元可构成为生成具备每个虚拟结构体的特征数据的数据库,所述每个虚拟结构体的特征数据是基于对应组的每个结构体的特征数据,将特征一致或相似的多个结构体的特征数据进行统合而成的。

多个数据库所具备的每个特征数据可包含参照数据,所述参照数据是合并时供参照的参照数据,并且表示与作为合并对象的数据库共同种类的特征。合并单元可构成为,以将多个数据库之间参照数据所表示的特征一致或相似的特征数据彼此合并的方式,对多个数据库进行合并。

根据本公开的一个方面,可提供一种信息处理系统,该信息处理系统包括:储存单元,构成为对具备每个虚拟结构体的特征数据的多个数据库进行储存;以及合并单元,构成为对储存单元所储存的多个数据库进行合并。通过该信息处理系统也能够有效地利用社会上存在的数据。

在本公开的一个方面,合并单元可构成为经由特定种类的数据库对上述多个数据库之间进行合并,所述特定种类的数据库是与和多个数据库相同或不同的组有关的数据库,并且以组的每个结构体为单位而具备单一来源数据作为特征数据。单一来源数据可包括参照数据,所述参照数据是在数据库合并时供参照的参照数据,并且表示与作为合并对象的数据库共同种类的特征。

在本公开的一个方面,合并单元可构成为,以将参照数据所表示的特征一致或相似的特征数据彼此合并的方式,对上述特定种类的数据库和除此之外的每个数据库进行合并,由此经由特定种类的数据库对多个数据库之间进行合并。

单一来源数据在未进行上述统合这一点充分表现结构体的特征。因此,经由单一来源数据对各数据库进行合并,由此能够更恰当地对数据库之间的每个虚拟结构体的特征数据进行结合。

在本公开的一个方面,作为上述生成单元以及合并单元的功能,能够通过硬件实现。也可以通过程序使计算机实现作为该各单元的功能。也可以通过多个计算机分散实现作为该各单元的功能。可以对计算机提供一种程序,该程序用于使计算机实现作为这些单元中至少一个单元的功能。程序可记录在半导体制存储器、磁盘以及光盘等计算机可读取的非暂时性记录介质中。

根据本公开的一个方面,可提供一种储存程序的计算机可读取的非暂时性记录介质,所述程序用于使计算机实现作为生成单元以及合并单元的至少一方的功能。根据本公开的一个方面,可提供一种信息处理系统,其具备计算机(处理器)以及存储器,并在存储器储存有上述程序。

根据本公开的一个方面,可提供一种数据库合并方法,其包括:生成或获取上述第一数据库的步骤;以及使第一数据库与上述第二数据库合并的步骤。根据本公开的另一方面,可提供一种数据库合并方法,其包括:生成或获取第一数据库的步骤;生成或获取第二数据库的步骤;以及对第一数据库和第二数据库进行合并的步骤。

上述数据库可以是有关顾客的数据库。数据库可构成为具备表示与顾客有关的人、物、服务、以及地点的至少一者的特征的特征数据。根据本公开一个方面的信息处理系统,可以在保护顾客个人信息的同时向合并单元提供有关顾客的数据。合并单元能够生成将与不同数据提供源的顾客有关的数据合并而成的数据库。

当每个数据库具备表示顾客特征的特征数据时,上述参照数据可作为表示顾客的人口统计属性的数据而构成。人口统计属性包含在各个企业持有的有关顾客的数据中。若基于这样的表示人口统计属性的参照数据对数据库之间进行合并,则能够恰当地合并不同数据库之间的特征数据。当然,参照数据可以是表示在人口统计属性附加除人口统计属性以外的顾客特征,或者表示以除人口统计属性以外的顾客特征取代人口统计属性的数据。

与顾客有关的特征数据中,作为参照数据以外的非参照数据,可以包括表示顾客的消费行为、接触大众传媒的行为、接触网络内容的行为、生活方式、价值观、以及品牌意识的至少一者的特征的数据。若将数据库之间这种包含与顾客有关的多种信息的特征数据彼此合并,则能够从合并后的数据库中通过分析而抽取与顾客(消费者)有关的多种有意义的统计信息。

在此作为示例而列举的非参照数据也可以变成参照数据。参照数据可以是表示在多个数据库内被直接合并的数据库之间共同种类的特征的数据。

附图说明

图1是表示第一实施例的信息处理系统的构成的框图。

图2A是表示数据加工装置的构成的框图;图2B是表示由数据加工装置的运算部执行的处理的框图。

图3A-3D是表示顾客相关数据库所具有的特征数据的构成的图。

图4是说明加工后数据库的示例的图。

图5A是表示数据合并装置的构成的框图;图5B是表示由数据合并装置的运算部执行的处理的框图。

图6A是说明加工后数据库的合并示例的图。

图6B是对作为合并对象的加工后数据库的构成进行例示的图。

图6C是表示基于加工后数据库的合并数据库的构成示例的图。

图7是说明合并数据库的分析示例的图。

图8A是说明第二实施例中加工后数据库的合并示例的图。

图8B是表示第二实施例中合并数据库的构成示例的图。

图9A是说明第三实施例中顾客相关数据库的构成的图。

图9B是说明第四实施例中顾客相关数据库的构成的图。

图10A是说明第五实施例中顾客相关数据库的构成的图。

图10B是说明第六实施例中顾客相关数据库的构成的图。

图11A是说明第七实施例中顾客相关数据库的构成的图。

图11B是说明第八实施例中顾客相关数据库的构成的图。

具体实施方式

以下参照附图说明本公开的实施例。

[第一实施例]

图1所示的本实施例的信息处理系统1包括多个数据加工装置10、以及数据合并装置50。数据加工装置10对企业持有的有关顾客的数据库153进行加工,并将加工后数据库155提供给数据合并装置50。数据加工装置10设置在持有与顾客有关的数据库153的企业侧。

以下将与顾客有关的数据库153表示为顾客相关数据库153。将对顾客相关数据库153进行加工和提供的企业表示为数据提供源。顾客相关数据库153具备有关顾客的特征数据组。

作为特征数据的一例可列举将顾客的消费行为、接触大众传媒的行为、接触网络内容的行为、生活方式、价值观、以及品牌意识的至少一者的特征连同顾客的识别ID或人口统计属性一起进行表示的数据。

上述顾客的识别ID可以是识别码,该识别码能够从储存顾客信息的数据库中提取表示顾客的人口统计属性的数据。顾客的消费行为中包括顾客的购买行为。

例如,上述特征数据可构成为一并具有顾客的人口统计属性和顾客的购买数据。购买数据可以是表示购买商品以及/或购买款额的数据。该情形下,顾客相关数据库153可以具有每个顾客以及每项结算的特征数据。

数据加工装置10以如下方式进行加工,即,基于顾客相关数据库153所具有的上述特征数据组,将特征相似的多个特征数据统合成一个特征数据。本说明书中使用的用语“相似”可理解成是包含“一致”作为下位概念的广义用语。数据加工装置10生成具备加工后的特征数据作为虚拟顾客的特征数据的数据库,作为上述加工后数据库155。本说明书中还将加工后的顾客相关数据库表示为加工后数据库155。加工后数据库155例如以与多个顾客对应的每个虚拟顾客为单位而具备该虚拟顾客的特征数据。

例如利用通信向数据合并装置50提供加工后数据库155。为了防止数据库的泄漏,通信可利用加密密钥或专用线路。作为其他示例,可将加工后数据库155保存在可携带且计算机可读取的记录介质中,并通过该记录介质的搬运将加工后数据库155提供给数据合并装置50侧。作为记录介质可列举半导体制存储器、CD-ROM和DVD等光盘、以及硬盘等磁盘作为一例。

数据合并装置50对从每个数据加工装置10提供的多个加工后数据库155进行合并,从而生成合并数据库557。作为数据提供源可列举如上所述的具备顾客相关数据库153的企业作为一例,其中,顾客相关数据库153包含顾客的购买数据作为特征数据。

作为拥有购买数据的企业,可列举经营便利商店、超级市场以及/或百货店等的零售(商品销售)商、经营自动售货机的企业、提供利用电子货币进行结算服务的企业、以及提供利用信用卡进行结算服务的企业作为一例。

零售商各自分别拥有积累了经由POS系统等获取的每项结算的购买数据的数据库。作为POS系统已知有能够对顾客进行确定的ID-POS系统。

顾客在结算时向零售商出示积分卡,零售商通过与由积分卡确定的顾客ID建立关联而对购买数据进行积累,由此零售商还对具备能够确定顾客的每项结算的购买数据的数据库进行构建。结算时通过销售人员输入根据外表辨别的顾客的性别以及年龄,而使顾客的人口统计属性和购买数据建立关联,由此零售商还对每项结算的购买数据进行积累。

数据合并装置50对这样数据提供源不同的、包含购买数据的多个加工后数据库155进行合并,由此能够构建出凭一个企业无法构建的庞大的数据库。例如,能够生成可对与大范围的商品有关的顾客(消费者)的购买行为进行分析的合并数据库557。

如图2A所示,每个数据加工装置10具备运算部11、储存部15、输入部17、以及输出部19。运算部11具备按照各种程序151执行处理的CPU13。运算部11还具备在由CPU13执行处理时作为工作存储器而使用的RAM14。如图2B所示,通过执行CPU13中的上述处理,使运算部11作为聚类处理部110以及加工处理部115发挥作用。

储存部15对各种程序151以及加工前的顾客相关数据库153进行储存,各种程序151包含用于使运算部11作为聚类处理部110以及加工处理部115而发挥作用的程序。储存部15进一步构成为,对通过加工该顾客相关数据库153而生成的加工后数据库155进行储存。

从输入部17输入构成顾客相关数据库153的数据。输入部17可以是能够从记录介质取入构成顾客相关数据库153的数据的界面,也可以是能够利用通信从企业内的系统取入该数据的界面。

图3A-3D表示顾客相关数据库153所具备的特征数据(记录)的示例。根据图3A的示例,特征数据具有表示顾客的性别以及年龄的参数作为顾客的人口统计属性。并且该特征数据还具有表示商品的购买地点、JAN(Japanese Article Number)码、购买数量、以及商品单价的参数,作为与顾客购买的商品有关的参数。JAN码是在日本广泛普及的商品编码。包含如图3A所示的购买商品的具体信息的顾客相关数据库153例如为便利商店和超级市场等零售商所拥有。

根据图3B所示的另一例,特征数据具有表示顾客的性别以及年龄的参数作为顾客的人口统计属性。并且该特征数据还具有表示商品的购买地点以及购买款额的参数,作为与顾客购买的商品有关的参数。包含如图3B所示的特征数据的顾客相关数据库153例如为信用卡公司所拥有。与零售商相比,该顾客相关数据库153具有巨大的购买数据,在这一点上优越于零售商所拥有的顾客相关数据库153,但是在无法确定到具体的购买商品这一点则与零售商所拥有的顾客相关数据库153呈互补关系。

根据图3C所示的另一例,特征数据具有表示顾客的性别、年龄以及职业的参数作为顾客的人口统计属性。并且该特征数据还具有表示对多个大众传媒(报纸/杂志/广播/电视/电影等)的利用情况的参数,作为有关顾客对大众传媒的接触情况的参数。例如,当顾客正在利用相符的大众传媒(订阅/观看收听等)时,表示利用情况的参数显示数值1,当未利用时则显示数值0。这种信息例如通过问卷形式或对话形式进行收集,并作为特征数据积累在顾客相关数据库153中。这种顾客相关数据库153通常是与大众宣传有关的企业所拥有的数据库,而非零售商所拥有的数据库。

根据图3D所示的另一例,特征数据具有表示顾客的性别、年龄以及居住地区的参数作为顾客的人口统计属性。并且该特征数据还具有表示对多个互联网网站的利用情况的参数,作为有关顾客对网络内容的接触情况的参数。例如,当顾客正在利用(访问)相符的网站时,表示利用情况的参数显示数值1,当未利用时则显示数值0。这种信息例如通过预先征得顾客的同意而安装在顾客的信息终端的访问日志生成程序而积累在特定的服务器上。该顾客相关数据库153通常是IT企业所拥有的数据库,而非零售商所拥有的数据库。

输出部19构成为能够从数据加工装置10将基于上述顾客相关数据库153的加工后数据库155提取到外部。例如,输出部19构成为,具有可利用通信向数据合并装置50提供加工后数据库155的通信界面,或具有可向记录介质输出加工后数据库155的界面。

聚类处理部110从储存部15所储存的加工前的顾客相关数据库153读取特征数据的集合,按照特征相似的多个特征数据为单位,使这些特征数据的集合集群化。作为聚类的方法可采用上述周知的方法。

作为简单的聚类方法,可列举以下方法作为一例,即,将每个特征数据作为特征向量设置在特征空间上,基于特征向量之间的余弦相似度,确定特征相似的特征数据,从而进行集群化的方法。

对于顾客特征相似的特征向量组,还可以使降维矩阵作用于每个特征向量,以在特征空间上使顾客特征相似的特征向量组与其他特征向量充分分离。通过降维矩阵的调整,能够更恰当地进行聚类。

作为聚类技术,还已知有如pLSA(概率潜在语义分析),将一个特征数据概率性地分类成多个集群。是将一个特征数据的80%分类成第一集群,将其余20%分类成第二集群这样的情形。

数据合并装置50的管理者可以考虑基于合并数据库557的数据分析的目的,来决定如何判断特征的相似性并使特征数据组集群化。数据合并装置50的管理者可以向数据提供源提供用于使运算部11作为聚类处理部110以及加工处理部115而发挥作用的程序,并从数据提供源获取充分符合数据分析目的加工后数据库155。

在一个方面中,信息处理系统1可通过对数据提供源所持有的顾客相关数据库153的统计处理,而生成保护个人信息的加工后数据库155。该情形下,优选以如下方式进行聚类,即,使每个集群通过统计处理(统合)而包含具有能够保护个人信息的个数以上的特征数据。当产生未包含具有能够保护个人信息的个数以上的特征数据的集群时,则可以考虑不将属于该集群的特征数据作为加工处理部115中的处理对象从而将其废弃。

加工处理部115进行以下统计处理,即,用于以由聚类处理部110集群化的多个特征数据为单位,换言之,以每个集群为单位,对这些属于同一集群的多个特征数据进行统合。具体地,加工处理部115进行以下处理,即,对每个集群计算属于同一集群的多个特征数据所具有的各参数的统计量,生成包含这些统计量作为参数值的特征数据,作为与集群相对应的虚拟顾客的特征数据。加工处理部115对于所有的集群,对每个集群生成一个虚拟顾客的特征数据,由此生成具备这些特征数据的加工后数据库155,并将其录入储存部15。

根据图4的示例,加工处理部115计算集群内特征数据所表示的性别的比值,作为有关性别参数的统计量,将该比值作为与集群相对应的虚拟顾客特征数据中性别的参数值而进行记载。并且,加工处理部115计算集群内特征数据所表示的年龄的平均值,作为有关年龄参数的统计量,将该平均值作为与集群相对应的虚拟顾客特征数据中年龄的参数值而进行记载。

根据图4上半部分的示例,加工前的特征数据以JAN码与购买地点的每个组合为单位而具有表示顾客于该购买地点购买该JAN码商品的款额总计的购买参数。该情形下,加工处理部115可以对JAN码与购买地点的每个组合计算集群内特征数据所表示的款额的平均值,作为有关购买参数的统计量,并将其记载在与集群相对应的虚拟顾客的特征数据中。

图4下半部分所示的加工后的特征数据以JAN码与购买地点的每个组合为单位而对虚拟顾客的人口统计属性(性别以及年龄)和虚拟顾客购买商品的款额(平均值)一并进行表示。

作为其他示例,加工处理部115也可以不计算上述款额的平均值,而是计算上述款额的最大值以及最小值,作为表示购买款额分布的数值。即,加工处理部115可以以JAN码与购买地点的每个组合为单位而将上述款额的最大值以及最小值作为有关购买参数的统计量记载在虚拟顾客特征数据中。

根据图4,除了加工后的特征数据为表示统计量的数据这一点、以及将表示加工前特征数据的个数(样本数)的参数添加到加工后的特征数据中这一点之外,加工前后的特征数据基本相同。

不过,加工处理部115也可以根据具有图3A所示的特征数据的顾客相关数据库153,生成具备如图4下半部分所示的每个虚拟顾客(集群)的特征数据的加工后数据库155。即,无需使特征数据具有的参数的种类在加工前后一致,可以将加工前的一个或多个参数在加工时置换成可由此计算出的其他种类的参数。

作为统计量,以上对计算比值(比例)、平均值、或最大值和最小值组的示例进行了描述,不过除此之外还可以计算中位数作为统计量,计算平均值和方差组分。可以根据数据分析目的确定计算哪种统计量,以在分析中不遗失有意义的信息。

这样,数据加工装置10以每个集群为单位,将属于该集群的特征数据组加工(统合)成表示统计量的特征数据,并向数据合并装置50输出包含该加工后的特征数据的加工后数据库155。

接下来,参照图5A以及图5B说明数据合并装置50的构成。如图5A所示,数据合并装置50包括运算部51、储存部55、输入部57、以及输出部59。运算部51具备按照各种程序551执行处理的CPU53。运算部51还具备由CPU53执行处理时作为工作存储器而使用的RAM54。运算部51通过由CPU53执行上述处理,而如图5B所示作为数据融合处理部510发挥作用。

储存部55储存各种程序551,该各种程序551包含用于使运算部51作为数据融合处理部510发挥作用的程序。储存部55还构成为储存由数据加工装置10提供的加工后数据库155、以及通过将这些加工后数据库155进行合并而生成的合并数据库557。通过输入部57将由数据加工装置10提供的加工后数据库155输入数据合并装置50内。输入部57可以是能够从记录介质输入加工后数据库155的界面,也可以是能够输入从数据加工装置10利用通信传送来的加工后数据库155的界面。输出部59用于例如将合并数据库557或将基于合并数据库557的数据分析结果从数据合并装置50提取到外部。

数据融合处理部510对储存部55所储存的多个加工后数据库155进行合并,从而生成合并数据库557。具体地,数据融合处理部510参照发挥接合部功能的特征数据内的参数,以将作为合并对象的加工后数据库155之间参照参数所表示的特征相似的特征数据彼此合并的方式,对作为合并对象的加工后数据库155之间进行合并。

如上所述,加工后数据库155所具备的各特征数据在数据提供源不同的加工后数据库155之间也共同具有表示顾客的人口统计属性的参数。例如,特征数据在数据提供源不同的特征数据之间也共同具有表示性别的参数和表示年龄的参数。

这样,数据融合处理部510参照作为合并对象的加工后数据库155具备的特征数据所共同具有的参数(以下表示为共同参数),以将共同参数所表示的顾客特征相似的特征数据彼此合并的方式,对加工后数据库155之间进行合并。

如图6A所示,使储存部55所储存的第1加工后数据库155与第2加工后数据库155合并,使第2加工后数据库155与第3加工后数据库155合并,使第m加工后数据库155与第(m+1)加工后数据库155合并(m为3以上的整数),以如上方式依次对加工后数据库155之间进行合并,由此可实现加工后数据库155之间的合并。作为另一例,相对于特定的加工后数据库155,数据融合处理部510将其余每个加工后数据库155与该特定的加工后数据库155进行合并,由此能够以特定的加工后数据库155为中心将储存部55所储存的加工后数据库155之间合并成星形(参照图8A)。

作为数据融合技术已知有各种技术。在本实施例的数据融合处理部510中也能够利用周知的数据融合技术对加工后数据库155之间进行合并。根据简单的数据融合方法,能够以如下方式对两个加工后数据库155之间相似的特征数据彼此进行匹配(合并)。

例如,对于用来评价相似度的共同参数(例如年龄以及性别),对加工后数据库155之间所有的特征数据的组合计算在将以这些共同参数为元素的特征向量设置在特征空间时特征向量之间的距离(例如余弦距离)。然后,对距离最短的特征向量彼此进行匹配,由此将共同参数所表示的顾客特征相似的特征数据彼此合并,以如上方式能够对加工后数据库155之间进行合并。

当在特征空间上用距离评价二个特征数据间的相似度时,还可以援引运输问题的解法,以使运输费呈“整体上最小”的方式,对加工后数据库155之间的特征数据彼此进行匹配。

通过如上的匹配而生成的合并数据库557可作为下述数据库而构成,即,该数据库保存有使二个加工后数据库155中的特征数据之间建立联系的数据。

图6C示出已对图6B所示的加工后数据库155A和图6B所示的加工后数据库155B进行合并的情形下的合并数据库557的构成,其中,加工后数据库155A具备包含样本数、性别、年龄、购买P1,P2,…,购买Q1,Q2,…的参数的特征数据;加工后数据库155B具备包含样本数、性别、年龄、购买R1,R2,…,购买Q1,Q2,…的参数的特征数据。

根据该加工后数据库155A和155B,共同参数为性别、年龄、购买Q1,Q2,…。而购买P1,P2,…,购买Q1,Q2,…,购买R1,R2,…为例如JAN码与购买地点的每个组合的购买参数。例如,该购买参数表示与对应的组合有关的顾客的购买款额或有无购买。

例如,购买Pi(i为2以上的整数)可以是表示顾客在与购买P1不同的购买地点购买与购买P1相同JAN码的商品的款额或对与购买P1相同JAN码的商品有无购买的参数。购买Qj,Rj(j为1以上的整数)可以是表示顾客在与参数j相对应的购买地点购买与购买Pj不同JAN码的商品的款额或对与购买Pj不同JAN码的商品有无购买的参数。

在将这样构成的加工后数据库155A、155B进行合并而成的合并数据库557中,被彼此合并的加工后数据库155A的特征数据和加工后数据库155B的特征数据通过使它们的识别号建立关联而得以表现。即,在合并数据库557中,记载与加工后数据库155A的特征数据的识别号相关联的、与该特征数据合并的加工后数据库155B的特征数据的识别号。

如图6C所示,还可以包括使加工后数据库155B中的多个特征数据(B20056,B00234,B01123)相对于加工后数据库155A中的一个特征数据(A00001)建立关联的情形。

加工后数据库155中的各特征数据可以是与加工前的多个特征数据相对应的特征数据,并且可以是与加工前的特征数据相对应的、集群内的样本数彼此不同的特征数据。该情形下,可以认为各特征数据是存在与样本数相对应的量的各特征数据,将顾客特征最相似的特征数据以相同样本数份进行合并,再将剩余样本数份的特征数据与其次相似的特征数据以同一样本数份进行合并。

在图6C中,记载有A00001、B20056、5.3的记录表示,将加工后数据库155A中识别号A00001的特征数据和加工后数据库155B中识别号B20056的特征数据彼此合并样本数5.3份。同样地,接下来的记录表示,将加工后数据库155A中识别号A00001的特征数据和加工后数据库155B中识别号B00234的特征数据彼此合并样本数8.2份。再接下来的记录表示,将加工后数据库155A中识别号A00001的特征数据和加工后数据库155B中识别号B01123的特征数据彼此合并样本数6.5份。加工后数据库155A中识别号A00001的特征数据基于样本数20的集群而生成。将加工后数据库155A中识别号A00001的特征数据分配到加工后数据库155B中识别号B20056、识别号B00234、以及识别号B01123的特征数据中并进行合并。

通过如上构成的合并数据库557,使加工后数据库155之间彼此合并,合并数据库557以及加工后数据库155构成一个庞大的数据库。根据图6B以及图6C的示例,对不具备有关购买R1,R2,…信息的加工后数据库155A和不具备有关购买P1,P2,信息的加工后数据库155B进行合并,由此构建出结合了购买P1,P2,…,购买Q1,Q2,…,购买R1,R2,…信息的庞大的数据库。因此,能够分析例如对购买P1,P2,…进行购买的顾客对购买R1,R2显示出何种倾向。

图7是将JAN码与购买地点的每个组合的数据块横向排列、在纵向以每个虚拟顾客为单位对该数据块的排列进行设置的图。影线数据块表示对应的虚拟顾客在该购买地点购买了与该JAN码相对应的商品。非影线数据块表示对应的虚拟顾客未在该购买地点购买与该JAN码相对应的商品。

根据图7,在虚线所示的区域,集中存在有影线数据块。该集中显示出在区域内对于JAN码与购买地点的组合存在购买层。因此,若在该区域内对与非影线数据块相对应的顾客层进行对应商品的宣传,则能够发挥有价值的宣传效果。例如,粗线围起的虚拟顾客虽然几乎未发生与虚线所示区域相对应的购买行为,但是统计上仍符合购买层。因此,若对所对应的顾客层进行对应商品的宣传,则可期待发挥有价值的宣传效果。

若基于以往有关顾客的数据进行如上所述的数据分析,则有可能在分析过程中详细地确定出有关顾客隐私的信息。与此相对,根据本实施例,图6B以及图7所示的各行数据是与进行了统计处理的虚拟顾客有关的数据。根据本实施例,由于基于进行了统计处理的数据进行上述数据分析,因此能够抑制上述以往技术中存有的问题的产生,同时能够通过数据分析获取有利于商业活动的信息。

以上对本实施例的信息处理系统1进行了说明。根据本实施例,数据加工装置10对顾客相关数据库153进行加工,并将加工后数据库155提供给数据合并装置50。然后,数据合并装置50对由数据加工装置10生成的多个加工后数据库155之间进行合并。

数据加工装置10的运算部11基于加工前的顾客相关数据库153所具备的特征数据组,按照特征相似的多个特征数据为单位,使这些特征数据的集合集群化。并且运算部11对与各集群相对应的多个特征数据进行统计处理从而对其进行统合。由此生成与特征相似的多个顾客相对应的每个虚拟顾客的特征数据。特别是,运算部11(加工处理部115)对每个集群计算属于集群的多个特征数据所具有的各参数的统计量。每个虚拟顾客的特征数据生成为包含这些统计量作为参数值。运算部11(加工处理部115)生成具备这样统合多个特征数据而成的每个虚拟顾客的特征数据的数据库,作为加工后数据库155。

加工后数据库155中的每个特征数据包含在对加工后数据库155之间进行合并时供参照的参照数据。参照数据表示与作为合并对象的加工后数据库155共同种类的特征。上述实施例中的参照数据表示顾客的性别以及年龄,作为顾客的人口统计属性。

数据合并装置50的运算部51以将多个加工后数据库155之间参照数据所表示的特征相似的特征数据彼此合并的方式,对加工后数据库155之间进行合并。

即,根据该信息处理系统1,数据加工装置10对多个顾客的特征数据进行统计处理从而对其进行统合,并生成具备每个虚拟顾客的特征数据的加工后数据库155。例如,当统计处理前特征数据是表示一个顾客的特征的单一顾客的数据时,通过数据加工装置10的工作将特征数据从单一顾客的数据转换成混合有多个顾客的特征的虚拟顾客的数据。

因此,数据提供源可利用数据加工装置10将顾客相关数据库153转换成对顾客的个人信息进行了保护的加工后数据库155,可以在对个人信息进行保护的同时向数据合并装置50提供有关顾客的数据。

由此,数据合并装置50的管理者能够从以前出于信息保护的观点而消极地提供顾客相关数据库153的企业,以加工后数据库155的形式获取顾客相关数据库。数据合并装置50可以生成对数据提供源不同的各种有关顾客的数据进行合并而成的数据库。

作为结果,该信息处理系统1可以构建对分散在社会中的各种有关顾客的数据进行统合而成的数据库,作为合并数据库557。并且信息处理系统1可基于该数据库有效利用各种有关顾客的数据,并可进行有价值的数据分析。

上述实施例中加工后数据库155之间的共同参数(数据库合并时的参照数据)为顾客的性别以及年龄。不过,共同参数也可以包括其他参数。例如,作为顾客的人口统计属性,共同参数可以包括顾客的性别、年龄、职业、居住地区、收入、学历、以及家庭构成的至少一者。

[第二实施例]

第二实施例的信息处理系统1构成为,在数据合并装置50中使用具备单一来源数据(single-source data)的数据库作为中心数据库H(参照图8A)。信息处理系统1将由数据加工装置10提供的各加工后数据库155合并到该中心数据库H,从而经由中心数据库H对多个加工后数据库155之间进行合并。

本实施例的信息处理系统1的硬件构成与第一实施例相同。本实施例的信息处理系统1中,数据合并装置50的储存部55除了具有由数据加工装置10提供的加工后数据库155之外还具有中心数据库H,这一点与第一实施例不同。除这一点之外,本实施例的信息处理系统1中只有数据融合处理部510的处理动作与第一实施例不同。因此,以下适当地省略对与第一实施例相同的构成的说明。

构成中心数据库H的单一来源数据例如可以从由博报堂株式会社开展的生活者调查“HABIT(注册商标)”获取。HABIT通过采访面试或问卷形式,从该调查的每个协助者处,对与生活方式(生活意识或态度)、价值观以及品牌意识有关的各种信息,连同协助者的人口统计属性的信息一并进行收集。由HABIT生成的每个顾客(协助者)的单一来源数据表示未在购买数据等中出现的顾客特征。

作为可以设置在中心数据库H中的其他单一来源数据的示例,可以列举从ID-POS获取的包含顾客的购买数据的单一来源数据、或通过问卷形式获取的表示接触大众传媒情况的单一来源数据。附带地说,也可以在中心数据库H设置按照相同顾客的数据为单位对这些多种类的单一来源数据进行了合并而成的数据。

中心数据库H所具备的单一来源数据是与表示顾客特征的特征数据相符的数据,为了与加工后数据库155进行合并,中心数据库H所具备的单一来源数据具有表示共同顾客的人口统计属性的参数,作为与加工后数据库155之间的共同参数。

如图8A所示,数据融合处理部510通过将由数据加工装置10提供的各加工后数据库155合并到该中心数据库H,而经由中心数据库H对多个加工后数据库155之间进行合并。合并方法如上所述。即,数据融合处理部510以使共同参数所表示的特征相似的特征数据彼此合并的方式,使中心数据库H和每个加工后数据库155合并。

合并数据库557中,与上述实施例相同,例如使中心数据库H的特征数据和与其合并的各加工后数据库155的特征数据之间的关系通过使它们的识别号建立关联而得以表现。图8B所示的合并数据库557中记载了与中心数据库H的特征数据的识别号(H00001)相关联的、与该特征数据合并的加工后数据库155A、155B的特征数据的识别号(A12345,B00044)。图8B所示的样本数与图6C中的说明相同。

单一来源数据充分表示顾客的特征。因此,若以具备单一来源数据作为表示顾客特征的特征数据的中心数据库H为基准,对中心数据库H和每个加工后数据库155进行合并,则能够更恰当地对加工后数据库155之间的特征数据进行结合。

HABIT等单一来源数据中包含表示顾客特征的多种信息。当对由数据加工装置10提供的各加工后数据库155与具备这样单一来源数据的中心数据库H进行合并时,可变更用于合并的参照数据。即,能够根据加工后数据库155具有的表示顾客特征的参数的种类,变更在合并中心数据库H和加工后数据库155中利用的参照数据。

例如,当加工后数据库155具备含有表示顾客对网络内容的接触行为的参数的特征数据时,在中心数据库H与加工后数据库155之间,作为共同参数,除表示顾客的人口统计属性的参数之外,还包括表示顾客接触网络内容的行为的参数,或者作为共同参数,不包括表示顾客的人口统计属性的参数而包括表示顾客接触网络内容的行为的参数。

该情形下,可以以将共同参数所表示的顾客接触网络内容的行为相似的特征数据彼此合并的方式,对中心数据库H和加工后数据库155进行合并。

[第三实施例]

第三实施例的信息处理系统1具备多个数据加工装置10、以及数据合并装置50。使数据加工装置10以及数据合并装置50为与第一实施例以及第二实施例相同的硬件构成。以下对第三实施例的信息处理系统1中与第一实施例以及第二实施例相同的构成和处理内容省略说明。

本实施例的信息处理系统1具有图9A所示的顾客相关数据库1531L、1531R,作为顾客相关数据库153。在图9A左方区域示出顾客相关数据库1531L的一例,该顾客相关数据库1531L具有自POS系统获取的顾客的购买数据作为与顾客有关的特征数据。在图9A右方区域示出顾客相关数据库1531R的一例,该顾客相关数据库1531R具有表示顾客所利用的设备的利用情况的特征数据作为与顾客有关的特征数据。作为设备的一例而列举微波炉烤箱一体机。

根据图9A,顾客相关数据库1531L具备每项结算的特征数据。该特征数据具有表示顾客的性别、年龄、以及居住地的参数作为顾客的人口统计属性。该特征数据还具有表示顾客购买的商品的购买地点、商品编码、购买数量、以及单价的参数。商品编码包括例如JAN码。

根据图9A,顾客相关数据库1531R具备每个微波炉烤箱一体机的特征数据。该特征数据包括表示拥有微波炉烤箱一体机的顾客的性别以及年龄的参数、和表示波炉烤箱一体机的设置地点、微波炉烤箱一体机中各使用时间段的功能以及食谱的参数。

具有顾客相关数据库1531L的数据加工装置10构成为在该顾客相关数据库1531L中对例如性别、年龄以及购买经历相似的多个特征数据进行集群化。与第一实施例相同,该数据加工装置10构成为,以每个集群为单位,对属于同一集群的多个特征数据进行统计处理,由此对每个集群生成将属于同一集群的多个特征数据进行统合而成的虚拟顾客的特征数据。

这样,数据加工装置10生成与顾客相关数据库1531L相对应的、具备每个虚拟顾客的特征数据的加工后数据库155。与顾客相关数据库1531L相对应的加工后数据库155所包含的特征数据具有与顾客相关数据库1531L的特征数据基本上相同的参数。不过,加工后数据库155的特征数据示出对应集群的统计量作为参数值。并且可在加工时删除顾客ID。

作为另一例,数据加工装置10可构成为,按照显示相同顾客ID的特征数据为单位,对顾客相关数据库1531L所具有的结算单位的特征数据进行汇集,从而将其转换成个人单位的特征数据。数据加工装置10可进一步构成为,基于个人单位的特征数据的集合,对购买经历相似的多个特征数据进行集群化以及统计处理,由此生成与顾客相关数据库1531L相对应的加工后数据库155。

具有顾客相关数据库1531R的其他数据加工装置10构成为,对在顾客相关数据库1531R中例如性别、年龄、和功能以及食谱的利用情况相似的多个特征数据进行集群化。数据加工装置10进一步构成为,以每个集群为单位,对属于同一集群的多个特征数据进行统计处理,由此对每个集群生成将属于同一集群的多个特征数据进行统合而成的虚拟设备的特征数据。这样,数据加工装置10生成与顾客相关数据库1531R相对应的、具备每个虚拟设备的特征数据的加工后数据库155。

数据合并装置50构成为,对与上述顾客相关数据库1531L相对应的加工后数据库155、和与顾客相关数据库1531R相对应的加工后数据库155进行合并,从而生成合并数据库557。

数据合并装置50可以利用加工后数据库155共同具有的表示顾客的性别以及年龄的参数、以及利用有关食材的参数作为参照数据,以将作为合并对象的加工后数据库155之间参照数据所表示的特征相似的特征数据彼此合并的方式,对作为合并对象的加工后数据库155之间进行合并。

“有关食材的参数”在与顾客相关数据库1531L相对应的加工后数据库155中,对应于特征数据所具有的表示商品编码以及购买数量的参数。在与顾客相关数据库1531R相对应的加工后数据库155中,“有关食材的参数”对应使用食谱。

根据这样生成的合并数据库557,能够对性别、年龄、购买食材、以及食谱之间的对应关系进行分析。因此,能够通过微波炉烤箱一体机向用户介绍对应于用户经常购买的食材的推荐食谱。此外,还可以在从POS收银机输出的收据附上与利用频率高的食谱相对应的食材的优惠券。

以上,作为第三实施例说明了以特征相似的特征数据为单位对顾客相关数据库1531L、1531R这两者进行集群化并进行统计处理的示例。不过,也可以对顾客相关数据库1531L、1531L的一方不进行统计处理。

即,合并数据库557既可以通过对顾客相关数据库1531L的加工后数据库155和顾客相关数据库1531R进行合并而生成,又可以通过对顾客相关数据库1531L与顾客相关数据库1531R的加工后数据库155进行合并而生成。前者的合并数据库557可提供给例如顾客相关数据库1531R的数据提供源。后者的合并数据库557可提供给例如顾客相关数据库1531L的数据提供源。

[第四实施例]

与第三实施例相同,第四实施例的信息处理系统1为基本上只有顾客相关数据库153的构成与第一实施例以及第二实施例不同的系统。本实施例的信息处理系统1所具备的数据加工装置10以及数据合并装置50为与第一实施例以及第二实施例相同的硬件构成。

以下对第四实施例的信息处理系统1中与第一实施例以及第二实施例相同的构成和处理内容省略说明。接下来要说明的第五~第八实施例的信息处理系统1的硬件构成以及处理内容也基本上与第一实施例以及第二实施例相同。

本实施例的信息处理系统1具有如图9B所示的顾客相关数据库1532L、1532R,作为顾客相关数据库153。图9B左方区域示出顾客相关数据库1532L的一例,该顾客相关数据库1532L具有从POS系统获取的顾客的购买数据作为有关顾客的特征数据。图9B右方区域示出顾客相关数据库1532R的一例,该顾客相关数据库1532R具有表示自动售货机利用情况的特征数据作为有关顾客的特征数据。

近年己知有具备液晶显示器以及摄像机的饮料用自动售货机。该自动售货机具备以下功能,即,根据摄像机的拍摄图像来辨别自动售货机使用者的性别以及年龄,并基于该辨别结果,通过液晶显示器显示推荐的饮料。以下说明的合并数据库557有助于对在自动售货机上显示的推荐饮料进行确定。

根据图9B,顾客相关数据库1532L构成为与第三实施例的顾客相关数据库1531L相同。该顾客相关数据库1532L具备表示与饮料有关的购买经历的特征数据。

根据图9B,顾客相关数据库1532R具备各自动售货机中的每个饮料销售的特征数据。构成该顾客相关数据库1532R的特征数据表示自动售货机的设置地点以及制造商。该特征数据还表示饮料销售时的天气以及时间、和作为购买者人口统计属性的性别以及年龄。该特征数据进一步还对购买者所购买的饮料的商品编码、购买数量、以及单价进行表示。除此之外,特征数据还表示销售时的库存信息。自动售货机的设置地点例如通过设置有自动售货机的地点的经度纬度来表示。

具有顾客相关数据库1532L的数据加工装置10构成为,例如对顾客相关数据库1532L中的性别、年龄以及购买经历相似的多个特征数据进行集群化,从而与第三实施例相同,生成与顾客相关数据库1532L相对应的加工后数据库155。

具有顾客相关数据库1532R的数据加工装置10例如对顾客相关数据库1532R中的设置地点、制造商以及库存信息等相似的多个特征数据进行集群化。并且数据加工装置10构成为,以每个集群为单位,对属于同一集群的多个特征数据进行统计处理,由此对每个集群生成将属于同一集群的多个特征数据进行统合而成的虚拟设备(自动售货机)的特征数据。

这样,数据加工装置10构成为,生成与顾客相关数据库1532R相对应的、具备每个虚拟设备的特征数据的加工后数据库155。

数据合并装置50构成为,对与上述顾客相关数据库1532L相对应的加工后数据库155、和与顾客相关数据库1532R相对应的加工后数据库155进行合并,从而生成合并数据库557。

例如,数据合并装置50利用表示顾客的性别以及年龄的参数并利用有关地点的参数作为参照数据,以将作为合并对象的加工后数据库155之间参照数据所表示的特征相似的特征数据彼此合并的方式,对作为合并对象的加工后数据库155之间进行合并。

在此所述的“有关地点的参数”在与顾客相关数据库1532L相对应的加工后数据库155中,对应于特征数据所具有的表示购买地点的参数。在与顾客相关数据库1532R相对应的加工后数据库155中,“有关地点的参数”对应于表示自动售货机设置地点的参数。

根据这样生成的合并数据库557,例如能够对消费者于便利商店或超级市场等商店的购买行为与消费者于自动售货机的购买行为之间的对应关系进行分析。因此,基于该合并数据库557,自动售货机能够向站立于自动售货机前的使用者推荐与该使用者的年龄以及性别相对应的购买层在同一地区的商店经常购买的饮料。并且商店能够在从POS收银机输出的收据附上与购买者的年龄以及性别相对应的在同一地区的自动售货机中的畅销饮料的优惠券。

与第三实施例相同,可以对顾客相关数据库1532L以及顾客相关数据库1532R的一方不进行统计处理。即,合并数据库557既可以是对顾客相关数据库1532L的加工后数据库155和顾客相关数据库1532R进行合并而成的数据库,又可以是对顾客相关数据库1532L和顾客相关数据库1532R的加工后数据库155进行合并而成的数据库。对后述的第五~第八实施例也可适用该技术思想。

[第五实施例]

以下对第五实施例的信息处理系统1中与第一实施例以及第二实施例相同的构成和处理内容省略说明。本实施例的信息处理系统1具有图10A所示的顾客相关数据库1533L、1533R作为顾客相关数据库153。

在图10A左方区域示出顾客相关数据库1533L的一例,该顾客相关数据库1533L具有表示拥有智能电话所代表的便携式终端的用户特征的特征数据,作为有关顾客的特征数据。在图10A右方区域示出顾客相关数据库1533R的一例,该顾客相关数据库1533R具有表示车站利用情况的特征数据作为有关顾客的特征数据。

根据图10A,顾客相关数据库1533L以每个便携式终端为单位而具有特征数据。作为拥有便携式终端的用户的人口统计属性,该特征数据对性别、年龄以及居住地进行表示。并且该特征数据还对用户的移动经历、以及各移动地点的天气进行表示。而且该特征数据还通过安装在便携式终端的应用程序对用户所利用的优惠券的利用情况进行表示。

顾客相关数据库1533R以车站、检票口、天气、以及时间段的每个组合为单位而具有特征数据。作为对应的车站以及检票口的通行数据,构成该顾客相关数据库1533R的特征数据对该检票口的行人的性别以及年龄、并且对通行时间段和通行时的天气进行表示。行人的性别以及年龄可通过定期车票信息获取,或通过由摄像机拍摄的图像获取。

具有顾客相关数据库1533L的数据加工装置10例如对顾客相关数据库1533L中性别、年龄、移动情况以及优惠券使用情况相似的多个特征数据进行集群化。然后,以每个集群为单位,对属于同一集群的多个特征数据进行统计处理,由此对每个集群生成将属于同一集群的多个特征数据进行统合而成的虚拟便携式终端的特征数据。这样,数据加工装置10生成与顾客相关数据库1533L相对应的、具备每个虚拟便携式终端的特征数据的加工后数据库155。

具有顾客相关数据库1533R的数据加工装置10对顾客相关数据库1533R中特征相似的特征数据进行集群化。然后,以集群为单位进行上述统计处理,由此生成加工后数据库155,该加工后数据库155具备与车站、检票口、天气以及时间段的组合有关的每个虚拟组合的特征数据。

数据合并装置50构成为对上述与顾客相关数据库1533L相对应的加工后数据库155、和与顾客相关数据库1533R相对应的加工后数据库155进行合并,从而生成合并数据库557。

例如,数据合并装置50利用加工后数据库155共同具有的表示性别以及年龄的参数以及有关地点和天气的参数作为参照数据,以将作为合并对象的加工后数据库155之间参照数据所表示的特征相似的特征数据彼此合并的方式,对作为合并对象的加工后数据库155之间进行合并。

根据这样生成的合并数据库557,例如可以对在车站附近的消费者行为以及优惠券的使用情况、和车站以及检票口的行人的倾向之间的对应关系进行分析。因此,基于该合并数据库557,可以恰当地向从检票口通过的用户的便携式终端传送以促进对车站附近的商店的利用为目的的优惠券。

[第六实施例]

以下对第六实施例的信息处理系统1中与第一实施例以及第二实施例相同的构成和处理内容省略说明。本实施例的信息处理系统1具有图10B所示的顾客相关数据库1534L、1534R作为顾客相关数据库153。

在图10B左方区域示出顾客相关数据库1534L的一例,该顾客相关数据库1534L具有拥有ETC卡的顾客的特征数据。ETC卡是在日本推广的收费公路网的电子收费(ETC)系统用信用卡。在图10B右方区域示出顾客相关数据库1534R的一例,该顾客相关数据库1534R具有出入口与收费站的每个组合的特征数据作为有关顾客的特征数据。

顾客相关数据库1534L以每张ETC卡为单位而具有特征数据。该特征数据表示与ETC卡相关联的车载装置的ID。此外,该特征数据还表示拥有ETC卡的顾客的性别、年龄以及居住地。并且该特征数据还表示收费站的ID以及通行日期时间。

构成顾客相关数据库1534R的特征数据表示从对应出入口的对应收费站通行的车辆的ETC卡号、车载装置ID、以及通行日期时间。并且该特征数据还包括通行车辆的数量以及附近设施的信息。

具有顾客相关数据库1534L的数据加工装置10例如对顾客相关数据库1534L中性别、年龄以及移动情况相似的多个特征数据进行集群化。然后,以每个集群为单位,对属于同一集群的多个特征数据进行统计处理,由此对每个集群生成将属于同一集群的多个特征数据进行统合而成的每个虚拟顾客(卡)的特征数据。这样,数据加工装置10生成与顾客相关数据库1534L相对应的、具备每个虚拟顾客(卡)的特征数据的加工后数据库155。

具有顾客相关数据库1534R的数据加工装置10对顾客相关数据库1534R中特征相似的特征数据进行集群化。然后,以每个集群为单位进行上述统计处理,由此生成具备每个虚拟收费站的特征数据的加工后数据库155。

数据合并装置50构成为,对该与顾客相关数据库1534L相对应的加工后数据库155、和与顾客相关数据库1534R相对应的加工后数据库155进行合并,从而生成合并数据库557。

若基于这样生成的合并数据库557,则可经由车辆导航装置等车载装置或信用卡公司,恰当地向顾客传送以促进对收费站附近设施的利用为目的的优惠券。

[第七实施例]

以下对第七实施例的信息处理系统1中与第一实施例以及第二实施例相同的构成和处理内容省略说明。本实施例的信息处理系统1具有图11A所示的顾客相关数据库1535L、1535R作为顾客相关数据库153。

在图11A左方区域示出顾客相关数据库1535L的一例,该顾客相关数据库1535L以每个数字标牌为单位而具有从数字标牌前通过的每个行人的特征数据,作为有关顾客的特征数据。在图11A右方区域示出顾客相关数据库1535R的一例,该顾客相关数据库1535R以各个车站的每个检票口为单位而具有从检票口通行的每个行人的特征数据,作为有关顾客的特征数据。

根据图11A,顾客相关数据库1535L所具有的特征数据表示数字标牌的设置地点。此外,该特征数据还表示行人的性别、年龄以及通行日期时间。行人的性别以及年龄可以根据由设置在数字标牌或设置在其附近的摄像机拍摄的图像进行辨别。并且该特征数据还可以是表示数字标牌附近各时间段的行人数、各时间段的数字标牌的观看者人数、以及各时间段的登出信息的数据。

顾客相关数据库1535R所具有的每个行人的特征数据表示行人的性别、年龄以及通行日期时间,并表示通行检票口ID和具有该检票口的车站的ID。

具有顾客相关数据库1535L的数据加工装置10例如对顾客相关数据库1535L中行人特征相似的特征数据进行集群化。然后,以每个集群为单位,对属于同一集群的多个特征数据进行统计处理,由此对每个集群生成将属于同一集群的多个特征数据进行统合而成的虚拟行人的特征数据。这样,数据加工装置10生成与顾客相关数据库1535L相对应的、具备每个虚拟行人的特征数据的加工后数据库155。

具有顾客相关数据库1535R的数据加工装置10例如对顾客相关数据库1535R中行人特征相似的特征数据进行集群化。然后以每个集群为单位进行上述统计处理,由此生成具备每个虚拟行人的特征数据的加工后数据库155。

数据合并装置50构成为,对与顾客相关数据库1535L相对应的加工后数据库155、和与顾客相关数据库1535R相对应的加工后数据库155进行合并,从而生成合并数据库557。

例如,数据合并装置50利用加工后数据库155共同具有的表示行人的性别以及年龄的参数、并利用有关地点的参数作为参照数据,以将作为合并对象的加工后数据库155之间参照数据所表示的特征相似的特征数据彼此合并的方式,对作为合并对象的加工后数据库155之间进行合并。

“有关地点的参数”在与顾客相关数据库1535L相对应的加工后数据155中,对应于特征数据所具有的表示数字标牌设置地点的参数。在与顾客相关数据库1535R相对应的加工后数据库155中,“有关地点的参数”对应于表示车站以及检票口的参数。

若根据这样生成的合并数据库557,例如能够对检票口的行人与数字标牌前的行人之间的对应关系进行分析。从而能够配合检票口行人的变化而适当地切换在数字标牌上显示的广告。

[第八实施例]

以下对第八实施例的信息处理系统1中与第一实施例以及第二实施例相同的构成和处理内容省略说明。本实施例的信息处理系统1具有图11B所示的顾客相关数据库1536L、1536R作为顾客相关数据库153。

在图11B左方区域示出顾客相关数据库1536L的一例,该顾客相关数据库1536L具有通过摄像机拍摄到的监视区域内的每个行人的特征数据,作为有关顾客的特征数据。图11B右方区域示出顾客相关数据库1536R的一例,该顾客相关数据库1536R具有表示饮料用自动售货机的利用情况的特征数据,作为有关顾客的特征数据。

根据图11B,顾客相关数据库1536L所具有的特征数据表示行人被拍摄到的地点(监视区域)以及时间段。此外,该特征数据还表示行人的性别以及年龄。并且特征数据还可以是表示行人的停留时间或通行时间的数据。

顾客相关数据库1536R具备各自动售货机中每个饮料销售的特征数据。构成该顾客相关数据库1536R的特征数据构成为与第四实施例的顾客相关数据库1532R所具有的特征数据相同。

具有顾客相关数据库1536L的数据加工装置10对顾客相关数据库1536L中行人特征相似的特征数据进行集群化。然后,以每个集群为单位,对属于同一集群的多个特征数据进行统计处理,由此对每个集群生成将属于同一集群的多个特征数据进行统合而成的虚拟行人的特征数据。这样,数据加工装置10生成与顾客相关数据库1536L相对应的、具备每个虚拟行人的特征数据的加工后数据库155。

具有顾客相关数据库1536R的数据加工装置10按照顾客相关数据库1536R中购买者的特征相似的特征数据为单位而进行集群化,从而生成具备每个虚拟购买者的特征数据的加工后数据库155。

数据合并装置50构成为,对与顾客相关数据库1536L相对应的加工后数据库155、和与顾客相关数据库1536R相对应的加工后数据库155进行合并,从而生成合并数据库557。

例如,数据合并装置50利用该加工后数据库155共同具有的表示性别以及年龄的参数、并利用有关地点的参数作为参照数据,以将作为合并对象的加工后数据库155之间参照数据所表示特征相似的特征数据彼此合并的方式,对作为合并对象的加工后数据库155之间进行合并。“有关地点的参数”在与顾客相关数据库1536L相对应的加工后数据库155中,对应于特征数据所具有的表示行人被拍摄到的地点的参数。在与顾客相关数据库1536R相对应的加工后数据库155中,“有关地点的参数”对应于表示自动售货机的设置地点的参数。

若根据这样生成的合并数据库557,则能够例如对行人的分布以及停留时间、和自动售货机的购买行为之间的对应关系进行分析。该分析结果可有助于自动售货机的库存管理、备货品种、以及产品推荐显示。

[其他]

本公开不限于上述实施例,能够采用各种方式。例如,上述实施例中对作为合并对象的数据库(加工后数据库155或顾客相关数据库153)之间顾客组不一致的示例进行了说明。不过本公开的技术也可以用于对表示与相同顾客组有关的不同种类的特征的数据库之间进行合并。例如,本公开的技术可以用于对相同顾客组在便利商店的购买数据、和在超级市场的购买数据进行合并。由记载在权利要求书中的语句确定的技术思想所包含的各种形态均为本公开的实施方式。

最后对用语之间的对应关系进行说明。数据加工装置10所具备的运算部11(特别是聚类处理部110以及加工处理部115)对应于生成单元的一例。数据合并装置50所具备的运算部51(特别是数据融合处理部510)对应于合并单元的一例。数据合并装置50所具备的储存部55对应于储存单元的一例。构成数据库(顾客相关数据库153/加工后数据库155)的特征数据的集合、或与该集合相对应的人、物(例如便携式终端/自动售货机/微波炉烤箱一体机/卡)、或者地点(例如检票口/收费站)的集合对应于组的一例。该集合的元素对应于结构体的一例。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1