用于限定人口统计市场的大小的方法和系统与流程

文档序号:14650277发布日期:2018-06-08 21:38阅读:262来源:国知局
用于限定人口统计市场的大小的方法和系统与流程

本申请要求2015年9月1日提交的序列号为62/212,648的美国专利申请的优先权,并享受其申请日的权益,其整体通过引用结合于本文中。

技术领域

本公开涉及用于限定人口统计市场的大小,具体而言,本发明涉及针对利用多个数据源识别的多个人口统计市场区段基于累计的交易数据来识别和预测市场花费。



背景技术:

诸如商户、零售商、制造商、广告商等商业实体经常对收集关于消费者的有用数据感兴趣,以便促进销售。可收集的数据经常可对实体有用,诸如用于发掘新的广告宣传活动、寻找目标理想消费者、创建焦点小组等。在许多情况下,涉及人口统计的数据可经常受实体欢迎,原因在于该数据可提供关于购买物品或服务的消费者的深刻认识,从而提供可对交叉销售、广告等有用的信息。

当与其他数据(诸如与商户、行业、地理位置等关联的交易数据)组合时,人口统计数据甚至可以更有价值。用于组合从人口跟踪机构收集的人口统计数据和交易数据的方法在以下文献中得到更详细的描述:Curtis Villars的序号为2013/0024274,题为“Method and System for Measuring Advertising Effectiveness Using Microsegments”的美国专利公布;Curtis Villars的序号为2015/0347624,题为“Systems and methods for Linking and Analyzing Data From Disparate Data Sets”的美国专利公布;Curtis Villars等人的序号为2013/0024242,题为“Protecting Privacy in Audience Creation”的美国专利公布;Curtis Villars等人的序号为2014/0180767,题为“Method and System for Assigning Spending Behaviors to Geographic Areas”的美国专利公布,其通过引用作为整体结合于本文中。在一些情况下,此类数据可能不足以提供对位于具体地理区域的人口统计的精确评估或者不足以识别某地理区域中的市场条件。

因而,需要一种技术解决方案,用于收集附加数据并将其配对,以便识别精确的人口统计市场区段,其可以阻止对个人可识别信息的使用,但仍然足够精细以有用于识别和预测市场花费的方式进行识别和大小限定。



技术实现要素:

本公开描述了用于利用相关联花费数据来生成人口统计市场区段的系统和方法。从包括政府机构数据的多个数据源收集与人口统计资料和地理位置相关的数据,并与交易数据组合,以便识别具有适当大小的人口统计市场区段,并带有市场花费。此类数据可对于多个不同产品有用,其在某些实施例中包括针对特定商户行业、地理区域和/或人口统计区段预测将来的市场花费。

用于利用关联的花费数据来生成人口统计市场区段的方法包括:在处理服务器的交易数据库中存储多个交易数据条目,其中每个交易数据条目是与支付交易相关的结构化数据集,至少包括地理位置、商户标识符、交易金额以及交易时间和/或日期;由处理服务器的接收设备接收来自一个或多个政府机构的普查数据,其中普查数据包括与至少商户和地理位置对应关系相关的数据;由处理服务器的接收设备从一个或多个第三方数据源接收人口统计数据,其中人口统计数据至少包括多个个体的至少年龄、性别、收入、子女状况以及地理位置数据;由处理服务器的数据识别模块至少基于普查数据和人口统计数据来识别多个人口统计市场区段,其中每个人口统计市场区段包括具有共同年龄、性别、年龄、性别、收入、子女状况以及地理位置数据的个体的子集,并且包括至少预定数量的个体;以及由处理服务器的数据识别件至少基于普查数据中所包括的商户和地理位置的对应关系和多个交易数据条目子集的组合来识别多个人口统计市场区段中每个人口统计市场区段的市场花费,其中所包括的地理位置对应于与相应的人口统计市场区段相关联的共同地理位置数据。

用于利用关联的花费数据来生成人口统计市场区段的系统包括:处理服务器的交易数据库,其配置成存储多个交易数据条目,其中每个交易数据条目是与支付交易相关的结构化数据集,包括至少地理位置、商户标识符、交易金额以及交易时间和/或日期;处理服务器的接收设备,其配置成从一个或多个政府机构接收普查数据,其中普查数据包括与至少与商户和地理位置对应关系相关的数据,以及从一个或多个第三方数据源接收人口统计数据,其中人口统计数据至少包括多个个体的年龄、性别、收入、子女状况以及地理位置数据;以及处理服务器的数据识别模块,其配置成至少基于普查数据和人口统计数据来识别多个人口统计市场区段,其中每个人口统计市场区段包括具有共同年龄、性别、年龄、性别、收入、子女状况以及地理位置数据的个体的子集,并且包括至少预定数量的个体;以及至少基于普查数据中所包括的商户和地理位置的对应关系以及多个交易数据条目的子集的组合来识别多个人口统计市场区段中每个人口统计市场区段的市场花费,其中所包括的地理位置对应于与相应的人口统计市场区段相关联的共同地理位置数据。

附图说明

当结合附图阅读时,从以下对示例性实施例的详细描述中最佳地理解本公开的范围。包括在附图中的是以下附图:

图1是示出根据示例性实施例用于识别人口统计市场区段以及与其关联的市场花费的高级体系系统架构的框图;

图2是示出图1的根据示例性实施例用于识别人口统计市场区段以及关联的市场花费的系统的处理服务器的框图;

图3是示出根据示例性实施例组合来自多个数据源的数据以用于识别人口统计市场区段以及关联的市场花费的框图;

图4是示出根据示例性实施例用于针对人口统计市场区段预测市场花费的过程的流程图;

图5是示出根据示例性实施例用于利用生成带有关联的花费数据的人口统计市场区段的示范方法的流程图;

图6是示出根据示例性实施例的计算机系统架构的框图。

从下文提供的详细描述中,将明显看出本公开的进一步适用范围。应该理解的是,示例性实施例的详细描述仅用于说明目的,并且因此,不一定要限制公开的范围。

具体实施方式

术语表

支付网络–一种系统或网络,用于在给定周期期间通过使用现金替代物为数千、数百万甚至数十亿笔交易进行资金转移。支付网络可以使用多种不同的协议和程序,以便针对不同类型的交易处理资金转移。可以通过支付网络执行的交易可包括产品或服务的购买、信用购买、借记交易、资金调拨、账户取款等。支付网络可以配置成通过现金替代物执行交易,其可能包括支付卡、信用证、支票、交易账户等。配置成作为支付网络来执行的网络或系统的例子包括由等运营的那些。在这里使用术语“支付网络”可能指的是作为实体的支付网络以及物理支付网络两者,物理支付网络诸如是设备、硬件以及包括支付网络的软件。

支付交易–两个实体之间的交易,其中钱或其他财务利益从一个实体交换到另一实体。支付交易可能是资金调拨,用于购买商品或服务,用于偿还债务,或用于本领域技术人员显而易见的任何其他财务利益交换。在一些情况下,支付交易可能指的是通过支付卡和/或支付账户提供资金的交易,诸如信用卡交易。此类支付交易可以通过发行方、支付网络和收单方来处理。处理此类支付交易的过程可能包括授权、批处理、清算、结算和提供资金中的至少一个。授权可包括由消费者向商户提供支付细节,从商户向他们的收单方提交交易细节(例如,包括支付细节),并向消费者用于向交易提供资金的支付账户的发行方验证支付细节。批处理可指的是将已授权交易与其他已授权交易成批存储以分配给收单方。清算可包括将成批交易从收单方发送给支付网络进行处理。结算可包括由支付网络对发行方借记涉及发行方的受益者的交易。在一些情况下,发行方可通过支付网络向收单方支付。在其他情况下,发行方可以直接向收单方支付。提供资金可包括针对已被清算和结算的支付交易从收单方向商户支付。本领域人员显而易见的是,作为支付交易处理的部分来执行的上述步骤的顺序和/或分类。

支付轨迹–与支付网络关联的基础设施,其用于处理支付交易以及在支付网络和与支付网络互连的其他实体之间传递交易消息和其他类似数据,该支付网络在给定周期期间处置数千、数百万甚至数十亿笔交易。支付轨迹可以包括用于建立支付网络及支付网络与其他关联实体之间的互连的硬件,关联实体诸如是金融机构、网关处理器等。在一些情况下,支付轨迹也可受到软件影响,诸如通过通信硬件以及包括支付轨迹的设备的专门编程。例如,支付轨迹可包括专门配置的计算设备,其专门配置成发送交易消息,交易消息可是专门格式的数据消息,通过支付轨迹以电子方式传送,如下面更详细地讨论的那样。

个人可识别信息(PII)–PII可包括可以单独或与其他源结合使用来唯一地标识单个个体的信息。可被视为个人可识别的信息可以由第三方来定义,诸如政府机构(例如,美国联邦贸易委员会、欧盟委员会等)、非政府组织(例如,电子前沿基金会)、行业惯例、消费者(例如,通过消费者调查、合同等),成文法律、条例或法规等。可使用本领域技术人员显而易见的用于将可能使个人可识别的信息修饰为匿名的系统和方法,例如桶分化(bucketing)。桶分化可包括将否则个人可识别的信息(例如年龄、收入等)聚集到桶中(例如分组),以便将该信息修饰为并非个人可识别。例如,年龄26岁、收入为65000美元的消费者,如不经桶分化,其在具体环境中可能是该消费者独有的,这可通过年龄21-30岁的年龄桶和收入50000美元至74999美元的收入桶表示,这可表示很大一部分附加消费者,并且因此,对于该消费者不再是个人可识别的。在其他实施例中,可以使用加密。例如,个人可识别信息(例如,帐号)可以加密(例如,使用单向加密),使得处理服务器102可不具备PII或不能够解密已加密的PII。

用于生成人口统计市场区段并限定其大小的系统

图1示出用于生成人口统计市场区段并对限定其大小以及识别与之关联的市场花费的系统100,其中包括针对人口统计市场区段重新分配交易账户花费和净消费量以及其未来市场花费的预测。

系统100可包括处理服务器102。下面更详细地讨论的处理服务器102可以配置成基于从多个不同数据源接收的数据生成人口统计市场区段,其中每个人口统计市场区段可以由处理服务器102限定大小,以便保护与之关联的个体的个人可识别信息。如下文更详细地讨论的,处理服务器102可以配置成至少基于普查数据、人口统计数据和交易数据来识别人口统计市场区段。

普查数据可由处理服务器102从一个或多个政府机构104接收。处理服务器102可以配置成使用任何适当的通信网络和方法从政府机构104接收普查数据,从而使政府机构可使用通信网络以电子方式将数据信号传送给处理服务器102,数据信号叠加有或以其他方式编码有普查数据。政府机构104可以包括例如普查局、商务部、劳工部、劳工统计局等。普查数据可以包括与政府机构104关联的、可提供给处理服务器102的任何数据,其中可至少包括与商户和地理位置对应关系相关的数据。此类数据可包括,例如,一般商户或特定类型和/或行业商户的地理分布、以地理位置分的在商户(例如,或特定类型和/或行业的商户)处的总花费等。在某些实施例中,普查数据还可以包括经济市场数据,这可与以商户、地理位置、人口统计特征等分的市场花费相关。

在一些情况下,普查数据可包括与多个消费者106关联的人口统计数据。此类人口统计数据可包括作为由政府机构104执行的普查的一部分来收集的人口统计特征。人口统计特征可包括性别、年龄、收入、子女状况、职业、教育、家庭状况、婚姻状况、居住状况、邮编、邮政编码、区号、市、地理位置等,在一些情况下,可将人口统计特征桶分化或以其他方式遮蔽。例如,年龄可桶分化为多个年龄(例如,18-25、26-33等),或人口统计特征值可由具有处理服务器102所未知的关联值的变量替换,以保护PII,诸如年龄桶由字母A到F表示,其中对应的年龄范围对处理服务器102而言是不提供的。

人口统计数据可由处理服务器102从一个或多个人口跟踪机构108接收。人口跟踪机构108可被配置成使用适当的方法从多个消费者106收集人口统计数据。人口跟踪机构108可收集消费者106的多个人口统计特征,其至少包括消费者106的年龄、收入、子女状况以及地理位置数据。在一些情况下,可如上面所讨论的那样将人口统计特征桶分化或以其他方式遮蔽。人口跟踪机构108可使用适当的通信网络和方法以电子方式将人口统计数据传送到处理服务器102,其中人口统计数据可以被叠加或以其它方式编码在由此以电子信号传送的数据信号中。

交易数据可以由处理服务器102从一个或多个支付网络110接收,其中支付网络110被配置成使用与之相关联的适当方法处理支付交易。处理服务器102可以接收来自支付网络110的交易数据,该交易数据可以包括在由支付网络110作为支付交易的处理的一部分接收和/或生成的交易消息中,或从中解析。交易消息可以是按照管理金融交易消息交换的一个或多个标准(诸如国际标准化组织ISO 8583或20022标准)来格式化的专门格式数据消息。在一些情况下,处理服务器102可以是支付网络110的一部分,并且可以通过内部通信方法接收交易数据,诸如在处理相关支付交易期间。在其他情况下,处理服务器102可以使用适当的通信网络和方法接收交易数据,该通信网络和方法可以包括与支付网络110相关联的支付轨迹。

交易数据可以包括与支付网络110所处理的支付交易相关并涉及多个消费者106的数据。每个支付交易的交易数据可以至少包括地理位置、商户标识符、交易金额和交易时间和/或日期。在一些情况下,交易数据也可能包括以下中的一个或多个:货币类型、商户名称、商户类别码、发行方标识符、收单方标识符、产品数据、要约数据、奖励数据、忠诚度数据、商户数据、消费者数据、发行方数据、收单方数据等。交易数据可以由处理服务器102接收并存储在包括在其中的数据库中,如下面更详细地讨论的那样。

处理服务器102可以被配置成至少基于普查数据和人口统计数据来识别人口统计市场区段。每个人口统计市场区段可以与地理区域有关,本文称之为“区段”,其中每个人口统计市场区段可能与和相关的地理区域关联的,具有共同的年龄、性别、收入和子女状况以及其他人口统计特征(如适用)的多个消费者106的子集关联。因此,一个区段可能有与其关联的,针对与对应地理区域相关联并且具有共同人口统计特征的多个消费者106群组的多个人口统计市场区段。

在示例性实施例中,处理服务器102可以被配置成限定人口统计市场区段的大小,使得相应区段至少包括预定数量的消费者106,使得人口统计市场区段和与其关联的数据对任何消费者106而言都不是个人可识别的。例如,预定数量可以是100,其中处理服务器102可以限定用作区段的地理区域的大小,使得没有人口统计市场区段包括少于100个消费者106。在一些情况下,可将每个人口统计市场区段生成为包括同样数量的消费者106,其中地理区域的大小可能相应变化(例如,在密集的城市区域具有小得多的大小,而在稀疏的农村地区具有大得多的大小)。在其他情况下,可将每个人口统计市场区段生成为具有相同的地理大小,其中与之关联的消费者106的数量可能相应变化。

在某些实施例中,人口统计市场区段可进一步基于交易数据。例如,人口统计市场区段可基于关联地理区域中支付交易的频率,正如基于包括在交易数据中的地理位置来限定大小,其中每个区段可具有的地理区域使得每个人口统计市场区段包括相同或相似的支付交易频率。在其他情况下,可以基于关联地理区域中支付交易的累计交易金额来限定人口统计市场区段的大小。

一旦生成人口统计市场区段并限定其大小,处理服务器102就可至少基于交易数据和普查数据来识别多个人口统计市场区段中每一个人口统计市场区段的市场花费。在一些情况下,处理服务器102可基于交易数据来识别一个区段的总体市场花费,然后可基于普查数据和/或人口统计数据,例如基于地理区域中的人口分布,将该总体市场花费归于与该区段相关联的不同人口统计市场区段。例如,在一个地理区域中的花费可能是100000美元一年(例如,基于来自普查数据的经济市场数据和/或交易数据),该地理区域有三个不同的人口统计市场区段,其中人口和/或普查数据显示,该区域中60%的消费者在第一人口统计市场区段(例如,基于共同的人口统计特征)。在此类情况下,处理服务器102因此可以将该地理区域一年60000美元的花费归因于那个人口统计场区段,作为其市场花费。在一些情况下,可能通过一个或多个标(诸如商户行业或其他描述)分解市场花费。

在某些实施例中,处理服务器102可以被配置成预测某一区段或特定人口统计市场区段的未来花费。在此类实施例中,处理服务器102可以将人口统计市场区段(例如,或整个区段,如适用)中的市场花费分解到时间序列中,其中一个人口统计市场区段的时间序列可使该区段的市场花费分成一年中的每月或其他时间周期,其中时间周期可以基于所请求的预测(例如,预测年度花费可使用年时间周期,而预测月花费可使用月时间周期等)。处理服务器102可识别人口统计市场区段在时间序列中每一条目的市场花费,并且然后可据此预测该人口统计市场区段中的未来市场花费。

在一个实施例中,可以使用季节性时间序列模型(诸如Holt-Winters模型)来识别预测。例如,在这样一个实施例中,Holt-Winters模型可能使用以下方程来识别预测的市场花费:

YT+τ=(aT+τbT)ST (1)

在方程(1)中,在未来的时间τ获得的市场花费可由Y表示。方程(1)的附加变量可以用下式来求解:

bt=β(at-at-1)+(1-β)bt-1 (3)

在方程(2)-(4)中,值α、β和γ可以是平滑参数,at是在时间t处的已平滑水平,bt是在时间t时的趋势变化,st是在时间t的季节平滑,并且p是每年的季度数量。在上面的例子中,季度数量可是,例如,十二,在时间序列中的每个月。

在某些实施例中,处理服务器102可以配置成对与人口统计市场区段关联的数据进行重新分配,用于识别每个人口统计市场区段的市场消费。在一些情况下,处理服务器102可以重新分配交易数据。例如,通过支付网络110收集的交易数据可能不成比例地夸大代表某区段中的一些人口统计资料,诸如由于不成比例地使用支付网络110所关联的支付卡和其他支付工具。在此类情况下,处理服务器102可以重新分配给定区段和人口统计分段的交易数据,以识别重新分配的花费估计值,所述估计值可用于识别关联的人口统计市场区段的重新分配的市场花费。

在一些此类实施例中,处理服务器102可以使用系统化方法在人口统计区段级别重新分配花费。处理服务器102可以基于如下项的至少一种组合为给定的人口统计市场分段计算所估计花费(例如,作为重新分配的花费):跨所有区段的该人口统计分段的整体市场花费(例如,基于普查数据)、在该区段中独特的人口统计分段的数量以及区段中每个人口统计分段的初始估计的市场花费。在其他此类实施例中,处理服务器102可以使用系统化方法在帐户级别重新分配花费。在此类情况下,处理服务器102可以基于如下项的至少一种组合来计算特定人口统计市场区段的重新分配的市场花销:跨所有区段的该人口统计分段的整体市场花费;跨所有区段的该人口统计分段中账户的累计花费(例如,其根据交易数据确定),这可能利用跨预定数量的采样迭代,该区段中独特人口统计分段的数量,以及该区段中每个人口统计分段的初始估计的市场花费的替换被采样。所得到的市场花费可以被重新分配以补偿可从支付网络110接收的交易数据的任何比例失调。

在某些实施例中,处理服务器102也可以配置为基于每个人口统计分段的消费来重新分配市场花费,因为交易数据可能是比例失调的,如上面所讨论的。在此类实施例中,处理服务器102可使用下列方程组来计算特定人口统计分段的消费百分比,这可应用于人口统计市场区段,以识别市场花费:

cj,k=Cj,k/∑j,kCj,k (6)

Ci,j,k=cj,k*Ci,j,k/∑iCi,j,k (8)

Ci,j,k,l=Ci,j,k*Pl/∑iPl (9)

在方程(5)至(9)中,i、j、k和l可能分别是收入、性别、年龄和子女状况的索引;C(A)和C(I)可以分别是作为年龄和收入的估计函数的人均消费,和可以是第j个性别和k个年龄范围的上限和下限;Pi,j,k,l可以是第i个收入范围、第j个性别、第k个年龄范围以及第l个子女状况的人口;Ci,j,k可以是第i个收入范围、第j个性别以及第k个年龄范围的净消费;并且ci,j,k,l可以是第i个收入范围、第j个性别、第k个年龄范围以及第l个子女状况的消费占所有总消费的百分比。消费百分比可用于调整交易数据或否则可用于基于使用上面的方程针对相应人口统计分段识别的消费来识别人口统计市场区段的市场花费。

处理服务器102可以配置成使此处识别的数据可用于一个或多个外部实体。例如,处理服务器102可以被配置成根据第三方的请求,诸如通过应用程序、网络站点或其他合适的接口,以电子方式传送人口统计市场区段的已知或预测的市场花费。在一个示例中,广告商可以请求在某地理区域内多个人口统计市场区段的数个月预测的市场花费,这可以通过网页来请求,以及使用本文所述的方法由处理服务器102识别出结果。广告商可以在网页上查看结果,其中这些结果可以通过条形图、热图或其他合适的方法来说明。

本文论述的方法和系统使处理服务器102能够基于从多个不同的源接收的数据的组合准确地识别多个人口统计市场区段的市场消费,数据包括从政府机构104获得的普查数据以及从人口跟踪机构108接收的人口统计数据。在某些情况下,处理服务器102还可以重新分配数据以进一步提高市场花费估计值的准确性,并且也可以配置成使用季节性时间序列基于所识别的市场花费来预测未来的市场花费。

处理服务器

图2示出了系统100中处理服务器102的实施例。对本领域技术人员来说显而易见的是,图2中所示的处理服务器102的实施例仅作为例证提供,并且可能不会穷尽于适合于执行本文所讨论的功能的处理服务器102的所有可能配置。例如,图6所示并且下面更详细地讨论的计算机系统600可以是处理服务器102的适当配置。

处理服务器102可以包括接收设备202。接收设备202可以被配置成通过一个或多个网络协议在一个或多个网络上接收数据。在某些情况下,接收设备202可以配置成通过一个或多个网络(诸如互联网、局域网、无线局域网、蜂窝通信网络、射频、支付轨迹等等)从政府机构104、人口跟踪机构108、支付网络110以及其他实体接收数据。在某些实施例中,接收设备202可以包括多个设备,诸如用于通过不同网络接收数据的不同接收设备,诸如用于通过局域网接收数据的第一接收设备和用于通过互联网接收数据的第二接收设备。接收设备202可接收以电子方式传送的数据信号,其中数据可被叠加或以其它方式编码在数据信号上,并通过由接收设备202接收数据信号进行解码、解析、读取或以其他方式获得。在某些情况下,接收设备202可包括解析模块,用于解析接收的数据信号以获得叠加在其上的数据。例如,接收设备202可包括解析器程序,该解析器程序被配置成接收和转换接收的数据信号到由处理设备执行的功能的可用输入,以执行本文所述的方法和系统。

接收设备202可配置成接收由政府机构104以电子方式传送的、叠加有或以其他方式编码有普查数据的数据信号。普查数据可至少包括与商户和地理位置对应关系相关的数据,并且也可包括经济市场数据,包括与市场花费和地理位置之间的对应关系、市场花费和人口统计特征的对应关系以及市场花费和商户行业的对应关系等相关的数据。接收设备202也可以配置为接收由人口跟踪机构108以电子方式传送的数据信号,其可叠加有人口统计数据或编码有人口统计数据。人口统计数据可以与一个或多个个体(例如,消费者106)相关联,并且至少包括每个个体的年龄、性别、收入、子女状况和地理位置数据。在示例性实施例中,人口统计数据可能不包括个人可识别信息。接收设备202也可以配置为接收由支付网络110以电子方式传送的数据信号,其可叠加有或编码有多个支付交易的交易数据,交易数据至少包括相应支付交易的交易金额、交易时间和/或日期、商户标识符和地理位置。

处理服务器102还可以包括通信模块204。通信模块204可以配置成在处理服务器102的模块、引擎、数据库、存储器和其他组件之间传送数据,以便执行本文所讨论的功能。通信模块204可以包括一个或多个通信类型,并且利用多种通信方法在计算设备内通信。例如,通信模块204可以包括总线、插针连接器、电线等,在某些实施例中,该通信模块204也可以配置为在处理服务器102的内部组件和处理服务器102的外部组件之间通信,外部组件诸如是外部连接的数据库、显示设备、输入设备等。处理服务器102也可包括处理设备。处理设备可以配置成执行本文中讨论的处理服务器102的功能,正如本领域技术人员显而易见的那样。在某些实施例中,该处理设备可以包括专门配置为执行处理设备的一个或多个功能的多个引擎和/或模块和/或由其组成,其诸如是查询模块214、数据识别模块216、建模模块218等。本文中所使用的术语“模块”可以是软件或特别编程的硬件,用于接收输入、使用输入执行一个或多个过程以及提供输出。由多种模块执行的输入、输出以及过程将是本领域技术人员基于本公开显而易见的。

处理服务器102可包括交易数据库206。交易数据库206可配置为使用适当的数据存储格式和方案来存储多个交易数据条目208。交易数据库206可以是利用结构化查询语言的关系数据库,用于对存储在其中的结构化数据集进行存储、识别、修改、更新、访问等。每个交易数据条目208可以配置成存储与支付交易相关的数据,其至少包括相关支付交易的地理位置、商户标识符、交易金额以及交易时间和/或日期。在某些情况下,交易数据条目208也可以包括以下中的至少一个:货币、商户名称、商户类别代码、产品数据、消费者数据、发行方数据、收单方数据、要约数据、忠诚度数据、奖励数据、销售点数据等。

处理服务器102也可以包括区段数据库210。区段数据库210可以被配置成使用适当的数据存储格式和方案来存储多个区段简档212。区段数据库210可以是利用结构化查询语言的关系数据库,用于对存储在其中的结构化数据集进行存储、识别、修改、更新、访问等。每个区段简档212可以被配置成存储与处理服务器102所识别的人口统计市场区段相关的数据。例如,数据可以包括与相关人口统计市场区段关联的唯一标识符(例如主键、索引等)、人口统计市场区段的地理区域(例如区段索引)、人口统计分段、市场花费数据、预测的市场花费等。

处理服务器102可以包括查询模块214。查询模块214可以配置成执行数据库上的查询以识别信息。查询模块214可以接收一个或多个数据值或查询字符串,并且可以在所指示的数据库(诸如交易数据库206)上执行基于此的查询字符串,以识别存储在其中的信息。然后,查询模块214可以根据需要将所识别的信息输出到处理服务器102的适当引擎或模块。查询模块214可例如在交易数据库206上执行查询,以识别位于特定分段中的多个交易数据条目208(例如,基于所包括的地理位置)用于识别人口统计市场区段的市场花费,或者可在区段数据库210上执行查询,以插入新的区段简档212,或更新包括在现有区段简档212中的数据,诸如以下针对相关人口统计市场区段的市场花费预测。

处理服务器102也可以包括数据识别模块216。数据识别模块216可以配置成执行本文中讨论的处理服务器102的功能。数据识别模块216可接收指令,可识别基于其的数据,并可将数据输出到处理服务器102的另一模块或引擎。在某些情况下,指令可能伴随着用于数据识别的数据。在其他情况下,数据识别模块216可配置成识别用于其中的数据,例如通过指示查询模块214执行用于识别数据的查询。数据识别模块216可配置为基于普查和人口统计数据来识别人口统计市场区段,并且也可配置为根据交易数据识别人口统计市场区段的市场花费,其包括将人口统计市场区段的市场花费分解到时间序列中。在某些实施例中,数据识别模块216也可以配置为识别交易数据的重新分配以及人口统计市场区段的消费。

处理服务器102也可以包括建模模块218。建模模块218可以配置成对数据建模,用于执行如本文中讨论的处理服务器102的功能。建模模块218可以接收指令作为输入,可以基于指令对数据建模,并且可以将通过模型获得的数据输出到处理服务器102的另一模块或引擎。建模模块218可配置为对人口统计市场区段或适用的区段的市场花费建模,以便预测人口统计市场区段未来的市场花费。

处理服务器102也可以包括传送设备222。传送设备222可以被配置成通过一个或多个网络协议在一个或多个网络上传送数据。在某些情况下,传送设备222可配置为通过一个或多个网络、诸如互联网、局域网、无线区域网、蜂窝通信网络、射频、支付轨迹等传送数据到政府机构104、人口跟踪机构108、支付网络110以及其他实体。在某些实施例中,传送设备222可以包括多个设备,诸如用于在不同网络上传送数据的不同传送设备,诸如用于在局域网上传送数据的第一传送设备以及用于在互联网上传送数据的第二传送设备。传送设备222可以电子方式传送叠加了数据的数据信号,所述数据可由接收计算设备解析。在某些情况下,传送设备222可包括一个或多个模块,用于将数据叠加、编码或以其他方式格式化到适于传送的数据信号中。

传送设备222可以配置成以电子方式将数据信号传送到政府机构104、人口跟踪机构108以及支付网络110,其可叠加或以其他方式编码有数据请求,诸如用于请求普查数据、人口统计数据、交易数据等。传送设备222还可配置成以电子方式将数据信号传送到附加实体,诸如数据请求器,其可叠加或以其他方式编码有市场花费数据,包括一个或多个人口统计市场区段的所识别的市场花费和/或预测的市场花费。

处理服务器102还可以包括存储器224。存储器224可配置成存储由处理服务器102在执行本文所述功能时使用的数据,诸如公共密钥和私人密钥、对称密钥等。存储器224可以配置成使用适当的数据格式化方法和方案来存储数据,并且可以是任何适当类型的存储器,诸如只读存储器、随机存取存储器等。存储器224可以包括,例如,加密密钥和算法、通信协议和标准、数据格式化标准和协议、用于处理设备的模块和应用程序的程序代码以及可适于由处理服务器102在执行本文公开的功能时使用的其他数据,如本领域技术人员显而易见的那样。在某些实施例中,存储器224可由关系数据库组成或可以其他方式包括关系数据库,其使用结构化查询语言以对存储在其中的结构化数据集进行存储、识别、修改、更新、访问等。

通过人口统计市场区段识别市场花费

图3说明了基于交易数据、普查数据和人口统计数据的组合来识别人口统计市场区段及其市场花费。

处理服务器102的接收设备202可从一个或多个支付网络110接收数据310。从支付网络110接收到的数据310可以包括多个不同支付交易的交易数据312,其中交易数据312至少包括每一支付交易的交易金额、交易时间和/或日期、地理位置和商户标识符。处理服务器102的接收设备202也可以从一个或多个政府机构104接收普查数据320。普查数据320可包括商户数据322、市场数据324和人口统计数据326,其中可包括其对应关系,诸如商户与经济市场花费之间的对应关系、人口统计特征与经济市场花费之间的对应关系等。

处理服务器102的数据识别模块216可配置成识别区段市场花费340,其可能是由数据识别模块216为多个作为区段的不同地理区域中的每个地理区域识别的市场花费。基于交易数据条目312和其中包括的地理位置和交易金额,以及普查数据320中包括的商户数据322和市场数据324,可以识别区段市场花费340。

处理服务器102的接收设备202也可以从一个或多个人口跟踪机构108接收人口统计数据330。人口统计数据330可至少包括多个个体(例如,消费者106)的性别数据332、收入数据334、年龄数据336以及家庭数据338。在一些情况下,人口统计数据330也可以包括地理位置数据。在某些情况下,包括在人口统计数据330中的数据可桶分化或以其他方式遮蔽。

处理服务器102的数据识别模块216可被配置成识别多个人口统计市场区段350。人口统计市场区段350可基于普查数据320和人口统计数据330,其中每个人口统计市场区段350可与作为区段的地理区域并且与人口统计分段关联,其中人口统计分段可与特定的年龄、性别、收入和家庭状况组合关联。可限定每个人口统计市场区段350的大小,使得其中所包括的个体数量至少是预定数量,使得每个人口统计市场区段350或与其关联的数据对任何个体而言都不是个人可识别的。在某些情况下,人口统计市场区段350的区段可能与市场花费区段340是相同的区段。

处理服务器102的数据识别模块216也可基于人口统计市场区段350和市场花费区段340识别每个人口统计市场区段350的市场花费360。在某些情况下,数据识别模块216可配置为在识别人口统计市场区段350的市场花费360之前,重新分配诸如上文讨论的市场花费区段340数据。市场花费360可使得单个区段中各个人口统计市场区段350的市场花费360的总和可等于对应的市场花费区段340。在某些情况下,市场花费360也可能进一步基于普查数据320中包括的市场数据324,诸如可基于市场数据324调整。

用于预测人口统计市场区段的市场花费的过程

图4示出了用于根据基于从多个不同源接收并且使用本文所述方法组合的数据的针对人口统计市场区段识别的市场花费的时间序列预测人口统计市场区段中未来市场花费的过程。

在步骤402中,处理服务器102的接收设备202可接收来自人口跟踪机构108的人口统计数据、来自政府机构104的普查数据以及来自一个或多个支付网络110的交易数据。人口统计数据可以至少包括多个个体的年龄、性别、收入、子女状况以及地理位置。普查数据可以至少包括商户和地理位置对应关系。交易数据可以至少包括多个支付交易的交易金额、交易时间和/或日期、商户标识符以及地理位置。

在步骤404中,处理服务器102的数据识别模块216可至少基于普查数据和人口统计数据来识别多个人口统计市场区段。每个人口统计市场区段可以与区段(例如,地理区域)和人口统计分段关联,其中人口统计分段是人口统计特征的集合,包括在其中的每个个体具有共同的人口统计特征集合,人口统计特征至少包括年龄、性别、收入和子女状况,并且其中每个个体的关联地理位置包括在对应的区段中。

在步骤406中,处理服务器102的数据识别模块216可以重新分配从支付网络110接收到的交易数据。交易数据可以被重新分配,以减少与之关联的花费数据中的任何比例失调。重新分配可以基于以下中的至少一种:人口统计分段数量、该区段的整体市场花费、跨所有区段的人口统计分段的整体市场花费、重新分配前人口统计市场区段的市场花费等。在步骤408中,数据识别模块216可以基于消费数据执行重新分配,诸如上面所讨论的,其中重新分配可以基于以下中的至少一种:人口统计市场分段的数量、分段的整体市场花费、交易账户数量、样本迭代等。

在步骤410中,处理服务器102的数据识别模块216可基于重新分配的数据来识别每个人口统计市场区段的市场花费。在步骤412中,数据请求实体400可以使用适当的通信网络和方法以电子方式将数据信号传送到处理服务器102,其中,数据信号叠加有或以其他方式编码有花费预测请求。在步骤414中,处理服务器102的接收设备202可接收花费预测请求,其可以包括至少一个人口统计市场区段,并且还可以包括请求进行预测的时间范围。

在步骤416中,处理服务器102的建模模块218可预测花费预测请求中规定的人口统计市场区段的请求的市场花费。在某些情况下,数据识别模块216可在预测之前将人口统计市场区段的市场花费分解到时间序列中,其中时间序列的周期可基于请求预测的时间周期。在某些实施例中,可以使用季节性时间序列模型预测未来花费。在某些情况下,季节性时间序列模型可是Holt-Winters模型。在步骤418中,处理服务器102的传送设备222可以使用适当的通信网络和方法以电子方式将预测的市场花费传送到数据请求实体400。在步骤420中,数据请求实体400可接收特定人口统计市场区段的预测的市场花费。

用关联花费数据生成人口统计市场区段的示例性方法

图5示出了基于普查和人口统计数据以及与之关联的市场花费数据生成人口统计市场区段的方法500。

在步骤502中,多个交易数据条目(例如,交易数据条目208)可以存储在处理服务器(例如,处理服务器102)的交易数据库(例如,交易数据库206)中,其中每个交易数据条目是与支付交易相关的结构化数据集,其至少包括地理位置、商户标识符、交易金额以及交易时间和/或日期。在步骤504中,可以由处理服务器的接收设备(例如,接收设备202)从一个或多个政府机构(例如,政府机构104)接收普查数据,其中普查数据包括与至少商户和地理位置对应关系相关的数据。在步骤506中,处理服务器的接收设备可接收来自一个或多个第三方数据源(例如,人口跟踪机构108)的人口统计数据,其中人口统计数据至少包括多个个体的年龄、性别、收入、子女状况和地理位置数据。

在步骤508中,多个人口统计市场区段可以由处理服务器的数据识别模块(例如,数据识别模块216)至少基于普查数据和人口统计数据来识别,其中每个人口统计市场区段包括具有共同年龄、性别、收入、子女状况和地理位置数据的个体子集,并且至少包括预定数量的个体。在步骤510中,市场花费可由处理服务器的数据识别模块基于如下项的至少一种组合来为多个人口统计市场区段中的每一个来识别:包括在普查数据中的商户和地理位置对应关系以及多个交易数据条目的子集,其中所包括的地理位置对应于与相应人口统计市场区段关联的共同地理位置数据。

在一个实施例中,人口统计数据可不包括多个个体中任一个体的个人可识别信息。在某些实施例中,普查数据可还包括经济市场数据,并且方法500也可以包括由处理服务器的数据识别模块至少基于经济市场数据和人口统计市场区段子集的平均市场消费重新分配多个人口统计市场区段中每个人口统计市场区段的市场花费,所述人口统计市场区段子集包括相应人口统计市场区段以及附加人口统计市场区段,其中所包括的个体子集具有共同的地理位置数据。在另一个实施例中,经济市场数据可包括市场花费与人口统计之间的对应关系。在另一个实施例中,经济市场数据可以包括市场花费与地理位置之间的对应关系。

在一个实施例中,该方法500还可以包括由处理服务器的数据识别模块将至少一个人口统计市场区段的市场花费分解到时间序列中,其中时间序列包括多个时间周期,并且时间序列的每一条目的市场消费至少基于包括在每个交易数据条目中的交易金额,其中所包括的地理位置对应于与相应人口统计市场区段关联的共同地理位置数据,并且其中所包括的交易时间和/或日期包括在相应的时间周期中。在另一个实施例中,方法500甚至可以还包括由处理服务器的建模模块(例如,建模模块218)至少基于时间序列中一个或多个条目的市场花费预测至少一个人口统计市场区段在未来时间周期的市场花费。在甚至另一实施例中,该方法500也可包括:由处理服务器的接收设备接收来自计算系统(例如数据请求实体400)的预测请求,其中该预测请求指示所述至少一个人口统计市场区段和将来时间周期,并且由处理服务器的传送设备(例如传送设备222)以电子方式将未来时间周期的预测的市场花费传送到计算系统。在另一实施例中,市场花费可使用季度性时间序列模型来预测。在另一实施例中,季度性时间序列模型可以是Holt-Winters模型。

计算机系统架构

图6示出计算机系统600,其中本公开的实施例或其部分可以作为计算机可读代码来实现。例如,图1的处理服务器102可以在计算机系统600中使用硬件、软件、固件、具有存储在其上的指令的非暂时性计算机可读介质或其组合实现,并且可以在一个或多个计算机系统或其它处理系统中实现。硬件、软件或其任何组合都可以包括用于实现本文所讨论的方法(诸如上文讨论的图4和5中所示的方法)的模块和组件。

如果使用可编程逻辑,则此类逻辑可以在由可执行软件代码配置以成为特定用途计算机或特定用途设备(例如,可编程逻辑阵列、专用集成电路等)的商业可用处理平台上执行。本领域技术人员可意识到,所公开主题的实施例可以使用不同的计算机系统配置来实施,其包括多核多处理器系统、微型计算机、大型计算机、带有分布式功能的链接或集群计算机以及可以嵌入到几乎任何设备中的普适计算机或超小型计算机。例如,可以使用至少一个处理器设备和存储器来实现上述实施例。

本文所讨论的处理器单元或设备可以是单个处理器、多个处理器或其组合。处理器设备可具有一个或多个处理器“核”。本文讨论的术语“计算机程序介质”、“非暂时性计算机可读介质”和“计算机可用介质”用于大体上指代有形介质,诸如可拆卸存储单元618、可拆卸存储单元622,和安装在硬盘驱动器612中的硬盘。

本公开的各种实施例根据该示例计算机系统600来描述。在阅读此描述之后,如何使用其他计算机系统和/或计算机架构来实现本公开将对于本领域技术人员变得显而易见。虽然操作可以被描述为顺序的过程,但实际上可以并行地、并发地和/或在分布式环境中执行一些操作,并且利用本地或远程存储程序代码以便由单个或多个处理器机器访问。此外,在某些实施例中,可以重新安排操作顺序,而不偏离所公开主题的精神。

处理器设备604可以是特定用途处理器设备或特别配置用于执行本文所讨论的功能的通用处理器设备。处理器装置604可连接到通信基础设施606,诸如总线、消息队列、网络、多核消息传递方案等。网络可以是适用于执行本文所述功能的任何网络,并且可包括局域网(LAN)、广域网(WAN)、无线网络(例如WiFi)、移动通信网络、卫星网络、互联网、光纤、同轴电缆、红外线、射频(RF),或它们的任意组合。其他适当的网络类型和配置对本领域技术人员来说是显而易见的。计算机系统600也可以包括主存储器608(例如,随机存取存储器、只读存储器等),并且也可以包括辅助存储器610。辅助存储器610可包括硬盘驱动器612和可拆卸存储驱动器614,诸如软盘驱动器、磁带驱动器、光盘驱动器、闪存等。

可拆卸存储驱动器614可以以众所周知的方式从可拆卸存储单元618读取和/或写入可拆卸存储单元618。可拆卸存储单元618可包括可被可拆卸存储驱动器614读取和写入的可拆卸存储介质。例如,如果可拆卸存储驱动器614是软盘驱动器或通用串行总线端口,则可拆卸存储单元618可以分别为软盘或便携式闪存驱动器。在一个实施例中,可拆卸存储单元618可以是非暂时性计算机可读记录介质。

在某些实施例中,辅助存储器610可包括用于允许计算机程序或其它指令加载到计算机系统600的替代部件、例如可拆卸存储单元622和接口620。这种部件的示例可以包括程序盒和盒式接口(例如,如在视频游戏系统中发现的)、可拆卸存储器芯片(例如EEPROM、PROM等)和关联插座,以及如本领域技术人员显而易见的其他可拆卸存储单元622和接口620。

存储在计算机系统600中(例如,在主存储器608和/或辅助存储器610中)的数据可以存储在任何类型的适当计算机可读介质上,例如光存储装置(例如,压缩盘、数字多用盘、蓝光盘等)或磁带存储装置(例如,硬盘驱动器)。数据可以任何类型的适当数据库配置来配置,诸如关系数据库、结构化查询语言(SQL)数据库、分布式数据库、对象数据库等。适当配置和存储类型对本领域技术人员来说将是显而易见的。

计算机系统600也可以包括通信接口624。通信接口624可以配置成允许在计算机系统600和外部设备之间传输软件和数据。示例性的通信接口624可包括调制解调器、网络接口(例如,以太网卡)、通信端口、PCMCIA插槽和卡等。通过通信接口624传输的软件和数据可以信号的形式,所述信号可以是电子、电磁、光学或本领域技术人员显而易见的其他信号。这些信号可以通过通信路径626行进,通信路径626可以配置成携带信号,并且可以使用电线、电缆、光纤、电话线、蜂窝电话链路、射频链路等来实现。

计算机系统600还可以包括显示接口602。显示接口602可配置成允许在计算机系统600和外部显示器630之间传输数据。示例性显示接口602可包括高清晰度多媒体接口(HDMI)、数字视频接口(DVI)、视频图形阵列(VGA)等。显示器630可能是任何适当类型的显示器,用于显示通过计算机系统600的显示接口602传送的数据,其包括阴极射线管(CRT)显示器、液液晶显示器(LCD)、发光二极管(LED)显示器、电容式触摸显示器、薄膜晶体管(TFT)显示器等。

计算机程序介质和计算机可用介质可以指代存储器,诸如主存储器608和辅助存储器610,其可以是存储半导体(例如DRAM等)。这些计算机程序产品可以是用于向计算机系统600提供软件的部件。计算机程序(例如,计算机控制逻辑)可以存储在主存储器608和/或辅助存储器610中。也可以通过通信接口624接收计算机程序。当执行时,此类计算机程序可以使计算机系统600能够实现本文所述的本发明方法。具体而言,当执行时,计算机程序可以使处理器设备604实现本文中讨论的方法,诸如上文讨论的图4和5中所示的方法。因此,此类计算机程序可以表示计算机系统600的控制器。在使用软件实现本公开的情况下,软件可存储在计算机程序产品中,并使用可拆卸存储驱动器614、接口620以及硬盘驱动器612或通信接口624加载到计算机系统600中。

处理器设备604可包括配置成执行计算机系统600的功能的一个或多个模块或引擎。每个模块或引擎可以使用硬件来实现,并且在某些情况下也可以利用软件,例如对应于存储在主存储器608或辅助存储器610中的程序代码和/或程序来实现。在此类情况下,程序代码在由计算机系统600的硬件执行之前可由处理器设备604(例如,编译模块或引擎)编译。例如,程序代码可以是用编程语言编写的源代码,其被翻译成较低级语言,例如汇编语言或机器代码,用于由处理器设备604和/或计算机系统600的任何附加硬件组件执行。编译过程可包括使用词法分析、预处理、语法分析,语义分析、语法制导翻译、代码生成、代码优化以及可适合于将程序代码翻译成适于控制计算机系统600的较低级语言的其他技术,以便执行本文公开的功能。对本领域技术人员而言将显而易见的是,此类过程导致计算机系统600是专门配置的计算机系统600,其经独特编程用于执行上述功能。

与本公开相一致的技术除了其他特征之外还提供了用于利用关联的花费数据来生成人口统计市场区段的系统和方法。虽然上文已经描述了所公开的系统和方法的各种示例性实施例,但应该理解的是,呈现这些仅仅是示例目的,而不是限制。它并非穷尽的并且并未将公开限于所揭示的精确形式。根据上述教导,修改和变形是可能的;或者修改和变形可通过实践本公开而获得,而不脱离幅度或范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1