量化数据质量的探试的制作方法_2

文档序号：9221676阅读：来源：国知局

未图示，但是要理解的是，贮藏室可以位于托管(多个)数据探试引擎模块112的(多个)服务器104的外部和/或内部。
[0021]除分析历史数据之外，(多个)数据探试引擎模块112可以分析(新和/或当前)到来的数据，诸如通过示例而非限制的方式，表征最终用户终端102 (a)、102 (b)、102 (c)和/或网络108之间的交互和/或与该交互相关联的数据。在一些实施例中，(多个)数据探试引擎模块112如针对历史数据所生成的那些那样在到来的数据上生成(多个)类似探试，并且将新的探试与存储在贮藏室中的(多个)预报相比较。可替换地或附加地，(多个)数据探试引擎模块112计算预报质量度量，其被配置为标识(多个)预报如何紧密地匹配与到来的数据相关联的度量。如果预报质量度量指示低质量和/或非准确的预报，则(多个)数据探试引擎模块112可以触发和/或发送告知给感兴趣方。有时，(多个)数据探试引擎模块112将与(多个)非准确的预报相关联的到来数据与历史数据隔离直至可以进一步分析到来数据的时间点。在一些实施例中，如果与到来的数据相关联的(多个)度量在预先确定的阈值和/或变化内匹配(多个)预报，则(多个)数据探试引擎模块将新到来的数据存储到数据贮藏室中和/或基于新到来的数据更新(多个)预报。
[0022]图2图示了示例系统200，其一般地示出如在通过中央计算设备互连多个设备的环境中实现的(多个)服务器104和最终用户终端102。中央计算设备可以位于多个设备本地或者可以远离多个设备定位。在一个实施例中，中央计算设备是“云”服务器农场，其包括通过网络或互联网或其它措施连接到多个设备的一个或多个服务器计算机。
[0023]在一个实施例中，该互连架构使得能够跨多个设备交付功能性以向多个设备的用户提供共同且无缝的体验。多个设备中的每一个可以具有不同的物理要求和性能，并且中央计算设备使用平台来使得能够将针对设备定制并且仍对所有设备是共同的体验交付给设备。在一个实施例中，创建目标设备“类”并且针对通用类设备定制体验。设备类可以由设备的物理特征或使用或其它共同特性来限定。例如，如之前所描述的，最终用户终端102可以以各种不同方式进行配置，诸如用于移动设备202、计算机204和电视206用途。这些配置中的每一个具有大体对应的屏幕尺寸并且因而最终用户终端102在该示例系统200中可以被配置为这些设备类中的一个。例如，最终用户终端102可以采取移动设备202类设备，其包括移动电话、音乐播放器、游戏设备等。最终用户设备102还可以采取计算机204设备类，其包括个人计算机、膝上型计算机、上网本等。电视206配置包括涉及日常环境中的显示的设备的配置，例如电视、机顶盒、游戏控制台等。因而，本文所描述的技术可以由最终用户终端102的这些各种配置所支持并且不限于以下部分中所描述的具体示例。
[0024]在一些实施例中，(多个)服务器104包括“云”功能性。此处，云208被图示为包括用于万维网服务212的平台210。平台210对云208的硬件(例如服务器)和软件资源的底层功能性进行抽象并且因而可以用作“云操作系统”。例如，平台210可以对连接最终用户终端102与其它计算设备的资源进行抽象。平台210还可以用来对资源缩放比例进行抽象以提供对应水平的缩放给经由平台210所实现的万维网服务212的所遭遇的需求。还预期到各种其它示例，诸如服务器群中的服务器的负载均衡、抵抗恶意方(例如垃圾邮件、病毒和其它恶意软件)的保护等。因而，云208作为策略的部分被包括，该策略针对经由互联网或其它网络对最终用户终端102可用的软件和硬件资源。
[0025]可替换地或附加地，服务器104包括如上文和下文所描述的(多个)数据探试引擎模块112。在一些实施例中，平台210和(多个)数据探试引擎模块112可以驻留在同一服务器集合上，而在其它实施例中，它们驻留在分离的服务器上。此处，(多个)数据探试引擎模块112被图示为利用由云208提供的功能性以用于与最终用户终端102的互连性。
[0026]一般地，本文所描述的任何功能可以使用软件、固件、硬件(例如固定逻辑电路)、手动处理或这些实现方式的组合来实现。如本文所使用的术语“模块”、“功能性”和“逻辑”一般表示软件、固件、硬件或其组合。在软件实现的情形中，模块、功能性或逻辑表示在处理器(例如一个或多个CPU)上或由处理器执行时施行具体任务的程序代码。程序代码可以存储在一个或多个计算机可读存储器设备中。下文所描述的手势技术的特征是独立于平台的，这意味着可以在具有各种处理器的各种商用计算平台上实现该技术。
[0027]在已经描述了其中可以利用各个实施例的示例操作环境的情况下，现在考虑依照一个或多个实施例的量化数据质量的讨论。
[0028]暈化数据质暈
可以使用度量和/或探试来标识和/或量化各种不同类型的项目，诸如产品的特性、与产品的用户交互、系统水平响应等。作为一个示例，一些度量对用户在24小时时段期间多频繁地访问互联网服务进行制表。除对用户在24小时时段期间多频繁地访问互联网服务进行制表之外，度量还可以标识在一天中该用户比其他用户更频繁地访问互联网服务的时间。为了更好地服务用户，互联网服务的开发者可以使用度量作为量化互联网服务如何很好地工作和/或互联网服务如何被使用的方式。这些度量还可以被“扩展”以预料与产品(诸如互联网服务)相关联的未来需要。以度量和/或探试为基础的预报可以帮助标识未来情景，帮助预料与产品相关联的未来需要，并且随后帮助基于未来需要定制产品。假定预报准确地预测未来行为，则最终结果可以产生更好地服务目标用户的产品。然而，当预报非准确地预测行为时，这可能导致对产品的不必要改变以及在一些激烈情形中不利地影响用户的改变。
[0029]为了减小潜在的错误预报，一些实施例对与(多个)预报相关联的准确度进行量化。为此，至少一些实施例可以利用数据探试引擎。作为示例，考虑图3，其一般地图示了包括数据探试引擎302的环境300。在所图示和描述的示例中，数据探试引擎302包括时间片模块306、探试计算模块308、预报模型生成模块310、模型贮藏室312、流处理器模块316、时间片计数器模块318、质量评分模块320和模型更新器模块322，其所有在下文更详细地描述。除其它事情之外，数据探试引擎302分析历史数据以生成(多个)探试，基于探试生成(多个)预报，和/或基于当前和/或到来的数据生成预报质量度量，如下文进一步描述的。
[0030]环境300包括历史数据304，其在此处被图示为数据探试引擎302的输入。在一些实施例中，历史数据304可以驻留在位于托管数据探试引擎302的相同计算设备上的数据贮藏室和/或存储器中。可替换地或附加地，历史数据304可以驻留在托管数据探试引擎302的计算设备的外部。历史数据304可以包括与表征对象/产品/服务、用户与对象/产品/服务的交互、对象/产品/服务与其它组件的交互等的任何适当类型的数据。例如，参照互联网服务的上述示例，历史数据304可以包括表征互联网服务的数据(例如其从何处提取资源、其多频繁地提取资源、其多频繁地刷新屏幕、互联网服务多频繁地崩溃、其为什么类型的服务等)、表征与互联网服务的用户交互的数据(多少个用户与互联网服务交互、特定用户与互联网服务多频繁地交互、互联网服务在一天中的什么时间更活跃、什么类型的用户请求服务、与请求服务的用户相关联的区域、用户请求的是什么类型的服务、用户运行的是什么版本的软件、相关联的客户端运行的是什么操作系统(OS)、用户点击什么类型的链接、每小时有多少个唯一用户在使用服务、来自一个或多个具体区域的用户的百分比是多少等)，可以包括表征数据本身的信息(例如数据被收集时的时间戳、数据类型、数据源信息等)、与服务相关联的平均网络等待时间是多少等等。在一些情形中，历史数据304可以是随时间收集的数据。例如，历史数据304可以包括若干文件和/或数据组，其中每一个组表示24小时跨度的数据收集。然而，要了解和理解的是，这些示例仅仅用于说明性目的，并不意图限制所要求保护的主题的范围。可替换地或附加地，历史数据304可以包括多个类型的数据和/或数据的混合。因而，历史数据304表示任何适当类型的数据、数据群集和/或数据组。另外，历史数据可以包括任何适当规模或数量的数据(例如数十亿的条目、数百万的条目、数万亿的条目等)。
[0031]数据探试引擎302的时间片模块306将历史数据304分割成一个或多个时间片。在一些实施例中，历史数据可以被划分为相同大小的时间片。可替换地或附加地，历史数据可以被划分成大小变化的时间片。考虑历史数据304包含在限定的时间段(例如24小时的时段)上所收集的数据组的情况。时间片模块306可以被配置为将历史数据划分成相等的时间片，其包括24个一小时时间片、48个相等的30分钟时间片等。可替换地，时间片模块306可以被配置为基于数据的特性而在24小时跨度上将历史数据划分为大小变化的时间片。例如，在一个情况下，在12:00AM-6:59AM之间所收集的数据可以被划分为I小时时间片，在7:00AM

完整全部详细技术资料下载

当前第2页1 2 3 4 5