对数据的自动识别和洞察的制作方法

文档序号:9713589阅读:345来源:国知局
对数据的自动识别和洞察的制作方法
【专利说明】对数据的自动识别和洞察
【背景技术】
[0001]随着计算技术的快速发展,对各种类型和形式的数据的分析、处理和可视化已经 变成了日常事务的主要的部分,甚至是很多人个人生活的主要的部分。从诸如销售、市场调 查之类的商业数据到学校中学生表现数据,来自各种背景和技能水平的人查看、处理并努 力理解日益增长量的数据。
[0002] 数据分析和查看的典型方案包括用户查看包含各种维度的数据的电子表格,试图 通过公式或图表来分析,通常通过手动配置来设置。甚至为了达到一定水平的自动化,用户 通常不得不在数据面前对数据有大概理解,选择部分数据(总体数据内的数据集),选择适 当的分析工具(例如,趋势公式、图表参数等)。对于少量的数据,这可能不是困难的任务,但 是少量的数据也提供对总体情节的较不精确的概括。当期望有更精确的结果或者可用数据 量很大时,普通的、基于手动配置的工具在最好的情况下不够好,在最坏的情况下不可用。
[0003] 此外,数据集的大小通常在用户直接控制下不成问题。除非用户手工制作数据,否 则用户可能从另一源获得数据。很多数据源,尤其是更加结构化的源(例如,数据库、来自政 府的公共可获得的数据集等),可能足够大而使得在没有正确的工具和适当的技能的情况 下很难进行手动分析。

【发明内容】

[0004] 提供该
【发明内容】
以便以下文在【具体实施方式】中进一步描述的简化形式来引入精 选的概念。该
【发明内容】
不旨在排他地标识出权利要求主题的关键特征或主要特征,也不旨 在作为确定权利要求主题的范围的辅助。
[0005] 实施例涉及各种类型数据的自动识别和洞察呈现。在一些示例中,总体数据可以 被分析,并且在总体数据内的整个范围内的数据集被确定,以便于推导用户数据的位置。用 户的数据集然后可以经过各种分析,诸如统计、启发和类似的分析,以确定诸如趋势、相关 性、离群值、比较和模式之类的洞察。洞察可以采用以下形式呈现给用户:自动优化可视化 (高亮显示所确定的洞察),在所呈现的原始数据上强调、数据格式化建议、以及类似的具有 进一步探索能力的形式。
[0006] 根据对下面【具体实施方式】的阅读以及对相关附图的浏览,这些以及其它的特征和 优点将变得显而易见。应当理解,前面的概述和下面的【具体实施方式】二者都是说明性的,且 不限制要求保护的方面。
【附图说明】
[0007] 图1是示出了根据一些实施例的数据分析和洞察呈现的示例性实现方式的概念 图;
[0008] 图2示出了在电子表格环境中自动识别和洞察呈现的实现方式;
[0009] 图3示出了基于自动识别和洞察确定将示例性基于图表的数据呈现为表格数据的 呈现;
[0010] 图4示出了根据一些实施例的自动识别和洞察呈现的流程的框图;
[0011] 图5是其中可以实现根据实施例的系统的简化的网络环境;
[0012] 图6是其中可以实现实施例的示例性计算操作环境的框图;以及
[0013] 图7示出了根据实施例的提供自动识别和洞察呈现的过程的逻辑流程图。
【具体实施方式】
[0014] 如上面简要概述,可以分析可用的数据来推导用户数据的位置。用户的数据然后 可以经过各种分析以确定诸如趋势、相关性、离群值、比较和模式之类的洞察(insight)。洞 察可以按如下形式呈现给用户:自动优化可视化、在呈现的原始数据上强调、数据格式化建 议、以及类似的形式。
[0015] 在下面的【具体实施方式】中,参考了附图,附图构成【具体实施方式】的一部分,并且在 附图中通过示例说明的方式示出了特定实施例或示例。这些方面可以组合,可以使用其它 方面,可以进行结构改变,而不偏离本公开的精神或范围。因此,下面的【具体实施方式】不应 从限制的意义上考量,且本发明的范围由随附的权利要求及其等价物来限定。
[0016] 虽然在结合在计算设备上的操作系统上运行的应用程序执行的程序模块的通常 上下文中描述实施例,但是本领域技术人员将认识到各方面可以结合其它程序模块来实 现。
[0017] -般地,程序模块包括例程、程序、组件、数据结构以及执行特定任务或实现特定 抽象数据类型的其它类型的结构。而且,本领域技术人员将意识到,实施例可以利用包括手 持式设备、微处理器系统、基于微处理器或可编程消费电子设备、小型计算机、大型计算机、 以及类似的计算设备在内的其它计算机系统配置来实践。实施例还可以在通过通信网络链 接的远程处理设备来执行任务的分布式计算环境中来实践。在分布式计算环境中,程序模 块可以位于本地存储器存储设备或远程存储器存储设备二者中。此外,实施例可以实现在 能够进行除了键盘和鼠标输入之外的触摸、姿势、眼睛跟踪、语音命令、陀螺仪、笔、以及类 似的交互机制的计算设备中。
[0018] 实施例可以被实现为计算机实现的过程(方法)、计算系统,或者实现为制品,诸如 计算机程序产品或计算机可读介质。计算机程序产品可以是能够由计算机系统来读取的、 并且对包括用于使计算机或计算系统执行示例过程的指令的计算机程序进行编码的计算 机存储介质。计算机可读存储介质是计算机可读存储器设备。计算机可读存储介质可以例 如经由易失性计算机存储器、非易失性存储器、硬盘驱动器或闪速驱动器中的一种或多种 来实现。
[0019] 在整个本说明书中,术语"平台"可以是用于提供对分析数据的自动识别和洞察呈 现的软件组件和硬件组件的组合。平台的示例包括但不限于在多个服务器上执行的托管服 务、在单个计算设备上执行的应用、以及类似的系统。术语"服务器"一般是指通常在网络环 境中执行一个或多个软件程序的计算设备。然而,服务器还可以被实现为在视作网络上的 服务器的一个或多个计算设备上执行的虚拟服务器(软件程序)。关于这些技术的更多细节 和示例性实施例可见于下面的说明书中。
[0020] 图1是示出了根据一些实施例的数据分析和洞察呈现的示例性实现方式的概念 图。
[0021] 如图100所示,提供分析和洞察呈现的过程可以开始于基础数据108。基础数据102 可以是结构化的、非结构化的以及以各种格式来格式化的。在网络环境中,基础数据108可 以通过服务器110表示的托管服务来管理并且经由一个或多个网络106通过在用户的客户 端设备104上执行的厚或薄的客户端应用来提供给用户102。可替代地,用户102可以直接从 数据存储设备取回基础数据108并且使用托管服务(例如,包括电子表格应用在内的产品套 件)来分析和理解。
[0022] 根据一些实施例,基础数据102可以首先被分析以标识用户数据(即,总体数据内 的用户感兴趣的数据集)。在该初始分析中可以考虑数据类型、数据处理的上下文、用户偏 好、用户许可、数据的结构以及类似因素。一旦推导出用户数据的位置,则可以将诸如统计、 变换、启发式等各种分析应用于用户数据集以确定诸如趋势、模式、相关性、比较和类似的 洞察之类的洞察。
[0023] 然后可以通过可视化来将洞察呈现给用户,诸如图表112被选择且被配置为高亮 显示所呈现的洞察(例如,模式114)。洞察还可以通过在原始数据上强调(例如,高亮显示、 加阴影或以其它方式强调电子表格上的特定数据集或其子集)或数据格式化建议(也是在 电子表格上)来呈现。
[0024]根据一些实施例,可以采用机器学习算法或类似技术来检测跟随洞察呈现之后的 用户动作(例如,特定列被改变或修改,特定洞察被保留而其它洞察被删除,等等)并且从那 些动作中学习。学习机制然后可用来调节未来的识别和洞察呈现操作。
[0025]除了托管服务环境之外,实施例还可以通过在本地安装的数据处理应用诸如电子 表格应用、数据库应用、呈现应用、做笔记应用或甚至是文字处理应用来实现。此外,可以采 用诸如键盘八鼠标、触摸、姿势、笔、眼睛跟踪、语音命令、陀螺仪和类似输入机制等各种交互 机制来与系统交互以及选定各种参数。
[0026]图2示出了在电子表格环境中自动识别和洞察呈现的实现方式。
[0027]示意图200显示出数据处理应用的用户界面,诸如以表格格式呈现数据的电子表 格应用。虽然所呈现的数据206为了该示例说明的目的并不重要,但是应当注意数据包括诸 如列和行的维度。自动识别和洞察呈现可以在将数据装载到应用或者检测到控制元件208 的激活时自动开始。
[0028] 在一个示例性实施例中,以二维表格呈现给用户的表格数据可以包括不同的维 度。例如,列可以代表各种产品,而行可以代表不同时间段(例如,按月)的销售图。此外,电 子表格可以包括各种用户可能感兴趣的完整的和/或不完整的数据的部分。电子表格还可 以在多个工作表中包含数据,将第三维度添加到方案中。
[0029] 用于检测用户数据的位置的初始分析
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1