渲染数据集的层次可视化的制作方法

文档序号:9672577阅读:513来源:国知局
渲染数据集的层次可视化的制作方法
【专利说明】
【背景技术】
[0001]计算设备的用户可获得海量数据,当用户以电子方式搜索与特定主题相关的数据时,可以向该用户呈现搜索结果的列表。为了帮助该用户理解搜索结果的范围和/或内容,还可以向该用户呈现搜索结果的概要。
[0002]图说明
[0003]下面的详细描述参考附图,其中:
[0004]图1是能够渲染数据集的层次可视化的示例设备的框图;
[0005]图2是包括机器可读存储介质的示例设备的框图,该机器可读存储介质被编码有用于针对数据集的可视化生成和设置几何形状的指令;
[0006]图3是示例服务器装置的框图,该示例服务器装置能够在客户端计算设备上渲染数据集的可视化;
[0007]图4是示例服务器装置的框图,该示例服务器装置与客户端计算设备通信以能够渲染数据集的层次可视化;
[0008]图5是数据集的示例层次可视化的图;
[0009]图6是用于在计算设备上渲染数据集的可视化的示例方法的流程图;
[0010]图7是用于通过生成和设置镶嵌图案中的几何形状而渲染数据集的可视化的示例方法的流程图;
[0011]图8是用于通过修改从数据集得到的树图而渲染数据集的可视化的示例方法的流程图;
[0012]图9是用于使在客户端计算设备上显示数据集的可视化的由服务器装置执行的示例方法的流程图;以及
[0013]图10是用于组织向客户端计算设备发送的信息以能够生成数据集的可视化的由服务器装置执行的示例方法的流程图。
【具体实施方式】
[0014]数据集的文本摘要或图形摘要可以帮助计算设备的用户更好地理解该数据集的范围和/或内容,尤其当该用户没有足够时间或资源来单独地检查该数据集的所有要素时。例如,当用户将查询输入到搜索引擎内时,该用户可能被搜索结果的数量淹没,并且在没有结果的摘要的情况下可能不能够找出想要得到的信息。将大型数据集中的关键概念和想法可视化的能力可能有利于用户获取想要得到的信息并且得出正确结论。
[0015]将不同实体(例如,文档)表示为镶嵌的多边形的树图和泰森多边形(Voronoidiagram)可以用于可视化大型数据集。每个多边形的尺寸可以表示已经被指派给相应实体的度量。尽管树图和泰森多边形可以相对于实体的特定度量而概括数据集,但是这种图不能指示对实体的情感或实体之间的概念相似性。
[0016]本公开通过提供可视化的渲染来解决这些问题,该可视化传达数据集的多个方面,如该数据集的概念、对该概念的情感、该概念在该数据集中相对于彼此的重要性以及概念之间的相似性。例如,本公开中的可视化可以是几何形状的镶嵌图案,每个几何形状对应于该数据集中的标题(topic)。几何形状的尺寸可以指示相应标题在数据集中的重要性。几何形状可以被着色或被加阴影,以指示对相应标题的情感,并且与密切相关的标题对应的形状可以在该镶嵌图案中被放置为在空间上紧邻。此外,本公开中讨论的可视化可以以多个层次等级呈现概念,以允许用户以想要得到的粒度获取信息。
[0017]现在参照图,图1是示例设备100的框图,该示例设备100能够渲染数据集的层次可视化。设备100可以是服务器,如云服务器、远程服务器或客户端设备可访问的任何电子设备。设备100可以是客户端计算设备,如笔记本计算机、台式计算机、工作站、平板计算设备、移动电话、电子书阅读器或者适于显示数据集的可视化的任何其它电子设备。在图1中,设备100包括处理器102和机器可读存储介质104。
[0018]处理器102可以包括中央处理单元(CPU)、微处理器(例如,基于半导体的微处理器)和/或适于获取和/或执行存储在机器可读存储介质104中的指令的其它硬件设备。处理器102可以提取、解码和/或执行指令106、108和110,以能够如下所述的那样渲染数据集的可视化。作为获取和/或执行指令的替代或除获取和/或执行指令以外,处理器102可以包括包含用于执行指令106、108和/或110的功能的多个电子组件的电子电路。
[0019]机器可读存储介质104可以是包含或存储可执行指令的任何合适的电子存储设备、磁性存储设备、光存储设备或者其它物理存储设备。因此,机器可读存储介质104可以包括例如随机存取存储器(RAM)、电可擦除可编程只读存储器(EEPR0M)、存储设备、光盘等。在一些实现方式中,机器可读存储介质104可以包括非暂时性存储介质,其中术语“非暂时性”不包含暂时性的传播信号。如下面详细描述的,机器可读存储介质104可以被编码有一组可执行指令106、108和110,以识别标题、排序标题和使镶嵌图案被显示。
[0020]识别标题指令106可以分析数据集,以识别该数据集中的文档的各标题。应该理解,本文使用的术语“文档”指可以用于传达信息的任何形式的介质。文档可以包括文本信息(例如,文章、博客帖子/评论、研究论文、商业/金融/医疗记录或报告)、视频、照片、音频信息(例如,语音邮件、播客、音乐录音)、电子邮件消息、社交媒体活动、或者上述和/或其它合适的文档的任何组合。识别标题指令106可以使用光字符识别(0CR)、自动语音识别和/或用于确定文档主题的任何其它合适方法,来识别文档的标题。在一些实现方式中,可以通过读取与文档关联的主题标签或关键字标签来识别标题。
[0021]识别标题指令106可以将识别出的标题分成多个层次等级。应该理解,本文中使用的术语“层次等级”指数据集的组织中的特殊性的等级。位于相同层次等级的要素可以近似地具有相同的特殊性等级。第一层次等级可以是最高层次等级,并且具有最宽泛的标题。第二层次等级可以具有比最高等级标题更窄的并且被分组为最高等级标题下面的标题,该标题在本文中也被称为子标题。在本公开全文中,术语“层次的等级”和“层次等级”可互换地使用。识别标题指令106可以识别标题,并且基于与数据集关联的聚类图和/或层次树而将标题分类成不同的层次等级。例如,识别标题指令106可以识别与层次树的最高等级相关的多个标题,并且确定该多个标题属于标题的最高层次等级。识别标题指令106可以在聚类图中定位最尚等级标题,并且识别相应最尚等级标题的子标题。
[0022]应该理解,当数据集具有某一固有结构或组织时,识别标题指令106可以执行数据集的参数分析,而不是标题分析(即识别与数据集相关的标题)。例如,包括病人医疗记录的数据集可以按照诸如病人姓名、医疗情况和症状之类的参数来组织。识别标题指令106可以以与可以分类标题的方式相同的方式,将参数分类成各个层次等级。应该理解,本公开中与基于数据集标题分析的可视化相关的讨论还适用于基于数据集参数分析的可视化,或者基于数据集的任何其它合适分析的可视化。
[0023]排序标题指令108可以按重要性的顺序对识别出的标题进行排序。标题的重要性可以基于数据集中有多少文档与该标题相关。例如,与数据集中最多文档相关的标题可以被排序为最重要标题。与数据集中最少文档相关的标题可以被排序为最不重要标题。应该理解,可以使用用于排序标题的其它合适的基础,如与相应标题相关的文档已经被查看的次数,以及标题在社交媒体上的受欢迎度。排序标题指令108可以按照重要性的顺序来对最高层次等级中的标题进行排序。对于在最高层次等级中的每个标题,如果有相关子标题的话,那么排序标题指令108可以按照重要性的顺序对相关子标题(例如,最高层次等级下的第二层次等级中的标题)进行排序。
[0024]使镶嵌图案被显示的指令110可以使在计算设备上显示数据集的可视化。可视化可以包括几何形状的镶嵌图案,每个几何形状对应于识别出的标题。镶嵌图案可以具有与识别出的标题的多个层次等级对应的多个层次等级。该镶嵌图案中的第一多个几何形状中的每个可以对应于最高层次等级中的标题之一。如本文使用,术语“镶嵌图案(tessellat1n)”、“镶嵌(tessellate)”和“被镶嵌(^6886]^七6(1)”指利用填充平面的几何形状铺装该平面。在一些实现方式中,镶嵌图案可以没有形状的重叠和形状之间的间隙。在一些实现方式中,镶嵌图案可以包括形状的一些重叠和/或形状之间的小间隙(例如,窄的均匀的空间可以隔离每个形状的边界)。
[0025]第一多个几何形状的尺寸可以基于对应标题的排序。例如,第一多个几何形状之一的尺寸可以正比于其对应标题的重要性。也就是,第一多个几何形状中的最大几何形状可以对应于最高层次等级中最重要的标题(例如,与数据集中最多文档相关的标题)。第一多个几何形状中的最小几何形状可以对应于最高层次等级中最不重要的标题(例如,与数据集中最少文档相关的标题)。与几何形状关联的文本标签可以识别相应标题。例如,第一多个几何形状中的每个几何形状可以具有识别对应标题的文本标签。
[0026]可以在可视化中指示与标题关联的情感(sentiment)。如本文使用的,术语“情感”应该被理解为指由标题和/或其相关文档表达或引出的情绪或态度。第一多个几何形状中的每个几何形状可以具有与第一多个标题中的相应标题关联的情感的可视表示。可以基于与数据集中的文档关联的情感标签来确定与第一多个标题关联的情感。可视表示可以包括颜色、阴影图案、图标或情感的任何其它合适的指示符。例如,如果与标题相关的文档与指示愤怒的情感标签关联,那么与该标题关联的几何形状可以被着色为红色。如果与标题相关的文档与指示赞成的情感标签关联,那么与该标题关联的几何形状可以被着色为绿色。
[0027]该镶嵌图案可以具有第二层次等级,该第二层次等级具有第二多个几何形状。该第二多个几何形状可以对应于与最高层次等级不同的层次等级中的第二多个标题。该第二多个标题可以与第一多个标题中的一个(例如,第二多个标题可以是最高等级标题之一的子标题)相关。第二多个几何形状的尺寸可以基于第二多个标题按重要性进行的排序。第二多个几何形状可以与文本标签和情感关联。例如,第二多个几何形状中的每个可以具有识别对应标题的文本
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1