文档背景内可视化的文档搜索的制作方法

文档序号:16367468发布日期:2018-12-22 08:30阅读:154来源:国知局
文档背景内可视化的文档搜索的制作方法

搜索引擎允许用户在与他们对特定种类信息的需求或兴趣相关的文档语料库中搜索文档。为了执行搜索,用户向搜索引擎提交查询,例如由一个或多个单词组成的查询。响应于该查询,搜索引擎标识看起来与查询相关的文档,并返回被称为查询结果的至这些文档的链接列表。用户可以跟随查询结果中的链接以显示查询结果中所标识的文档或以其他方式与其交互。



技术实现要素:

提供本发明内容以用简化形式引入一些概念,这些概念以下在详细描述中进一步描述。本发明内容并非旨在标识所要求保护的主题内容的关键因素或必要特征,也并非旨在用于限制所要求保护的主题内容的范围。

描述了一种用于对文档的视觉表示进行注释的设施。该设施在显示设备上呈现文档的两个或更多个部分的视觉表示。该设施还在显示器上与所呈现的文档部分视觉表示中的一个或多个视觉表示中的每个视觉表示相结合地呈现注释,该注释传达对两个或更多个搜索事务进行描述的聚合信息的结果,在这些搜索事务的结果中包括所表示的文档部分。

附图说明

图1是示出了通常被并入设施在其上运行的至少一些计算机系统和其他设备中的一些组件的框图。

图2是示出了在一些实施例中由设施执行以编译搜索历史信息的过程的流程图。

图3是示出了在一些实施例中由设施存储和/或访问的数据的数据图。

图4是示出了在一些实施例中由设施执行以显示文档的视觉表示的过程的流程图,该文档的视觉表示反映了跨其查询跨文档的部分匹配的文档搜索事务进行聚合的结果。

图5-图8是均示出了设施的示例的显示图,该设施利用从匹配文档的部分的搜索事务聚合的信息来增强文档的视觉表示。

具体实施方式

发明人已认识到,关于文档搜索的信息构成了对文档及其有用方式的有价值的反馈。具体而言,发明人已确定,文档作者和其他人能够结合特定文档显示关于已经或将要与文档的不同部分(例如章节、页面、段落、句子、文档存储单元等等)匹配的搜索查询的信息将是有用的。

因此,发明人已构想并简化为实践用于在文档内可视化在包含文档的语料库内进行的文档搜索的结果的软件和/或硬件设施(“设施”)。在一些实施例中,对于文档的每个部分,设施(1)跨其查询与该部分匹配的文档搜索事务执行一个或多个聚合,随后(2)显示该部分的视觉表示,该视觉表示反映该聚合的结果。例如,在一些实施例中,设施(1)计算其查询与文档的每个段落匹配的文档搜索事务的数量,随后(2)显示文档的视觉表示,其中在每个段落旁边的空白部分中,彩色矩形经由其颜色指示其查询相对于其它段落与该段落匹配的文档搜索事务的总数。

在各种实施例中,该设施针对各种类型的文档部分进行操作,包括诸如章节、页面、列、段落、行、句子、构成文档的图形的节点、大纲元素、电子表格单元格、电子表格标签、图形等等的非排他性示例。这些可以出现在各种类型的文档中,包括文本文字处理文档;电子表格;幻灯片文档;大纲文件;布局,技术或建筑绘图文档;艺术文档;时间线文档;数据库记录;网页文件;电子邮件和其他类型的消息传送文档;等等。

在一些实施例中,设施使用诸如计数、最小值、最大值、均值、中值等聚合对每个文档部分的文档搜索事务中的信息执行各种聚合。在一些实施例中,设施在对它们进行聚合之前过滤匹配的文档搜索事务,例如通过对它们进行过滤以仅包括由以各种方式定义的特定组中的用户执行的事务;从特定地理位置或区域执行的事务;在任何尺度的特定时间段期间执行的事务;其查询结果列出5、20或100个最相关文档或文档部分中的文档部分的事务;搜索用户通过其查询结果来访问文档或文档部分或以其他方式与其交互的事务;等等。在一些实施例中,该设施类似地将搜索事务分组以用于对一个或多个因素的聚合,例如上面所标识的那些因素中的任何因素。

在一些实施例中,设施在经聚合的搜索事务之中包括如下搜索事务,尽管这些搜索事务实际上不匹配文档的部分,但是在不同条件下(例如与执行搜索事务的条件不同的当前或未来条件)将会匹配。例如,在搜索事务发生时未创建的文档,搜索用户通过搜索进行访问的权限不足的文档,还未被翻译成表达搜索事务查询的语言的文档等等。在一些实施例中,设施支持使用类似的功能来确定如果使特定的文档或文档部分可用于一群搜索用户则该特定的文档或文档部分的普及程度。

在各种实施例中,设施使用各种视觉属性来反映聚合的结果;这些视觉属性可以包括颜色的各个方面,包括色调、饱和度水平和/或亮度;图案;形状大小;形状类型;形状边界厚度等等。在一些实施例中,设施另外或替代地利用描述聚合结果的文本来注释文档,包括一些或所有匹配查询的副本;匹配查询数量的数字计数;对搜索结果中查询最频繁出现的位置的文本指示;查询最频繁匹配的用户或用户组的名称;查询最频繁匹配的时间段;等等。

在各种实施例中,设施利用各种图表和图形在视觉上增强文档表示,例如在每个文档部分旁边显示的图表或图形,如果用户悬停或触摸文档部分则设施针对文档部分显示的图表或图形,或应用于文档部分的不同类型的搜索信息注释等等。在各种实施例中,此类图表和图形具有各种类型,包括显示经聚合事务随时间的趋势的图形和图表;显示每个用户或每个用户组(例如靠前的搜索用户或用户组)的经聚合事务的图表和图形;显示事务背后的搜索用户的地理位置或区域的地图等等。在一些实施例中,设施使用替代显示方案,其中,该设施显示其中标识文档的各部分的图表或图形,而不是在文档的表示的上下文中包括文档搜索信息;例如,在一些实施例中,设施通过显示堆栈图表来这样做,其中每个堆栈标识其对应的文档的不同部分,并且其高度指示该文档部分的聚合结果。

在一些实施例中,设施提供了一种用于直接导航到与本文档的特定部分相同的查询结果中频繁出现和/或接近顶部的其他文档和文档部分的机制。

通过以上述方式中的一些或所有方式执行,该设施提供了关于文档及其各个部分的重要性和有用性的大量信息。

图1是示出了通常被并入设施在其上运行的至少一些计算机系统和其他设备中的一些组件的框图。在各种实施例中,这些计算机系统和其他设备100可以包括服务器计算机系统、台式计算机系统、膝上型计算机系统、上网本、移动电话、个人数字助理、电视机、相机、车载计算机、电子媒体播放器等等。在各种实施例中,计算机系统和设备包括以下各项中的零个或多个:用于执行计算机程序的中央处理单元(“cpu”)101;用于在使用程序和数据时存储程序和数据的计算机存储器102,包括设施和相关联的数据、包含内核的操作系统、以及设备驱动器;持久存储设备103,例如用于持久地存储程序和数据的硬盘驱动器或闪存驱动器;计算机可读介质驱动器104,例如软盘、cd-rom或dvd驱动器,用于读取存储在计算机可读介质上的程序和数据;以及网络连接105,用于将计算机系统连接到其他计算机系统以例如经由互联网或另一网络及其网络硬件(例如交换机、路由器、中继器、电缆和光纤、光发射机和接收机、无线发射机和接收机等等)来发送和/或接收数据。虽然如上所述配置的计算机系统通常用于支持设施的操作,但是本领域技术人员将意识到,可以使用各种类型和配置、并且具有各种组件的设备来实现设施。

图2是示出了在一些实施例中由设施执行以编译搜索历史信息的过程的流程图。在动作201中,设施从所标识的用户接收针对特定文档语料库(有时被称为“搜索域”,例如存储在公司的文档管理系统中的所有文档、在由技术标准制定组织颁布的一套标准中的所有文档、经由万维网可访问的所有文档等等)的文档搜索请求。文档搜索请求指定查询,例如由一个或多个单词组成的查询。在动作202中,设施执行搜索以标识与在动作201中接收的文档搜索请求所指定的查询匹配的文档节点或其他类型的文档部分。在动作203中,设施向请求用户呈现包含与在动作202中标识的匹配文档节点有关的信息的查询结果。在动作204中,设施存储搜索历史信息,在一些实施例中,该搜索历史信息包括诸如用户身份、搜索查询、日期/时间、在动作202中标识的匹配文档节点、以及用户后续针对查询结果中所标识的文档节点执行的任何交互(例如查看它们、编辑它们、对它们进行评论、将它们合并到其他文档中等等)之类的信息。在动作204之后,设施在动作201中继续以接收下一文档搜索请求。

本领域技术人员将意识到,可以以各种方式更改图2中所示出的以及下面讨论的每个流程图中的动作。例如,可以重新排列动作的顺序;可以并行执行一些动作;可以省略所示出的动作,或者可以包括其他动作;所示出的动作可以划分为子动作,或者多个所示出的动作可以组合成单个动作等等。

图3是示出了在一些实施例中由设施存储和/或访问的数据的数据图。一个或多个存储设备300包含文档部分的内容,例如文档节点的内容。存储设备还包含搜索历史信息,例如图2中所示出的动作204中存储的搜索历史信息。

图4是示出了在一些实施例中由设施执行以显示文档的视觉表示的过程的流程图,该视觉表示反映了跨其查询与文档的部分匹配的文档搜索事务进行聚合的结果。在动作401中,设施接收到请求以显示由该请求标识的文档。在动作402中,设施使得显示文档的视觉表示,在该视觉表示中可以在视觉上辨别文档节点或其他文档部分。在动作403中,对于文档部分中的至少一些部分,设施使得在该部分附近显示聚合与该部分匹配的已发出搜索查询的结果的指示。在一些实施例中,设施本身执行该聚合,而在其他实施例中,设施检索或接收在设施外部生成的聚合结果。如上面提到的,在一些实施例中,在聚合发生之前,以各种方式过滤与每个节点匹配的搜索事务。示出设施执行动作402和403的示例在图5-图8中示出并在下面讨论。在动作403之后,该过程结束。

图5-图8是均示出了设施利用从与文档的部分匹配的搜索事务聚合的信息来增强文档的视觉表示的示例的显示图。图5示出了样本文档的第一经增强视觉表示。该文档表示500至少包括段落510、520、530和540。此处,设施将这四个段落中的每个段落视为文档部分,其中针对文档部分单独显示经聚合搜索信息的视觉指示。在各种实施例中,这些段落中的每个段落对应于不同的例如文档节点、文档章节、大纲元素等等。可以看到,在段落530的左侧,设施已经使得显示利用图案551填充的经聚合搜索信息的视觉指示531。通过参考图案记号550,可以看到视觉指示531指示段落530以相对低的频率出现在搜索结果中。类似地,指示511指示段落510以较高的中等频率出现;指示541指示段落540以更高的中等频率出现;并且指示521指示段落520以高频率出现。如上面提到的,在各种实施例中,设施在具有或没有显式记号的情况下使用各种其他视觉属性来传达类似信息,例如色调、饱和度、亮度等等。还如上面提到的,在一些实施例中,用户可以与该显示器交互,例如通过触摸或悬停在文档部分或相关联的指示上以显示针对该部分的各种类型的另外搜索信息。

图6示出了样本文档的第二经增强视觉表示。在显示器600中,设施显示搜索信息的文本指示,此处是文档部分在搜索结果中的最高位置。例如,指示611表明,在存在段落610的搜索结果中,其最高位置是数字3;指示621表明,在存在段落620的较大搜索结果集中,其最高位置是在10个结果中;并且指示631表明,在其中存在段落630的搜索结果中,其最高位置是在最后10个结果中。

图7示出了样本文档的第三经增强视觉表示。在显示器700中,设施显示搜索信息的文本指示,此处是由每个文档部分匹配的一个或多个查询。例如,指示711指示段落710与包含单词“modern(现代)”和“enterprise(企业)”的查询匹配;指示721指示段落720与包含单词“pay(支付)”,“as(随)”,“you(你)”和“go(使用)”的第一查询匹配,与包含单词“cloud(云)”的第二查询匹配,并且与包含单词“scalable(可缩放)”的第三查询匹配;等等。

图8示出了样本文档的第四经增强视觉表示。在该显示器中,文档表示是文档节点的图800。具体而言,该文档表示示出了表示整个文档的文档根节点811通过“包含”边连接到文档内容节点821和822。文档内容节点821表示文档的“摘要”部分,并且通过“包含”边连接到文档内容节点831-833。文档内容节点831-833中的每个节点表示由内容节点821表示的文档的“摘要”部分中的不同句子。可以看到,设施已经利用对节点在搜索结果中出现的频率进行指示的图案来填充每个内容节点831-836。在一些实施例(未示出)中,与特定内容节点匹配的搜索事务另外或替代地归因于文档图的与最直接表示匹配内容的节点具有包含关系的一个或多个节点。

在一些实施例(未示出)中,图3中所示出的搜索历史信息320存储在文档图中,如由图8中所示出的文档表示所描绘的文档图。例如,在一些实施例中由设施使用的第一方法中,内容节点(例如内容节点831-836)均直接包含节点的聚合结果、或者与节点匹配的各个事务中的一些或全部信息。在一些实施例中由设施使用的第二方法中,对于每个内容节点831-836,内容节点通过“查询”边连接到单个查询节点,该查询节点直接包含所连接的内容节点的聚合结果、或者与所连接的内容节点匹配的单个事务中的一些或全部信息。在一些实施例中由设施使用的第三方法中,对于每个内容节点831-836,内容节点通过“查询”边连接到一个或多个查询节点,每个查询节点表示与所连接的内容节点匹配的单个搜索事务;这些查询节点中的每个查询节点包含有关它所代表的搜索事务的信息。在一些实施例中,在第三方法中,每个查询节点通过“发出”边连接到表示发出搜索事务请求的用户的用户节点。这些用户节点包含关于用户的信息,在一些实施例中,这些信息包括可以用于检索诸如用户的姓名和职位之类的信息的用户标识符、用户所在的组的身份、用户执行的其他活动等等。在诸如上面所描述的那些实施例中,设施访问文档图中的搜索信息,以便显示反映针对文档部分的经聚合搜索信息的指示。

在一些实施例中,该设施提供了一种计算机可读介质,所述计算机可读介质具有被配置为使得计算系统进行以下操作的内容:对于包括文档部分的文档:生成对所述文档的至少一部分的视觉表示,所述视觉表示包含两个或更多个文档部分的视觉表示;对于其视觉表示被所述文档的视觉表示包含的文档部分中的至少一个文档部分中的每个文档部分:执行对描述两个或更多个搜索事务的信息的聚合操作以获得聚合结果,在所述两个或更多个搜索事务的结果中包括所述文档部分;根据所获得的聚合结果来对所述文档的视觉表示中的所述文档部分的视觉表示进行注释;以及使得显示所述文档的经注释的视觉表示。

在一些实施例中,所述设施提供了一种基础处理器的设备,包括:显示器;处理器;以及具有使得所述处理器进行以下操作的内容的存储器:在所述显示器上呈现文档的两个或更多个部分的视觉表示;以及在所述显示器上与所呈现的文档部分视觉表示中的一个或多个视觉表示相结合地呈现注释,所述注释传达描述所呈现的文档部分被包括在其结果中的两个或更多个搜索事务的聚合信息的结果。

在一些实施例中,所述设施提供了一种存储表示文档的数据的计算机可读介质,包括:针对所述文档的文档根节点;包含边,每个包含边将文档内容节点连接到所述文档根节点以指示所述文档内容节点的内容被所述文档根节点包含;所连接的文档内容节点;以及与选择的多个连接的文档内容节点中的每个文档内容节点关联的与所述文档内容节点的内容匹配的较早发出的搜索查询有关的信息。

本领域技术人员将意识到,上述设施可以用各种方式来直接适配或扩展。虽然前述描述参考特定的实施例,但本发明的范围仅由所附权利要求和其中所记载的元素来限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1