使用基于文本分析的智能特征建议进行文档美化的制作方法

文档序号:17049224发布日期:2019-03-05 19:52阅读:224来源:国知局
使用基于文本分析的智能特征建议进行文档美化的制作方法

本发明涉及使用基于文本分析的智能特征建议进行文档美化。比如,所提供的智能特征建议对于帮助用户美化数字文档是有用的。



背景技术:

在高级设计布局中,文章、故事、书籍和其他文档类型通常由作者和编辑使用如googledocs、microsoftword等文字处理编辑器以文本形式编写。一旦文章或其他文档由作者编写(并且可能由编辑修订),通常其就被传递到设计者或其他用户,以使用诸如adobeindesign之类的桌面排版应用来美化(例如,准备好排版或外部分发)。美化可以像原来编写和编辑一样花费大量(或更多)努力。美化常常分为两个部分:探索和应用。探索是美化的创造性方面,其中设计者进行最初的设计工作,探索哪类属性与文档各个部分协调。另一方面,应用是编辑过程,其中用户找到类似文本元素(如标题、子标题等)和上下文的部分,并且应用在探索期间设计者已经决定使用的相同属性。

比如,文本文档通常由各部分组成,其中每个部分是构成特定类型的文本元素的词(例如,连续词)组或其他文本,举例来说,诸如作为同一题目、标题、子标题、公式、段落正文、字幕的一部分。在探索中,设计者正在决定属性的类型,诸如字体选择、特征、尺寸等,以应用于文档中的各种文本元素中的每种文本元素。例如,可以在文档的一部分中进行探索。然而,在跨文档的其余部分的适当上下文中一致地应用这些特征所致的努力会使得整个美化成为非常耗时的过程。

附图说明

所要求保护的主题的实施例的特征将随着以下具体实施方式的进行并且参照附图而变得显而易见,其中相同的附图标记描绘相同的部分。

图1是根据本公开的实施例的用于实现用于基于文本分析进行智能特征建议的自学习模型和装置的示例网络计算环境的示意图。

图2是图示了根据本公开的实施例的用于使用基于文本分析的智能特征建议进行文档美化的示例装置的框图。

图3a至图3b是根据本公开的实施例的用于基于文本分析的智能特征建议的示例图形用户界面(gui)的屏幕截图。

图4a至图4b是根据本公开的另一实施例的用于基于文本分析的智能特征建议的示例图形用户界面(gui)的屏幕截图。

图5是根据本公开的实施例的如可以在图2的装置中使用的示例文本文档美化电路的框图。

图6是根据本公开的实施例的示例文本文档美化方法的流程图。

图7是根据本公开的另一实施例的示例文本文档美化方法的流程图。

尽管以下具体实施方式将参照说明性实施例进行,但是根据本公开内容,许多备选方案、修改方案和变型方案对于本领域技术人员而言将是显而易见的。

具体实施方式

本公开的一个或多个实施例旨在利用文档的美化来增强用户的体验。在一个实施例中,一种通过计算机处理器进行电子文档美化的方法包括:接收对进行美化的文本的用户选择。选定文本包括至少一个区段的至少一部分。该方法还包括:将选定文本分类到至少一个区段所表示的对应的至少一个文本元素。比如,处理器可以使用启发式分析来将选定区段自动分类为该区段最能表示的文本元素。该方法还包括:对可适用于至少一个文本元素的属性的集合进行排序。例如,对特定属性的排序可以反映用户将该属性应用于表示至少一个文本元素的区段的可能性(例如,由处理器通过分析用户随着时间推移的属性选择来决定)。这里,较高的排序可以表示用户在这个上下文中应用的可能性高于用户不太可能应用的其他属性。该方法还包括:向用户呈现最高排序的属性的有序列表,以及从用户接收对所呈现的属性中的一个或多个属性的选择。

该方法还可以包括:突出显示选定属性所应用到的选定文本的那些部分,以在视觉上将这些部分与选定文本的其余部分(选定属性未应用到的)区分开。例如,突出显示可以在逐区段的基础上突出显示选定属性中的至少一个选定属性所应用到的那些区段。在另一实施例中,突出显示包括:进一步通过处理器分析以标识受选定属性影响的至少一个区段内的特定字符,以及仅突出显示那些字符。比如,突出显示可以在应用属性之前完成,以提供对受影响的文本的总体或精确标识。该方法还包括:将选定属性应用于选定文本。每个选定属性被应用于选定文本中的与选定属性可适用的至少一个文本元素相对应的一部分。例如,依据诸如选定的文本、所表示的文本元素以及可适用于所表示的文本元素的属性之类的因素,应用可以在逐属性和逐区段的基础上是选择性的。比如,选定文本中的公式可能会经历一种美化,而标题可能会经历另一种美化。

例如,被美化的文本文档可以是由编写者、编辑或其他作者提供的论文、文章、书、多媒体项目、广告等。该文件具有以多个区段组织的文本。例如,每个区段可以是组成并且表示共同文本元素的单词或字符(诸如顺序或相邻单词或字符)组。示例文本元素包括比如题目或其他标题、数学或科学公式、外语短语或段落(诸如正文段落)等等。该方法包括:接收对进行美化的文本的用户选择。选定文本包括区段中的一个区段(诸如第一区段)的至少一部分。该方法还包括:将选定文本分类为由第一区段表示的文本元素中的对应的一个文本元素(诸如第一文本元素)。该方法还包括:对可适用于第一文本元素的属性(例如,特征)的集合进行排序,并且向用户呈现最高排序的属性的有序列表。例如,属性可以是字体类型、字体大小和字体质量,诸如位置、重点、间距等等,并且有序列表可以是有序下拉式菜单或其他gui元素。该方法还包括:(例如,从用户)接收对所呈现的属性中的一个或多个属性的选择,将选定属性应用于选定文本,并且对可适用的属性进行重新排序以反映选定属性。比如,选定属性的排序可能比将其应用于选定文本之前的排序相对更高,以便最高排序的属性的未来呈现将使选定属性在列表中显现得更高。

在本公开的一个或多个实施例中,属性(或特征)被认为可适用于基于静态准则和动态准则的特定文本元素类型。可适用的属性又可以在最高排序的可适用属性的有序列表中被呈现给用户。在一些实施例中,当属性是用于文本元素的默认属性(例如,化学式编号的下标)时,或者当用户早在文档的美化过程中已经挑选属性时(例如,当选择只有该类型的文本元素的区段时),属性被决定为可适用于特定类型的文本元素。例如,在一些实施例中,用户可以通过下拉式菜单来访问任何可用属性,该下拉式菜单与最高排序的可适用属性的呈现不同。在一些实施例中,当用户已经挑选用于仅美化其他文档中的文本元素类型的区段的属性时,该属性可以被指定为可适用的。在一些实施例中,当特别美化该类型的文本元素的区段时,用于文本元素的默认属性基于其他用户的使用来挑选。

在一些实施例中,最高排序的属性的有序列表的呈现处于图形用户界面(gui)中,其突出显示受属性改变影响的选定区段。这允许用户在实际上将改变应用于文档之前查看改变的程度。

根据一些实施例,在文档的美化中,通过用户对应用于这些区段的文本的属性(例如,字体大小、样式、效果等)的挑选来美化特定文本元素类型(例如,题目、公式、普通文本等)的文本(例如,区段)的选择。这些属性相对于文本元素变得可适用。如此,在对作为同一文本元素的文档的后续区段进行美化期间,可以向用户自动呈现可适用于文本元素的最适用(例如,最常用、最高排序)属性的有序列表。因此,用户可以基于针对文档的先前区段挑选的内容,容易地为文档的后续区段的属性挑选适当的选择。

根据本公开内容,本文中所提供的技术的许多应用将是显而易见的。一个具体示例用例包括美化电子文本文档的计算机实现的方法。该方法可以通过诸如计算机处理器、微处理器、在个人计算设备上运行的文字处理器等之类的处理器来实现。

总体概述

在本公开的各种实施例中,为桌面排版应用提供了智能工具,其减少、最小化或消除了以贯穿文档的一致的方式和适当的上下文来应用设计挑选的编辑努力。例如,考虑opentype(可扩展计算机字体的格式)特性或属性。字体通常具有可以由字体设计者在美化文档时决定的若干个opentype特征或属性。举例而言,示例字体特征包括字体大小、间距、大写和格式化等等。应用(诸如桌面排版应用)可以基于对被美化的文本的特定部分或区段的可用性和适用性准则来向用户呈现这些特性。例如,特性或属性可以通过gui界面(诸如下拉式菜单)呈现给字体设计者。

在其他技术中,该呈现可以是固定呈现。比如,呈现可以使用固定优先级或次序来呈现可以改变的可能属性,诸如在下拉列表中以相同次序呈现属性。进一步地,这个优先级或排序可以保持固定,诸如总是以相同次序呈现属性。在这样的方案下,最相关的建议(诸如所选择的最近属性)可能甚至不会在下拉式菜单上示出。例如,在一些情况下,最相关的建议可能需要用户进行滚动或其他交互以使其可见。如此,使文本呈现最有吸引力的特征甚至不会显现给进行美化的设计者。

因此,按照实施例,基于对由设计者正在美化的文档的文本分析,提供用于自学习模型和装置的技术用于智能特征建议。使用这样的技术,用于美化的可适用属性的自动呈现可以基于例如用户在文档中的相同类型的区段上的属性的先前选择来利用上下文信息。为了便于描述,本文中所讨论的技术主要从应用opentype特性来美化文档中的文本的角度来看,但是其他实施例不限于此。例如,在其他实施例中,可以利用在gui元素(例如,下拉式菜单、色带、上下文鼠标选择等)中反映的类似的优先级化或呈现改变来对其他特征(诸如段落布局、总体样式、页面格式、公式生成等)进行属性改变。按照实施例,不是基于诸如哪些属性改变是可用的或可适用的考虑来简单地呈现选项,而是将用户文档的当前上下文作为可用或可适用的属性改变的呈现的因素,诸如哪些属性改变是在当前文档中已经被美化的类似区段(例如,相同类型的区段)中已使用。

在一个具体示例实施例中,美化过程分为几个模块,其包括上下文标识模块、特征标识模块、特征排序模块和用户反馈模块。上下文标识模块分析正在被美化的文档的选定区段的上下文,并且将该区段分类为多个不同文本元素(例如,标题、公式、正文等等)中的一个文本元素。特征标识模块标识属性(例如,可用或可适用于选定文本元素的文本设计改变)。特征排序模块基于例如用户在文档中的可比较上下文中做出的、或者用户在类似文本上下文中的其他类似文档中做出的、或者其他用户在其他类似文本上下文中的其他类似文档中做出的最近选择来对用于当前上下文的所标识的特征(或属性)进行排序。例如,在一些这样的实施例中,与最近未被选择的属性相比,特征排序模块将用于特定文本元素的最近选择的属性排序更高。

用户反馈模块从对经排序的属性的用户选择(或就此而论,属性的任何选择)获得反馈。例如,在一个实施例中,对于文档内的不同文本元素中的每个文本元素,用户反馈模块维护用于美化该类型的文本元素的每个属性的分数。比如,可以基于用户在其他这样的文档中选择的(例如,最初给予这样的属性较高的分数)或者当美化这样的文档时由其他用户选择的属性来初始化分数。然后,在用户选择或以其他方式选择应用于特定文本元素的区段的属性的情况下,增加用于该属性(和文本元素)的分数。因而,随着用户美化文档,被频繁选定的属性相对于其他(例如,未选定的)属性获得逐渐更高的分数,使得那些所挑选的属性通过特征排序模块在该文档(以及可能由用户美化的未来文档)中排序更高。

在一个或多个实施例中,上下文标识被假定为应用特定的或用例特定的。例如,在一个实施例中,构造分类的启发式模型,其考虑正在被分类的文本的各区段中的各种因素(诸如单词和其他表达式中的字符的类型和排列)。如将在下文更详细讨论的,启发式模型然后将这些区段分类为类别集合(例如,预先定义的集合)。然而,其他实施例不限于此,并且应用(诸如桌面排版应用)可以使用其他技术来标识上下文。

体系架构和方法

图1是根据本公开的实施例的用于实现用于基于文本分析进行智能特征建议的自学习模型和装置的示例网络计算环境100的示意图。在图1中,用户160、170和180美化存储在本地设备(例如,个人计算机160、智能电话170、或其他计算设备,诸如平板电脑、工作站、个人数字助理(pda)等等)上的或远程存储(诸如在服务器150(例如,由客户端计算机180访问的)、服务器140(例如,通过通信网络110(例如,因特网)访问的)、文档存储云120或其他远程存储设备上)的源文档。用户160、170和180使用自学习模型和装置(诸如本地计算设备(例如,个人计算机160、智能电话170、或其他计算设备)或远程计算设备(诸如服务器150、服务器140或应用存储云130)上可用的工具)来美化源文档。

在一些实施例中,工具向用户160、170和180呈现诸如gui之类的界面,以使得能够美化源文档。gui可以在下拉式菜单中呈现选项,诸如优先化选项,用于美化源文档的文本。在一个或多个实施例中,优先化选项的次序动态地改变以反映用户160、170和180在美化源文档的先前部分或其他部分中文本的类似区段时选择的选项。

图2是图示了根据本公开的实施例的使用基于文本分析的智能特征建议进行文档美化的示例装置200的框图。用户使用装置200来美化文档。装置200可以是被配置为进行桌面排版的客户桌面排版设备,诸如工作站、个人计算机或膝上型计算机。装置200的一个或多个部件可以是软件或固件,其被配置为在计算机处理器上执行并且基于如本文中所描述的文本分析来执行智能特征建议。

桌面排版应用可以支持用于文本对象的各种文本相关的特征,诸如连字、自由连字、小写字母、分数、花饰等等。这些或类似特征中的每个特征都可以最适合于特定区段或文本元素。比如,花饰可以最适合文档的题目,而自由连字可能最适合于文档正文,但不适用于页脚区段。另外,当数字是段落的一部分时,分数或表格图形可能更有意义。一般而言,类似规则可以被描述为文档的其他文本元素或者被动态地确定为文档的美化的一部分。

参考图2,正在被美化的文档的用户选定文本205被输入到装置200。用户旨在将属性应用于选定文本205。装置200可以具有文档的不同区段被分类到的若干个(例如,预先确定的数目)的不同文本元素或类别。这些可以包括题目和子题目、数学式和化学式、分数、日期、文本之间的数字、缩写词、外来词(诸如文档的语言以外的语言中的单词或短语)、专有名词(诸如名称或地点)等。因而,用户选定文本205可以包括与这些类别(或文本元素)中的一个或多个类别相对应的文本的区段。选择205可以是小的(诸如字符或单词)或大的(诸如文档的段落、文本框或实质部分)或中间的某处(诸如句子或公式)。选择可以包括一个或多个不同类型的文本元素(或类别)的区段或整个区段的各部分。

分类模块210被用于分类用户选定文本205。在一些实施例中,整个选择被用于将其分类为预先确定的类别中的一个类别(例如,作为所遇到的第一类别、或者作为所遇到的最主要类别、或作为在有序列表或类别层次中遇到的最高类别等)。在一些其他实施例中,整个选择被用于将其分类到文本元素中的一个或多个文本元素(例如,由选定区段中的一个或多个区段或其部分表示的文本元素中的每个文本元素)。在一个或多个实施例中,启发式规则被用于分类。通过示例,装置200可以基于关于现有文本的某些属性的启发式模型来将选择分类为预先定义的类别中的一个类别。例如,题目可以通过使用较大的字体大小或在短语的第一字符以外的位置中使用大写字母而与文本的其他区段分开设置。分类模块210基于这些启发式来输出检测到的上下文215。

更详细地,在示例实施例中,针对上述示例类别中的每个示例类别实现启发式规则。题目和子题目由字体大小标识。例如,可以针对文档维护平均字体大小、最小字体大小和最大字体大小。然后,大于平均值的任何文本都可以被认定是题目或子题目(诸如最大字体大小的文本是题目,平均字体大小和最大字体大小之间的文本是子题目)。其他启发式规则可以包括在连续单词中使用所有大写字母或词首大写字母来指示题目或子题目。其他规则还可以包括使用下划线来指示题目或子题目。在数学式或化学式的情况下,可以使用字母数字单词或连续字符的使用来指示公式。其他指示符包括使用某些符号或惯例(诸如不是正常标点符号的单个字符、或公认化学元素标识符的(具有词首大写字母)的双字母组合),这些符号或惯例通常指示可以使用的公式。例如,可以对可能的化学式进行进一步解析,以查看它们在被如此分类之前是否是有效公式。

继续示例启发式规则,分数可以通过数字之间的单个“/”来标识,而日期可以遵循用于编写日期的某些建立的或标准的格式。另外,外来单词可以被标识为不属于该文档的语言,而是属于另一语言。例如,分类模块210可以维护包括文档的语言的各种语言的字典。在一个实施例中,分类模块210可以通过标识用于每种语言的单词的数目并且将文档中具有单词最多的语言(例如,主导语言)标识为文档的语言来建立文档的语言,并且所有其他单词都是外来词。用于外来词的其他规则可以包括使用某些惯例(诸如斜体)来指示外来词。类似地,专有名词可以使用类似于外来词的技术(诸如使用专有名词的词典)来标识。

分类215被输入到排序模块220,排序模块220使用例如排序模型算法来对用于所确定的上下文215(例如,文本元素或多个元素)的可适用属性的集合进行排序。许多属性(例如,当组合或通过精细可调参数考虑时数百或甚至数千个)可用于修改文本的区段。诸如字体大小、特点、特征、上下文等之类的属性可以为用户或设计者呈现看似无穷无尽的挑选阵列。然而,在任何给定文档中,基于诸如在选定文本中表示什么类型的文本元素、在用户或其他设计者的其他类似文档中通常使用什么类型的文本元素、用户已经在当前文档中使用什么类型的文本元素、在美化之前现有文本中是什么类型的文本元素等之类的因素,仅使用这些属性中的相对较少的属性。因而,在一些实施例中,对于每个文本元素,装置200维护可适用属性的集合。该集合可以被默认为公共属性(例如,用于题目的小写)组,诸如其他用户(或者在先前美化的文档中使用的当前用户)在这样的文档使用的属性以及当用户明确选择该属性以应用于表示该文本元素的特定区段时为特定文本元素添加的新属性。

对于每个这样维护的属性(以及对于每个文本元素),跟踪并且更新分数或经训练的权重(或其他这种排序准则)。例如,将这样的属性应用于特定类型的文本元素的选定区段会增加该属性相对于该文本元素的其他可适用属性的分数或权重(以及如果该属性不在那里,则将该属性添加到用于该文本元素的可适用属性的集合)。排序模块220的输出是属性(或特征)的有序列表,诸如第一特征222、第二特征224等等,一直到第n特征228。例如,在一些实施例中,n=5。然而,在一些其他实施例中,n的值可以变化。第一特征222是用于该文本元素的最相关(例如,最高评分或最高排序)属性,第二特征224是第二最相关属性等等。将同一属性连续应用于特定文本元素的各区段最终会使得该属性成为用于该文本元素的排序最高的特征。

更详细地,在一个实施例中,用户选定文本205被考虑用于找到正确特征集合以进行建议。分类模块210处理选定文本中的每个单词并且判定通过其分类单词的可能文本元素。可能分类可以诸如通过简单优先顺序(例如,题目,然后是公式,然后是分数,然后是日期,然后是专有名词,然后是外来词等等)和所挑选的最主导顺序来排序。在另一实施例中,考虑连续单词(例如,相对于孤立考虑每个单词,共享公共文本元素的连续单词均被认为是该文本元素)。如此,形成连续单词的区段,每个区段表示文本元素中的一个文本元素。整个选择205的分类215可以基于例如选择205内的文本元素中的最多数文本元素。一旦选择205的类别215被标识,则特征排序222,224,......,228可以基于单个查找表,该查找表包含针对特定类别的每个特征的分数。查找表的单元格可以标识针对上下文类别的特定特征的分数。所有特征可以按照它们各自分数的降序排序,并且前n个特征被传递到应用以供建议。依据实施例(例如,用户要求或偏好),参数n可以被预设(诸如n=5)或被定制。

在一些实施例中,检测的上下文215包括多个文本元素,诸如用于由选定文本205中的各区段所表示的每个不同文本元素的文本元素。因而,排序后的特征222,224,......,228包括来自选定文本205中表示的文本元素中的一些或全部文本元素的可适用属性的属性。比如,在一个实施例中,排序模块220对每个文本元素内的可适用属性中的每个可适用属性进行排序,然后合并来自检测的上下文215中的表示的文本元素中的每个文本元素的排序最高的属性以创建排序后的特征222,224,......,228。在另一实施例中,排序模块220合并来自所有文本元素的所有可适用属性,基于它们的分数或权重对它们进行排序,并且选择前n个属性,而不管n个选定属性中的不同文本元素的表示。

选定特征222,224,......,228被输入到图形用户界面(gui)230用于呈现给用户。比如,在一个实施例中,gui230按照从最高评分(在顶部)到第n最高评分(在底部)的降序来在下拉式菜单中呈现特征。用户选择用户想要应用于选定文本205的一个或多个特征。在一些实施例中,选定文本205受一个或多个选定属性(以及如果多于一个文本元素由特征222,224,......,228表示,则一个或多个相关联的文本元素或多个文本元素)影响的各部分被突出显示给用户,以与选定文本205的其余部分(其不受一个或多个选定属性或属性影响)区分开。装置200将由用户或设计者选择的特征应用于文档(或者更确切地说,应用于表示其属性从gui230被选择的文本元素的选定区段)。

另外,在一些实施例中,排序训练模块240记录一个或多个用户的挑选并且调整分类-特征网络的权重以反映用户或设计者的一个或多个挑选。例如,选定特征(和文本元素)的权重相对于任何未选定特征的权重增加。如此,基于该反馈对排序模型进行训练以生成用于网络的新权重245以供在来自用户的后续查询中使用。因而,装置200用作用于基于文本分析进行智能特征建议的自学习模型。

图3a至图3b是根据本公开的实施例的用于基于文本分析的智能特征建议的示例图形用户界面(gui)的屏幕截图。在图3a至图3b中,正在对文档(特别地,文本选择310)进行美化。选择310具有各种字体方面,诸如作为题目的指示符的词首大写字母和较大的字体。在图3a中,题目310在设计过程的早期被美化,系统不知道用户倾向于针对题目使用小写。因而,所建议的属性的gui呈现320仅仅是个通用列表。然而,在图3b中,美化过程稍微再向前,并且用户已经将小写属性应用于题目。因而,gui建议列表330具有小写作为在题目310上使用的第一建议属性。在另一实施例中,小写是用于题目的默认属性,因此从一开始就向用户呈现与列表330类似的列表。

图4a至图4b是根据本公开的另一实施例的用于基于文本分析的智能特征建议的示例图形用户界面(gui)的屏幕截图。在图4a至图4b中,图3a至图3b中的文档的不同部分正在被美化,在这种情况下,化学式410和刚好就在化学式之前的单词。在图4a中,系统将选定文本标识为包括化学式,因此呈现包括下标作为第一建议的gui列表420。然而,用户有时对(例如,由用户美化的其他文档中的)化学式应用小写,使得属性显示在列表420中的第二项。应当指出,gui列表420示出了选定文本410在应用对应属性之后看起来怎样的预览(对于每个属性)。在一些实施例中,选定文本410被突出显示以示出受来自列表420中的任何选定属性影响的各部分。在图4b中,情形类似于图4a中的情形,不过用户已经通过将小写应用于化学式进行了美化。因而,系统随着时间的推移增加用于化学式的小写属性的权重,并且小写现在在gui列表430中被显示为顶部建议的属性以应用于选定文本410。

在本公开的一个或多个实施例中,对于所有类别(或文本元素),每个特征(或属性)最初被赋予相等权重。然后,可以对测试数据运行训练模型以适当地更新权重(例如,将权重初始化为更多反映用于不同类别的良好属性默认值的值)。比如,用于培训的数据可以是从应用这些特征来美化其文档的用户收集的历史数据。随着时间的推移,模型将具有实质数据以适当反映权重,而与进一步迭代的偏差最小或可忽略。在这点上,设计者偏好会调整初始化的权重,该初始化的权重的值更加反映了设计者的美化品味或要求。

在一些实施例中,用于排序模块的训练是本地的:排序模块仅考虑当前用户所采取的动作(例如,本地训练)。比如,在如上文所描述的初始化权重之后,进一步的调整来自用户无论是在当前文档上还是在由用户美化的先前文档上的动作(例如,用户针对特定文本元素的属性的选择或挑选)。如此,排序模块的权重可以基于他们更经常使用的特征而在不同用户之间变化。当用户想要比一般用户所基于的更频繁地使用一些特征时,这非常有用。这种技术单独迎合每个用户的风格。它还快速响应用户风格的改变。在一个实施例中,用户的权重训练数据保留在专用于用户的客户端计算机上,其中没有权重数据发送或存储在中央服务器上。

在一些其他实施例中,所有权重训练(例如,排序)全局发生,从而汇集许多用户的属性选择(例如,全局训练)。这里,排序模块考虑了所有用户在生成用于不同文本元素类型的属性权重中的选择。如此,这个模型中所有用户的权重相同,并且每个用户在相同的上下文中看到相同的建议属性的有序列表。这种技术可以帮助用户发现其他设计者经常使用的更多特征。因而,这项技术中的推荐从庞大的用户池中建立,因此表示相对标准的或普通的美化特征。进一步地,除非两个属性具有几乎相同的权重,否则使用该技术提出的建议每天保持相对固定。在一个实施例中,训练发生在中央服务器上,中央服务器可以用作用于所有不同用户对全局权重的贡献的便利存储库。

在又一些其他实施例中,权重训练既在本地也在全局进行(例如,混合训练)。这里,当前用户的使用可以具有比其他用户更高的权重,以实现个性化。然而,来自全局用户的权重仍然使得全局偏好出现在建议的属性列表中(或许较少的属性列表,或者在列表上较低位置出现)。因而,用于每个用户的权重可能会不同,但是仍然反映了全局趋势以及用户自身风格。这种技术可以帮助用户建立公共美化或日常美化,以及一旦用户习惯于这样做,允许用户逐渐使用用户自己的品味取代那些挑选中的一些挑选。

图5是根据本公开的实施例的可以在图2的装置200中使用的示例文本文档美化电路500的框图。比如,如下文更详细讨论的,图5的美化电路500的部件中的一些部件可以是执行图2的装置200的不同部件的角色的示例电路。图6是根据本公开的实施例的文本文档美化的示例方法600的流程图。

本文中所描述的方法600和其他方法可以以硬件或软件或两者的某种组合来实现。例如,方法600可以由图5的文本文档美化电路500来实现。在另一实施例中,方法600可以被实现为定制电路,诸如被配置为执行方法600的现场可编程门阵列(fpga)。在一些其他实施例中,方法600可以被实现为一系列计算机指令,诸如软件、固件或两者的组合,以及一个或多个计算机处理器(例如,一个或多个微处理器)。指令当在给定处理器上被执行时使得方法600被执行。例如,在一个或多个实施例中,提供了一种计算机程序产品。该计算机程序产品包括编码有指令的一个或多个非瞬态机器可读介质(诸如光盘、数字视频光盘(dvd)、固态驱动器、硬盘驱动器、随机存取存储器(ram)、只读存储器(rom)、片上处理器高速缓存等),该指令当由多个计算机执行时,使得用于文本文档美化的方法600(或本文中所描述的其他方法)被执行。在一些实施例中,机器可读介质位于服务器或基于云的计算机可通过网络访问的非瞬态存储设备上。

应当领会,方法600可以以分布式方式(诸如在多于一个计算设备或处理核心上)执行。另外,虽然本文中所描述的方法可能看起来对其操作具有特定次序,但是其他实施例可以不是如此限制。因而,如根据本公开内容显而易见的,操作的次序可以在实施例之间变化。另外,操作中的一些操作是可选的,并且可以出现在一些实施例中而不出现其他实施例中。

类似地,本文中所公开的美化电路500和其他电路可以是定制硬件电路或通用计算机硬件(例如,通过软件、固件、定制逻辑等等),其被配置为执行指派给电路的任务。虽然电路被图示为按功能由其他电路组成,但是在其他实施例中,两个或更多个电路可以被组合成执行两个或更多个电路的功能性的单个电路。在其他实施例中,单个电路可以被分成两个或更多个电路,每个电路执行单个电路执行的单独功能。

参考图5的文本文档美化电路500,用户将文本文档的选定文本505输入到美化电路500。选定文本接收电路510接收该文本选择505,并且将选定文本505传递到选定文本分类电路520,该选定文本分类电路520将选定文本505分类到一个或多个文本元素。选定文本分类电路520是可以执行图2中的分类模块210的角色的示例电路。例如,分类基于启发式规则,以将选定文本505分割为区段,其中每个区段对应于(或表示)文本元素中的一个文本元素。这种分类被传递到可适用属性排序电路530,可适用属性排序电路530对在选定文本505中表示的一个或多个文本元素的可适用属性进行排序。可适用属性排序电路530是可以执行图2的排序模块220的角色的示例电路。排序后的属性被传递到最高属性呈现电路540,最高属性呈现电路540基于排序后的属性向用户(例如,通过gui接口)呈现可适用属性535的有序列表。最高属性呈现电路540是可以执行图2中的gui230的角色的示例电路。

用户选择属性545中的一个或多个属性,并且选定属性545被传递到选定属性接收电路550,该选定属性接收电路550将选定属性545传递到选定文本突出显示电路560。选定文本突出显示电路560突出显示与受选定属性545影响的文本元素相对应的选定文本505的部分555。例如,在一个实施例中,与每个受影响的文本元素相对应的文本的整个区段555被突出显示,而在另一实施例中,仅由于选定属性而经历改变的选定文本505的那些字符或单词555被突出显示。突出显示在视觉上将由于选定属性545而经历改变(或以其他方式受影响)的文本555的那些部分与未受选定属性545影响的选定文本505的其余部分区分开。然后,选定属性545被传递到选定属性应用电路570,选定属性应用电路570将属性545应用于选定文本505中的受影响的区段。选定属性545然后被传递回到可适用属性排序电路530,可适用属性排序电路530更新(例如,重新排序)对用于受影响的文本元素的属性的排序以反映选定属性545。例如,选定属性545可以被排序得相对较高,使得它们在最高属性呈现电路540的未来属性呈现中的gui呈现的属性535中看起来更高。可适用属性排序电路530是可以执行图2中的排序训练模块24的角色的示例电路。

图6的方法600是美化电子文本文档的计算机实现的方法。该文档具有以多个区段组织的文本。区段中的每个区段表示多个文本元素中的对应的一个文本元素。参考图6,方法600开始于接收610对进行美化的文本的用户选择。选定文本包括区段中的一个区段的至少一部分。例如,接收610可以由图5的选定文本接收电路510执行。方法600还包括:将选定文本分类620为由区段中的一个区段所表示的文本元素中的对应的一个文本元素。例如,该分类可以由图5的选定文本分类电路520执行。方法600还包括:对可适用于文本元素中的该一个文本元素的属性的集合进行排序630。例如,排序630可以由图5的可适用属性排序电路530执行。

方法600还包括:呈现640最高排序的属性的有序列表。例如,呈现640可以由图5的最高属性呈现电路540执行。方法600还包括:接收650对所呈现的属性中的一个或多个属性的选择。例如,接收650可以由图5的选定属性接收电路550执行。方法600还包括:将选定属性应用660到选定文本。例如,应用660可以由图5的选定属性应用电路570执行。方法600还包括:对可适用属性进行重新排序670以反映选定属性。例如,重新排序670可以由图5的可适用属性排序电路530执行。

图7是根据本公开的另一实施例的文本文档美化的示例方法700的流程图。例如,如上文针对方法600所讨论的,方法700可以由图5的文本文档美化电路500执行。方法700(如方法600)是美化电子文本文档的计算机实现的方法。文档具有以多个区段组织的文本。区段中的每个区段表示多个文本元素中的对应的一个文本元素。

在方法700中,处理开始于接收710对进行美化的文本的用户选择。选定文本包括区段中的至少一个区段的至少一部分。方法700还包括:将选定文本分类720到区段中的至少一个区段所表示的文本元素中的对应的一个或多个文本元素;对可适用于文本元素中的一个或多个文本元素的属性的集合进行排序730;呈现最高排序的属性的有序列表740;接收750对所呈现的属性中的一个或多个属性的选择;以及突出显示760选定属性应用到的选定文本的那些部分,以在视觉上与选定属性未应用到的选定文本的其余部分区分开。例如,突出显示760可以由图5的选定文本突出显示电路560执行。方法700还包括:将选定属性应用770到选定文本。每个选定属性被应用于选定文本中的与选定属性可适用的文本元素中的一个或多个文本元素的那些部分相对应的部分。

其他示例实施例

以下示例涉及进一步实施例,许多变换和配置将从中显而易见。

示例1是一种计算机程序产品,其包括一个或多个非瞬态机器可读介质,非瞬态机器可读介质上编码有指令,指令当由一个或多个处理器执行时,使得执行用于美化电子文本文档的过程,电子文本文档具有以多个区段组织的文本,区段中的每个区段表示多个文本元素中的对应的一个文本元素。该过程包括:接收对进行美化的文本的用户选择,选定文本包括区段中的一个区段的至少一部分;将选定文本分类为区段中的一个区段所表示的文本元素中的对应的一个文本元素;对可适用于文本元素中的一个文本元素的属性的集合进行排序;呈现至少最高排序的属性的有序列表;响应于接收到对所呈现的属性中的一个或多个属性的选择,将选定属性应用于选定文本;对可适用的属性进行重新排序以反映选定属性。

示例2包括示例1的主题,其中选定文本的分类包括:将启发式规则应用于区段中的一个区段的至少一部分,以将选定文本分类为文本元素中的一个文本元素。

示例3包括示例1的主题,其中可适用属性的排序包括:当美化其他文本文档时,至少部分地基于由给定用户从可适用属性中的选择进行排序,给定用户已经提供对进行美化的文本的用户选择。

示例4包括示例1的主题,其中可适用的属性的排序包括:当美化其他文本文档时,至少部分地基于由其他用户从可适用属性中的选择进行排序,其他用户与给定用户不同,给定用户已经提供对进行美化的文本的用户选择。

示例5包括示例1的主题,该过程还包括:接收对进行美化的文本的第二选择,第二选定文本包括区段中的另一区段的至少一部分,区段中的另一区段表示文本元素中的一个文本元素;将第二选定文本分类为文本元素中的该一个文本元素;响应于接收到用于第二选定文本的用户挑选的属性,将挑选的属性应用于第二选定文本;以及修改可适用的属性以反映挑选的属性。

示例6包括示例5的主题,其中可适用的属性的修改包括:如果挑选的属性不是可适用的属性的成员,则将挑选的属性添加到可适用的属性;以及对可适用的属性进行重新排序以反映挑选的属性。

示例7是一种用于美化电子文本文档的计算机实现的方法,电子文本文档具有以多个区段组织的文本,区段中的每个区段表示多个文本元素中的对应的一个文本元素。该方法包括:通过处理器接收对进行美化的文本的用户选择,选定文本包括区段中的一个区段的至少一部分;通过处理器将选定文本分类到区段中的至少一个区段所表示的文本元素中的对应的一个或多个文本元素;通过处理器对可适用于文本元素中的一个或多个文本元素的属性的集合进行排序;通过处理器呈现至少最高排序的属性的有序列表;以及响应于通过处理器接收到对所呈现的属性中的一个或多个属性的选择,将选定属性应用于选定文本,每个选定属性被应用于选定文本的一部分,该部分与选定属性所适用的文本元素中的一个或多个文本元素的那些部分相对应。

示例8包括示例7的主题,其中选定文本的分类包括:从选定文本中标识区段中的至少一个区段的至少一部分;以及将区段中的至少一个区段的标识的至少一部分分类到所标识的区段中的至少一个区段所表示的文本元素中的对应的一个或多个文本元素。

示例9包括示例8的主题,其中所标识的区段中的至少一个区段的至少一部分的分类包括:将启发式规则应用于区段中的至少一个区段的至少一部分的每个区段,以将该区段分类为文本元素中的一个或多个文本元素中的对应的一个文本元素。

示例10包括示例7的主题,其中可适用的属性的排序包括:当美化其他文本文档时,至少部分地基于由给定用户从可适用的属性中的选择进行排序,给定用户已经提供对进行美化的文本的用户选择。

示例11包括示例7的主题,其中可适用的属性的排序包括:当美化其他文本文档时,至少部分地基于由其他用户从可适用属性中的选择进行排序,其他用户与给定用户不同,给定用户已经提供对进行美化的文本的用户选择。

示例12包括示例7的主题,还包括突出显示选定属性所应用到的选定文本的那些部分,以在视觉上与选定属性未应用到的选定文本的剩余部分区分开。

示例13包括示例7的主题,还包括通过处理器对可适用的属性进行重新排序以反映选定属性。

示例14包括示例7的主题,还包括:通过处理器接收对进行美化的文本的第二选择,第二选定文本包括区段中的一个区段的至少一部分,区段中的一个区段表示文本元素中的一个文本元素;通过处理器将第二选定文本分类为文本元素中的该一个文本元素;响应于通过处理器接收到用于第二选定文本的用户挑选的属性,将挑选的属性应用于第二选定文本;以及通过处理器修改可适用的属性以反映挑选的属性。

示例15包括示例14的主题,其中可适用的属性的修改包括:如果挑选的属性不是可适用的属性的成员,则将挑选的属性添加到可适用的属性;以及对可适用的属性进行重新排序以反映挑选的属性。

示例16是一种用于美化电子文本文档的基于计算机的系统,电子文本文档具有在多个部分组织的文本,区段中的每个区段表示多个文本元素中的对应的一个文本元素。该系统包括:选定文本接收电路,用于接收对进行美化的文本的用户选择,选定文本包括区段中的至少一个区段的至少一部分;选定文本分类电路,用于将选定文本分类到区段中的至少一个区段所表示的文本元素中的对应的一个或多个文本元素;可适用属性排序电路,用于对可适用于文本元素中的一个或多个文本元素的属性的集合进行排序;最高属性呈现电路,用于呈现至少最高排序的属性的有序列表;选定属性接收电路,用于接收对所呈现的属性中的一个或多个呈现的属性的选择;以及选定属性应用电路,其用于将选定属性应用于选定文本,每个选定属性被应用于选定文本的一部分,该部分与选定属性可适用的文本元素中的一个或多个文本元素的那些部分相对应。

示例17包括示例16的主题,还包括选定属性突出显示电路,用于突出显示选定属性所应用到的选定文本的那些部分,以在视觉上与选定属性未应用到的选定文本的剩余部分区分开。

示例18包括示例16的主题,其中可适用属性排序电路还用于对可适用的属性进行重新排序以反映选定属性。

示例19包括示例16的主题,其中:选定文本接收电路还用于接收对进行美化的文本的第二选择,第二选定文本包括区段中的一个区段的至少一部分,区段中的一个区段表示文本元素中的一个文本元素;选定文本分类电路还用于将第二选定文本分类为文本元素中的一个文本元素;选定属性接收电路还用于接收用于第二选定文本的用户挑选的属性;选定属性应用电路还用于将挑选的属性应用于第二选定文本;以及可适用属性排序电路还用于修改可适用属性以反映挑选的属性。

示例20包括示例19的主题,其中可适用属性排序电路还用于:如果挑选的属性不是可适用的属性的成员,则将挑选的属性添加到可适用的属性;以及对可适用的属性进行重新排序以反映挑选的属性。

本文中所采用的术语和表达式被用作描述术语而非限制术语,并且在使用这样的术语和表达式时不旨在排除所示出和描述的特征的任何等同物(或者其部分),并且应当认识到在权利要求的范围内可以进行各种修改。因而,权利要求旨在涵盖所有这样的等同物。另外,本文中对各种特征、方面和实施例进行了描述。如本领域技术人员应当理解的,特征、方面和实施例易于彼此组合以及变化和修改。因此,本公开应当被认为涵盖这样的组合、变化和修改。意图是本公开的范围不限于该具体实施方式,而是由所附权利要求来限制。要求本申请的优先权的未来提交的申请可以以不同的方式要求保护所公开的主题,并且一般可以包括本文以各种方式公开或以其他方式演示的一个或多个元素的任何集合。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1