自动组成评估器的制造方法_3

文档序号:9438920阅读:来源:国知局
scendant)”,该说明符指定从上下文节点导航的方向。然后,节点测试和谓词进一步定义对哪些节点进行导航。例如,节点测试“A”要求所有被导航的节点必须具有标签“A”。谓词会进一步要求所选择的节点具有某些性质。如果度量文件包括XPath内容,则自动组成评估系统100可以根据XPath表达式执行评估过程。即,评估器将根据预定义的次序执彳丁评估。
[0045]在某些实施例中,自动组成评估系统100可以基于度量文件中的标记执行该评估过程。例如,如说明性度量文件中所示,度量文件可以通过包括标记如“ < eval_line…力”指示文本对象,因此,自动组成评估系统100可以将该对象标识为文本对象,确定该文本对象的一个或多个参数,并且通过将该一个或多个参数与文本对象的相关组成规则进行比较来执行该评估过程。
[0046]自动组成评估系统100通过解释器114可以确定系统字符连接信息(步骤212)。作为一个示例,系统字符连接可以包括将单词断开在两个连续行上的连字符。在某些实施例中,不可以在单词内随机添加或编排系统字符连接,而是其必须根据字符连接规则进行编排。在某些实施例中,例如,系统字符连接不可以被编排在不可接受的音节处,并且城市名等内可以没有字符连接。在步骤212,自动组成评估系统100可以确定例如文本对象中的行是否包括连字符和获得与连字符相关联的相关信息,如连续连字符的数量、连字符的断开位置、以及包括这些连字符的文本。
[0047]自动组成评估系统100通过解释器114还可以确定对齐信息(步骤214)。对齐(justificat1n)是栏中的文本或图像的排版对准设置或沿着栏的左右边距的对准测量。作为一个示例,如果栏沿着左右边距对准,则其可以被称为“对齐”。在对齐文本中,单词之间的间距被拉伸或有时被压缩以便使文本与左右边距两者对齐。自动组成评估系统100可以确定例如所有文本行是否对齐,是否有任何分散对齐(loose justificat1n) (S卩,任何没有对齐的行),以及该对齐是否符合预定义的标准。为了确定对齐信息,自动组成评估系统100可以使用例如在步骤202确定的坐标和行距信息。
[0048]本领域内的普通技术人员将认识到如所述对应于步骤202至214的文件解释过程200仅是为了说明而不是排他性或限制性的。自动组成评估系统100通过解释器114可以确定或解释步骤202至214中没有描述或包括的信息。例如,自动组成评估系统100还可以确定空白区信息、标签标记信息、行中最后字符信息、下标和上标信息、和任何其他与文本对象相关的信息。自动组成评估系统100还可以执行步骤202至214中包括的某些但不是所有步骤。而且,虽然次序如图3A中所示,但自动组成评估系统100还可以执行文件解释过程200。
[0049]图3B是与某些披露的实施例一致的另一个示例性文件解释过程240的流程图。文件解释过程240以及其中任何或所有单独步骤可以由自动组成评估系统100的任何组件(包括阅读器112、解释器114、评估器116和处理器120)执行。为了示例性目的,图3B被披露为由解释器114执行。
[0050]自动组成评估系统100通过解释器114可以执行软件指令来确定表格对象的一个或多个参数。(过程240)。表格对象可以包括以行和列安排的数据。电子表格例如是表格。表格可以包括以行和列安排的文本。
[0051]自动组成评估系统100通过解释器114可以确定表格对象的栏间空白(gutter)的总宽度(步骤242)。表格栏间空白是表格中两个相邻单元格、行或列之间的间距。自动组成评估系统100可以通过例如度量文件中的标示标记来标识表格中的某些或所有栏间空白。标识表格栏间空白后,自动组成评估系统100可以对表格栏间空白的总数进行计数并且还返回这些表格栏间空白的总宽度(或其他期望的尺寸)。自动组成评估系统100可以进一步将总栏间空白宽度与表格的宽度进行比较并且确定例如栏间空白宽度与表格宽度的比率。
[0052]自动组成评估系统100通过解释器114可以确定表格中的任何列是否没有内容(未示出步骤)。即,自动组成评估系统100可以搜索空的表格列。如果例如发现表格中的具体列是空的,则可以建议不需要该列并因此可以将其移除。
[0053]自动组成评估系统100通过解释器114可以确定表格对象的列数据宽度、或该数据的任何参数(步骤244)。列数据宽度是表格中的列内包括的数据宽度。例如,自动组成评估系统100可以确定某一列中的数据宽度比相应列宽或者更长或者更短。并且取决于该结果,可能需要调整列或数据或者两者的宽度,这样使得数据令人期望地适应其相应的列。
[0054]自动组成评估系统100通过解释器114可以确定对表格对象进行编排的重新尝试的次数(步骤246 ) ο在某些实施例中,度量文件可以包括指示已经若干次试图布置表格对象的信息。这种情况可能发生,例如,因为表格对象具有超过页宽的宽度,因为表格对象需要被编排在其相应的标注附近但缺乏空间,或者因为任何其他可能阻止表格对象第一次被正确布置的原因。当表格对象第一次没有被正确布置时,会有后续若干次尝试将其正确布置。自动组成评估系统100可以确定已经进行的重新布置尝试的次数。而且,自动组成评估系统100还可以为其他非文本对象(如方程对象和图形对象)中的每个对象确定重新尝试的次数。
[0055]自动组成评估系统100通过解释器114可以确定表格对象中的行和列的数量(步骤248)、和坐标信息(如X,y坐标)、以及表格对象的和/或表格对象中的列的尺寸信息(步骤250)。例如,自动组成评估系统100可以确定表格对象中的行和列的总数、表格对象中的每个行和列的宽度和高度、以及每个表格对象的位置。
[0056]自动组成评估系统100通过解释器114可以确定表格对象中的每个单元格中的文本行的数量(步骤252)。自动组成评估系统100还可以确定表格对象中的空白区的数量(未示出步骤)。自动组成评估系统100还可以确定文本行在单元格中的布置,如字体、对齐、行距、标题、字符连接、换行、对准等(未示出步骤)。
[0057]本领域内的普通技术人员将认识到自动组成评估系统100通过解释器114可以确定除了对应于图3A和图3B描述的那些参数以外的参数。自动组成评估系统100可以用任何次序确定与文本对象、表格对象、图形对象、方程对象、栏、页、以及整个文档相关的任何参数。作为一个示例,自动组成评估系统100还可以确定文本对象的参数,包括字符之间的间距、单词之间的间距、文本块之间的行距的变化、在行结束但不是段落结束处的空白区、以及以或者物理连字符或者自由选定连字符结束的连续行的数量。自动组成评估系统100还可以确定标签标记是否与贴有标签的项断开;某些特殊字符是否作为行中的第一个字符或最后一个字符出现;系统连字符是否跟着某些特殊字符等。如此处描述的文本对象可以包括例如纯文本、附属资料文本、以及元数据。纯文本对象可以包括输入文档的正文文本。附属资料文本可以包括结论、附录、词汇表、索引等。元数据提供关于基础数据(如正文文本或其他对象)的信息。例如,元数据可以包括数据的创建方式、数据的用途、数据创建时间和日期、数据的作者等。
[0058]作为另一个示例,自动组成评估系统100还可以确定各大对象、小对象、固定对象或浮动对象的编排。例如,自动组成评估系统100可以确定大对象是否和其他类似的对象一起按顺序被编排、附录中的对象标注是否被编排在附录后面等。
[0059]作为另一个示例,自动组成评估系统100还可以确定表格对象的参数,包括表格的取向(如是否对其进行旋转)、方程是否出现在表格中、表格是否包裹到下一栏或页而没有堆积等。而且,自动组成评估系统100还可以确定方程对象的参数,包括方程的尺寸、方程是否具有多个行、方程是否溢出等。
[0060]此外,在某些实施例中,自动组成评估系统100还可以确定标记的参数,包括是否存在某些类型的标记。例如,自动组成评估系统100可以确定是否有上划线标记、等宽间距标记、乘积标记、多节表格、引文等。
[0061]此外,在某些实施例中,自动组成评估系统100还可以确定对象之间的关系。例如,自动组成评估系统100可以确定某一文本对象、表格对象、方程对象、或图形对象可以位于单栏或单页内,或者可以位于多个栏或多个页上。此外,自动组成评估系统100还可以确定表格对象需要被编排在标注、或另一个表格对象、相关方程对象或相关图形对象附近。
[0062]本领域内的普通技术人员将认识到如所述对应于步骤242至252的文件解释过程240仅是为了说明而不是排他性或限制性的。自动组成评估系统100通过解释器114可以确定或解释步骤242至252中没有描述或包括的信息,以上描述了其中的一些信息。自动组成评估系统100还可以执行步骤242至252中包括的某些但不是所有步骤。而且,虽然次序如图3B中所示,但自动组成评估系统100还可以执行文件解释过程240。
[0063]图4是与某些披露的实施例一致的示例性评估和符合性确定过程300的流程图。评估和符合性确定过程300以及其中任何或所有单独步骤可以由自动组成评估系统100的任何组件(包括阅读器112、解释器114、评估器116、规则引擎122和处理器(多个)120)执行。为了示例性目的,图4被披露为由评估器116和规则引擎122执行。
[0064]自动组成评估系统100通过评估器116和规则引擎122可以执行软件指令来执行文本对象评估过程(步骤400)、标注评估过程(步骤410)、表格评估过程(步骤420)、方程评估过程(步骤440)、以及栏评估过程(步骤460)。对应于图5A至图5E,详细描述了步骤400、410,420,440以及460。简言之,自动组成评估系统100可以执行评估过程400、410、420、440以及460以便基于多个相应的组成规则获得一个或多个结果。
[0065]自动组成评估系统100通过评估器116和规则引擎122还可以执行软件指令来执行页评估过程(步骤500)和文档评估过程(步骤600)。对应于图6和图7,详细描述了步骤500和600。简言之,自动组成评估系统100可以执行评估过程500和600以便基于多个相应的组成规则获得一个或多个结果。
[0066]本领域内的普通技术人员将认识到评估过程400、410、420、440、460、500以及600仅是为了说明而不是排他性或限制性的。自动组成评估系统100可以执行任何其他期望的评估过程。例如,自动组成评估系统100还可以执行度量文件中所包括的任何其他对象的评估过程。此外,自动组成评估系统100还可以执行某些但不是所有步骤步骤400、410、420、440、460、500以及600。而且,虽然次序如图4中所示,但自动组成评估系统100还可以执行步骤400、410、420、440、460、500以及600。例如,自动组成评估系统100可以在其执行文本对象评估过程400之前执行步骤420的表格对象评估过程。
[0067]此外,无需在执行步骤500的页评估过程和步骤600的文档评估过程之前执行步骤400、410、420、440和460中的一个或多个步骤。作为一个示例,自动组成评估系统100可以评估某一页中的所有文本对象和非文本对象并且然后通过将那页中的文本对象和非文本对象的评估结果考虑在内来执行那页的评估过程。自动组成评估系统100还可以首先评估该页而不评估那页中的文本对象和非文本对象。作为另一个示例,自动组成评估系统100可以评估整个输入文档中的所有文本对象和非文本对象并且然后针对该输入文档中的每一页执行页评估过程。换言之,可以按照所期望的任何顺序执行如图4中所示的过程300中的所有步骤。
[0068]图5A是与某些披露的实施例一致的示例性文本对象评估过程400的流程图。文本对象评估过程400以及其中任何或所有单独步骤可以由自动组成评估系统100的任何组件(包括评估器116、规则引擎122和处理器120)执行。为了示例性目的,图5A被披露为由评估器116和规则引擎122执行。
[0069]自动组成评估系统100通过评估器116和规则引擎122可以执行软件指令来评估连续连字符(步骤402),以便确定文本对象中的连续连字符的数量是否满足第一文本阈值条件。例如,自动组成评估系统100可以确定如果文本对象(如正在被评估的段落或文本块)中有多于4个连续连字符则可以生成、记录和/或存储结果(步骤409)。结果可以是任何指示评估过程的结果的数字数据或文本数据。例如,结果可以是文本字符串,如“失败(fail)”、“警告(warning)”和“仅供参考(informat1n only)”。因此,如果自动组成评估系统100确定有少于4个连续连字符,其可以生成结果并将其记录为“仅供参考”。然而,如果自动组成评估系统100确定有多于4个连续连字符,则其可以生成结果并将其记录为“警告”。结果还可以是数值,如指示评估结果的分数或点。例如,如果自动组成评估系统100确定有少于4个连续连字符,则其可以不从最初的分数(如100个点)减去点或减去少量点(如从总计100个点中扣除20个点),并将该分数存储存储装置(如存储器124)中。
[0070]自动组成评估系统100通过评估器116和规则引擎122可以执行软件指令来评估字符间间距(步骤404),以便确定文本对象中的字符间间距是否满足第二文本阈值条件。作为一个示例,自动组成评估系统100可以确定字符间间距是否大于组成规则中定义的最大允许值(如2.1 _)、或小于组成规则中定义的最小允许值(如O _),并且生成、记录和/或存储相应的结果(步骤409)。如果自动组成评估系统100确定字符间间距符合组成规则,则自动组成评估系统100可以继续进行到下一个步骤。
[0071 ] 自动组成评估系统100通过评估器116和规则引擎122可以执行软件指令来评估单词间间距(步骤406 ),以便确定文本对象中的单词间间距是否满足第三文本阈值条件。作为一个示例,如果自动组成评估系统100确定单词间间距大于组成规则中定义的最大允许值(如4 _)、或小于组成规则中定义的最小允许值(如0.5 _),则其相应地生成、记录和/或存储结果(步骤409)。如果该评估器确定单词间间距符合组成规则,则自动组成评估系统100可以继续进行到下一个步骤。
[0072]自动组成评估系统100通过评估器116和规则引擎122可以执行软件指令来评估行间间距(步骤408),以便确定文本对象中的行间间距是否满足第四文本阈值条件。作为一个示例,如果自动组成评估系统100确定行间间距大于组成规则中定义
当前第3页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1