文档分析器的制作方法

文档序号:18903205发布日期:2019-10-18 22:15阅读:153来源:国知局
文档分析器的制作方法

通常,诸如例如交易文档的文档可以形成企业的组成部分。交易文档可以管理不同企业之间、企业和消费者之间以及企业和政府之间的各种任务、操作、交易等。通常需要相对于执行各种任务的某些预定义策略、指南或标准理解这些交易文档,诸如例如用于直接从交易文档执行资产管理,将发票与交易文档进行协调,等等。

传统上,交易文档可以由系统管理,该系统可以执行功能,诸如例如将交易文档电子地存储在数据库中。然而,此类系统可能无法执行额外的分析,这可能涉及理解或审查交易文档,诸如确定参与方的义务,履行义务所产生的收入,所有权转让等。

此外,通常,诸如基于规则的策略的策略可能是全面的,并且与这些策略相对应的交易文档的查看可能是麻烦的、资源密集的并且容易出错。此外,由于每个交易文档可以特定于域,因此可能需要熟练劳动力来执行特定于每个域的分析。本公开提供了一种用于问题的技术解决方案,以高效且准确地辅助系统理解交易文档。

附图说明

图1示出了根据本公开的示例实施例的实现文档分析系统的网络环境。

图2示出了根据本公开的示例实施例的文档分析系统的各种组件。

图3a示出了根据本公开的示例实施例的用于分析交易文档的知识模型的示例。

图3b示出了根据本公开的示例实施例的用于分析交易文档的另一知识模型的示例。

图4示出了根据本公开的示例实施例的描绘双方之间的各种交易关系的示例。

图5示出了根据本公开的示例实施例的用于实现该系统的硬件平台。

图6示出了根据本主题的示例实施例的用于生成与用于分析交易文档的指南相对应的知识模型的方法。

图7示出了根据本主题的示例实施例的用于分析交易文档的方法。

具体实施方式

为了简化和说明的目的,通过主要参考其示例来描述本公开。本文描述的本公开的示例可以以不同的组合一起使用。在以下描述中,阐述细节以便提供对本公开的理解。然而,显而易见的是,可以在不限于所有这些细节的情况下实践本公开。此外,在整个本公开中,术语“一”和“一个”旨在表示特定元件中的至少一个。如本文所用,术语“包括”表示包括但不限于,术语“包含”表示包括但不限于。术语“基于”意味着至少部分地基于,术语“根据”意指至少部分地根据,并且术语“诸如”意指诸如但不限于。

本公开描述了用于以高效且准确的方式分析关于预定义指南的文档(诸如例如交易文档)的系统和方法。预定义指南可以是为域定义的标准、策略或规则,诸如例如国际财务报告标准(ifrs),它为业务运营提供通用的全球语言,以便公司帐户在全球范围内可理解和可比较。因此,组织确保诸如例如交易文档的文档遵守这些指南,并且基于指南分析交易文档。此外,可能必须出于各种原因连续地分析和理解交易文档,诸如例如用于直接从交易文档执行资产管理以及协调发票与合同。

然而,通常,指南和交易文档可能是全面的并且涉及复杂的语言,从而使得关于指南的交易文档的分析繁琐、耗时且资源(计算和其他方面)密集。

本公开提供了对指南的高效分析,其进而提供对交易文档的高效和准确的分析。在示例实施例中,指南分析器可以获得要分析的指南。在分析时,可以提取指南的元素。指南的元素可以被理解为管理指南的核心原则的过程或因素。例如对于ifrs15,它是与顾客签订合同的收入确认会计准则的标准,元素的提取可能涉及标识与顾客的合同与涉及实物安排的业务合作伙伴的合同;标识履行义务,诸如需要在特定时间向交易文档中的某个地点交付货物或服务;确定交易价格和其他此类元素,诸如损失语言的存在和最小保证吞吐量。

在提取元素时,指南分析器可以确定定义所提取的元素的知识模型。知识模型可以包括例如假设问题和逻辑流以获得对假设问题的推断。在一个示例中,可以生成特定于组织、产品类别等的知识模型。例如知识模型可以用于描述处理非气液(ngl)产品的组织。替代地,知识模型可以通常用变量来定义,这些变量可以针对不同的组织、产品等进行调整。可以存储指南的知识模型以供进一步使用。可以使用ai技术和/或自然语言处理技术来半自动或完全自动地生成知识模型。

在示例中,为了分析交易文档,文档分析器可以确定与交易文档相对应的指南。例如可以识别交易文档的域,并且可以确定域中管理交易文档的指南。对于确定的指南,可以获得相应的知识模型。基于知识模型,文档分析器可以从交易文档中提取和分析称为知识数据的数据。

知识数据可以包括通常可以在其上执行分析的交易文档的相关或关键方面。知识提取和分析可以涉及地理空间实体提取、句子相似性、监督分类、搜索索引提取、无监督集群、主题检测、表提取、实体和关系提取以及依赖性解析中的至少一个。

除了知识模型之外,基于案例的数据还可以用于文档分析。基于案例的数据通常包括案例描述符,其以向量的形式描述案例的关键方面。可以基于那些案例的案例描述符的相似性来取回其他类似的案例。例如此方案能够实现同一域中的另一个交易文档的分析。

该分析可以包括,例如确定交易文档是否落入交易文档所属的域的指南的范围。此外,在接收到解释交易文档的方面的用户请求时,文档分析器还可以提供对交易文档的方面的解释。该方面可以是,例如确定是否定义了交易价格,或者是否为不满足义务的情况定义了最小交易价格。如上所述,还可以基于知识模型和/或基于案例的数据来提供解释。

因此,本系统可以智能地处理指南以生成知识模型以高效地捕获相关和关键方面。此外,系统然后可以基于知识模型分析各种交易文档以准确地解释交易文档。因为系统可以捕获指南的所有相关元素(过程和/或特征),并且可以基于对应于元素的知识模型来执行交易文档的后续分析,所以分析可以基本上没有错误。此外,相对于传统系统,相关特征的提取和用于自动分析文档的适当的知识模型的使用可以减少cpu(中央处理单元)周期和所需的存储器。

另外,因为一旦生成的知识模型可以用于各种交易文档,所以还可以更好地利用时间和资源。此外,系统可以被配置为当和在它们来提供更新的知识模型时处理修改,从而确保根据最新的指南来分析交易文档,这进而可以帮助确保分析的准确性。

因此,使用与本公开一致的技术的诸如例如交易管理系统的系统可以以时间和资源高效的方式准确地分析交易文档。

图1示出了根据本公开的示例实现的实现文档分析系统105的网络环境100。在示例实施例中,文档分析系统105使用人工智能(ai)技术,诸如机器学习、数据挖掘和知识发现,用于分析交易文档和相应的指南的目的。

在示例实施例中,网络环境100可以是公共网络环境,包括数千个个体计算机、膝上型计算机、诸如刀片服务器的各种服务器、以及其他计算设备。在另一示例实施例中,网络环境100可以是具有有限数量的计算设备的专用网络环境,诸如个体计算机、服务器和膝上型计算机。此外,系统100可以在各种计算系统中实现,例如膝上型计算机、平板计算机等。

根据示例实施例,系统105通过网络120与交易文档数据库110和指南数据库115通信地耦合。在另一个示例中,交易文档数据库110和指南数据库115可以与系统105集成。交易文档数据库110可以存储组织的交易文档和与交易文档有关的元数据。元数据可以包括例如签署文档的日期、与谈判有关的细节等。指南数据库115可以存储与为各种域定义的指南、标准、策略和规则有关的数据。

在示例中,系统105可以从各种源取回指南,包括第三方源,诸如文档存储库和其他这样的信息源、数据存储库和/或第三方应用。系统105可以进一步将现有指南分解和策划为多个知识表示,并将数据存储到指南数据库115中以供将来表示,如稍后在图1的描述中详细解释的那样。此外,指南数据库115可以被周期性更新。例如可以将新数据添加到指南数据库115中,可以修改指南数据库115中的现有数据,或者可以从指南数据库115中删除无用数据。

在示例实施例中,网络120可以是无线网络、有线网络或其组合。网络120还可以是个体的网络或许多这样的个体网络的集合,彼此互连并且用作单个大型网络,例如因特网或内联网。网络120可以实现为不同类型的网络之一,诸如内联网、局域网(lan)、广域网(wan)、因特网等。此外,网络120可以包括各种网络设备,包括路由器、网桥、服务器、计算设备、存储设备等。

根据示例实施例,系统105可以包括指南分析器125和文档分析器130。指南分析器125可以分析存储在指南数据库115中的指南以生成指南的每个元素的知识模型。应当理解,术语指南涵盖指南、标准、规定、政策、规则、原则等。该指南可以提供关于如何定义诸如交易文档的文档以满足行业标准的指南。换句话说,指南提供了确定交易文档是否落入现行法规范围的基本规则和原则。

指南分析器125可以实现用于分析指南的各种ai技术。在示例中,指南分析器125可以从指南数据库115获得要分析的指南,诸如例如ifrs9和ifrs15。在获得时,指南分析器125可以提取指南的中心元素。元素定义了指南核心原则的中心概念、方面、过程或因素。指南分析器125可以实现技术,诸如例如文本挖掘技术和本体构造以提取元素。

在一个示例中,指南分析器125可以基于跨多交易文档的关系的频率,对知识库中的多个交易文档或对应于域的本体进行深度解析(依赖性解析)以标识实体和它们之间的关系。

在提取元素时,指南分析器125可以生成假设问题和/或逻辑流以获得关于分析交易文档的假设问题的推断。每个知识模型可以提供逻辑,其可以帮助确定交易文档是否包括与指南的元素相对应的文本。假设性问题可能与指南的元素有关。指南的知识模型可以存储在指南数据库115中以供进一步使用。

在一个示例中,指南分析器125可以执行自然语言处理任务,诸如例如主题建模和从指南中抽取的句子、词语或样本查询的集群,这有助于与指南有关的重要主题/元素的标识。对于这样的主题/实体,可以定义知识模型。例如可以遵循基于规则的方案来为某些假设问题生成逻辑流。例如可以对训练样本执行语义相似性,然后可以使用语义相似性来预测问题(与指南有关)的答案以标识相似的句子,即,可以被解释为与训练样本相同的句子。因此,可以定义具有肯定/否定的答案的问题的逻辑流。参考图2的描述借助于示例详细解释知识模型生成。

在操作中,用户可以提供用于查看、分析或理解交易文档的请求。在接收到请求时,文档分析器130可以例如从交易数据库110获得要分析的交易文档。在一个示例中,文档分析器130可以标识交易文档的域以确定对应于该域的指南。在一个示例中,文档分析器130可以基于与词语相关的统计,诸如频率计数和其他统计(tf-idfs等)来标识文档中的词,以将文档映射到特定域或知识库。对于确定的指南,可以从指南数据库115获得对应的知识模型。

文档分析器130可以基于知识模型从交易文档中提取知识数据以分析交易文档。知识数据可以包括定义交易文档和数据的特征的数据,这些数据可能是关于知识模型的分析所需要的。文档分析器130可以包括各种组件(如图2所示)以执行知识提取和分析。例如文档分析器130可以执行搜索索引构造、实体/关系提取、主题检测、句子相似性搜索、地理空间实体提取、用于提取与实体相关联的参数依赖性解析、表提取、域特定本体的提取等。知识数据可以存储在交易数据库110中。

然后,文档分析器130可以关于指示指南的知识模型分析所提取的知识数据。另外,文档分析器130还可以关于基于案例的数据(图中未示出)来分析知识数据,其可以存储在系统105中或者单独存储在数据库中。基于案例的数据可以包括关于同一域中的交易文档的分析的细节。来自针对先前案例(交易文档)执行的分析的知识可用于智能地分析当前案例。

基于该分析,文档分析器130可以确定交易文档是否落在规范交易文档的指南的范围内和/或提供对交易文档的方面的解释。交易文档的分析细节将在后续段落中提供。

图2示出了根据本公开的示例实现的系统105的各种组件。已经针对ifrs15详细解释了系统105的功能;然而,应当理解,所描述的原理也可应用于其他指南。如前所述,系统105可以与各种数据源通信,诸如交易数据库110、指南数据库115、用于获得交易文档的基于案例的数据、指南、知识模型和用于分析的域特定数据。

在示例中,系统105可以包括指南分析器125和文档分析器130。指南分析器125可以包括元素提取器205和知识模型生成器210。文档分析器130可以包括知识分析器215,和各种ai组件,诸如例如地理空间实体提取器225、句子相似性分析器230、监督分类器235、搜索索引提取器240、无监督集群生成器245、主题检测器250、表提取器255、实体和关系提取器260、以及依赖性解析器265。

在一个示例中,元素提取器205可以从指南数据库115获得指南。元素提取器205可以周期性地获得新指南或者可以获得关于接收用户输入的指南。获得指南的元素提取器205可以提取指南的元素。如前所述,指南的元素可以对应于过程、特征、指南核心原则的中心因素。元素提取器205可以实现ai技术,诸如例如文本挖掘技术、自然语言处理技术等,用于元素提取。

例如对于ifrs15,核心原则可能是确认收入以描述货物或服务的转移。因此,可以分析ifrs15的文本以将以下过程标识为元素:

1.标识与顾客的交易

2.标识交易中的履约义务

3.确定交易价格

4.分配交易价格

5.在满足履约义务时(或作为履约义务)确认收入

因此,遵守ifrs15所需的每个交易文档需要满足上述过程,即每个交易文档根据指南的元素。元素提取器205可以将元素存储在指南数据库115中或系统105中。

在提取元素时,知识模型生成器210可以生成与元素相对应的知识模型。在示例中,知识模型可以包括假设问题,并且对于每个假设问题,可以定义用于确定对假设问题的推断的流程图/逻辑。在一个示例中,可以生成特定于组织、产品类别等的知识模型。替代地,可以使用变量来一般地定义知识模型,可以针对不同的组织、产品等来调整变量。

参考上面的ifrs15的示例,关于处理非气液(ngl)的组织的过程的假设问题可以是,例如

1.产品的权利是否在交货点传递给组织?

2.产品的权利是否随处传回合同方?

3.合同方是否保留任意产品?

4.合同方是否采取任意实物选举?

5.如果是,请提供残留物,ngl,转移实物(tik)的费用减除?

6.基于来自销售的收入支付给合同方的代价?

7.组织是否需要向特定的一方或市场推销产品?

8.对于组织,是否减除运输分馏和储存?

9.合同方是否有权绕过工厂?

10.合同中是否存在损失语言的风险?

11.是否有保证的吞吐量?

12.如果是,合同是否包含缺陷费用条款?

前六个假设问题可以涉及一个元素,其对应于判断交易文档是否落入ifrs15的过程,并且剩余的假设问题可以涉及其他元素,其可以对应于诸如以下的方面,诸如例如确定如何设置交易价格以及如何计算交易价格,并且在不满足义务时是否有要付的任意最低交易价格。

此外,对于上述假设问题中的每一个,可以定义流程图以获得对假设问题的推断。参考图3a和图3b的描述描述了流程图的示例。

因此,可以高效地生成与组织相关的所有指南的知识模型,使得它们可以用于分析交易文档。

在一个示例中,用户可以提供用于分析的请求,例如根据对应的指南来解释交易文档的请求。在接收到这样的请求时,知识分析器215可以确定与交易文档相对应的指南。可以基于交易文档所属的域来确定指南。例如域可以是“与顾客签订合同的收入”。在所述示例中,ifrs15可以被标识为所述域中的联系人的当前规则。因此,可以获得与ifrs15相对应的知识模型。

基于知识模型,知识分析器215可以从要分析的交易文档中提取知识数据。例如基于知识模型,可以获得地理空间实体、表格、各方、权利等。知识分析器215可以实现自然语言处理技术、文本挖掘技术、机器学习等技术,以提取知识数据。此外,知识分析器215可以配置一个或多个ai组件以辅助知识提取。

在一个示例中,基于用户请求,可以查询与域或对应于用户请求的知识模型相对应的本体,以标识要激活的ai组件。在示例中,从对应于知识模型/域的本体,可以选择相关的ai组件。例如对于每个域,可以预定义这样的数据;或者可以存在预定义的映射,其可以指示要激活哪个ai组件以及用于何种目的。因此,知识分析器215可以参考针对每个域本体/知识模型本体的这种预定义数据/映射,以标识要选择的ai组件。

在确定要配置的ai组件时,知识分析器215可以参考另一个域特定映射来确定要设置的参数,并且可以确定参数的值。这种映射也可以从相应域的本体中导出。基于所确定的值,可以为ai组件设置对应的参数。

例如如果查询本体的结果指示要确定两个实体之间是否存在特定关系,则知识分析器可以选择依赖性解析器并相应地配置它。为了执行配置,可以设置对应的参数。参考依赖性解析器的示例,参数可以被配置为指示感兴趣的实体以及应该查看的这些实体之间的关系。

因此,知识分析器215可以基于与指南相对应的知识模型来配置ai组件,用于提取实体和关系,用于实体解析,用于搜索索引,用于依赖性解析,以及用于知识图提取。因此,ai组件可以被配置为针对知识模型中的逻辑流程中定义的术语来执行例如句子相似性。

在一个示例中,可以基于监督分类器235或无监督分类器245来分析整个文档语料库,以便可以标识类似的文档或段落。在另一示例中,知识分析器215可以基于语义搜索来标识交易文档的不同部分和/或搜索索引。知识分析器215可以利用主题检测器250来确定段落或部分的目的。交易文档可以包括各种部分,诸如“各方”、“义务”、“权利”、“收入”、“地理实体”等。这些部分可以形成用于存储从交易文档中提取的不同类型信息的基础。为此目的,知识分析器215可以实现搜索索引提取器240,其可以帮助标识交易文档中的部分和搜索索引。

知识分析器215还可以解析交易文档以标识参与方,诸如卖方、买方、中间实体等。例如句子相似性分析器230可以执行基于相似性的搜索,以将交易文档的文本与预定关键词进行比较,诸如“各方”、“卖家”、“买家”、“保留者”等。此外,知识分析器215可以确定与所标识的各方相关联的义务。在示例中,知识分析器215可以实现实体和关系提取器260,其可以提供实体或各方的标识以及它们之间的关系。在一些情况下,可以触发依赖性解析器265以建立参数与其值之间的关联。

知识分析器215还可以提取地理空间实体,例如以确定各方、产品等的位置。在一个示例中,知识分析器215可以实现地理空间实体提取器225,其可以提取交易文档中的地理空间信息。地理空间信息可以包括在例如交易文档的展品或附件中。地理空间实体提取器也可以分析这些部分以提取地理空间信息。在一个示例中,地理空间信息可以当仅给出质心时,以纬度和经度的形式出现,或者当给出矩形区域时,可以以边界框的形式指定。此外,诸如以部分、范围、乡镇等形式来对土地的法律描述;或调查、摘要等也可能出现在文档中。

地理空间信息可用于合同协调或管辖权相关问题。知识分析器215还可以使用表提取器255提取表,以便提取通常以表格格式列在文档中的资产的描述。

此外,使用各种ai组件,知识分析器215可以获得交易文档、义务、定价条件、地理空间信息等内的对方。在示例中,可以在知识图中捕获义务。可以通过执行实体的信息提取和来自义务的关系来从义务构建知识图。知识图或推理规则还可以捕获定价条件和公式。知识图和/或推理规则可以存储在知识数据中。

所提取的知识,即知识数据可以存储在交易数据库110中,系统105中,或者存储在单独的知识库中(图中未示出)。可以关于知识模型分析知识数据。在一个示例中,分析包括确定交易文档是否落入指南的范围内。如前所述,知识模型可以包括对应于指南的假设问题的逻辑或流程图。

基于为知识模型中的假设问题定义的逻辑,可以分析知识数据以确定对假设问题的推断。例如基于知识模型,可以确定合同方是否可以保留产品或者产品的一部分的所有权是否在交付点传递给组织?为简洁起见,本文不详细讨论知识模型,并且参考图3a和3b的描述借助于示例来描述知识模型。

除了知识模型之外,知识分析器230还可以使用基于案例的数据来分析知识数据并因此分析交易文档。

基于对知识模型的推断,知识分析器215可以提供指示可能/可能不在交易文档的范围内的各方面的报告。因此,即使是复杂且全面的交易文档也可以具有准确地被容易且高效地分析。可以通过用户界面向用户提供报告。

在另一示例中,用户可以提供与交易文档的方面的解释有关的查询。例如查询可以对应于知识模型之一,诸如例如产品的权利是否在交付点传递给组织。在所述示例中,知识分析器130在确定交易文档落入指南的范围内时,可以提取相关知识模型并分析交易文档,如上所述。报告可以指示对交易文档的解释以回答用户的查询。例如如果不满足义务,则用户可能已经询问了要支付的最低交易价格。

图3a和3b示出了根据本公开的示例实现的由系统105针对ifrs15生成的知识模型300和350的示例。指南的知识模型可以包括假设问题和确定对假设问题的推断的逻辑。知识模型300对应于假设性问题-合同方是否可以保留任意产品?

可以基于知识数据来确定知识模型300中的每个块的答案。在框302处,逻辑可以开始。在框304-1处,可以指示知识分析器215转到部分“承诺或交付点或重新交付点”或“卖方的采用实物选项”或“考虑”。在方框304-2,可以指示知识分析器215搜索术语“保留权利”、“传递权利”或“单独负责”、“重新交付/等价物/体积”、“实物重新交付”或“采用实物”。

在框306处,可以确定存在任意搜索项。如果搜索项不存在,则知识分析器215可以退出知识模型300。然而,如果搜索项存在,则在框308,可以执行依赖性解析以确定对权利相关问题的答案,诸如“谁保留权利?”、“重新交付给谁?”、“谁全权负责”、“传递给谁?”。在示例中,知识分析器215可以实现依赖性解析器265以确定搜索项是否存在。

在框310处,基于解析,可以确定是否标识出供应商、托运人或卖方中的任意一个?基于在框310处做出的确定,可以进行推断,是或否。在分析时,知识分析器215可以退出。

参考图3(b),示出了知识模型350,其提供逻辑流程以确定对假设问题的推断:产品的权利是否在尾门处传递给组织?

在框352处,知识分析器215可以搜索诸如“权利”、“传递”和“重新交付”的术语,并确定这些术语是否出现在同一句子中。基于该确定,可以确定推断。在示例中,知识分析器215可以实现句子相似性分析器230以确定术语是否出现在同一句子中。如果推断是否定的,则知识分析器215可以前进到下一个框。

在框354处,知识分析器215可以搜索术语“权利”、“销售”和“尾门”,并确定术语是否出现在同一句子中。基于该确定,可以确定推断。如果推断是否定的,则知识分析器215可以前进到下一个块。

在框356处,知识分析器215可以搜索术语“权利”、“转移”和“重新交付”,并确定这些术语是否出现在同一句子中。基于该确定,可以确定推断,并且知识分析器215可以退出知识模型350。

图4示出了根据本公开的示例实现的描绘双方之间的各种关系的示例。图4示出了三种类型的合同,即,天然气购买合同410、天然气收集合同420和天然气处理合同430。在每个合同中,组织的角色和义务可以改变,从而使得准确确定合同各方的所有权和义务很重要。

参考天然气购买合同410,卖方410-1可以向买方410-2出售天然气,买方410-2进而可以将其出售给顾客410-3。在这种情况下,组织可以是买方450。在这种情况下,组织(买方410-2)将获得原料气,处理气体并将处理后的气体出售给顾客。

参考天然气收集合同420,托运人420-1可以将天然气运送到组织,该组织现在可以是收集方420-2。在这种情况下,没有最终顾客,组织的角色可能是收集方的角色。

参考气体处理合同430,供应商430-1可以向处理器430-2提供气体,处理器430-2可以处理气体并将其出售给顾客430-3。

因此,对于相同的组织和相同的域,可能存在多个合同并因此存在交易文档。可能必须准确理解每个这样的交易文档以执行各种任务,诸如收益的生成。

图5示出了根据本公开的示例实施例的用于实现系统105的硬件平台。特别地,计算机器诸如但不限于内部/外部服务器集群、量子计算机、台式机、膝上型计算机、智能电话、平板计算机和可穿戴设备,其可以用于执行系统105或者可以具有硬件平台500的结构。硬件平台500可以包括未示出的附加组件,并且可以移除和/或修改所描述的一些组件。在另一示例中,具有多个gpu的计算机系统可以位于外部云平台上,包括amazonwebservices,或内部企业云计算集群,或组织计算资源等。

在图5上,硬件平台500可以是可以与本文描述的示例一起使用的计算机系统500。计算机系统500可以表示包括可以在服务器或另一计算机系统中的组件的计算平台。计算机系统500可以由处理器(例如单个或多个处理器)或其他硬件处理电路执行本文描述的方法、功能和其他过程。这些方法,功能和其他过程可以体现为存储在计算机可读介质上的机器可读指令,计算机可读介质可以是非暂态的,诸如硬件存储设备(例如ram(随机存取存储器)、rom(只读存储器)、eprom(可擦除可编程rom)、eeprom(电可擦除、可编程rom)、硬盘驱动器和闪存)。计算机系统500可包括处理器505,其执行存储在非暂态计算机可读存储介质510上用于执行本公开的方法的软件指令或代码。软件代码包括例如收集数据和文档以及分析文档的指令。在示例中,指南分析器125和文档分析器130是执行这些步骤的软件代码或组件。

计算机可读存储介质510上的指令被读取并存储在存储装置515或随机存取存储器(ram)520中。存储装置515提供大空间用于保持静态数据,其中至少一些指令可以被存储以用于以后的执行。可以进一步编译存储的指令以生成指令的其他表示并动态地存储在ram520中。处理器505从ram520读取指令并按照指示执行动作。

计算机系统500还包括输出设备525,以提供至少一些执行结果作为输出,包括但不限于用于的视觉信息,例如外部代理。输出设备可以包括计算设备和虚拟现实眼镜上的显示器。例如显示器可以是移动电话屏幕或膝上型计算机屏幕。gui和/或文本在显示屏上显示为输出。计算机系统500还包括输入设备530,输入设备530用于向用户或另一设备提供用于输入数据的机制和/或以其他方式与计算机系统500交互。输入设备可包括例如键盘、小键盘、鼠标、或触摸屏。在示例中,文档分析器130的输出显示在输出设备525上。这些输出设备525和输入设备530中的每一个可以通过一个或多个附加外围设备连接。

例如可以提供网络通信器535以将计算机系统500连接到网络,并且进而连接到连接到网络的其他设备,该其他设备包括其他客户端、服务器、数据存储库和接口。网络通信器535可以包括例如网络适配器,诸如lan适配器或无线适配器。计算机系统500包括用于访问数据源545的数据源接口540。数据源是信息资源。作为一个示例,异常和规则的数据库可以是数据源。此外,知识库和策划数据可以是数据源的其他示例。

图6示出了用于生成对应于指南的知识模型的方法600,并且图7示出了根据本公开的用于分析交易文档的方法700。应当理解,本文示出的方法步骤仅供参考,并且步骤的其他组合也是可能的。此外,除了图6和图7中所示的步骤之外,方法600和700还可以分别包含一些步骤。为简洁起见,在图6和图7的描述中没有详细解释在图1、图2、图3和图5的描述中详细解释的系统105的结构和操作特征。方法600可以由诸如指南分析器125的系统105的组件执行,并且方法700可以由文档分析器130执行。

在框605,可以从指南数据库获得指南。在示例中,指南分析器125的元素提取器205可以从指南数据库115获得指南。指南可以对应于为域中的交易文档定义的规则。例如ifrs15,其针对来自与顾客的合同收入而被定义,和ifrs16,其用于租赁合规。

在框610处,可以使用ai技术获得指南的元素。该元素可以与指南概述的过程和/或管理指南的核心原则的因素有关。在示例中,元素提取器205可以提取元素。

在框615,可以生成使用ai技术和自然语言处理技术中的一个定义指南的元素的知识模型。知识模型可以包括假设问题和用于确定对假设问题的推断的逻辑流中的至少一个。假设性问题与指南的元素有关。在示例中,指南分析器125的知识模型生成器210可以生成知识模型。在示例中,假设问题可以提供用于确定交易文档是否落入指南的范围内,或者提供用于解释交易文档的方面,诸如例如如何计算交易价格。

参考方法700,在框705,可以接收用于分析交易文档的请求。该请求可以是分析作为整体的交易文档或仅分析交易文档的一部分/方面。在示例中,用户可以提供交易文档,或者文档分析器130可以从交易文档数据库110获得交易文档。

在框710处,可以基于交易文档的域来标识对应于交易文档的指南。如前所述,对于每个域,可能存在预定义的指南。因此,如果交易文档涉及租赁合规性的情况下,则可以将ifrs16标识为指南。

在框715,可以获得对应于与和交易文档相关联的指南的知识模型。在示例中,可以从指南数据库115获得知识模型。

在框720,可以基于与指南的域相对应的本体来配置分析交易文档的系统的一个或多个ai组件。可以为每个域和/或指南预定义本体和对应数据。基于本体,可以选择与根据知识模型/指南处理文档相关的ai组件。在选择时,可以使用本体来设置各种参数,以根据指南/知识模型来配置用于处理文档的ai组件。ai组件可以执行ai任务,诸如例如提取地理空间实体、执行句子相似性、执行监督分类、提取搜索索引、执行无监督集群、检测主题、提取表、提取实体和它们之间的关系、以及执行依赖性解析。

在框725,基于知识模型,可以使用配置的ai组件来提取来自交易文档的数据。

在框730处,可以基于知识模型来分析所提取的数据,以确定对与知识模型相关联的假设问题的推断。可以使用由知识模型定义的逻辑来确定推断。在示例中,文档分析器130可以使用配置的ai组件来分析提取的数据。

在框735处,基于分析,可以生成指示交易文档是否落入指南的范围内的报告。在一个示例中,在用户请求关于交易文档的一个方面的分析的情况下,该报告可以指示该方面的解释。

本文描述和说明的内容是本公开的示例。本文使用的术语、描述和附图仅以说明的方式阐述,并不意味着限制。在本主题的精神和范围内许多变体是可能的,这些变体旨在由所附权利要求及其等同物限定,其中除非另有说明,否则所有术语均以其最广泛的合理含义表示。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1