用于复杂系统生命周期管理的预测查询处理的制作方法

文档序号:18834858发布日期:2019-10-09 04:52阅读:164来源:国知局
用于复杂系统生命周期管理的预测查询处理的制作方法

本公开涉及电子文档检索,并且更具体地,涉及用于确定与描述复杂系统的问题的所接收的自然语言文档相关的一组历史自然语言文档的技术。



背景技术:

复杂的机械(诸如商用飞行器)偶尔会遇到设备故障。一些商用飞行器和其他复杂机械可以将故障数据传输到一个或多个计算机系统,诸如维护中心使用的计算机系统和飞行器制造商操作的计算机系统。在许多情况下,复杂系统的问题记录在自然语言数据中,例如由正在努力解决该问题的工程师编写。通常,通过数据挖掘可以收集关于复杂系统的故障及其对应的解决方案的信息。数据挖掘广泛地寻求揭示数据中的模式和趋势,并且大多数数据挖掘技术是用于分析高度格式化数据(诸如数值数据或具有相对较少的固定数量的可能值的数据)之间的关系的复杂方法。然而,大量的信息由文本表达的信息组成,该本文表达的信息包括许多数据库字段、报告、备忘录、电子邮件、网站以及管理人员、市场分析师和研究人员感兴趣的外部新闻文章。随着文本表达的信息量持续快速增长,针对复杂系统的问题的给定的自然语言报告,识别一组相关信息的技术故障变得越来越困难。

文本挖掘是自由或半结构化文本领域中数据挖掘的一般概念的扩展。与数据挖掘相比,文本数据分析(也称为“文本挖掘”或简称“文本分析”)是指文本的分析,并且可能涉及文本概括、信息可视化、文档分类、文档聚类、文档汇总和文档交叉引用等功能。因此,文本数据分析可以帮助知识工作者找到单个非结构化或半结构化文本文档与跨此类文档的大集合的语义模式之间的关系。



技术实现要素:

根据本发明的一个实施例,一种方法包括从请求装置接收指定描述复杂系统的问题的自然语言文本的电子文档。该方法还包括通过以下操作来合成电子文档以创建合成的电子文档:移除被确定为满足一个或多个预定义过滤规则的电子文档的一个或多个部分;使用数据字典结构识别对应于电子文档的第一组术语以包括在合成的电子文档中;以及识别对应于电子文档的第二组术语以包括在合成的电子文档中,其中对应于电子文档的第二组术语中的至少一个术语满足至少一个预定义模式匹配规则。该方法包括识别数据储存库内的与合成的电子文档相关的第一组电子文档。此外,该方法包括将第一组电子文档的至少一部分返回到请求装置。

在一个方面,结合以上任何示例,该方法进一步包括向第一组术语中的至少一个术语分配权重,权重指示术语相对于第一组术语中的其他术语的相关性,其中至少部分地基于分配给第一组术语中的术语的权重识别数据储存库内的第一组电子文档。

在一个方面,结合以上任何示例,复杂系统进一步包括飞行器,并且该方法进一步包括识别指定电子文档涉及的飞行器中的感兴趣区域的元数据,其中所分配的权重至少部分地基于感兴趣区域确定。

在一个方面,结合以上任何示例,识别数据储存库内的与合成的电子文档相关的第一组电子文档进一步包括使用合成的电子文档访问用于数据储存库的索引以识别第一组电子文档,其中基于对应于存储在数据储存库内的多个电子文档的多个合成的电子文档生成索引。

在一个方面,结合以上任何示例,合成电子文档以创建合成的电子文档进一步包括将对应于电子文档内的第一单词的一个或多个同义词添加到电子文档中,并且用对应的词干单词替换电子文档内的第一单词。

在一个方面,结合以上任何示例,该方法进一步包括通过处理作为到机器学习模型的输入的电子文档来识别数据储存库内的第二组电子文档,该机器学习模型被训练以识别电子储存库内的相关电子文档,以及将第二组搜索结果的至少一部分返回到请求装置。

在一个方面,结合以上任何示例,复合系统进一步包括飞行器,其中基于对应的至少一个预定义模式匹配规则,第二组术语中的至少一个单词被分配相应的权重,其中基于电子文档涉及的飞行器的部分进一步确定权重,并且其中针对至少一个预定义模式匹配规则,飞行器的至少一部分被分配相应的权重。

在一个方面,结合以上任何示例,合成电子文档以创建合成的电子文档进一步包括通过处理作为到机器学习模型的输入的电子文档来识别对应于电子文档的第三组术语以包括在合成的电子文档中,所述机器学习模型被训练以识别电子文档内的相关术语。

在一个方面,结合以上任何示例,该方法进一步包括优化被训练以识别数据储存库内的相关电子文档的机器学习模型,将电子文档和相关联的最佳解决方案存储在数据储存库内,以及基于合成的电子文档,更新用于数据储存库的索引以识别所存储的电子文档和相关联的最佳解决方案。

在一个方面,结合以上任何示例,将第一组电子文档的至少一部分返回到请求装置进一步包括确定第一组电子文档中的至少一个电子文档的相关性衡量,指示来自第一组电子文档的相应电子文档与所接收的电子文档的相关性的度量,基于对应于第一组电子文档中的电子文档的解决方案和用于第一组电子文档中的至少一个文档的所确定的相关性度量,确定由所接收的电子文档的自然语言文本描述的复杂系统的问题的一个或多个解决方案,以及将复杂系统的问题的一个或多个解决方案返回到请求装置。

在一个方面,结合以上任何示例,复杂系统进一步包括飞行器,并且其中数据储存库包括至少第一电子文档,该第一电子文档包括用于飞行器系统的修复请求、对飞行器系统的更新、飞行器系统的替换、或其组合,并且其中请求装置进一步包括用于飞行器机队(包括飞行器)的操作员装置。

本文描述的另一个实施例提供了一种系统,该系统包括一个或多个计算机处理器、以及包含计算机程序代码的存储器,在由一个或多个计算机处理器的操作执行时,该计算机程序代码执行操作。该操作包括从请求装置接收电子文档,该电子文档指定描述飞行器的客户问题的自然语言文本。该操作进一步包括通过以下项合成电子文档以创建合成的电子文档:从电子文档中至少过滤掉一个或多个部分,其中一个或多个部分被确定以满足至少一个预定义规则;使用数据字典结构识别对应于电子文档的第一组术语以包括在合成的电子文档中;以及识别对应于电子文档的第二组术语以包括在合成的电子文档中,其中第二组术语中的至少一个单词满足至少一个预定义模式匹配规则。此外,该操作包括使用合成的电子文档访问用于数据储存库的索引以识别数据储存库内的第一组电子文档。该操作进一步包括通过处理作为到机器学习模型的输入的电子文档来识别第二组电子文档,该机器学习模型被训练以识别电子储存库内的相关项目。该操作包括将第一组电子文档和第二组电子文档中的至少一部分返回到请求装置。

在一个方面,结合以上任何示例,操作进一步包括检索指定电子文档涉及的飞行器的区域的元数据,并且基于电子文档涉及的飞行器的指定区域,将相应的权重分配给第一组术语和第二术语组中的至少一个术语。

在一个方面,结合以上任何示例,合成电子文档以创建合成的电子文档进一步包括将对应于电子文档内的第一单词的一个或多个同义词添加到电子文档中。

在一个方面,结合以上任何示例,合成电子文档以创建合成的电子文档进一步包括用对应的词干单词替换电子文档内的第一单词。

在一个方面,结合以上任何示例,基于对应的至少一个预定义模式匹配规则,第二组术语中的至少一个单词被分配相应的权重,其中基于电子文档涉及的飞行器的部分进一步确定权重,其中针对至少一个预定义模式匹配规则,飞行器的至少一个部分被分配相应的权重。

在一个方面,结合以上任何示例,识别电子文档内的第二组术语以包括在合成的电子文档中进一步包括确定包括第二组术语之一的多个单词何时满足一个或多个预定义模式匹配规则。

在一个方面,结合以上任何示例,合成电子文档以创建合成的电子文档进一步包括通过处理作为到机器学习模型的输入的电子文档来识别对应于电子文档的第三组术语以包括在合成的电子文档中,该机器学习模型被训练以识别电子文档内的相关术语。

在一个方面,结合以上任何示例,操作进一步包括优化被训练以识别数据储存库内的相关项目的机器学习模型,并且将电子文档和相关联的最佳解决方案存储在数据储存库内,其中数据储存库包括至少第一电子文档,该第一电子文档包括用于飞行器系统的修复请求、对飞行器系统的更新、飞行器系统的替换、或其组合,并且其中请求装置进一步包括用于飞行器机队(包括飞行器)的操作员装置。

本文描述的另一个实施例提供了一种方法,该方法包括从请求装置接收指定描述复杂系统的问题的自然语言文本的电子文档。该方法进一步包括从电子文档中移除被确定为满足一个或多个预定义过滤规则的一个或多个部分。该方法还包括使用数据字典结构确定与电子文档对应的第一组术语以包括在合成的电子文档中。该方法包括确定与电子文档对应的第二组术语以包括在合成的电子文档中,其中第二组术语中的至少一个术语满足至少一个预定义模式匹配规则。此外,该方法包括通过处理作为到机器学习模型的输入的电子文档来确定对应于电子文档的第三组术语,该机器学习模型被训练以识别电子文档内的相关术语。该方法包括基于第一组术语、第二组术语和第三组术语生成合成的文档。该方法进一步包括基于合成的电子文档确定数据储存库内的一组相关电子文档。该方法还包括将一组相关电子文档的至少一部分返回到请求装置。

附图说明

为了能够详细地理解本公开的上述特征的方式,可以通过参考各方面(其中一些方面在附图中示出)获得对以上简要概述的本公开的更具体的描述。

图1是根据本公开的一个实施例示出包括查询处理部件的系统的框图。

图2示出根据本公开的一个实施例的用于处理电子文档以识别由电子文档表示的故障的潜在解决方案的工作流程。

图3示出根据本公开的一个实施例的用于处理电子文档以识别由电子文档表示的故障的潜在解决方案的双层方法的工作流程。

图4a至图4d示出根据本公开的一个实施例的通过各种术语识别技术在电子文档内所识别的术语。

图5是根据本公开的一个实施例的表示示例性查询结果的图形界面。

图6是示出根据本文描述的一个实施例的利用数据储存库识别与所接收的电子文档相关的一组文档的方法的框图。

图7是示出用于通过使用机器学习模型识别数据储存库内与所接收的电子文档相关的一组电子文档的方法的框图。

图8是示出根据本文描述的一个实施例的用于通过使用被配置为识别所接收的电子文档内的相关术语的机器学习模型来识别数据储存库内与所接收的电子文档相关的一组电子文档的方法的框图。

具体实施方式

现代制造商和服务提供商具有与复杂系统(例如,飞行器)的生命周期相关的越来越大的数据集,包括由飞行器上的传感器收集的性能数据、维修报告、维修解决方案、服务公告等。往往可以在制造商维持的数据储存库内找到针对复杂系统的给定故障的解决方案,因为在许多情况下,先前已经经历类似复杂系统的故障,并且描述故障解决方案的细节记录在数据储存库内。然而,由于数据储存库的大小和生成用于查找与特定复杂系统的特定故障相关的数据的最佳搜索查询的困难,常规的基于计算机的搜索解决方案不足以满足复杂系统制造商和服务提供商的需求。

例如,飞行器制造商可以接收描述客户使用特定飞行器正经历的故障的几个自然语言文本句子。虽然可以使用整个自然语言文本生成搜索查询,但是这样做不能区分文本中的哪个(哪些)数据与客户正在经历的特定故障相关和/或对客户正在经历的特定故障是重要的。例如,停用词(例如,一个、一种、该等)对于几乎所有自然语言文本都是通用的,并且通常对于包含在搜索查询中是不重要的,而诸如零件号、飞行器位置、正在经历的特定故障等信息可能是高度相关性的。

常规的技术解决方案无法提供足够的方法以将针对飞行器维修事件的自然语言客户报告转换为搜索查询,该搜索查询将产生详细说明对客户正在经历的故障的(一个或多个)解决方案的准确结果。因此,在许多实例中,搜索数据储存库以用于解决方案的任务是手动过程,其中飞行器制造商或服务提供商员工生成搜索查询(或多个搜索查询)并手动审查查询结果以便为客户识别潜在的解决方案。此类过程在时间和资源上都很昂贵。此外,执行搜索的服务提供商员工可能难以识别问题的自然语言报告中的相关搜索术语,除非服务提供商员工对飞行器的生命周期以及生命周期期间所面临的常见故障和解决方案有充分了解。然而,找到具有适当知识库和理解力的员工以有效地执行这样的搜索可能是困难且昂贵的,从而使得常规解决方案效率低并阻碍此类解决方案的可扩展性。

本文描述的实施例提供了基于复杂系统的问题的自然语言报告以解决使基于计算机确定在电子数据储存库内的相关电子文档自动化的技术故障的技术,以便识别相关的解决方案和数据储存库中的电子文档内所描述的其他信息。有利地,实施例可以基于复杂系统的问题的给定自然语言报告,自动地确定数据储存库内的一组电子文档,该组电子文档识别类似的复杂系统问题及其对应的适用解决方案,从而显著降低复杂系统(例如,飞行器)的生命周期成本并且帮助减少主题专家手动干预搜索过程的需要。

通常,本文描述的实施例提供了用于合成复杂系统差异和元数据的自主数据分析方法和工具。本文描述的实施例可以通过在新的差异和先前的解决方案之间创建关系来识别类似的复杂系统解决方案。一个实施例将复杂系统差异合成为相关的可搜索数据模型。然后,这样的实施例可以使用具有在自动优化数据字典和加权重要性数据字段中所找到的识别关键字的整体复杂系统差异进行搜索。实施例可以使用机器学习和数据建模技术识别类似的复杂系统差异,并且可以将搜索结果与机器学习识别的记录相关联。模式分析可以进一步用于提供预测分析。然后,实施例可以使用相关差异生成相关解决方案信息,并将该信息提供给提交故障报告的客户。

一个实施例基于特定飞行器的飞行器问题的自然语言报告,提供基于计算机的搜索功能以识别具有适用的解决方案的类似的、先前记录的飞行器问题。虽然本文描述的实施例与飞行器的维修和生命周期有关,但更一般地,本文描述的技术也可以应用于其他产品的生命周期,并且不仅限于飞行器空间。因此,本公开内关于飞行器的维修和生命周期的示例仅出于说明性目的而被提供,并且不具有限制性。然而,更一般地,实施例可以应用于各种不同产品(例如,其他交通工具、复杂系统等)的维修和生命周期,以提高效率、降低成本和增加产品可用性。本文描述的实施例通过将客户信息与自主提供相关解决方案的机器学习数据模型合成,提供最佳合适解决方案和优化能力以提高准确度从而实现高水平的可用性。因此,实施例可以实时分析单个客户问题,并且将客户问题与所有可用的客户信息相关联。随着数据增加,数据模型可行性自动改善,并且实施例提供了一种比常规解决方案更加可扩展的方法,常规解决方案依赖于主题专家直接协助搜索过程。

图1是根据本文描述的一个实施例的包括查询处理部件的系统的框图。如图所示,系统100包括由数据通信网络130互连的查询分析系统105、多个飞行器135和客户系统170。查询分析系统105包括但不限于一个或多个计算机处理器110、存储器112和存储装置120,每个都连接到总线(未示出)。查询分析系统105还可以包括将i/o装置(例如,键盘、鼠标和显示装置)连接到查询分析系统105的输入/输出(i/o)装置接口(未示出)。此外,在本公开的上下文中,查询分析系统105中所示的计算元件可以对应于物理计算系统(例如,数据中心中的系统)或者可以是在计算云内执行的虚拟计算实例。

通常,本公开的示例实施方式的设备可以包括、包含或体现在一个或多个固定或便携式电子装置中。合适的电子装置的示例包括智能手机、平板计算机、膝上型计算机、台式计算机、工作站计算机、服务器计算机等。该设备可以包括连接到存储器112(例如,随机存取存储器(ram)装置、存储装置等)的多个部件(例如,处理器110)中的每一个的一个或多个。

通常,(一个或多个)计算机处理器110检索并执行存储在存储器112中的编程指令,以及存储和检索常驻在存储器112中的应用程序数据。总线用于在(一个或多个)计算机处理器110、i/o装置接口、存储装置120、网络接口(未示出)与存储器112之间传输编程指令和应用程序数据。注意,(一个或多个)计算机处理器110被包括以代表单个cpu、多个cpu、具有多个处理核的单个cpu等。

(一个或多个)计算机处理器110通常表示能够处理诸如数据、计算机程序和/或其他合适的电子信息等信息的任何计算机硬件。(一个或多个)计算机处理器110由电子电路的集合组成,其中一些电子电路可以封装为集成电路或多个互连的集成电路(集成电路有时更通常称为“芯片”)。(一个或多个)计算机处理器110可以配置为执行可以存储在处理器上或以其他方式存储在存储器112(相同设备或另一个设备)中的计算机程序。通常存储器112被包括以代表随机存取存储器。存储装置120可以是磁盘驱动器存储装置。尽管示出为单个单元,但是存储装置120可以是固定的和/或可移动的存储装置的组合,诸如固定磁盘驱动器、可移动存储卡或光学存储装置、网络附加存储装置(nas)或存储区域网络(san)。

根据具体的实施方式,(一个或多个)计算机处理器110中的每个可以表示多个处理器、多处理器核或一些其他类型的处理器。此外,(一个或多个)计算机处理器110可以使用多个异构处理器系统来实施,其中主处理器与单个芯片上的一个或多个次级处理器一起存在。作为另一个说明性示例,(一个或多个)计算机处理器110可以是包含相同类型的多个处理器的对称多处理器系统。在又一个示例中,(一个或多个)计算机处理器110可以体现为或以其他方式包括一个或多个专用集成电路(asic)、现场可编程门阵列(fpga)等。因此,尽管(一个或多个)计算机处理器110可以能够运行计算机程序以执行一个或多个功能,但是各种示例的处理器可以能够在不借助计算机程序的情况下执行一个或多个功能。

存储器112通常表示能够存储诸如,例如,数据、计算机程序(例如计算机可读程序代码)等的信息、和/或在临时基和/或永久基上的其他合适的信息的任何计算机硬件。存储器112可以包括易失性和/或非易失性存储器,并且可以是固定的或可移动的。合适的存储器的示例包括随机存取存储器(ram)、只读存储器(rom)、硬盘驱动器、快闪存储器、拇指驱动器、可移动计算机磁盘、光盘、磁带或上述的一些组合。光盘可以包括压缩盘-只读存储器(cd-rom)、压缩盘-读/写(cd-r/w)、数字多用盘(dvd)等。在各种实例中,存储器112可以被称为计算机可读存储介质。计算机可读存储介质是能够存储信息的非暂时性装置,并且可以与计算机可读传输介质(诸如能够将信息从一个位置传送到另一个位置的电子瞬态信号)区分开。本文描述的计算机可读介质通常可以指计算机可读存储介质或计算机可读传输介质。

除了存储器112,处理器110还可以连接到用于显示、发送和/或接收信息的一个或多个接口。接口可以包括通信接口(例如,通信单元)和/或一个或多个用户接口,该一个或多个用户接口的一个示例可以是网络接口。网络接口可以配置为发送和/或接收信息,例如将信息发送到另外的(一个或多个)设备、(一个或多个)网络等和/或接收来自另外的(一个或多个)设备、(一个或多个)网络等的信息。网络接口可以配置为通过物理(有线)通信链路和/或无线通信链路发送和/或接收信息。合适的通信接口的示例包括网络接口控制器(nic)、无线nic(wnic)等。

用户接口可以包括显示器和/或一个或多个用户输入接口(例如,输入/输出单元)。显示器可以配置为向用户呈现信息或以其他方式显示信息,该显示器的合适的示例包括液晶显示器(lcd)、发光二极管显示器(led)、等离子体显示板(pdp)等。用户输入接口可以是有线的或无线的,并且可以配置为从用户接收信息到设备中,诸如用于处理、存储和/或显示。用户输入接口的合适的示例包括麦克风、图像或视频捕获装置、键盘或小键盘、操纵杆、触敏表面(与触摸屏分离或集成到触摸屏中)、生物识别传感器等。用户接口可以进一步包括用于与诸如打印机、扫描仪等外围设备通信的一个或多个接口。

存储器112包含查询处理部件114、机器学习模型116和操作系统118。通常,操作系统118表示被配置为管理查询分析系统105上的计算硬件资源和计算软件资源的软件。操作系统118可以进一步为在查询分析系统105上执行的软件应用程序提供计算服务。

另外,查询处理部件114可以与客户系统170通信以检索自然语言事件报告数据180。每个飞行器135包括传感器装置145和服务中交通工具监测系统140,服务中交通工具监测系统140进而包括服务事件数据150和传感器事件数据160。通常,服务事件数据150表示为对应的服务中交通工具收集的诊断数据(例如,诊断代码和对应的时间戳,在这些对应的时间戳处检测到使用诊断代码分类的事件)。在一个实施例中,服务事件数据150内的事件由给定类别的交通工具的交通工具内的控制逻辑自动记录。

传感器事件数据160通常表示从相应的服务中交通工具上的传感器装置145所收集的数据。传感器装置145可以包括但不限于温度传感器、压力传感器、定位传感器、高度传感器等。更一般地,可以使用与本文描述的功能一致的适合于监测服务中交通工具的属性的任何传感器。在一个实施例中,查询分析系统105提供多个预定义触发条件,每个预定义触发条件针对从一个或多个传感器装置收集的一种或多种类型的传感器数据指定条件逻辑。在此类实施例中,在确定来自一个或多个传感器装置的一个或多个传感器数据值满足多个预定义触发条件之一后,查询分析系统105记录传感器事件数据160内的传感器事件。

客户系统170通常表示计算机系统,通过该计算机系统可以提交(例如,由工程师提交)维修事件报告,并且客户系统170包括自然语言事件报告数据180。通常,自然语言事件报告数据180包括多个服务事件的每个的自然语言描述。例如,工程师可以输入(例如,使用由客户系统170生成的图形用户界面)特定服务事件的文本描述,包括例如,经历的故障、故障原因、服务事件的(一个或多个)故障以及故障的解决。

通常,查询处理部件114可以从请求装置接收指定自然语言文本的电子文档,该自然语言文本描述飞行器的客户问题。例如,查询处理部件114可以从客户系统170接收自然语言事件报告数据180。作为示例,电子文档可以指定讨论中(inquestion)的飞行器、飞行器内经历差异的区域、所涉及的任何零件号的零件号、与差异相关的传感器读数、以及差异的自然语言描述。这种电子文档的示例在图4a中示出并在下面进行了更详细地讨论。然而,更一般地,电子文档可以包括与本公开一致的任何复杂系统(例如,飞行器、另一交通工具等)所经历的差异或问题的任何自然语言描述。

查询处理部件114可以合成电子文档以创建用于在识别数据储存库内的相关文档中使用的合成的电子文档。例如,查询处理部件114可以从电子文档中过滤掉一个或多个停用词。通常,停用词表示几乎在每个文档中找到的常用词,其中英语停用词的示例包括但不限于“a”、“an”、“the”、“of”等。更一般地,与本文描述的实施例一致,通常不向电子文档添加任何语义含义的任何单词都可以被过滤掉。

此外,使用数据字典结构识别对应于电子文档的第一组术语以包括在合成的电子文档中。例如,数据字典结构可以指定被确定为相关术语的单词列表,并且数据字典结构可以进一步指定与每个单词相关联的权重,该权重指示对应的单词指示由电子文档表示的差异或故障的可能性。例如,特定文档可以包括描述差异的自然语言文本的若干段落,但是对于电子文档所表示的故障和所表示的故障的解决方案来说,指定特定零件号具有可见裂缝的特定短语可能特别有意义。

此外,查询处理部件114可以识别对应于电子文档的第二组术语以包括在合成的电子文档中,其中第二组术语中的至少一个术语对应于满足至少一个预定义模式匹配规则。例如,可以定义模式匹配规则以识别由特定飞行器零件供应商所使用的零件号的格式。然而,更一般地,与本文描述的功能一致,可以使用任何类型的模式。

然后,查询处理部件114可以使用合成的电子文档访问数据储存库的索引,以识别数据储存库内的第一组相关电子文档。例如,鉴于数据字典结构以及预定义模式匹配规则,可以基于对相应文档的内容的评估来对数据储存库内的每个文档编索引。这样,查询处理部件114可以有效地搜索数据储存库,不是通过直接使用电子文档的内容搜索数据储存库,而是通过将电子文档的分析结果与通过对存储在数据储存库内的电子文档执行类似分析而生成的索引结构进行比较,从而识别数据储存库内具有类似分析结果的其他文档。

在一个实施例中,查询处理部件114可以通过处理作为到机器学习模型116的输入的电子文档来进一步识别第二组相关电子文档。例如,机器学习模型116可以被训练为识别电子储存库内的相关项目。然后,查询处理部件114可以将第一组相关电子文档和第二组相关电子文档中的至少一部分返回到请求装置。

在一个实施例中,查询处理部件114可以检索指定电子文档涉及的飞行器的区域的元数据。例如,当提交自然语言事件报告数据180时,客户系统170的用户可以指定经历事件的讨论中的飞行器的区域(例如,飞行器的机翼、着陆系统、驾驶舱等)。在一个实施例中,电子文档可以指定诸如美国航空运输协会(ata)规范(例如,章节和子章节)、型号等数据,这些数据可以用于确定电子文档涉及的飞行器内的感兴趣区域。

查询处理部件114可以基于电子文档涉及的飞行器的指定区域,为第一组术语和第二组术语中的至少一个术语分配相应的权重。换句话说,查询处理部件114可以确定特定术语在用于飞行器的特定区域的事件报告中使用时特别指示某些事件,但是相同术语在涉及飞行器的其他区域的事件报告中使用时可能是发生的特定事件的贫乏指示器。这样,查询处理部件114可以根据与自然语言事件报告数据180对应的飞行器的区域为术语分配不同的权重。

此外,当确定文档的术语组时,查询处理部件114可以将文档内出现的单词的同义词插入到术语组中。例如,许多客户在写详细描述飞行器的事件发生的电子文档时,可以使用术语“lh”作为“lefthand”的简写,并且查询处理部件114在检测到电子文档中出现首字母缩写“lh”时,可以将短语“lefthand”插入要考虑的术语中。类似地,查询处理部件114可以生成表示出现在电子文档内的单词的词干的术语,以便包括在术语组内。作为示例,尽管电子文档可以包括单词“replacement”,但是查询处理部件114可以在术语组中包括术语“replace”以确定数据储存库内的相关文档,因为“replace”是单词“replacement”的词干。

此外,查询处理部件114可以利用模式匹配来识别多个单词何时满足一个或多个预定义匹配规则。例如,可以定义匹配规则以识别后跟字母数字值的单词“零件号”(或其任何同义词或变体)的任何短语。继续该示例,在确定文档包括短语“零件号12345”时,查询处理部件114可以将术语“零件号12345”包括在术语组中以确定电子数据储存库中的相关文档。

在特定实施例中,查询处理部件114可以使用机器学习模型(例如,机器学习模型116)处理电子文档以确定对应于文档的一组相关术语。例如,机器学习模型可以被训练以分析详述飞行器故障的电子文档,并且机器学习模型可以输出被确定为与电子文档表示的故障或事件相关的一个或多个术语。然后,查询处理部件114可以使用由机器学习模型所识别的术语来查询数据储存库以识别相关的先前故障报告和与电子文档相关的解决方案。

图2示出了根据本公开的一个实施例的用于处理电子文档以识别由电子文档表示的故障的潜在解决方案的工作流程。如图所示,工作流程200描绘了复杂的差异系统,并且当查询处理部件114接收将针对包含可搜索数据205的数据储存库被处理的包含复杂系统(例如,飞行器)差异的自然语言描述的电子文档时,工作流程开始。

工作流程200开始于查询处理部件114合成所接收的电子文档以生成一组术语。在这样做时,查询处理部件114可以移除电子文档内的任何停用词或被确定为对电子文档的语义含义几乎没有影响的电子文档的其他部分。在一个实施例中,查询处理部件114进一步生成一组对应的权重,其中每个权重对应于该组术语中的一个术语。通常,查询处理部件114可以对电子文档执行自动优化操作,以通过使用数据字典215进一步优化(refine)对应于文档的一组术语。通常,数据字典215可以指定一组术语,这组术语通常指示由包含术语的电子文档所表示的差异。如果查询处理部件114识别电子文档内的数据字典215内的任何术语,则查询处理部件114可以在确定数据储存库中的相关文档时包括那些术语(和任何对应的权重)。

然后,查询处理部件114可以启动数据储存库的搜索(框230)以识别类似的差异报告及其对应的解决方案。此外,查询处理部件114可以使用经过训练的机器学习模型245来分析电子文档(或从电子文档中所导出的术语),以便识别(框240)一个或多个类似的差异报告(及其对应的解决方案)。查询处理部件114可以将类似的差异报告和解决方案相互关联(框250),以便确定一组排名的查询结果。查询处理部件114可以从关联的报告生成对详述差异报告的电子文档的解决方案(框260)。此外,查询处理部件114可以执行模式分析270以确定电子文档是否满足用于差异报告的任何预定义模式,如果满足,则可以相应地改变所生成的解决方案。

如框260所示,查询处理部件114可以生成由电子文档所描述的问题的解决方案。在一个实施例中,返回的解决方案可以包括两个或多个潜在解决方案的排名列表。查询处理部件114可以基于与所识别的数据储存库内的一组相关电子文档对应的一组解决方案来确定潜在的解决方案。例如,查询处理部件114可以确定用于数据储存库内的每个电子文档的相关性度量,其中相关性度量反映所接收的电子文档(即,包含当前问题的自然语言描述的文档)和数据储存库内的相应电子文档(例如,指定历史问题的自然语言描述)之间的确定的相关性。在一个实施例中,查询处理部件114被配置为使用合成的电子文档来识别第一组相关电子文档(在框230处)并且使用机器学习模型来识别第二组相关电子文档(在框240处)。然后,查询处理部件114可以关联第一组相关电子文档和第二组相关电子文档,以生成一组聚合的相关文档。在这样做时,查询处理部件114可以调整来自第一组相关电子文档和第二组相关电子文档的相关性度量,作为关联操作的一部分。例如,如果查询处理部件114确定在第一组相关电子文档和第二组相关电子文档中都识别出特定电子文档,则查询处理部件114可以增加用于特定电子文档的相关性度量(例如,通过将用于第一组中的特定电子文档的相关性度量与用于第二组中的特定电子文档的相关性度量组合)。

然后,查询处理部件114可以对该组解决方案(例如,如何解决历史问题的自然语言描述)进行集群(cluster)以生成两个或多个解决方案组。然后,查询处理部件114可以确定与所生成的解决方案组对应的两个或多个潜在的解决方案。然后,查询处理部件114可以基于分配给每个组的各种电子文档的相关性度量来确定用于所生成的解决方案组的每个的相关性度量。然后,查询处理部件114可以基于分配给每个组的各种电子文档的相关性度量来对潜在的解决方案进行排名。

例如,查询处理部件114可以确定数据储存库内的20个电子文档与所接收的电子文档充分相关。然后,查询处理部件114可以确定20个电子文档对应于两个不同的解决方案(即,使用两个不同解决方案之一解决20个电子文档中描述的问题)。查询处理部件114可以基于对应于解决方案的电子文档的相关性度量进一步确定两个不同解决方案的排名。例如,如果10个最相关的文档描述了使用第一解决方案所解决的问题,并且使用第二解决方案解决了所识别的一组文档中的剩余文档,则查询处理部件114可以在将解决方案返回到请求实体时,将第一解决方案排名在第二解决方案之前。作为另一示例,查询处理部件114可以在确定排名时考虑各种解决方案的使用频率。例如,20个电子文档中的18个电子文档描述了使用第三解决方案解决的问题,并且剩余的2个电子文档使用第四解决方案被解决,则查询处理部件114可以使第三解决方案在排名上优先于第四解决方案,因为第三解决方案比第四种解决方案被使用了更多的显着次数。当然,提供此类示例并非限制而仅用于说明目的,并且更一般地,查询处理部件114可以使用与本文描述的功能一致的任何合适的方法对解决方案进行排名。

然后,查询处理部件114可以将(一个或多个)解决方案提供给请求实体,电子文档从请求实体被接收(例如,讨论中的复杂系统的所有者和/或操作者)。例如,查询处理部件114可以使访问数据储存库的结果相关联,并且可以生成电子报告,该电子报告详述了由电子文档所描述的问题或情况的所识别的(一个或多个)解决方案。然后,用户(例如,服务讨论中的复杂系统的工程师)可以审查和实施此类(一个或多个)解决方案,以解决由查询处理部件114处理的电子文档中提出的问题或情况。有利地,实施例为自动识别数据储存库内的相关自然语言文本数据的技术故障提供了技术方案,例如,通过处理包含自然语言文本的所接收的电子文档并生成用于在访问数据储存库的索引结构中使用的合成的电子文档。

图3示出了根据本公开的一个实施例的用于处理电子文档以识别由电子文档所表示的故障的潜在解决方案的双层方法的工作流程。如图所示,工作流程300在框310处开始,其中查询处理部件114接收使用自然语言文本详述输入的飞行器问题的电子文档。然后,查询处理部件114使用双层方法分析电子文档。例如,查询处理部件114可以检索特定于电子文档的客户信息320(例如,客户先前经历的故障和差异、在由客户编写的电子文档中常用的术语和首字母缩写等),并且数据分析器部件325从电子文档中提取相关术语和其他元数据,以用于输入到数据模型335。通常,数据模型335被配置为识别数据储存库内与所接收的输入(例如,所提取的术语和其他元数据)对应的文档(和对应的解决方案)。

另外,查询处理部件114使用数据分析器315分析电子文档,数据分析器315使用多种技术从电子文档中提取关键术语,用于在识别类似的客户报告的故障及其对应的解决方案中使用。在这样做时,查询处理部件114可以基于由数据分析器315执行的输入的电子文档的分析的结果,利用搜索技术、模式匹配表达式、计算机逻辑和算法以及机器学习技术的组合识别相关的客户报告的故障及其对应的解决方案。然后,可以对数据模型335和分析330的分析的结果进行编译,以向客户提供相关的解决方案以及预防性解决方案340。

图4a至图4d示出了根据本公开的一个实施例的通过各种术语识别技术在电子文档中识别的术语。如图所示,图4a示出了文档400,其中通过预处理操作已经移除许多停用词和无关紧要的短语。例如,单词“的”、“该”、“那个”、“”等都已从文档中移除,因为这些停用词通常在大多数文档中使用,并且对讨论中的文档提供很少的语义含义。此外,短语“在视图/a/和/b/中所示”已经移除。在本示例中,假设创建正则表达式来移除该(和类似的)短语,因为这些短语对文档的语义含义几乎没有增加(例如,短语仅指附加的图像,并且本身没有添加任何值)。此外,如图所示,查询处理部件114已将对应于所识别的术语的同义词和词干单词的附加术语添加到用于识别数据储存库内的相关电子文档的合成的文档中。在所描绘的示例中,响应于查询处理部件114确定首字母缩写“lh”是对应于术语“lefthand”的预定义首字母缩写,术语“lefthand”已经被添加。此外,查询处理部件114基于文档中单词“finishing”的使用并基于确定“finish”是“finishing”的词干单词,将术语“finish”添加到合成的文档中。

图4b示出了文档420,其中查询处理部件114已经分析了输入的文档并且已经使用数据字典识别了文档内的一组术语(或关键字)。所识别的术语以粗体显示,其中诸如“leftcardoortrim”和“platingprocess”之类的术语已基于这些术语在数据字典中的存在被识别为文档内的潜在的重要术语。通常,数据字典可以被构造为包括通常指示与包含术语的电子文档对应的维修故障或差异的术语。

图4c示出了文档440,其中查询处理部件114使用训练的机器学习模型已经分析了文档并且已经将特定术语识别为相关的(以带下划线的文本示出)。因此,在所描绘的示例中,机器学习模型确定诸如“finishtreatment”和“platingprocess”的术语是相关的,而诸如“recordedleadtime”的其他术语则不是相关的。此外,图4d示出了对所接收的电子文档的模式匹配分析的结果,其中所识别的术语以粗体和下划线字体显现。例如,在所描绘的实施例中,查询处理部件114已经确定零件号“p/nxxxx1234”和“p/nxxxx2345”满足预定义模式匹配结果,用于识别遵循特定命名约定并显现在电子文档内的零件号。这样,查询处理部件114可以在生成用于在制定针对数据储存库的查询中使用的合成的文档时包括突出显示的术语。

一旦识别出术语,查询处理部件114就可以启动用于确定数据储存库内的相关电子文档的操作(或多个操作),并且可以确定一组相关的故障报告及其对应的解决方案。例如,查询处理部件114可以使用在电子文档内识别出的各种术语组(例如,图4a至图4d中所示的突出显示的术语)来执行若干不同的操作,并且可以执行相关操作(框250)以将各种结果调和为单个聚合结果组。然后,这样的一组聚合结果可以在图形用户界面中显示,如图5所示,根据本公开的一个实施例,图5描绘了表示示例性查询结果的图形界面。如图所示,图形用户界面500描绘了各种提交识别符,该提交识别符唯一地识别先前差异报告以及相关的历史报告的自然语言描述,该先前差异报告被发现与当前电子文档相关。图形用户界面500可以被配置使得当用户选择相关历史报告之一时,所选的报告的附加描述以及与所选报告有关的任何解决方案数据(例如,历史报告中详述的故障如何被解决的自然语言描述,以及与故障相关的任何零件号或服务公告)被显示。

图6是示出根据本文描述的一个实施例的利用数据储存库识别与所接收的电子文档相关的一组文档的方法的框图。如图所示,方法600从框610处开始,其中查询处理部件114从请求装置接收指定描述复杂系统的问题的自然语言文本的电子文档。然后,查询处理部件114通过以下操作来合成电子文档以创建合成的电子文档(框620):移除被确定为满足一个或多个预定义过滤规则的电子文档的一个或多个部分、使用数据字典结构识别对应于电子文档的第一组术语以包括在合成的电子文档中、以及识别对应于电子文档的第二组术语以包括在合成的电子文档中,其中第二组术语中的每个术语对应于满足至少一个预定义模式匹配规则。查询处理部件114进一步识别数据储存库内的与合成的电子文档相关的第一组电子文档(框630)。另外,查询处理部件114将第一组电子文档的至少一部分返回到请求装置(框640),并且方法600结束。

图7是示出用于通过使用机器学习模型识别数据储存库内的与所接收的电子文档相关的一组电子文档的方法的框图。方法700在框710处开始,其中查询处理部件114从请求装置接收指定描述飞行器的客户问题的自然语言文本的电子文档。查询处理部件114合成电子文档以创建合成的电子文档,包括:从电子文档中过滤掉一个或多个部分,其中该一个或多个部分被确定为满足至少一个预定义规则;使用数据字典结构识别对应于电子文档的第一组术语以包括在合成的电子文档中;以及识别对应于电子文档的第二组术语以包括在合成的电子文档中,其中第二组术语中的每个单词满足至少一个预定义模式匹配规则(框720)。此外,查询处理部件114使用合成的电子文档访问用于数据储存库的索引,以识别数据储存库内的第一组电子文档(框730)。查询处理部件114通过处理作为到机器学习模型的输入的电子文档来进一步识别第二组电子文档(框740),该机器学习模型被训练以识别电子储存库内的相关项目。在框750处,查询处理部件114将第一组电子文档和第二组电子文档中的至少一部分返回到请求装置,并且方法700结束。

图8是示出根据本文描述的一个实施例的用于通过使用机器学习模型识别数据储存库内与所接收的电子文档相关的一组电子文档的方法的框图,该机器学习模型被配置为识别所接收的电子文档内的相关术语。如图所示,方法800在框810处开始,其中查询处理部件114从请求装置接收指定描述复杂系统的问题的自然语言文本的电子文档。查询处理部件114从电子文档中移除被确定为满足一个或多个预定义过滤规则的一个或多个部分(框820)。例如,查询处理部件114可以从电子文档中过滤掉一个或多个停用词。查询处理部件114还使用数据字典结构确定对应于电子文档的第一组术语以包括在合成的电子文档中。

此外,查询处理部件114确定对应于电子文档的第二组术语以包括在合成的电子文档中,其中第二组术语中的每个术语满足至少一个预定义模式匹配规则(框840)。查询处理部件114通过处理作为到被训练以识别电子文档内的相关术语的机器学习模型的输入的电子文档来确定对应于电子文档的第三组术语(框850)。

然后,查询处理部件114基于第一组术语、第二组术语和第三组术语生成合成的电子文档(框860)。查询处理部件114使用合成的电子文档来确定数据储存库内的一组相关电子文档(框870)。查询处理部件114将该组相关电子文档的至少一部分返回到请求装置(框880),并且方法800结束。

通过使用一组相关电子文档的至少一部分,在复杂系统中解决了故障。复杂系统的技术人员使用一组相关电子文档的至少一部分以确定如何解决故障。然后技术人员例如通过检查、修复或更换故障原因来解决故障。在另一个实例中,提供给机器人、自主装置或计算机程序产品一组相关电子文档的至少一部分。然后,机器人、自主装置或计算机程序产品使用这些信息以例如通过检查、修复或更换故障原因来解决故障。

就飞行器而言,飞行器的技术人员使用一组相关电子文档的至少一部分来确定如何解决故障。然后技术人员例如通过检查、修复或更换故障原因解决故障。在另一个实例中,提供给机器人、自主装置或计算机程序产品一组相关电子文档的至少一部分。然后,机器人、自主装置或计算机程序产品使用该信息以例如通过检查、修复或更换故障原因来解决故障。

出于说明的目的,已经呈现本发明的各种实施例的描述,但是所述各种实施例的描述不旨是穷举性的或被限制到所公开的实施例。对本领域普通技术人员来说,在不脱离所描述的实施例的范围和精神的情况下,许多修改和变体将是明显的。选择本文所使用的术语以最好地解释实施例的原理、实际应用或对市场中发现的技术的技术改进,或者使得本领域普通技术人员能够理解本文所公开的实施例。

如本领域技术人员所理解的,本发明的各方面可以体现为系统、方法或计算机程序产品。因此,本发明的各方面可以采取完全硬件实施例、完全软件实施例(包括固件、常驻软件、微代码等)或软件方面与硬件方面组合的实施例的形式,上述实施例在本文中通常可以被称为“电路”、“模块”或“系统”。此外,本发明的各方面可以采取体现在一个或多个计算机可读介质中的计算机程序产品的形式,该一个或多个计算机可读介质具有体现在其上的计算机可读程序代码。

可以利用一个或多个计算机可读介质的任何组合。计算机可读介质可以是计算机可读信号介质或计算机可读存储介质。计算机可读存储介质可以是例如但不限于电子的、磁的、光的、电磁的、红外的或半导体的系统、设备或装置、或前述的任何合适的组合。计算机可读存储介质的更具体示例(非详尽列表)将包括以下项:具有一条或多条电线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom)、电可擦除可编程存储器(eeprom)诸如快闪存储器、光纤、便携式光盘只读存储器(cd-rom)、光存储装置、磁存储装置、或前述的任何合适的组合。在本文档的上下文中,计算机可读存储介质可以是任何有形介质,该有形介质可以包含或存储程序以供指令执行系统、设备或装置使用或与所述指令执行系统、设备或装置结合使用。

计算机可读信号介质可以包括传播的数据信号,其中计算机可读程序代码体现在其中,例如,在基带中或作为载波的一部分。这种传播的信号可以采用多种形式中的任何一种,包括但不限于电磁、光学或其任何合适的组合。计算机可读信号介质可以是任何计算机可读介质,该计算机可读介质不是计算机可读存储介质并且可以通信、传播或传输程序以供指令执行系统、设备或装置使用或与所述指令执行系统、设备或装置结合使用。

体现在计算机可读介质上的程序代码可以使用任何适当的介质传输,包括但不限于无线、有线、光纤电缆、射频(rf)等,或者前述的任何合适的组合。

用于执行本发明的各方面的操作的计算机程序代码可以以一种或多种编程语言的任何组合来编写,包括诸如java、smalltalk、c++等的面向对象编程语言和诸如“c”编程语言或类似的编程语言的传统过程式编程语言。程序代码可以在用户的计算机上完全地执行、在用户的计算机上部分地执行、作为独立的软件包在用户的计算机上部分地执行并且在远程计算机上部分地执行或在远程计算机或服务器上完全地执行。在后一种情况下,远程计算机可以通过任何类型的网络(包括局域网(lan)或广域网(wan))连接到用户的计算机,或者可以(例如,通过使用因特网服务提供商的因特网)连接到外部计算机。

下面参考根据本发明实施例的方法、设备(系统)和计算机程序产品的流程图图示说明和/或框图来描述本发明的各方面。应当理解,流程图图示说明和/或框图的每个框、以及流程图图示说明和/或框图中的框的组合可以由计算机程序指令实施。这些计算机程序指令可以被提供给通用计算机、专用计算机或其他可编程数据处理设备的处理器以产生机器,使得经由计算机或其他可编程数据处理装置的处理器执行的指令创建用于实施流程图和/或框图(一个或多个框)中指定的功能/动作的装置。

这些计算机程序指令还可以存储在计算机可读介质中,该计算机可读介质可以引导计算机、其他可编程数据处理设备、或其他装置以特定方式起作用,使得存储在计算机可读介质中的指令产生制品,该制品包括实施流程图和/或框图(一个或一个框)中指定的功能/动作的指令。

计算机程序指令还可以被加载到计算机、其他可编程数据处理设备或其他装置上,以使在计算机、其他可编程设备或其他装置上执行一系列操作步骤,以产生计算机实施的过程,使得在计算机或其他可编程设备上执行的指令提供用于实施流程图和/或框图(一个或一个框)中指定的功能/动作的过程。

本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质(或媒介),该计算机可读存储介质(或媒介)具有在其上的用于使处理器执行本发明的各方面的计算机可读程序指令。

计算机可读存储介质可以是有形装置,该有形装置可以保留和存储指令以供指令执行装置使用。计算机可读存储介质可以是例如但不限于电子存储装置、磁存储装置、光存储装置、电磁存储装置、半导体存储装置、或前述的任何合适的组合。计算机可读存储介质的更具体示例的非详尽列表包括以下项:便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、静态随机存取存储器(sram)、便携式光盘只读存储器(cd-rom)、dvd、记忆棒、软盘、机械编码装置(诸如具有在其上记录的指令的凹槽中的打孔卡或凸起结构)、以及前述的任何合适的组合。本文所使用的计算机可读存储介质不应被解释为暂时性信号本身,诸如无线电波或其他自由传播的电磁波、通过波导或其他传输介质传播的电磁波(例如,通过光纤电缆传递的光脉冲)、或通过电线传输的电信号。

本文描述的计算机可读程序指令可以从计算机可读存储介质下载到相应的计算/处理装置或者经由网络(例如,因特网、局域网、广域网和/或无线网络)下载到外部计算机或外部存储装置。网络可以包括铜传输电缆、光传输光纤、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理装置中的网络适配器卡或网络接口从网络接收计算机可读程序指令,并转发计算机可读程序指令用于存储在相应的计算/处理装置内的计算机可读存储介质中。

用于执行本发明的操作的计算机可读程序指令可以是汇编指令、指令集架构(isa)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,编程语言包括诸如java、smalltalk、c++等的面向对象编程语言以及诸如“c”编程语言或类似编程语言的传统过程式编程语言。计算机可读程序指令可以在用户的计算机上完全地执行、在用户的计算机上部分地执行、作为独立的软件包执行、在用户的计算机上部分地执行并且在远程计算机上部分地执行或在远程计算机或服务器上完全地执行。在后一种情况下,远程计算机可以通过任何类型的网络(包括局域网(lan)或广域网(wan))连接到用户的计算机,或者可以(例如,通过使用因特网服务提供商的因特网)连接到外部计算机。在一些实施例中,电子电路包括例如可编程逻辑电路、现场可编程门阵列(fpga)或可编程逻辑阵列(pla),电子电路可以通过利用计算机可读程序指令的状态信息以个性化电子电路来执行计算机可读程序指令,以便执行本发明的各个方面。

本文参考根据本发明实施例的方法、设备(系统)和计算机程序产品的流程图图示说明和/或框图来描述本发明的各方面。可以理解,流程图图示说明和/或框图的每个框、以及流程图图示说明和/或框图中的框的组合可以由计算机可读程序指令实施。

这些计算机可读程序指令可以被提供给通用计算机、专用计算机或其他可编程数据处理设备的处理器以产生机器,使得经由计算机或其他可编程数据处理设备的处理器执行的指令创建用于实施流程图和/或框图(一个或多个框)中指定的功能/动作的装置。这些计算机可读程序指令还可以存储在计算机可读存储介质中,该计算机可读存储介质可以引导计算机、可编程数据处理设备和/或其他装置以特定方式起作用,使得具有存储在其中的指令的计算机可读存储介质包括制品,该制品包括实施流程图和/或框图(一个或多个框)中指定的功能/动作的各方面的指令。

计算机可读程序指令还可以被加载到计算机、其他可编程数据处理设备或其他装置上,以使得在计算机、其他可编程设备或其他装置上执行一系列操作步骤,以产生计算机实施的过程,使得在计算机、其他可编程设备或其他装置上执行的指令实施在流程图和/或框图(一个或多个框)中指定的功能/动作。

附图中的流程图和框图示出了根据本发明的各种实施例的系统、方法和计算机程序产品的可能实施方式的体系结构、功能和操作。在这方面,流程图或框图中的每个框可以表示模块、区段或指令的一部分,其包括用于实施指定的(一个或多个)逻辑功能的一个或多个可执行指令。在一些可替代的实施方式中,框中所提到的功能可以不按图中所提到的顺序发生。例如,连续示出的两个框实际上可以基本上同时执行,或者框有时可以以相反的顺序执行,这取决于所涉及的功能。还应注意,框图和/或流程图图示说明的每个框、以及框图和/或流程图中的框的组合可以由基于专用硬件的系统来实施,该基于专用硬件的系统执行特定功能或动作或者执行专用硬件和计算机指令的组合。

虽然前述内容针对本发明的实施例,但是可以在不脱离本发明的基本范围的情况下设计本发明的其他实施例和进一步的实施例,并且本发明的范围由随附的权利要求确定。

此外,本发明包含根据以下条款的实施例:

条款1.一种方法,其包括:

从请求装置接收指定描述复杂系统的问题的自然语言文本的电子文档;

合成电子文档以创建合成的电子文档,包括:

移除被确定为满足一个或多个预定义过滤规则的电子文档的一个或多个部分;

使用数据字典结构识别对应于电子文档的第一组术语以包括在合成的电子文档中;以及

识别对应于电子文档的第二组术语以包括在合成的电子文档中,其中对应于电子文档的第二组术语中的至少一个术语满足至少一个预定义模式匹配规则;

识别数据储存库内的与合成的电子文档相关的第一组电子文档;以及

将第一组电子文档的至少一部分返回到请求装置。

条款2.根据条款1所述的方法,进一步包括:

将相应的权重分配给第一组术语中的至少一个术语,权重指示至少一个术语相对于第一组术语中的其他术语的相关性,

其中,识别数据储存库内的第一组电子文档至少部分地基于分配给第一组术语中的至少一个术语的权重。

条款3.根据条款2所述的方法,其中复杂系统进一步包括飞行器,并且其中方法进一步包括:

识别指定电子文档涉及的飞行器中的感兴趣区域的元数据,

其中至少部分地基于感兴趣区域确定分配的权重。

条款4.根据条款1-3中任一项所述的方法,其中识别数据储存库内的与合成的电子文档相关的第一组电子文档进一步包括:

使用合成的电子文档访问用于数据储存库的索引以识别第一组电子文档,其中基于对应于存储在数据储存库内的多个电子文档的多个合成的电子文档生成索引。

条款5.根据条款1-4中任一项所述的方法,其中合成电子文档以创建合成的电子文档进一步包括:

将一个或多个同义词添加到电子文档中,所述一个或多个同义词对应于电子文档内的第一单词;和

用对应的词干单词替换电子文档内的第一单词。

条款6.根据条款1-5中任一项所述的方法,进一步包括:

通过处理作为到机器学习模型的输入的电子文档来识别数据储存库内的第二组电子文档,所述机器学习模型被训练以识别电子储存库内的相关电子文档;和

将第二组电子文档的至少一部分返回到请求装置。

条款7.根据条款6所述的方法,进一步包括:

优化被训练以识别数据储存库内的相关电子文档的机器学习模型;

将电子文档和相关联的最佳解决方案存储在数据储存库内;以及

基于合成的电子文档,更新用于数据储存库的索引以识别存储的电子文档和相关联的最佳解决方案。

条款8.根据条款6-7中任一项所述的方法,其中复杂系统进一步包括飞行器,其中基于对应的至少一个预定义模式匹配规则,为所述第二组术语中的至少一个单词分配相应的权重;其中基于电子文档涉及的飞行器的部分进一步确定权重,并且其中针对至少一个预定义模式匹配规则中的至少一个为飞行器的至少一个部分分配相应的权重。

条款9.根据条款1-8中任一项所述的方法,其中合成电子文档以创建合成的电子文档,进一步包括:

通过处理作为到机器学习模型的输入的电子文档来识别对应于电子文档的第三组术语以包括在合成的电子文档中,所述机器学习模型被训练以识别电子文档内的相关术语。

条款10.根据条款1-9中任一项所述的方法,其中将第一组电子文档的至少一部分返回到请求装置进一步包括:

确定第一组电子文档中的至少一个电子文档的相关性衡量,指示至少一个电子文档与所接收的电子文档的相关性的度量;

基于对应于第一组电子文档中的电子文档的解决方案和确定的用于至少一个电子文档的相关性度量,确定由所接收的电子文档的自然语言文本描述的复杂系统的问题的一个或多个解决方案;以及

将对复杂系统的问题的一个或多个解决方案返回到请求装置。

条款11.根据条款1-10中任一项所述的方法,其中复杂系统进一步包括飞行器,并且其中数据储存库包括至少第一电子文档,所述第一电子文档包括用于飞行器系统的修复请求、对飞行器系统的更新、飞行器系统的替换、或其组合,并且其中请求装置进一步包括用于飞行器机队的操作员装置,所述飞行器机队包括飞行器。

条款12.一种系统,其包括:

一个或多个计算机处理器;和

包含计算机程序代码的存储器,当由一个或多个计算机处理器的操作执行时,计算机程序代码执行操作,所述操作包括:

从请求装置接收指定描述飞行器的客户问题的自然语言文本的电子文档;

合成电子文档以创建合成的电子文档,包括:

从电子文档过滤掉一个或多个部分,其中一个或多个部分被确定以满足至少一个预定义规则;

使用数据字典结构识别对应于电子文档的第一组术语以包括在合成的电子文档中;以及

识别对应于电子文档的第二组术语以包括在合成的电子文档中,其中第二组术语中的至少一个单词满足至少一个预定义模式匹配规则;

使用合成的电子文档访问用于数据储存库的索引以识别数据储存库内的第一组电子文档;

通过处理作为到第一机器学习模型的输入的电子文档来识别第二组电子文档,所述第一机器学习模型被训练以识别数据储存库内的相关文档;以及

将第一组电子文档和第二组电子文档中的至少一部分返回到请求装置。

条款13.根据条款12所述的系统,所述操作进一步包括:

检索指定电子文档涉及的飞行器的区域的元数据,和

基于电子文档涉及的飞行器的区域,将相应的权重分配给第一组术语和第二组术语中的至少一个术语。

条款14.根据条款12-13中任一项所述的系统,其中合成电子文档以创建合成的电子文档进一步包括将一个或多个同义词添加到电子文档,所述一个或多个同义词对应于电子文档内的第一单词。

条款15.根据条款12-14中任一项所述的系统,其中合成电子文档以创建合成的电子文档进一步包括利用相应的词干单词替换电子文档内的第一单词。

条款16.根据条款12-15中任一项所述的系统,其中基于满足至少一个预定义模式匹配规则,为第二组术语中的至少一个单词分配权重,其中基于电子文档涉及的飞行器的部分进一步确定权重,其中针对至少一个预定义模式匹配规则为飞行器的至少一部分分配权重。

条款17.根据条款12-16中任一项所述的系统,其中识别电子文档内的第二组术语以包括在合成的电子文档中进一步包括确定多个单词何时满足一个或多个预定义模式匹配规则,所述多个单词包括第二组术语中的一个术语。

条款18.根据条款12-17中任一项所述的系统,其中合成电子文档以创建合成的电子文档,进一步包括:

通过处理作为到第二机器学习模型的输入的电子文档来识别对应于电子文档的第三组术语以包括在合成的电子文档中,所述第二机器学习模型被训练以识别电子文档内的相关术语。

条款19.根据条款12-18中任一项所述的系统,进一步包括:

优化被训练以识别数据储存库内的相关文档的第一机器学习模型;和

将电子文档和相关联的最佳解决方案存储在数据储存库内,其中数据储存库至少包括第一电子文档,所述第一电子文档包括用于飞行器系统的修复请求、对飞行器系统的更新、飞行器系统的替换、或其组合,并且其中请求装置进一步包括用于飞行器机队的操作员装置,所述飞行器机队包括飞行器。

条款20.一种方法,其包括:

从请求装置接收指定描述复杂系统的问题的自然语言文本的电子文档;

从电子文档中移除被确定为满足一个或多个预定义过滤规则的一个或多个部分;

使用数据字典结构确定对应于电子文档的第一组术语;

确定对应于电子文档的第二组术语,其中第二组术语中的至少一个术语满足至少一个预定义模式匹配规则;

通过处理作为到机器学习模型的输入的电子文档来确定对应于电子文档的第三组术语,所述机器学习模型被训练以识别电子文档内的相关术语;

基于第一组术语、第二组术语和第三组术语生成合成的电子文档;

基于合成的电子文档确定数据储存库内的一组相关电子文档;以及

将一组相关电子文档的至少一部分返回到请求装置。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1