用于自主飞行器的对话系统的制作方法

文档序号:30493996发布日期:2022-06-22 03:09阅读:156来源:国知局
用于自主飞行器的对话系统的制作方法

1.本发明涉及用于自主飞行器的对话系统。


背景技术:

2.飞行器的操作通常涉及飞行员与空中交通管制(atc:air traffic control)之间的通信。atc指导地面和空中的交通,实施飞行器之间的分离(separation)、排序活动、管理拥塞和资源使用、指派优先级以及考虑天气活动。为此,通常居于塔台中的空中交通管制员(air traffic controller)贯穿从滑行到着陆的所有飞行阶段传达引导飞行器移动的许可(clearance)。这种方法需要来自人类飞行员的高度发展的知识和技能来成功地解释来自atc的许可和其它信息。这种要求部分地是由atc通信中的高度特定和技术术语产生的,从而不仅必需有深度的知识来理解单独术语,而且必需理解由多个术语组成的复杂指令的更大含义。另外,需要飞行器的深度操作知识来基于atc许可确定要执行的适当的飞行器动作,就像对总体形势的情境感知一样,特别是在偏离atc许可是适当的情况下。
3.与有人驾驶飞行器不同,无人驾驶飞行器(unmanned aircraft)不具备机载飞行员的知识和技能来帮助操作。在一些背景下,这可能不会造成问题,诸如无人驾驶飞行器由人类飞行员进行远程控制或者被配备成完全自主地行进。然而,机载飞行员的缺乏在其它背景下会导致问题。例如,在需要与atc的通信的背景下(诸如在受控空域中)整合自主飞行器仍然是未解决的问题,部分是由于在自主飞行器处理解atc通信存在着挑战。机载飞行员的缺乏意味着,在自主飞行器上处存在为理解atc通信的术语和总体含义以及作为响应执行适当的动作所需的人类知识和技能。不能自主地理解atc通信加剧了建造和部署自主飞行器的已经很重要的挑战。
4.鉴于上述,在受控空域以及发生与atc的通信的其它背景中整合自主飞行器存在挑战。


技术实现要素:

5.根据本公开的一个方面,提供了一种对自主载具(autonomous vehicle)进行管制的方法。在这个方面,所述方法包括以下步骤:接收有关自主飞行器的操作的文本串;经由解码器模块分析文本串(text string),以标识该文本串中的一个或更多个语言学飞行器管制组分(linguistic aircraft control component);以及访问与解码器模块关联的飞行器相关知识库,以证实一个或更多个所标识的语言学飞行器管制组分。所述方法还包括以下步骤:至少基于所标识的语言学飞行器管制组分,确定用于对自主飞行器进行管制的命令;以及输出该命令以供自主飞行器执行。
6.本公开的另一方面涉及一种用于对自主飞行器进行管制的系统。在这个方面,该系统包括:逻辑子系统以及存储子系统,该存储子系统包括能够由逻辑子系统执行的指令,该指令:(1)接收有关自主飞行器的操作的文本串;(2)经由解码器模块分析文本串,以标识该文本串中的一个或更多个语言学飞行器管制组分;以及(3)访问与解码器模块关联的飞
行器相关知识库,以证实一个或更多个所标识的语言学飞行器管制组分。该存储子系统还包括能够由逻辑子系统执行的指令,该指令:至少基于所标识的语言学飞行器管制组分,确定用于对自主飞行器进行管制的命令;以及输出该命令以供自主飞行器执行。
7.本公开的又一方面涉及一种自主飞行器,该自主飞行器包括:推进系统、逻辑子系统以及存储子系统,该存储子系统包括能够由逻辑子系统执行的指令,该指令:接收有关自主飞行器的操作的文本串;经由解码器模块分析文本串,以标识该文本串中的一个或更多个语言学飞行器管制组分;以及访问与解码器模块关联的飞行器相关知识库,以证实一个或更多个所标识的语言学飞行器管制组分。该存储子系统还包括能够由逻辑子系统执行的指令,该指令用于:至少基于所标识的语言学飞行器管制组分,确定用于对自主飞行器进行管制的命令;以及发送用于空中交通管制的所述命令的指示。
8.已经讨论的特征、功能以及优点可以在不同实施方式中独立实现,或者可以在其它实施方式中进行组合,这些特征、功能以及优点的进一步细节可以参照下面的描述和附图而得以了解。
附图说明
9.图1示出了描绘根据本公开的示例实施方式的其中自主飞行器从atc塔台接收atc通信的机场的例示图。
10.图2示出了描绘根据本公开的示例实施方式的对话系统的例示图,自主飞行器和atc可以利用该对话系统经由语音进行通信。
11.图3示出了描绘根据本公开的示例实施方式的经由解码器模块标识文本串中的语言学飞行器管制组分的例示图。
12.图4示出了根据本公开的示例实施方式执行的方法的操作的例示图。
13.图5示出了根据本公开的示例实施方式的计算系统的框图。
具体实施方式
14.鉴于上述考虑事项,提供了涉及基于语音来对自主飞行器进行管制的方法、系统和设备。简要地,经由解码器模块对有关自主飞行器的操作的文本串进行分析,以标识该文本串中的一个或更多个语言学飞行器管制组分。作为示例,文本串可以从来自空中交通管制(atc)塔台的通信中导出,并且语言学飞行器管制组分可以包括:许可(clearances)、呼号(call signs)、目的地、路线和/或其它组分。访问与解码器模块关联的飞行器相关知识库,以证实一个或更多个所标识的语言学飞行器管制组分,这可以包括证实组分在知识库中的存在、确定飞行路径是有效的,和/或其它操作。至少基于所标识的语言学飞行器管制组分,确定用于对自主飞行器进行管制的命令并输出以供自主飞行器执行。
15.本文所描述的方法使得自主飞行器例如能够解释和响应来自atc的通信并执行适当的动作。另外,解释和动作确定可以形成对话系统的一部分,自主飞行器利用该对话系统经由自然语言回读消息(read back message)向atc作出响应,该自然语言回读消息可以由空中交通管制员加以解释。利用这些能力,可以将自主飞行器整合到受控空域以及发生飞行器与atc之间的通信的其它场景中,从而极大地扩展了自主飞行器可以被有效且安全地使用的背景,并且支持在操作期间不需要人来监督的完全自主飞行器的实现。如下面进一
步详细描述的,实际的atc通信可以是众包的(crowdsourced),并且用于对解码器模块进行训练,以标识文本串中的语言学飞行器管制组分,从而使自主飞行器能够解释atc通信。该方法提供了用于收集训练数据并以高准确度解码文本串的高效机制。
16.图1示出了自主飞行器102从atc塔台104接收atc通信的示例机场100。在该示例中,atc塔台104发送指令飞行器102经由特定路线(α)向特定跑道(跑道1)滑行的许可(由106指示)。许可106是经由位于atc塔台104处的空中交通管制员说出的语音,经由atc塔台104与飞行器102之间的甚高频无线电链路或者任何其它合适的通信机制来传送的。此外,通过对捕获语音的音频执行语音识别,可以将许可106转换成文本串。如别处所描述的,语音识别可以在飞行器102上或别处来执行,诸如在atc塔台104或104或其它atc地面站处执行。
17.经由下面描述的解码器模块,对文本串进行解码以标识该文本串中的构成许可106的语言学飞行器管制组分。在该示例中,这样的组分包括:被指派给飞行器102的呼号(redwood three fifty,redwood 350)、操作(滑行)、目的地(跑道1)以及路线(α)。使用还在下面进行描述的其它模块,语言学飞行器管制组分中的一个或更多个被证实,这可以包括:验证管制组分在飞行器相关知识库中的存在、使用地图服务来证实路线、和/或其它操作。基于所标识的语言学飞行器管制组分,并且潜在地基于其它信息(诸如在先事件、从atc接收的在先许可、地面活动以及天气活动),来确定用于对飞行器102进行管制的命令。在该示例中,命令的执行使飞行器102经由在许可106中标识的路线(α)滑行至目的地(跑道1)。飞行器102还可以经由确认许可106的自然语言消息(以108指示)来响应该许可106。通过以短语表达为自然语言响应,消息108可以被atc塔台104处的空中交通管制员直接理解。在一些示例中,可以将语音传送消息108进行合成并中继至atc,使得消息108被接收,就好像atc正在与被驾驶的飞行器进行通信一样。
18.虽然被描绘为客机,但是飞行器102可以采取自主飞行器(autonomous aircraft)的任何形式。示例包括但不限于,轻型飞行器、大型飞行器、动力飞行器、无动力飞行器、飞机、飞艇、直升机以及航天器。此外,如本文所使用的“自主飞行器”可以指的是由非飞行员(例如,乘客)占用(occupied)的无人驾驶飞行器和/或无人驾驶的、未被占用的飞行器。虽然图1例示了在滑行期间的飞行器-atc对话,但是本文所描述的用于向自主飞行器提供自主地解释飞行器管制通信并执行对应动作的方法适用于除滑行之外的其它飞行阶段,包括:起飞(takeoff)、爬升(climb)、巡航(cruise)、下降、进近(approach)和/或着陆(landing)。
19.图2描绘了示例对话系统200,自主飞行器和atc可以利用该对话系统经由语音进行通信。如下面进一步详细描述的,系统200包括可以在与atc关联的位置(诸如atc塔台)和/或在自主飞行器处实现的各种模块。例如,可以实现系统200的各方面以便于自主飞行器102与atc塔台104之间的对话。
20.在所描绘的示例中,在音频处理模块204处接收捕获针对自主飞行器的操作的语音的音频202。在所描绘的示例中,音频202从atc塔台104接收音频202,但是可以从任何合适的源接收该音频,包括从自主飞行器上的飞行员接收该音频。音频处理模块204包含噪声抑制模块206,该噪声抑制模块206可操作以抑制/去除音频202中的噪声,其中,抑制/去除可以包括对音频进行滤波和/或任何其它合适的音频处理。音频处理模块204还包括分割
(segmentation)模块208,该分割模块208可操作以将音频202中的捕获针对自主飞行器的操作的语音的部分与音频202中的未捕获这种语音的其它部分(诸如无声)分割。在一些示例中,可以将模块206和208进行组合,以在公共音频处理步骤中提供噪声抑制/去除和分割。在其它示例中,可以将经由模块204的音频处理省略,或者修改成包括任何合适类型的音频处理。
21.捕获针对自主飞行器的操作的语音的音频202可以包括飞行器管制通信,如本文所使用的,该飞行器管制通信指的是针对包括在地面时和在飞行期间的飞行器的通信。在一些示例中,飞行器管制通信包括一个或更多个atc许可。如本文所使用的,“atc许可”指的是atc对飞行器继续进行的授权。在一些示例中,如本文所使用的“atc许可”可以指的是除了atc授权之外的其它通信,诸如咨询、天气信息和/或交通信息。
22.在所描绘的示例中,音频处理模块204输出已经历噪声抑制/去除和分割的经处理的音频。语音识别模块210接收经处理的音频并对该音频执行语音识别,这生成包括在经处理的音频中识别的语音的文本串。模块210可以采用用于识别语音的任何合适的机制,包括但不限于,隐markov模型(hidden markov model)、动态时间规整(dynamic time warping)以及神经网络。作为特定的示例,模块210可以采用经深度学习训练的递归神经网络-连接时间分类模型(connectionist temporal classification model)来识别语音。
23.对话系统200包括解码器模块212,该解码器模块212接收由语音识别模块210输出的文本串。解码器模块212标识文本串中的一个或更多个语言学飞行器管制组分。通常,语言学飞行器管制组分是与飞行器的操作相关的文本串中的单词、术语、短语或其它语言学元素。作为示例,语言学飞行器管制组分可以包括但不限于,atc许可、机场对象(例如,跑道(runway)、加油点(fuel pit)、滑行道(taxiway))、呼号、操作以及位置信息(例如,起点、目的地、路线、关于飞行计划的信息)。
24.图3例示了经由解码器模块212标识文本串300中的语言学飞行器管制组分的示例。文本串300是从由图1中的atc塔台104发出的atc许可106导出的。在该示例中,文本串300中所标识的语言学飞行器管制组分包括:操作(滑行);路线信息,包括路线名称(alpha,α)以及路线信息存在的语言学指示符(经由);目的地信息,包括目的地的类型(跑道)、目的地的名称(一)以及向目的地前进的方向(右);以及由指派给自主飞行器102的呼号标识的受众(redwood 350)。可以在模板302中填充所标识的语言学飞行器管制组分,该模板302可以包括预定义的字段和属性。图3还例示了可以在文本串中标识的其它语言学飞行器管制组分及其属性,包括:路线的类型、方向和状态、目的地的存在和目的地的状态的语言学指示符、许可的源(例如,许可源自的atc塔台)、以及与许可关联的时间。通常,可以将解码器212配置成,标识文本串中的任何合适的语言学飞行器管制组分和组分属性,其中,这种配置可以是下面描述的训练过程的部分。
25.解码器模块212可以以任何合适方式来标识语言学飞行器管制组分。在一些示例中,解码器模块212标识文本串中的单词或术语之间的边界。此外,解码器模块212可以将基于字典树(trie)和/或有限状态转换器的序列标记算法应用于文本串,以标识语言学飞行器管制组分。同样地,图2描绘了在解码器模块212中包括转换器213(例如,字典树和/或有限状态转换器)。然而,可以在任何合适的位置实现转换器213。在一些示例中,解码器模块212可以采用自然语言处理来标记解析(tokenize)文本串。在这样的示例中,自然语言处理
可以在航空相关领域中执行,例如,标记或标识语言学飞行器管制组分和/或检测文本串中的事件。例如,可以采用基于字典树和/或有限状态转换器的序列标记(例如,经由转换器213)。在一些示例中,解码器模块212可以基于预定义本体(ontology)来解析许可,该预定义本体可以用于确定描述许可的语义属性。另选地或者除了其它合适的机制之外,解码器模块212还可以应用前述机制的任何合适的组合来标识语言学飞行器管制组分。
26.如上提及,可以对解码器模块212进行训练,以标识语言学飞行器管制组分。在这样的示例中,可以使用包括飞行器管制通信(例如,atc许可)的训练数据来对解码器模块212进行训练。飞行器管制通信可以是在飞行器操作期间交换的实际飞行器管制通信,或者可以是合成的(例如,由飞行员合成)。作为一个示例,飞行器管制通信可以经由在线工具从飞行员众包,其中飞行员输入(例如,键入或说出)飞行器管制通信。在一些示例中,可以对训练数据进行标注,以标识其中包括的语言学飞行器管制组分。作为示例,可以在第一遍(pass)中通过手工提供标签或者通过解码器模块212以编程方式确定标签,随后在第二遍中对标签进行校正。此外,在一些示例中,解码器模块212的训练可以包括:接收指示解码器模块212的输出的准确度的反馈。例如,飞行员可以审查解码器模块212的输出,从而提供任何合适的反馈,包括但不限于,输出的评级(rating)、输出是正确还是不正确的是/否指示、以及不正确地标识的语言学组分的校正。因此,可以根据至少部分地受监督的学习过程来训练解码器模块212。在一些示例中,可以采用主动学习来将附加训练数据自举(bootstrap)至初始训练数据集。
27.如上所述,解码器模块212可以采用转换器213来标识语言学飞行器管制组分。另选地或者另外,解码器模块212可以采用一个或更多个神经网络(例如,深度神经网络)来标识语言学飞行器管制组分。在这样的示例中,可以经由深度学习方法来对解码器模块212进行训练。
28.解码器模块212还通过访问飞行器相关知识库214来证实一个或更多个所标识的语言学飞行器管制组分。知识库214通常包括这样的信息,即,该信息可以用来证实语言学飞行器管制组分的存在和/或其它属性。作为示例,知识库214可以包括关于飞行器相关操作的信息,在一些示例中,该飞行器相关操作可以涉及单独的飞行阶段(例如,滑行操作)、呼号(诸如用来进行对话的自主飞行器的呼号)、与自主飞行器相关的信息(例如,特征、规范、组件(component))、关于飞行或飞行阶段的本体信息、和/或机场对象(例如,跑道、滑行道、加油点、登机门(gate)、停放区)。同样地,可以将知识库214称为机场相关知识库。可以存储在知识库214中的信息的另选或附加示例包括:诸如越过(cross)、滑行(taxi)、连续滑行(continue taxiing)、前进(proceed)、跟随(follow)、头朝特定特定方向(head in a particular direction)、下降(descend)、着陆(land)以及保持高度的操作;诸如“去往”的目的地指示符;诸如“经由”和“之上(on)”的位置指示符;诸如笔直、左、右的方向;航空公司名称;和/或机场名称。
29.在一些示例中,可以基于知识库214来构造字典树,其中,向字典树的各个叶节点指派类别标签。然后,可以使用字典树以类别来标注话语/许可/文本,从而生成经标注的语言学飞行器管制组分(例如,形成经解码的文本串)。类别可以包括但不限于,呼号、数字(例如,高度)、目的地或目的地类型、受众、操作、路线指示符以及记号(token)。可以将经标注的语言学飞行器管制组分或记号用于填充(例如,经由转换器213)诸如模板302的模板。
30.作为例示对语言学飞行器管制组分的证实的一个示例,从atc许可中提取的呼号可以通过访问知识库214并确定知识库214中是否存在该呼号来进行证实。在一些示例中,知识库214可以存储呼号的变化(并且潜在地存储其它语言学飞行器管制组分)。可以将这种呼号证实用于确定在自主飞行器处接收的许可是针对该自主飞行器,还是改为相反地针对另一实体并由此可以被忽略。作为证实的另一示例,atc许可中标识的目的地可以通过确定知识库214中是否存在该目的地来进行证实。此外,解码器模块212可以将换能器213应用于知识库214以标识其中的信息,包括但不限于,滑行操作和其它飞行阶段的操作、目的地以及路线。
31.在一些示例中,解码器模块212可以使用地图服务216来证实语言学飞行器管制组分。例如,可以访问地图服务216以证实采用位置信息形式的语言学飞行器管制组分,该位置信息诸如是起点、目的地、飞行路径、飞行计划、坐标(例如,机场对象的坐标)和/或任何其它合适的信息。地图服务216可以提供任何合适的功能来服务语言组分证实,包括但不限于,卫星或空中成像、拓扑地图、交通分析和/或路线规划。因此,解码器模块212可以潜在地与其它模块协作来执行证实。
32.解码器模块212生成经解码的信息作为输出,这可以包括但不限于,经证实的语言学飞行器管制组分以及经证实的解码的许可。状态跟踪模块218接收从解码器模块212输出的经解码的信息。状态跟踪模块218存储包括atc与自主飞行器之间的通信(例如,atc许可)的事件日志。可以将事件日志实现为加时间戳的动态队列或者采用任何其它合适的方式。此外,事件日志可以包括任何其它合适的数据,包括但不限于,经解码的atc许可和其它指令/命令、关于自主飞行器和/或其中的组件的状态的信息、以及关于周围世界的信息(例如,地面和/或空中交通、天气信息、与其它飞行器的通信)。如下所述,可以响应于接收到的atc许可来确定用于对自主飞行器进行管制的命令。这种命令可以基于被存储在状态跟踪模块218中的数据来加以确定。在一些场景中,这可以包括访问与在当前时间之前发生的在前事件相对应的事件日志中的数据。例如,在确定用于对自主飞行器进行管制的命令方面,可以检查事件日志以标识和分析与其它飞行器的atc通信,例如,确定其它飞行器是否处于与自主飞行器相同的跑道上、标识跑道关闭、或者用于任何其它合适的目的。这些方面使得状态跟踪模块218能够向自主飞行器提供形势感知。
33.对话系统200还包括策略模块220,该策略模块220基于系统200中的一个或其它模块的输出来执行判定。例如,策略模块220可以确定要发送至执行模块222的命令,该执行模块实现自动驾驶仪功能,以基于在对话系统200中确定的动作来自主地对自主飞行器进行管制。在一些示例中,用于对自主飞行器进行管制的命令的确定可以在解码器模块212与策略模块220以及潜在地与图2中描绘的其它模块之间协作地加以确定。在命令确定至少部分地发生在策略模块220处的情况下,策略模块220可以基于来自解码器模块212的经证实的解码的输出(例如,经解码的许可)以及由状态跟踪模块218存储的事件中的一个或更多个,来确定用于对自主飞行器进行管制的命令。作为解码器模块212与策略模块220之间的潜在协作的另一示例,策略模块220可以请求解码器模块212校正在解码过程中发生的错误,诸如无法解码/理解/标识目的地或其它位置。
34.策略模块220可以确定要发送至atc的消息(例如,响应于先前接收到的许可)。在一些示例中,策略模块220可以根据是否证实了许可以及根据许可是否针对相关自主飞行
器,来确定不同的消息。例如,策略模块220可以响应于证实许可而生成第一消息,其中,第一消息包括确认回读。参照图1所描绘的示例,策略模块220可以生成在消息108中传送的确认回读,从而确认从atc塔台104发出的许可106。此外,策略模块220可以响应于证实许可的失败而生成第二消息,其中,第二消息包括传送该失败的证实的错误消息。例如,错误消息可以请求atc重复许可和/或请求进一步的指令。代替地,如果策略模块220确定许可未针对相关自主飞行器,则策略模块220可以放弃生成消息。
35.由策略模块220确定的消息可以在经由自然语言消息模块224合成的语音中被中继至atc。具体地,自然语言消息模块224可以基于从策略模块220接收到的消息来生成自然语言响应。例如,自然语言消息模块224可以响应于证实所标识的语言学飞行器管制组分,来生成用于向atc操作员输出的第一自然语言响应,其中,该响应指示了证实。自然语言消息模块224还可以响应于未能证实所标识的语言学飞行器管制组分,来生成用于向atc操作员输出的第二自然语言响应,其中,该响应指示这种证实失败。图2例示了从自然语言消息模块224到atc塔台104的自然语言消息225的输出。自然语言消息模块224可以实现生成自然语言消息的任何合适的方法,包括但不限于使用预定义的规则集。
36.如上提及,解码器模块212潜在地与诸如策略模块220这样的其它模块协作,可以至少基于一个或更多个所标识的语言学飞行器管制组分来确定用于对自主飞行器进行管制的命令。在一些示例中,解码器模块212可以通过将一个或更多个经证实的许可转换成命令来确定用于对自主飞行器进行管制的命令。命令的确定可以包括:标注语言学飞行器管制组分和/或填充如上所述的模板。作为一个示例,模板可以填充有经标注的语言学飞行器管制组分,其中,模板可以包括采用滑行操作的形式的命令。然后,解码器模块212可以基于滑行操作确定命令—例如,在执行时致动自主飞行器的组件从而执行滑行操作的一个或更多个动作。
37.经由解码器模块212确定的命令可以被发布到飞行器管理模块226,该飞行器管理模块226可以以执行模块222接受的格式封装该命令。然后,执行模块222可以执行格式化的命令,从而根据该命令对自主飞行器进行管制。如上所提到的,如上所述,执行模块222可以实现自动驾驶仪功能以基于接收到的命令自主地对自主飞行器进行管制,其中这种自主管制可以涉及执行命令的任何合适的动作,包括但不限于,对推进系统的操作进行管制以及致动飞行器组件以实现飞行路径。
38.在一些示例中,执行模块222可以规划(plan)飞行路径并证实该飞行路径(例如,经由知识库214和地图服务216中的一者或两者)。如果飞行路径被证实,则执行模块222可以向对话系统200发送指示飞行路径证实的消息(该消息可以用于随后的判定),以将消息中继至atc和/或用于任何其它合适的目的。在向atc发送指示飞行路径证实的消息的一些示例中,地面站操作员可以响应于该消息提供使自主飞行器沿着飞行路径前进的输入。因此,在一些示例中,如本文所使用的“自主飞行器”可以指的是完全自主的飞行器,或在其它示例中,指的是部分自主的飞行器,其功能至少部分地视来自人类操作员的输入而定。通常,在一些示例中,用于自主飞行器的命令可以在由自主飞行器执行之前根据空中交通管制进行审查或修改。
39.在一些示例中,对话系统200的操作可以根据寻求与atc进行通信的飞行阶段而改变。这种自适应可以由不同飞行阶段之间的消息、术语、操作等的类型的不同而产生。在这
样的示例中,知识库214可以存储用于不同飞行阶段的不同数据集—例如,用于滑行、起飞、爬升、巡航、下降、进近以及着陆中的各个阶段的相应数据集。此外,可以使用相应的训练数据集,来对各个飞行阶段的解码器模块212进行训练。在一些示例中,可以将不同的标签和/或模板用于不同的飞行阶段。
40.可以在任何合适位置实现对话系统200的模块以及图2所描绘的其它模块。作为一个示例,可以在自主飞行器处实现解码器模块212、状态跟踪模块218、策略模块220以及执行模块222。可以在诸如atc塔台的地面站处实现诸如音频处理模块204和/或语音识别模块210的其它模块。此外,可以在对话系统200内或对话系统外实现任何合适的模块集合。更进一步地,可以使用任何合适的机制来实现图2所描绘的一个或更多个模块。在一个示例中,模块212、218、220以及224皆可以经由一个或更多个神经网络来加以实现。
41.图4示出了例示对自主飞行器进行管制的方法400的流程图。例如,可以将方法400实现成对自主飞行器进行管制102。
42.在402,方法400包括:接收关于自主飞行器的操作的文本串。例如,该文本串可以通过对这样的音频执行语音识别来生成,即,该音频捕获针对自主飞行器的操作的语音。在404,方法400包括:经由解码器模块分析文本串,以标识该文本串中的一个或更多个语言学飞行器管制组分,该解码器模块是针对从飞行器管制通信导出的数据进行训练的。例如,该飞行器管制通信可以包括atc通信。解码器模块可以包括406针对从飞行器管制通信导出的数据进行了训练的一个或更多个神经网络。另选地或者另外,解码器模块可以包括408转换器(例如,字典树和/或有限状态转换器)。作为示例,该语言学飞行器管制组分可以包括410空中交通管制许可、机场对象、呼号以及位置信息中的一者或更多者。
43.在412,方法40包括:在状态跟踪模块中存储事件日志,该事件日志包括atc与自主载具(autonomous vehicle)之间的通信。在414,方法400包括:访问与解码器模块关联的飞行器相关知识库,以证实一个或更多个所标识的语言学飞行器管制组分。访问飞行器相关知识库的步骤可以包括:证实416在飞行器相关知识库中存在各个所标识的语言学飞行器管制组分。另选地或者另外,访问飞行器相关知识库的步骤可以包括:使用418地图服务。
44.在420,方法400包括:确定414处的证实是否成功。如果该证实失败(否),则则方法400进行至422,其中,响应于未能证实所标识的语言学飞行器管制组分而生成自然语言回读消息(例如,自然语言响应(natural language response))。该自然语言回读消息可以指示这种证实失败。如果证实成功(是),方法400进行至424。
45.在424,方法400包括:至少基于所标识的语言学飞行器管制组分,确定用于对自主飞行器进行管制的命令。该命令可以还基于事件日志的至少一部分426来进行确定。此外,确定该命令的步骤可以包括:将一个或更多个(经解码的、证实的)许可转换成该命令。
46.在428,方法400包括:输出该命令以供自主飞行器执行。在430,方法400包括:响应于证实所标识的语言学飞行器管制组分而生成自然语言回读消息(例如,自然语言响应)。该自然语言回读消息可以指示该证实成功。
47.本文所描述的方法提供了一种对话系统,利用该对话系统可以经由自然语音来执行atc和自主飞行器之间的通信。在一些示例中,该对话系统可以便于贯穿所有飞行阶段进行对话以支持飞行器自主性。而且,该对话系统潜在地与其它系统相呼应,可以考虑形势和情境信息以支持智能飞行器自主性和感知。所公开的方法的这些和其它方面可以扩展自主
飞行器的潜在应用和使用的范围(例如,包括它们在受控空域的使用),同时减少或消除人类对自主飞行器的监督。
48.在一些实施方式中,可以将本文所描述的方法和过程绑定至一个或更多个计算装置的计算系统。特别地,可以将这样的方法和过程实现为计算机应用程序或服务、应用编程接口(api)、库和/或其它计算机程序产品。
49.图5示意性地示出了可以执行(enact)上述方法和过程中的一个或更多个的计算系统500的非限制性实施方式。以简化形式示出了计算系统500。计算系统500可以采取一个或更多个个人计算机、服务器计算机、平板计算机、家庭娱乐计算机、网络计算装置、游戏装置、移动计算装置、移动通信装置(例如,智能手机)和/或其它计算装置的形式。
50.计算系统500包括逻辑子系统502和存储子系统504。计算系统500可以可选地包括:显示子系统506、输入子系统508、通信子系统510和/或图5未示出的其它组件。
51.逻辑子系统502包括被配置成执行指令的一个或更多个物理装置。例如,可以将逻辑机器配置成,执行作为一个或更多个应用、服务、程序、例程、库、对象、组件、数据结构或其它逻辑构造的一部分的指令。可以将这样的指令实现成执行任务、实现数据类型、变换一个或更多个组件的状态、实现技术效果或者以其它方式达到希望的结果。
52.逻辑机器可以包括被配置成执行软件指令的一个或更多个处理器。另外或者另选地,逻辑机器可以包括被配置成执行硬件或固件指令的一个或更多个硬件或固件逻辑机器。逻辑机器的处理器可以是单核或多核的,并且可以将其上执行的指令配置为顺序、并行和/或分布式处理。可以将逻辑机器的单独组件可选地分布在两个或更多个单独的装置中,这些装置可以进行远程定位和/或被配置为协调处理。逻辑机器的各方面可以由采用云计算配置进行配置的可远程访问的联网计算装置来虚拟化和执行。
53.存储子系统504包括一个或更多个物理装置,这些物理装置被配置成保存能够由逻辑机器执行的指令,以实现本文所描述的方法和过程。当实现这样的方法和过程时,可以将存储子系统504的状态例如变换成保存不同的数据。
54.存储子系统504可以包括可去除和/或内置装置。存储子系统504可以包括:光学存储器(例如,cd、dvd、hd-dvd、蓝光盘等)、半导体存储器(例如,ram、eprom、eeprom等)、和/或磁存储器(例如,硬盘驱动器、软盘驱动器、磁带驱动器、mram等),等等。存储子系统504可以包括易失性、非易失性、动态、静态、读/写、只读、随机存取、顺序存取、位置可寻址、文件可寻址和/或内容可寻址的装置。
55.应意识到,存储子系统504包括一个或更多个物理装置。然而,本文所描述的指令的各方面可以另选地通过不由物理设备保持的通信介质(例如,电磁信号、光学信号等)进行传播达有限的持续时间。
56.可以将逻辑子系统502和存储子系统504的各方面共同集成到一个或更多个硬件-逻辑组件中。例如,此类硬件-逻辑组件可以包括:现场可编程门阵列(fpga)、程序及应用特定集成电路(pasic/asic)、程序及应用特定标准产品(pssp/assp)、芯片上系统(soc)以及复杂可编程逻辑装置(cpld)。
57.可以将术语“模块”、“程序”以及“引擎”用于描述被实现成执行特定功能的计算系统500的一方面。在一些情况下,模块、程序或引擎可以经由执行由存储子系统504保存的指令的逻辑子系统502来实例化。应理解,可以从相同的应用、服务、代码块、对象、库、例程、
api、函数等来实例化不同的模块、程序和/或引擎。同样,可以通过不同的应用、服务、代码块、对象、例程、api函数等来实例化相同的模块、程序和/或引擎。术语“模块”、“程序”以及“引擎”可以涵盖可执行文件、数据文件、库、驱动程序、脚本、数据库记录等的个体或组。
58.应意识到,如本文所使用的“服务”是可跨多个用户会话执行的应用程序。服务可用于一个或更多个系统组件、程序和/或其它服务。在一些实现中,服务可以运行于一个或更多个服务器-计算装置上。
59.显示子系统506在被包括时可以用于呈现由存储子系统504保存的数据的可视表示。该可视表示可以采取图形用户界面(gui)的形式。由于本文所描述的方法和过程改变了由存储机器保存的数据,并因此变换了存储机器的状态,因此,同样可以将显示子系统506的状态变换成可视地表示底层数据的变化。显示子系统506可以包括实际上利用任何类型技术的一个或更多个显示装置。这样的显示装置可以在共用外壳中与逻辑子系统502和/或存储子系统504相组合,或者这样的显示装置可以是外围显示装置。
60.输入子系统508在被包括时可以包括一个或更多个用户输入装置((诸如键盘、鼠标器、触摸屏或游戏控制器),或者与该一个或更多个用户输入装置对接接口。在一些实施方式中,输入子系统可以包括所选择的自然用户输入(nui:natural user input)组成部分(componentry)或者与该nui组成部分对接。这样的组成部分可以是集成的或外围的,并且输入动作的转换和/或处理可以在板上或板外处理。示例nui组成部分可以包括:用于话音和/或语音识别的麦克风;用于机器视觉和/或姿势识别的红外、彩色、立体和/或深度摄像机;用于运动检测和/或意图识别的头部跟踪器、眼球跟踪器、加速度计和/或陀螺仪;以及用于评估大脑活动的电场感测组成部分。
61.通信子系统510在被包括时可以被配置成,将计算系统500与一个或更多个其它计算装置以通信方式联接。通信子系统510可以包括与一个或更多个不同通信协议兼容的有线和/或无线通信装置。作为非限制性示例,可以将通信子系统配置为经由无线电话网络,或者有线或无线局域网或广域网进行通信。在一些实施方式中,通信子系统可以允许计算系统500经由诸如互联网的网络向其它装置发送消息和/或从其它装置接收消息。
62.另一示例提供了一种对自主飞行器进行管制的方法,该方法包括以下步骤:接收有关自主飞行器的操作的文本串;经由解码器模块分析所述文本串,以标识所述文本串中的一个或更多个语言学飞行器管制组分,所述解码器模块是针对从飞行器管制通信导出的数据进行训练的;访问与所述解码器模块关联的飞行器相关知识库,以证实一个或更多个所标识的语言学飞行器管制组分;至少基于所标识的语言学飞行器管制组分,确定用于对所述自主飞行器进行管制的命令;以及输出所述命令以供所述自主飞行器执行。在这种示例中,所述飞行器管制通信可以包括空中交通管制通信。在这种示例中,所述文本串可以通过对这样的音频执行语音识别来生成,即,所述音频捕获针对所述自主飞行器的操作的语音。在这种示例中,所述解码器模块可以包括针对从飞行器管制通信导出的数据进行了训练的一个或更多个神经网络。在这种示例中,所述解码器模块另选地或者另外可以包括有限状态转换器。在这种示例中,证实一个或更多个所标识的语言学飞行器管制组分的步骤可以包括:证实在所述飞行器相关知识库中存在各个所标识的语言学飞行器管制组分。在这种示例中,证实一个或更多个所标识的语言学飞行器管制组分的步骤另选地或者另外可以包括:使用地图服务。在这种示例中,一个或更多个所标识的语言学飞行器管制组分可以
包括空中交通管制许可、机场对象、呼号以及位置信息中的一者或更多者。在这种示例中,所述方法另选地或者另外可以包括以下步骤:响应于证实所标识的语言学飞行器管制组分,生成用于向空中交通管制操作员输出的第一自然语言响应;以及响应于未能证实所标识的语言学飞行器管制组分,生成用于向空中交通管制操作员输出的第二自然语言响应。在这种示例中,所述命令可以在由所述自主飞行器执行之前根据空中交通管制进行修改。在这种示例中,所述方法另选地或者另外可以包括以下步骤:在状态跟踪模块中存储事件日志,所述事件日志包括空中交通管制与所述自主载具之间的通信。在这种示例中,所述命令另选地或者另外可以还基于所述事件日志的至少一部分来进行确定。在这种示例中,所述解码器模块另选地或者另外可以针对多个飞行阶段中的各个飞行阶段单独进行训练。
63.另一示例提供了一种用于对自主飞行器进行管制的系统,所述系统包括:逻辑子系统;以及存储子系统,所述存储子系统包括能够由所述逻辑子系统执行的指令,所述指令:接收有关自主飞行器的操作的文本串;经由解码器模块分析所述文本串,以标识所述文本串中的一个或更多个语言学飞行器管制组分,所述解码器模块是针对从飞行器管制通信导出的数据进行训练的;访问与所述解码器模块关联的飞行器相关知识库,以证实一个或更多个所标识的语言学飞行器管制组分;至少基于所标识的语言学飞行器管制组分,确定用于对所述自主飞行器进行管制的命令;以及输出所述命令以供所述自主飞行器执行。在这种示例中,所述解码器模块可以包括针对从飞行器管制通信导出的数据进行了训练的一个或更多个神经网络。在这种示例中,能够执行以证实一个或更多个所标识的语言学飞行器管制组分的所述指令:能够执行以证实在所述飞行器相关知识库中存在各个所标识的语言学飞行器管制组分。在这种示例中,一个或更多个所标识的语言学飞行器管制组分可以包括空中交通管制许可、机场对象、呼号以及位置信息中的一者或更多者。在这种示例中,所述存储子系统另选地或者另外可以包括能够由所述逻辑子系统执行以在状态跟踪模块中存储事件日志的指令,所述事件日志包括空中交通管制与所述自主载具之间的通信。在这种示例中,所述命令另选地或者另外可以还基于所述事件日志的至少一部分来进行确定。
64.另一示例提供了一种自主飞行器,所述自主飞行器包括:推进系统;逻辑子系统;以及存储子系统,所述存储子系统包括能够由所述逻辑子系统执行的指令,所述指令:接收有关所述自主飞行器的操作的文本串;经由解码器模块分析所述文本串,以标识所述文本串中的一个或更多个语言学飞行器管制组分,所述解码器模块是通过从飞行器交通管制通信导出的数据进行训练的;访问与所述解码器模块关联的飞行器相关知识库,以证实一个或更多个所标识的语言学飞行器管制组分;至少基于所标识的语言学飞行器管制组分,确定用于对所述自主飞行器进行管制的命令;以及发送用于空中交通管制的所述命令的指示。
65.应理解,本文所描述的配置和/或方法本质上是示例性的,并且这些具体实施方式或示例不应按限制性意义来考虑,这是因为许多变化都是可能的。本文所描述的特定例程或方法可以表示任何数量的处理策略中的一个或更多个处理策略。因此,所例示和/或描述的各种动作可以以所例和/或描述的顺序、以其它顺序、并行地执行或者加以省略。同样地,可以改变上述过程的次序。
66.在下面的段落中描述了根据本公开的进一步的例示性和非排它性的示例:
67.在根据本公开的示例中,提供了一种对自主飞行器进行管制的方法,所述方法包括以下步骤:
68.接收有关所述自主飞行器的操作的文本串;
69.经由解码器模块分析所述文本串,以标识所述文本串中的一个或更多个语言学飞行器管制组分;
70.访问与所述解码器模块关联的飞行器相关知识库,以证实一个或更多个所标识的语言学飞行器管制组分;
71.至少基于所标识的语言学飞行器管制组分,确定用于对所述自主飞行器进行管制的命令;以及
72.输出所述命令以供所述自主飞行器执行。
73.可选地,在根据较早段落的方法中,其中,所述解码器模块是通过从飞行器交通管制通信导出的数据进行训练的。
74.可选地,在根据较早段落的方法中,其中,所述文本串是通过对这样的音频执行语音识别来生成的,即,所述音频捕获针对所述自主飞行器的操作的语音。
75.可选地,在根据较早段落的方法中,其中,所述解码器模块包括针对从飞行器管制通信导出的数据进行了训练的一个或更多个神经网络。
76.可选地,在根据较早段落的方法中,其中,所述解码器模块包括有限状态转换器。
77.可选地,在根据较早段落的方法中,其中,证实一个或更多个所标识的语言学飞行器管制组分的步骤包括:证实在所述飞行器相关知识库中存在各个所标识的语言学飞行器管制组分。
78.可选地,在根据较早段落的方法中,其中,证实一个或更多个所标识的语言学飞行器管制组分的步骤包括:使用地图服务。
79.可选地,在根据较早段落的方法中,其中,一个或更多个所标识的语言学飞行器管制组分包括空中交通管制许可、机场对象、呼号以及位置信息中的一者或更多者。
80.可选地,根据较早段落的方法还包括以下步骤:响应于证实所标识的语言学飞行器管制组分,生成用于向空中交通管制操作员输出的第一自然语言响应;以及响应于未能证实所标识的语言学飞行器管制组分,生成用于向空中交通管制操作员输出的第二自然语言响应。
81.可选地,在根据较早段落的方法中,其中,所述命令在由所述自主飞行器执行之前根据空中交通管制进行修改。
82.可选地,根据较早段落的方法还包括以下步骤:在状态跟踪模块中存储事件日志,所述事件日志包括空中交通管制与所述自主载具之间的通信。
83.可选地,在根据较早段落的方法中,其中,所述命令还基于所述事件日志的至少一部分来进行确定。
84.可选地,在根据较早段落的方法中,其中,所述解码器模块是针对多个飞行阶段中的各个飞行阶段单独进行训练的。
85.根据本公开的示例提供了一种用于对自主飞行器进行管制的系统,所述系统包括:
86.逻辑子系统;以及
87.存储子系统,所述存储子系统包括能够由所述逻辑子系统执行的指令,所述指令:
88.接收有关所述自主飞行器的操作的文本串;
89.经由解码器模块分析所述文本串,以标识所述文本串中的一个或更多个语言学飞行器管制组分;
90.访问与所述解码器模块关联的飞行器相关知识库,以证实一个或更多个所标识的语言学飞行器管制组分;
91.至少基于所标识的语言学飞行器管制组分,确定用于对所述自主飞行器进行管制的命令;以及
92.输出所述命令以供所述自主飞行器执行。
93.可选地,在根据较早段落的系统中,其中,所述解码器模块包括针对从飞行器管制通信导出的数据进行了训练的一个或更多个神经网络。
94.可选地,在根据较早段落的系统中,其中,能够执行以证实一个或更多个所标识的语言学飞行器管制组分的所述指令:能够执行以证实在所述飞行器相关知识库中存在各个所标识的语言学飞行器管制组分。
95.可选地,在根据较早段落的系统中,其中,一个或更多个所标识的语言学飞行器管制组分包括空中交通管制许可、机场对象、呼号以及位置信息中的一者或更多者。
96.可选地,根据较早段落的系统还包括能够执行以在状态跟踪模块中存储事件日志的指令,所述事件日志包括空中交通管制与所述自主载具之间的通信。
97.可选地,在根据较早段落的系统中,其中,所述命令是进一步基于所述事件日志的至少一部分来进行确定的。
98.根据本公开的示例提供了一种自主飞行器,所述自主飞行器包括:
99.推进系统;
100.逻辑子系统;以及
101.存储子系统,所述存储子系统包括能够由所述逻辑子系统执行的指令,所述指令:
102.接收有关所述自主飞行器的操作的文本串;
103.经由解码器模块分析所述文本串,以标识所述文本串中的一个或更多个语言学飞行器管制组分;
104.访问与所述解码器模块关联的飞行器相关知识库,以证实一个或更多个所标识的语言学飞行器管制组分;
105.至少基于所标识的语言学飞行器管制组分,确定用于对所述自主飞行器进行管制的命令;以及
106.发送用于空中交通管制的所述命令的指示。
107.本公开包括本文所公开的各种特征和技术的所有新颖的和不明显的组合和子组合。本文所公开的各种特征和技术不必是本公开的所有示例所必需的。而且,除了所公开的示例之外,本文所公开的各种特征和技术可以定义可专利的主题,并且可以在本文未明确公开的其它实现中找到实用性。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1