使用对话系统来学习和推断判断推理知识的制作方法

文档序号:24159404发布日期:2021-03-05 14:30阅读:105来源:国知局
使用对话系统来学习和推断判断推理知识的制作方法

[0001]
本发明总体上涉及计算系统,并且更具体地涉及使用对话系统的各种实施例,以在使用计算处理器的计算环境中在对话系统中应用和推断判断推理知识。


背景技术:

[0002]
在当今社会中,消费者、商人、教育者和其他人通过各种各样的媒介进行实时、远距离、无国界的多次交流。计算机和网络技术的出现使人们的生活质量得以提高,同时又加强了日常活动。
[0003]
可以在工作场所、家庭或学校中发现计算系统。由于信息技术的最新发展和因特网的日益普及,机器学习中已使用了各种各样的计算机系统。机器学习是人工智能的一种形式,其被用来允许计算机基于经验数据来发展行为。机器学习可以利用训练样本来捕获感兴趣的特征的未知的潜在概率分布。训练数据可以看作是表明了观察到的变量之间的关系的样本。
[0004]
机器学习研究的主要重点是自动学习以识别复杂的模式并基于数据做出明智的决策。随着技术的进步和进展的真正实现,这些技术进展便可以在日常生活中发挥作用。


技术实现要素:

[0005]
提供了各种实施例,用于由处理器在计算环境中的对话系统中应用判断推理知识。确定在使用对话系统的对话期间对查询的响应不符合对多个查询响应中的一个的一个或多个预期响应模式。可以使用判断推理知识将更新后的响应与一个或多个预期响应模式相匹配来向查询提供所述更新的响应。
[0006]
除了上述示例性方法实施例外,还提供了其他示例性系统和计算机产品实施例,并提供了相关的优点。
附图说明
[0007]
为了容易理解本发明的优点,将通过参考附图中示出的特定实施例来对以上简要描述的本发明进行更具体的描述。应理解这些附图描述了本发明的实施例,不应因此认为是对本发明范围的限制,将通过使用附图以附加的特征和细节来描述和解释本发明,其中:
[0008]
图1是示出根据本发明的实施例的示例性计算节点的框图;
[0009]
图2是示出根据本发明的实施例的示例性云计算环境的附加框图;
[0010]
图3是示出根据本发明的实施例的抽象模型层的附加框图;
[0011]
图4是示出本发明各个方面之间的示例性功能关系的附加框图;
[0012]
图5是示出根据本发明的实施例的在计算环境中的对话系统中应用和推断判断推理知识的附加框图;
[0013]
图6是示出根据本发明的实施例的用于在计算环境中的对话系统中应用和推断判断推理知识的示例性方法的流程图;
[0014]
图7是示出根据本发明实施例的在计算环境中的对话系统中应用和推断判断推理知识的附加的示例性方法的流程图;以及
[0015]
图8是示出根据本发明实施例的在计算环境中的对话系统中应用和推断判断推理知识的附加的示例性方法的流程图。
具体实施方式
[0016]
作为初步事项,计算系统可以包括称为“云计算”的大规模计算,其中资源可以经由诸如计算机网络之类的通信系统进行交互和/或访问。资源可以是在一个或多个计算设备(例如服务器)上运行的计算设备、存储设备、应用程序和/或其他计算机相关设备和/或服务的软件渲染模拟和/或仿真。例如,取决于完成请求的任务所需的处理能力、存储空间和/或其他计算资源的数量,多个服务器可以通信和/或共享可以在服务器之间扩展和/或收缩的信息。词语“云”暗示以这种布置进行交互的计算设备、计算机网络和/或其他计算机相关设备之间的互连图的云形外观。
[0017]
此外,对话系统在诸如商业、政府、团体或其他实体的组织的运转中起关键作用。例如,许多重要的决定可能是由聊天系统、类似聊天的对话系统或聊天机器人中的讨论得出的。聊天机器人可以是听觉、视觉和/或通过文本方法进行谈话或对话的操作。组织可能会试图捕获和分析这些决定,以对组织的结构进行各种改进。但是,当前的对话系统以及人工智能(“ai”)/机器学习系统无法理解、学习和获取常识知识(例如,判断推理知识),然后可以使用、应用和/或甚至可以在使用对话系统进行对话的过程中推断出这些常识知识。换句话说,许多ai系统/对话系统在提供推理、学习和应用人类常识知识的能力方面表现出很大的困难。一方面,“判断推理知识”可以定义为特定研究领域或主题领域中的个人、实体、组织、团体、文化、学术界、科学家或其他社区的集体判断、立场和观点。同样,判断推理知识也可以定义为广泛已知或理解的东西,可以通过人工智能来学习和推理。在另一方面,常识知识(例如,“判断推理知识”)可以涉及机器学习操作,该机器学习操作能够学习、创建、训练和/或增强关于执行一个或多个操作/任务的操作和/或规则,该操作和/或规则具有实际的或模拟的环境的知识,并具有以适当的方式使该操作和/或规则适应环境的推理能力,并且这种综合能力可以称为“常识性推理”。
[0018]
在人工智能中,常识性知识(例如,“判断推理知识”)可以涉及模拟人类的能力以对一般情况,例如,日常生活活动(“adl”),的类型和本质作出假设和推理。这些假设包括对人和物体的物理特性、目的、意图和行为以及其行为和相互作用的可能结果的判断。应用常识性推理(例如,“判断推理知识”)的机器学习模型/系统可能能够预测与人类相似的结果和推理/得出结论(例如,人类与生俱来的关于人或组织行为以及意图和对自然世界的自然理解的推理能力。)
[0019]
例如,考虑对话系统和用户之间的以下对话。对话框系统提供“此牛排餐厅怎么样?”的查询,用户回答“我是素食主义者”。对用户来说,很明显,即使答案中未明确给出否定答案,对问题的响应也是负面的。此外,由于查询要求“是”或“否”类型的响应,因此用户的响应也无法提供预期的响应模式,例如“是/否”响应模式。
[0020]
然而,从对话系统的角度来看,响应可能被误解,甚至被解释为没有响应。因此,本发明的各种实施例提供了一种可以在对话系统或一个或多个用户中应用和推断判断推理
知识(例如,常识知识)的计算机系统。计算机系统可以是能够自动推理、学习和应用人类常识知识并从每个用户响应中提取隐含意义的对话系统(例如,对话代理)。在一个方面,本发明可以确定在使用对话系统的对话期间对查询的响应不符合对多个查询响应中的一个的一个或多个预期的响应模式。可以使用判断推理知识将更新后的响应与一个或多个期望的响应模式相匹配来向查询提供更新的响应。
[0021]
在另一方面,在多用户对话系统(例如,聊天机器人)中,在与用户对话期间可以通过考虑用户的上下文和对话的目的来检测推断常识的触发器。另外,可以通过对话系统提供、建议和/或传达与一个或多个预期响应模式(例如,是/否响应类型模式)的模式相关联的注释、语句和/或查询/问题(例如,通信)。用户对注释/语句和/或查询/问题提供的每个响应都可能被确定为与可能的响应的预期模式不匹配。因此,可以创建使用来自用户的响应和/或来自原始查询/问题的一个或多个关键字和/或概念的新查询/问题,以将注释/语句和/或查询/问题发布到知识库(或知识域或本体,例如,一个或多个查询回答系统,例如,互联网)。从知识库获得和/或接收的一个或多个搜索结果可用于将用户的原始响应映射为与预期的可能响应模式相匹配的更新响应。可以从每个搜索结果响应中提取新获得的知识(例如,判断推理知识)并将其用于机器学习操作,以学习和训练用于应用、学习和推断常识知识(例如,判断推理知识)的机器学习模型。
[0022]
在另一方面,所示实施例的机制提供了一种智能对话系统,该智能对话系统具有(或具有访问)关于一个或多个领域的知识或本体,并且能够应用、学习和推断常识知识(例如,判断推理知识)。智能对话系统可以与交互式图形用户界面(“gui”)或其他计算系统(例如,物联网(“iot”)计算设备)通信。
[0023]
应该注意的是,如本文所述,术语“智能”(或“认知”)可以与诸如,思维、推理或记忆之类的有意识的智力活动有关,是这些智力活动或涉及这些智力活动,这些智力活动可以使用机器学习来执行。在另一方面,智能或“智力”可以是认识的心理过程,包括意识、知觉、推理和判断等方面。机器学习系统可以使用人工推理来解释来自一个或多个数据源(例如,基于传感器的设备或其他计算系统)的数据,并通过机器学习来学习可以确定和/或得到的主题、概念、判断推理知识和/或过程。
[0024]
在另一方面,智能或“智力”可以指通过使用机器学习(可以包括使用基于传感器的设备或其他包括音频或视频设备的计算系统)来通过思想、经验和一种或多种感官获得知识和理解的精神动作或过程。智能或“智力”还可以指识别行为模式,从而导致“学习”一个或多个问题、领域、事件、操作或过程。因此,随着时间的推移,智能(例如认知)模型可以开发语义标签以应用于观察到的行为、领域、问题、判断推理知识,并使用知识域或本体来存储学习到的观察到的行为、问题、判断推理知识和领域。在一实施例中,该系统提供了可从一个或多个对话框、操作或过程中学到的复杂性的渐进级别。
[0025]
在另一方面,术语“智能”或“智力”可以指智能或“智力”系统。智能系统可以是专用计算机系统或计算机系统集合,其配置有硬件和/或软件逻辑(结合在其上执行软件的硬件逻辑)以模拟人类的认知功能。这些智能系统运用类人特征来传达和操纵思想,这些思想当与数字计算的固有优势相结合时,可以高度准确(例如,在规定的百分比范围内或在准确度阈值以上)和大范围弹性地解决问题。智能系统可以执行一个或多个计算机实现的智能/认知操作,这些操作近似于人类的思维过程,同时使用户或计算系统能够以更自然的方式
进行交互。智能系统可以包括人工智能逻辑,例如基于自然语言处理(nlp)的逻辑,以及机器学习逻辑,它们可以作为专用硬件、在硬件上执行的软件或专用硬件和执行在硬件上的软件的任意组合提供。认知系统的逻辑可以实现智能/认知操作,其示例包括但不限于问题回答,识别问题,识别语料库中内容的不同部分内的相关概念以及智能搜索算法,例如因特网网页搜索。
[0026]
通常,这样的智能系统能够执行以下功能:1)导航人类语言和理解的复杂性;2)摄取和处理大量的结构化和非结构化数据;3)产生和评估假设;4)权衡和评估仅基于相关证据的回答;5)提供针对具体情况的建议、见解、估计,确定、评估、计算和指导;6)通过机器学习过程提高知识,并在每次迭代和交互中学习;7)在影响点做出决策(上下文指导);8)与任务、过程或操作成比例的规模;9)扩展和扩大人类的专业知识和认知;10)从自然语言中识别出类似人的共鸣属性和特质;11)从自然语言中推导出各种特定于语言或不可知的属性;12)记忆和召回相关的数据点(图像、文本,语音)(例如,与数据点(图像、文本、语音)高度相关回忆(记忆和调用));以及/或13)预测和感知情境感知操作,这些操作模仿基于经验的人类认知。
[0027]
以下将进一步描述本发明的其他方面和附带的好处。
[0028]
首先应当理解,尽管本公开包括关于云计算的详细描述,但其中记载的技术方案的实现却不限于云计算环境,而是能够结合现在已知或以后开发的任何其它类型的计算环境而实现。
[0029]
云计算是一种服务交付模式,用于对共享的可配置计算资源池进行方便、按需的网络访问。可配置计算资源是能够以最小的管理成本或与服务提供者进行最少的交互就能快速部署和释放的资源,例如可以是网络、网络带宽、服务器、处理、内存、存储、应用、虚拟机和服务。这种云模式可以包括至少五个特征、至少三个服务模型和至少四个部署模型。
[0030]
特征包括:
[0031]
按需自助式服务:云的消费者在无需与服务提供者进行人为交互的情况下能够单方面自动地按需部署诸如服务器时间和网络存储等的计算能力。
[0032]
广泛的网络接入:计算能力可以通过标准机制在网络上获取,这种标准机制促进了通过不同种类的瘦客户机平台或厚客户机平台(例如移动电话、膝上型电脑、个人数字助理pda)对云的使用。
[0033]
资源池:提供者的计算资源被归入资源池并通过多租户(multi-tenant)模式服务于多重消费者,其中按需将不同的实体资源和虚拟资源动态地分配和再分配。一般情况下,消费者不能控制或甚至并不知晓所提供的资源的确切位置,但可以在较高抽象程度上指定位置(例如国家、州或数据中心),因此具有位置无关性。
[0034]
迅速弹性:能够迅速、有弹性地(有时是自动地)部署计算能力,以实现快速扩展,并且能迅速释放来快速缩小。在消费者看来,用于部署的可用计算能力往往显得是无限的,并能在任意时候都能获取任意数量的计算能力。
[0035]
可测量的服务:云系统通过利用适于服务类型(例如存储、处理、带宽和活跃用户帐号)的某种抽象程度的计量能力,自动地控制和优化资源效用。可以监测、控制和报告资源使用情况,为服务提供者和消费者双方提供透明度。
[0036]
服务模型如下:
[0037]
软件即服务(saas):向消费者提供的能力是使用提供者在云基础架构上运行的应用。可以通过诸如网络浏览器的瘦客户机接口(例如基于网络的电子邮件)从各种客户机设备访问应用。除了有限的特定于用户的应用配置设置外,消费者既不管理也不控制包括网络、服务器、操作系统、存储、乃至单个应用能力等的底层云基础架构。
[0038]
平台即服务(paas):向消费者提供的能力是在云基础架构上部署消费者创建或获得的应用,这些应用利用提供者支持的程序设计语言和工具创建。消费者既不管理也不控制包括网络、服务器、操作系统或存储的底层云基础架构,但对其部署的应用具有控制权,对应用托管环境配置可能也具有控制权。
[0039]
基础架构即服务(iaas):向消费者提供的能力是消费者能够在其中部署并运行包括操作系统和应用的任意软件的处理、存储、网络和其他基础计算资源。消费者既不管理也不控制底层的云基础架构,但是对操作系统、存储和其部署的应用具有控制权,对选择的网络组件(例如主机防火墙)可能具有有限的控制权。
[0040]
部署模型如下:
[0041]
私有云:云基础架构单独为某个组织运行。云基础架构可以由该组织或第三方管理并且可以存在于该组织内部或外部。
[0042]
公共云:云基础架构向公众或大型产业群提供并由出售云服务的组织拥有。
[0043]
共同体云:云基础架构被若干组织共享并支持有共同利害关系(例如任务使命、安全参数、政策和合规考虑)的特定共同体。共同体云可以由共同体内的多个组织或第三方管理并且可以存在于该共同体内部或外部。
[0044]
混合云:云基础架构由两个或更多部署模型的云(私有云、共同体云或公共云)组成,这些云依然是独特的实体,但是通过使数据和应用能够移植的标准化技术或私有技术(例如用于云之间的负载平衡的云突发流量分担技术)绑定在一起。
[0045]
云计算环境是面向服务的,特点集中在无状态性、低耦合性、模块性和语意的互操作性。云计算的核心是包含互连节点网络的基础架构。
[0046]
现在参考图1,其中显示了云计算节点的一个例子。图1显示的云计算节点10仅仅是适合的云计算节点的一个示例,不应对本发明实施例的功能和使用范围带来任何限制。总之,云计算节点10能够被用来实现和/或执行以上所述的任何功能。
[0047]
云计算节点10具有计算机系统/服务器12,其可与众多其它通用或专用计算系统环境或配置一起操作。众所周知,适于与计算机系统/服务器12一起操作的计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统﹑大型计算机系统和包括上述任意系统的分布式云计算技术环境,等等。
[0048]
计算机系统/服务器12可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括执行特定的任务或者实现特定的抽象数据类型的例程、程序、目标程序、组件、逻辑、数据结构等。计算机系统/服务器12可以在通过通信网络链接的远程处理设备执行任务的分布式云计算环境中实施。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
[0049]
如图1所示,云计算节点10中的计算机系统/服务器12以通用计算设备的形式表现。计算机系统/服务器12的组件可以包括但不限于:一个或者多个处理器或者处理单元
16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
[0050]
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(isa)总线,微通道体系结构(mac)总线,增强型isa总线、视频电子标准协会(vesa)局域总线以及外围组件互连(pci)总线。
[0051]
计算机系统/服务器12典型地包括多种计算机系统可读介质。这些介质可以是能够被计算机系统/服务器12访问的任意可获得的介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
[0052]
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(ram)30和/或高速缓存存储器32。计算机系统/服务器12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图1未显示,通常称为“硬盘驱动器”)。尽管图1中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如cd-rom,dvd-rom或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。系统存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
[0053]
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在系统存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
[0054]
计算机系统/服务器12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机系统/服务器12交互的设备通信,和/或与使得该计算机系统/服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口22进行。并且,计算机系统/服务器12还可以通过网络适配器20与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机系统/服务器12的其它模块通信。应当明白,尽管图中未示出,其它硬件和/或软件模块可以与计算机系统/服务器12一起操作,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
[0055]
现在参考图2,其中显示了示例性的云计算环境50。如图所示,云计算环境50包括云计算消费者使用的本地计算设备可以与其相通信的一个或者多个云计算节点10,本地计算设备例如可以是个人数字助理(pda)或移动电话54a,台式电脑54b、笔记本电脑54c和/或其他类型的计算机系统54n(例如,汽车计算机系统)。云计算节点10之间可以相互通信。可以在包括但不限于如上所述的私有云、共同体云、公共云或混合云或者它们的组合的一个或者多个网络中将云计算节点10进行物理或虚拟分组(图中未显示)。这样,云的消费者无需在本地计算设备上维护资源就能请求云计算环境50提供的基础架构即服务(iaas)、平台即服务(paas)和/或软件即服务(saas)。应当理解,图2显示的各类计算设备54a-n仅仅是示意性的,云计算节点10以及云计算环境50可以与任意类型网络上和/或网络可寻址连接的
任意类型的计算设备(例如使用网络浏览器)通信。
[0056]
现在参考图3,其中显示了云计算环境50(图2)提供的一组功能抽象层。首先应当理解,图3所示的组件、层以及功能都仅仅是示意性的,本发明的实施例不限于此。如图3所示,提供下列层和对应功能。
[0057]
设备层55包括物理和/或虚拟设备、嵌入和/或独立的电子设备、传感器,致动器和其他对象以在云计算环境50中执行各种任务。设备层55中的每个设备都包含有到其他功能抽象层的联网能力,使得可以向其提供从设备获得的信息,和/或可以将来自其他抽象层的信息提供给设备。在一个实施例中,包括设备层55在内的各种设备可以包括被统称为“物联网”(iot)的实体网络。如本领域普通技术人员将理解的,这样的实体网络允许数据的相互通信,收集和分发以实现各种各样的目的。
[0058]
所示的设备层55包括传感器52、致动器53、具有集成处理、传感器和联网电子设备的“学习”恒温器56、照相机57,可控家用插座/插座58和可控电气开关59,如图所示。其他可能的设备可能包括但不限于各种其他传感器设备、网络设备、电子设备(例如远程控制设备)、其他执行器设备,例如冰箱或洗衣机/干衣机等所谓的“智能”设备,以及各种其他可能的互连对象。
[0059]
硬件和软件层60包括硬件和软件组件。硬件组件的例子包括:主机61;基于risc(精简指令集计算机)体系结构的服务器62;服务器63;刀片服务器64;存储设备65;网络和网络组件66。软件组件的例子包括:网络应用服务器软件67以及数据库软件68。
[0060]
虚拟层70提供一个抽象层,该层可以提供下列虚拟实体的例子:虚拟服务器71、虚拟存储72、虚拟网络73(包括虚拟私有网络)、虚拟应用和操作系统74,以及虚拟客户端75。
[0061]
在一个示例中,管理层80可以提供下述功能:资源供应功能81:提供用于在云计算环境中执行任务的计算资源和其它资源的动态获取;计量和定价功能82:在云计算环境内对资源的使用进行成本跟踪,并为此提供帐单和发票。在一个例子中,该资源可以包括应用软件许可。安全功能:为云的消费者和任务提供身份认证,为数据和其它资源提供保护。用户门户功能83:为消费者和系统管理员提供对云计算环境的访问。服务水平管理功能84:提供云计算资源的分配和管理,以满足必需的服务水平。服务水平协议(sla)计划和履行功能85:为根据sla预测的对云计算资源未来需求提供预先安排和供应。
[0062]
工作负载层90提供云计算环境可能实现的功能的示例。在该层中,可提供的工作负载或功能的示例包括:地图绘制与导航91;软件开发及生命周期管理92;虚拟教室的教学提供93;数据分析处理94;交易处理95;以及在本发明的图示实施例的上下文中,用于在对话系统中应用和推断判断推理知识的工作负载和功能96。另外,用于在对话系统中应用和推断判断推理知识的工作负载和功能96可以包括诸如数据分析,数据分析以及如将进一步描述的通知功能之类的操作。本领域普通技术人员将理解,用于在对话系统中应用和推断判断推理知识的工作负载和功能96还可以与各种抽象层的其他部分(例如,硬件和软件层60,虚拟层70,管理层80和其他工作负载层90(例如,数据分析处理94)中的那些)相结合,以完成本发明所示实施例的各种目的。
[0063]
现在转向图4,示出了描绘根据所示实施例的各种机制的示例性功能组件400的框图。图4示出了用于在对话环境中为计算环境中的用户应用和推断判断推理知识的工作负载和功能。可以看出,许多功能块也可以被认为是功能的“模块”或“组件”,与先前在图1-3
中已经描述的描述意义相同。考虑到前述,模块/组件块400也可以结合到根据本发明的用于认知数据管理的系统的各种硬件和软件组件中。许多功能块400可以在分布式计算组件中,或者在用户设备上或在其他地方的各种组件上作为后台处理执行。再次示出了计算机系统/服务器12,该计算机系统/服务器12结合有处理单元16(和图1的存储器28,为了说明方便,未示出)以执行根据本发明的各个方面的各种计算,数据处理和其他功能。
[0064]
系统400可以包括域数据库402和对话系统404。对话系统404可以包括对话管理器406、学习组件408和判断推理知识组件410、响应组件412、搜索组件414、映射/绘图组件416和知识域组件418。系统400是集成到对话系统中的系统,该对话系统具有从一个或多个知识库(例如,多个域,例如域1,域2和域n)学习、应用和推断判断推理知识的能力。
[0065]
域数据库402和对话系统404可以各自通过一种或多种通信方法(诸如计算网络)彼此关联和/或彼此通信。在一个示例中,域数据库402和对话系统404可以由与计算机系统/服务器12相关联的所有者,客户或技术人员/管理员来控制。
[0066]
在一方面,计算机系统/服务器12可以向域数据库402和对话系统404提供虚拟化计算服务(即,虚拟化计算、虚拟化存储、虚拟化联网等)。更具体地,计算机系统服务器12可以提供在硬件基底上执行的虚拟化计算、虚拟化存储、虚拟化联网和其他虚拟化服务。
[0067]
如图4所示,域数据库402可以是一个或多个知识域,其还可以包括本体、知识库和/或其他数据。
[0068]
域数据库402的知识域可以具有多个知识域(例如,域1、域2和/或域n),并且可以是域、概念、域或概念之间的关系、机器学习数据、特征、参数、数据、轮廓数据、历史数据、测试和验证或其他用于测试、监视、验证、检测、学习、分析、监视和/或维护数据、概念和/或概念之间关系的指定/定义数据的组合。在另一方面,域数据库402的知识域可以是和/或提供诸如因特网之类的查询搜索系统。
[0069]
在一个方面,对话系统404可以根据问题实例模板、识别的用户意图、到与多个域相关联的一个或多个问题解决者的链接,或其组合来为多个域定义一个或多个问题实例。
[0070]
与判断推理知识组件410一起工作的对话框管理器406可以向用户提供与对通信的可能/预期响应的模式相关联的通信(例如,查询)。响应组件412可以分析对从用户接收到的通信的响应,并确定(例如,发现、确定、识别、分析等)响应与可能响应的一个或多个可能/预期模式不匹配。也就是说,与判断推理知识组件410一起工作的对话管理器406可以确定在与使用对话系统404的用户的对话期间对查询的响应不符合对多个查询响应中的一个的一个或多个预期响应模式。
[0071]
响应组件412可以使用从查询、响应或其组合获得的一个或多个选择的术语、概念或其组合来生成、创建和/或提供重构查询。响应组件412可以向域数据库402提交重构的查询,域数据库402可以是一个或多个知识域,例如,知识域1、知识域2和/或知识域n。
[0072]
搜索组件414响应于提交重构的查询,可以从域数据库402获得一个或多个搜索结果。
[0073]
映射/绘图组件416可以将一个或多个搜索结果映射到更新的响应中。映射/绘图组件416还可将与一个或多个概念有关的响应与表示每个知识域的多个表中的一个或多个搜索结果映射。映射/绘图组件416可以创建具有多个节点的一个或多个图,该多个节点表示与每个知识域(例如,知识域1,知识域2和/或知识域n)相对应的每个表的多个单元。每个
表的多个单元格中的每个单元格可以代表一个或多个概念。映射/绘图组件416可以识别具有语义相似性的多个节点中的一个或多个之间的链接,甚至在多个节点中的一个或多个之间的每个链接的每个路径之间分配加权值。
[0074]
学习组件408与判断推理知识组件410相关联,可以初始化机器学习操作以学习、提取和推断判断推理知识。也就是说,学习组件408与判断推理知识组件410相关联,可以理解、学习和获取常识知识(例如,判断推理知识),然后可以在对话系统与一个或多个用户之间的对话过程使用期间使用、应用和/或甚至推断这些常识知识。换句话说,对话系统404可以提供推理、学习和应用人类常识知识的能力。学习组件408可从搜索组件414接收的一个或多个搜索结果中学习并提取判断推理知识。学习组件408可在检测到要学习、提取、并推断出判断推理的知识,使用一个或多个机器学习操作(例如,诸如assistant的的实例)。(和是国际商业机器公司(international business machines corporation)的商标)。学习组件408可以使用自然语言处理(nlp),而人工智能(ai)也可以用于学习、提取和推断判断推理知识。
[0075]
判断推理知识组件410可以使用用于将更新后的响应与一个或多个预期响应模式进行匹配的判断推理知识来提供对查询的更新后的响应。判断推理知识组件410可以在提取、学习、应用、推断和/或建议各种类型的判断推理知识和/或对任何类型或形式的通信的可能的/预期的响应的模式的同时,在知识域418中存储任何学习到的判断推理知识。
[0076]
应当注意,学习组件408可以是机器学习组件,用于训练和学习一个或多个机器学习模型,并且还用于学习、应用推断、和/或关于一个或多个域、概念、特征、问题和域之间的关系或其组合的推理到用于对话管理器406的机器学习模型。例如,学习组件408可以学习所选域中变量的一个或多个偏好、多个域的一个或多个用户界面(“ui”)元素的一个或多个偏好、建模成本和认知负载。学习组件408可用于基于学习对对话界面进行个性化设置。
[0077]
在一个方面,学习组件408可使用多种方法组合(例如监督学习、无监督学习、时间差分学习、强化学习等)应用一个或多个基于启发式和机器学习的模型。一些可与本技术一起使用的监督学习的非限制性实例包括aode(平均单依赖估计器)、人工神经网络、反向传播、贝叶斯统计、朴素贝叶斯分类器、贝叶斯网络、贝叶斯知识库、基于实例的推理、决策树、归纳逻辑编程,高斯过程回归、基因表达式编程、分组数据处理方法(gmdh)、学习自动机、学习向量量化、最小消息长度(决策树、决策图等)、懒惰学习、基于实例的学习、最近邻算法、类比建模、可能近似正确(pac)学习,连锁反应规则、知识获取方法学、符号机器学习算法、亚符号机器学习算法、支持向量机、随机森林、分类器集合、引导聚集(装袋(bagging))、提升方法(boosting)(元算法)、序数分类、回归分析、信息模糊网络(ifn)、统计分类、线性分类器、fisher线性判别、逻辑回归、感知器、支持向量机、二次分类器、k-最近邻,隐马尔可夫模型和提升方法。可对本技术使用的无监督学习的一些非限制性实例包括人工神经网络、数据聚类、期望最大化、自组织图、径向基函数网络、矢量量化、生成地形图、信息瓶颈法等,ibsead(基于交互的分布式自治实体系统)、关联规则学习、apriori算法、eclat算法、fp-growth算法、层次聚类、单链接聚类、概念聚类、分区聚类、k-means算法、模糊聚类和强化学习。时间差分学习的一些非限制性例子可以包括q学习和学习自动机。关于本段中描述的有监督、无监督、时间差分或其他机器学习的任何实例的具体细节是已知的,并且被认为在本公开的范围内。
[0078]
现在转到图5,为根据本发明的各个方面,关于在对话系统中应用和推断判断推理知识的示例性功能500的框图。如图所示,各功能块用箭头表示模块组500之间的关系,并显示流程。另外,还可以看到与功能块组500的每个块相关的描述性信息。如将要看到的,许多功能块还可以被视为功能的“模块”,与先前在图1-4中描述的相同的描述意义。考虑到上述内容,模块组500还可以被并入用于在根据本发明的对话系统中应用和推断判断推理知识的系统的各种硬件和软件组件中。功能块组500中的许多可以作为后台处理在各种组件上执行,或者在分布式计算组件中,或者在用户设备上,或者在其他地方。
[0079]
从框510开始,触发器组件(也参见图4的响应组件412)可以检测学习判断推理知识(例如,常识知识)的触发。例如,可以通过检测来自离散的一组可能值的一个或多个可能/预期的评论、响应、答案(例如,是/否答案)不符合对多个查询响应中的一个的一个或多个预期的响应模式来激活触发器。换句话说,可以在具有触发器组件的对话系统上激活触发器,该对话框系统期望来自离散的可能值集合中的答案(例如,是/否答案),但是答案有些复杂,从而提供了学习常识知识的机会。例如以下用户与对话系统(例如,对话代理或“代理”)之间的对话对话中所示:
[0080]
示例1:
[0081]
代理:我应该为您购买此电子书并用您的信用卡付款吗?
[0082]
用户:我全年免费订阅。
[0083]
示例2:
[0084]
代理:这是今天足球比赛的提醒。
[0085]
用户:我病了。
[0086]
示例3:
[0087]
代理:我发现了在a国度假的好机会。
[0088]
用户:我今年不休假。
[0089]
示例4:
[0090]
代理:这家牛排餐厅怎么样?
[0091]
用户:我是素食主义者。
[0092]
对于对话系统提供的每个问题/评论,有一些离散的预期答案(例如,是/否,例如,代理:“这家牛排餐厅怎么样?”)。当用户提供的答案/响应与离散的可能值,预期的语义结构和/或预期的响应的预期类型不直接匹配时,可以激活学习判断推理知识(例如,常识知识)的过程。
[0093]
在框520中,查找操作(例如,参见图4的响应组件412)可以使用对话代理的话语和用户话语中的选定关键字和/或概念构造查询,例如,“这家牛排餐厅怎么样?”及“我是素食主义者”可能会导致诸如“牛排,餐厅素食主义者”或“牛排素食主义者”之类的查询。查找组件可以基于查询(例如,向与因特网、知识库或本体数据库相关联的搜索引擎提出查询)在知识数据库(例如,因特网)中查找/搜索信息。
[0094]
在框530中,可以推断判断推理知识(例如,常识知识)。例如,为了推断判断推理知识,可以在“输入数据”中提供一个或多个概念、关键字或短语,例如两个概念“c1”(例如牛排餐厅)和概念“c2”(例如,素食主义者)。搜索结果的响应可以作为输出数据提供,该输出数据可以是两个概念之间的推断关系(“rel”),例如rel(c1,c2),指示以避免“牛排餐厅”和

素食主义者”甚至“素食主义者”。
[0095]
在一方面,可以在以下步骤中执行推断操作。在步骤1中,让“t1,...,tn”是知识库的表表示,其中每个表ti是两个或多个概念之间的关系。表ti的标题可以是关系,表ti的每一行可以存储各个概念的特定实例。
[0096]
在步骤2中,可以创建一个图“g”,其中该图可以包括对应于每个表单元eijk(表ti、行j、列k)的节点,并且如果对应的概念实例之间存在语义相似性,在表单元eijk之间存在链接(例如,表ti第j行第k列的单元的索引,和表单元eijk包含一段文本)和ei'j'k'。图g的每一条边也可以被相应的语义相似性度量值赋予一个加权。
[0097]
在一个方面,给定两个单元格eijk和ei'j'k',例如,两个单元格之间的边可以通过相应文本片段之间的语义相似度来加权(用于确定加权值)。以最简单的情况为例,两个作品的语义相似度为0到1之间的实数,其中1表示两个词完全相同,0表示两个词之间没有语义上的相似性(如sim('car','vehicle')=0.83,sim('car','cat')=0。)
[0098]
在步骤3中,可以在概念c1和图g中的相关节点之间创建一个或多个边。还可以在概念c2和图g中的相关节点之间创建一个或多个边。在步骤4中,可以在c1和c2之间确定最多经过一个表tj的最大权重路径“s”(例如,可以使用基于线性规划的方法确定最大权重路径“s”)。在步骤5中,如果最大权重路径s不等于零(例如,s!=0),可以将c1和c2之间的推断关系添加到知识库(“kb”)和相应的表中。在步骤6中,权重路径“s”等于零(例如,s=0),可以确定/得出结论,概念c1和概念c2之间没有关系。
[0099]
在框540中,可以在知识域中存储、保留和/或访问学习到的判断推理知识(例如,常识知识),该知识域还可以用于训练机器学习操作,以为在对话中的后续查询/评论学习、应用和/或推断判断推理知识(例如,常识知识)。
[0100]
现在转到图6,说明了在计算环境中的对话系统中应用判断推理知识的附加方法700,其中可以实现所示实施例的各个方面。功能600可以实现为在机器上作为指令执行的方法,其中指令被包括在至少一个计算机可读介质或非暂时性机器可读存储介质上。功能600可以在框602开始。
[0101]
如方框604所示,在使用对话系统的对话期间对查询的响不符合对多个查询响应中的一个的一个或多个预期的响应模式。如框606所示,可以使用判断推理知识将更新后的响应与一个或多个预期响应模式相匹配来向查询提供更新的响应。功能600可以在框608结束。
[0102]
现在转到图7,描述了一种由处理器在计算环境中的对话系统中应用判断推理知识的附加方法700,其中可以实现所示实施例的各个方面。功能700可以实现为在机器上作为指令执行的方法,其中指令被包括在至少一个计算机可读介质或一个非暂时性机器可读存储介质上。功能700可以从方框702开始。
[0103]
如框704中所示,可以提供与对通信的可能响应的模式相关联的通信(例如,经由对话代理/系统发布或通信)。可以(例如,从用户)接收对通信的响应,并且可以执行确定操作以确定(例如,发现、确定、识别、分析等)响应与可能的响应的预期模式不匹配,如框706中所示。可以使用来自响应和/或查询中的一个或多个关键字和/或概念来构造(例如,创建、生成和/或编辑)查询,以将构建的查询发布到一个或多个查询-回答系统,如框708。可以从一个或多个查询回答系统获得搜索结果,以将响应映射到与预期的可能响应模式相匹
配的响应以及提取新的判断推理知识,如框710所示。功能700可以在框712中结束。
[0104]
现在转到图8,描绘了用于通过处理器在计算环境中的对话系统中应用判断推理知识的附加方法800,其中可以实现所示出的实施例的各个方面。功能800可以被实现为在机器上作为指令执行的方法,其中指令被包括在至少一个计算机可读介质或一个非暂时性机器可读存储介质上。功能800可以在框802开始。
[0105]
如框804,可以经由对话系统向一个或多个用户提供通信(例如,查询、评论、问题等)。响应于该通信,对话系统可以从一个或多个用户接收响应。如框806。可以确定对该通信的响应不符合(例如,该响应与用于响应该通信的期望模式不匹配)多个查询响应中的一个的一个或多个期望响应模式,如框808中所示。可以使用从通信、响应或其组合中获得的一个或多个选定的术语、概念或其组合来创建重构查询,如框810中所示。可以在方框812中将重构的查询提交给一个或多个知识域。如在方框814中所示,可以响应于提交重构的查询从一个或多个知识域中获得一个或多个搜索结果。如框816中所示,可以使用判断推理知识(例如,推断和/或应用的判断推理知识)将更新后的响应与所述一个或多个预期响应模式相匹配来向所述查询提供所述更新的响应。功能800可以在框818中结束。
[0106]
在一方面,结合图6-8的至少一个框和/或作为其至少一部分,600、700和/或800的操作可以包括以下每个。600、700和/或800的操作可以将一个或多个搜索结果映射到更新的响应中,和/或从一个或多个搜索结果中学习并提取判断推理知识。600、700和/或800的操作可以将与一个或多个概念有关的响应与在表示每个知识域的多个表中提供的一个或多个搜索结果进行映射,创建具有多个节点的图,这些节点表示对应于每个知识域的每个表中的多个单元,其中多个单元中的每个单元代表一个或多个概念,标识具有语义相似性的多个节点中的一个或多个之间的链接,和/或在多个节点中的一个或多个之间的每个链接的每个路径之间分配加权值。
[0107]
600、700和/或800的操作可以初始化机器学习机制以学习、提取和推断判断推理知识。对话系统的界面(例如,图形用户界面“gui”)可以根据对话进行个性化、定制和/或调整。
[0108]
本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
[0109]
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、静态随机存取存储器(sram)、便携式压缩盘只读存储器(cd-rom)、数字多功能盘(dvd)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
[0110]
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外
部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
[0111]
用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(isa)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如smalltalk、c++等,以及传统的过程式编程语言—诸如“c”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(fpga)或可编程逻辑阵列(pla),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
[0112]
这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
[0113]
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
[0114]
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
[0115]
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1