本公开涉及用于采用量子随机数生成器进行自然语言处理的技术,具体地涉及用于通过量子随机数生成器创建会话聊天机器人的技术。
背景技术:
1、交谈机器人(或聊天机器人(chatbot))是使用自然语言输入(如文本或语音输入)模拟人类会话的设备。聊天机器人可以在对话系统中实施以执行各种实际任务,包括自动化客户支持或信息获取。通常,许多精密的聊天机器人利用人工智能和机器学习技术(如深度神经网络),并且可能采用随机性技术。虽然最终目标是为用户呈现类似于与人类会话的体验,但目前所有的聊天机器人仍具有很大的局限性,且无法实现这一目标。特别是,许多现有的聊天机器人都表现出了揭示底层算法的人工痕迹,并给用户留下了他们的请求正在由机器处理而不是由人类处理的印象。
技术实现思路
1、鉴于现有技术,仍然需要自然语言处理技术,以解除现有聊天机器人的局限性,并提供呈现更类似于与人类会话的用户体验的聊天机器人。
2、该目的通过根据本公开的用于自然语言处理的方法和根据本公开的用于自然语言处理的系统来实现。本公开还提供了优选实施例。
3、在第一方面,本公开涉及一种用于自然语言处理的方法,所述方法包括:接收包括自然语言的样本;处理所述样本,其中,处理所述样本包括生成多个响应假设以及生成多个置信度值,其中,每个响应假设与对应的置信度值相关联;以及选择响应,包括通过量子随机数生成器至少部分地基于对应置信度值从所述多个响应假设中随机选择所述响应。
4、众所周知,量子对象构成了真正随机性的唯一载体,并且量子随机数生成器可以表现出真正不可预测的行为。从多个响应假设中选择响应时采用量子随机数生成器可以显著增强自然语言处理的能力,特别是可以允许聊天机器人输出相比传统的自然语言处理技术能够实现的要好得多的、避免重复模式且模拟人类对话伙伴的响应行为和自由意志的响应。
5、在本公开的上下文中,量子随机数生成器可以表示能够从量子物理过程生成随机数的硬件随机数生成器。特别地,量子随机数生成器可以是适于(adapted to)实施量子物理过程并且进一步适于基于量子物理过程得到随机数的硬件设备。
6、量子物理学预测,某些物理现象从根本上说是随机的,原则上无法被预测。这些现象可包括核衰变、散粒噪声(shot noise)或穿过半透明镜子的光子。一般而言,所有表现出真正不可预测性的量子现象都可以用于根据本公开的量子随机数生成器。量子光学过程通常非常便于实施并且相对容易处理,因此为许多实际相关场景提供了量子随机数生成器的良好示例。
7、可以在m.herrero-collantes、j.c.garcia-escartin的“quantum random numbergenerators[量子随机数生成器]”现代物理学评论89(2017)015004(也可从cornell预印本服务器arxiv:1604.03304获得)中找到可以在本公开的上下文中采用的量子随机数生成器的基础知识和示例性系统的概述。
8、根据实施例,选择响应包括从量子随机数生成器接收随机数。
9、特别地,选择响应可以包括至少部分地基于对应置信度值和接收到的随机数从多个响应假设中随机选择响应。
10、根据实施例,选择响应包括调用或查询量子随机数生成器。
11、响应于调用或查询量子随机数生成器,量子随机数生成器可以输出至少一个随机数,所述至少一个随机数可以用于从多个响应假设中随机选择响应。
12、在其他实施例中,量子随机数生成器可以在不被主动调用或查询的情况下提供随机数。例如,量子随机数生成器可以以固定的时间间隔提供一个随机数或多个随机数。
13、特别地,选择响应可以包括以固定的时间间隔从量子随机数生成器接收至少一个随机数。
14、根据实施例,选择响应包括以基于相应置信度值的对应权重为多个响应假设生成概率分布。
15、可以与相应权重所基于的相应置信度值成比例地选择这些相应权重。特别地,可以通过归一化置信度值以使得它们总和为1来从置信度值中选择相应权重。
16、选择响应可以进一步包括通过量子随机数生成器根据对应权重从多个响应假设中随机选择。
17、根据实施例,选择响应包括将对应置信度值与预定阈值进行比较,并且在对应置信度值小于预定阈值的情况下通过量子随机数生成器至少部分地基于对应置信度值从多个响应假设中随机选择响应。
18、特别地,所述方法可以涉及仅在对应置信度值小于预定阈值的情况下才通过量子随机数生成器至少部分地基于对应置信度值从多个响应假设中随机选择响应。
19、以这种方式,只有当所有相应置信度值或所有对应权重都小于预定阈值时,才可以从多个响应假设中随机选择响应。
20、在多个响应假设中的至少一个具有不小于预定阈值的对应置信度值或对应权重的情况下,则可以从响应假设的这个子集中确定性地选择响应。
21、特别地,在这种情况下,响应可以被选择为具有最大置信度值或最大权重的响应假设。
22、因此,根据实施例,所述方法包括在对应置信度值不小于预定阈值的情况下至少部分地基于对应置信度值从多个响应假设中确定性地选择响应。
23、这些技术可以平衡用于选择响应的确定性和随机性方法,并且可以保证具有非常高置信度值的响应被优先化。
24、根据实施例,选择响应可以包括根据预定义标准预选多个响应假设。
25、预选多个响应假设可以包括根据预定义标准丢弃响应假设。
26、例如,具有毒性(toxic)的响应或不符合可接受响应的符合性要求的响应可能会被丢弃。
27、预选可以包括降低相应响应假设的置信度值或权重,特别是将相应响应假设的置信度值或权重设置为0。
28、在本公开的上下文中,自然语言可以包括任何形式的语言或表示语言的信号,包括书面文本和/或语音信号。
29、样本可以被理解为表示自然语言的任何字符串或单词,并且可以以易于进行电子数据处理的任何格式来被提供。例如,样本可以表示人类用户在与聊天机器人会话时可能说出的陈述或问题。
30、特别地,所述方法可以包括从人类用户接收样本。
31、根据实施例,样本可以是注释样本。
32、在本公开的上下文中,在样本由自然语言处理(nlp)模型处理的情况下,样本可以被称为注释样本,这些npl模型的输出可能不会直接生成响应但可以辅助生成响应候选项或选择响应。
33、特别地,所述方法可以包括对样本进行注释。
34、根据实施例,可以在生成多个响应假设和生成多个置信度值之前对样本进行注释。
35、对样本进行注释可以包括拼写预处理和/或句子分割。
36、在本公开的上下文中,响应假设表示对样本的答复的候选。
37、置信度值可以表示对应响应假设是对样本的有意义答复的概率或可能性。
38、根据实施例,所述方法可以进一步包括返回所选响应,特别是将所选响应返回给人类用户。
39、多个响应假设可以通过任何响应生成技术生成,特别是通过任何自然语言处理技术生成。
40、根据实施例,处理样本可以包括通过至少两种不同的响应生成技术来生成多个响应假设。
41、不同的响应生成技术可以可选地包括随机性响应生成技术和/或确定性响应生成技术。
42、特别地,处理样本可以包括通过神经网络生成多个响应假设的至少一部分。
43、任何不同的响应生成技术都可以生成一个或多个响应假设,所述方法随后可以从这些响应假设中进行选择。
44、根据实施例,生成多个响应假设可以包括通过量子随机数生成器生成多个响应假设的至少一部分。
45、以这种方式,量子随机数生成器的优越特性不仅可以被控制和用于从多个响应假设中选择响应,而且还可以被控制和用于首先生成响应假设。
46、根据实施例,生成多个响应假设包括随机选择响应假设的单词,特别是通过量子随机数生成器来选择。
47、在实施例中,生成多个响应假设包括从量子随机数生成器接收随机数,并且基于接收到的随机数生成多个响应假设的至少一部分。
48、生成多个响应假设可以包括查询或调用量子随机数生成器。
49、在其他实施例中,量子随机数生成器可以在不被主动调用或查询的情况下提供随机数。例如,量子随机数生成器可以以固定的时间间隔提供一个随机数或多个随机数。
50、特别地,生成多个响应假设可以包括以固定的时间间隔从量子随机数生成器接收至少一个随机数。
51、根据实施例,所述方法可以是计算机实施的方法。
52、在第二方面,本公开涉及一种包括计算机可读指令的计算机程序或计算机程序产品,其中,这些指令当在计算机上被读取时,使计算机实施具有如上所述的一些或所有特征的方法。
53、计算机程序产品可以是或可以包括计算机可读介质。
54、在第三方面,本公开涉及一种用于自然语言处理的系统,所述系统包括:接收单元,所述接收单元适于接收包括自然语言的样本;适于处理所述样本的处理单元,其中,所述处理单元适于生成多个响应假设以及生成多个置信度值,其中,每个响应假设与对应的置信度值相关联;以及适于选择响应的选择单元,其中,所述选择单元适于通过量子随机数生成器至少部分地基于对应置信度值从多个响应假设中随机选择响应。
55、根据实施例,所述系统、特别是选择单元适于耦接到量子随机数生成器,并从量子随机数生成器接收随机数。
56、选择单元可以适于至少部分地基于对应置信度值和接收到的随机数从多个响应假设中随机选择响应。
57、根据实施例,选择单元适于调用或查询量子随机数生成器。
58、在其他实施例中,量子随机数生成器可以在不被主动调用或查询的情况下向所述系统、特别是选择单元提供随机数。例如,量子随机数生成器可以以固定的时间间隔提供一个随机数或多个随机数。
59、因此,所述系统、特别是选择单元可以适于耦接到量子随机数生成器,并且以固定的时间间隔从量子随机数生成器接收至少一个随机数。
60、在实施例中,所述系统可以包括量子随机数生成器。
61、根据实施例,选择单元适于以基于置信度值的对应权重为多个响应假设生成概率分布,其中,所述选择单元进一步适于通过量子随机数生成器根据对应权重从多个响应假设中随机选择。
62、选择单元可以适于将对应置信度值与预定阈值进行比较,并且可以进一步适于在对应置信度值小于预定阈值的情况下通过量子随机数生成器至少部分地基于对应置信度值从多个响应假设中随机选择响应。
63、特别地,选择单元可以适于仅在对应置信度值小于预定阈值的情况下才通过量子随机数生成器至少部分地基于对应置信度值从多个响应假设中随机选择响应。
64、根据实施例,选择单元适于在对应置信度值不小于预定阈值的情况下至少部分地基于对应置信度值从多个响应假设中确定性地选择响应。
65、在实施例中,选择单元可以适于根据预定义标准预选响应假设。特别地,选择单元可以适于根据预定义标准丢弃响应假设。
66、根据实施例,所述系统可以进一步包括适于返回所选响应的输出单元。
67、在实施例中,处理单元可以适于通过不同的响应生成技术来生成多个响应假设,其中,不同的响应生成技术可以可选地包括随机性响应生成技术和/或确定性响应生成技术。
68、根据实施例,处理单元可以包括适于生成多个响应假设的至少一部分的神经网络。
69、在实施例中,处理单元适于通过量子随机数生成器生成多个响应假设的至少一部分。
70、特别地,处理单元可以适于随机选择响应假设的单词,特别是通过量子随机数生成器来选择。
71、根据实施例,处理单元可以适于从量子随机数生成器接收随机数。
72、特别地,处理单元可以进一步适于基于接收到的随机数生成多个响应假设的至少一部分。
73、在实施例中,处理单元可以适于查询或调用量子随机数生成器。
74、在其他实施例中,量子随机数生成器可以在不被主动调用或查询的情况下向处理单元提供随机数。例如,量子随机数生成器可以以固定的时间间隔提供一个随机数或多个随机数。
75、因此,处理单元可以适于以固定的时间间隔从量子随机数生成器接收至少一个随机数。
76、根据实施例,量子随机数生成器通过通信线路连接到选择单元和/或处理单元。
77、所述系统可以进一步包括注释器单元,所述注释器单元适于对样本进行注释,特别是在生成多个响应假设以及生成多个置信度值之前对样本进行注释。
78、根据实施例,接收单元和/或处理单元和/或选择单元和/或输出单元和/或注释器单元可以以硬件实施。在其他实施例中,接收单元和/或处理单元和/或选择单元和/或输出单元和/或注释器单元可以以软件或固件实施。在更进一步的实施例中,接收单元和/或处理单元和/或选择单元和/或输出单元和/或注释器单元可以部分地以硬件且部分地以软件或固件来实施。
79、在一些实施例中,接收单元和/或处理单元和/或选择单元和/或输出单元和/或注释器单元是可以彼此通信地耦接的分开的独立单元。在其他实施例中,这些单元中的至少两个可以被集成到共用单元中。