基于语音的问答系统和用于交互式语音系统的方法

文档序号:2826196阅读:234来源:国知局
基于语音的问答系统和用于交互式语音系统的方法
【专利摘要】本发明涉及基于语音的问答系统和用于交互式语音系统的方法。一种基于语音的问答系统,包括:问答数据存储单元,在该问答数据存储单元中相关联地存储问题以及对应于所述问题的答案;语音识别单元,通过使用语言模型对于用户说出的问题进行语音识别;语义相似度计算单元,根据语音识别单元对于用户说出的问题的识别结果,计算用户说出的问题与问答数据存储单元中存储的每个问题之间的语义相似度,其中,所述语义相似度用于表示用户说出的问题与所述问答数据存储单元中存储的每个问题所表达的意思上的相似程度;以及分类单元,基于语义相似度计算单元所计算出的语义相似度,将用户说出的问题分类为在存储单元内的问题或者在存储单元外的问题。
【专利说明】基于语音的问答系统和用于交互式语音系统的方法

【技术领域】
[0001] 本发明涉及基于语音的问答系统和用于交互式语音系统的方法。

【背景技术】
[0002] 近年来,能够自动回答用户所问的问题的基于语音的问答系统得到研究。对于该 类系统,基于实例的答复生成方法是一种有效的方法,所述基于实例的答复生成方法利用 问答数据库,所述问答数据库中包括很多问题-答案对。当一个问答系统从用户接收到问 题时,它首先通过语音识别器来识别用户所问的问题,然后从问答数据库中选择问答数据 库中的与语音识别器所识别的结果最相似的问题,并将问答数据库中的与所选择的问题成 一对(即,相对应)的答案提供给用户。
[0003] 但是,基于实例的答复生成方法的问题是开发人员无法事先把所有类型的问 题-答案对都记录在问答数据库中。由于一个要问的问题的变型可以有很多种,对于开发 人员而言,很难将它们都事先记录到问答数据库中;进一步地,将很多个问题的各种变型都 事先记录到问答数据库中更是无法实现。当问答数据库中没有记录与所问的问题类似的问 题(和相应的答案)时,该问答系统会请用户问另外的问题,或者仅向用户提供不正确的答 案。
[0004] 鉴于以上原因,需要提高基于语音的问答系统的问答数据库中记录的问题-答案 对的数量。
[0005] -种解决的方法例如是,开发人员可以先记录用户所问的问题。然后,人为地听取 所记录的问题并转录这些问题,并检测这些问题在问答数据库中是否有记录(问题检测步 骤)。然后,开发人员为每个未被记录的问题提供答案,并将所述未被记录的问题和提供的 其答案添加到问答数据库中(答案生成步骤)。
[0006] 但是,该方法的问题检测步骤和答案生成步骤都需要人工操作,这使得该方法效 率低下。
[0007] 另外,常规的基于语音的问答系统仅根据用户所问的问题的声学和语言特征来确 定用户所问的问题是否在系统中有记录。从而导致如果用户所问的问题与系统中的例如问 答数据库中记录的问题在字面意思上不一致(即,单纯的文字上不一致)时,常规的系统会 把用户所问的问题作为系统中未记录的问题对待,从而使得这样的问答系统的识别问题的 精度较低,能够准确回答的问题也较少。而如果想覆盖更多的问题,则必须增加系统中记录 的问题-答案对的数量,这对于系统的存储容量提出更高的要求。
[0008] 例如,假设在问答数据库中记录了"给我操作手册看看",而用户所问的问题是"我 想读一本手册",那么常规的基于语音的问答系统会将用户所问的该问题分类为未记录的 问题。但是,这两句话的意思差不多,也就是说,用户所问的该问题应当被认为等同于问答 数据库中记录的相应问题而被分类为已记录的问题。即,语义对于基于语音的问答系统也 是很重要的一个方面,但是在已有的方法中却仅考虑了用户所问的问题的声学和语言特征 (即,字面意思),语义上的相似却未被考虑。


【发明内容】

[0009] 综上可知,需要一种以下这样的基于语音的问答系统:其能够自动确定用户所问 的问题是否在系统中(例如,系统的数据存储单元中)有记录。优选地,还需要该系统能够提 高其中所存储的数据的有效性从而减轻对于存储容量的需求,需要使得该系统的识别问题 的精度更高,需要使得该系统所覆盖的问题的范围更大。
[0010] 本发明旨在解决上面描述的至少一个问题。本发明的一个目的是提供一种解决以 上问题中的任何一个的基于语音的问答系统和用于交互式语音系统的方法。
[0011] 具体地,对于用户所问的问题,通过计算语音识别单元对于该所问问题的识别结 果与系统中所存储的相关数据的在语义(所表达的含义)上的相似程度(简称语义相似度), 确定该所问问题在系统中是否有与其匹配的数据。
[0012] 如果该所问问题在系统中有与其匹配的数据,则可以输出与该匹配数据对应的输 出数据。
[0013] 如果该所问问题在系统中没有与其匹配的数据,则可以将该所问问题存储到系统 中以扩展系统中所记录的数据。
[0014] 根据本公开内容的一个方面,提供一种基于语音的问答系统,所述系统包括:问答 数据存储单元,在该问答数据存储单元中相关联地存储问题以及对应于所述问题的答案; 语音识别单元,通过使用语言模型对于用户说出的问题进行语音识别;语义相似度计算单 元,根据语音识别单元对于用户说出的问题的识别结果,计算用户说出的问题与所述问答 数据存储单元中存储的每个问题之间的语义相似度,其中,所述语义相似度用于表示用户 说出的问题与所述问答数据存储单元中存储的每个问题所表达的意思上的相似程度;以及 分类单元,基于所述语义相似度计算单元所计算出的所述语义相似度,将用户说出的问题 分类为在存储单元内的问题或者在存储单元外的问题。
[0015] 根据本公开内容的另一个方面,提供一种用于交互式语音系统的方法,该交互式 语音系统包括语音识别单元和问答数据存储单元,在所述问答数据存储单元中相关联地存 储了问题以及对应于所述问题的答案,所述方法包括:语音识别步骤,通过语音识别单元使 用语言模型对于用户说出的问题进行语音识别;语义相似度计算步骤,根据语音识别单元 对于用户说出的问题的识别结果,计算用户说出的问题与所述问答数据存储单元中存储的 每个问题之间的语义相似度,其中,所述语义相似度用于表示用户说出的问题与所述问答 数据存储单元中存储的每个问题所表达的意思上的相似程度;以及分类步骤,基于计算出 的所述语义相似度,将用户说出的问题分类为在存储单元内的问题或者在存储单元外的问 题。
[0016] 由此,本发明能够自动确定用户所问的问题是否在系统中(例如,系统的数据存储 单元中)有记录。而且,本发明能够提高基于语音的问答系统中所存储的数据的有效性,从 而减轻其对于存储容量的需求,并且,能够使得该系统的识别问题的精度更高,并且使得该 系统所覆盖的问题的范围更大。
[0017] 参照附图来阅读对于示例性实施例的以下描述,本发明的其他特性特征和优点将 变得清晰。

【专利附图】

【附图说明】
[0018] 并入到说明书中并且构成说明书的一部分的附图示出了本发明的实施例,并且与 描述一起用于解释本发明的原理。在这些附图中,除非另外指明,否则,相同的附图标记用 于表示具有相同功能的要素。
[0019] 图1是示出能够实施本发明的实施例的计算机系统的示例性的硬件配置的框图。
[0020] 图2示例性地示出根据本发明的实施例的基于语音的问答系统的框图。
[0021] 图3示例性地示出根据本发明的实施例的用于交互式语音系统的方法的流程图。
[0022] 图4示例性地示出根据本发明的实施例的作为例子的语义相似度计算单元的框 图。
[0023] 图5示例性地示出根据本发明的实施例的作为例子的用于计算语义相似度的方 法的流程图。
[0024] 图6示例性地示出根据本发明的实施例的另一基于语音的问答系统的框图。
[0025] 图7示例性地示出根据本发明的实施例的另一用于交互式语音系统的方法的流 程图。
[0026] 图8示例性地示出文字相似度计算单元的框图。
[0027] 图9示例性地示出文字相似度计算方法的流程图。
[0028] 图10示出本发明与常规技术的效果对比。

【具体实施方式】
[0029] 应当注意,以下的示例性实施例不意欲限制所附权利要求的范围,并且在示例性 实施例中描述的特征的所有组合对于本发明的解决手段并不一定是必需的。以下描述的本 发明的示例性实施例中的每一个都可单独地实施,或者在必要的情况下或在单个实施例中 组合来自各个实施例的要素或特征是有益的情况下作为多个实施例或者它们的特征的组 合来实施。
[0030] 由于在这些附图中类似的附图标记用于表示类似的要素,所以,在说明书中对于 这些类似的要素将不会重复描述,而本领域普通技术人员应当明白这些类似的要素表示类 似的含义。
[0031] 并且,在本公开中,本发明的基于语音的问答系统的各单元、部件和/或组件等等 可以用硬件、固件、软件、或其任意组合来实施,并且如果这些单元、部件和/或组件要执行 的操作与根据本发明的用于交互式语音系统的方法中的步骤是类似的,则为了简要起见, 可能将仅具体描述相应的步骤而省略对于操作的详细描述,但是本领域普通技术人员会明 白,这些单元、部件和/或组件所要执行的操作的具体内容。另外,根据本发明的用于交互 式语音系统的方法也是可以用硬件、固件、软件、或其任意组合来实施的。即,本发明的方法 和系统不受实施方式的限制,其保护范围仅由所附权利要求来限定。
[0032] 在本公开中,术语"第一"、"第二"等仅仅被用来在要素之间进行区分,而并不意图 表示时间顺序、优先级或重要性等。
[0033] 而且,在本公开中,步骤的执行顺序不是必须要按照流程图所示出和实施例中所 提到的那样,而是可以根据实际情况来灵活变通的,即,本发明不应该受到流程图所示出的 步骤的执行顺序的限制。
[0034] 以下,将参照附图来对本发明的示例性实施例进行详细描述。
[0035] 图1是示出能够实施本发明的实施例的计算机系统1的硬件配置的框图。
[0036] 如图1中所示,计算机系统1包括计算机1110。计算机1110包括经由系统总线 1121连接的处理单元1120、系统存储器1130、固定非易失性存储器接口 1140、可移动非易 失性存储器接口 1150、用户输入接口 1160、网络接口 1170、视频接口 1190和输出外围接口 1195。
[0037] 系统存储器1130包括ROM (只读存储器)1131和RAM (随机存取存储器)1132。 BIOS (基本输入输出系统)1133驻留在R0M1131中。操作系统1134、应用程序1135、其他 程序模块1136和某些程序数据1137驻留在RAMl 132中。
[0038] 诸如硬盘之类的固定非易失性存储器1141连接到固定非易失性存储器接口 1140。固定非易失性存储器1141例如可以存储操作系统1144、应用程序1145、其他程序模 块1146和某些程序数据1147。
[0039] 诸如软盘驱动器1151和⑶-ROM驱动器1155之类的可移动非易失性存储器连接 到可移动非易失性存储器接口 1150。例如,软盘1152可以被插入到软盘驱动器1151中,以 及⑶(光盘)1156可以被插入到⑶-ROM驱动器1155中。
[0040] 诸如麦克风1161和键盘1162之类的输入设备被连接到用户输入接口 1160。
[0041] 计算机1110可以通过网络接口 1170连接到远程计算机1180。例如,网络接口 1170可以经由局域网1171连接到远程计算机1180。或者,网络接口 1170可以连接到调制 解调器(调制器-解调器)1172,以及调制解调器1172经由广域网1173连接到远程计算机 1180。
[0042] 远程计算机1180可以包括诸如硬盘之类的存储器1181,其存储远程应用程序 1185。
[0043] 视频接口 1190连接到监视器1191。
[0044] 输出外围接口 1195连接到打印机1196和扬声器1197。
[0045] 图1所示的计算机系统可以被实施于任何实施例,可作为独立计算机,或者也可 作为设备中的处理系统,可以移除一个或更多个不必要的组件,也可以向其添加一个或更 多个附加的组件。
[0046] 用户可以采用任何方式使用图1所示的计算机系统,本发明对于用户使用计算机 系统的方式不作限制。
[0047] 显然,图1所示的计算机系统只是示例性的,并且决不意图限制本发明、本发明的 应用或用途。
[0048] [第一实施例]
[0049] 以下,将参照图2和图3来详细描述本发明的第一实施例。
[0050] 图2示例性地示出根据本发明的第一实施例的基于语音的问答系统100的框图。
[0051] 如图2所示,根据本发明的第一实施例的基于语音的问答系统100可以包括问答 数据存储单元101、语音识别单元102、语义相似度计算单元103、分类单元104。
[0052] 其中,在问答数据存储单元101中相关联地存储有问题以及对应于所述问题的答 案。
[0053] 并且,语音识别单元102被配置为通过例如使用语言模型对于用户说出的问题进 行语音识别。
[0054] 并且,语义相似度计算单元103被配置为根据语音识别单元102对于用户说出的 问题的识别结果,计算用户说出的问题与所述问答数据存储单元101中存储的每个问题之 间的语义相似度。在本文中,该语义相似度用于表示用户说出的问题与所述问答数据存储 单元101中存储的每个问题所表达的意思上的相似程度。
[0055] 并且,分类单元104被配置为基于所述语义相似度计算单元103所计算出的语义 相似度,将用户说出的问题分类为在存储单元内的问题或者在存储单元外的问题。
[0056] 当然,本领域普通技术人员会明白,上面描述的基于语义相似度来对问题进行分 类以区分其是在存储单元内还是在存储单元外只是一个例子,实际上,在本发明中,分类单 元可以基于能够想到的任何其他方式来将用户所问的问题进行分类,只要能够将其区分开 是在存储单元内还是在存储单元外即可。
[0057] 另外,需要注意的是,图2所示的基于语音的问答系统仅是示例性的,本发明的基 于语音的问答系统不限于此。并且,图2中所示的这些部件对于解决本发明的技术问题而 言并不一定都是必须的,并且,这些部件可以采取单个部件的形式或者可以采取任何方式 进行组合。
[0058] 以下将参照图3来描述用于交互式语音系统的方法。
[0059] 图3示例性地示出根据本发明的实施例的用于交互式语音系统的方法的流程图。
[0060] 在本发明中,交互式语音系统包括上面提到的基于语音的问答系统,还可以包括 能够想到的其他形式的可以和用户进行交互的基于语音的系统。
[0061] 根据本发明的实施例的交互式语音系统可以包括语音识别单元和问答数据存储 单元。其中,语音识别单元可以通过例如语言模型来识别输入的语音,例如用户所问的问 题。并且,在所述问答数据存储单元中可以相关联地存储有多种数据,例如,其中可以存储 有问题以及对应于所述问题的答案。
[0062] 在根据本发明的实施例的用于交互式语音系统的方法中,在语音识别步骤S101, 对于语音输入(例如,用户说出的问题),通过语音识别单元利用例如语言模型等进行语音 识别,从而可以得到语音识别的结果。这里,语音识别的结果由词构成,例如,其可以包括构 成所问问题的词。
[0063] 这里,上面提到的语言模型还可以通过例如更新单元被更新(后面将提到),以使 得语音识别结果更精确。
[0064] 这里,可用的识别语音的方法有很多,例如,基于HMM (隐式马尔科夫模型)的方法 等,在此对其不作任何限制,只要其能够识别出输入的语音即可。另外,语言模型例如可以 是通过领域内文本数据训练的领域特定的N元语言模型。
[0065] 另外,从所述语音识别单元还可以输出语音识别结果(更具体地,词)的声学得分 和语言得分、以及所问问题的帧大小等。
[0066] 在语义相似度计算步骤S102,根据语音识别单元对于用户说出的问题的语音识别 结果,计算用户说出的问题与所述问答数据存储单元中所存储的每个问题之间的语义相似 度。这里,语义相似度用于表示用户说出的问题与所述问答数据存储单元中存储的每个问 题所表达的意思上的相似程度。由此可以看出,本发明不是仅考虑文字(即单纯的字面意 思)上的相似程度。
[0067] 关于计算语义相似度的方法将在后面作为例子进行描述。但是,需要注意的是,本 发明不限于后面将描述的计算语义相似度的方法,本领域普通技术人员能够想到的任何计 算语义相似度的方法都应包含在本发明的保护范围内。
[0068] 在分类步骤S103,基于语义相似度计算步骤S102所计算出的语义相似度,将用户 说出的问题分类为在存储单元内的问题或者在存储单元外的问题。
[0069] 这里,上述的分类可以通过例如支持向量机(SVM)来实现,但是这仅是一种分类的 实现方式的例子,本发明对于分类的实现方式并不进行任何限制,即,只要能够实现本发明 所需的分类,任何分类方式都是可以的。
[0070] 另外,需要注意的是,参照图3所描述的用于交互式语音系统的方法仅是示例性 的,本发明的用于交互式语音系统的方法不限于此。并且,图3中所示的这些步骤对于解决 本发明的技术问题而言并不一定都是必须的,并且,上面所描述的这些步骤之间的顺序也 仅仅是示例性的,本发明并不限制于这样的步骤顺序。
[0071] 通过本发明,具体地,借助于计算所问的问题与所存储的问题之间的语义相似度, 能够自动确定用户所问的问题在系统中(例如,系统的数据存储单元中)是否有记录,并且 能够提高系统中所存储的数据的有效性,从而减轻了对于系统的存储容量的要求,并且还 使得系统的识别精度更高,从而使得该系统所覆盖的问题的范围更大。
[0072] [第二实施例]
[0073] 以下,将参照图4、图5来描述根据本发明的第二实施例。
[0074] 在本发明中,可以进行多种语义相似度的计算,具体地,可以计算用户所说出的问 题与问答数据存储单元中记录的问题之间的多种语义相似度。也就是说,各种语义相似度 的计算方式都在本发明的保护范围之内。但是,为了简要起见,下面将在本实施例中仅参照 图4、图5来描述语义相似度的计算的例子。
[0075] 图4示例性地示出根据本发明的实施例的作为例子的语义相似度计算单元103的 框图。
[0076] 如图4所示,该语义相似度计算单元103可以包括第一词袋产生部件1031、第一词 选择部件1032、第一检索部件1033、第二词袋产生部件1034、第二检索部件1035、以及语义 相似度计算部件1036。
[0077] 其中,第一词袋产生部件1031被配置为根据语音识别单元对于用户所说出的问 题的识别结果,产生第一词袋,其中所述第一词袋包括该识别结果中所含的词。
[0078] 第一词选择部件1032被配置为根据语音识别单元对于用户所说出的问题的识别 结果,从第一词袋选择其概率大于第一阈值的词。其中,词的概率例如可以由通过N元语言 模型得到的声学得分来确定。当然,也可以通过其他方式来确定词的概率。
[0079] 第一检索部件1033被配置为根据所述第一词选择部件所选择的词,从数据源检 索文档。
[0080] 第二词袋产生部件1034被配置为针对所述问答数据存储单元中存储的每个问题 产生相应的第二词袋,其中每个第二词袋包括所述问答数据存储单元中所存储的相应的问 题所含的词。
[0081] 第二检索部件1035被配置为基于每个第二词袋中的词,从数据源检索文档。
[0082] 语义相似度计算部件1036被配置为基于第一检索部件所检索到的文档和第二检 索部件所检索到的文档,计算用户所说出的问题与所述问答数据存储单元中存储的每个问 题之间的语义相似度。
[0083] 下面,将更具体地结合图5来描述作为例子的用于计算语义相似度的方法。
[0084] 图5示例性地示出根据本发明的实施例的用于计算语义相似度的方法的流程图。
[0085] 如图5所示,在第一词袋产生步骤S1021,基于语音识别单元对于用户所说出的问 题的识别结果,产生第一词袋。该第一词袋可以包括该识别结果中所含的所有的词。
[0086] 例如,对于用户所说出的一个问题的语音识别结果中有以下字母所代表的词:A、 B、C、D、E、F、G、H、I、J、K、L、M,则该第一词袋可以为由这些词所组成的集合{A,B,C,D,E, F,G,H,I,J,K,L,M}。
[0087] 当然,该第一词袋也可以根据情况而仅包含该语音识别结果的一部分,也就是说, 并不一定必须要包含该识别结果中所含的所有的词。或者说,第一词袋可以包括该识别结 果中所含的部分或全部的词。
[0088] 然后,在第一词选择步骤S1022,将第一词袋中的其概率小于等于第一阈值(例如, 0. 3)的词去除,换而言之,选择第一词袋中其概率大于第一阈值的词。这里,词的概率可以 使用已知的方法来计算,例如可以通过模糊网络来计算。这里,词的概率例如可以通过由例 如N元语言模型所得到的声学得分而得到。当然,也可以采用其他方式来选择词,本发明对 此不作任何限制。
[0089] 请注意,这里第一阈值可以为范围在0?1的值,并且,在本发明中,第一阈值的具 体数值不受限制。
[0090] 然后,在第一检索步骤S1023,基于在第一词选择步骤S1022中所选择的第一词袋 中的词,从数据源(例如,从外部的大型数据库或者从网络等)检索文档,从而可以得到一组 文档。这里,可以使用任何已知的方法或者本领域普通技术人员能够想到的方法来检索文 档。
[0091] 另一方面,在第二词袋产生步骤S1024,针对问答数据存储单元中所存储的每个问 题,产生相应的第二词袋。每个相应的第二词袋可以包括相应问题中所含的所有的词(即, 构成该问题的全部的词),当然,第二词袋也可以根据情况而仅包含相应问题中所含的一部 分词。也就是说,如第一词袋那样,第二词袋并不一定必须要包含相应问题中所含的所有的 。
[0092] 然后,在第二检索步骤S1025,对于每个第二词袋,基于该第二词袋中的词,从数据 源(例如,从系统中已有的一个数据库,或者从外部的大型数据库,或者从网络,等等)检索 文档,从而同样可以得到一组文档。同样,这里,可以使用任何已知的方法或者本领域普通 技术人员能够想到的方法来检索文档。
[0093] 这里,第一检索步骤S1023和第二检索步骤S1025中所用的数据源可以是同一个 数据源,也可以不是同一个。本发明对此并没有任何限制或者特别的要求。
[0094] 然后,在语义相似度计算子步骤S1026,基于在第一检索步骤S1023所检索到的一 组文档和在第二检索步骤S1025所检索到的一组文档,计算用户所说出的问题与问答数据 存储单元中所存储的每个问题之间的语义相似度。
[0095] 计算语义相似度的方法很多,下面将例举两个根据本发明的实施例的语义相似度 的计算例子。
[0096] 首先描述计算例子1,在该例子中,通过向量空间模型(VSM),基于在第一检索步 骤S1023和在第二检索步骤S1025检索得到的两组文档中的每个词来计算语义相似度。为 了简便起见,将利用计算例子1得到的语义相似度表示为SS1。
[0097] 其中,SSl可由下式(1)得到。

【权利要求】
1. 一种基于语音的问答系统,包括: 问答数据存储单元,在该问答数据存储单元中相关联地存储问题以及对应于所述问题 的答案; 语音识别单元,通过使用语言模型对于用户说出的问题进行语音识别; 语义相似度计算单元,根据语音识别单元对于用户说出的问题的识别结果,计算用户 说出的问题与所述问答数据存储单元中存储的每个问题之间的语义相似度,其中,所述语 义相似度用于表示用户说出的问题与所述问答数据存储单元中存储的每个问题所表达的 意思上的相似程度;以及 分类单元,基于所述语义相似度计算单元所计算出的所述语义相似度,将用户说出的 问题分类为在存储单元内的问题或者在存储单元外的问题。
2. 根据权利要求1的问答系统,还包括: 置信度计算单元,基于语音识别单元输出的有关用户所说出的问题的识别结果,为用 户所说出的问题计算置信度; 其中,所述分类单元还能够基于所述置信度计算单元计算出的置信度,将用户所说出 的问题分类为在存储单元内的问题或者在存储单元外的问题。
3. 根据权利要求1的问答系统,还包括: 输出单元,如果用户所说出的问题被分类为在存储单元内的问题,则该输出单元能够 输出与用户所说出的问题相应的在所述问答数据存储单元中所存储的问题对应的答案。
4. 根据权利要求1的问答系统,还包括: 更新单元,如果用户所说出的问题被分类为在存储单元外的问题,则该更新单元基于 所述在存储单元外的问题更新所述问答数据存储单元中存储的问题和/或更新所述语言 模型。
5. 根据权利要求2的问答系统,其中所述置信度是通过将用户所说出的问题经由N元 语言模型进行识别而得到的声学得分除以用户所说出的该问题经由音素网络进行识别而 得到的声学得分来确定的。
6. 根据权利要求1的问答系统,其中,所述语义相似度计算单元包括: 第一词袋产生部件,根据语音识别单元对于用户所说出的问题的识别结果,产生第一 词袋,其中所述第一词袋包括该识别结果中所含的词; 第一词选择部件,根据语音识别单元对于用户所说出的问题的识别结果,从所述第一 词袋选择其概率大于第一阈值的词,其中所述概率能够由通过N元语言模型得到的声学得 分来确定; 第一检索部件,根据所述第一词选择部件所选择的词,从数据源检索文档; 第二词袋产生部件,为所述问答数据存储单元中存储的每个问题产生相应的第二词 袋,其中每个第二词袋包括所述问答数据存储单元中所存储的相应的问题所含的词; 第二检索部件,基于每个第二词袋中的词,从数据源检索文档;以及 语义相似度计算部件,基于第一检索部件所检索到的文档和第二检索部件所检索到的 文档,计算用户所说出的问题与所述问答数据存储单元中存储的每个问题之间的语义相似 度。
7. 根据权利要求6的问答系统,其中,所述语义相似度计算单元还包括: 第一过滤部件,根据词性,从所述第一词选择部件自所述第一词袋所选择的词中过滤 掉一部分词,和/或根据词性,从所述第二词袋中过滤掉一部分词; 其中,所述第一检索部件针对过滤后的第一词袋进行检索,和/或第二检索部件针对 过滤后的第二词袋进行检索。
8. 根据权利要求7的问答系统,其中,所述语义相似度计算单元还包括: 领域词添加部件,向过滤后的第一词袋和/或过滤后的第二词袋添加与领域有关的 词; 其中,所述第一检索部件针对进行上述添加后的第一词袋进行检索,和/或第二检索 部件针对进行上述添加后的第二词袋进行检索。
9. 根据权利要求6所述的问答系统,其中,所述语义相似度计算单元基于以下来进行 语义相似度的计算: 第一检索部件所检索到的文档和第二检索部件所检索到的文档中的每个词;和/或 第一检索部件所检索到的文档和第二检索部件所检索到的文档之间的重合。
10. 根据权利要求1?9中的任一项的问答系统,还包括: 文字相似度计算单元,根据语音识别单元对于用户说出的问题的识别结果,计算用户 所说出的问题与所述问答数据存储单元中的每个问题之间的文字相似度,其中,所述文字 相似度用于表示用户说出的问题与所述问答数据存储单元中存储的每个问题在文字上的 相似程度; 其中,所述分类单元还能够基于所述文字相似度计算单元所计算出的所述文字相似 度,将用户所说出的问题分类为在存储单元内的问题或者在存储单元外的问题。
11. 根据权利要求10的问答系统,其中,所述文字相似度计算单元包括: 第三词袋产生部件,根据语音识别单元对于用户所说出的问题的识别结果,产生第三 词袋,其中所述第三词袋包括所述识别结果中所含的词; 第四词袋产生部件,为所述问答数据存储单元中存储的每个问题产生相应的第四词 袋,其中每个第四词袋包括所述问答数据存储单元中所存储的相应的问题所含的词; 第二词选择部件,根据语音识别单元对于用户所说出的问题的识别结果,从所述第三 词袋选择其概率大于第二阈值的词,其中所述概率能够由通过N元语言模型得到的声学得 分来确定;以及 文字相似度计算部件,根据所述第二词选择部件所选择的第三词袋中的词和所述第四 词袋中的词,计算用户所说出的问题与所述问答数据存储单元中存储的每个问题之间的文 字相似度。
12. 根据权利要求11的问答系统,其中,所述文字相似度计算单元还包括: 第二过滤部件,根据词性,从所述第二词选择部件自所述第三词袋所选择的词中过滤 掉一部分词,和/或根据词性,从所述第四词袋中过滤掉一部分词; 其中,在第二过滤部件进行上述过滤后,所述文字相似度计算部件进行文字相似度的 计算。
13. -种用于交互式语音系统的方法,该交互式语音系统包括语音识别单元和问答数 据存储单元,在所述问答数据存储单元中相关联地存储了问题以及对应于所述问题的答 案,所述方法包括: 语音识别步骤,通过语音识别单元使用语言模型对于用户说出的问题进行语音识别; 语义相似度计算步骤,根据语音识别单元对于用户说出的问题的识别结果,计算用户 说出的问题与所述问答数据存储单元中存储的每个问题之间的语义相似度,其中,所述语 义相似度用于表示用户说出的问题与所述问答数据存储单元中存储的每个问题所表达的 意思上的相似程度;以及 分类步骤,基于计算出的所述语义相似度,将用户说出的问题分类为在存储单元内的 问题或者在存储单元外的问题。
14. 根据权利要求13的方法,还包括: 置信度计算步骤,基于所述语音识别步骤中得到的有关用户所说出的问题的识别结 果,为用户所说出的问题计算置信度; 其中,在所述分类步骤中,还能够基于计算出的所述置信度,将用户所说出的问题分类 为在存储单元内的问题或者在存储单元外的问题。
15. 根据权利要求13的方法,还包括: 输出步骤,如果用户所说出的问题被分类为在存储单元内的问题,则输出与用户所说 出的问题相应的在所述问答数据存储单元中所存储的问题对应的答案。
16. 根据权利要求13的方法,还包括: 更新步骤,如果用户所说出的问题被分类为在存储单元外的问题,则基于所述在存储 单元外的问题更新所述问答数据存储单元中存储的问题和/或更新所述语言模型。
17. 根据权利要求14的方法,其中所述置信度是通过将用户所说出的问题经由N元语 言模型进行识别而得到的声学得分除以用户所说出的该问题经由音素网络进行识别而得 到的声学得分来确定的。
18. 根据权利要求13的方法,其中,所述语义相似度计算步骤包括: 第一词袋产生步骤,根据所述语音识别步骤中得到的对于用户所说出的问题的识别结 果,产生第一词袋,其中所述第一词袋包括该识别结果中所含的词; 第一词选择步骤,根据从所述语音识别步骤得到的对于用户所说出的问题的识别结 果,从所述第一词袋选择其概率大于第三阈值的词,其中所述概率能够由通过N元语言模 型得到的声学得分来确定; 第一检索步骤,根据所述第一词选择步骤中所选择的词,从数据源检索文档; 第二词袋产生步骤,为所述问答数据存储单元中存储的每个问题产生相应的第二词 袋,其中每个第二词袋包括所述问答数据存储单元中所存储的相应的问题所含的词; 第二检索步骤,基于每个第二词袋中的词,从数据源检索文档;以及 语义相似度计算子步骤,基于第一检索部件所检索到的文档和第二检索部件所检索到 的文档,计算用户所说出的问题与所述问答数据存储单元中存储的每个问题之间的语义相 似度。
19. 根据权利要求18的方法,其中,所述语义相似度计算步骤还包括: 第一过滤步骤,根据词性,从在所述第一词选择步骤中所选择的第一词袋的词中过滤 掉一部分词,和/或根据词性,从所述第二词袋中过滤掉一部分词; 其中,在所述第一检索步骤中针对过滤后的第一词袋进行检索,和/或在第二检索步 骤中针对过滤后的第二词袋进行检索。
20. 根据权利要求19的方法,其中,所述语义相似度计算步骤还包括: 领域词添加步骤,向过滤后的第一词袋和/或过滤后的第二词袋添加与领域有关的 词; 其中,在所述第一检索步骤中,针对进行上述添加后的第一词袋进行检索,和/或在所 述第二检索步骤中,针对进行上述添加后的第二词袋进行检索。
21. 根据权利要求18所述的方法,其中,在所述语义相似度计算步骤中,基于以下来进 行语义相似度的计算: 在第一检索步骤中所检索到的文档和在第二检索步骤中所检索到的文档中的每个词; 和/或 在第一检索步骤中所检索到的文档和在第二检索步骤中所检索到的文档之间的重合。
22. 根据权利要求13?21中的任一项的方法,还包括: 文字相似度计算步骤,根据从所述语音识别步骤得到的对于用户说出的问题的识别结 果,计算用户所说出的问题与所述问答数据存储单元中的每个问题之间的文字相似度,其 中,所述文字相似度用于表示用户说出的问题与所述问答数据存储单元中存储的每个问题 在文字上的相似程度; 其中,在所述分类步骤中,还能够基于所计算出的文字相似度,将用户所说出的问题分 类为在存储单元内的问题或者在存储单元外的问题。
23. 根据权利要求22的方法,其中,所述文字相似度计算步骤包括: 第三词袋产生步骤,根据从所述语音识别步骤得到的对于用户所说出的问题的识别结 果,产生第三词袋,其中所述第三词袋包括该识别结果中所含的词; 第四词袋产生步骤,为所述问答数据存储单元中存储的每个问题产生相应的第四词 袋,其中每个第四词袋包括所述问答数据存储单元中所存储的相应的问题所含的词; 第二词选择步骤,根据从所述语音识别步骤得到的对于用户所说出的问题的识别结 果,从所述第三词袋选择其概率大于第四阈值的词,其中所述概率能够由通过N元语言模 型得到的声学得分来确定;以及 文字相似度计算子步骤,根据在所述第二词选择步骤中所选择的第三词袋中的词和所 述第四词袋中的词,计算用户所说出的问题与所述问答数据存储单元中存储的每个问题之 间的文字相似度。
24. 根据权利要求23的方法,其中,所述文字相似度计算步骤还包括: 第二过滤步骤,根据词性,从所述第二词选择步骤中所选择的第三词袋的词中过滤掉 一部分词,和/或根据词性,从所述第四词袋中过滤掉一部分词; 其中,在进行了第二过滤步骤中的过滤之后,进行所述文字相似度计算子步骤中的文 字相似度的计算。
【文档编号】G10L15/32GK104424290SQ201310390944
【公开日】2015年3月18日 申请日期:2013年9月2日 优先权日:2013年9月2日
【发明者】左祥, 金浩 申请人:佳能株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1