基于语音的问答系统和用于交互式语音系统的方法

文档序号：2826196阅读：234来源：国知局

基于语音的问答系统和用于交互式语音系统的方法
【专利摘要】本发明涉及基于语音的问答系统和用于交互式语音系统的方法。一种基于语音的问答系统，包括：问答数据存储单元，在该问答数据存储单元中相关联地存储问题以及对应于所述问题的答案；语音识别单元，通过使用语言模型对于用户说出的问题进行语音识别；语义相似度计算单元，根据语音识别单元对于用户说出的问题的识别结果，计算用户说出的问题与问答数据存储单元中存储的每个问题之间的语义相似度，其中，所述语义相似度用于表示用户说出的问题与所述问答数据存储单元中存储的每个问题所表达的意思上的相似程度；以及分类单元，基于语义相似度计算单元所计算出的语义相似度，将用户说出的问题分类为在存储单元内的问题或者在存储单元外的问题。
【专利说明】基于语音的问答系统和用于交互式语音系统的方法

【技术领域】
[0001] 本发明涉及基于语音的问答系统和用于交互式语音系统的方法。

【背景技术】
[0002] 近年来，能够自动回答用户所问的问题的基于语音的问答系统得到研究。对于该类系统，基于实例的答复生成方法是一种有效的方法，所述基于实例的答复生成方法利用问答数据库，所述问答数据库中包括很多问题-答案对。当一个问答系统从用户接收到问题时，它首先通过语音识别器来识别用户所问的问题，然后从问答数据库中选择问答数据库中的与语音识别器所识别的结果最相似的问题，并将问答数据库中的与所选择的问题成一对(即，相对应）的答案提供给用户。
[0003] 但是，基于实例的答复生成方法的问题是开发人员无法事先把所有类型的问题-答案对都记录在问答数据库中。由于一个要问的问题的变型可以有很多种，对于开发人员而言，很难将它们都事先记录到问答数据库中；进一步地，将很多个问题的各种变型都事先记录到问答数据库中更是无法实现。当问答数据库中没有记录与所问的问题类似的问题(和相应的答案）时，该问答系统会请用户问另外的问题，或者仅向用户提供不正确的答案。
[0004] 鉴于以上原因，需要提高基于语音的问答系统的问答数据库中记录的问题-答案对的数量。
[0005] -种解决的方法例如是，开发人员可以先记录用户所问的问题。然后，人为地听取所记录的问题并转录这些问题，并检测这些问题在问答数据库中是否有记录（问题检测步骤)。然后，开发人员为每个未被记录的问题提供答案，并将所述未被记录的问题和提供的其答案添加到问答数据库中(答案生成步骤)。
[0006] 但是，该方法的问题检测步骤和答案生成步骤都需要人工操作，这使得该方法效率低下。
[0007] 另外，常规的基于语音的问答系统仅根据用户所问的问题的声学和语言特征来确定用户所问的问题是否在系统中有记录。从而导致如果用户所问的问题与系统中的例如问答数据库中记录的问题在字面意思上不一致（即，单纯的文字上不一致）时，常规的系统会把用户所问的问题作为系统中未记录的问题对待，从而使得这样的问答系统的识别问题的精度较低，能够准确回答的问题也较少。而如果想覆盖更多的问题，则必须增加系统中记录的问题-答案对的数量，这对于系统的存储容量提出更高的要求。
[0008] 例如，假设在问答数据库中记录了"给我操作手册看看"，而用户所问的问题是"我想读一本手册"，那么常规的基于语音的问答系统会将用户所问的该问题分类为未记录的问题。但是，这两句话的意思差不多，也就是说，用户所问的该问题应当被认为等同于问答数据库中记录的相应问题而被分类为已记录的问题。即，语义对于基于语音的问答系统也是很重要的一个方面，但是在已有的方法中却仅考虑了用户所问的问题的声学和语言特征 (即，字面意思)，语义上的相似却未被考虑。

【发明内容】

[0009] 综上可知，需要一种以下这样的基于语音的问答系统：其能够自动确定用户所问的问题是否在系统中（例如，系统的数据存储单元中)有记录。优选地，还需要该系统能够提高其中所存储的数据的有效性从而减轻对于存储容量的需求，需要使得该系统的识别问题的精度更高，需要使得该系统所覆盖的问题的范围更大。
[0010] 本发明旨在解决上面描述的至少一个问题。本发明的一个目的是提供一种解决以上问题中的任何一个的基于语音的问答系统和用于交互式语音系统的方法。
[0011] 具体地，对于用户所问的问题，通过计算语音识别单元对于该所问问题的识别结果与系统中所存储的相关数据的在语义(所表达的含义）上的相似程度(简称语义相似度)，确定该所问问题在系统中是否有与其匹配的数据。
[0012] 如果该所问问题在系统中有与其匹配的数据，则可以输出与该匹配数据对应的输出数据。
[0013] 如果该所问问题在系统中没有与其匹配的数据，则可以将该所问问题存储到系统中以扩展系统中所记录的数据。
[0014] 根据本公开内容的一个方面，提供一种基于语音的问答系统，所述系统包括：问答数据存储单元，在该问答数据存储单元中相关联地存储问题以及对应于所述问题的答案；语音识别单元，通过使用语言模型对于用户说出的问题进行语音识别；语义相似度计算单元，根据语音识别单元对于用户说出的问题的识别结果，计算用户说出的问题与所述问答数据存储单元中存储的每个问题之间的语义相似度，其中，所述语义相似度用于表示用户说出的问题与所述问答数据存储单元中存储的每个问题所表达的意思上的相似程度；以及分类单元，基于所述语义相似度计算单元所计算出的所述语义相似度，将用户说出的问题分类为在存储单元内的问题或者在存储单元外的问题。
[0015] 根据本公开内容的另一个方面，提供一种用于交互式语音系统的方法，该交互式语音系统包括语音识别单元和问答数据存储单元，在所述问答数据存储单元中相关联地存储了问题以及对应于所述问题的答案，所述方法包括：语音识别步骤，通过语音识别单元使用语言模型对于用户说出的问题进行语音识别；语义相似度计算步骤，根据语音识别单元对于用户说出的问题的识别结果，计算用户说出的问题与所述问答数据存储单元中存储的每个问题之间的语义相似度，其中，所述语义相似度用于表示用户说出的问题与所述问答数据存储单元中存储的每个问题所表达的意思上的相似程度；以及分类步骤，基于计算出的所述语义相似度，将用户说出的问题分类为在存储单元内的问题或者在存储单元外的问题。
[0016] 由此，本发明能够自动确定用户所问的问题是否在系统中（例如，系统的数据存储单元中）有记录。而且，本发明能够提高基于语音的问答系统中所存储的数据的有效性，从而减轻其对于存储容量的需求，并且，能够使得该系统的识别问题的精度更高，并且使得该系统所覆盖的问题的范围更大。
[0017] 参照附图来阅读对于示例性实施例的以下描述，本发明的其他特性特征和优点将变得清晰。

【专利附图】

【附图说明】
[0018] 并入到说明书中并且构成说明书的一部分的附图示出了本发明的实施例，并且与描述一起用于解释本发明的原理。在这些附图中，除非另外指明，否则，相同的附图标记用于表示具有相同功能的要素。
[0019] 图1是示出能够实施本发明的实施例的计算机系统的示例性的硬件配置的框图。
[0020] 图2示例性地示出根据本发明的实施例的基于语音的问答系统的框图。
[0021] 图3示例性地示出根据本发明的实施例的用于交互式语音系统的方法的流程图。
[0022] 图4示例性地示出根据本发明的实施例的作为例子的语义相似度计算单元的框图。
[0023] 图5示例性地示出根据本发明的实施例的作为例子的用于计算语义相似度的方法的流程图。
[0024] 图6示例性地示出根据本发明的实施例的另一基于语音的问答系统的框图。
[0025] 图7示例性地示出根据本发明的实施例的另一用于交互式语音系统的方法的流程图。
[0026] 图8示例性地示出文字相似度计算单元的框图。
[0027] 图9示例性地示出文字相似度计算方法的流程图。
[0028] 图10示出本发明与常规技术的效果对比。

【具体实施方式】
[0029] 应当注意，以下的示例性实施例不意欲限制所附权利要求的范围，并且在示例性实施例中描述的特征的所有组合对于本发明的解决手段并不一定是必需的。以下描述的本发明的示例性实施例中的每一个都可单独地实施，或者在必要的情况下或在单个实施例中组合来自各个实施例的要素或特征是有益的情况下作为多个实施例或者它们的特征的组合来实施。
[0030] 由于在这些附图中类似的附图标记用于表示类似的要素，所以，在说明书中对于这些类似的要素将不会重复描述，而本领域普通技术人员应当明白这些类似的要素表示类似的含义。
[0031] 并且，在本公开中，本发明的基于语音的问答系统的各单元、部件和/或组件等等可以用硬件、固件、软件、或其任意组合来实施，并且如果这些单元、部件和/或组件要执行的操作与根据本发明的用于交互式语音系统的方法中的步骤是类似的，则为了简要起见，可能将仅具体描述相应的步骤而省略对于操作的详细描述，但是本领域普通技术人员会明白，这些单元、部件和/或组件所要执行的操作的具体内容。另外，根据本发明的用于交互式语音系统的方法也是可以用硬件、固件、软件、或其任意组合来实施的。即，本发明的方法和系统不受实施方式的限制，其保护范围仅由所附权利要求来限定。
[0032] 在本公开中，术语"第一"、"第二"等仅仅被用来在要素之间进行区分，而并不意图表示时间顺序、优先级或重要性等。
[0033] 而且，在本公开中，步骤的执行顺序不是必须要按照流程图所示出和实施例中所提到的那样，而是可以根据实际情况来灵活变通的，即，本发明不应该受到流程图所示出的步骤的执行顺序的限制。
[0034] 以下，将参照附图来对本发明的示例性实施例进行详细描述。
[0035] 图1是示出能够实施本发明的实施例的计算机系统1的硬件配置的框图。
[0036] 如图1中所示，计算机系统1包括计算机1110。计算机1110包括经由系统总线 1121连接的处理单元1120、系统存储器1130、固定非易失性存储器接口 1140、可移动非易失性存储器接口 1150、用户输入接口 1160、网络接口 1170、视频接口 1190和输出外围接口 1195。
[0037] 系统存储器1130包括ROM (只读存储器）1131和RAM (随机存取存储器）1132。 BIOS (基本输入输出系统）1133驻留在R0M1131中。操作系统1134、应用程序1135、其他程序模块1136和某些程序数据1137驻留在RAMl 132中。
[0038] 诸如硬盘之类的固定非易失性存储器1141连接到固定非易失性存储器接口 1140。固定非易失性存储器1141例如可以存储操作系统1144、应用程序1145、其他程序模块1146和某些程序数据1147。
[0039] 诸如软盘驱动器1151和⑶-ROM驱动器1155之类的可移动非易失性存储器连接到可移动非易失性存储器接口 1150。例如，软盘1152可以被插入到软盘驱动器1151中，以及⑶（光盘）1156可以被插入到⑶-ROM驱动器1155中。
[0040] 诸如麦克风1161和键盘1162之类的输入设备被连接到用户输入接口 1160。
[0041] 计算机1110可以通过网络接口 1170连接到远程计算机1180。例如，网络接口 1170可以经由局域网1171连接到远程计算机1180。或者，网络接口 1170可以连接到调制解调器(调制器-解调器）1172,以及调制解调器1172经由广域网1173连接到远程计算机 1180。
[0042] 远程计算机1180可以包括诸如硬盘之类的存储器1181，其存储远程应用程序 1185。
[0043] 视频接口 1190连接到监视器1191。
[0044] 输出外围接口 1195连接到打印机1196和扬声器1197。
[0045] 图1所示的计算机系统可以被实施于任何实施例，可作为独立计算机，或者也可作为设备中的处理系统，可以移除一个或更多个不必要的组件，也可以向其添加一个或更多个附加的组件。
[0046] 用户可以采用任何方式使用图1所示的计算机系统，本发明对于用户使用计算机系统的方式不作限制。
[0047] 显然，图1所示的计算机系统只是示例性的，并且决不意图限制本发明、本发明的应用或用途。
[0048] [第一实施例]
[0049] 以下，将参照图2和图3来详细描述本发明的第一实施例。
[0050] 图2示例性地示出根据本发明的第一实施例的基于语音的问答系统100的框图。
[0051] 如图2所示，根据本发明的第一实施例的基于语音的问答系统100可以包括问答数据存储单元101、语音识别单元102、语义相似度计算单元103、分类单元104。
[0052] 其中，在问答数据存储单元101中相关联地存储有问题以及对应于所述问题的答案。
[0053] 并且，语音识别单元102被配置为通过例如使用语言模型对于用户说出的问题进行语音识别。
[0054] 并且，语义相似度计算单元103被配置为根据语音识别单元102对于用户说出的问题的识别结果，计算用户说出的问题与所述问答数据存储单元101中存储的每个问题之间的语义相似度。在本文中，该语义相似度用于表示用户说出的问题与所述问答数据存储单元101中存储的每个问题所表达的意思上的相似程度。
[0055] 并且，分类单元104被配置为基于所述语义相似度计算单元103所计算出的语义相似度，将用户说出的问题分类为在存储单元内的问题或者在存储单元外的问题。
[0056] 当然，本领域普通技术人员会明白，上面描述的基于语义相似度来对问题进行分类以区分其是在存储单元内还是在存储单元外只是一个例子，实际上，在本发明中，分类单元可以基于能够想到的任何其他方式来将用户所问的问题进行分类，只要能够将其区分开是在存储单元内还是在存储单元外即可。
[0057] 另外，需要注意的是，图2所示的基于语音的问答系统仅是示例性的，本发明的基于语音的问答系统不限于此。并且，图2中所示的这些部件对于解决本发明的技术问题而言并不一定都是必须的，并且，这些部件可以采取单个部件的形式或者可以采取任何方式进行组合。
[0058] 以下将参照图3来描述用于交互式语音系统的方法。
[0059] 图3示例性地示出根据本发明的实施例的用于交互式语音系统的方法的流程图。
[0060] 在本发明中，交互式语音系统包括上面提到的基于语音的问答系统，还可以包括能够想到的其他形式的可以和用户进行交互的基于语音的系统。
[0061] 根据本发明的实施例的交互式语音系统可以包括语音识别单元和问答数据存储单元。其中，语音识别单元可以通过例如语言模型来识别输入的语音，例如用户所问的问题。并且，在所述问答数据存储单元中可以相关联地存储有多种数据，例如，其中可以存储有问题以及对应于所述问题的答案。
[0062] 在根据本发明的实施例的用于交互式语音系统的方法中，在语音识别步骤S101，对于语音输入(例如，用户说出的问题)，通过语音识别单元利用例如语言模型等进行语音识别，从而可以得到语音识别的结果。这里，语音识别的结果由词构成，例如，其可以包括构成所问问题的词。
[0063] 这里，上面提到的语言模型还可以通过例如更新单元被更新(后面将提到)，以使得语音识别结果更精确。
[0064] 这里，可用的识别语音的方法有很多，例如，基于HMM (隐式马尔科夫模型）的方法等，在此对其不作任何限制，只要其能够识别出输入的语音即可。另外，语言模型例如可以是通过领域内文本数据训练的领域特定的N元语言模型。
[0065] 另外，从所述语音识别单元还可以输出语音识别结果(更具体地，词）的声学得分和语言得分、以及所问问题的帧大小等。
[0066] 在语义相似度计算步骤S102,根据语音识别单元对于用户说出的问题的语音识别结果，计算用户说出的问题与所述问答数据存储单元中所存储的每个问题之间的语义相似度。这里，语义相似度用于表示用户说出的问题与所述问答数据存储单元中存储的每个问题所表达的意思上的相似程度。由此可以看出，本发明不是仅考虑文字（即单纯的字面意思）上的相似程度。
[0067] 关于计算语义相似度的方法将在后面作为例子进行描述。但是，需要注意的是，本发明不限于后面将描述的计算语义相似度的方法，本领域普通技术人员能够想到的任何计算语义相似度的方法都应包含在本发明的保护范围内。
[0068] 在分类步骤S103,基于语义相似度计算步骤S102所计算出的语义相似度，将用户说出的问题分类为在存储单元内的问题或者在存储单元外的问题。
[0069] 这里，上述的分类可以通过例如支持向量机（SVM)来实现，但是这仅是一种分类的实现方式的例子，本发明对于分类的实现方式并不进行任何限制，即，只要能够实现本发明所需的分类，任何分类方式都是可以的。
[0070] 另外，需要注意的是，参照图3所描述的用于交互式语音系统的方法仅是示例性的，本发明的用于交互式语音系统的方法不限于此。并且，图3中所示的这些步骤对于解决本发明的技术问题而言并不一定都是必须的，并且，上面所描述的这些步骤之间的顺序也仅仅是示例性的，本发明并不限制于这样的步骤顺序。
[0071] 通过本发明，具体地，借助于计算所问的问题与所存储的问题之间的语义相似度，能够自动确定用户所问的问题在系统中（例如，系统的数据存储单元中）是否有记录，并且能够提高系统中所存储的数据的有效性，从而减轻了对于系统的存储容量的要求，并且还使得系统的识别精度更高，从而使得该系统所覆盖的问题的范围更大。
[0072] [第二实施例]
[0073] 以下，将参照图4、图5来描述根据本发明的第二实施例。
[0074] 在本发明中，可以进行多种语义相似度的计算，具体地，可以计算用户所说出的问题与问答数据存储单元中记录的问题之间的多种语义相似度。也就是说，各种语义相似度的计算方式都在本发明的保护范围之内。但是，为了简要起见，下面将在本实施例中仅参照图4、图5来描述语义相似度的计算的例子。
[0075] 图4示例性地示出根据本发明的实施例的作为例子的语义相似度计算单元103的框图。
[0076] 如图4所示，该语义相似度计算单元103可以包括第一词袋产生部件1031、第一词选择部件1032、第一检索部件1033、第二词袋产生部件1034、第二检索部件1035、以及语义相似度计算部件1036。
[0077] 其中，第一词袋产生部件1031被配置为根据语音识别单元对于用户所说出的问题的识别结果，产生第一词袋，其中所述第一词袋包括该识别结果中所含的词。
[0078] 第一词选择部件1032被配置为根据语音识别单元对于用户所说出的问题的识别结果，从第一词袋选择其概率大于第一阈值的词。其中，词的概率例如可以由通过N元语言模型得到的声学得分来确定。当然，也可以通过其他方式来确定词的概率。
[0079] 第一检索部件1033被配置为根据所述第一词选择部件所选择的词，从数据源检索文档。
[0080] 第二词袋产生部件1034被配置为针对所述问答数据存储单元中存储的每个问题产生相应的第二词袋，其中每个第二词袋包括所述问答数据存储单元中所存储的相应的问题所含的词。
[0081] 第二检索部件1035被配置为基于每个第二词袋中的词，从数据源检索文档。
[0082] 语义相似度计算部件1036被配置为基于第一检索部件所检索到的文档和第二检索部件所检索到的文档，计算用户所说出的问题与所述问答数据存储单元中存储的每个问题之间的语义相似度。
[0083] 下面，将更具体地结合图5来描述作为例子的用于计算语义相似度的方法。
[0084] 图5示例性地示出根据本发明的实施例的用于计算语义相似度的方法的流程图。
[0085] 如图5所示，在第一词袋产生步骤S1021，基于语音识别单元对于用户所说出的问题的识别结果，产生第一词袋。该第一词袋可以包括该识别结果中所含的所有的词。
[0086] 例如，对于用户所说出的一个问题的语音识别结果中有以下字母所代表的词：A、 B、C、D、E、F、G、H、I、J、K、L、M，则该第一词袋可以为由这些词所组成的集合{A，B，C，D，E， F，G，H，I，J，K，L，M}。
[0087] 当然，该第一词袋也可以根据情况而仅包含该语音识别结果的一部分，也就是说，并不一定必须要包含该识别结果中所含的所有的词。或者说，第一词袋可以包括该识别结果中所含的部分或全部的词。
[0088] 然后，在第一词选择步骤S1022,将第一词袋中的其概率小于等于第一阈值(例如， 0. 3)的词去除，换而言之，选择第一词袋中其概率大于第一阈值的词。这里，词的概率可以使用已知的方法来计算，例如可以通过模糊网络来计算。这里，词的概率例如可以通过由例如N元语言模型所得到的声学得分而得到。当然，也可以采用其他方式来选择词，本发明对此不作任何限制。
[0089] 请注意，这里第一阈值可以为范围在0?1的值，并且，在本发明中，第一阈值的具体数值不受限制。
[0090] 然后，在第一检索步骤S1023,基于在第一词选择步骤S1022中所选择的第一词袋中的词，从数据源(例如，从外部的大型数据库或者从网络等）检索文档，从而可以得到一组文档。这里，可以使用任何已知的方法或者本领域普通技术人员能够想到的方法来检索文档。
[0091] 另一方面，在第二词袋产生步骤S1024,针对问答数据存储单元中所存储的每个问题，产生相应的第二词袋。每个相应的第二词袋可以包括相应问题中所含的所有的词（即，构成该问题的全部的词)，当然，第二词袋也可以根据情况而仅包含相应问题中所含的一部分词。也就是说，如第一词袋那样，第二词袋并不一定必须要包含相应问题中所含的所有的。
[0092] 然后，在第二检索步骤S1025,对于每个第二词袋，基于该第二词袋中的词，从数据源(例如，从系统中已有的一个数据库，或者从外部的大型数据库，或者从网络，等等）检索文档，从而同样可以得到一组文档。同样，这里，可以使用任何已知的方法或者本领域普通技术人员能够想到的方法来检索文档。
[0093] 这里，第一检索步骤S1023和第二检索步骤S1025中所用的数据源可以是同一个数据源，也可以不是同一个。本发明对此并没有任何限制或者特别的要求。
[0094] 然后，在语义相似度计算子步骤S1026,基于在第一检索步骤S1023所检索到的一组文档和在第二检索步骤S1025所检索到的一组文档，计算用户所说出的问题与问答数据存储单元中所存储的每个问题之间的语义相似度。
[0095] 计算语义相似度的方法很多，下面将例举两个根据本发明的实施例的语义相似度的计算例子。
[0096] 首先描述计算例子1，在该例子中，通过向量空间模型（VSM)，基于在第一检索步骤S1023和在第二检索步骤S1025检索得到的两组文档中的每个词来计算语义相似度。为了简便起见，将利用计算例子1得到的语义相似度表示为SS1。
[0097] 其中，SSl可由下式（1)得到。

【权利要求】
1. 一种基于语音的问答系统，包括：问答数据存储单元，在该问答数据存储单元中相关联地存储问题以及对应于所述问题的答案；语音识别单元，通过使用语言模型对于用户说出的问题进行语音识别；语义相似度计算单元，根据语音识别单元对于用户说出的问题的识别结果，计算用户说出的问题与所述问答数据存储单元中存储的每个问题之间的语义相似度，其中，所述语义相似度用于表示用户说出的问题与所述问答数据存储单元中存储的每个问题所表达的意思上的相似程度；以及分类单元，基于所述语义相似度计算单元所计算出的所述语义相似度，将用户说出的问题分类为在存储单元内的问题或者在存储单元外的问题。
2. 根据权利要求1的问答系统，还包括：置信度计算单元，基于语音识别单元输出的有关用户所说出的问题的识别结果，为用户所说出的问题计算置信度；其中，所述分类单元还能够基于所述置信度计算单元计算出的置信度，将用户所说出的问题分类为在存储单元内的问题或者在存储单元外的问题。
3. 根据权利要求1的问答系统，还包括：输出单元，如果用户所说出的问题被分类为在存储单元内的问题，则该输出单元能够输出与用户所说出的问题相应的在所述问答数据存储单元中所存储的问题对应的答案。
4. 根据权利要求1的问答系统，还包括：更新单元，如果用户所说出的问题被分类为在存储单元外的问题，则该更新单元基于所述在存储单元外的问题更新所述问答数据存储单元中存储的问题和/或更新所述语言模型。
5. 根据权利要求2的问答系统，其中所述置信度是通过将用户所说出的问题经由N元语言模型进行识别而得到的声学得分除以用户所说出的该问题经由音素网络进行识别而得到的声学得分来确定的。
6. 根据权利要求1的问答系统，其中，所述语义相似度计算单元包括：第一词袋产生部件，根据语音识别单元对于用户所说出的问题的识别结果，产生第一词袋，其中所述第一词袋包括该识别结果中所含的词；第一词选择部件，根据语音识别单元对于用户所说出的问题的识别结果，从所述第一词袋选择其概率大于第一阈值的词，其中所述概率能够由通过N元语言模型得到的声学得分来确定；第一检索部件，根据所述第一词选择部件所选择的词，从数据源检索文档；第二词袋产生部件，为所述问答数据存储单元中存储的每个问题产生相应的第二词袋，其中每个第二词袋包括所述问答数据存储单元中所存储的相应的问题所含的词；第二检索部件，基于每个第二词袋中的词，从数据源检索文档；以及语义相似度计算部件，基于第一检索部件所检索到的文档和第二检索部件所检索到的文档，计算用户所说出的问题与所述问答数据存储单元中存储的每个问题之间的语义相似度。
7. 根据权利要求6的问答系统，其中，所述语义相似度计算单元还包括：第一过滤部件，根据词性，从所述第一词选择部件自所述第一词袋所选择的词中过滤掉一部分词，和/或根据词性，从所述第二词袋中过滤掉一部分词；其中，所述第一检索部件针对过滤后的第一词袋进行检索，和/或第二检索部件针对过滤后的第二词袋进行检索。
8. 根据权利要求7的问答系统，其中，所述语义相似度计算单元还包括：领域词添加部件，向过滤后的第一词袋和/或过滤后的第二词袋添加与领域有关的词；其中，所述第一检索部件针对进行上述添加后的第一词袋进行检索，和/或第二检索部件针对进行上述添加后的第二词袋进行检索。
9. 根据权利要求6所述的问答系统，其中，所述语义相似度计算单元基于以下来进行语义相似度的计算：第一检索部件所检索到的文档和第二检索部件所检索到的文档中的每个词；和/或第一检索部件所检索到的文档和第二检索部件所检索到的文档之间的重合。
10. 根据权利要求1?9中的任一项的问答系统，还包括：文字相似度计算单元，根据语音识别单元对于用户说出的问题的识别结果，计算用户所说出的问题与所述问答数据存储单元中的每个问题之间的文字相似度，其中，所述文字相似度用于表示用户说出的问题与所述问答数据存储单元中存储的每个问题在文字上的相似程度；其中，所述分类单元还能够基于所述文字相似度计算单元所计算出的所述文字相似度，将用户所说出的问题分类为在存储单元内的问题或者在存储单元外的问题。
11. 根据权利要求10的问答系统，其中，所述文字相似度计算单元包括：第三词袋产生部件，根据语音识别单元对于用户所说出的问题的识别结果，产生第三词袋，其中所述第三词袋包括所述识别结果中所含的词；第四词袋产生部件，为所述问答数据存储单元中存储的每个问题产生相应的第四词袋，其中每个第四词袋包括所述问答数据存储单元中所存储的相应的问题所含的词；第二词选择部件，根据语音识别单元对于用户所说出的问题的识别结果，从所述第三词袋选择其概率大于第二阈值的词，其中所述概率能够由通过N元语言模型得到的声学得分来确定；以及文字相似度计算部件，根据所述第二词选择部件所选择的第三词袋中的词和所述第四词袋中的词，计算用户所说出的问题与所述问答数据存储单元中存储的每个问题之间的文字相似度。
12. 根据权利要求11的问答系统，其中，所述文字相似度计算单元还包括：第二过滤部件，根据词性，从所述第二词选择部件自所述第三词袋所选择的词中过滤掉一部分词，和/或根据词性，从所述第四词袋中过滤掉一部分词；其中，在第二过滤部件进行上述过滤后，所述文字相似度计算部件进行文字相似度的计算。
13. -种用于交互式语音系统的方法，该交互式语音系统包括语音识别单元和问答数据存储单元，在所述问答数据存储单元中相关联地存储了问题以及对应于所述问题的答案，所述方法包括：语音识别步骤，通过语音识别单元使用语言模型对于用户说出的问题进行语音识别；语义相似度计算步骤，根据语音识别单元对于用户说出的问题的识别结果，计算用户说出的问题与所述问答数据存储单元中存储的每个问题之间的语义相似度，其中，所述语义相似度用于表示用户说出的问题与所述问答数据存储单元中存储的每个问题所表达的意思上的相似程度；以及分类步骤，基于计算出的所述语义相似度，将用户说出的问题分类为在存储单元内的问题或者在存储单元外的问题。
14. 根据权利要求13的方法，还包括：置信度计算步骤，基于所述语音识别步骤中得到的有关用户所说出的问题的识别结果，为用户所说出的问题计算置信度；其中，在所述分类步骤中，还能够基于计算出的所述置信度，将用户所说出的问题分类为在存储单元内的问题或者在存储单元外的问题。
15. 根据权利要求13的方法，还包括：输出步骤，如果用户所说出的问题被分类为在存储单元内的问题，则输出与用户所说出的问题相应的在所述问答数据存储单元中所存储的问题对应的答案。
16. 根据权利要求13的方法，还包括：更新步骤，如果用户所说出的问题被分类为在存储单元外的问题，则基于所述在存储单元外的问题更新所述问答数据存储单元中存储的问题和/或更新所述语言模型。
17. 根据权利要求14的方法，其中所述置信度是通过将用户所说出的问题经由N元语言模型进行识别而得到的声学得分除以用户所说出的该问题经由音素网络进行识别而得到的声学得分来确定的。
18. 根据权利要求13的方法，其中，所述语义相似度计算步骤包括：第一词袋产生步骤，根据所述语音识别步骤中得到的对于用户所说出的问题的识别结果，产生第一词袋，其中所述第一词袋包括该识别结果中所含的词；第一词选择步骤，根据从所述语音识别步骤得到的对于用户所说出的问题的识别结果，从所述第一词袋选择其概率大于第三阈值的词，其中所述概率能够由通过N元语言模型得到的声学得分来确定；第一检索步骤，根据所述第一词选择步骤中所选择的词，从数据源检索文档；第二词袋产生步骤，为所述问答数据存储单元中存储的每个问题产生相应的第二词袋，其中每个第二词袋包括所述问答数据存储单元中所存储的相应的问题所含的词；第二检索步骤，基于每个第二词袋中的词，从数据源检索文档；以及语义相似度计算子步骤，基于第一检索部件所检索到的文档和第二检索部件所检索到的文档，计算用户所说出的问题与所述问答数据存储单元中存储的每个问题之间的语义相似度。
19. 根据权利要求18的方法，其中，所述语义相似度计算步骤还包括：第一过滤步骤，根据词性，从在所述第一词选择步骤中所选择的第一词袋的词中过滤掉一部分词，和/或根据词性，从所述第二词袋中过滤掉一部分词；其中，在所述第一检索步骤中针对过滤后的第一词袋进行检索，和/或在第二检索步骤中针对过滤后的第二词袋进行检索。
20. 根据权利要求19的方法，其中，所述语义相似度计算步骤还包括：领域词添加步骤，向过滤后的第一词袋和/或过滤后的第二词袋添加与领域有关的词；其中，在所述第一检索步骤中，针对进行上述添加后的第一词袋进行检索，和/或在所述第二检索步骤中，针对进行上述添加后的第二词袋进行检索。
21. 根据权利要求18所述的方法，其中，在所述语义相似度计算步骤中，基于以下来进行语义相似度的计算：在第一检索步骤中所检索到的文档和在第二检索步骤中所检索到的文档中的每个词；和/或在第一检索步骤中所检索到的文档和在第二检索步骤中所检索到的文档之间的重合。
22. 根据权利要求13?21中的任一项的方法，还包括：文字相似度计算步骤，根据从所述语音识别步骤得到的对于用户说出的问题的识别结果，计算用户所说出的问题与所述问答数据存储单元中的每个问题之间的文字相似度，其中，所述文字相似度用于表示用户说出的问题与所述问答数据存储单元中存储的每个问题在文字上的相似程度；其中，在所述分类步骤中，还能够基于所计算出的文字相似度，将用户所说出的问题分类为在存储单元内的问题或者在存储单元外的问题。
23. 根据权利要求22的方法，其中，所述文字相似度计算步骤包括：第三词袋产生步骤，根据从所述语音识别步骤得到的对于用户所说出的问题的识别结果，产生第三词袋，其中所述第三词袋包括该识别结果中所含的词；第四词袋产生步骤，为所述问答数据存储单元中存储的每个问题产生相应的第四词袋，其中每个第四词袋包括所述问答数据存储单元中所存储的相应的问题所含的词；第二词选择步骤，根据从所述语音识别步骤得到的对于用户所说出的问题的识别结果，从所述第三词袋选择其概率大于第四阈值的词，其中所述概率能够由通过N元语言模型得到的声学得分来确定；以及文字相似度计算子步骤，根据在所述第二词选择步骤中所选择的第三词袋中的词和所述第四词袋中的词，计算用户所说出的问题与所述问答数据存储单元中存储的每个问题之间的文字相似度。
24. 根据权利要求23的方法，其中，所述文字相似度计算步骤还包括：第二过滤步骤，根据词性，从所述第二词选择步骤中所选择的第三词袋的词中过滤掉一部分词，和/或根据词性，从所述第四词袋中过滤掉一部分词；其中，在进行了第二过滤步骤中的过滤之后，进行所述文字相似度计算子步骤中的文字相似度的计算。
【文档编号】G10L15/32GK104424290SQ201310390944
【公开日】2015年3月18日申请日期:2013年9月2日优先权日:2013年9月2日
【发明者】左祥, 金浩申请人:佳能株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：左祥;金浩;
技术所有人：佳能株式会社;
我是此专利的发明人

上一篇：一种智能电视的数字音频处理的系统及方法
上一篇：激活音检测方法和装置制造方法