一种基于问题分类获取答案的方法、装置及电子设备与流程

文档序号：17762976发布日期：2019-05-24 21:52阅读：113来源：国知局

本发明涉及通信技术领域，尤其涉及一种基于问题分类获取答案的方法、装置及电子设备。

背景技术：

在问答系统(questionanswer，qa)中，用户输入自然语言形式的问题，问答系统输出该问题的答案。现有技术中根据问题本身包含的信息，在问答系统中获取该问题的答案。用户提出的问题，可以根据问题分为多种类型，例如，“消防车为什么是红色的”，“国庆节是几月几日”这类答案一致的事实类问题，或者，“怎么看待中国近几年的发展”，“好莱坞电影怎么样”这类答案不固定的回答人有自己的观点和想法的观点类问题，或者，“比萨斜塔在哪个城市”这类地点类问题，但是在问答系统中获取问题的答案时，只是根据问题本身包含的信息，即问题本身的文字去获取答案，获取问题的信息量单一，会导致获取答案正确率不高。

综上所述，如何对用户提出的问题进行处理才能提高获取答案的正确率是目前需要解决的问题。

技术实现要素：

有鉴于此，本发明提供了一种基于问题分类获取答案的方法、装置及电子设备，用于解决现有技术中如何对用户提出的问题进行处理才能提高获取答案的正确率是目前需要解决的问题。

根据本发明实施例的第一个方面，提供了一种基于问题分类获取答案的方法，包括：获取问题的文本信息；根据预先设置的至少一个分类模型将所述文本信息进行分类；确定至少一个分类标签；根据所述文本信息与所述至少一个分类标签获取所述文本信息的答案。

在一个实施例中，若所述分类模型为第一模型，所述根据预先设置的至少一个分类模型将所述文本信息进行分类，具体包括：根据所述第一模型将所述文本信息分类为事实类或观点类；所述确定至少一个分类标签，具体包括：确定分类标签为事实类标签或者观点类标签。

在一个实施例中，若所述分类模型为第二模型，所述根据预先设置的至少一个分类模型将所述文本信息进行分类，具体包括：根据所述第二模型将所述文本信息分类为位置类、人名类、时间类、选择类、数字类、描述类、方法类、原因类或是否类；所述确定至少一个分类标签，具体包括：确定分类标签为位置类、人名类、时间类、选择类、数字类、描述类、方法类、原因类或是否类。

在一个实施例中，所述根据预先设置的至少一个分类模型将所述文本信息进行分类，具体包括：根据预先设置的多个分类模型将所述文本信息进行分类；所述确定至少一个分类标签，具体包括：确定多个分类标签。

在一个实施例中，所述根据预先设置的多个分类模型将所述文本信息进行分类，具体包括：根据所述第一模型将所述文本信息分类为事实类或观点类，和根据所述第二模型将所述文本信息分类为位置类、人名类、时间类、选择类、数字类、描述类、方法类、原因类或是否类；所述确定多个分类标签，具体包括：确定分类标签为事实类标签或者观点类标签，和确定分类标签为位置类、人名类、时间类、选择类、数字类、描述类、方法类、原因类或是否类。

在一个实施例中，述分类模型为支持向量机模型、最大熵模型或者神经网络分类模型。

在一个实施例中，所述根据所述文本信息与所述至少一个分类标签获取所述文本信息的答案，具体包括：将所述文本信息与所述至少一个分类标签与预先设置的携带至少一个标签的答案进行匹配，获取所述文本信息的答案。

根据本发明实施例的第二个方面，提供了一种基于问题分类获取答案的装置，包括：接收单元，用于获取问题的文本信息；分类单元，用于根据预先设置的至少一个分类模型将所述文本信息进行分类；确定单元，用于确定至少一个分类标签；获取单元，用于根据所述文本信息与所述至少一个分类标签获取所述文本信息的答案。

在一个实施例中，若所述分类模型为第一模型，所述分类单元具体用于：根据所述第一模型将所述文本信息分类为事实类或观点类；所述确定单元具体用于：确定分类标签为事实类标签或者观点类标签。

在一个实施例中，若所述分类模型为第二模型，所述分类单元具体用于：根据所述第二模型将所述文本信息分类为位置类、人名类、时间类、选择类、数字类、描述类、方法类、原因类或是否类；所述确定单元具体用于：确定分类标签为位置类、人名类、时间类、选择类、数字类、描述类、方法类、原因类或是否类。

在一个实施例中，所述分类单元具体用于：根据预先设置的多个分类模型将所述文本信息进行分类；根据所述确定单元具体用于：确定多个分类标签。

在一个实施例中，所述分类单元具体用于：根据所述第一模型将所述文本信息分类为事实类或观点类，和根据所述第二模型将所述文本信息分类为位置类、人名类、时间类、选择类、数字类、描述类、方法类、原因类或是否类；所述确定单元具体用于：确定分类标签为事实类标签或者观点类标签，和确定分类标签为位置类、人名类、时间类、选择类、数字类、描述类、方法类、原因类或是否类。

在一个实施例中，所述分类模型为支持向量机模型、最大熵模型或者神经网络分类模型。

在一个实施例中，所述获取单元具体用于：将所述文本信息与所述至少一个分类标签与预先设置的携带至少一个标签的答案进行匹配，获取所述文本信息的答案。

根据本发明实施例的第三个方面，提供了一种电子设备，包括存储器和处理器，所述存储器用于存储一条或多条计算机程序指令，其中，所述一条或多条计算机程序指令被所述处理器执行以实现如第一方面或第一方面任一种可能所述的方法。

根据本发明实施例的第四个方面，提供了一种计算机可读存储介质，其上存储计算机程序指令，其特征在于，所述计算机程序指令在被处理器执行时实现如第一方面或第一方面任一种可能所述的方法。

本发明实施例的有益效果包括：首先获取问题的文本信息，然后根据预先设置的至少一个分类模型将所述文本信息进行分类，确定至少一个分类标签，最后根据所述文本信息与所述至少一个分类标签获取所述文本信息的答案。通过本发明实施例，为用户提出的问题增加分类标签，增加了获取答案时使用的数据信息，提高获取答案的准确性。

附图说明

通过以下参照附图对本发明实施例的描述，本发明的上述以及其它目的、特征和优点将更为清楚，在附图中：

图1是本发明实施例提供的一种基于问题分类获取答案的方法流程图；

图2是本发明实施例提供的另一种基于问题分类获取答案的方法流程图；

图3是本发明实施例提供的一种基于问题分类获取答案的装置示意图；

图4是本发明实施例提供的一种电子设备结构示意图。

具体实施方式

以下基于实施例对本发明进行描述，但是本发明并不仅仅限于这些实施例。在下文对本发明的细节描述中，详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本申请。此外，本领域普通技术人员应当理解，在此提供的附图都是为了说明的目的。

除非上下文明确要求，否则整个说明书和权利要求书中的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义；也就是说，是“包括但不限于”的含义。

在本发明的描述中，需要理解的是，术语“第一”、“第二”等仅用于描述目的，不代表顺序，也不能理解为指示或暗示相对重要性。此外，在本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上。

本发明提供的一种基于问题分类获取答案的方法，具体如图1所示，包括：

步骤s100、获取问题的文本信息。

举例说明，所述文本信息可以是“消防车为什么是红色的”，“国庆节是几月几日”，“怎么看待中国近几年的发展”，“好莱坞电影怎么样”，“比萨斜塔在哪个城市”等，本发明实施例对其他问题的文本信息不做限定。

步骤s101、根据预先设置的至少一个分类模型将所述文本信息进行分类。

具体的，所述分类模型为支持向量机(supportvectormachine，svm)模型、最大熵模型或者神经网络分类模型。所述分类模型根据问题的文本信息确定的，根据不同的文本信息可以确定不同的分类模型。

若所述分类模型为第一模型，根据所述第一模型将所述文本信息分类为事实类或观点类，例如：接收的问题为“消防车为什么是红色的”，“国庆节是几月几日”，“怎么看待中国近几年的发展”，“好莱坞电影怎么样”，通过第一模型将“消防车为什么是红色的”，“国庆节是几月几日”这类答案一致的确定为事实类问题，将“怎么看待中国近几年的发展”，“好莱坞电影怎么样”这类答案不固定的回答人有自己的观点和想法的确定为观点类问题。

若所述分类模型为第二模型，根据所述第二模型将所述文本信息分类为位置类、人名类、时间类、选择类、数字类、描述类、方法类、原因类或是否类，其中，上述where类问题，用于提问位置在哪里，答案是位置，例如“比萨斜塔在哪个城市”；who类问题，用于提问人名，答案是一个人名，例如“国歌的作词者是谁”；when类问题，用于提问时间，答案是一个或几个时间点，例如“天安门几点升旗”；which类问题：用于选择实体，答案是选择实体之一，例如“小明和小红谁是某本书的作者”；how_many类问题，用于提问数字类问题，例如规格，尺寸的问题，例如“a4纸的长度是多少厘米”，其他类问题本发明实施例中不再赘述。假设问题为“保定属于哪个省”“苹果7手机的屏幕是几寸”，根据上述九类分类模型，将“保定属于哪个省”确定为位置类问题，将“苹果7手机的屏幕是几寸”确定为数字类问题。

本发明实施例中，问题类型根据具体情况划分，例如根据问题是中文问题还是外文问题等，具体根据实际情况确定，本发明实施例对其不做限定。

步骤s102、确定至少一个分类标签。

具体的，若分类模型为第一模型，确定分类标签为事实类标签或者观点类标签。若分类模型为第二模型，确定分类标签为位置类、人名类、时间类、选择类、数字类、描述类、方法类、原因类或是否类。

步骤s103、根据所述文本信息与所述至少一个分类标签获取所述文本信息的答案。

具体的，将所述文本信息与所述至少一个分类标签与预先设置的携带至少一个标签的答案进行匹配，获取所述文本信息的答案。

本发明实施例中，首先获取问题的文本信息，然后根据预先设置的至少一个分类模型将所述文本信息进行分类，确定至少一个分类标签，最后根据所述文本信息与所述至少一个分类标签获取所述文本信息的答案。通过本发明实施例，为用户提出的问题增加分类标签，增加了获取答案时使用的数据信息，提高获取答案的准确性。

可选的，在步骤s100之前，该方法还包括：训练所述至少一个分类模型。具体的，所述分类模型的训练过程为：在日志记录中获取历史问题的文本信息；将所述历史问题的文本信息按照设定条件进行分类；根据分类后的问题，按照设定算法，确定所述分类模型，其中，所述设定算法可以为支持向量机算法、最大熵算法或者神经网络分类算法，确定出的分类模型为支持向量机模型、最大熵模型或者神经网络分类模型，本发明对其不做限定。

本发明实施例中，步骤s101包括：根据预先设置的多个分类模型将所述文本信息进行分类，具体的，根据所述第一模型将所述文本信息分类为事实类或观点类，和根据所述第二模型将所述文本信息分类为位置类、人名类、时间类、选择类、数字类、描述类、方法类、原因类或是否类，即针对一个问题的文本信息可以分类为事实类或观点类，同时该问题的文本信息也可以分类为位置类、人名类、时间类、选择类、数字类、描述类、方法类、原因类或是否类，或者该问题的文本信息还可以同时分为其他类，本发明对其不做限定。

本发明实施例中，步骤s102包括：确定多个分类标签，具体的，确定分类标签为事实类标签或者观点类标签，和确定分类标签为位置类、人名类、时间类、选择类、数字类、描述类、方法类、原因类或是否类。即针对一个问题的文本信息确定该文本信息的标签为事实类标签或者观点类标签，同时该文本信息的标签为位置类、人名类、时间类、选择类、数字类、描述类、方法类、原因类或是否类，或者该问题文本信息的标签还可以是其他标签，本发明对其不做限定。

下面通过一个具体实施例，对发明实施例提供的一种基于问题分类获取答案的方法进行详细的说明，具体流程如下：

步骤s200、获取日志记录。

步骤s201、根据日志记录训练两个分类模型。

其中，所述分类模型为第一模型以及第二模型。

步骤s202、获取问题的文本信息。

步骤s203、根据预先设置的两个分类模型将所述文本信息进行分类。

步骤s204、根据所述第一模型以及第二模型确定两个分类标签。

步骤s205、根据所述文本信息与所述两个分类标签获取所述文本信息的答案。

图3是本发明实施例提供的一种基于问题分类获取答案的装置示意图。如图3所示，本实施例的问题分类的装置包括：接收单元31、分类单元32、确定单元33和获取单元34。其中，所述接收单元31，用于获取问题的文本信息；分类单元32，用于根据预先设置的至少一个分类模型将所述文本信息进行分类；确定单元33，用于确定至少一个分类标签；获取单元34，用于根据所述文本信息与所述至少一个分类标签获取所述文本信息的答案。

在一个实施例中，所述分类单元具体用于：根据预先设置的多个分类模型将所述文本信息进行分类；根据所述确定单元具体用于：确定多个分类标签。

在一个实施例中，所述分类模型为支持向量机模型、最大熵模型或者神经网络分类模型。

图4是本发明实施例的电子设备的示意图。图4所示的电子设备为基于问题分类获取答案的装置，其包括通用的计算机硬件结构，其至少包括处理器41和存储器42。处理器41和存储器42通过总线43连接。存储器42适于存储处理器41可执行的指令或程序。处理器41可以是独立的微处理器，也可以是一个或者多个微处理器集合。由此，处理器41通过执行存储器42所存储的指令，从而执行如上所述的本发明实施例的方法流程实现对于数据的处理和对于其它装置的控制。总线43将上述多个组件连接在一起，同时将上述组件连接到显示控制器44和显示装置以及输入/输出(i/o)装置45。输入/输出(i/o)装置45可以是鼠标、键盘、调制解调器、网络接口、触控输入装置、体感输入装置、打印机以及本领域公知的其他装置。典型地，输入/输出装置45通过输入/输出(i/o)控制器46与系统相连。

如本领域技术人员将意识到的，本发明实施例的各个方面可以被实现为系统、方法或计算机程序产品。因此，本发明实施例的各个方面可以采取如下形式：完全硬件实施方式、完全软件实施方式(包括固件、常驻软件、微代码等)或者在本文中通常可以都称为“电路”、“模块”或“系统”的将软件方面与硬件方面相结合的实施方式。此外，本发明实施例的各个方面可以采取如下形式：在一个或多个计算机可读介质中实现的计算机程序产品，计算机可读介质具有在其上实现的计算机可读程序代码。

可以利用一个或多个计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或计算机可读存储介质。计算机可读存储介质可以是如(但不限于)电子的、磁的、光学的、电磁的、红外的或半导体系统、设备或装置，或者前述的任意适当的组合。计算机可读存储介质的更具体的示例(非穷尽列举)将包括以下各项：具有一根或多根电线的电气连接、便携式计算机软盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或闪速存储器)、光纤、便携式光盘只读存储器(cd-rom)、光存储装置、磁存储装置或前述的任意适当的组合。在本发明实施例的上下文中，计算机可读存储介质可以为能够包含或存储由指令执行系统、设备或装置使用的程序或结合指令执行系统、设备或装置使用的程序的任意有形介质。

计算机可读信号介质可以包括传播的数据信号，所述传播的数据信号具有在其中如在基带中或作为载波的一部分实现的计算机可读程序代码。这样的传播的信号可以采用多种形式中的任何形式，包括但不限于：电磁的、光学的或其任何适当的组合。计算机可读信号介质可以是以下任意计算机可读介质：不是计算机可读存储介质，并且可以对由指令执行系统、设备或装置使用的或结合指令执行系统、设备或装置使用的程序进行通信、传播或传输。

可以使用包括但不限于无线、有线、光纤电缆、rf等或前述的任意适当组合的任意合适的介质来传送实现在计算机可读介质上的程序代码。

用于执行针对本发明实施例各方面的操作的计算机程序代码可以以一种或多种编程语言的任意组合来编写，所述编程语言包括：面向对象的编程语言如java、smalltalk、c++等；以及常规过程编程语言如“c”编程语言或类似的编程语言。程序代码可以作为独立软件包完全地在用户计算机上、部分地在用户计算机上执行；部分地在用户计算机上且部分地在远程计算机上执行；或者完全地在远程计算机或服务器上执行。在后一种情况下，可以将远程计算机通过包括局域网(lan)或广域网(wan)的任意类型的网络连接至用户计算机，或者可以与外部计算机进行连接(例如通过使用因特网服务供应商的因特网)。

上述根据本发明实施例的方法、设备(系统)和计算机程序产品的流程图图例和/或框图描述了本发明实施例的各个方面。将要理解的是，流程图图例和/或框图的每个块以及流程图图例和/或框图中的块的组合可以由计算机程序指令来实现。这些计算机程序指令可以被提供至通用计算机、专用计算机或其它可编程数据处理设备的处理器，以产生机器，使得(经由计算机或其它可编程数据处理设备的处理器执行的)指令创建用于实现流程图和/或框图块或块中指定的功能/动作的装置。

还可以将这些计算机程序指令存储在可以指导计算机、其它可编程数据处理设备或其它装置以特定方式运行的计算机可读介质中，使得在计算机可读介质中存储的指令产生包括实现在流程图和/或框图块或块中指定的功能/动作的指令的制品。

计算机程序指令还可以被加载至计算机、其它可编程数据处理设备或其它装置上，以使在计算机、其它可编程设备或其它装置上执行一系列可操作步骤来产生计算机实现的过程，使得在计算机或其它可编程设备上执行的指令提供用于实现在流程图和/或框图块或块中指定的功能/动作的过程。

以上所述仅为本发明的优选实施例，并不用于限制本发明，对于本领域技术人员而言，本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：岳聪;孔心宇
技术所有人：出门问问信息科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。