基于人工智能的问答方法和装置与流程

文档序号:16532844发布日期:2019-01-05 10:54阅读:288来源:国知局
基于人工智能的问答方法和装置与流程

本发明涉及人工智能技术领域,尤其涉及一种基于人工智能的问答方法和装置。



背景技术:

人工智能(artificialintelligence),英文缩写为ai。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,目前,人工智能最重要的一个应用场景为基于人工智能的问答技术。其中,问答技术是指根据用户输入的提问文本,自动地返回合适的答案而不需要人为干预的技术。在当今的互联网和人工智能技术不断发展、持续为用户带来各种便利的同时,人们逐渐依赖于通过在线提问的方式获取需要的信息。如搜索引擎(百度、谷歌)、问答社区(百度知道、知乎)和问答app等。

相关技术中,根据用户输入的问题提供答案的方式主要包括两类:

第一类:依靠其他用户或专业人士手动编辑答案,例如医生回答医疗的提问,网友回答旅游攻略的提问等;这种方式由于每次用户提问都需要等待其他用户或专业人士发现提问、分析提问和编辑答案,因此可能出现等待时间过长、无响应等问题,同时,答案编辑者也可能会向平台索要一定的奖励,而为平台带来更多资源支出。

第二类:依靠信息检索的方式,将新的用户提问与数据库中其它之前的用户提问进行匹配,若匹配成功,则直接将匹配项中对应原有的答案返回给提问用户;但是,该方法完全依赖于数据库中是否存在相似的问答结果以及文本匹配技术是否足够成熟等因素,导致匹配失败的情况较为普遍。



技术实现要素:

本发明提供一种基于人工智能的问答方法和装置,以解决现有技术中,基于人工智能的问答服务在成本或者服务质量上具有较强的限制性的技术问题。

本发明第一实施例提供一种基于人工智能的问答方法,包括以下步骤:获取用户发送的目标问题,提取所述目标问题的第一特征向量;查询预设的问答信息库获取预存的与每个问题集合对应的第二特征向量,按照预设算法计算所述每个问题集合的第二特征向量与所述目标问题的第一特征向量之间的匹配度;将所有的匹配度分别与预设阈值比较,获取大于所述预设阈值的最大匹配度,并确定与所述最大匹配度对应的目标问题集合;查询所述问答信息库获取预存的与所述目标问题集合对应的答复文本片段,并将所述答复文本片段反馈给所述用户。

本发明第二实施例提供一种基于人工智能的问答装置,包括:提取模块,用于获取用户发送的目标问题,提取所述目标问题的第一特征向量;查询模块,用于查询预设的问答信息库获取预存的与每个问题集合对应的第二特征向量;匹配模块,用于按照预设算法计算所述每个问题集合的第二特征向量与所述目标问题的第一特征向量之间的匹配度;确定模块,用于将所有的匹配度分别与预设阈值比较,获取大于所述预设阈值的最大匹配度,并确定与所述最大匹配度对应的目标问题集合;所述查询模块,还用于查询所述问答信息库获取预存的与所述目标问题集合对应的答复文本片段;反馈模块,用于将所述答复文本片段反馈给所述用户。

本发明第三实施例提供一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时实现如前述实施例所述的基于人工智能的问答方法。

本发明第四实施例提供一种非临时性计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如前述实施例所述的基于人工智能的问答方法。

本发明实施例提供的技术方案可以包括以下有益效果:

预先对问答信息库中的问答进行基于文本片段的挖掘和学习,并基于学习结果将问答特性抽象为第二特征向量表示,该第二特征向量体现了原有答案共性,进而,基于目标问题的第一特征向量与第二特征向量匹配,为目标问题生成答案,其中,生成的答案根据文本片段粒度进行乱序匹配,增加了原有答案的灵活性和涵盖范围,智能化的根据用户输入的问题提供答案,有效扩展了问答技术可处理的问题范围和能力,有利于增加用户和产品的粘性。

本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

图1是根据本发明一个实施例的基于人工智能的问答方法的流程图;

图2是根据本发明一个实施例的第一特征向量的生成方法的流程图;

图3是根据本发明一个实施例的第二特征向量的生成方法的流程图;

图4是根据本发明另一个实施例的第一特征向量的生成方法的流程图;

图5是根据本发明另一个实施例的第二特征向量的生成方法的流程图;

图6是根据本发明另一个实施例的基于人工智能的问答方法的流程图;

图7-1是根据本发明一个实施例的基于人工智能的问答方法的应用场景示意图;

图7-2是根据本发明另一个实施例的基于人工智能的问答方法的应用场景示意图;以及

图8是根据本发明一个实施例的基于人工智能的问答装置的结构示意图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。

下面参考附图描述本发明实施例的基于人工智能的问答方法和装置。本发明实施例的基于人工智能的问答方法和装置的应用场景,可以为任意提供问答服务的应用程序中,比如,百度知道、知乎、豆瓣等,其中,上述应用程序提供问答服务的场景包括但不限于医疗问答、学习问答、美妆问答等。

正如背景技术所分析的,现有技术中问答技术提供问答服务时,一方面,依赖于人工提供回答的服务方式,导致服务效率较低,支出成本较高,另一方面,依赖于数据库提供回答的服务方式,依赖于数据库的完整性和便利性,显然这是难以实现的,由此现有技术中,解决用户提出问题的范围限制较强。

为了解决上述技术问题,本发明提出了一种智能化的问答服务方式,能够基于用户提出的问题,自动生成并生成合适的答案,增大了问答技术可以解决的用户提出问题的范围,具有较强的实用性。

图1是根据本发明一个实施例的基于人工智能的问答方法的流程图,如图1所示,该方法包括:

步骤101,获取用户发送的目标问题,提取目标问题的第一特征向量。

在实际执行过程中,获取用户发送的目标问题的方式根据用户输入的方式的不同而不同,比如,用户语音输入,则可以将用户输入的语音信息进行识别转换为文字形式的目标问题,又比如,用户文字输入,则可以将用户输入的文字信息进行清洗处理后生成目标问题等。

步骤102,查询预设的问答信息库获取预存的与每个问题集合对应的第二特征向量,按照预设算法计算每个问题集合的第二特征向量与目标问题的第一特征向量之间的匹配度。

可以理解,在本发明的一个实施例中,预先设置问答信息库,该问答信息库中包含了多种问题集合,其中,每个问题集合可以是根据问题的语义或者所述类别等统一特性来划分的,预先设置的问答信息库中,针对每个问题集合设置对应的特征向量,该特征向量对应于划分问题集合时的划分特性,基于该特征向量可以获知其在划分特性维度的具体特性。

具体地,提取目标问题的第一特征向量,进而,查询预设的问题信息库获取预存的与每个问题集合对应的第二特征向量,按照预设算法计算每个问题集合的第二特征向量与目标问题的第一特征向量之间的匹配度,以便于该匹配度确定当前目标问题与预先设置的哪个问题集合具有较大的相似性。

其中,需要强调的是,本发明实施例中到的第二特征向量对应于一个问题集合的特征,而不是单一的问题,反映了问题的共性,具有较强的稳定性和实用性。

应当理解的是,为了便于匹配,第一特征向量与第二特征向量是基于同样的特征维度的特征向量,比如,第二特征向量为在语义上的特征向量,则第一特征向量也为在语义上的特征向量。

需要说明的是,第一特征向量对应的特征维度的不同,提取目标问题的第一特征向量的方式不同,第一特征向量和第二特征性两两均可以包括一种特征向量或者多种特征向量,其中由于第一特征向量与第二特征向量的特征维度相同,为了描述的方便,对第一特征向量的确定方式进行描述时,对第二特征向量的获取方式进行描述,第一和第二特征向量的获取方式示例如下:

示例一:

在该示例中,特征向量对应的特征维度为语义特征。

具体而言,在本示例中,步骤101中的提取目标问题的第一特征向量包括如图2所示的以下步骤:

步骤201,根据预设的筛选条件对目标问题进行分词处理后提取目标关键词。

其中,目标关键词是能够体现目标问题语义的关键词。

作为一种可能的实现方式,预设的筛选条件为筛选出目标问题中能体现目标语义的目标问题中的动词和名词,从而,对目标问题进行分词处理后,去除停用词、虚词、数字等,提取出具有重要语义的名词和动词作为目标问题语义的关键词。

当然,在本发明的实施例中,为了提高对目标关键词的确定效率,还可以预先根据预设的筛选条件构建深度学习模型,将目标问题输入该肾虚学习模型,以该深度模型的输出作为目标关键词。

步骤202,根据目标关键词获取目标问题的第一语义特征向量。

具体地,为了表示出该目标问题在语义维度的特征,根据目标关键词获取目标问题的第一语义特征向量,其中,可以预先设置包含目标关键词和对应的语义特征向量的对应词表,通过获取的目标关键词查询该对应词表,获取到目标问题的第一语义特征向量。

在本实施例中,获取每个问题集合对应的第二特征向量的步骤,如下图3所示:

步骤301,根据预设的筛选条件对每个问题集合中各个问题进行分词处理,提取每个问题集合中关键词以及每个关键词对应的出现频率。

具体地,根据预设的筛选条件,对每个问题集合中的各个问题进行分词处理,比如,对多个问题进行去除停用词、虚词、数字等,保留具有重要语义的分词,进而,将具有语义的分词中确定为每个问题集合中能反应该问题集合共性的关键词,在本发明的一个实施例中,提取每个问题集合中的关键词以及每个关键词对应的出现频率,以便于根据该关键词的出现频率筛选出出现频率较高的关键词进一步分析出该问题集合中包含的问题的语义共性。

步骤302,根据每个问题集合中关键词以及每个关键词对应的出现频率获取每个问题集合的第二语义特征向量。

具体地,在本发明的实施例中,根据每个问题集合中关键词以及每个关键词对应的出现频率确定每个问题集合的第二语义特征向量,该第二语义特征向量反应了问题集合在语义层面的抽象的特征表示。

示例二:

在该示例中,第一特征向量对应的特征维度为科目类别。其中,在不同的应用场景中,科目类别可以包括医疗中的不同科室、教育中的不同学科等。

具体而言,在本示例中,步骤101中的提取目标问题的第一特征向量包括如图4所示的以下步骤:

步骤401,获取与目标问题的应用场景对应的科目类别信息。

不难理解的是,在不同的应用场景中,提供问答服务的科目类别不同,比如,在医疗诊断服务应用程序中,提供的问答服务的科目类别包括肛肠类、皮肤类、五官类等隶属于医疗诊断的相关科目类别,又比如,在百度知道等综合性问答服务应用程序中,提供的问答服务的科目类别显然包括医疗、教育、美妆等。

因而,获取与目标问题的应用场景对应的科目类别信息,确定目标问题在该应用场景下所属的科目类别。

步骤402,根据科目类别信息的分布向量获取目标问题的第一结构特征向量。

具体地,为了表示出该目标问题在科目类别维度的特征,根据目标关键词获取目标问题的第一结构特征向量,其中,可以预先设置包含目标关键词和对应的结构特征向量的对应词表,通过获取的目标关键词查询该对应词表,获取到目标问题的第一结构特征向量。

在本实施例中,获取每个问题集合对应的第二特征向量的步骤,如下图5所示:

步骤501,获取每个问题集合中各个问题的科目类别信息。

步骤502,根据问题集合中各个问题的科目类别信息的分布向量获取每个问题集合的第二结构特征向量。

具体地,在本实施例中,根据每个问题集合所属的科目类别进行结构化分类,按照其所属的科目类别进行分类,比如,对同属于医疗治疗场景中的所有问题,按照其所属的科室科目类进行结构化的分类,并且根据问题集合中各个问题的科目类别信息的分布向量获取每个问题集合的第二结构特征向量,该第二结构特征向量反映了该问题集合在所属的科目类别特性,基于该第二结构特征向量与第一特征向量的相似度,可以发现目标问题对应的所属科目类别,可有效生成针对目标问题的答案。

步骤103,将所有的匹配度分别与预设阈值比较,获取大于阈值的最大匹配度,并确定与最大匹配度对应的目标问题集合。

应当理解的是,目标问题最有可能属于哪一个问题集合,则目标问题对应的第一特征向量与该问题集合对应的第二特征向量则较为匹配,因而,在本发明的实施例中,为了确定目标问题所属的问题集合,以便于在根据该问题集合进一步确定针对该目标问题的答案,将第一特征向量与第二特征向量的匹配度与预设阈值比较,获取大于与预设阈值的最大匹配度,确定与最大匹配度对应的目标问题集合。

步骤104,查询问答信息库获取预存的与目标问题集合对应的答复文本片段,并将答复文本片段反馈给用户。

正如以上分析的,目标问题集合是与目标问题最为相似的问题所在集合,比如,目标问题为“肚子绞痛一直,怎么回事”,则确定出的目标问题集合均是针对肚子绞痛类的问题所在集合,因而,查存的与目标问题对应的答复文本片段即可作为当前目标问题的答复文本片段反馈给客户。

由此,本发明实施的基于人工智能的问答方法,一方面,不需要针对当前目标问题实时去编辑或者匹配出答案,而是确定该问题所属的最相似的问题集合,根据该问题集合对应的答案作为该目标问题的答案提供给用户,由此,提高了问题回答的效率,且基于原有的问题集合进行回答的确定,没有增加回答成本。另一方面,充分对原有的问题和回答进行梳理,以原有的问题和回答作为问答服务的数据源,由于原有的问答代表了用户常用的问答形式,且通过对相似问题进行归类为问题集合,挖掘了应用场景中用户问答的共性,且基于目标问题和问题集合抽象为特征向量,以确定目标问题所属的为目标问题集合,削弱了目标问题的特异性的影响,确保了对用户提供的目标问题确定所属问题集合类别时的可确定性,因而,保证了问答服务的质量。又一方面,基于原有的问题的回答的答复文本片段作为回答的数据源,可以根据当前目标问题所属的目标问题集合中对应的答复文本片段构造答案,即基于原有的回答拆分为更小粒度的答复文本片段,由答复文本片段组合出当前目标问题的答案,使得问答服务中提供的回答不再局限于原有的答案,平衡了形式多变的目标问题与数据库中固定的答案之间的矛盾,扩展了用户提问的处理能力。

基于以上描述,不难理解的是,能够确保本发明实施例中基于人工智能的问答方法的可扩展性的核心为问题集合与对应的答复文本片段的构建过程,在实际应用中,问题集合与对应的答复文本片段的构建方式有多种,下面以一种可能的实现方式为例进行该过程的描述,以帮助本领域的技术人员更加清楚的了解本发明。

在本发明的一个实施例中,在查询问答信息库获取预存的与目标问题集合对应的答复文本片段之前,如图6所示,该方法包括:

步骤601,按照预设的切分策略对问答信息库中的每个答案进行文本切分处理生成多个文本片段,对相邻的多个文本片段进行组合生成多个片段数量大于预设门限值的候选文本片段。

具体地,基于文本片段粒度挖掘包含大量问答信息的问答信息库中的每个答案,由于答案实际上是由多个文本片段组成的,因而,基于文本片段进行答案的挖掘,无论是对当前答案的学习还是对答案的自动生成都具有重要意义。在本实施例中,按照预设的切分策略对问答信息库中的每个答案进行文本切分处理生成多个文本片段,对相邻的多个文本片段进行组合生成多个片段数量大于预设门限值的候选文本片段,其中,为了避免由于候选文本片段包含的文本片段数量较少而导致候选文本片段没有明确的语义,限定该文本片段的数量大于预设门限值,其中,该预设门限值是根据大量实验数据标定的,当文本片段的数量大于预设门限值时,对应的候选文本片段具有明确的语义。

其中,根据预设的切分策略用以确保切分出的文本片段可以表征相关语义,而不是没有意义的字符组成,作为一种可能的实现方式,该预设的切分策略为根据答案的停顿的标点符号(比如逗号、分号、句号、问号和叹号等)进行文本片段的切分。

步骤602,按照预设的筛选策略对候选文本片段进行过滤获取满足条件的多个目标文本片段,并从问答信息库中获取每个目标文本片段与对应问题的映射关系。

需要说明的是,根据大量答案切分出的文本片段组成的候选文本片段中,有些候选文本片段体现了答案之间的特异性,有些候选文本片段体现了答案之间的共性,在本发明的实施例中,显然需要挖掘答案之间的共性,因而,按照预设的筛选策略对候选文本片段进行过滤获取满足条件的多个目标文本片段,即确定出能体现多个答案之间共性的多个目标文本片段。

其中,根据应用场景的不同,确定能体现多个答案之间的共性的多个目标文本片段的预设的筛选策略不同,作为一种可能的实现方式,计算每个候选文本片段出现的概率,由于每个候选文本片段的出现频率越高,则显然其越能体现多个答案之间的共性,因而,根据候选文本片段的出现频率过滤掉小于预设频率门限的候选文本片段,其中,预设频率门限根据应用场景的需要设置,预设频率门限越高,则被过滤的候选文片段越多,得到的目标文本片段越是能体现答案之间的共性,预设频率门限越低,则被过滤的候选文片段越少,得到的目标文本片段对问题的覆盖率越强。

作为另一种可能的实现方式,检测各个候选文本片段之间的包含关系,则为了能够确保目标文本片段更能够体现多个答案之间的共性,检测各个候选文本片段之间的包含关系,过滤掉被包含在其他候选文本片段中的候选文本片段。比如,候选文本片段abcdf(其中每个字母代表一个文本片段),包含于候选文本片段abcdfh(其中每个字母代表一个文本片段),则过滤到候选文本片段abcdf,以更能体现多个答案之间的共性的候选文本片段abcdfh作为目标文本片段,且该目标文本片段除了能够体现答案之间的共性,还能够更加全面的对应的问题。

进一步地,为了便于后续提供基于目标问题的答案提供服务,从问答信息库中,获取每个目标文本片段与对应问题的映射关系,以将每个问题与对应的目标文本片段联系起来。

步骤603,按照预设算法对多个目标文本片段进行聚类处理获取多个目标文本片段集合,根据映射关系生成与每个目标文本片段集合对应的问题集合。

可以理解的是,很多问题的答案具有相似性,因而,为了进一步挖掘答案之间的共性,按照预设算法对对多个目标文本片段进行聚类处理获取多个目标文本片段集合,根据映射关系生成与每个目标文本片段集合对应的问题集合。比如,计算每个目标文本片段之间的特征向量,根据特征向量的匹配度对多个目标文本片段进行聚类处理获取多个目标文本片段集合,进而根据每个目标文本片段所属的问题生成与每个目标文本片段集合对应的问题集合。

步骤604,从每个目标文本片段集合中选择最长目标文本片段,将最长目标文本片段存储为对应问题集合的答复文本片段。

具体地,在实际应用中,确定的多个目标文本片段可能语义比较相似,比如,目标文本片段abd和bdef由于含有多个相似的文本片段db,从而目标文本片段abd和bdef(其中每个字母代表一个文本片段)比较相似,为了从语义相似的答案中确定出最全面的答案,从每个目标文本片段集合中选择最长目标文本片段,将最长目标文本片段存储为对应问题集合的答复文本片段。

为了更加使得本领域的技术人员对本发明实施例的基于人工智能的问答方法更加清楚,下面结合具体的应用场景进行举例,在该场景下,第二特征向量和第一特征向量对应于语义特征维度的向量和结构特征维度的向量,说明如下:

首先,参照图7-1,对问答信息库中每个答案a(包括a1,a2,…an)按照预设的切分策略进行文本切分处理,切分为多个文本片段{a,b,c,…},需要理解的是,此处的文本片段是一个字符串而不是单独的一个字符,进而,基于拆分的文本片段进行组合,构建由n(对应于上述预设门限值)个文本片段组成的多个候选文本片段n-gram,为了保证候选文本片段n-gram具有明确语义,在本示例中,n为大于等于3的正整数,进而,多个候选文本片段n-gram组成了一个庞大的列表。

继续参照图7-1,按照预设的筛选策略对多个候选文本片段n-gram进行过滤获取满足条件的多个目标文本片段n-gram,具体而言,计算每个候选文本片段的出现频率,根据所有候选文本片段的出现频率过滤掉小于预设频率门限的候选文本片段,比如图7-1中,候选文本片段abd出现5次,abde出现2次等,将出现次数小于3次(对应于上述预设频率门限)的候选文本片段过滤掉,将大于等于三次的候选文本片段作为目标文本片段保留,比如,图7-1中的候选文本片段abde和abdef均被过滤掉,在过滤掉出现频次较低的候选文本片段后,在本实施例中,检测各个候选文本片段之间的包含关系,过滤掉被包含在其他候选文本片段中的候选文本片段,例如图7-1中的候选文本片段bde完全包含于候选文本片段bdef则过滤掉候选文本片段bde,将候选文本片段bdef作为目标文本片段保留。在筛选出目标文本片段n-gram中,同时从问答信息库中获取每个目标文本片段与对应问题的映射关系,此时新的问答对中,虽然每个目标文本片段不再是初始的答案,但是问题仍是原有的问题。

由于生成的新的问答对中,存在很多答案类似的情况,例如图7-1中最后输出的目标文本片段n-gram中abd和bdef就有重叠的部分,导致二者的相似度很高,因而,为了减少不同的目标文本片段n-gram中的重叠,按照预设算法对多个目标文本片段进行聚类,即提取每个目标文本片段n-gram提取tf-idf特征,形成特征向量表示,继而根据k-means或dbscan算法对个目标文本片段进行聚类处理获取,并选择每个聚类中最长的目标文本片段n-gram作为该聚类下的答复文本片段a*,每个聚类由一个问题集合lq={q1,q2,…}对应,lq中的每个问题可由对应的答复文本片段a*作为答案。

其中,为了便于后续答案的提供,针对问题集合lq中多个问题进行第二特征向量的提取,针对每个问题集合lq可对应得到一个关键词词表{w1:f1,w2:f2,…},其中,w和f分别表示每个问题的关键词和该关键词在问题中出现的频次,基于该关键词词表,可以提取每个问题集合lq的第二语义特征向量tf-idf,记作ftf-idf。

进而,在本发明的实施例中,在获取每个问题集合在在语义层面的抽象表示后,获取每个问题结合在结构层面的抽象表示,通过统计每个问题集合lq中的问题所属的科目类别确定问题结合的第二结构特征向量fstruct。

由此,如图7-2所示,在接收到用户输入的目标问题b后,抽取该目标问题b的第一语义特征向量htf-idf和第一结构特征向量hstruct,按照如下公式(1)计算每个第二语义特征向量和第二结构特征向量与第一语义特征向量和第一结构特征向量的匹配度score:

其中,公式(1)中α(0≤α≤1)表示用以平衡语义特征向量和结构特征向量之间的参数,||htf-idf||和||htf-idf||表示第二语义特征向量和第一语义特征向量之间的二范数值。

进而,将匹配度score最大值对应的问题集合对应的答复文本片段a*作为答复文本反馈给客户。

综上,本发明实施例的基于人工智能的问答方法,预先对问答信息库中的问答进行基于文本片段的挖掘和学习,并基于学习结果将问答特性抽象为第二特征向量表示,该第二特征向量体现了原有答案共性,进而,基于目标问题的第一特征向量与第二特征向量匹配,为目标问题生成答案,其中,生成的答案根据文本片段粒度进行乱序匹配,增加了原有答案的灵活性和涵盖范围,智能化的根据用户输入的问题提供答案,有效扩展了问答技术可处理的问题范围和能力,有利于增加用户和产品的粘性。

为了实现上述实施例,本发明还提出了一种基于人工智能的问答装置,图8是根据本发明一个实施例的基于人工智能的问答装置的结构示意图,如图8所示,该装置包括:提取模块110、查询模块120、匹配模块130、确定模块140和反馈模块150。

其中,提取模块110,用于获取用户发送的目标问题,提取目标问题的第一特征向量。

查询模块120,用于查询预设的问答信息库获取预存的与每个问题集合对应的第二特征向量。

匹配模块130,用于按照预设算法计算每个问题集合的第二特征向量与目标问题的第一特征向量之间的匹配度。

确定模块140,用于将所有的匹配度分别与预设阈值比较,获取大于预设阈值的最大匹配度,并确定与最大匹配度对应的目标问题集合。

查询模块120,还用于查询问答信息库获取预存的与目标问题集合对应的答复文本片段。

反馈模块150,用于将答复文本片段反馈给用户。

需要说明的是,前述对基于人工智能的问答方法实施例的解释说明也适用于该实施例的基于人工智能的问答装置,此处不再赘述。

综上,本发明实施例的基于人工智能的问答装置,预先对问答信息库中的问答进行基于文本片段的挖掘和学习,并基于学习结果将问答特性抽象为第二特征向量表示,该第二特征向量体现了原有答案共性,进而,基于目标问题的第一特征向量与第二特征向量匹配,为目标问题生成答案,其中,生成的答案根据文本片段粒度进行乱序匹配,增加了原有答案的灵活性和涵盖范围,智能化的根据用户输入的问题提供答案,有效扩展了问答技术可处理的问题范围和能力,有利于增加用户和产品的粘性。

为了实现上述实施例,本发明还提出一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行上述实施例示出的基于人工智能的问答方法。

为了实现上述实施例,本发明还提出一种非临时性计算机可读存储介质,当所述存储介质中的指令由处理器被执行时,使得能够执行上述实施例示出的基于人工智能的问答方法。

在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。

在本发明中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1