一种基于移动终端的智能问答交互系统及方法

文档序号:6402585阅读:296来源:国知局
专利名称:一种基于移动终端的智能问答交互系统及方法
技术领域
本发明涉及信息检索与查询领域,尤其涉及一种基于移动终端的智能问答交互系统及方法。
背景技术
在移动互联网时代,手机、平板电脑等移动终端,已成为人们重要的信息获取工具。利用手机等移动终端查询信息主要通过两种方式:一是通过在搜索引擎中输入关键字的方式,得到网页搜索结果,然后从网址结果列表里筛选自己想要的信息;二是通过垂直领域查询方式,即通过登录相关网站,或通过安装不同的应用软件,来查询相应的信息。在实际应用中,上述两种传统信息查询方式,各有不足:搜索引擎:1、搜索引擎对网页信息进行定期检索,实时性较差;2、搜索结果为网页地址,需对信息进行筛选,耗费时间;3、关键字内容主要靠键盘等外设逐字输入,输入方
式单一。垂直领域查询:1、信息面狭窄,网站及软件所提供的信息单一,不能进行综合查询;2、输入方式以文本为主,部分使用群体受限。随着人们对快速、准确地获取信息的需求不断增加,基于人工智能和自然语言处理领域的问答系统,逐渐兴起。问答系统(Question answering)是信息检索系统的一种高级形式。它能让用户用自然语言提问(完整而口语化的问句),并为用户返回一个简洁、准确的答案。使用户不需要依靠关键字匹配的搜索引擎,通过一一筛选搜索结果,来获取所需信息;同时通过自设知识库或提供外部数据接口,来进行综合信息查询,具有方便、快捷、高效等特点。目前,问答系统在手机等移动终端的应用方面,主要有语音助手(如虫洞语音助手)和聊天机器人,其虽然与传统的查询方式相比具有突出的优点,但在识别的准确度、回答的正确性和内容的个性化方面还存在不足;在实时数据、结果展示、模态输入、信息支持等实用性方面也还有很大的改进空间。有鉴于此,有必要对现有的问答系统予以改进,以解决上述问题。

发明内容
本发明的目的在于针对现有技术的不足,提供一种基于移动终端的智能问答交互系统及方法,提高其识别的准确度和回答的正确性,并增强其内容的个性化和系统的实用性。为实现上述目的,本发明提供了一种基于移动终端的智能问答交互系统,包括:输入模块,用于输入用户语音、文本及操作指令提问信息,采集用户参数信息,并将用户提问信息及用户参数信息全部转换为标准的文本格式信息;去噪模块,用于对文本格式信息,进行去噪和模块结构化处理;语义解析模块,用于对去噪和模块化处理的用户提问信息进行语义解析;
信息处理模块,用于对解析信息进行验证、初步封装以及数据处理,生成原始结果数据;输出模块,用于把该信息处理模块传过来的原始结果数据,进行二次封装和格式化,并将处理完的结果分发给调用服务器,输出检索结果。进一步,该输入模块,包括:语音输入模块,用于用户语音信息输入;文本输入模块,用于用户文本信息输入;操作输入模块,用于用户操作指令输入;参数采集模块,用于采集用户的各种参数信息;文本转换模块,用于将用户提问信息及用户参数信息转换为文本格式信息。进一步,该语义解析模块,包括:分词模块,用于建立一套基于现代汉语的语句、句法的分词算法模型,利用大量基础词汇数据,采用最小颗粒分词算法对用户输入的自然语言和指令进行分词;权重分配模块,用于分词之后,对用户的语境、上下文、偏好及各项参数,进行关键字和意图的初次组合和权重分配,解析出关键字;结构化组合模块,用于对解析出的关键字进行结构化组合,得到解析结果。进一步,该信息处理模块,包括:验证模块,用于判断该语义解析模块的domain信息是否全面,如果不全面,建立本次上下文模型,保存本次对话记录,转入对应的处理平台;如果全面,直接转入对应的处理平台;处理平台,用于对验证的domain信息进行处理,生成原始结果数据,并转发到输出模块。进一步,该处理平台,包括:domain处理模块,用于与domainType和domainName传入的domain信息对接,如果domain信息完整,对获取对应的完整信息进行封装,并提交给系统知识库进行数据检索和处理;如果domain信息不完整,根据缺少信息字段和本domain上下文提示模型进行处理;最后将信息处理的原始结果数据转发到输出模块;系统知识库,用于存储各类知识数据和经过用户调教、编辑以及个性化配置的用户知识数据;应用接口模块,用于与外部的应用程序或数据系统对接,进行实时信息查询。一种基于移动终端的智能问答交互方法,包括以下步骤:步骤1,输入用户语音、文本及操作指令提问信息,采集用户参数信息;步骤2,将用户提问信息及用户参数信息转换为标准的文本格式信息;步骤3,对文本格式信息,进行去噪和模块结构化处理;步骤4,对去噪和模块化处理的用户提问信息进行语义解析;步骤5,对解析信息进行验证、初次封装以及数据处理,生成原始结果数据;步骤6,把该步骤5中的原始结果数据,根据用户参数信息和个性化配置,进行二次封装和格式化,并将处理完的结果分发给调用服务器,输出检索结果。进一步,该步骤4包括以下子步骤:
1、采用分词算法对用户输入的自然语言和指令进行分词;2、对用户的语境、上下文、偏好及各项参数,进行关键字和意图的初次组合和权重分配,解析出关键字;3、对解析出的关键字进行结构化组合,得到解析结果。进一步,该步骤5具体过程为:验证domain信息是否全面,如果不全面,建立本次上下文模型,保存本次对话记录,根据缺少信息字段和本domain上下文提示模型进行处理;如果全面,对信息进行封装,并提交给系统知识库进行数据检索和处理;与现有技术相比,本发明的有益效果是:1、采用智能问答交互系统,给用户提供了一种简单、快捷地获取信息的新方式;2、以一问一答的语音方式进行信息查询,降低了使用门槛,让用户轻松愉快的获取信息;3、提高了问答系统识别的准确度和回答的正确性;并增强其内容的个性化;4、增强了系统的实用性。


图1为本发明一种基于移动终端的智能问答交互系统及方法的系统结构图;图2为本发明一种基于移动终端的智能问答交互系统及方法的方法流程图。
具体实施例方式下面结合附图所示的各实施方式对本发明进行详细说明,但应当说明的是,这些实施方式并非对本发明的限制,本领域普通技术人员根据这些实施方式所作的功能、方法、或者结构上的等效变换或替代,均属于本发明的保护范围之内。参图1所示,图1为本发明的系统结构图。在本实施方式中,一种基于移动终端的智能问答交互系统,包括:输入模块10,用于输入用户语音、文本及操作指令提问信息,采集用户参数信息(包括用户当前的动态数据,如:时间、地点、速度、输入模态、终端类型、网络类型,及部分用户在客户端设置的偏好数据,如:显示模式、翻译模式),并将用户提问信息、及用户参数信息全部转换为标准的文本格式信息。本问答系统支持文本、语音及操作输入方式,尤其语音输入方式极大地降低了用户使用的门槛。去噪模块20,用于对文本格式信息,进行去噪和模块结构化处理;语义解析模块30,用于对去噪和模块化处理的用户提问信息进行语义解析;信息处理模块40,用于对解析信息进行验证、初步封装以及数据处理,生成原始结果数据;输出模块50,用于把该信息处理模块40传过来的原始结果数据,根据该输入模块10所采集的参数信息(如所用终端类型、型号、分辨率、情景模式、网络状况)和个性化配置(如用户的历史问答数据、出行偏好、使用习惯、历史位置、渠道信息等等),进行二次封装和格式化,并将处理完的结果分发给调用服务器,输出检索结果。本问答系统支持多种不同的结果展示形式,包括文字、声音、图片、URL(统一资源定位符,Uniform ResourceLocator的缩写)等,可以根据用户的不同情况,如时间、地点、网络方式、终端类型和型号等给予最优的展现方式,简洁、生动的地展示给用户最优的答案。该输入模块10,包括:语音输入模块101,用于用户语音信息输入;文本输入模块102,用于用户文本信息输入;操作输入模块103,用于用户操作指令输入;参数采集模块104,用于采集用户的各种参数信息,如时间、用地地点、终端设备种类和型号、网络情况、设备方向、速度、加速度等等;文本转换模块105,用于将用户提问信息及用户参数信息转换为文本格式信息。该语义解析模块30,包括:分词模块301,用于建立一套基于现代汉语的语句、句法的分词算法模型,利用大量基础词汇数据,采用最小颗粒分词算法对用户输入的自然语言和指令进行分词。这样既可以完成普通语句的分词,又可以有针对性的修改算法配置和添加个性化及偏重词汇数据,很好地完成分词任务;权重分配模块302,用于分词之后,对用户的语境、上下文、偏好及各项参数,进行关键字和意图的初次组合和权重分配,解析出关键字。其具体实现方式为:对语境、上下文、用户偏好及各项参数,进行意图组合和权重因子分配;对意图关键字进行基于类马尔可夫模型的统计模型进行打分,把排序和意图进行反验证,比如通过用户的使用记录、习惯或其他规则,如果没有通过反验证则给予一定的减分;根据意图进行排序和权重分配,确定排名第一的意图模型。结构化组合模块303,用于对解析出的关键字进行结构化组合,得到解析结果。比如用户查询输入“你帮我查查明天去上海的飞机”,根据以上模块,可以解析出:1交通出行2坐飞机3目的城市是上海4时间是明天;但是我们可以根据从用户的参数采集或个人数据库中得到用户的位置是北京,一般对经济舱感兴趣,打折尤佳,经常乘坐东方航空的航班,根据这些信息解析的结果类似为:< xml version="!.0" encoding= ,,ut/-S,, >
<parseModule xmlns:Chongdong=^http://www.uzo0.cn/xmlw> <stateCode>l</stateCode>
<domainType>51</domainType>
<domainName>fIigth_station_to_station</domainName>
<flight_station_to_station>
< st art > 北京"start >
<dest>±i$</dest>
<date>2013-01-01</date>
<priority>
<seatlevel>2</seatlevel>
<f lightCorp〉东方航空 </flightCorp>
〈/priority〉
</flight_station_to_station>
</parseModule>该信息处理模块40,包括 :验证模块401,用于判断该语义解析模块的domain信息是否全面,如果不全面,建立本次上下文模型,保存本次对话记录,转入对应的处理平台;如果全面,直接转入对应的处理平台。“domain信息”是问答系统定义的功能分类,每一个大的功能分类都属于一个单独的domain, —个完整的domain包括所对应的功能的所有信息。如:航班domain需要如下必选信息:日期(格式为:yyyy-MM_dd)、出发城市或机场、目的城市或机场;除此之外,还有一些可选信息,如坐席类别、打折信息、航空公司信息、时间区间段(00:00-24:00)等等。“domain信息”验证主要是对该domain进行必选信息的验证,看必选信息是否已经全部按要求具备,如果全部按要求具备,则把验证通过的domain信息直接转入对应的处理平台进行数据处理。如果不具备,则查验出缺哪几项信息,根据所缺少的信息项的domain信息添加上下文标识并把对应信息字段项添加标识,统一交给处理和输出模块。处理平台402,用于对验证的domain信息进行处理,生成原始结果数据,并转发到输出模块。该处理平台包括:
domain处理模块,用于与domainType和domainName传入的domain信息对接,如果domain信息完整,对获取对应的完整信息进行封装,并提交给系统知识库进行数据检索和处理;如果domain信息不完整,根据缺少信息字段和本domain上下文提示模型进行处理;最后将信息处理的原始结果数据转发到输出模块。“domainType”为问答系统内部定义的功能分类的唯一数字标识,主要用于机器检索和识别。如航班查询出发城市到目的城市功能的domainType为51。“domainName”为问答系统内部定义的功能分类的唯一文字解释标识,主要用于开发、测试和维护人员进行辨别之用。系统知识库,用于存储各类知识数据和经过用户调教、编辑以及个性化配置的用户知识数据。比如张三用户特别喜欢电子产品,如果问答系统提供的答案无法让他满意,其可以自己进行编辑,然后提交系统,下次如果他提出类似的问题,问答系统可以优先使用他自己调教的答案;其他用户问到类似的问题,如果张三愿意分享并且答案质量不错,他的答案就有可能被问答系统直接推荐给该提问用户。通过这种用户间不断贡献问题和答案的方式,让问答系统不擅长的调侃,通过大量活跃用户的智囊支持,得到非常快速、高效和高质量地补充和更新,让整个问答变得更有趣味性。应用接口模块,用于与外部的应用程序或数据系统对接,进行实时信息查询。如果用户的问题可以使用系统知识库,该问答系统会根据用户当前的情况,快速给予用户答案数据;如果是需要其他CP(内容提供商,Content Provider)的数据支持,该问答系统则会使用CP提供的合作接口 API (应用程序编程接口,Application ProgrammingInterface)进行实时查询或使用虫洞的数据系统进行请求抓取,从而获取最新的实时数据,保证不会像搜索引擎获取的是检索缓存的数据。另外,本问答系统支持近百个大类,数千小类的各种信息类型。用户只需要本系统的一个终端接口(如Android、Web、Wap、AP1、微信等),就可以方便、快捷地使用这些功能和服务,而不是要安装上百个专门的软件,或者收藏上百个专门查询的网址。参图2所示,图2为本发明的方法流程图。在本实施方式中,一种基于移动终端的智能问答交互方法,包括以下步骤:步骤SI,输入用户语音、文本及操作指令提问信息,采集用户参数信息;步骤S2,将用户提问信息及用户参数信息转换为标准的文本格式信息;步骤S3,对文本格式信息,进行去噪和模块结构化处理。步骤S4,对去噪和模块化处理的用户提问信息进行语义解析;步骤S5,对解析信息进行验证、初次封装以及数据处理,生成原始结果数据;步骤S6,把该步骤S5中的原始结果数据,根据用户参数信息和个性化配置,进行二次封装和格式化,并将处理完的结果分发给调用服务器,输出检索结果。上述步骤S4包括以下子步骤:1、采用分词算法对用户输入的自然语言和指令进行分词;2、对用户的语境、上下文、偏好及各项参数,进行关键字和意图的初次组合和权重分配,解析出关键字;3、对解析出的关键字进行结构化组合,得到解析结果。上述步骤S5具体过程为:
验证domain信息是否全面,如果不全面,建立本次上下文模型,保存本次对话记录,根据缺少信息字段和本domain上下文提示模型进行处理;如果全面,对信息进行封装,并提交给系统知识库进行数据检索和处理;本发明提供了一种基于移动终端的智能问答交互系统及方法,其通过输入模块10,输入用户提问信息;通过去噪模块20,进行去噪和结构化处理;通过分词模块301、权重分配模块302及结构化组合模块303对用户提问信息进行语义解析;通过验证模块401及处理平台402对解析信息进行处理;通过输出模块50,生成最优检索结果。其不仅克服了传统查询方式的不足,还对现有问答系统做了实质性的改进,达到了以下技术效果:1、采用智能问答交互系统,给用户提供了一种简单、快捷地获取信息的新方式;2、以一问一答的语音方式进行信息查询,降低了使用门槛,让用户轻松愉快的获取信息;3、提高了问答系统识别的准确度和回答的正确性;并增强其内容的个性化;4、增强了系统的实用性,具体为:(I)通过系统知识库和外部应用程序或系统互补提供实时数据;(2)结合不同用户的实际情况展示个性化最优答案;(3)适用多种模态输入(文本、语音、操作);(4)支持多种信息类型。对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
权利要求
1.一种基于移动终端的智能问答交互系统,其特征在于,包括: 输入模块,用于输入用户语音、文本及操作指令提问信息,采集用户参数信息,并将用户提问信息及用户参数信息全部转换为标准的文本格式信息; 去噪模块,用于对文本格式信息,进行去噪和模块结构化处理; 语义解析模块,用于对去噪和模块化处理的用户提问信息进行语义解析; 信息处理模块,用于对解析信息进行验证、初步封装以及数据处理,生成原始结果数据; 输出模块,用于把所述信息处理模块传过来的原始结果数据,进行二次封装和格式化,并将处理完的结果分发给调用服务器,输出检索结果。
2.根据权利要求1所述的一种基于移动终端的智能问答交互系统,其特征在于,所述输入模块,包括: 语音输入模块,用于用户语音信息输入; 文本输入模块,用于用户文本信息输入; 操作输入模块,用于用户操作指令输入; 参数采集模块,用于采集用户的各种参数信息; 文本转换模块,用于将用户提问信息及用户参数信息转换为文本格式信息。
3.根据权利要求1所述的一种基于移动终端的智能问答交互系统,其特征在于,所述语义解析模块,包括: 分词模块,用于建立一套基于现代汉语的语句、句法的分词算法模型,利用大量基础词汇数据,采用最小颗粒分词算法对用户输入的自然语言和指令进行分词; 权重分配模块,用于分词之后,对用户的语境、上下文、偏好及各项参数,进行关键字和意图的初次组合和权重分配,解析出关键字; 结构化组合模块,用于对解析出的关键字进行结构化组合,得到解析结果。
4.根据权利要求1所述的一种基于移动终端的智能问答交互系统,其特征在于,所述信息处理模块,包括: 验证模块,用于判断该语义解析模块的domain信息是否全面,如果不全面,建立本次上下文模型,保存本次对话记录,转入对应的处理平台;如果全面,直接转入对应的处理平台; 处理平台,用于对验证的domain信息进行处理,生成原始结果数据,并转发到输出模块。
5.根据权利要求4所述的一种基于移动终端的智能问答交互系统,其特征在于,所述处理平台,包括: domain处理模块,用于与domainType和domainName传入的domain信息对接,如果domain信息完整,对获取对应的完整信息进行封装,并提交给系统知识库进行数据检索和处理;如果domain信息不完整,根据缺少信息字段和本domain上下文提示模型进行处理;最后将信息处理的原始结果数据转发到输出模块; 系统知识库,用于存储各类知识数据和经过用户调教、编辑以及个性化配置的用户知识数据; 应用接口模块,用于与外部的应用程序或数据系统对接,进行实时信息查询。
6.一种基于移动终端的智能问答交互方法,其特征在于,包括以下步骤: 步骤1:输入用户语音、文本及操作指令提问信息,采集用户参数信息; 步骤2:将用户提问信息及用户参数信息转换为标准的文本格式信息; 步骤3:对文本格式信息,进行去噪和模块结构化处理; 步骤4:对去噪和模块化处理的用户提问信息进行语义解析; 步骤5:对解析信息进行验证、初次封装以及数据处理,生成原始结果数据; 步骤6:把所述步骤5中的原始结果数据,根据用户参数信息和个性化配置,进行二次封装和格式化,并将处理完的结果分发给调用服务器,输出检索结果。
7.根据权利要求6所述的一种基于移动终端的智能问答交互方法,其特征在于,所述步骤4包括以下子步骤: (1)采用分词算法对用户输入的自然语言和指令进行分词; (2)对用户的语境、上下文、偏好及各项参数,进行关键字和意图的初次组合和权重分配,解析出关键字; (3)对解析出的关键字进行结构化组合,得到解析结果。
8.根据权利要求6 所述的一种基于移动终端的智能问答交互方法,其特征在于,所述步骤5具体过程为: 验证domain信息是否全面,如果不全面,建立本次上下文模型,保存本次对话记录,根据缺少信息字段和本domain上下文提示模型进行处理; 如果全面,对信息进行封装,并提交给系统知识库进行数据检索和处理。
全文摘要
本发明提供了一种基于移动终端的智能问答交互系统,包括输入模块、去噪模块、语义解析模块、信息处理模块及输出模块。本发明还提供了一种基于移动终端的智能问答交互方法,包括以下步骤输入用户提问信息,采集用户参数信息;将用户提问信息及用户参数信息转换为标准的文本格式信息;对文本格式信息,进行去噪和模块结构化处理;对用户提问信息进行语义解析;对解析信息进行验证、初次封装以及数据处理,生成原始结果数据;把原始结果数据,进行二次封装和格式化,并将处理完的结果分发给调用服务器,输出检索结果。其提高了识别的准确度和回答的正确性,增强了内容的个性化和系统的实用性。
文档编号G06F17/30GK103198155SQ20131015114
公开日2013年7月10日 申请日期2013年4月27日 优先权日2013年4月27日
发明者俞志晨 申请人:俞志晨
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1