一种智能互动式问答系统的制作方法

文档序号:6615212阅读:393来源:国知局
专利名称:一种智能互动式问答系统的制作方法
技术领域
本发明涉及计算机网络技术,特别是一种利用计算机互联网,将不同用户的问题需求提 交到问答系统中,由系统和用户进行互动式的交流,最终为用户提供满意的答案。
背景技术
随着互联网在近几年的高速发展,上网人数高速增长,网络已经成为最大最快捷的信 息载体,也成为越来越多人寻求问题答案的第一选择。
现在在网络上获得答案的途径主要有下面几种可以浏览相关的专业网站,可以在相 关论坛发贴求助,也可以通过各种大型搜索引擎搜索相关结果,还可以通过现有的一些基于 搜索引擎技术的知识聚合类网站进行提问寻找答案。
但是现有的这些途径都有各自很大的局限性和不足
一、 浏览相关的专业网站需要花费大量的时间,能否找到自己需要的答案还要取决于网 站内容是否全面,而且对于很多用户来说并不知道自己的问题需要到哪个网站去寻找答案。
二、 在论坛发贴求助需要等待别的用户的回答,在问题解决时间上具有不确定性,另外 在论坛上提问大大局限了对问题进行解答的人群范围从而降低了找到答案的概率。
三、 各种大型搜索引擎实际上只是对用户的提问中的一些关键字进行搜索,并不是对问 题进行真正有效的分析和处理,因此搜索的结果往往包含大量无效的信息,达不到解答也就 是理解并回答的效果。
四、 一些基于搜索引擎技术的知识聚合类网站实质上就是应用了搜索引擎技术的论坛, 因此二和三中提到的弊端,它都同样存在,比如问题解决的时间性,比如不能对问题进行有 效的分析。例如, 一个人想知道从圆明园到故宫该怎么走,那么提问可能是以下很多种形式 :"圆明园到故宫怎么走?"、"从圆明园到故宫怎么坐车?"、"圆明园到故宫的交通方 式有哪些?"等等,某一种提问形式也许可以寻找到答案,但换了一种提问形式也许就没答 案了,而提问者并不清楚该用何种形式进行提问,同样的一个问题通过不同的语句表达出来 ,基于现有的搜索引擎技术是无法进行有效的分析和处理的。

发明内容
本发明的目的在于提供一种智能互动式的问答系统,包括两个部分,问题分析系统和 答案寻找系统。问题分析系统指的是可以对用户不同形式的提问进行智能化交互式的有效分 析和理解,最终形成结构化模块化的可以被答案寻找系统大量程序化处理的问题格式(在本 说明书中称其为问题的格式化)。答案寻找系统指的是对问题分析系统产生的结构化模块化 的问题进行程序化的智能处理,寻找答案并反馈给用户。用户通过网络完成提问和交互过程 ,在缺少网络的情况下也可以在本地完成。
为了达到上述的发明目的,本发明提供如下技术方案
通过计算机互联网络,利用设置在服务器上的软件系统实现本发明,即用户通过系统的 输入界面将问题提交给系统,系统对提交的问题进行分析和理解,如果缺少理解所需的信息 则和用户进行交互索取所需信息直到对问题正确理解,理解完毕形成格式化问题,并由答案 寻找系统自动搜索问题答案,搜索到答案后将答案反馈给用户。系统包括问题分析部分和答 案寻找部分。
问题分析部分
用户登录服务器,通过输入界面将问题提交给系统,问题可以通过汉语、英语等各种人 类语言文字也可以通过计算机语言或者其它行业专用符号进行表示,对于通过声音、图片、 视频等多媒体表达的问题则先处理转化为文字形式再进行后续分析处理
系统对用户提交的问题进行分析,首先判断是用何种语言表达(可以多种并存),判断 完成后转入相关语言处理子系统进行处理
相关语言子系统对问题进行处理,如果需要分词则进行分词处理(比如汉语需要进行分 词而英语则不需要,如用户输入的"少林寺好看么?"需要分词为"少林寺好看么?" ,汉语的分词处理需要专用的分词软件或自己实现的软件模块,北京大学计算语言所等都开 发有相应的软件模块)。
分词处理完毕后使用本系统自带的句式处理模块进行句式处理,确定用户问句的句式和 句子的相关要素如主谓宾从等。
确定句式以后,形成可被答案寻找系统处理的格式化问题,由句式、句子各要素组成, 如用户输入的"少林寺好看么?"处理后形成的格式化问题为(句式是非问句;主语 :少林寺;判断要点好看)
形成格式化问题后,对有可能产生歧义的要素进行反馈处理,实现真正理解用户的本意 ,形成最终的格式化问题。如例子中的少林寺,经过歧义分析后,发现存在(电影)少林 寺以及(旅游景点)少林寺,而这两者都具备和(判断要点好看)匹配的特性,这就需
要反馈给用户,由用户确认,假如用户问的是电影少林寺,则最终形成格式化问题(句式 是非问句;主语电影少林寺;判断要点好看)。
答案寻找部分
对问题分析系统提供的格式化问题进行处理,给出答案,答案可以是系统答案库中的答 案,也可以给用户返回一个外部网站的链接,直接指导用户到系统推荐的相关专业网站进行 査询。
(1) 对问题分析系统提供的格式化问题(由句式、句子各要素构成)进行句式分析,确定 该句式对应的分析处理方法
(2) 应用对应的句式分析处理方法,从句子各要素中找出所有关键词和他们各自的参数
(3) 按照每个关键词的处理方法,对各个关键词及它们所带的参数进行处理
(4) 汇总全部的关键词处理结果,形成初步答案
(5) 答案可以有多条,可以是直接的文字或者声音、图片、视频等解释,也可以是其它 相关网站的链接(可以有参数)
(6) 如果没有找到答案,则反馈给用户系统推荐的其它答案寻找系统或者请求用户修改 提问形式。
(7) 对准备返回给用户的初步答案进行处理,形成用户可以理解的最终答案(即输出答 案和输入问题保持同语言)反馈用户。


图l是本发明系统总流程图 图2是问题分析系统流程图 图3是答案寻找系统流程图
具体实施例方式
本发明是一种智能互动式的问答系统。给出以下的描述以使任何本领域的技术人员都 能够实施并使用本发明。给出的特定实施例子的描述和应用仅提供作为实例,进行各种修改 对本领域的技术人员是很容易实现的,因此可以在不脱离本发明精神范围的条件下,将本文 中所限定的原理应用于其它实施例子和应用。本发明符合包括文中所披露的原理和特征相一 致的许多替换、修改和等效物的最宽范围。为了简洁和避免不必要的混淆,不再详细描述与
本发明相关的技术领域中的已知技术。
下面介绍一个本系统的实施例。 一个用户想知道从故宫到颐和园应该采用什么样的交 通方式,于是通过本系统进行问答。
一、 问题分析
用户通过提问界面输入问题从故宫到颐和园怎么走
系统处理步骤如下
语言判断,判断为中文;
进行分词处理,处理结果为从故宫到颐和园怎么走,如果碰到不能确定分词结 果的问题则和用户进行交互确定(在遇到有歧义的情况下需要);
进行句式判断(从故宫到颐和园)+怎么+走判断结果为(定语)+怎么+(行为 动词)的疑问句;
要素处理关键词为走,定语为(从故宫到颐和园) 走(从a到b)对应为交通(a,b)
问题的格式化产生可以为答案寻找系统所理解处理的格式化问题
生成结果为(句式 一般问句,主语交通;判断要点故宫,颐和园)
需要说明的是,不管用户输入的问题是(从故宫到颐和园怎么走)、(故宫到颐和园如 何走)、(故宫到颐和园该坐什么车)等等,最终经过问题格式化处理后提交给答案寻找系 统的都是同一个格式化问题,也就是(句式 一般问句;主语交通;判断要点故宫,颐 和园)。
问题格式化的目的是在确保系统处理效率的前提下尽可能的解决用户输入问题的个性化 行为。
二、 答案寻找
对(句式 一般问句,主语交通;判断要点故宫,颐和园)进行处理,给出答案 系统处理步骤如下
取得系统对一般问句的分析处理方法;
找到关键词一个交通,确定它的参数为(故宫,颐和园);
取得关键词交通的处理方法,交通(a, b) = {公交线路(a, b),自驾车线路(a, b),网络地 图(a, b),…h
汇总全部关键词处理结果,形成初步答案,由于本问题只有一个关键词,所以无需汇总 答案如下
1、 公交线路(故宫到颐和园)乘814在故宫站上车,经26站,行程17. 53公里,在圆 明园东门站下车,行程预计耗时1小时10分钟
2、 自驾车线路(故宫到颐和园)故宫北门西行300米,右转,北行1500米,上北四 环,西行7.5公里,成府路西口右转,北行500米,左转,西行5公里,颐和园东门,行程预 计耗时30分钟
3、 网路地图(故宫到颐和园)其它专业交通地图网站链接,并将用户输入的起点 故宫,终点颐和园作为参数直接传递过去,这样顾客就可以直接进行图形化的交通路线査 询了。
权利要求
1.一种智能互动式的问答系统,该系统通过内含的两个部分,问题分析系统和答案寻找系统,执行对提问的解答。其特征在于通过问题分析系统对用户不同形式的提问进行智能化交互式的有效分析和理解,最终形成结构化模块化的可以被答案寻找系统大量程序化处理的问题格式,再通过答案寻找系统对结构化模块化的问题进行程序化的智能处理,寻找答案并反馈给用户。
2. 根据权利要求l所述的问题分析系统,其特征在于可以处理各种 表达方式的问题,问题的表达方式可以是各种人类语言,也可以是各种其它行业约定的通用 符号构成的语言,问题的表达方式还可以是声音、图片、视频等多媒体方式。
3. 根据权利要求l所述的答案寻找系统,其特征在于可以对需要分 词的语言(比如汉语等)进行分词处理。
4. 根据权利要求2所述的问题格式化,其特征在于可以对问题进行 格式化处理即按照系统设定的格式对提问进行句式处理,确定用户问句的句式和句子的相 关要素如主谓宾从等,确定句式以后,形成可被答案寻找系统处理的格式化问题,由句式、 句子各要素组成,如用户输入的"少林寺好看么?"处理后形成的格式化问题为(句式 :是非问句;主语少林寺;判断要点好看)。
5. 根据权利要求2所述的问题的智能化交互,其特征在于可以和用 户进行智能化交互形成格式化问题后,对有可能产生歧义的要素反馈给用户,由用户进行 确认,从而实现真正理解用户的本意。如例子中的少林寺,经过歧义分析后,发现存在( 电影)少林寺以及(旅游景点)少林寺,而这两者都具备和(判断要点好看)匹配的特 性,这就需要反馈给用户,由用户确认,假如用户问的是电影少林寺,则最终形成格式化问 题(句式是非问句,主语电影少林寺,判断要点好看)
6. 根据权利要求l所述的答案寻找系统,其特征在于处理结果可以有多条。
7. 根据权利要求l所述的答案寻找系统,其特征在于处理结果可以 是直接的文字或、声音、图片、视频等,也可以是系统推荐的对解决用户提问有帮助的外部 网站的链接。
8. 根据权利要求4所述的对问题进行格式化处理,其特征在于所遵 循的格式,是灵活可变的,可以由系统管理员进行设定。
9. 根据权利要求4所述的对问题进行格式化处理,其特征在于对通 过不同方式表达出的相同意思的问题,都会形成同一个格式化问题。
10. 根据权利要求5所述的问题的智能化交互,其特征在于对于有 歧义的要素会反馈给用户所有可能的歧义选项,由用户进行确认。
全文摘要
本发明涉及计算机网络技术,利用互联网为用户提供问题解答。系统包括问题分析和答案寻找两部分。问题分析系统可以和用户进行交互以解决歧义从而实现对问题的正确理解,并处理问题形成可以被程序化处理的格式化问题,意思相同但表达方式不同的问题将形成同一格式化问题。答案寻找系统可对格式化的问题进行处理,寻找答案并反馈用户,答案可以是系统答案库中的文字、声音、图片、视频等,也可以是系统推荐的其它相关网站的链接。通过本系统,用户的问题将得到真正的理解,对问题的格式化处理则在确保系统效率的前提下满足了用户提问的个性化要求,而答案的动态和多样性将最大可能的满足用户的提问。
文档编号G06F17/27GK101174259SQ20071020173
公开日2008年5月7日 申请日期2007年9月17日 优先权日2007年9月17日
发明者张琰亮 申请人:张琰亮
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1