一种基于知识库的问答题目生成方法和装置的制造方法

文档序号:9261430阅读:195来源:国知局
一种基于知识库的问答题目生成方法和装置的制造方法
【技术领域】
[0001]本发明涉及互联网领域,具体而言,涉及一种基于知识库的问答题目生成方法和
目.0
【背景技术】
[0002]通过问题和对该问题的回答是人们获取现实世界的知识数据或信息的一种有效方式。然而,现实世界(特别是互联网上)涉及的知识数据或信息是海量的,如何将海量的知识数据或信息转换为问题和相应回答成为亟需解决的技术问题。现有的知识数据或信息到问题和相应回答的转换主要通过人工方式,转换的数据处理效率较低。

【发明内容】

[0003]为解决上述的技术问题,本发明提供了一种基于知识库的问答题目生成方法和装置,利用海量的结构化的实体、属性以及属性值信息作为问题的主干数据,将实体、属性以及属性值三元素之一作为正确答案,剩余两个元素作为问题的问句成分,与现有的人工编辑生成问答题库相比,显著提高了海量的知识数据向问答题目的数据转换效率并且改善了问答题目的丰富度;而且,通过海量结构化数据自动生成问答题库,能够避免人工编辑问题的记忆偏差,提高答案的准确度。
[0004]根据本发明实施方式的第一方面,提供了一种基于知识库的问答题目生成方法,该方法可包括:从知识库中获取三元数据组,其中,所述三元数据组中各元素的关系为??属性值元素为实体元素的属性元素对应的取值;将所述三元数据组中的任意一个元素作为正确答案根据语言表达习惯的模板生成所述正确答案对应的问题。
[0005]在本发明的一些实施方式中,将所述三元数据组中的任意一个元素作为正确答案根据语言表达习惯的模板生成所述正确答案对应的问题,包括:根据所述三元数据组中属性的点击数量选择一个以上属性用于问题生成。
[0006]在本发明的一些实施方式中,将所述三元数据组中的任意一个元素作为正确答案根据语言表达习惯的模板生成所述正确答案对应的问题,包括:在根据所述三元数据组中属性的点击数量选择一个以上属性用于问题生成之后,将所述三元数据组中选择出的属性对应的属性值元素作为正确答案,根据语言习惯表达的模板生成包含下述句子成分的问句作为所述正确答案对应的问题:所述三元数据组中实体的属性。
[0007]在本发明的一些实施方式中,基于知识库的问答题目生成方法还可包括:根据所述正确答案和/或生成的所述问题的约束信息生成所述问题的一个以上错误答案,所述约束信息包括下述的一种以上:属性集合、属性值集合、热门程度、公知常识。
[0008]在本发明的一些实施方式中,基于知识库的问答题目生成方法还可包括:对所述正确答案和/或所述错误答案进行配图。
[0009]在本发明的一些实施方式中,基于知识库的问答题目生成方法还可包括:在所述问题的显示页面呈现正确答案查看链接,供用户查看所述问题的正确答案。
[0010]根据本发明实施方式的第二方面,提供了一种基于知识库的问答题目生成装置,该装置可包括:获取模块,用于从知识库中获取三元数据组,其中,所述三元数据组中各元素的关系为:属性值元素为实体元素的属性元素对应的取值;生成模块,用于将所述三元数据组中的任意一个元素作为正确答案根据语言表达习惯的模板生成所述正确答案对应的问题。
[0011]在本发明的一些实施方式中,所述生成模块中将所述三元数据组中的任意一个元素作为正确答案根据语言习惯表达的模板生成所述正确答案对应的问题包括:根据所述三元数据组中属性的点击数量选择一个以上属性用于问题生成。
[0012]在本发明的一些实施方式中,所述生成模块中将所述三元数据组中的任意一个元素作为正确答案根据语言表达习惯的模板生成所述正确答案对应的问题包括:在根据所述三元数据组中属性的点击数量选择一个以上属性用于问题生成之后,将所述三元数据组中选择出的属性对应的属性值元素作为正确答案,根据语言习惯表达的模板生成包含下述句子成分的问句作为所述正确答案对应的问题:所述三元数据组中实体的属性。
[0013]在本发明的一些实施方式中,基于知识库的问答题目生成装置还可包括:误选模块,用于根据所述正确答案和/或生成的所述问题的约束信息生成所述问题的一个以上错误答案,所述约束信息包括下述的一种以上:属性集合、属性值集合、热门程度和公知常识。
[0014]在本发明的一些实施方式中,基于知识库的问答题目生成装置还可包括:配图模块,用于对所述正确答案和/或所述错误答案进行配图。
[0015]在本发明的一些实施方式中,基于知识库的问答题目生成装置还可包括:查看模块,用于在所述问题的显示页面呈现正确答案查看链接,供用户查看所述问题的正确答案。
[0016]本发明实施方式提供的知识数据转换方法和装置,利用实体、属性、属性值等结构化数据生成相应的问题和答案,与现有的问题和答案的人工生成技术相比,改善了知识数据的数据转换效率,同时也提高了问答题目的丰富度;通过问题和答案的约束信息生成问题的错误选项,增加了问答题目的层次性,有利于促使用户参与答题,获取知识;对答案选项进行相应的配图,改善了问答题目的趣味性,更进一步改善用户参与答题的积极性;通过在问题页面设置正确答案查看链接,有利于用户实时查看答案信息,获取相关知识。
【附图说明】
[0017]图1图示了根据本发明一种实施方式的基于知识库的问答题目生成方法的流程示意图;
[0018]图2图示了根据本发明一种实施方式的问题和答案页面的网页示意图;
[0019]图3图示了根据本发明一种实施方式的基于知识库的问答题目生成装置的结构示意图。
【具体实施方式】
[0020]为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
[0021]参见图1,图示了根据本发明一种实施方式的基于知识库的问答题目生成方法的流程示意图,该方法可包括:
[0022]S101,从知识库中获取三元数据组,其中,所述三元数据组包括实体、属性和属性值三个元素。各元素的关系为:属性值元素为实体元素的属性元素对应的取值;
[0023]S102,将三元数据组中的任意一个元素作为正确答案根据语言表达习惯的模板生成该正确答案对应的问题。
[0024]基于知识库的问答题目生成方法可包括执行步骤S101,从知识库中获取三元数据组〈实体,属性,属性值 >,其中,所述三元数据组中各元素的关系为:属性值元素为实体元素的属性元素对应的取值。具体而言,可包括:根据属性/实体词典获取二元数据组〈实体,属性 > ;根据二元数据组〈实体,属性 > 从知识库中获取二元数据组中实体的属性对应的属性值,将该属性值与该二元数据组合并生成三元数据组〈实体,属性,属性值 >。根据属性/实体词典获取二元数据组〈实体,属性 >,从知识库中获取属性/实体词典,其中,属性/实体的选择可通过圈定或选定一些特定的领域和实体进行,例如,首先,可根据领域的属性热度、数据热度、实体热度、用户主需求(其中,这些热度可依据用户的检索、点击量等因素进行测算)等计算用户对某一些或某一个领域的兴趣度,圈出这些或这个领域作为问答题目的生成领域;然后,根据圈出的这些领域中的实体热度圈出该领域中的实体,作为知识数据转换的实体。利用上述圈定的领域及其实体生成问题,可提高问题的兴趣度,促进用户参与答题,获取相关知识。根据上述圈定的领域和
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1