一种基于疑问语义的自然语言语义计算的方法及装置的制造方法_5

文档序号:9349929阅读:来源:国知局
和预先存储的字符对应,则显示与所 述预先存储的字符对应的划分前的待处理的字符。
[0263] 具体的,例如,若用户输入几时、谁、怎样、哪儿,则根据预先存储的明天/几时我 和你/谁一块去/怎样北京/哪里,可以搜索出明天我和你一块去北京。
[0264] 实施例六
[0265] 参考图8,图8是本发明实施例基于疑问语义的自然语言语义计算的装置的功能 丰旲块不意图。
[0266] 在实施例四的基础上中,所述装置还包括:
[0267] 接收模块407,用于接收用户输入的搜索字符;
[0268] 获取模块408,用于根据所述搜索字符和相似度计算获取预先存储的字符模型;
[0269] 第二划分模块409,用于根据所述预先存储的字符模块划分为预先设置的疑问对 象;
[0270] 第二搜索模块410,用于根据划分后的疑问代词搜索预先存储的字符;
[0271] 第二显示模块411,用于若划分后的疑问代词和预先存储的字符对应,则显示与所 述预先存储的字符对应的划分前的待处理的字符。
[0272] 具体的,在处理自然语言句子时,由于对每个句子建立了相应的疑问语义树,各层 子树语义间相对独立,进而实现并行计算。由于各层子树对句子的疑问语义抽象层次不同, 进行计算时,可计算最低等级的字符块、也可计算抽象度递增的各层子树,进而放大或缩小 了搜索空间,实现匹配精度的有效控制。
[0273] 对于具体句子的计算,可转换为与疑问语义句模库中句模型的匹配与分解问题, 进而计算出语义相似度。步骤描述:
[0274] 输入句子S ;
[0275] 对句子S进行疑问语义标注;
[0276] 根据句子中疑问运算符和疑问对象,进行分级计算;
[0277] 分级计算结果,根据疑问点,转化为疑问语义树;
[0278] 与疑问句模匹配,计算出各级的疑问语义句式;
[0279] 为后续处理做好准备,处理结束。
[0280] 以上结合具体实施例描述了本发明实施例的技术原理。这些描述只是为了解释本 发明实施例的原理,而不能以任何方式解释为对本发明实施例保护范围的限制。基于此处 的解释,本领域的技术人员不需要付出创造性的劳动即可联想到本发明实施例的其它具体 实施方式,这些方式都将落入本发明实施例的保护范围之内。
【主权项】
1. 一种基于疑问语义的自然语言语义计算的方法,其特征在于,所述方法包括: 设计多个多层次的疑问语义标注集,每个标注集均由若干现代汉语中常用的疑问词组 成,其中疑问词包括疑问代词; 根据待处理语句的各组成部分的疑问特征,通过所述疑问语义标注集、疑问语义句模 库和疑问语义树,将所述待处理语句的各组成部分切分并标注为疑问对象或疑问运算符; 根据所述疑问对象或所述疑问运算符的性质和规则,结合所述疑问语义句模库、统计 方法和疑问语义树,实现待处理语句的疑问语义计算。2. 根据权利要求1所述的方法,其特征在于,所述设计多个多层次的疑问语义标注集, 每个标注集均由若干现代汉语中常用的疑问词组成,其中疑问词包括疑问代词,包括: 根据不同的语义场景或者不同的应用场景设计多个多层次的疑问语义标注集,每个标 注集均由若干现代汉语中常用的疑问词组成,其中疑问词包括疑问代词。3. 根据权利要求1所述的方法,其特征在于,所述根据待处理语句的各组成部分的疑 问特征,通过所述疑问语义标注集、疑问语义句模库和疑问语义树,将所述待处理语句的各 组成部分切分并标注为疑问对象或疑问运算符,包括: 若所述语义范畴为人,则与人对应的疑问代词为"谁"; 若所述语义范畴为事物,则与事物对应的疑问代词为"什么"; 若所述语义范畴为动作,则与所述事物对应的疑问代词为"怎么",与所述"怎么"疑问 语义等同的其他疑问代词为怎么样、怎样、怎、怎么着、怎的和如何; 若所述语义范畴为时间,则与所述时间对应的疑问代词为几时,与所述"几时"疑问语 义等同的其他疑问代词为多会儿、哪会儿和多咱; 若所述语义范畴为地点场所,则与所述地点场所对应的疑问代词为哪里,与所述"哪 里"疑问语义等同的其他疑问代词为哪和哪儿; 若所述语义范畴为数目数量,则与所述数目数量对应的疑问代词为多少,与所述多少 等同的其他疑问代词为几和多; 若所述语义范畴为虚词,则将所述语义范畴切分并标注为疑问运算符。4. 根据权利要求1至3任意一项所述的方法,其特征在于,所述方法还包括: 将搜索字符通过预先设置的算法划分为预先设置的疑问对象; 根据划分后的疑问代词搜索预先存储的字符; 若划分后的疑问代词和预先存储的字符对应,则显示与所述预先存储的字符对应的划 分前的待处理的字符。5. 根据权利要求1至3任意一项所述的方法,其特征在于,所述方法还包括: 接收用户输入的搜索字符; 根据所述搜索字符和相似度计算获取预先存储的字符模型; 根据所述预先存储的字符模块划分为预先设置的疑问对象; 根据划分后的疑问代词搜索预先存储的字符; 若划分后的疑问代词和预先存储的字符对应,则显示与所述预先存储的字符对应的划 分前的待处理的字符。6. -种基于疑问语义的自然语言语义计算的装置,其特征在于,所述装置包括: 设计模块,用于设计多个多层次的疑问语义标注集,每个标注集均由若干现代汉语中 常用的疑问词组成,其中疑问词包括疑问代词; 标注模块,用于根据待处理语句的各组成部分的疑问特征,通过所述疑问语义标注集、 疑问语义句模库和疑问语义树,将所述待处理语句的各组成部分切分并标注为疑问对象或 疑问运算符; 计算模块,用于根据所述疑问对象或所述疑问运算符的性质和规则,结合所述疑问语 义句模库、统计方法和疑问语义树,实现待处理语句的疑问语义计算。7. 根据权利要求6所述的装置,其特征在于,所述设计模块,包括: 设计单元,用于根据不同的语义场景或者不同的应用场景设计多个多层次的疑问语义 标注集,每个标注集均由若干现代汉语中常用的疑问词组成,其中疑问词包括疑问代词。8. 根据权利要求6所述的装置,其特征在于,所述标注模块,包括: 第一标注单元,用于若所述语义范畴为人,则与人对应的疑问代词为"谁"; 第二标注单元,用于若所述语义范畴为事物,则与事物对应的疑问代词为"什么"; 第三标注单元,用于若所述语义范畴为动作,则与所述事物对应的疑问代词为"怎么", 与所述"怎么"疑问语义等同的其他疑问代词为怎么样、怎样、怎、怎么着、怎的和如何; 第四标注单元,用于若所述语义范畴为时间,则与所述时间对应的疑问代词为几时,与 所述"几时"疑问语义等同的其他疑问代词为多会儿、哪会儿和多咱; 第五标注单元,用于若所述语义范畴为地点场所,则与所述地点场所对应的疑问代词 为哪里,与所述"哪里"疑问语义等同的其他疑问代词为哪和哪儿; 第六标注单元,用于若所述语义范畴为数目数量,则与所述数目数量对应的疑问代词 为多少,与所述多少等同的其他疑问代词为几和多; 第七标注单元,用于若所述语义范畴为虚词,则将所述语义范畴切分并标注为疑问运 算符。9. 根据权利要求6至8任意一项所述的装置,其特征在于,所述装置还包括: 第一划分模块,用于将搜索字符通过预先设置的算法划分为预先设置的疑问对象; 第一搜索模块,用于根据划分后的疑问代词搜索预先存储的字符; 第一显示模块,用于若划分后的疑问代词和预先存储的字符对应,则显示与所述预先 存储的字符对应的划分前的待处理的字符。10. 根据权利要求6至8任意一项所述的装置,其特征在于,所述装置还包括: 接收模块,用于接收用户输入的搜索字符; 获取模块,用于根据所述搜索字符和相似度计算获取预先存储的字符模型; 第二划分模块,用于根据所述预先存储的字符模块划分为预先设置的疑问对象; 第二搜索模块,用于根据划分后的疑问代词搜索预先存储的字符; 第二显示模块,用于若划分后的疑问代词和预先存储的字符对应,则显示与所述预先 存储的字符对应的划分前的待处理的字符。
【专利摘要】本发明实施例公开了一种基于疑问语义的自然语言语义计算方法及装置,设计多个多层次的疑问语义标注集,每个标注集均由若干现代汉语中常用的疑问词组成,其中疑问词包括疑问代词;根据待处理语句的各组成部分的疑问特征,通过所述疑问语义标注集、疑问语义句模库和疑问语义树,将所述待处理语句的各组成部分切分并标注为疑问对象或疑问运算符;根据所述疑问对象或所述疑问运算符的性质和规则,通过所述疑问语义标注集、疑问语义句模库和疑问语义树,作为一个基础的语义计算方法,本发明实施例可以有效的解决常见的自然语言处理问题,尤其是在语句的切分标注、自然语言搜索、机器翻译、人机问答等领域具有较高的使用价值。
【IPC分类】G06F17/27
【公开号】CN105068995
【申请号】CN201510510604
【发明人】刘战雄
【申请人】刘战雄
【公开日】2015年11月18日
【申请日】2015年8月19日
当前第5页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1