一种基于疑问语义的自然语言语义计算的方法及装置的制造方法

文档序号:9349929阅读:251来源:国知局
一种基于疑问语义的自然语言语义计算的方法及装置的制造方法
【技术领域】
[0001] 本发明实施例涉及信息处理的技术领域,尤其涉及一种基于疑问语义的自然语言 语义计算的方法及装置。
【背景技术】
[0002] 自然语言处理是研究人人、人机交际中语言问题的一门学科。在自然语言处理中, 语义计算是通过计算机解释自然语言中各级单位即字、词素、词、词组、短语、句子、句群、段 落、篇章等的意义,所关心的重点是这个语言单位到底说了什么。在目前技术中主要有:义 素分析法、语义场、语义网络、Montague语法、优选语义学、概念依存理论、意义-文本理论 等方法。
[0003] 在目前技术中,语义计算的主要的缺陷表现为两方面:一方面侧重于利用统计方 法进行字符运算,很少或者没有涉及语义问题;另一方面失之于语义概念抽象或规则复杂, 利用计算机技术难以实现或算法复杂度高,缺乏实用性。

【发明内容】

[0004] 本发明实施例的目的在于提出一种基于疑问语义的自然语言语义计算的方法及 装置,旨在解决如何建立简单易懂的语义划分规则对自然语言进行处理的问题。
[0005] 为达此目的,本发明实施例采用以下技术方案:
[0006] 设计多个多层次的疑问语义标注集,每个标注集均由若干现代汉语中常用的疑问 词组成,其中疑问词包括疑问代词;
[0007] 根据待处理语句的各组成部分的疑问特征,通过所述疑问语义标注集、疑问语义 句模库和疑问语义树,将所述待处理语句的各组成部分切分并标注为疑问对象或疑问运算 符;
[0008] 根据所述疑问对象或所述疑问运算符的性质和规则,结合所述疑问语义句模库、 统计方法和疑问语义树,实现待处理语句的疑问语义计算。
[0009] 优选地,所述设计多个多层次的疑问语义标注集,每个标注集均由若干现代汉语 中常用的疑问词组成,其中疑问词包括疑问代词,包括:
[0010] 根据不同的语义场景或者不同的应用场景设计多个多层次的疑问语义标注集,每 个标注集均由若干现代汉语中常用的疑问词组成,其中疑问词包括疑问代词。
[0011] 优选地,所述根据待处理语句的各组成部分的疑问特征,通过所述疑问语义标注 集、疑问语义句模库和疑问语义树,将所述待处理语句的各组成部分切分并标注为疑问对 象或疑问运算符,包括:
[0012] 若所述语义范畴为人,则与人对应的疑问代词为"谁";
[0013] 若所述语义范畴为事物,则与事物对应的疑问代词为"什么";
[0014] 若所述语义范畴为动作,则与所述事物对应的疑问代词为"怎么",与所述"怎么" 疑问语义等同的其他疑问代词为怎么样、怎样、怎、怎么着、怎的和如何;
[0015] 若所述语义范畴为时间,则与所述时间对应的疑问代词为几时,与所述"几时"疑 问语义等同的其他疑问代词为多会儿、哪会儿和多咱;
[0016] 若所述语义范畴为地点场所,则与所述地点场所对应的疑问代词为哪里,与所述 "哪里"疑问语义等同的其他疑问代词为哪和哪儿;
[0017] 若所述语义范畴为数目数量,则与所述数目数量对应的疑问代词为多少,与所述 多少等同的其他疑问代词为几和多;
[0018] 若所述语义范畴为虚词,则将所述语义范畴切分并标注为疑问运算符。
[0019] 优选地,所述方法还包括:
[0020] 将搜索字符通过预先设置的算法划分为预先设置的疑问对象;
[0021] 根据划分后的疑问代词搜索预先存储的字符;
[0022] 若划分后的疑问代词和预先存储的字符对应,则显示与所述预先存储的字符对应 的划分前的待处理的字符。
[0023] 优选地,所述方法还包括:
[0024] 接收用户输入的搜索字符;
[0025] 根据所述搜索字符和相似度计算获取预先存储的字符模型;
[0026] 根据所述预先存储的字符模块划分为预先设置的疑问对象;
[0027] 根据划分后的疑问代词搜索预先存储的字符;
[0028] 若划分后的疑问代词和预先存储的字符对应,则显示与所述预先存储的字符对应 的划分前的待处理的字符。
[0029] -种基于疑问语义的自然语言语义计算的装置,所述装置包括:
[0030] 设计模块,用于设计多个多层次的疑问语义标注集,每个标注集均由若干现代汉 语中常用的疑问词组成,其中疑问词包括疑问代词;
[0031] 标注模块,用于根据待处理语句的各组成部分的疑问特征,通过所述疑问语义标 注集、疑问语义句模库和疑问语义树,将所述待处理语句的各组成部分切分并标注为疑问 对象或疑问运算符;
[0032] 计算模块,用于根据所述疑问对象或所述疑问运算符的性质和规则,结合所述疑 问语义句模库、统计方法和疑问语义树,实现待处理语句的疑问语义计算。
[0033] 优选地,所述设计模块,包括:
[0034] 设计单元,用于根据不同的语义场景或者不同的应用场景设计多个多层次的疑问 语义标注集,每个标注集均由若干现代汉语中常用的疑问词组成,其中疑问词包括疑问代 O
[0035] 优选地,所述标注模块,包括:
[0036] 第一标注单元,用于若所述语义范畴为人,则与人对应的疑问代词为"谁";
[0037] 第二标注单元,用于若所述语义范畴为事物,则与事物对应的疑问代词为"什么";
[0038] 第三标注单元,用于若所述语义范畴为动作,则与所述事物对应的疑问代词为"怎 么",与所述"怎么"疑问语义等同的其他疑问代词为怎么样、怎样、怎、怎么着、怎的和如何;
[0039] 第四标注单元,用于若所述语义范畴为时间,则与所述时间对应的疑问代词为几 时,与所述"几时"疑问语义等同的其他疑问代词为多会儿、哪会儿和多咱;
[0040]第五标注单元,用于若所述语义范畴为地点场所,则与所述地点场所对应的疑问 代词为哪里,与所述"哪里"疑问语义等同的其他疑问代词为哪和哪儿;
[0041] 第六标注单元,用于若所述语义范畴为数目数量,则与所述数目数量对应的疑问 代词为多少,与所述多少等同的其他疑问代词为几和多;
[0042] 第七标注单元,用于若所述语义范畴为虚词,则将所述语义范畴切分并标注为疑 问运算符。
[0043] 优选地,所述装置还包括:
[0044] 第一划分模块,用于将搜索字符通过预先设置的算法划分为预先设置的疑问对 象;
[0045] 第一搜索模块,用于根据划分后的疑问代词搜索预先存储的字符;
[0046] 第一显示模块,用于若划分后的疑问代词和预先存储的字符对应,则显示与所述 预先存储的字符对应的划分前的待处理的字符。
[0047] 优选地,接收模块,用于接收用户输入的搜索字符;
[0048] 获取模块,用于根据所述搜索字符和相似度计算获取预先存储的字符模型;
[0049] 第二划分模块,用于根据所述预先存储的字符模块划分为预先设置的疑问对象;
[0050] 第二搜索模块,用于根据划分后的疑问代词搜索预先存储的字符;
[0051] 第二显示模块,用于若划分后的疑问代词和预先存储的字符对应,则显示与所述 预先存储的字符对应的划分前的待处理的字符。
[0052] 本发明实施例通过设计多个多层次的疑问语义标注集,每个标注集均由若干现代 汉语中常用的疑问词组成,其中疑问词包括疑问代词;根据待处理语句的各组成部分的疑 问特征,通过所述疑问语义标注集、疑问语义句模库和疑问语义树,将所述待处理语句的各 组成部分切分并标注为疑问对象或疑问运算符;根据所述疑问对象或所述疑问运算符的性 质和规则,通过所述疑问语义标注集、疑问语义句模库和疑问语义树,实现待处理语句的疑 问语义计算,作为一个基础的语义计算方法,本发明实施例可以有效的解决常见的自然语 言处理问题,尤其是在语句的切分标注、自然语言搜索、机器翻译、人机问答等领域具有较 高的使用价值。
【附图说明】
[0053]图1是本发明实施例基于疑问语义的自然语言语义计算的方法第一实施例的流 程不意图;
[0054]图2是本发明实施例基于疑问语义的自然语言语义计算的方法第二实施例的流 程不意图;
[0055] 图3是本发明实施例基于疑问语义的自然语言语义计算的方法第三实施例的流 程不意图;
[0056]图4是本发明实施例基于疑问语义的自然语言语义计算的装置的功能模块示意 图;
[0057]图5是本发明实施例设计模块401的功能模块示意图;
[0058]图6是本发明实施例标注模块402的功能模块示意图;
[0059]图7是本发明实施例基于疑问语义的自然语言语义计算的装置的功能模块示意 图;
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1