语言歧义消除系统及方法与流程

文档序号:11464382阅读:230来源:国知局
语言歧义消除系统及方法与流程
本发明涉及一种语言识别技术,尤其涉及一种可以消除语言歧义的系统及方法。

背景技术:
现有的语言理解系统通常根据已设定语言逻辑关系对所输入的文字进行语义判断。然而,因为中文语言的灵活性,在对涉及动作的语句进行分析时往往会发生歧义。比如:在对语句“我爸爸在理发”的理解中就会因在现有语言逻辑关系中语句的主语既可以是相关动作的发出者也可以是承受者而产生:1、我爸爸给别人理发;2、理发师给我爸爸理发的两种意思判断,从而无法做出唯一的语义判断导致系统陷入死循环。

技术实现要素:
鉴于以上内容,有必要提供一种可消除语句歧义的语言歧义消除系统及方法。一种语言歧义消除系统,应用于电子设备中以消除电子设备进行语义分析时所产生的歧义。该语言歧义消除系统包括:词语拆分模块,用于将输入的语句拆分为多个具有确定意思的词语单元;语义分析模块,用于按照语言逻辑对拆分后的词语单元进行分析以生成具有明确意思的语义判断,对具有歧义的多个语义判断贴上标签并确定引起歧义的关键词语;信息提取模块,用于从已生成的语义判断和词语单元中挑选出与预设的关键词类别相关的关键信息;及辅助判断模块,用于从所挑选的关键信息中检索与关键词语相关的内容以确定所述关键词语在语句中的真实意思,所述语义分析模块根据所确定的关键词语在语句中的真实意思消除具有歧义的语义判断。一种语言歧义消除方法,应用于电子设备中以消除电子设备进行语义分析时所产生的歧义。所述语言歧义消除方法包括如下步骤:将所输入的语句拆分为多个词语单元。按照预设的语言逻辑关系对拆分后的多个词语单元进行分析以生成具有明确意思的语义判断,对具有歧义的多个语义判断贴上标签并确定引起歧义的关键词语。从已生成的语义判断中挑选出与预设的关键词类别对应的关键信息。根据挑选出来的关键信息确定所述关键词语在对应语句中的真实意思。根据所述关键词语在对应语句中的真实意思消除具有歧义的语义判断。相较于现有技术,本发明提供的语言歧义消除系统、语言歧义消除方法及使用该语言歧义消除系统的电子设备通过从之前已分析好的语义判断中挑选出与引起歧义的关键词语相关的关键信息来解析关键词语在当前语句中的真实意思,从而消除由中文表达的灵活性所引起歧义,提高了智能语言分析的准确性。附图说明图1是本发明语言歧义消除系统运行环境的硬件架构图。图2是本发明语言歧义消除方法较佳实施例的流程图。主要元件符号说明电子设备1语言歧义消除系统10临时存储模块101词语拆分模块102语义分析模块103信息提取模块104辅助判断模块105输入装置12存储器14基本语言资料库140临时语言资料库141原始词库区1410语义库区1411关键信息库区1412处理器16如下具体实施方式将结合上述附图进一步说明本发明。具体实施方式如图1所示,本发明实施方式所提供的语言歧义消除系统10运行于电子设备1中。所述电子设备1包括输入装置12、存储器14及处理器16。所述输入装置12、存储器14及处理器16等元件之间直接地或间接地电性连接以进行数据的传输和交换。在本实施方式中,所述电子设备1可以是计算机或移动智能终端等。所述输入装置12用于输入需要分析的语言信息。输入方式可为语音输入或文本输入。对应地,所述输入装置12可为,但不限于,麦克风、键盘、触控屏幕等。所述存储器14可为硬盘、闪存或记忆卡等存储介质,用于存储通过输入装置12接收的语言信息、一预先设定的基本语言资料库140以及在语言歧义消除系统10运行过程中所产生的临时资料。所述基本语言资料库140中存储有大量具有明确定义的词语单元及语言逻辑关系。所述语言歧义消除系统10存储于存储器14中并被处理器16执行,也可以是固化在处理器上的韧体。所述语言歧义消除系统10包括临时存储模块101、词语拆分模块102、语义分析模块103、信息提取模块104及辅助判断模块105。可以理解的是,所述语言歧义消除系统10也可嵌入电子设备1的操作系统中。所述临时存储模块101用于在每次开始对一段输入的文字进行语言分析时于所述存储器14内建立一临时语言资料库141。所述临时语言资料库141用于存储在进行语言分析时所产生的临时资料。该临时资料包括拆分语句所形成的词语单元、从所拆分的词语单元中提取出的涉及语义判断的关键词语、根据已有的语言逻辑关系已作出的具有明确意思的语义判断等。所述临时存储模块101在进行完该次语义分析后将所建立的临时语言资料库141清空,为下一次语义分析处理做准备。所述词语拆分模块102用于根据所述基本语言资料库140中已有的词语单元及语言逻辑关系对经由所述输入装置12接收的语句进行词语拆分,以将完整的语句拆分为多个词语单元。所述词语拆分模块102于所述临时语言资料库141中开设一原始词库区1410以存储拆分后的词语单元。所述原始词库区1410内的词语单元作为本次语义分析的原始资料。所述语义分析模块103用于根据基本语言资料库140中已有的语言逻辑关系对原始词库中的词语单元进行分析。所述语义分析模块103在所述临时语言资料库141中开设一语义库区1411,并将通过现有的语言逻辑关系可以得出明确意思的语义判断按照出现的先后次序存储在所述语义库区1411内。所述语义库区1411内的具有明确意思的语义判断可作为后续语义分析的参考。当在分析语句过程中,根据预设的语法逻辑关系可以生成两个或以上的语义判断时意味着出现语言歧义。比如:对“我爸爸在理发”这句话进行分析时,根据预设语法逻辑关系可以生成两个语义判断:1、我爸爸是理发动作的发出者,即“我爸爸给别人理发”;2、我爸爸是理发动作的承受者,即“别人给我爸爸理发”。此时,所述语义分析模块103将具有歧义的这两个语义判断进行存储并贴上歧义标签。此外,所述语义分析模块103会判断出导致歧义的关键词语,比如:“我爸爸”及“理发”,以待后续过程确定其真实意思。所述信息提取模块104用于从语义库区1411及原始词库区1410中挑选出与预先设定的关键词类别相关的关键信息,并在所述临时语言资料库141中开设一关键信息库区1412以存储挑选出来的关键信息。所述关键词类别可根据较容易引起歧义的内容来确定,比如:人物的职业、身份等,所述信息提取模块104在原始词库区1410及语义库区1411挑选与所述关键词类别相关的内容作为当前文字的语义背景以消除语句中出现的歧义。在本实施方式中,所设定的关键词类别为职业,所挑选出的是与职业或所提供的职业服务相关的信息。比如,关于“我爸爸”职业的语义判断:“我爸爸是理发师”或关于“我爸爸”的职业服务需求:“我爸爸需要理发”等。可以理解的是,所述关键信息可为词语单元或由语义分析模块在词语单元基础上做出的具有明确意思的语义判断。所述辅助判断模块105在关键信息库区1412中检索与以所述关键词语相关的内容,并根据所检索到的内容来判断该关键词语在语句中的真实意思。比如:若检索到“我爸爸是理发师”的关键信息,则可以解析在语句中理发的动作是由“我爸爸”发出的。所述语义分析模块103根据辅助判断模块105所作出的关键词语的意思解析保留与之匹配的语义判断,取消歧义标签,并将其他有歧义的语义判断隐藏以备后续查验。请参阅图2,是本发明实施方式所提供的语言歧义消除方法的流程图。步骤S01,接收语句并建立临时语言资料库,所述临时存储模块101在每次开始进行语言分析时于所述存储器14内建立一临时语言资料库以暂时存储在语言分析过程中所产生的临时资料。步骤S02,拆分语句,所述词语拆分模块102根据所述基本语言资料库中已有的词语单元及语言逻辑关系将语句拆分为多个词语单元。比如:所输入语句为“我爸爸在理发”,根据基本语言资料库,将其拆分为“我”、“爸爸”、“在”、“理发”这几个词语单元。拆分后的词语单元存储在所述临时语言资料库中的原始词库区内。步骤S03,分析语义,所述语义分析模块103根据基本语言资料库140中预设的语言逻辑关系对原始词库区1410中的词语单元进行分析以得出具有明确意思的语义判断,并将所述语义判断按照出现的先后次序存储在临时语言资料库的语义库区内。步骤S04,确定关键词语,当分析过程中出现歧义时,所述语义分析模块103将具有歧义的多个语义判断进行存储并贴上标签。此外,所述语义分析模块103会记录下导致歧义的关键词语,并调用辅助判断模块105以判断该关键词语在语句中的真实意思。比如:当分析语句:“我爸爸在理发”时因为缺省了宾语,无法直接确定理发动作的承受者,按照预设的语言逻辑关系可以生成两种不同的语义判断:1、我爸爸给别人理发;2、别人给我爸爸理发。此时,所述语义分析模块103会根据歧义的分歧所在判断引起歧义的词语单元作为关键词语并将其发送至辅助判断模块105。比如,在本例子中引起歧义的分歧所在为“理发”动作的发出者及承受者无法确定,则判断“理发”为关键词语,。步骤S05,提取关键信息,所述信息提取模块104从语义库区1411或原始词库区1410中挑选出与预先设定的关键词类别对应的关键信息,并存储在所述关键信息库区1412中。以所预设的关键词类别是“职业”为例,所述信息提取模块104从语义库区1411或原始词库区1410中挑选出与职业相关的关键信息。所述关键信息可以是与职业或所提供的职业服务有关的信息。比如:“我爸爸是理发师”、“我爸爸头发太长”、“我爸爸需要理发”等。步骤S06,判断关键词语的真实意思,所述辅助判断模块105根据所挑选出来的关键信息来判断歧义的关键词语的真实意思。具体地,当所提取的关键信息没有关于主语职业的相关内容,而关键词语为一与某职业相关的动作时,则判断主语为该动作的承受者。当所述提取的关键信息表明语句中的主语从事的某一职业,而关键词语为与该职业相关的动作时,则判断主语为该动作的发出者。当所提取的关键信息表明主语需要某种职业服务,而关键词语为与该职业相关的动作时。则判断主语为该动作的承受者。比如:如果所提取的关键信息中没有任何与主语“我爸爸”职业相关的内容,则判断关键词语“理发”的承受者是主语“我爸爸”;如果所提取的关键信息为“我爸爸是理发师”时,则判断关键词语“理发”是主语“我爸爸”发出的;如果所提取的关键信息为“我爸爸想理发”或“我爸爸头发太长”时,则判断关键词语“理发”的承受者为主语“我爸爸”。步骤S07,消除歧义,所述语义分析模块103根据辅助判断模块105所作出的关键词语的意思解析保留与之匹配的语义判断,取消歧义标签,并将其他有歧义的语义判断隐藏以备后续查验。与现有技术相比,本发明提供的语言歧义消除系统10、语言歧义消除方法及使用该语言歧义消除系统10的电子设备通过从之前已分析好的语义判断中挑选出与引起歧义的关键词语相关的关键信息来解析关键词语在当前语句中的真实意思,从而消除由中文表达的灵活性所引起歧义,提高了智能语言分析的准确性。以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1