一种文字转换方法及装置的制作方法

文档序号:6483592阅读:141来源:国知局

专利名称::一种文字转换方法及装置的制作方法
技术领域
:本发明涉及计算机及通信领域,特别是涉及文字转换方法及装置。
背景技术
:伴随着信息技术的发展以及全球网络的一体化趋势,机器翻译技术也得以不断提高,翻译软件的辅助翻译作用愈发明显。目前,国内的机器翻译软件就不下百种,根据这些软件的翻译特点,大致可以分为三大类词典翻译类、汉化翻译类和专业翻译类。词典翻译类仅是提供词的查找和翻译,无法提供句子或文章的翻译。对于汉化翻译类,在平时的翻译过程中,句型相同或相似的句子也经常出现,软件大多采用的是语法树结构的翻译内核,这种内核适用于比较有规律的语句,而对于变化多端的自然语言,采用千篇一律的翻译模式,往往不能奏效。另一种以语法模式为主的翻译内核,是基于传统语法树和以自然语言为基础的一种广义语法结构,计算机根据这些规则"举一反三"地进行翻译,在不断"学习"新语法的情况下,高质量的参考译文就出现了。广义语法的基础是"句型"和"类别",这使语法的表现形式更简单、易用,并可分类继承,提高了系统的专业翻译水平。然而该方法仍存在一定的局限性,对灵活的自然语言翻译仍不够准确。专业翻译类是一种人工辅助翻译方式,需要有外语基础的工作人员来辅助完成翻译工作,无法自动完成较理想的翻译工作。综上,现有的翻译方法所实现的翻译结果均不理想。
发明内容本发明实施例提供一种文字转换方法及装置,用于提高自然语言自动翻译的准确性。—种文字转换方法,包括以下步骤根据获得的第一语言文字表达的词得到与词对应的语义项;根据与词对应的语义项获得对应的语义代码或第二语言文字表达的语义项;根据获得的语义代码或第二语言文字表达的语义项获得第二语言文字表达的词;根据第二语言的语法表达规则将第二语言文字表达的词组织成句子。—种用于实现文字转换的装置,包括语义查询模块,用于根据获得的第一语言文字表达的词得到与词对应的语义项;语义转换模块,用于根据与词对应的语义项获得对应的语义代码或第二语言文字表达的语义项;词查找模块,用于根据获得的语义代码或第二语言文字表达的语义项获得第二语言文字表达的词;组织模块,用于根据第二语言的语法规则将第二语言文字表达的词组织成句子。—种用于实现文字转换的系统,包括第一用户设备,用于获得第一语言表达文字的句子;以及获得该句子的句法代码;根据该句法代码以通用句法结构的形式将该句子输出给用户,和/或,根据该句法代码将该句子中每个词对应的语义项输出给用户,并将用户确认后的句法代码发送给服务器和第二用户设备;其中,句法代码用于表示通用句法结构,并且当通用句法结构的各结构对应有词时,句法代码还包括与句子中每个词的语义项对应的语义代码;服务器,用于判断本地是否存有第一语言表达的句子所对应的句法代码;若有,则将所述句子的句法代码发送给第一用户设备;否则,根据第一语言表达的句子获得该句子的句法代码并发送给第一用户设备,或者,指示第一用户设备根据第一语言表达的句子获得该句子的句法代码;第二用户设备,用于根据获得的句法代码中的语义代码获得第二语言文字表达的词,并根据第二语言的语法表达规则和句法代码将第二语言文字表达的词组织成句子。本发明实施例根据第一语言的词查找与其具有相同或相近含义的第二语言的词,从而实现第一语言到第二语言的翻译,并且文字转换结果更准确。附图说明图1为本发明实施例中文字转换方法的主要流程图;图2为本发明实施例中文字转换方法的详细流程图;图3为本发明实施例中第一语言操作界面的示意图;图4为本发明实施例中第二语言操作界面的示意图;图5为本发明实施例中根据用户的输入和指示进行文字转换方法的详细流程图;图6为本发明实施例中包含语义项输入的操作界面的示意图;图7为本发明实施例中装置的主要结构图;图8为本发明实施例中装置的详细结构图;图9为本发明实施例中系统的结构图。具体实施例方式发明人发现,自然语言通讯的基本原则是语义约定通讯,可以首先基于自然语言学常识推导出各种自然语言通用的句子语义约定基本定律,然后再根据这组定律进行多种语言之间的文字转换。定律1:各种自然语言词汇及固定搭配短语的语义,均可用本语言基础词汇进行语义约定(例如,朗曼英语词典用1000多常用词汇对任意词汇、固定搭配短语进行语义约定);并且,一种自然语言的基础词汇,可以对其他语言的任意词汇进行语义约定(用一种自然语言的常用词汇对其他自然语言的任意词汇符号进行语义描述)。定律2:从定律1可以自然引申出基础词汇语义约定定律各种自然语言基础词汇的语义彼此循环约定(例如,"'好''坏'的反义词"。"'父亲'儿子的爸爸"。"'美'美丽、漂亮、好看......."。)。定律3:自然语言语义符号冗余定律在不参照句子以外上下文的前提下,如果一个句子中缺损某个语义符号(包括词汇、语法、句法规则符号表达式)不影响读者理解语义,并且读者知道缺损的是什么符号,则此符号属于习惯性表达冗余符号(例如,汉语中的大多数量词、英语中的不定冠词、不可能实现的虚拟语气表达规则)。对于不同自然语言之间的语义信息通讯而言,此类冗余符号不需要进行语义约定。定律4:只有各种自然语言通用的语法概念才是必要语法概念。虽然各种自然语言的语法概念的表达形式不同,虽然自然语言翻译既可以直译也可以意译。但是,无论直译还是意译,任何一种自然语言翻译的译文语法转换过程,都是在凭空添加原文中没有的译文特殊语法概念。因此,各种自然语言的特殊语法概念实际上均满足"缺损某个词汇、语法、句法规则符号表达式不影响读者理解语义,并且读者知道缺损的是什么符号"的冗余成分判定条件。定律5:任何一个不规范的句子语义表达式(含词汇语义和语法语义)均可以用规范的句子语义表达式进行语义约定(例如,任何一个固定搭配句子、成分缺损句子、口语句子,均可以用一个规范的书面语体句子表达式进行语义约定)。从实用层面上讲,从上述定律出发,将有可能产生一种各种自然语言通用的、能够保障语义信息传递质量的自然语言语义约定翻译方法。本发明实施例通过第一语言文字的词来查找与该词的语义项对应的第二语言文字的词,即根据相同或相近的语义项,将第一语言文字转换为第二语言文字,使得转换结果更准确。本发明实施例中的语义项是指词的含义解释。如,词"好"的含义1:形容词与坏相对,优、精、良、妙、出色(0001-1);含义2:名称友爱、友善、友好、和睦、投机(0001-2)。含义1和含义2所指的内容即为语义项,0001-1和0001-2为语义项对应的语义代码。参见图l,本实施例中文字转换的主要方法流程如下步骤101:根据获得的第一语言文字表达的词得到与词对应的语义项。步骤102:根据与词对应的语义项获得对应的语义代码或第二语言文字表达的语义项。步骤103:根据查找到的语义代码或第二语言文字表达的语义项获得第二语言文字表达的词。步骤104:根据第二语言的语法表达规则将第二语言文字表达的词组织成句子。所述的语法表达规则是指语法概念的表达规则。例如,英语、汉语主要用句子中词汇排序来表达句子成分(如主语、宾语)语法概念,俄语则在词汇符号中直接标识主格、宾格表达句子成分。英语用添加专用符号+动词变形表达"过去完成时"时态概念,汉语则用独立词汇符号"已经....过了"表达"过去完成时"时态概念。其中,第一语言文字表达的词、第一语言文字表达的语义项、语义代码、第二语言文字表达的语义项和第二语言文字表达的词之间的对应关系如表1所示表1<table>tableseeoriginaldocumentpage7</column></row><table>参见图2,本实施例中文字转换的详细方法流程如下步骤201:获得的第一语言文字表达的句子,对该句进行分词处理,得到第一语言文字表达的词。该分词过程可自动完成,也可通过用户的操作实现。若获得的是第一语言文字表达的段或文章,可先将其拆分为句,再进行分词处理。步骤202:根据获得的第一语言文字表达的词得到与词对应的语义项。其中,预先设有词与语义项的对应关系。当该词有多个语义项时,根据该词在句中的词性确定语义项,和/或,从多个语义项中选择使用频率最高的语义项,并更新语义项的使用频率。本实施例中使用频率可以是该语义项的应用次数,或者是该语义项的应用次数与所有语义项的应用次数的和的比值,或者是该语义项在一段时间内的应用次数与所有语义项在该时间段内的应用次数的和的比值,也可以是其它能反映频率性质的参数。步骤203:将获得的第一语言文字表达的词对应到通用句法结构的各结构中。该步骤可以在步骤202之前执行,然后根据词所对应的结构确定词的词性,在步骤202中根据词的词性确定词的语义项。步骤204:根据获得的语义项查找对应的语义代码。其中,预先建立有语义项与语义代码的对应关系。步骤205:根据获得的语义代码获得第二语言文字表达的词。当一个语义项对应有多个词时,可从中选择使用频率最高的词,并更新词的使用频率。同时,可根据需要的词的词性,来选择合适的词。步骤206:根据第二语言的语法表达规则和各词在通用句法结构中所对应的结构,将第二语言文字表达的词组织成句子。第一语言以汉语为例,参见图3所示,3-l中示出了一段文章,该文章可以是用户输入的,也可以是从邮件、即时通信或网页等处获得的。并且,3-l所示的文章已进行了分词处理,该分词处理可以是自动实现,也可通过用户操作来实现,或者在自动实现后由用户对分词结果进行确认,当认为分词结果不正确时,用户可通过修改3-1中的"\"来修改分词结果。3-2中示出了经过分词处理的一句话"女王陛下\要求\我\朗读\以下\咨文",每个词旁的小号字为该词对应的语义项,如"女王陛下"的语义项(即含义)是"名(词性)对女王的尊称"。可以在获得语义项的同时,将获得的词对应到到3-3所示的通用句法结构的各结构中。本实施例中通用句法结构包括主语区、谓语区和宾语区,每个区还包括修饰区、核心区和补充区。其中将句间连词或特殊句法结构词等不确定成分对应到主语区的补充区。3-4所示的结构是对3-3中子句的进一步分析。为了便于模块或设备间的数据传输,本实施例对各结构进行编码,如3-3中按由左至右从上到下的顺序,各结构的编码如Al、A2、A3、B1、B2、B3、C1、C2和C3,句子女王陛下\要求\我\朗读\以下\咨文"中各词的语义项所对应的语义代码如0010-1、0011-1、0012-1、0013-1、0014-1和0015-1,则该句的编码为"A1(),A2(0010-1),A3(),Bl(),B2(0011-1),B3(),Cl(),C2(Al(),A2(0012-1),A3(),Bl(),B2(0013-1),B3(),Cl(0014-1),C2(0015-1),C3()),C3();",多种语言相同含义的语义项可对应相同的语义代码。然后,根据该编码进行文字转换,第二语言以英语为例,参见图4所示。根据语义代码确定第二语言文字表示的语义项,即4-2中小字号所示的内容。然后根据该语义项确定相应的词,即4-2中大字号所示的内容。4-3和4-4示出了获得的词所对应的结构,根据该结构和英语语法,将结构中的内容组阵成4-l中所示的句子。从而实现了中文到英文的翻译,其中图4中的内容为图3中内容的英文译文。图4所示的界面为用户提供了查询功能,如可先在4-l中显示句子,用户可通过点击4-l中的句子或句子中的词来查询该句子的结构、句子中每个词的语义项、和/或句子中每个词对应的结构,查询结果在4-2和/或4-3中显示。用户根据4-2中所示的语义项可更准确的理解词在句子中的含义,从而更准确的理解句子。其中,在步骤203中将获得的第一语言文字表达的词对应到通用句法结构的各结构中的具体实现过程包括确定句子中所有词的所有可能的词性,并确定具有唯一词性的词。如句子"女王陛下\要求\我\朗读\以下\咨文"中,"女王陛下"为名词,"要求"为动词或名词,"我"为代词,"朗读"为动词,"以下"为介词,"咨文"为名词,具有唯一词性的词有"女王陛下"、"我"、"朗读"、"以下"和"咨文"。根据语法表达规则和/或通用句法结构中各结构对词性的要求,确定各词在句子中的成分,较佳的,先确定具有唯一词性的词在句子中的成分,再确定其它词在句子中的成分。如"女王陛下"为名称,可能是主语或宾语,又因为"女王陛下"出现在句首,后接的词"要求"可以有动词词性,则确定"女王陛下"为主语,从而确定"要求"为谓语,"要求"后面的内容应为宾语。代词"我"可能是主语或宾语,因为"我"后接的词"朗读"为动词,则确定在子句"我\朗读\以下\咨文"中"我"为主语,从而确定"朗读"为谓语,"以下\咨文"为宾语。上述举例是根据语法表达规则所设置的判断条件,来确定各词在句子中的成分,也可以将句子中各词的词性与预设的有效句型中各结构的词性按顺序进行匹配,若匹配一致,则可根据匹配成功的有效句型确定句子中各词的成分。如句子"女王陛下\要求\我\朗读\以下\咨文"中各词的词性与有效句型"(主句)主语_名词、(主句)谓_动词、(宾语)子句主语-代词、(宾语)子句谓语-动词、(宾语)子句宾语-名词"的词性匹配一致,或者说匹配程度最高,从而可确定句子"女王陛下\要求\我\朗读\以下\咨文"中各词的句子成分。若一个句子与所有的有效句型均不匹配,或者匹配程度均低于预设的程度门限(如60%),则该句子属于无效句型,由用户重新输入或由用户通过在3-3中的操作来进行结构划分。可根据用户划分后的结构生成新的有效句型。本实施例中图3所示的界面为可操作界面,用户可以通过该界面对其中的内容进行更改。如将3-1中的词用鼠标拖动到3-2或3-3中,或者在3-3中直接输入词,3_2和3_1自动根据3-3中的内容进行相应的输出。当某个词有多个语义项时,在3-2中词的旁边可输出多个语义项,由用户选择确定的语义项,如果用户认为3-2中输出的语义项均不准确时,还可以自行输入语义项。下面是带有用户操作过程的文字转换流程进行详细介绍。参见图5,本实施例中根据用户操作进行文字转换的方法流程如下步骤501:获得的第一语言文字表达的句子,对该句进行分词处理,得到第一语言文字表达的词。若获得的是第一语言文字表达的段或文章,可先将其拆分为句,再进行分词处理。步骤502:根据获得的第一语言文字表达的词得到与词对应的语义项。当该词有多个语义项时,根据用户的操作确定其中的一个语义项。或者,参见图6所示,由用户在6-1的"语义描述"中输入相应的语义项,并将该语义项显示在3-2中。根据用户在6-l中设置的时态等内容,可得到更为准确的转换结果。步骤503:通过用户的拖动操作,将获得的第一语言文字表达的词对应到通用句法结构的各结构中。还可进一步判断拖动后的对应结果是否可满足有效句型词性匹配规则,若不满足,则提示用户重新操作。步骤504:将获得的语义项转换为第二语言文字表达的语义项。该过程可参见图1或图2所示的文字转换流程。步骤505:根据第二语言文字表达的语义项获得第二语言文字表达的词。在该步骤中,将第二语言文字表达的语义项作为第二语言文字表达的词。例如汉语固定搭配"一箭双雕"的语义项是"一个行为达到两个目的",然而可能"一箭双雕"没有对应的英文固定搭配表达,则将"一个行为达到两个目的"翻译成英文,然后在"一箭双雕"出现的位置用"一个行为达到两个目的"的英文表达来代替"一箭双雕"。步骤506:根据第二语言的语法表达规则和各词在通用句法结构中所对应的结构,将第二语言文字表达的词组织成句子。在步骤503后,可以根据获得的语义项获得对应的语义代码。当语义项为用户自行定义的时,根据语义代码的生成规则自动为该语义项生成语义代码,生成的语义代码可唯一标识语义项即可。并建立生成的语义代码与转换后的第二语言文字表达的语义项的对应关系,便于第二语言用户直接查询。其中,语义代码的生成规则有多种,如将用户自行定义的语义项中各词的语义项对应的语义代码顺序组合成新的语义代码,该新的语义代码即为用户自行定义的语义项所对应的语义代码。通过以上介绍了解了文字转换的实现过程,该方法可由一个装置或由多个装置构成的系统实现,下面先对实现该方法的装置进行介绍。参见图7,文字转换装置包括语义查询模块701、语义转换模块702、词查找模块703和组织模块704。语义查询模块701用于根据获得的第一语言文字表达的词得到与词对应的语义项。当得到与词对应的多个语义项时,根据用户的指示从多个语义项中确定一个语义项,或者,根据语义项的使用频率从多个语义项中确定一个使用频率最高的语义项,或者,根据该词在句子中的词性从多个语义项中确定一个语义项。语义转换模块702用于根据与词对应的语义项获得对应的语义代码或第二语言文字表达的语义项。其中语义转换模块702可以包括第一转换子模块,用于根据获得的语义项查找对应的语义代码;第二转换子模块,用于根据获得的语义代码查找对应的第二语言文字表达的语义项。词查找模块703用于根据查找到的语义代码或第二语言文字表达的语义项获得第二语言文字表达的词。组织模块704用于根据第二语言的语法表达规则将第二语言文字表达的词组织成句子。所述装置还包括分词模块705,参见图8所示,分词模块705用于当获得了第一语言文字表达的句子时,对获得的第一语言文字表达的句子进行分词,获得第一语言文字表达的词。所述装置还包括接口模块706,用于为用户提供操作界面,并获得用户输入的句、词和语义项等。例如,通过为用户提供的操作界面,获得用户根据第一语言文字表达的词输入的与词对应的语义项;语义查询模块701还用于根据获得的语义项所包含的词,查找与该词对应的语义项;组织模块704还用于将组织成的句子作为第二语言文字表达的语义项传输给词查找模块;词查找模块703用于将查找到的第二语言文字表达的语义项作为第二语言文字表达的词。接口模块706还用于获得点击组织成的句子中的词的操作。语义查询模块701还用于通过点击组织成的句子中的词来查询该词对应的语义项。所述装置还包括存储模块707,用于存储多种语言的词、语义项和语义代码等及它们之间的对应关系。所述装置还包括结构分析模块708,用于将获得的第一语言文字表达的词对应到通用句法结构的各结构中。组织模块704用于根据第二语言的语法规则和各词在通用句法结构中所对应的结构,将第二语言文字表达的词组织成句子。具体的,组织模块704用于根据第二语言的语法表达规则和包括语义代码的通用句法结构的句法代码,将第二语言文字表达的词组织成句子。接口模块706用于通过为用户提供的操作界面获得用户将获得的词对应到通用句法结构的各结构中的操作。语义查询模块701还可以根据结构分析模块708的结构划分结果确定各词的词性,并根据各词的词性来确定各词的语义项。所述装置中的各模块可以位于多个物理实体中,则该多个物理实体构成了系统。可以将所述装置制成插件,便于在即时通信、邮件和网页等场景中实现多种语言之间的翻译。参见图9,本实施例中文字转换系统包括第一用户设备901、服务器902和第二用户设备903。第一用户设备901用于获得第一语言表达文字的句子;以及获得该句子的句法代码;根据该句法代码以通用句法结构的形式将该句子输出给用户,和/或,根据该句法代码将该句子中每个词对应的语义项输出给用户,并将用户确认后的句法代码发送给服务器902和第二用户设备903;其中,句法代码用于表示通用句法结构,并且当通用句法结构的各结构对应有词时,句法代码还包括与句子中每个词的语义项对应的语义代码。服务器902用于判断本地是否存有第一语言表达的句子所对应的句法代码;若有,则将所述句子的句法代码发送给第一用户设备;否则,根据第一语言表达的句子获得该句子的句法代码并发送给第一用户设备,或者,指示第一用户设备根据第一语言表达的句子获得该句子的句法代码。服务器902还可以保存第一用户设备901发送的句法代码。第二用户设备903用于根据获得的句法代码中的语义代码获得第二语言文字表达的词,并根据第二语言的语法规则和句法代码将第二语言文字表达的词组织成句子。第二用户设备903还用于通过获得点击组织成的句子或句子中的词的操作,来查询该词对应的语义项和/或通用句法结构中的结构并输出给用户。第一用户设备901与第二用户设备903可以是完全相同的设备,只是在不同场景下起着不同的作用。第一用户设备901、服务器902和第二用户设备903之间的信息传输可通过即时通信系统、邮件系统或网页(WEB)系统等实现。用于实现本发明实施例的软件可以存储于软盘、硬盘、光盘和闪存等存储介质。本发明实施例根据第一语言的词查找与其具有相同或相近含义的第二语言的词,从而实现第一语言到第二语言的翻译,并且文字转换结果更准确。当一个词有多个语义项时,可通过使用频率、词性或用户的指示等确定一个最贴切的语义项,根据该语义项获得的第二语言的词也更准确。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若对本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。权利要求一种用于实现文字转换的装置,其特征在于,包括语义查询模块,用于根据获得的第一语言文字表达的词得到与词对应的语义项;语义转换模块,用于根据与词对应的语义项获得对应的语义代码或第二语言文字表达的语义项;词查找模块,用于根据获得的语义代码或第二语言文字表达的语义项获得第二语言文字表达的词;组织模块,用于根据第二语言的语法表达规则将第二语言文字表达的词组织成句子。2.如权利要求1所述的装置,其特征在于,还包括接口模块,用于通过为用户提供的操作界面,获得用户根据第一语言文字表达的词输入的与词对应的语义项;语义查询模块还用于根据获得的语义项所包含的词,查找与该词对应的语义项;组织模块还用于将组织成的句子作为第二语言文字表达的语义项传输给词查找模块;词查找模块用于将获得的第二语言文字表达的语义项作为第二语言文字表达的词。3.如权利要求1所述的装置,其特征在于,还包括结构分析模块,用于将获得的第一语言文字表达的词对应到通用句法结构的各结构中;组织模块用于根据第二语言的语法表达规则和各词在通用句法结构中所对应的结构,将第二语言文字表达的词组织成句子。4.如权利要求3所述的装置,其特征在于,组织模块用于根据第二语言的语法表达规则和包括语义代码的通用句法结构的句法代码,将第二语言文字表达的词组织成句子。5.如权利要求3所述的装置,其特征在于,还包括接口模块,用于通过为用户提供的操作界面获得用户将获得的词对应到通用句法结构的各结构中的操作。6.如权利要求3所述的装置,其特征在于,语义查询模块用于当得到与词对应的多个语义项时,根据用户的指示从多个语义项中确定一个语义项,或者,根据语义项的使用频率从多个语义项中确定一个使用频率最高的语义项,或者,根据该词的词性从多个语义项中确定一个语义项。7.如权利要求1所述的装置,其特征在于,还包括接口模块,用于获得点击组织成的句子或句子中的词的操作;语义查询模块还用于通过点击组织成的句子中的词来查询该词对应的语义项。8.—种文字转换方法,其特征在于,包括以下步骤根据获得的第一语言文字表达的词得到与词对应的语义项;根据与词对应的语义项获得对应的语义代码或第二语言文字表达的语义项;根据获得的语义代码或第二语言文字表达的语义项获得第二语言文字表达的词;根据第二语言的语法规则将第二语言文字表达的词组织成句子。9.如权利要求8所述的文字转换方法,其特征在于,根据获得的第一语言文字表达的词得到与词对应的语义项的步骤包括通过为用户提供的操作界面,获得用户根据第一语言文字表达的词输入的与词对应的语义项;根据与词对应的语义项获得对应的第二语言文字表达的语义项的步骤包括根据获得的语义项所包含的词,查找与该词对应的语义项;根据查找到的语义项查找对应的语义代码或第二语言文字表达的语义项;根据查找到的语义代码或第二语言文字表达的语义项获得第二语言文字表达的词;根据第二语言的语法表达规则将第二语言文字表达的词组织成句子,得到第二语言文字表达的语义项;根据查找到的第二语言文字表达的语义项获得第二语言文字表达的词的步骤包括将查找到的第二语言文字表达的语义项作为第二语言文字表达的词。10.如权利要求8所述的文字转换方法,其特征在于,在根据第二语言的语法表达规则将第二语言文字表达的词组织成句子之前,将获得的第一语言文字表达的词对应到通用句法结构的各结构中;根据第二语言的语法规则将第二语言文字表达的词组织成句子的步骤包括根据第二语言的语法规则和各词在通用句法结构中所对应的结构,将第二语言文字表达的词组织成句子。11.如权利要求io所述的文字转换方法,其特征在于,根据第二语言的语法表达规则和各词在通用句法结构中所对应的结构,将第二语言文字表达的词组织成句子的步骤包括根据第二语言的语法表达规则和包括语义代码的通用句法结构的句法代码,将第二语言文字表达的词组织成句子。12.如权利要求IO所述的文字转换方法,其特征在于,将获得的词对应到通用句法结构的各结构中的步骤包括通过为用户提供的操作界面获得用户将获得的词对应到通用句法结构的各结构中的操作。13.如权利要求8所述的文字转换方法,其特征在于,当得到与词对应的多个语义项时,根据用户的指示从多个语义项中确定一个语义项,或者,根据语义项的使用频率从多个语义项中确定一个使用频率最高的语义项,或者,根据该词的词性从多个语义项中确定一个语义项。14.如权利要求8所述的文字转换方法,其特征在于,还包括步骤通过点击组织成的句子或句子中的词来查询该词对应的语义项和/或通用句法结构中的结构。15.—种用于实现文字转换的系统,其特征在于,包括第一用户设备,用于获得第一语言表达文字的句子;以及获得该句子的句法代码;根据该句法代码以通用句法结构的形式将该句子输出给用户,和/或,根据该句法代码将该句子中每个词对应的语义项输出给用户,并将用户确认后的句法代码发送给服务器和第二用户设备;其中,句法代码用于表示通用句法结构,并且当通用句法结构的各结构对应有词时,句法代码还包括与句子中每个词的语义项对应的语义代码;服务器,用于判断本地是否存有第一语言表达的句子所对应的句法代码;若有,则将所述句子的句法代码发送给第一用户设备;否则,根据第一语言表达的句子获得该句子的句法代码并发送给第一用户设备,或者,指示第一用户设备根据第一语言表达的句子获得该句子的句法代码;第二用户设备,用于根据获得的句法代码中的语义代码获得第二语言文字表达的词,并根据第二语言的语法表达规则和句法代码将第二语言文字表达的词组织成句子。16.如权利要求15所述的系统,其特征在于,第二用户设备还用于通过获得点击组织成的句子或句子中的词的操作,来查询该句子中的词对应的语义项和/或通用句法结构中的结构并输出给用户。全文摘要本发明公开了一种文字转换方法,用于提高自然语言自动翻译的准确性。所述方法包括根据获得的第一语言文字表达的词得到与词对应的语义项;根据与词对应的语义项获得对应的语义代码或第二语言文字表达的语义项;根据获得的语义代码或第二语言文字表达的语义项获得第二语言文字表达的词;根据第二语言的语法规则将第二语言文字表达的词组织成句子。本发明还公开了用于实现所述方法的装置和系统。文档编号G06F17/28GK101777043SQ200910076370公开日2010年7月14日申请日期2009年1月14日优先权日2009年1月14日发明者刘莎申请人:北京思在信息技术有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1