应用电费自助缴费终端柯尔克孜文翻译引擎的方法

文档序号:6526323阅读:433来源:国知局
应用电费自助缴费终端柯尔克孜文翻译引擎的方法
【专利摘要】本发明公开了应用电费自助缴费终端柯尔克孜文翻译引擎的方法,1、从自助缴费终端选择显示类型如汉文、柯尔克孜文;2、若选择汉文,则无需进行机器翻译;若选择柯尔克孜文,则启动翻译引擎对数据库里的信息进行翻译,并显示在终端界面上。本发明大大减少人工互译汉文-柯尔克孜文的成本和时间。
【专利说明】 应用电费自助缴费终端柯尔克孜文翻译引擎的方法

【技术领域】
[0001]本发明涉及语言翻译技术,特别是应用电费自助缴费终端柯尔克孜文翻译引擎的方法。

【背景技术】
[0002]机器翻译的研究历史可以追溯到20世纪三四十年代。20世纪30年代初,法国科学家G.B.阿尔楚尼提出了用机器来进行翻译的想法。1933年,苏联发明家Π.Π.特罗扬斯基设计了把一种语言翻译成另一种语言的机器,并在同年9月5日登记了他的发明;但是,由于30年代技术水平还很低,他的翻译机没有制成。1946年,第一台现代电子计算机ENIAC诞生,随后不久,信息论的先驱、美国科学家W.Weaver和英国工程师A.D.Booth在讨论电子计算机的应用范围时,于1947年提出了利用计算机进行语言自动翻译的想法。1949年,W.Weaver发表《翻译备忘录》,正式提出机器翻译的思想。走过六十年的风风雨雨,机器翻译经历了一条曲折而漫长的发展道路。
[0003]随着Internet的普遍应用,世界经济一体化进程的加速以及国际社会交流的日渐频繁,传统的人工作业的方式已经远远不能满足迅猛增长的翻译需求,人们对于机器翻译的需求空前增长,机器翻译迎来了一个新的发展机遇。国际性的关于机器翻译研究的会议频繁召开,相继推出了一系列机器翻译软件,例如“google”、“yahoo”、“百度”。
[0004]上世界90年代,在国外对翻译引擎的研究和工作展开得比较多,研究成果广泛地应用到各个行业和日常生活中。在国内,针对汉语的自然语言处理研究中已经一部分工作涉及计算机和嵌入式系统中进行机器翻译。在新疆维吾尔自治区,由于地理和其他原因,信息化的起步开始得较晚,这方面的需求也没有明显地体现出来。本世纪初十年,该地区的信息化加快,各个行业中自然语言处理的需求非常紧急。目前为止,没有进行过关于实时机器翻译的研究,更没有事实应用的现象。此工作的基础是基于统计的汉哈机器翻译。该工作还需要建立电力相关的平行语料库。这些基础工作在翻译引擎中应用。翻译引擎的设计中,首先用GIZA++对平行语料库进行对接,第二步利用IBM模型制造翻译模型。第三步通过Moses译码机输出结果。
[0005]新疆维吾尔自治区是多民族居住的地区,随着社会向信息化社会发展,在西部大开发的推进下,基于少数民族文的IT行业进入快速发展的时期。在新疆维吾尔自治区电力系统中用电用户的分布比较广,13个地州公司,89个县公司、营业区,业务覆盖用户数约378万户,电力自助缴费终端的应用很大程度上减少了电力公司收电费成本。但是由于新疆是中国多民族多语言的省区,汉族与维族各占40%,剩下20%是其他民族,使用语言有汉语、维吾尔语、哈萨克语等,其中吐鲁番、哈密、阿克苏、巴州、疆南、和田六地州是居住少数民族同志较多的地区,大部分的少数民族同志不会汉语,使电力自助缴费终端的推广受到阻碍。多语种(维哈柯)自助缴费终端来说,疆内有建设银行等银行业有了初步的推广应用,但目前的电力行业还是以汉语版本为主,没有提供具有本地化支持的自助缴费终端。目前为止,新疆维吾尔自治区电力行业中还没有汉语-柯尔克孜语自助缴费终端,一部分原因归于嵌入式系统中进行机器翻译的研究还不够深入,对信息的实时翻译准确率得不到保证。


【发明内容】

[0006]本发明的目的在于提供一种应用电费自助缴费终端柯尔克孜文翻译引擎的方法,大大减少人工互译汉文-柯尔克孜文的成本和时间。
[0007]本发明的目的是这样实现的:一种应用电费自助缴费终端柯尔克孜文翻译引擎的方法,1、从自助缴费终端选择显示类型如汉文、柯尔克孜文;2、若选择汉文,则无需进行机器翻译;若选择柯尔克孜文,则启动翻译引擎对数据库里的信息进行翻译,并显示在终端界面上。
[0008]本发明在新疆维吾尔自治区范围内,少数民族语言的电表,哈汉双语营销系统已经开始推广和应用。该工作是少数民族语言电力业务标准化的有效保障,该系统可以适应到其他少数民族语言,比如维吾尔语,柯尔克孜语等等。在新疆维吾尔自治区范围内,少数民族语言的电表,哈汉双语营销系统已经开始推广和应用。本发明是少数民族语言电力业务标准化的有效保障,本发明使用词典和双语实例库,对基于实例的机器翻译技术进行研究,面向电力行业自助终端的机器翻译引擎。本发明应用广泛,可对给予的柯尔克孜文字资料进行词法分析,分词,根据预料的知识进行翻译,并输出结果,其应用范围是电力行业自助缴费终端信息,大大减少人工互译汉文-柯尔克孜文的成本和时间。

【专利附图】

【附图说明】
[0009]下面将结合附图对本发明作进一步说明。
[0010]图1为本发明的工作流程图;
图2为本发明翻译模型形成的工作流程图。

【具体实施方式】
[0011]一种应用电费自助缴费终端柯尔克孜文翻译引擎的方法,如图1所示,1、从自助缴费终端选择显示类型如汉文、柯尔克孜文;2、若选择汉文,则无需进行机器翻译;若选择柯尔克孜文,则启动翻译引擎对数据库里的信息进行翻译,并显示在终端界面上。
[0012]如图2所示:本发明的翻译模型的形成包括训练模型和基于统计翻译模型的翻译部分。
[0013]训练模型:①建立大量的柯尔克孜文语料库。②对已建立的柯尔克孜文语料库,在SRILM算法的基础上建立柯尔克孜语的语言模型。③需要大量的平行语料库来训练翻译模型,该发明中的资料均来自于新疆维吾尔自治区电力系统中的相关规则,电力系统中发表的文档和法律条款,这些资料都是以汉哈文对齐的,具体如下所示:
科学用电常识安全用电常识节约用电常识电网调度管理条例电力设施保护条例中华人民共和国电力法电力供应与使用条例
电网调度管理条例
电力设施保护条例
汉哈专用名词辞典
国家电网公司供电服务“十项承诺”
汉哈专用名词辞典国家电网公司供电服务“十项承诺”
上述全部文字资料通过人工对接,用于训练。
[0014]④对平行语料库进行基于Mkcls算法的单词分类。⑤用GIZA++实现了 IBM模型Γ5的所有代码,在生成源语言语目标语言之间翻译概率的同时,产生了翻译模型。
[0015]翻译部分:①从汉文数据库提取相应的汉文信息。②对汉文进行词法分析。③通过Moses译码机实现汉-哈翻译,并显示柯尔克孜文的翻译结果。
【权利要求】
1.一种应用电费自助缴费终端柯尔克孜文翻译引擎的方法,其特征在于:1、从自助缴 费终端选择显示类型如汉文、柯尔克孜文;2、若选择汉文,则无需进行机器翻译;若选择柯 尔克孜文,则启动翻译引擎对数据库里的信息进行翻译,并显示在终端界面上。
【文档编号】G06F3/0481GK104298661SQ201310740810
【公开日】2015年1月21日 申请日期:2013年12月29日 优先权日:2013年12月29日
【发明者】席小刚, 阿布都哈力力·阿布都热依木, 钟方伟 申请人:新疆信息产业有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1