基于桥梁语的跨语种专用数据检索系统及方法

文档序号:9375897阅读:270来源:国知局
基于桥梁语的跨语种专用数据检索系统及方法
【技术领域】
[0001]本发明涉及信息检索技术领域,具体地,涉及一种基于桥梁语的跨语种专用数据检索系统及方法。
【背景技术】
[0002]随着经济全球化和我国“一带一路”战略的实施,我国企业、事业单位、个人等各种主体与其他国家的主体的合作越来越多,对国外各种信息的需求更多。不仅中国机构需要检索外国机构信息和技术情报,国外机构也急需检索中国机构信息和技术情报。
[0003]由于各国使用的语言不同,目前获取他国的信息时一般通过两种途径转换为本国语言,一是获取他国语言的信息后通过人为翻译成本国语言;另一种是通过翻译系统检索获取通过翻译系统翻译后的本国语言的信息。前者人工翻译工作量巨大,且质量难以管控,而后者的应用中现有机器翻译系统无法完成高质量的翻译且翻译内容非常有限、支持的语种有限,例如谷歌、微软的在线机器翻译系统的数据库老旧、零散,“谷歌专利”仅基于英语文献库和英语检索,要构建一种支持多语种的翻译系统支持检索,翻译系统的构建难度非常大。

【发明内容】

[0004]本发明的目的就在于克服上述现有技术的缺点和不足,提供一种基于桥梁语的跨语种专用数据检索系统及方法,该跨语种检索系统支持多语种输入,支持用户跨语种检索并向用户输出基于用户所使用语言的检索结果,用户使用方便并且检索结果准确性高。
[0005]本发明解决上述问题所采用的技术方案是:
基于桥梁语的跨语种专用数据检索系统,包括桥梁语检索服务模块、检索客户端、翻译模块,其中:
检索客户端,用于接收用户发送的本地民族语检索请求并发送给翻译模块,接收翻译模块返回的本地民族语检索结果并反馈给用户;
翻译模块,用于将本地民族语检索请求翻译为桥梁语检索请求并发送给桥梁语检索服务模块;将桥梁语检索服务模块返回的桥梁语检索结果翻译为本地民族语检索结果,并返回给检索客户端;
桥梁语检索服务模块,用于存储多国专用数据,以及根据桥梁语检索请求检索出用户所需的专用数据作为桥梁语检索结果返回给翻译模块,所述多国专用数据采用桥梁语存储在桥梁语检索服务模块中。基于桥梁语的跨语种专用数据检索系统支持多语种输入检索请求,用户可直接使用自己的民族语输入即可获得所使用的民族语的检索结果,使用方便而且无需用户翻译;系统采用桥梁语作为中间语言,支持跨语种检索,对用户要求低,并且系统的扩容只需要增加相应的数据服务器或者相应国家的专用数据即可,系统构建难度远小于直接构建民族语之间的翻译系统网难度,而且系统可扩展能力强。
[0006]作为本发明的进一步改进,上述基于桥梁语的跨语种专用数据检索系统还包括数据服务器,用于存储基于各国专用数据,数据服务器中的各国专用数据采用相应国家的通用语言存储;所述翻译模块还用于将数据服务器中的各国专用数据翻译成桥梁语后发送给桥梁语检索服务模块。数据服务器是桥梁语检索服务模块的数据来源,数据服务器中的各国专用数据通过翻译模块翻译为桥梁语后由桥梁语检索服务模块存储,桥梁语检索服务模块在检索时再根据检索请求检索自身存储的各国专用数据获得用户所需的专用数据。
[0007]进一步,所述翻译模块中存储有桥梁语与本地民族语的术语库。本技术方案中,构建术语库支持翻译模块的翻译,可以增加机器翻译的准确性。
[0008]进一步,所述桥梁语采用人工国际语。
[0009]进一步,所述翻译模块中均还设置有翻译记忆库,该翻译记忆库中存储有翻译过的语句及其译文。
[0010]进一步,所述翻译模块中还设置有对翻译记忆库中的译文进行校准的人工校准模块。
[0011]本发明还提供了基于桥梁语的跨语种专用数据检索方法,该方法包括以下步骤:
51、检索客户端接收本地民族语检索请求并发送给翻译模块;
52、翻译模块将本地民族语检索请求翻译成桥梁语检索请求并发送给桥梁语检索服务丰吴块;
53、桥梁语检索服务模块根据桥梁语检索请求检索出用户所需的专用数据作为桥梁语检索结果返回给翻译模块;
54、翻译模块将桥梁语检索服务模块返回的桥梁语检索结果翻译为本地民族语检索结果,并返回给检索客户端;
55、检索客户端接收翻译模块返回的本地民族语检索结果并反馈给用户。
[0012]进一步,上述基于桥梁语的跨语种专用数据检索方法,还包括数据更新步骤:
数据服务器中的各国专用数据有更新时,翻译模块将数据服务器中的更新的专用数据翻译成桥梁语后发送给桥梁语检索服务模块,桥梁语检索服务模块更新多国专用数据;所述数据更新步骤与步骤S1-步骤S5不分先后顺序。
[0013]综上,本发明的有益效果是:
1、本发明支持多语种输入检索请求,用户可直接使用自己的民族语输入即可获得所使用的民族语的检索结果,使用方便而且无需用户翻译;
2、本发明采用桥梁语作为中间语言,支持跨语种检索,使得多个国家的跨语种检索成为可能;
3、本发明采用桥梁语作为中间语言,系统的扩容只需要增加某种或某几种民族语与桥梁语的术语库、再配以相应的数据服务器或者相应的专用数据即可,系统构建难度远小于直接构建民族语之间的翻译系统网难度,而且系统可扩展能力强;
4、本发明的桥梁语采用人工国际语,人工国际语的语义明确语法严谨,翻译模块中使用桥梁语与民族语的专业术语库,翻译准确性好。
【附图说明】
[0014]图1是本发明的一个具体实施例的结构示意图。
【具体实施方式】
[0015]为了解决现有技术中检索外国信息中存在的机器翻译支持语种少、翻译准确性低、翻译系统构建难度大的问题,本发明提供了一种基于桥梁语的跨语种专用数据检索系统及检索方法。该系统的主要思想是:选用一种语义明确、语法严谨的人工国际语作为中间语言,与各个国家或地区的通用语言(文字)进行匹配和转换。用户在检索国外的信息时,使用自己常用的语言(例如通用语言(文字))输入检索请求,该请求转化为中间语言进行检索,检索结果再转化为用户常用的语言返回给用户。
[0016]本发明中的“民族语”是指各国或各地区的通用语言(文字),每种通用语言(文字)为一种民族语;“本地民族语”指发送检索请求的用户所使用的通用语言(文字);“桥梁语”即前述的中间语言;“专用数据”是指某一类型的特定数据,例如但不限于专利数据、公民身份数据、企业身份数据等。
[0017]本发明主要用于跨国和跨语种的信息检索,并且主要针对某一特定类型的专用数据进行检索,例如但不限于仅检索企业组织机构代码或仅检索护照号、仅检索专利等,针对不同的类型的专用数据检索对应采用一个本发明的检索系统实现。下面结合实施例及附图,对本发明作进一步地的详细说明,但本发明的实施方式不限于此。
[0018]【实施例1】
如图1所示,包括桥梁语检索服务模块、检索客户端、翻译模块,所述检索客户端与翻译模块相连,其中:
检索客户端,用于接收用户发送的本地民族语检索请求并发送给翻译模块,接收翻译模块返回的本地民族语检索结果并反馈给用户;
翻译模块,用于将本地民族语检索请求翻译为桥梁语检索请求并发送给桥梁语检索服务模块;将桥梁语检索服务模块返回的桥梁语检索结果翻译为本地民族语检索结果,并发送给检索客户端;
桥梁语检索服务模块,用于存储被译为桥梁语的多国专用数据,以及根据桥梁语检索请求检索出用户所需的专用数据作为桥梁语检索结果返回给翻译模块。本实施例中,桥梁语检索服务模块包括桥梁语中心数据库,所述多国专用数据采用桥梁语存储在桥梁语中心数据库中。
[0019]上述本地民族语检索请求是指检索请求的语言为用户的本地民族语,本地民族语检索结果是指检索结果使用的语言为本地民族语;上述桥梁语检索请求是指检索请求的语言为桥梁语,桥梁语检索结果是指检索结果(即检索出的用户所需的专用数据)使用的语言为桥梁语。本实施例中,所述桥梁语采用人工国际语,人工国际语一般具有语义明确、语法严谨的特点,不同于民族语的各种字、字母的组合,的每个词仅有一个含义,因此其语义非常明确,保证了翻译的准确性。本实施例中可以但不限于采用Lojban、Interlingua、Esperanto等人工国际语。
[0020]上述检索客户端可以有多个,可供世界各国的用户接入,均通过翻译模块连接桥梁语检索服务模块;翻译模块能够将检索客户端输入的检索请求使用的民族语翻译成桥梁语、将桥梁语检索结果翻译为本地民族语检索结果。所述翻译模块中存储有桥梁语与各国的民族语的术语库,该术语库包括但不限于有桥梁语与各国民族语对应的各种术语对,翻译模块根据该术语库对检索请求和检索结果进行翻译。
[0021]进一步地,桥梁语检索服务模块或翻译模块中还可以存储有整个跨语种专用数据检索系统中各模块、服务器的连接方式,在工作过程中桥梁语检索服务模块或翻译模块还对每一个检索请求的来源进行记录,记录时可以但不限于记录检索客户端的编号或IP地址或Mac地址等,便于翻译模块将桥梁语检索结果翻译为本地民族语检索结果后发送给对应的检索客户端;该对应的客户端是指发送来与桥梁语检索结果对应的民本地族语检索请求的检索客户端。也可以在检索请求中包含检索客户端的编号或IP地址或Mac地址等信息,翻译模块在接收检索请求时对检索请求进行解析获取检索客户端的信息,翻译后检索结果就根据该信息返回给对应的检索客户端。前述检索客户端、翻译模块、桥梁语检索服务模块的通信为现有技术,桥梁语检索服务模块根据检索请求进行检索获得所需的专用数据的具体方法采用现有技术中常用的检索方法实现,本实施例中不再赘述。
[0022]本实施例中,基于桥梁语的跨语种专用数据检索系统支持多语种输入检索请求,用户可直接使用自己的民族语输入即可获得所使用的民族语的检索结果,用户检索过程中,检索请求从本地民族语翻译为桥梁语、基于桥梁语检索、检索结果从桥梁语翻译为本地民族语的过程对用户进行屏蔽,用户不需要关心整个检索和翻译过程,各国用户均能使用其母语检索,并得到母语的检索结果,使用方便而且无需用户翻译;本发明采用桥梁语作为中间语言,使得跨语种检索成为可能,并且系统的扩容只需要增加某种或某几种民族语与桥梁语的术语库、增加相应的数据服务
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1