信息匹配方法、装置及终端的制作方法

文档序号:10655087阅读:407来源:国知局
信息匹配方法、装置及终端的制作方法
【专利摘要】本申请公开了信息匹配方法、装置及终端,所述方法包括:获取原文的各组原文语句;获取每组原文语句对应的每组特征信息;将每组特征信息分别与所述原文的译文匹配,获取每组特征信息所匹配的译文语句;将每组特征信息所匹配的译文语句和所对应的原文语句,作为彼此的相邻语句输出。实施本申请,可将每组原文语句与其译文语句相邻输出,便于用户对照学习原文和译文进而提高相关应用的智能化程度和用户体验度。
【专利说明】
信息匹配方法、装置及终端
技术领域
[0001]本申请涉及数据处理技术领域,尤其涉及信息匹配方法、装置及终端。
【背景技术】
[0002]随着智能终端的发展和网络应用的普及,用户可以通过终端上安装的各种应用实现各种业务操作,例如网络教学应用、翻译应用等。通过上述应用可向用户展示古文(如古诗词、文言文)的译文(白话文)。
[0003]上述应用在展示古文和译文时,通常是将整篇原文和整篇译文分别独立展示,这样难以直观的将每句古文的译文对应每局古文展示给用户,不便于用户对照学习古文和译文,会降低应用的智能化程度和用户体验度。

【发明内容】

[0004]本申请提供信息匹配方法、装置及终端,以解决现有网络教学应用、翻译应用等智能化程度低的问题。
[0005]根据本申请实施例的第一方面,提供一种信息匹配方法,包括:
[0006]获取原文的各组原文语句,其中,一组原文语句为所述原文的一个片段;
[0007]获取每组原文语句对应的每组特征信息;
[0008]将每组特征信息分别与所述原文的译文匹配,获取每组特征信息所匹配的译文语句;
[0009]将每组特征信息所匹配的译文语句和所对应的原文语句,作为彼此的相邻语句输出。
[0010]在一个实施例中,所述获取每组原文语句对应的特征信息,包括:
[0011]获取构成每组原文语句的各个文字信息,生成每组原文语句对应的每组特征信息,其中,每个文字信息为标点符号、或单个文字、或多个文字组成的词组;或,
[0012]获取构成每组原文语句的各个文字信息的译文信息,生成每组原文语句对应的每组特征信息。
[0013]在一个实施例中,所述将每组特征信息分别与所述原文的译文匹配,获取每组特征信息所匹配的译文语句,包括:
[0014]从所述译文中查询每组特征信息;
[0015]根据查询结果,将含有同一组特征信息的译文语句,确定为与所述同一组特征信息匹配的译文语句。
[0016]在一个实施例中,所述从所述译文中查询每组特征信息,包括:
[0017]根据每个特征信息所对应的原文语句在所述原文中的位置次序,按从前到后的次序从所述译文中查询每组特征信息;
[0018]查询到一个特征信息,则记录含有该特征信息的译文语句,并终止对该特征信息的查询。
[0019]在一个实施例中,所述根据查询结果,将含有同一组特征信息的译文语句,确定为与所述同一组特征信息匹配的译文语句,包括:
[0020]查询完M组特征信息,则根据查询结果,将含有同一组特征信息的译文语句,确定为与所述同一组特征信息匹配的译文语句,M为大于O且小于原文语句总组数的整数;
[0021]所述方法还包括:
[0022]将其他组的特征信息与所确定译文语句之外的其他译文匹配,获取每组特征信息所匹配的译文语句,所述其他组的特征信息为已匹配译文语句的各组特征信息之外的特征
?目息O
[0023]在一个实施例中,所述根据查询结果,将含有同一组特征信息的译文语句,确定为与所述同一组特征信息匹配的译文语句,包括:
[0024]若任一译文语句同时含有K组特征信息,则计算所述任一译文语句所含的每组特征信息的信息数目与该组特征信息的信息总数的比例,K为大于I且小于原文语句总组数的整数;
[0025]将所述任一译文语句确定为比例最高的一组特征信息所匹配的译文语句。
[0026]在一个实施例中,所述计算所述任一译文语句所含的每组特征信息的信息数目与该组特征信息的信息总数的比例前,所述方法还包括:
[0027]若所述特征信息为单个文字或多个文字组成的词组,则将所述特征信息的信息数目值设置为I;
[0028]若所述特征信息为单个标点符号,则将所述特征信息的信息数目值设置为J,其中,J大于O且小于I。
[0029]根据本申请实施例的第二方面,提供一种信息匹配装置,包括:
[0030]原文语句获取模块,用于获取原文的各组原文语句,其中,一组原文语句为所述原文的一个片段;
[0031]特征信息获取模块,用于获取每组原文语句对应的每组特征信息;
[0032]译文语句匹配模块,用于将每组特征信息分别与所述原文的译文匹配,获取每组特征信息所匹配的译文语句;
[0033]语句输出模块,用于将每组特征信息所匹配的译文语句和所对应的原文语句,作为彼此的相邻语句输出。
[0034]在一个实施例中,所述特征信息获取模块包括:
[0035]第一信息获取子模块,用于获取构成每组原文语句的各个文字信息,生成每组原文语句对应的每组特征信息,其中,每个文字信息为标点符号、或单个文字、或多个文字组成的词组;或,
[0036]第二信息获取子模块,用于获取构成每组原文语句的各个文字信息的译文信息,生成每组原文语句对应的每组特征信息。
[0037]在一个实施例中,所述译文语句匹配模块包括:
[0038]特征信息查询模块,用于从所述译文中查询每组特征信息;
[0039]译文语句确定模块,用于根据查询结果,将含有同一组特征信息的译文语句,确定为与所述同一组特征信息匹配的译文语句。
[0040]在一个实施例中,所述特征信息查询模块包括:[0041 ]第一特征信息查询子模块,用于根据每个特征信息所对应的原文语句在所述原文中的位置次序,按从前到后的次序从所述译文中查询每组特征信息;
[0042]结果记录模块,用于在查询到一个特征信息时,记录含有该特征信息的译文语句,并通知所述第一特征信息查询模块终止对该特征信息的查询。
[0043]在一个实施例中,所述译文语句确定模块包括:
[0044]第一译文语句确定子模块,用于在查询完M组特征信息时,根据查询结果,将含有同一组特征信息的译文语句,确定为与所述同一组特征信息匹配的译文语句,M为大于O且小于原文语句总组数的整数;
[0045]所述装置还包括:
[0046]译文语句获取模块,用于将其他组的特征信息与所确定译文语句之外的其他译文匹配,获取每组特征信息所匹配的译文语句,所述其他组的特征信息为已匹配译文语句的各组特征信息之外的特征信息。
[0047]在一个实施例中,所述译文语句确定模块,包括:
[0048]比例计算模块,用于在任一译文语句同时含有K组特征信息时,计算所述任一译文语句所含的每组特征信息的信息数目与该组特征信息的信息总数的比例,K为大于I且小于原文语句总组数的整数;
[0049]第二译文语句确定子模块,用于将所述任一译文语句确定为比例最高的一组特征信息所匹配的译文语句。
[0050]在一个实施例中,所述装置还包括:
[0051 ]第一数目值设置模块,用于在所述特征信息为单个文字或多个文字组成的词组时,将所述特征信息的信息数目值设置为I;
[0052]第二数目值设置模块,用于在所述特征信息为单个标点符号时,将所述特征信息的信息数目值设置为J,其中,J大于O且小于I。
[0053 ]根据本申请实施例的第三方面,提供一种终端,包括:
[0054]处理器;
[0055]用于存储所述处理器可执行指令的存储器;
[0056]其中,所述处理器被配置为:
[0057]获取原文的各组原文语句,其中,一组原文语句为所述原文的一个片段;
[0058]获取每组原文语句对应的每组特征信息;
[0059]将每组特征信息分别与所述原文的译文匹配,获取每组特征信息所匹配的译文语句;
[0060]将每组特征信息所匹配的译文语句和所对应的原文语句,作为彼此的相邻语句输出。
[0061]应用本申请实施例,获取原文的各组原文语句,以每组原文语句对应的每组特征信息与所述原文的译文匹配,获取每组特征信息所匹配的译文语句,再将每组特征信息所匹配的译文语句和所对应的原文语句,作为彼此的相邻语句输出。可将每组原文语句与其译文语句相邻输出,便于用户对照学习原和译文,进而提高相关应用的智能化程度和用户体验度。
[0062]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
【附图说明】
[0063]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
[0064]图1a是本申请信息匹配方法的一个实施例流程图;
[0065]图1b是本申请实施例中信息匹配方法的原文语句显示界面示意图;
[0066]图1c是本申请实施例中信息匹配方法的一译文语句匹配界面示意图;
[0067]图1d是本申请实施例中信息匹配方法的另一译文语句匹配界面示意图;
[0068]图1e是本申请实施例中信息匹配方法的语句输出界面示意图;
[0069]图2是本申请信息匹配方法的另一个实施例流程图;
[0070]图3是本申请信息匹配装置所在终端的一种硬件结构图;
[0071 ]图4是本申请信息匹配装置的一个实施例框图;
[0072]图5是本申请信息匹配装置的另一个实施例框图。
【具体实施方式】
[0073]这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
[0074]在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0075]应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
[0076]参见图la,图1a是本申请信息匹配方法的一个实施例流程图,该实施例可以用于终端中,包括以下步骤101-104:
[0077]步骤101:获取原文的各组原文语句,其中,一组原文语句为所述原文的一个片段。
[0078]本申请实施例涉及的终端,具有显示原文和译文、语音播放原文和译文、实时翻译原文等功能中至少一项功能,如:具有上述任一项功能的家教机、手持阅读器、语音播放器、计算机、平板电脑、移动电话等类似设备。
[0079]实际应用时,原文和译文可以是同一类文字形式的文字内容,例如:原文为中文的古诗词或文言文,译文为中文的白话文;原文和译文也可以不是同一类文字形式的文字内容,原文可以为第一类文字形式的文字内容,译文可以为所述文字内容由第一类文字形式变换为第二类文字形式所得的文字内容,例如:原文为中文论文,译文为所述中文论文对应的英文论文。
[0080]在本申请的实施例中,各组原文语句为组成所述原文的语句,所述原文可以是一篇完整的文字内容,也可以是一篇完整的文字内容的一部分。原文的一个片段可包括原文的一句或多句完整文字内容,也可包括原文的一句完整文字内容中的部分文字内容,如图1 b的原文语句文本框中的标识为A、B、C、D的四组原文语句。
[0081]获取所述原文的各组原文语句时,可实时将所述原文划分成N组原文语句,N为大于或等于2的整数。也可从预先划分所得的原文语句库中,调取所述原文的各组原文语句。
[0082]为了快速获得各组原文语句,在一个例子中,获取原文的各组原文语句的可选实现方式包括:
[0083]搜索所述原文中的预设标点符号。
[0084]在搜索到的每个所述预设标点符号所处的原文位置对所述原文进行分割,生成各组原文语句。
[0085]本例子,通过标点符号可快速将原文分割为多组原文语句。
[0086]实际应用时,所述预设标点符号可以是引号、句号、问号、感叹号、逗号、顿号、分号等标点符号中的至少一种。在某些例子中,为了使每组原文语句包括完整的语句,可设置各类预设标点符号的优先级,例如:如果搜索到对称性标点符号,如引号,则将引号内所包含的原文语句划分为一组原文语句,无论其间是否包括其他预设标点符号。
[0087]如图1b所示,以古诗《秋宵月下有怀》的部分内容为所述原文,如图1b的原文文本框内所示内容,以任一标点符号为所述预设标点符号对所述原文进行分割,可获得如图1b的原文语句文本框中的标识为A、B、C、D的四组原文语句。在其他例子中,还可以句号为所述预设标点符号对所述原文进行分割,获得各组原文语句。
[0088]对于某些原文,会获得语句长度较小的原文语句(短句),而在匹配译文语句时短句易误匹配,为了尽量避免误匹配,在另一例子中,所述在搜索到的每个所述预设标点符号所处的原文位置对所述原文进行分割,生成各组原文语句的可选实现方式包括:
[0089]若分割所得的任一组原文语句的语句长度小于预设长度阈值,则将所述任一组原文语句并入相邻的一组原文语句,所述相邻的一组原文语句与所述任一组原文语句在所述原文中的位置相邻。
[0090]本例子,将小于预设长度阈值的一组原文语句划分到相邻组,可避免短句误与其他原文语句争夺译文语句。
[0091]实际应用时,所述预设长度阈值可以是S个字符的字符长度,S为大于I且小于5的整数。在其他实施例中,可根据实际需要设定所述预设长度阈值。
[0092]步骤102:获取每组原文语句对应的每组特征信息。
[0093]本申请实施例中,所述特征信息可以是原文语句中所含的字符和词组,也可以是原文语句中所含字词对应的译文信息。
[0094]在一个例子中,可通过以下至少一种可选实现方式获取每组原文语句对应的特征信息:
[0095]方式一:获取构成每组原文语句的各个文字信息,生成每组原文语句对应的每组特征信息,其中,每个文字信息为标点符号、或单个文字、或多个文字组成的词组。
[0096]方式二:获取构成每组原文语句的各个文字信息的译文信息,生成每组原文语句对应的每组特征信息。
[0097]其中,所述原文为文言文,译文信息可以是直接将文言文中字符翻译成白话文所得的直译信息,可不考虑任何语法规则,如“曰”的直译信息为“说”。本申请实施例也可预先建立一份文言文中的特殊字符的直译信息表,在获取每组原文语句对应的每组特征信息的过程中,可直接从直译信息表中查询对应的直译信息为特征信息。
[0098]步骤103:将每组特征信息分别与所述原文的译文匹配,获取每组特征信息所匹配的译文语句。
[0099]本申请实施例中,译文语句为组成所述译文的语句,即译文的一个片段,译文的一个片段可包括译文的一句或多句完整文字内容,也可包括译文的一句完整文字内容中的部分文字内容。
[0100]实际应用时,将每组特征信息分别与所述原文的译文匹配的可选实现方式可包括:从所述译文中查找每组特征信息,根据查询结果获取每组特征信息所匹配的译文语句,匹配时,可将含有每组特征信息的译文语句确定为该组特征信息匹配的译文语句。在本申请的其他实施例中,还可通过预设的匹配算法,计算构成所述译文的文字信息与每组特征信息的匹配度,确定每组特征信息所匹配的译文语句。
[0101]在一个例子中,将每组特征信息分别与所述原文的译文匹配,获取每组特征信息所匹配的译文语句的可选实现方式可包括:
[0102]从所述译文中查询每组特征信息。
[0103]根据查询结果,将含有同一组特征信息的译文语句,确定为与所述同一组特征信息匹配的译文语句。
[0104]本例子,通过从译文中查询每组特征信息,可快速确定每组特征信息所匹配的译文语句。
[0105]其中,为了提高匹配效率,在匹配译文语句时匹配连续的译文内容,若所述译文内有出现次序在任一组特征信息所匹配的译文语句之前,且未匹配到特征信息的语句,则将该语句确定为与所述任一组特征信息匹配的译文语句。可避免有剩余的译文语句未匹配到特征信息。
[0106]如图1c所示,以古诗《秋宵月下有怀》的部分内容为所述原文,获得如原文语句文本框中的A、B、C、D四组原文语句后,各组特征信息构成各组原文语句的文字信息,可用各组原文语句的组名称A、B、C、D标识,在如图1c所示的译文语句匹配界面的译文中查询每组特征信息,查询到一个特征信息,则在对应的译文位置记录对应的组名称,查询结果如图1c所示。从图1c可发现,A、B两组特征信息中的同一特征信息在译文中经过了多次匹配。由图1c可知,根据查询结果,难以快速准确地确定各组特征信息匹配的译文语句,需要排除误匹配的译文语句。
[0107]为了提高匹配效率,尽可能避免误匹配,在另一个例子中,所述从所述译文中查询每组特征信息的可选实现方式包括:
[0108]根据每个特征信息所对应的原文语句在所述原文中的位置次序,按从前到后的次序从所述译文中查询每组特征信息。
[0109]查询到一个特征信息,则记录含有该特征信息的译文语句,终止对该特征信息的查询。
[0110]本例子的查询结果如图1d的译文语句匹配界面所示,通过该查询结果,可快速确定各组特征信息匹配的译文语句。
[0111]其中,若一特征信息为构成原文语句的文字信息,则该特征信息所对应的原文语句在所述原文中的位置次序,可为该特征信息在原文中的出现次序,若一特征信息为构成原文语句的文字信息的译文信息,则该特征信息所对应的原文语句在所述原文中的位置次序,可为所述文字信息在原文中的位置次序。查询译文的起始位置为译文的头位置。
[0112]在其他实施例中,在从所述译文中查询每组特征信息时,若该组特征信息含有构成原文语句的同一文字信息的多个译文信息,在所述译文中查询到同一文字信息的一个译文信息,则终止查询该文字信息的其他译文信息,避免误匹配。
[0113]在其他场景中,同一译文语句中可能同时含有多组特征信息,为了准确确定该组译文语句匹配的一组特征信息,在另一个例子中,所述根据查询结果,将含有同一组特征信息的译文语句,确定为与所述同一组特征信息匹配的译文语句的可选实现方式可包括:
[0114]若任一译文语句同时含有K组特征信息,则计算所述任一译文语句所含的每组特征信息的信息数目与该组特征信息的信息总数的比例,K为大于I且小于原文语句总组数的整数。
[0115]将所述任一译文语句确定为比例最高的一组特征信息所匹配的译文语句。
[0116]其中,每个特征信息的信息数目值可为I,一组特征信息的信息总数可为该组所含的所有特征信息的信息数目值的总和。
[0117]在某些场景中,同一译文语句含两组特征信息,两组特征信息的比例相等,但其中一组特征信息内包括符号特征信息,为了快速确定该译文语句所匹配的一组特征信息,在另一个例子中,所述计算所述任一译文语句所含的每组特征信息的信息数目与该组特征信息的信息总数的比例前,所述信息匹配方法还包括:
[0118]若所述特征信息为单个文字或多个文字组成的词组,则将所述特征信息的信息数目值设置为I。
[0119]若所述特征信息为单个标点符号,则将所述特征信息的信息数目值设置为J,其中,J大于O且小于I。
[0120]本例子适当降低标点符号的信息数目值,可提高匹配准确度。在其他例子,若所述特征信息为构成原文语句的文字信息的译文信息,则将则将所述特征信息的信息数目值设置为L,其中,L大于J且小于I。
[0121]步骤104:将每组特征信息所匹配的译文语句和所对应的原文语句,作为彼此的相邻语句输出。
[0122]其中,对语句的输出包括界面显示、视频播放、音频播放等,因此,在将译文语句和原文语句作为彼此的相邻语句输出时,可将其直接以字符形式输出,也可将其转换为音频、视频输出。
[0123]为了将译文语句和原文语句作为彼此的相邻语句输出显示,在一个例子中,所述将每组特征信息所匹配的译文语句和所对应的原文语句,作为彼此的相邻语句输出,包括:
[0124]将每组特征信息所匹配的译文语句和所对应的原文语句映射到显示界面的相邻显示位置。
[0125]根据映射结果,在所述显示界面对应显示各组特征信息所匹配的译文语句和所对应的原文语句。
[0126]本例子,可快速将译文语句和原文语句作为彼此的相邻语句输出显示,输出效果如图1e的显示界面所示。
[0127]在其他例子中,还可以表格形式或其他排版形式,将译文语句和原文语句作为彼此的相邻语句输出显示。
[0128]在某些实施例中,在将每组特征信息分别与所述原文的译文匹配,若完全查询完各组特征特征信息,再确定匹配的译文语句,会将每组特征信息分别在所述译文的全文中查询,这样匹配的数据处理量较大,会降低信息匹配效率,为了降低匹配时的数据处理量,可查询完M组特征信息后,即进行一次译文语句匹配,相应的本申请实施例的信息匹配方法可参见图2,包括以下步骤201-207:
[0129]步骤201:获取原文的各组原文语句,其中,一组原文语句为所述原文的一个片段。
[0130]步骤202:获取每组原文语句对应的每组特征信息。
[0131]步骤203:根据每个特征信息所对应的原文语句在所述原文中的位置次序,按从前到后的次序从所述译文中查询每组特征信息。
[0132]步骤204:查询到一个特征信息,则记录含有该特征信息的译文语句,并终止对该特征信息的查询,若未查询完M组特征信息,M为大于O且小于原文语句总组数的整数,则返回步骤203,查询完M组特征信息,则执行步骤205。
[0133]步骤205:根据查询结果,将含有同一组特征信息的译文语句,确定为与所述同一组特征信息匹配的译文语句。
[0134]本步骤的查询结果,为所述译文中查询M组特征信息所得的查询结果。确定与某一组特征信息匹配的译文语句的方式可与附图1a所对应的实施例中的方式相同。
[0135]步骤206:将其他组的特征信息与所确定译文语句之外的其他译文匹配,获取每组特征信息所匹配的译文语句,所述其他组的特征信息为已匹配译文语句的各组特征信息之外的特征信息。
[0136]若其他组的特征信息为V组的特征信息,V大于I,则可再次通过步骤203至205的操作,查询获取所述其他组的特征信息匹配的译文语句。
[0137]步骤207:将每组特征信息所匹配的译文语句和所对应的原文语句,作为彼此的相邻语句输出。
[0138]由上述实施例可知,本申请通过获取原文的各组原文语句,以每组原文语句对应的每组特征信息与所述原文的译文匹配,获取每组特征信息所匹配的译文语句,再将每组特征信息所匹配的译文语句和所对应的原文语句,作为彼此的相邻语句输出。可将每组原文语句与其译文语句相邻输出,便于用户对照学习原文和译文,进而提高相关应用的智能化程度和用户体验度。
[0139]此外,本申请实施例的信息匹配方法,将原文的各组原文语句分别与所述原文的译文匹配,将匹配出的译文语句与对应的原文语句作为相邻语句输出。为了实现译文语句与原文语句相邻输出,也可以先将每段原文分块显示,相邻两段原文之间留有空白显示空间,对应每段原文,由用户触发相应位置的翻译控件,然后响应用户的触发操作,通过翻译工具即时翻译该段原文,生成译文并在该段原文的邻近空白位置显示生成的译文。
[0140]而本申请实施例的信息匹配方法的实现过程,无需分别对应每段原文实时生成译文,可直接生成整篇原文的译文,也无需用户的实时触发操作,仅需每组原文语句对应的每组特征信息与所述原文的整篇译文匹配,即可匹配出每组原文语句的译文语句,然后将每组原文语句与匹配出的译文语句作为彼此的相邻语句输出。能在短时间内对大量原文和译文进行有效匹配,可有效提高应用效率。
[0141]与前述信息匹配方法的实施例相对应,本申请还提供了信息匹配装置的实施例。
[0142]本申请信息匹配装置的实施例可以应用在终端上。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在终端的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,如图3所示,为本申请信息匹配装置所在终端的一种硬件结构图,除了图3所示的处理器310、网络接口320、内存330、以及非易失性存储器340之外,实施例中装置所在的终端通常根据该终端的实际功能,还可以包括其他硬件,对此不再赘述。
[0143]参见图4,图4是本申请信息匹配装置的一个实施例框图,该装置可包括:原文语句获取模块410、特征信息获取模块420、译文语句匹配模块430和语句输出模块440。
[0144]其中,原文语句获取模块410,用于获取原文的各组原文语句,其中,一组原文语句为所述原文的一个片段。
[0145]特征信息获取模块420,用于获取每组原文语句对应的每组特征信息。
[0146]译文语句匹配模块430,用于将每组特征信息分别与所述原文的译文匹配,获取每组特征信息所匹配的译文语句。
[0147]语句输出模块440,用于将每组特征信息所匹配的译文语句和所对应的原文语句,作为彼此的相邻语句输出。
[0148]在一个可选的实现方式中,原文语句获取模块410可包括(图4中未示出):
[0149]符号搜索模块,用于搜索所述原文中的预设标点符号。
[0150]语句生成模块,用于在搜索到的每个所述预设标点符号所处的原文位置对所述原文进行分割,生成各组原文语句。
[0151]其中,所述语句生成模包括(图4中未示出):
[0152]语句生成子模块,用于在分割所得的任一组原文语句的语句长度小于预设长度阈值时,将所述任一组原文语句并入相邻的一组原文语句,所述相邻的一组原文语句与所述任一组原文语句在所述原文中的位置相邻。
[0153]在另一个可选的实现方式中,本申请实施例的特征信息获取模块420可包括(图4中未示出):
[0154]第一信息获取子模块,用于获取构成每组原文语句的各个文字信息,生成每组原文语句对应的每组特征信息,其中,每个文字信息为标点符号、或单个文字、或多个文字组成的词组;或,
[0155]第二信息获取子模块,用于获取构成每组原文语句的各个文字信息的译文信息,生成每组原文语句对应的每组特征信息。
[0156]在另一个可选的实现方式中,本申请实施例的译文语句匹配模块430可包括(图4中未示出):
[0157]特征信息查询模块,用于从所述译文中查询每组特征信息。
[0158]译文语句确定模块,用于根据查询结果,将含有同一组特征信息的译文语句,确定为与所述同一组特征信息匹配的译文语句。
[0159]其中,所述特征信息查询模块包括(图4中未示出):
[0160]第一特征信息查询子模块,用于根据每个特征信息所对应的原文语句在所述原文中的位置次序,按从前到后的次序从所述译文中查询每组特征信息。
[0161]结果记录模块,用于在查询到一个特征信息时,记录含有该特征信息的译文语句,并通知所述第一特征信息查询子模块终止对该特征信息的查询。
[0162]在另一个可选的实现方式中,所述译文语句确定模块,包括(图4中未示出):
[0163]比例计算模块,用于在任一译文语句同时含有K组特征信息时,计算所述任一译文语句所含的每组特征信息的信息数目与该组特征信息的信息总数的比例,K为大于I且小于原文语句总组数的整数。
[0164]第二译文语句确定子模块,用于将所述任一译文语句确定为比例最高的一组特征信息所匹配的译文语句。
[0165]在另一个可选的实现方式中,本实施例的信息匹配装置可包括(图4中未示出):
[0166]第一数目值设置模块,用于在所述特征信息为单个文字或多个文字组成的词组时,将所述特征信息的信息数目值设置为I。
[0167]第二数目值设置模块,用于在所述特征信息为单个标点符号时,将所述特征信息的信息数目值设置为J,其中,J大于O且小于I。
[0168]在另一个可选的实现方式中,本实施例的语句输出模块440可包括(图4中未示出):
[0169]显示位置映射模块,用于将每组特征信息所匹配的译文语句和所对应的原文语句映射到显示界面的相邻显示位置。
[0170]显示模块,用于根据映射结果,在所述显示界面对应显示各组特征信息所匹配的译文语句和所对应的原文语句。
[0171]参见图5,图5是本申请信息匹配装置的另一个实施例框图,该装置可包括:原文语句获取模块510、特征信息获取模块520、第一特征信息查询子模块530、结果记录模块540、第一译文语句确定子模块550、译文语句获取模块560和语句输出模块570。
[0172]其中,原文语句获取模块510,用于获取原文的各组原文语句,其中,一组原文语句为所述原文的一个片段。
[0173]特征信息获取模块520,用于获取每组原文语句对应的每组特征信息。
[0174]第一特征信息查询子模块530,用于根据每个特征信息所对应的原文语句在所述原文中的位置次序,按从前到后的次序从所述译文中查询每组特征信息。
[0175]结果记录模块540,用于在查询到一个特征信息时,记录含有该特征信息的译文语句,并通知所述第一特征信息查询子模块终止对该特征信息的查询。
[0176]第一译文语句确定子模块550,用于在查询完M组特征信息时,根据查询结果,将含有同一组特征信息的译文语句,确定为与所述同一组特征信息匹配的译文语句,M为大于O且小于原文语句总组数的整数。
[0177]译文语句获取模块560,用于将其他组的特征信息与所确定译文语句之外的其他译文匹配,获取每组特征信息所匹配的译文语句,所述其他组的特征信息为已匹配译文语句的各组特征信息之外的特征信息。
[0178]语句输出模块570,用于将每组特征信息所匹配的译文语句和所对应的原文语句,作为彼此的相邻语句输出。
[0179]上述装置中各个模块的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
[0180]对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本申请方案的目的。
[0181]本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
[0182]应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。
【主权项】
1.一种信息匹配方法,其特征在于,包括: 获取原文的各组原文语句,其中,一组原文语句为所述原文的一个片段; 获取每组原文语句对应的每组特征信息; 将每组特征信息分别与所述原文的译文匹配,获取每组特征信息所匹配的译文语句; 将每组特征信息所匹配的译文语句和所对应的原文语句,作为彼此的相邻语句输出。2.根据权利要求1所述的方法,其特征在于,所述获取每组原文语句对应的特征信息,包括: 获取构成每组原文语句的各个文字信息,生成每组原文语句对应的每组特征信息,其中,每个文字信息为标点符号、或单个文字、或多个文字组成的词组;或, 获取构成每组原文语句的各个文字信息的译文信息,生成每组原文语句对应的每组特征信息。3.根据权利要求1所述的方法,其特征在于,所述将每组特征信息分别与所述原文的译文匹配,获取每组特征信息所匹配的译文语句,包括: 从所述译文中查询每组特征信息; 根据查询结果,将含有同一组特征信息的译文语句,确定为与所述同一组特征信息匹配的译文语句。4.根据权利要求3所述的方法,其特征在于,所述从所述译文中查询每组特征信息,包括: 根据每个特征信息所对应的原文语句在所述原文中的位置次序,按从前到后的次序从所述译文中查询每组特征信息; 查询到一个特征信息,则记录含有该特征信息的译文语句,并终止对该特征信息的查询。5.根据权利要求4所述的方法,其特征在于,所述根据查询结果,将含有同一组特征信息的译文语句,确定为与所述同一组特征信息匹配的译文语句,包括: 查询完M组特征信息,则根据查询结果,将含有同一组特征信息的译文语句,确定为与所述同一组特征信息匹配的译文语句,M为大于O且小于原文语句总组数的整数; 所述方法还包括: 将其他组的特征信息与所确定的译文语句之外的其他译文匹配,获取每组特征信息所匹配的译文语句,所述其他组的特征信息为已匹配译文语句的各组特征信息之外的特征信息。6.根据权利要求3至5中任一项所述的方法,其特征在于,所述根据查询结果,将含有同一组特征信息的译文语句,确定为与所述同一组特征信息匹配的译文语句,包括: 若任一译文语句同时含有K组特征信息,则计算所述任一译文语句所含的每组特征信息的信息数目与该组特征信息的信息总数的比例,其中,K为大于I且小于原文语句总组数的整数; 将所述任一译文语句确定为比例最高的一组特征信息所匹配的译文语句。7.根据权利要求6所述的方法,其特征在于,所述计算所述任一译文语句所含的每组特征信息的信息数目与该组特征信息的信息总数的比例前,所述方法还包括: 若所述特征信息为单个文字或多个文字组成的词组,则将所述特征信息的信息数目值设置为I; 若所述特征信息为单个标点符号,则将所述特征信息的信息数目值设置为J,其中,J大于O且小于I。8.一种信息匹配装置,其特征在于,包括: 原文语句获取模块,用于获取原文的各组原文语句,其中,一组原文语句为所述原文的一个片段; 特征信息获取模块,用于获取每组原文语句对应的每组特征信息; 译文语句匹配模块,用于将每组特征信息分别与所述原文的译文匹配,获取每组特征信息所匹配的译文语句; 语句输出模块,用于将每组特征信息所匹配的译文语句和所对应的原文语句,作为彼此的相邻语句输出。9.根据权利要求8所述的装置,其特征在于,所述特征信息获取模块包括: 第一信息获取子模块,用于获取构成每组原文语句的各个文字信息,生成每组原文语句对应的每组特征信息,其中,每个文字信息为标点符号、或单个文字、或多个文字组成的词组;或, 第二信息获取子模块,用于获取构成每组原文语句的各个文字信息的译文信息,生成每组原文语句对应的每组特征信息。10.根据权利要求8所述的装置,其特征在于,所述译文语句匹配模块包括: 特征信息查询模块,用于从所述译文中查询每组特征信息; 译文语句确定模块,用于根据查询结果,将含有同一组特征信息的译文语句,确定为与所述同一组特征信息匹配的译文语句。11.根据权利要求10所述的装置,其特征在于,所述特征信息查询模块包括: 第一特征信息查询子模块,用于根据每个特征信息所对应的原文语句在所述原文中的位置次序,按从前到后的次序从所述译文中查询每组特征信息; 结果记录模块,用于在查询到一个特征信息时,记录含有该特征信息的译文语句,并通知所述第一特征信息查询子模块终止对该特征信息的查询。12.根据权利要求11所述的装置,其特征在于,所述译文语句确定模块包括: 第一译文语句确定子模块,用于在查询完M组特征信息时,根据查询结果,将含有同一组特征信息的译文语句,确定为与所述同一组特征信息匹配的译文语句,M为大于O且小于原文语句总组数的整数; 所述装置还包括: 译文语句获取模块,用于将其他组的特征信息与所确定译文语句之外的其他译文匹配,获取每组特征信息所匹配的译文语句,所述其他组的特征信息为已匹配译文语句的各组特征信息之外的特征信息。13.根据权利要求10至12中任一项所述的装置,其特征在于,所述译文语句确定模块,包括: 比例计算模块,用于在任一译文语句同时含有K组特征信息时,计算所述任一译文语句所含的每组特征信息的信息数目与该组特征信息的信息总数的比例,κ大于I且小于原文语句总组数的整数; 第二译文语句确定子模块,用于将所述任一译文语句确定为比例最高的一组特征信息所匹配的译文语句。14.根据权利要求13所述的装置,其特征在于,所述装置还包括: 第一数目值设置模块,用于在所述特征信息为单个文字或多个文字组成的词组时,将所述特征信息的信息数目值设置为I; 第二数目值设置模块,用于在所述特征信息为单个标点符号时,将所述特征信息的信息数目值设置为J,其中,J大于O且小于I。15.一种终端,其特征在于,包括: 处理器; 用于存储所述处理器可执行指令的存储器; 其中,所述处理器被配置为: 获取原文的各组原文语句,其中,一组原文语句为所述原文的一个片段; 获取每组原文语句对应的每组特征信息; 将每组特征信息分别与所述原文的译文匹配,获取每组特征信息所匹配的译文语句; 将每组特征信息所匹配的译文语句和所对应的原文语句,作为彼此的相邻语句输出。
【文档编号】G06F17/28GK106021238SQ201610507811
【公开日】2016年10月12日
【申请日】2016年6月28日
【发明人】覃炜
【申请人】广州华多网络科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1