标点符号转换方法及装置制造方法

文档序号:6486274阅读:174来源:国知局
标点符号转换方法及装置制造方法
【专利摘要】本发明涉及一种标点符号转换方法,应用于将文本中以第一语言和/或第二语言输入的标点符号转换成以第三语言输出的标点符号的转换过程中,所述方法包括以下步骤:S1.查找所述文本中以第一语言和/或第二语言输入的标点符号;S2.判断查找到的所述标点符号是否需要转换;以及S3.根据预设的标点符号映射表,将需要转换的所述标点符号转换成以第三语言输出的标点符号,并保持不需要转换的标点符号不变。本发明能够实现在多语言混合情况下对标点符号的简繁转换,解决了混合文本中标点符号被误转的问题,提高了转换效率,同时方便用户对比转换和结果。
【专利说明】标点符号转换方法及装置
【技术领域】
[0001]本发明涉及标点符号处理技术,尤其涉及一种标点符号转换方法及装置。
【背景技术】
[0002]众所周知,目前使用的中文字体有两种,一种是在中国大陆和新加坡等地区使用的简体中文,另一种是在台湾、香港和澳门等地区使用的繁体中文。然而,由于简体中文和繁体中文之间的差异很大,因此,造成了使用这两种文字的用户在信息交流上的隔阂。为了消除这种隔阂,已经研制开发了一些简繁转换工具。通过这些简繁转换工具,可以很容易地实现简体中文和繁体中文之间的转换。此外,随着计算机技术的发展,在一些网站(例如,Google)或文字编辑软件(例如,微软的Microsoft Word)中都会附有这类的简繁转换工具。
[0003]虽然现有的简繁转换工具已经能够较为准确地实现文字间的简繁转换,但目前还没有一款软件能够实现对文本中较复杂的标点符号(例如,双引号)的简繁转换。此外,由于简体中文和繁体中文对标点符号的设置不同,导致了在进行简繁转换时,存在一些标点符号无法被转换或者被转换成乱码的情况,因此,仍需要用户重新对转换后的文本中的标点符号进行查找和判断并做出正确的转换。
[0004]另外,现有的简繁转换工具也无法实现对中文-非中文混合文本中的标点符号进行转换。因为在中文-非中文混合文本中,非中文文本(例如,英文文本)通常使用与中文文本(简体中文或繁体中文)不同的标点符号编码,因此,在转换过程中也同样会出现如上所述的无法转换或转换成乱码的情况,因此,为了保证整体的一致性,同样需要用户重新对转换后的文件中的标点符号进行查找和判断并做出正确的转换。
[0005]综上所述,由于现有技术还无法实现对标点符号的简繁转换,因此,用户仍需花费大量的时间对转换后的文件中的标点符号进行查找和判断并做出正确的转换,因此,有必要提出改进的技术手段以解决此问题。

【发明内容】

[0006]鉴于上述现有技术的缺陷,本发明的主要目的在于提供一种标点符号转换方法及装置,以解决现有技术存在的上述问题。
[0007]本发明针对现有技术中存在的问题,提供一种标点符号转换方法及装置,能够在中文文本和中文-非中文混合文本中实现对标点符号的简繁转换,从而提高了转换效率。
[0008]为实现上述目的,本发明的实施例提供了一种标点符号转换方法,应用于将文本中以第一语言和/或第二语言输入的标点符号转换成以第三语言输出的标点符号的转换过程中,其中所述文本为选自中文文本和中文-非中文混合文本中的一种,所述第一语言和所述第三语言分别为选自简体中文和繁体中文中的一种,所述第二语言为选自非中文语言中的一种,所述方法包括以下步骤:S1.查找所述文本中以第一语言和/或第二语言输入的标点符号;S2.判断查找到的所述标点符号是否需要转换;以及S3.根据预设的标点符号映射表,将需要转换的所述标点符号转换成以第三语言输出的标点符号,并保持不需要转换的标点符号不变。
[0009]本发明的实施例还提供了一种标点符号转换装置,应用于将文本中以第一语言和/或第二语言输入的标点符号转换成以第三语言输出的标点符号的转换过程中,其中所述文本为选自中文文本和中文-非中文混合文本中的一种,所述第一语言和所述第三语言分别为选自简体中文和繁体中文中的一种,所述第二语言为选自非中文语言中的一种,所述装置包括:查找模块,用于查找所述文本中以第一语言和/或第二语言输入的标点符号;判断模块,用于判断查找到的所述标点符号是否需要转换;以及转换模块,用于根据预设的标点符号映射表,将需要转换的所述标点符号转换成以第三语言输出的标点符号,并保持不需要转换的标点符号不变。
[0010]综上所述,本发明的标点符号转换方法及装置能够实现在多种语言的混合情况下对标点符号的简繁转换,从而解决在混合文本中标点符号被误转的问题,并提高了转换效率;此外,还能够对文本中的标点符号加以突出显示,从而便于用户进行对比转换以及校验转换后的结果。
【专利附图】

【附图说明】
[0011]图1为本发明标点符号转换方法的实施例流程图;
[0012]图2为本发明标点符号转换装置的实施例结构框图。
【具体实施方式】
[0013]下面将详细描述本发明的实施例。应当注意,这里描述的实施例只用于举例说明,并不用于限制本发明。
[0014]图1为本发明标点符号转换方法的实施例流程图。本实施例的标点符号转换方法应用于将文本中以第一语言和/或第二语言输入的标点符号转换成以第三语言输出的标点符号的转换过程中,其中所述文本为选自中文文本和中文-非中文混合文本中的一种,所述第一语言和所述第三语言分别为选自简体中文和繁体中文中的一种,所述第二语言为选自非中文语言中的一种。如图所示,所述方法包括以下步骤S1、S2和S3。
[0015]S1.查找文本中以第一语言和/或第二语言输入的标点符号。
[0016]在一个实施例中,根据预设的规则,在文本中对以第一语言和/或第二语言输入的标点符号进行查找。这里,预设的规则是指第一语言和第二语言中所有标点符号对应的编码表,文本可以是中文文本(例如,简体中文文本或繁体中文文本),也可以是中文-非中文混合文本(例如,简体中文-英文、简体中文-德文、繁体中文-法文等);第一语言为选自简体中文和繁体中文中的一种,而第二语言为选自非中文语言(例如,英文、德文、法文等)中的一种。
[0017]在一个实施例中,在所述步骤S I之后、所述步骤S2之前还包括步骤Sll.对查找到的所述标点符号加以突出显示。具体而言,在一个实施例中,当查找到文本中以第一语言和/或第二语言输入的标点符号时,会通过例如弹出对话框的方式提示用户是否对查找到的标点符号加以突出显示,如果用户选择是,则自动将查找到的标点符号标识出颜色,所述颜色可以是例如红色、黄色、蓝色等。需要注意的是,对所查找到的标点符号加以突出显示的过程不仅限于“颜色”标识,也可以使用类似微软的Microsoft Word中的“批注”模式来进行。通过上述突出显示,能够很容易地将文本中的标点符号与文字字符进行区分,使得标点符号能够很清楚地被显示,从而便于后续的判断、转换和校对。此外,突出显示不仅限于对查找到的标点符号来进行,参考上述内容,在一个实施例中,也可以在转换后的输出文本中对标点符号加以突出显示。
[0018]S2.判断查找到的标点符号是否需要转换。
[0019]在一个实施例中,步骤S2具体包括S21.判断以第一语言和/或第二语言输入的标点符号是否全部为中文标点符号,如果是则转步骤S3,否则继续步骤S22 ;S22.判断非中文标点符号间是否包含中文字符或中文-非中文混合字符,如果是则转步骤S3,否则仅转换中文标点符号,而保持非中文标点符号不变。
[0020]参考上述内容,在一个实施例中,可通过以下步骤对所查找到的标点符号进行判断,以确定是否需要进行转换。首先,判断所查找到的标点符号是否全部为中文标点符号(即,简体标点符号或繁体标点符号),如果是,则根据预设的规则将上述以第一语言和/或第二语言输入的中文标点符号转换成以第三语言输出的中文标点符号;如果同时包含中文标点符号和非中文标点符号,则保持其中的非中文标点符号不变,而将中文标点符号转换成以第三语言输出的中文标点符号。这里,第三语言为选自简体中文和繁体中文中的一种。接续,对上述未被转换的非中文标点符号进行判断,如果非中文标点符号中仅包含中文字符(例如,简体或繁体中文的单字、词组或句子等),则将非中文标点符号转换成以第三语言输出的中文标点符号;如果非中文标点符号中仅包含非中文字符(例如,英文单词、词组或句子等),则不需要对其进行转换,即保持非中文标点符号不变;如果非中文标点符号中同时包含有中文字符和非中文字符,则与上述仅包含中文字符的情况一样,将非中文标点符号转换成以第三语言输出的中文标点符号。也就是说,只有当非中文标点符号中仅包含非中文字符时才保持所述非中文标点符号不变,除此之外的其他情况下都需要将非中文标点符号转换成中文标点符号。此外,在一个实施例中,用户也可以直接选择转换所有标点符号。
[0021]S3.根据预设的标点符号映射表,将待转换的标点符号转换成以第三语言输出的标点符号,并保持不需要转换的标点符号不变。
[0022]在一个实施例中,根据预设的标点符号映射表,对待转换的标点符号进行转换。这里所说的标点符号映射表是一张存储有文本中以第一语言和/或第二语言输入的标点符号与以第三语言输出的标点符号 对应的映射关系的表,使得以第一语言和/或第二语言输入的标点符号与以第三语言输出的标点符号相关联;从而能够根据所述映射关系实现对所述标点符号的转换。具体而言,在一个实施例中,简体中文和/或非中文与繁体中文标点符号一一对应的映射关系可以如下表I所示(其中包括了简体繁体中文转换中单引号与双引号的互相转换),表I中的内容仅用于举例说明,而并非用于限制本发明。
[0023]表I[0024]
【权利要求】
1.一种标点符号转换方法,应用于将文本中以第一语言和/或第二语言输入的标点符号转换成以第三语言输出的标点符号的转换过程中,其中所述文本为选自中文文本和中文-非中文混合文本中的一种,所述第一语言和所述第三语言分别为选自简体中文和繁体中文中的一种,所述第二语言为选自非中文语言中的一种,所述方法包括以下步骤:S1.查找所述文本中以第一语言和/或第二语言输入的标点符号;S2.判断查找到的所述标点符号是否需要转换;以及S3.根据预设的标点符号映射表,将需要转换的所述标点符号转换成以第三语言输出的标点符号,并保持不需要转换的标点符号不变。
2.根据权利要求1所述的标点符号转换方法,其中,所述步骤S2具体包括:S21.判断所述以第一语言和/或第二语言输入的标点符号是否全部为中文标点符号,如果是则转步骤S3,否则继续步骤S22 ;S22.判断所述非中文标点符号间是否包含中文字符或中文-非中文混合字符,如果是则转步骤S3,否则仅转换所述中文标点符号,而保持所述非中文标点符号不变。
3.根据权利要求1所述的标点符号转换方法,其中,所述步骤SI之后、所述步骤S2之前还包括:Sll.对查找到的所述标点符号加以突出显示。
4.根据权利要求3所述的方法,其中,所述步骤S3之后还包括:S4.在所述转换过程完成之后,判断是否对所述以第三语言输出的标点符号进行了修改且修改是否正确,如果是则确定是否清除所述突出显示。
5.根据权利要求1所述的方法,其中,所述预设的标点符号映射表用于存储所述文本中以第一语言和/或第二语言输入的标点符号与以第三语言输出的标点符号对应的映射关系,使所述以第一语言和/或第二语言输入的标点符号与所述以第三语言输出的标点符号相关联;则所述步骤S3根据所述映射关系实现对所述标点符号的转换。
6.一种标点符号转换装置,应用于将文本中以第一语言和/或第二语言输入的标点符号转换成以第三语言输出的标点符号的转换过程中,其中所述文本为选自中文文本和中文-非中文混合文本中的一种,所述第一语言和所述第三语言分别为选自简体中文和繁体中文中的一种,所述第二语言为选自非中文语言中的一种,所述装置包括:查找模块,用于查找所述文本中以第一语言和/或第二语言输入的标点符号;判断模块,用于判断查找到的所述标点符号是否需要转换;以及转换模块,用于根据预设的标点符号映射表,将需要转换的所述标点符号转换成以第三语言输出的标点符号,并保持不需要转换的标点符号不变。
7.根据权利要求6所述的标点符号转换装置,其中,所述判断模块包括:标点判断单元,用于判断所述以第一语言和/或第二语言输入的标点符号是否全部为中文标点符号,如果是则通过所述转换模块进行转换;字符判断单元,用于判断非中文标点符号间是否包含中文字符或中文-非中文混合字符,如果是则通过所述转换模块进行转换。
8.根据权利要求6所述的标点符号转换装置,其中,所述装置还包括:标识模块,用于对查找到的所述标点符号加以突出显示。
9.根据权利要求8所述的标点符号转换装置,其中,所述装置还包括:清除模块,用于在所述转换过程完成之后,判断是否对所述以第三语言输出的标点符号进行了修改且修改是否正确,如果是则确定是否清除所述突出显示。
10.根据权利要求6所述的标点符号转换装置,其中,所述预设的标点符号映射表用于存储所述文本中以第一语言和/或第二语言输入的标点符号与以第三语言输出的标点符号一一对应的映射关系,使所述以第一语言和/或第二语言输入的标点符号与所述以第三语言输出的标点符号相关联;则所述转换模块根据所述映射关系实现对所述标点符号的转换。
【文档编号】G06F17/22GK103514145SQ201210200998
【公开日】2014年1月15日 申请日期:2012年6月18日 优先权日:2012年6月18日
【发明者】朱纯深, 郝天永 申请人:香港城市大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1