数据处理系统和数据处理方法

文档序号:2819762阅读:725来源:国知局
专利名称:数据处理系统和数据处理方法
技术领域
本发明涉及用于处理多种语言的一种构造简单的数据处理系统和数据处理方法。
在许多情况下,需要计算机处理在多种语言下编码的字符串数据。随着卡拉OK系统在世界上更加流行,对能用于多种语言下的卡拉OK系统的需求日益增加。并且,同时,强烈需要这样一种卡拉OK系统,其允许许多人规定歌名、检索歌曲信息并且用他们自己的语言显示歌词,从而来自各国的人们可以在同一地点享受卡拉OK。
能处理多种语言的计算机必须能够处理根据某种专门的编码方法的那些语言中的所有字符。这要求计算机把字符转换为由特定位数构成的二进制代码系统。这种处理称为编码。这些基本代码中的一种是图4中所示的字母数字和假名(ANK)代码。
如图4中所示,该ANK代码中的各个字符,是用一个8位(一字节)的字符代码表示的。根据其在描述该字符的ANK编码表中的位置,对应于各字符的8位字符代码是用二维(即水平和垂直)坐标值表示的。也就是说,在ANK代码里,一个8位字符代码的高位4位代表水平坐标值,而低位4位代表垂直坐标值。这两个坐标值各由十六进制数表示,十六进制数由10个数字字符0至9和6个字母字符A至F组成。例如,在ANK代码中,对应于假名字符“ア”的字符代码是用十六进制B1(H)表示的,因为该假名字符的水平坐标值为B而且垂直坐标值为1。
ANK编码的问题在于,尽管它几乎包括英语中所需的全部字符(大写和小写字母字符、数字字符以及特殊符号),但是因为它只包括片假名字符它是不适用于日语的。这是因为字符的数量随着语言而变化。
更具体地,在英语中大约使用200个字符,包括大写/小写字母字符和特殊符号,而在日语中使用片假名字符并使用平假名字符和大约7000个汉字字符。在许多亚洲国家里,一种语言由许多字符组成。例如,朝鲜语至少需要大约2300个常用的由首音(initialsounds)、中间音(intermediate sounds)和尾音(end sound)组合的朝鲜语字符。
因此,对于诸如使用汉字字符的日语和汉语或者使用朝鲜语字符的朝鲜语,由于这些语言使用大量的字符,不可能利用8位ANK代码唯一地识别所有的字符。为了解决这个问题,已经使用能代表更多字符的16位(双字节)二进制代码对汉字字符和朝鲜文字符进行编码。
双字节代码系统的一个例子是移位JIS(日本工业标准)代码,即日语汉字字符标准。移位JIS代码是通过在保持由JISC6226定义的JIS代码的内容的情况下移动字符的字符定义位置建立的。也就是说,在移位JIS代码里,各个汉字字符的两个字节中第一个字节从它的定义位置移动到一个ANK代码未使用的未定义区域里。然后把第二个字节移动到ANK代码中未定义ANK代码控制字符、符号或空格的位置上去。这个方法使得有可能从各个汉字字符代码的第一个字节中识别出该字符代码是一个日语汉字字符。
其它已知的双字节代码系统包括GB 2312-80和KS C5601,GB 2312-80是用于表示大约7500个汉语汉字字符的汉字字符标准,而KS C5601是用于表示大约2600个朝鲜语字符和大约3000个汉字字符的朝鲜字符标准。
但是,不能够在同一个计算机上使用这些各具有自己的代码设置的双字节代码系统。此外,利用32位表示大量字符的国际编码字符集(ISO 10646-1/图5)在处理上是复杂的。为了解决这些问题,近来提出把统一码用作为标准以允许在同一个计算机上使用多种语言。
统一码是由美国国家标准学会(ANSI)提出的16位(双字节)代码系统。具有一个由256×256种组合构成的称为基本语言平面的大代码表的统一码的目的是,单靠该基本语言平面来表示所有语言的字符代码设置。在该统一码中,某些等效的但是形状不同的汉字代码字符,如日语中的“恶”和汉语中的“恶,被处理为相同形状的字符。这些形状不同的字符是用称为CJK(中日朝)综合汉字代码的一种公用代码表示的。
但是,用统一码实现处理多种语言的数据处理系统存在下述问题。统一码所使用的特殊代码是和常规的代码系统不兼容的,因而不可能利用现有的资源。
另外,由于统一码对所有语言的所有字符只使用一个大的基本多语言平面,数据量增大了并且系统结构变得复杂。
另一个问题是有时忽略了多个语言之间的细微差别。在上面所述的CJK综合汉字代码里,日语、朝鲜语和汉语中使用的多个形状不同的字符被综合成一个汉字字符。因此,不可能区分在几种语言中具有细小差异的汉字字符。图6表示不同形状字符的一个例子。
因此,当在上述三种语言的一种语言下显示数据时,有时在那种语言中不使用的形状不同的字符出现在所显示的数据中。
这样,在现有技术中,不可能在一个计算机上同时处理象日语、朝鲜语、汉语等等的多种双字节语言。
本发明寻求结合上述的现有技术解决这些问题。本发明的一个目的是提供一种处理多种语言的构造简单的数据处理系统。本发明的另一个目的是提供一种数据处理系统,其处理多种语言并且还能区分形状不同的字符。本发明的再一个目的是提供一种处理多种语言并同寸利用现有资源的数据处理系统。
为了实现上述目的,本发明第一方面是一个数据处理系统,其包括处理装置和显示装置,处理装置用于处理包含着各表示一个字符的字符代码的数据;显示装置用于显示用字符代码所表示的字符。在该系统里至少存在着一组字形存储器,用于为各个字符代码存储字符字体并且用于向显示装置提供字形数据,根据字符代码的规定位数的组合该字形存储器划分成多个区域,并且把不同语言的字符集的字形分配到各个区域里。
本发明第二方面从方法学的观点实现第一方面的发明并且是一种数据处理方法,该方法包括处理包含着各表示着一个字符的字符代码的数据的步骤;和显示用字符代码表示的字符的步骤,在该方法里至少存在着一组字形存储器,用于为各个字符代码存储字体并且用于向显示步骤提供字形数据。根据字符代码的一规定位数的组合该字体存储器划分成多个区域,并且把不同语言的字符集的字形分配到各个区域里。
根据本发明第一方面和第二方面,根据字符代码的一规定位数的组合该字形存储器划分成多个区域,并且把不同语言的字符集分配到各个区域里。这样能够表示和处理多种语言的字符类型。此外,根据本发明第一方面和第二方面,一种字符集的代码不和另一种字符集的代码重复,从而向每个形状不同的字符指定了统一的代码。这样防止了把形状不同的字符处理为相同的代码。
本发明第三方面是一个数据处理系统,包括处理装置和显示装置,处理装置用于处理包含各代表着一个字符的单字节或双字节的字符代码的数据;显示装置用于显示用字符代码表示的字符,在该系统里至少存在一组字形存储器,用于为各个字符代码存储字体并且用于向显示装置提供字形数据。根据字符代码的一规定2位的组合该字形存储器被划分为四个区域,第一区域至第四区域,并且把第一种语言的第一种字符集分配到第一区域里,而把第二种语言的第二种字符集分配到除第一区域外的其它区域中的一个区域里。
本发明第四方面从方法学的观点实现本发明第三方面并且是一种数据处理方法。该方法包括处理包含着各代表一个字符的单字节或双字节的字符代码的数据的步骤和显示用字符代码表示的字符的步骤,在该方法里至少存在一组字形存储器,用于为各个字符代码存储一个字体并且用于向显示步骤提供字形数据。根据字符代码的一规定2位的组合该字形存储器被划分为四个区域,第一区域至第四区域,并且把第一种语言的第一种字符集分配到第一区域里,而把第二种语言的第二种字符集分配到除第一区域外的其它区域中的一个区域里。
根据本发明第三、第四方面所述的发明,根据双字节字符代码的前二位的组合字形存储器划分为四个区域。把第一字符集指定到第一区域,并把第二字符集指定到第二区域里。这可允许用双字节字符代码代表和处理多种语言的字符类型。另外,根据本发明第一方面所述的发明,第一字符集不和第二字符集重复,从而向每个形状不同的字符分配了统一的字符代码。这样防止了把不同形状的字符处理成相同的代码。
本发明第五方面是一个如本发明第三方面所述的数据处理系统,其进而包括一个识别装置,用于根据字符代码的一规定2位识别一个字符代码所对应的一个区域。
本发明第六方面从方法学的观点实现本发明第五方面并且是一种如本发明第四方面所述的数据处理方法,该方法进行包括根据字符代码的一规定2位识别一个字符代码所对应的一个区域的步骤。
根据本发明第五、第六方面,通过简单地检验一个字符代码的前二位可以容易地识别和处理字符类型。
本发明第七方面是一个如本发明第三方面所述的数据处理系统,其中一个字形存储器集包含着可以同时在显示装置上显示的多个字符的字体。
本发明第八方面从方法学的观点实现发明第七方面并且是一种如本发明第四方面所述的数据处理方法,其中一个字形存储器集包含着可以同时在显示步骤上显示的多个字符的字体。
根据如本发明第七、第八方面所述的发明,第一和第二字符集位于可以被同时显示的字符的字形区域里。这样可允许同时显示来自第一字符集的字符和那些来自第二字符集的字符,使得用户可同时观察来自两个集的字符。
本发明第九方面是一个如本发明第三方面所述的数据处理系统,其中只要需要,可以显示来自第一字符集的第一字符串数据的或者来自第二字符集的对应第二字符串数据的任何一种字符串数据。
本发明第十方面从方法学的观点实现发明第九方面并且是一种如本发明第四方面所述的数据处理方法,其中只要需要,可以显示或者来自第一字符集的第一字符串数据的或者来自第二字符集的对应第二字符串数据的任何一种字符串数据。
根据本发明第九、第十方面所述的发明,使得在处理期间来自第一字符集的字符串对应于来自第二字符集的那些字符串。它给用户多种显示选择,确保了高级的显示可操作性;例如,能够选择性地显示来自不同字符集中的一个字符集的字符,或者,能够同时地显示来自两个字符集的字符。
发明第十一方面是一个如本发明第三方面所述的数据处理系统,其中第一字符集和第二字符集是日语字符、汉语字符或者朝鲜语字符。
本发明第十二方面从方法学的观点实现本发明第十一方面并且是一种如本发明第四方面所述的数据处理方法,其中第一字符集和第二字符集是日语字符、汉语字符或者朝鲜语字符。
根据本发明第十一、第十二方面所述的发明,日语字符、汉语字符或者朝鲜语字符被用作为第一字符集和第二字符集。因为这些字符集需要相同等级分辨率的字形,存储区得到更好的使用。
本发明第十三方面是一个如本发明第三方面所述的数据处理系统,其中把移位JIS标准字符代码用作为第一字符集的字符代码。
本发明第十四方面从方法学的观点实现发明第十三方面并且是一种如本发明第四方面所述的数据处理方法,其中把移位JIS标准字符代码用作为第一字符集的字符代码。
根据本发明第十三、第十四方面所述的发明,把移位JIS标准字符代码用作为第一字符集,从而即使当这些字符和单字节的字符相混合时仍可取消对控制代码(例如,输入/输出代码)的需要。此外,因为该系统能和现有的与JIS兼容的硬件和软件一起很好的工作并且保持它们的向上兼容性,现有资源可得到应用。
本发明第十五方面是一个如本发明第三方面所述的数据处理系统,其中把JIS标准字符代码用作为该第一字符集的字符代码。
本发明第十六方面从方法学的观点实现发明第十五方面并且是一种如本发明第四方面所述的数据处理方法,其中把JIS标准字符代码用作为第一字符集的字符代码。
根据本发明第十五、第十六方面所述的发明,因为把JIS标准字符代码用作为第一字符集,该系统能和现有的与JIS兼容的硬件和软件一起很好的工作并且保持它们的向上兼容性,从而应用了现有的资源。
本发明第十七方面是一个如本发明第三方面所述的数据处理系统,进而包括转换装置,用于转换一个字符集的字符代码。
本发明第十八方面从方法学的观点实现发明第十七方面并且是一种如本发明第四方面所述的数据处理方法,其进而包括转换一个字符集的字符码的步骤。
根据本发明第十七、第十八方面所述的发明,本发明中采用的字符代码能够用基于某其它标准的字符代码来代替。它能使得包括数据在内的现有资源得到更好的使用。
从下述说明中将会更全面地显现本发明的其它的和更深层的目的、特性和优点。


图1是一个功能框图,表示本发明的第一实施方式的结构。
图2是一个图,表示在本发明的第二实施方式中使用的代码分配。
图3是一个概念图,图中把汉语字符分配到本发明的实施方式里的数据处理系统的第三区域中。
图4是ANK代码的例子。
图5是一个概念图,表示国际编码字符集的结构。
图6是形状不同的字符的例子。
各图中所使用的数字表示1…处理装置2…显示装置3…字形存储器4…识别装置参见附图,附图中表示了本发明的各种最佳实施方式。(1)第一实施方式的结构第一实施方式对应于权利要求1至4、6、8、10、至13、15、和17。本发明的一个目的是提供一种处理多种语言的结构简单的数据处理系统。本发明的另一个目的是提供一种处理多种语言的并且区分形状不同的字符的数据处理系统。本发明的再一个目的是提供一种处理多种语言并同时利用现有资源的数据处理系统。
图1是一个功能性框图,表示本实施方式中所采用的数据处理系统(下称本系统)的结构。如该图所示。本系统是一个包括处理装置1和显示装置2的数据处理系统,处理装置1用于处理由单字节或双字节字符代码数据构成的数据,显示装置2用于显示用字符代码表示的字符。处理装置1包括存储设备,处理程序和输入设备。
此外,本系统具有一组字形存储器(3),以把各个字符代码的字体存储起来,根据一个字符代码的前二位的组合,该字形存储器被划分为四个区域,从1到4。区域1含有作为第一种语言的第一字符集的日语字符,而区域4含有作为第二种语言的第二字符集的朝鲜语字符。保存着多个可同时在显示装置2上显示的字符的字形存储器3包含着作为日语字符的JIS C 6226。本系统还具有识别装置4,用于根据一个字符代码的该前二位识别各字符代码对应的区域。(2)第一实施方式的操作和效果具有上述构造的第一实施方式按如下执行操作。当在本系统里显示一个字符时,识别装置4检验字符代码的前二位以便识别该字符代码对应的区域,并且基于其结果显示包括在显示装置2上的对应区域里的字形。
本实施方式把第一字符集分配给第一区域并把第二字符集分配给第二区域,从而产生一种仅利用双字节字符代码来表示和处理多种语言字符类型的简单结构。此外,对第一和第二字符集的每一个都使用统一的代码的本实施方式允许把不同的字符代码分配给形状不同的字符,并因此而防止了把形状不同的字符处理成相同的字符代码。
本实施方式还允许通过检验字符代码的前二位,识别和处理字符类型。并且,本实施方式把第一和第二字符集分配到各字形区域里从而可同时显示来自第一集和那些来自第二集的字符,因此使得用户能同时观察来自两个集的字符。
此外,因为在本实施方式里第一字符集是日语以及第二字符集是朝鲜语,并且因为这两种字符集需要等级相同的分辨率的字形,从而存储器区域得到更好的使用。
本实施方式在第一字符集里采用JIS标准字形,可允许本系统能和现有的与JIS兼容的硬件和软件一起很好地工作,因此利用了现有资源。(3)第二实施方式可以把移位JIS标准(X 0208-1990、等等)代码用作为第一字符集(权利要求7和16)。图2表示在第二实施方式中使用的字符代码分配。如图2中所示,单字节的片假名字符(十六进制数80h至DFh)被去掉,并且在所产生的空出区域里分配所需的语言(本例中为朝鲜语)代码,按相同的方式,如同JIS代码改变成移位JIS代码。(在本图中,所分配的朝鲜语代码被简写为原始KS代码)。这里,移位JIS代码用于JIS代码的对应部分,而KS代码的对应部分移至其第一字节范围为从AOh至CFh的区域里。请注意,纵然不存在单字节片假名字符,采用了双字节片假名字符来显示片假名字符。还请注意,在空出的区域中其第一字节为DDh、DEh、和DFh的区域是不用于外国语言的代码的,以使得在尺寸上外国语言区域和移位JIS标准代码区域相等。
如上面所述,不和JIS代码重复的朝鲜语KS代码或者汉语GB代码能够应用在本发明的一种实施方式里。因此,本发明特别适用于同时显示日语和朝鲜语两种字符的卡拉OK系统。即使单字节字符和双字节字符相混,本发明仍除去了对控制代码(例如、输入/输出代码)的需要。另外,因为本系统和现有的与JIS兼容的硬件和软件能很好地一起工作并且保持着它们的向上兼容性,现有的资源得到利用。具有上面所描述特征的第二实施方式可应用于,例如,采用移位JIS通信协议的通信卡拉OK机。(4)其它的实施方式本发明不受限于上述的最佳实施方式中,在不违背其精神和基本特性的前提下本发明可以体现在如下面所描述的具体形式中。
例如,尽管可以通过专门的输入程序读入字符代码,它们可以从其它的字符代码转换得到;该方法可省掉输入步骤(权利要求9和18)。更具体地,通过一个转换器程序可以把按JIS标准C6226-1978字符代码输入的日语字符转换成移位JIS标准字符代码,或者可以把按朝鲜语KS-C 5601标准字符代码输入的字符分配到上述实施方式中规定的区域。逆转换也是可能的。这使得现有资源包括数据能得到更好的使用。
分配到各个区域里的字符集是不限于日语、汉语或朝鲜语字符集的,而是可以分配给任何其它语言的字符集的。当从日语、汉语和朝鲜语中选择第一字符集和第二字符集时,任何组合(日语字符和汉语字符、汉语字符和朝鲜语字符、等等)是可能的(权利要求6和15)。
在中国,GB 2312-80(GO)是目前唯一可用的标准。图3表示把汉语GB 2312标准代码分配到上述第一实施方式中的第三区域(第三块)中的一个例子。还存在着G1、G3、G5、G7及G8标准草案;当将来使用标准G1至G8时,可以把允许进行层间切换的一个多层语言平面应用于那些标准。
根据本发明可以构造这样的系统,使得只要需要,可以显示或者来自第一字符等的第一字符串数据的或者来自第二字符集的对应第二字符串数据的任何一种字符串(权利要求5和14)。该方法给予用户多种显示选择,确保了高级的显示可操作性;例如,能够选择性地显示日语字符和朝鲜语字符中的一个字符,或者同时显示它们的各一个字符。
如上面所述,本发明提供了一种构造简单的处理多种语言的数据处理系统。
尽管说明了最佳实施方式,在由下述权利要求书所叙述的本发明的原理的范围之内熟练的技术人员可对其作出各种改变。
权利要求
1.一种数据处理系统,包括处理装置,用于处理包含着各表示一个字符的字符代码的数据;以及显示装置,用于显示由字符代码表示的字符,其中至少存在着一组字形存储器,用于为各个字符代码存储字体并且用于向显示装置提供字形数据。根据字符代码的一个规定位数的组合,把该字形存储器划分成多个区域,并且把不同语言的字符集的字形分配到各个区域里。
2.一种数据处理系统,包括处理装置,用于处理包含着各表示一个字符的单字节或双字节的字符代码的数据;以及显示装置,用于显示由字符代码表示的字符,其中至少存在着一组字形存储器,用于为各个字符代码存储字体并且用于向显示装置提供字形数据。根据字符代码的所规定的2位的组合,该字形存储器被划分成四个区域,第一区域至第四区域。并且把第一种语言的第一种字符集分配到第一区域里和把第二种语言的第二种字符集分配到除第一区域之外的其它区域中的一个区域里。
3.如权利要求2所述的数据处理系统,还包括识别装置,用于根据字符代码的所规定2位识别一个字符代码对应的这些区域中的一个区域。
4.如权利要求2所述的数据处理系统,其中一个字形存储器集包含着可以同时在显示装置上显示的多个字符的字体。
5.如权利要求2所述的数据处理系统,其中只要需要,可以显示或者来自第一字符集的第一字符串数据中的或者来自第二字符集的对应第二字符串数据中的任何一种字符串数据。
6.如权利要求2所述的数据处理系统,其中第一字符集和第二字符集是日语字符、汉语字符或朝鲜语字符。
7.如权利要求2所述的数据处理系统,其中把移位JIS标准字符代码用作为第一字符集的字符代码。
8.如权利要求2所述的数据处理系统,其中把JIS标准字符代码用作为第一字符集的字符代码。
9.如权利要求2所述的数据处理系统,进而包括转换装置,用于转换字符集的字符代码。
10.一种数据处理方法,包括处理包含着各表示一个字符的字符代码的数据的步骤;以及显示由字符代码所表示的字符的步骤,其中至少存在着一组字形存储器,用于为各个字符代码存储字体并且用于向显示步骤提供字形数据。根据字符代码的一个规定位数的组合,把该字形存储器划分成多个区域,并且把不同语言的字符集的字形分配到各个区域里。
11.一种数据处理方法,包括处理包含着各表示一个字符的单字节或双字节字符代码的数据的步骤;以及显示由字符代码表示的字符的步骤,其中存在着一组字形存储器,用于为各个字符代码存储字体并且用于向显示步骤提供字形数据。根据字符代码的所规定2位的组合,该字形存储器被划分成四个区域,第一区域至第四区域。并且把第一种语言的第一种字符集分配到第一区域里和把第二种语言的第二种字符集分配到除第一区域之外的其它区域中的一个区域里。
12.如权利要求11所述的数据处理方法,还包括根据字符代码的所规定2位识别一个字符代码对应的这些区域中的一个区域的步骤。
13.如权利要求11所述的数据处理方法,其中一个字形存储器集包含着可以同时在显示步骤上显示的多个字符的字体。
14.如权利要求11所述的数据处理方法,其中只要需要,可以显示或者来自第一字符集的第一字符串数据中的或者来自第二字符集的对应第二字符串数据中的任何一种字符串数据。
15.如权利要求11所述的数据处理方法,其中第一字符集和第二字符集是日语字符、汉语字符或朝鲜字符。
16.如权利要求11所述的数据处理方法,其中把移位JIS标准字符代码用作为第一字符集的字符代码。
17.如权利要求11所述的数据处理方法,其中把JIS标准字符代码用作为第一字符集的字符代码。
18.如权利要求11所述的数据处理方法,还包括转换字符集的字符代码的步骤。
全文摘要
一种处理多种语言的数据的构造简单的数据处理系统。包括处理装置、显示装置、一组字形存储器和识别装置。字形存储器用于为各个字符代码存储字体并且用于向显示装置提供字形数据。根据字符代码的前2位的组合把字形存储器划分成四个区域。基于移位JIS标准把日语字符作为第一种语言的第一种字符集分配到第一区域里,并且把朝鲜语字符作为第二种语言的第二种字符集分配到第四区域里。根据字符的前2位识别装置识别字符代码对应的区域。
文档编号G10H1/36GK1131768SQ95120000
公开日1996年9月25日 申请日期1995年11月30日 优先权日1994年12月1日
发明者北原笃, 田代裕 申请人:世嘉企业股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1