移动终端、机器、服务器、文字编码方法、以及程序的制作方法

文档序号:7679158阅读:126来源:国知局
专利名称:移动终端、机器、服务器、文字编码方法、以及程序的制作方法
技术领域
本发明涉及一种对文字进行编码的移动终端(mobile terminal)等,特别地,涉及一种在复数个语言圈内可以显示文字的移动终端、机器、服务器、文字编码方法、以及程序。
背景技术
在计算机中,文字被处理为数值码,通过指定与数值码相对应的文字,就可以显示该文字的文字图像。将数值码和文字图像建立关联的规则被称为编码方式,也就是说,只要知道了编码方式,就可以将某文字集合中的文字与数值码建立一对一的关系。作为编码方式,例如,在日本熟知的有JIS、aiift JIS、ECU、Unicode等。另外,文字被可视化后的文字图像的设计被称为字型或字体(font),至今为止,已经开发出了各种各样的字体。文字图像被进行了相同设计的复数个文字的文字集合被称为文字组。文字组是各文字的文字图像的集合,每个文字都具有空心字(outline font)等的文字图像生成数据。据此,对某一文字来说,例如可以用楷书的文字图像对其进行显示,还可以将其显示为手书等其他形式。近年,随着网络的普及,在不同语言圈(以下简称“国家”)之间进行电子文件交换的机会也增加了。在采用数值码为7 8个比特的ASCII码的国家之间,即使国家不同,显示文字时也不会存在较大的问题。但是,在数值码为16个比特O字节码)的所谓汉字圈的国家之间,计算机内所安装的编码方式很多都是不同的。所以,通常会出现这样的问题, 即在A国计算机上所作成的电子文件被B国计算机进行显示时,在B国计算机上被显示成与A国计算机上所显示的文字图像完全不同的文字图像(即乱码)。图1是表示乱码的一个例子的图。在日本的移动终端上,例如,“E1234”、“E1235” 这两个数值码被显示为日本语言(日文)“理光”这样的文字图像。但是,如果将同样的数值码‘ 1234”、‘ 1235”发送至中国,则因为编码方式的不同,“理”被变换为“好”,而“光” 则被变换为“的”,这样就出现了乱码的问题。另外,在韩国语言(韩文)中也会发生同样的文字图像变化的问题。因此,为了避免产生上述的乱码问题,已经开发出了各种各样的技术(例如,参照下述专利文献1)。专利文献1中公开了一种文字信息显示系统,其特征在于,从终端将文字读音的数值码发送至服务器,服务器将与数值码相对应的文字图像生成数据发送至终端。但是,在专利文献1公开的技术中,因为需要由服务器进行变换,所以存在着使用不方便的问题。另外,在熟知的Unicode编码方式中,为了可以统一地使用日本、中国、台湾、韩国以及越南的汉字,文字图像相同的汉字被分配了相同的数值码(CJKV统一汉字)。但是, A国和B国的意思相同但文字图像不同的汉字则需要进行另外的处理,另外,由于还存在 A国和B国的意思不同但却被分配了相同文字图像的汉字等,所以,难以原封不动地使用 Unicode。对于诸如个人电脑那样的资源(resource)丰富的计算机来说,通过在A国计算机上安装与B国的编码方式相对应的文字组,可以在A国计算机上生成与B国的文字组相对应的电子文件。但是,在诸如移动终端那样的资源受制约的装置中,很难安装与B国的编码方式相对应的文字组。另外,即使是个人电脑,因为各国的汉字数量都非常庞大,所以,在A 国计算机可以与B国相对应的情况下,如果还想与C国和D国的汉字进行对应,则可能会出现计算机资源不足的问题。另外,即使能够安装与所有编码方式都可以对应的文字组,这也意味着增加了计算机的使用成本。专利文献1 (日本)特开2006-2156M号公报

发明内容
本发明的目的在于,提供一种能够在资源受制约的计算机上输入不同语言圈的文字的移动终端、机器、服务器、文字编码方法、以及程序。为了实现上述目的,本发明的一个实施方式提供一种移动终端,其特征在于,具有自机字体数据,其中,基本区域内配置了第1文字集合(例如,日文),造字区域内配置了语言圈与所述第ι文字集合不同的第2文字集合(例如,中文),根据数值码对所述第1 文字集合的文字或所述第2文字集合的文字进行指定;存储单元,用于保存电子文件,该电子文件中记述了用于指定所述第2文字集合的文字的第1数值码(造字区域内的中文); 数值码对应表,将所述第1数值码与用于指定预定字体数据中的基本区域内的所述第2文字集合的文字的第2数值码(基本区域的中文)建立关联;以及码变换单元,将所述电子文件中记述了的、用于指定所述自机字体数据中的所述造字区域内的文字的所述第1数值码变换为由所述数值码对应表建立了关联的所述第2数值码。本发明的效果在于,可以提供一种能够在资源受制约的计算机上输入不同语言圈的文字的移动终端、机器、服务器、文字编码方法、以及程序。



图15是移动终端的字体利用系统的概略结构图。图16是表示移动电话A向移动电话B发送电子文件的步骤的流程图的一个例子。图17是表示文字输入画面的迁移例子的图。主要符号说明12 文字提取单元;13 变换表生成单元;14 拼音生成单元;15 字体修正单元;16 大小统一单元;17 基线确定单元;19 提取拼音表;20 变换表;31 字体要求单元;32:文字输入单元;33 语言判别表;34 码变换单元;35 电子文件;36 :HBF_ID ;100 移动终端;110:文字变换程序;200 混合字体;300 服务器;310 字体生成程序;400:网络;500 字体利用系统;600 蓝光碟机。
具体实施例方式以下参照附图对本发明的实施方式进行说明。[混合字体的概要]图2(a)是示意性地说明本实施方式的混合字体的图的一个例子。在图2(a)中, 通过在日文文字组中追加中文文字组,生成了混合字体200。这里,需要说明的是,以下尽管以Unicode为例进行了说明,但是,本发明也同样适用于其他编码方式。例如,在Unicode中,日文的“亜”文字的数值码为“E4BA9C”、“哑”文字的数值码为‘ 59496”等。另外,在Unicode中也登记了中文的汉字,例如,“一”文字的数值码为 “U+4E000 ”、“丁”文字的数值码为“U+4E001 ”等。在本实施方式中,将日文的文字集合和中文的文字集合进行结合,以生成混合字体200。中文的文字集合被登记在例如Unicode的造字区域。这样,在日本国内,用户仅通过使用通用的Unicode编码方式,就可以输入日文和中文这两种不同语言圈的汉字。这里,需要说明的是,混合字体200因为也可以适用于汉字以外的文字,所以,以下将汉字简称为
“文字”。这样,例如,根据混合字体200所生成的(即日本国内所生成的)电子文件就变成了具有Unicode的造字区域的数值码。但是,在中国的移动终端上,并未在Unicode的造字区域内登记诸如“一”、“丁”等文字。所以,日本的移动终端需要根据一变换表将其造字区域的文字的数值码变换为中国的移动终端上的基本区域的数值码。图2(b)是说明数值码的变换的图的一个例子。由造字区域的数值码所指定的 “一”、“丁”等文字根据变换表20被变换为由基本区域的数值码所指定。变换表20可以在生成混合字体200时预先作成,所以,不会增加移动终端的处理负荷。因此,通过使用混合字体200,资源受制约的日文圈的移动电话不仅可以发送中文电子文件,还可以在收到中文电子文件时不出现乱码地进行显示。这里,预先定义几个技术用语。在本实施方式中,将日文、中文、韩文或越南语言 (越文)等各语言圈的所有文字或其中的一部分文字分别称为日文、中文、韩文、越文的文字集合。另外,对中文来说,尽管有中国大陆的简体字和中国台湾的繁体字之分,但并不对其进行区别,都简称为中文。另外,将文字集合中的文字和文字图像的关联信息称为数值码,将数值码和文字图像的一对一对应的规则称为编码方式。将用于对由数值码所指定的文字进行可视化的描绘数据称为文字数据。文字数据由轮廓(outline)数据或位图(bitmap)数据给定。文字数据被可视化后即为文字图像。因此,因为文字数据与文字图像基本相同,所以,下面使用文字图像进行说明。将与某编码方式相对应的数值码和文字图像的组称为文字组。这里, 需要说明的是,Unicode是基于被称为UTF-8的编码方式的文字组。另外,基本区域是指在基于某编码方式的文字组中的、数值码和文字图像被对应了的区域,造字区域是指在基于某编码方式的文字组中的、数值码和文字图像的对应未被定义的区域。另外,文字中还包含除了汉字之外的“0 9”的数值、“()”、“/”等的记号、以及阿
拉伯字母等。[移动终端使用混合字体的形态]图3是字体利用系统500的概略结构图的一个例子。为了对移动终端100进行区分,将与日文相对应的移动终端100称为移动终端A,将与中文相对应的移动终端100称为移动终端B。移动终端A和移动终端B经由网络400进行通信。这里,需要说明的是,移动终端A、B中的至少一个可为PC (个人电脑)、智能电话或PDA等。移动终端A和B以由GSM、CDMA (移动电话网)、IEEE 802. lla/g/n (无线LAN)、或者IEEE 802. 16e (WiMAX)所规格化的通信方式与基站10进行通信。基站10与通信运营商的服务器(未图示)相连,该服务器将数据变换为IP网络用数据,并主要将其传送至有线网络400。到达另一基站10的数据以同样的通信方式被发送至另一移动终端。假设移动终端A和移动终端B被使用在不同的语言圈。语言圈主要与国家的概念一样,但是,并不受国境所限制。另外,在本实施方式中,移动终端A和移动终端B所使用的语言如果不同也可以;再有,移动终端A和移动终端B即使存在于相同的语言圈,也可以使用混合字体200。
在本实施方式中,以从移动终端A向移动终端B发送电子文件为例进行说明。在这种情况下,移动终端A安装了混合字体200,而移动终端B却没有安装。如果移动终端B 也安装了混合字体200,则从移动终端B也可以同样地向移动终端A发送电子文件。服务器300中存储混合字体200。因为使用了造字区域这样的容量受制约的资源, 所以可以根据几个语言圈的组合,作成复数种混合字体200。图中的“JC”表示“日文/中文 (简体)”的混合字体200,“KT”表示“韩文/中文(繁体)”的混合字体200,“CT”表示“中文(简体)/中文(繁体)”的混合字体200,“CKT”表示“中文(简体)/韩文/中文(繁体)”的混合字体200,“JCTK”表示“日文/中文(简体)/中文(繁体)/韩文”的混合字体200,而“CK”则表示“中文(简体)/韩文”的混合字体200。服务器300根据来自移动终端A的要求,将混合字体200发送至移动终端A。这里,需要说明的是,在本实施方式中不需要向移动终端B发送混合字体200。下面,对字体利用系统500的整体动作的步骤进行说明。(1)移动电话A向服务器300要求发送混合字体200。(2)移动电话A从服务器300接收混合字体200以及变换表20。(3)用户向移动电话A输入文字。移动电话A生成电子文件35,该电子文件35包含用于指定混合字体200的造字区域的数值码。(4)用户输入电子文件35的发送操作。(5)移动电话A利用变换表20将包含在电子文件35内的造字区域的数值码变换成移动电话B的基本区域的数值码。(6)移动电话A向移动电话B发送电子文件35。(7)移动电话B接收电子文件35,然后显示文字图像。图4(a)表示移动终端A、B的硬件结构图的一个例子。移动终端A、B分别具有经由总线相互连接的CPU 10UR0M 12URAM 103、存储介质安装部104、通信装置105、输入装置106、显示控制部107、以及存储装置108。CPU 101从存储装置108读出应用程序和文字变换程序110,并将RAM 12作为工作内存以对程序进行执行。RAM 102是对必要的数据进行暂时保存的工作内存(主存储内存)。ROM 103中保存了 BIOS以及初期设定的数据和程序等。存储介质安装部104是用于安装USB等缆线以及可移动型存储介质111的界面。通信装置105依照通信运营商的通信方式对数据进行编码·解码,并同时对电波进行调制·解调,以经由天线进行发送和接收。输入装置106是键盘、触屏、音声输入装置等可接受用户操作的装置。显示控制装置107根据由应用程序和文字变换程序所指定的画面信息,按预定的解像度和色数等对显示器109的描绘进行控制。显示器109是液晶或有机 EL 等的 FPD (flat panel display)。存储装置108以闪光存储器等不挥发性存储器为实体,用于存储应用程序和文字变换程序110。存储介质111例如为SD卡和USB存储器等不挥发性存储器。应用程序和文字变换程序110以被保存在存储介质111中的状态、或者从未图示的服务器可被下载的状态来进行发行(distribution)。图4(b)表示服务器300的硬件结构图的一个例子。服务器300具有经由总线相互连接的CPU 30UROM 302,RAM 303、存储介质安装部304、NIC 305、输入装置306、显示控制部307、以及存储装置308。在图4(b)中,省略了与图4(a)相同的一部分要素的说明。NIC (network interface card) 305 为 LAN 卡或以太网(注册商标)卡,根据 CPU 301的指示,将混合字体200和变换表20发送至移动终端A。在服务器300的存储装置308中保存了字体生成程序310以及若干种混合字体 200。服务器300的CPU 301执行字体生成程序310,以生成混合字体200。<基于服务器的混合字体的生成>图5表示字体利用系统500的功能框图的一个例子。首先,对服务器300的功能框图按图6的步骤进行说明。服务器300具有由CPU 301执行字体生成程序310而实现的文字提取单元12、变换表生成单元13、拼音生成单元14、字体修正单元15、大小统一单元16、 以及基线确定单元17。另外,存储装置301中保存了高使用频度文字11以及拼音表18。· Sl文字提取单元12例如从由字体开发商所提供的2种以上语言的1种中提取出若干个文字(文字集合)。例如,可从日文、中文、韩文、或越文中指定2种以上的语言。这里, 以指定了日文和中文为例进行说明。因为日文圈的用户主要使用日文,所以,在日文圈的混合字体200中,基本区域内登记的是日文的文字组,造字区域内登记的是中文的文字组(因为主要用户是日本人)。相反,在中文圈的混合字体200中,基本区域内登记的是中文的文字组,造字区域内登记的是日文的文字组(因为主要用户是中国人)。在本实施方式中,假定日文圈的文字组和中文圈的文字组都是对日文和中文进行统一处理的Unicode 21。因此,移动终端A所下载的混合字体200 (J/C)的基本区域的文字组是Unicode 21,造字区域的文字组也是toicode 21。另外,需要说明的是,在中国,一般来说,繁体字中文的编码方式为“Big5”,简体字中文的编码方式为“GB2312(EUC_CN)”。因此,移动终端B的编码方式也是“Big5”或 "GB2312(EUC_CN) ”。在移动终端B中,如果假设中文圈的编码方式为‘‘GB2312 (EUC_CN) ”,则混合字体200 (J/C)的造字区域中登记的是将‘‘GB2312 (EUC_CN) ”作为编码方式的文字组。· S2通过利用混合字体200,可以在移动终端A和B上显示中文。文字提取单元12从 Unicode 21中提取出中文的文字集合,并将其登记在Unicode 21的造字区域。这里,因为中文的汉字数量远远大于UniCOde21的造字区域内可登记的文字数量,所以,难以将所有的中文汉字都登记在造字区域内。因此,文字提取单元12从中文中提取若干个文字并将其作为中文的文字集合。 Unicode 21的造字区域大约可以登记6400个造字;一般来说,作为日常使用的文字,6400 个已经足够了。这样的使用频度较高的5000 6000个的文字被预先登记为高使用频度文字11。另外,用于构成某个时期的热门话题的单词的文字则可根据搜索引擎的搜索结果数来进行确定。通过定期(例如,1周,1个月,或1年)取得搜索引擎运营商所公开的统计信息,可以在高使用频度文字11中再登记400 1400个这样的文字。图7是示意性地表示从中文所提取的文字的图的一个例子。图7的下面的表格表示Unicode 21的基本区域内的中文的文字集合的一部分,上面的表格则表示所提取的中文的文字集合。
文字提取单元12将所提取的文字例如可按Unicode 21的造字区域的码编号的从小到大的顺序进行分配。Unicode 21的造字区域以私用区域的名称被分配为U+E000 U+F8FF、U+000F0000 U+000FFFFD、U+00100000 U+0010FFFD。这样,就生成了混合字体200。此时,混合字体200变成了 Unic0de21的一部分; 可以比较容易地从Unicode 21中仅取出混合字体200,或者,可以比较容易地仅取出造字区域内的中文的文字集合。如果仅取出造字区域内的中文的文字集合,并将其保存至2个移动电话A、B,就可以互相发送和接收造字区域的文字。文字提取单元12将所提取的文字和所分配的造字区域的数值码输出至变换表生成单元13和拼音生成单元14。· S3变换表生成单元13根据所提取的文字的Unicode 21的基本区域的数值码、以及、 所分配的造字区域的数值码,生成变换表20。图8(a)是表示变换表20的一个例子的图。在变换表20中,“基本区域的数值码” 被与“造字区域的数值码”和“文字图像”建立了关联。这里,需要说明的是,“文字图像”是为了说明而附加的,所以,也可以不将其登记至变换表20中。根据该变换表20,当用户输入了(中文)“一”的汉字(U+E000)时,如果将其变换为“U+4E000”的数值码,则就可以在Unicode 21中显示“一”这样的汉字。· S4另外,拼音生成单元14利用拼音表18生成拼音。拼音是指用于输入汉字的中国式的罗马字母(汉字的读音或发音)。例如,如果用户输入“gongsi”,则可以出现“公司”这样的汉字。这样的输入方法在日文中相当于熟知的“罗马字变换”、“假名汉字变换”。拼音表18中登记了与各汉字的数值码相关联的拼音。拼音生成单元14从拼音表 18中读出与文字提取单元12所提取的文字的数值码相关联的拼音,生成“提取拼音表” 19。 换言之,如果提取出6400个中文汉字,则可生成包含6400个中文汉字的提取拼音表19。这里,需要说明的是,将造字区域的文字集合的文字图像进行一览显示,用户也可以通过选择来输入造字区域的文字。因此,提取拼音表19并不一定是必须的。另外,在一种混合字体200中,也可以登记复数个不同语言圈的文字组。例如,当将“日文/中文/韩文”的各自的文字集合登记至混合字体200时,基本区域为原样的日文的数值码。文字提取单元12可将造字区域例如进行2等分,其中的一半用于登记中文的文字集合,另一半用于登记韩文的文字集合。此时,变换表生成单元13根据Unicode 21的中文的基本区域的数值码、所分配的造字区域的数值码、以及所提取的文字,生成变换表20的一半,同时,根据Unicode 21的基本区域的韩文的数值码、所分配的造字区域的数值码、以及所提取的文字,生成变换表20 的另一半。图8(b)是表示包含3个文字集合的混合字体200的变换表20的一个例子的图。 通过在变换表20的后半中仅追加用于韩文的变换表20,可以得到与图8 (a)的变换表20相同的结构。换言之,用户输入文字时,可以不需要对中文和韩文进行区分地来进行输入;移动终端A如果具有变换表20,则可以不需要对中文和韩文进行区分地(即不需要对变换表20和混合字体200进行切换地)来进行变换成基本区域的数值码的操作。
· S5字体修正单元15对日文的文字集合或中文的文字集合的字体进行修正。尽管对哪一个集合都可以进行修正,但是,这里假定对容易修正的文字集合进行修正、或者、对文字数较少的文字集合进行修正。字体是指文字的可视设计。例如,“宋体字”和“黑体字”都是熟知的字体;字体不同,有时也存在用户难以阅读的问题。在一个文字集合中,一般来说都是准备了相同字体的文字图像;但是,如本实施方式所述,将日文和中文进行统合时,有可能出现日文的文字图像和中文的文字图像的设计并不相同的问题。因此,字体修正单元15对字体进行修正。字体修正的难易是指,例如,将黑体字变为宋体字比较困难,而相反却比较容易。图9(a)、(b)是说明从宋体字向黑体字进行变换的图的一个例子。一般来说,宋体字的文字开始和结尾处具有凸部,文字的线宽也不一样,另外,线宽也比黑体字要细。字体修正单元15将由空心字所给定的文字数据变换为位图数据,然后消除开始和结尾处的凸部(根据线宽和线长,将黑格变为白格、将白格变为黑格),并加大线宽,以形成相同的宽度。· S6大小统一单元16对日文的文字图像和中文的文字图像的大小进行统一。文字的大小由磅(point)数来指定,磅数表示围绕文字的矩形的大小;同样的磅数,既有被做成小一点的文字图像,也有被作成大一点的文字图像(如图9所示)。如果文字大小不同,则有可能存在用户不易阅读的问题。因此,如果是相同文字图像的文字,日文的文字集合和中文的文字集合中的文字大小可以进行比较,但是,因为并不一定都是相同文字图像的文字,所以,需要以围绕文字的矩形为基准,对日文的文字集合和中文的文字集合中的文字大小进行修正。图9(c)、(d)是示意性地说明文字大小统一的图的一个例子。在图9(c)中,从文字的最外侧至矩形的距离较大。大小统一单元16例如通过对文字图像进行放大处理,使文字变大。这样,如图9(d)所示,就可以得到从文字的最外侧至矩形的距离为较小的文字。这里,需要说明的是,如果文字的最外侧至矩形的距离较小,则可以对文字进行缩小处理。· S7另外,大小统一单元16还可以对文字的线宽进行统一。图9(e)、(f)是示意性地说明文字线宽统一的图的一个例子。大小统一单元16通过使线宽变小(减少线宽的格数)、 或者、通过使线宽变大(增加线宽的格数),可以对日文的文字集合和中文的文字集合中的文字的线宽进行统一。· S8另外,基线确定单元17用于确定基线。基线如果偏了,则文字的排列看起来不美观。图9(g)、(h)是说明基线统一的图的一个例子。基线确定单元17为各文字确定一基线,以使所有文字都位于该基线之上,该基线例如可以位于从文字的矩形的下边开始往上的一定数目的格子上。这里,需要说明的是,上述混合字体200的生成是由服务器300来执行的,但是,上述各步骤的一部分或全部也可以由人工操作来执行。
<基于移动终端A的混合字体的利用>接下来,根据表示图10的移动电话A发送文字的步骤的流程图,对移动终端A的功能框图进行说明。移动终端A具有通过CPU 101来执行文字变换程序110而实现的字体要求单元31、文字输入单元32以及码变化单元34。· SlO用于将电子文件35从移动终端A发送至移动终端B的最一般的应用程序是电子邮件,所以,这里以电子邮件为例对移动终端A的功能进行说明。需要说明的是,对英特网 (internet)的论坛或博客等进行写入(例如,所谓的“发贴”或者“跟贴”)等,也可以使用本实施方式的混合字体200。字体要求单元31接收到用户操作后访问服务器300,要求发送混合字体200。根据语言圈的组合,混合字体200可具有若干种类;字体要求单元31根据用户操作例如可要求发送“日文/中文”的混合字体200。对用户来说,除了日文之外还要输入哪种语言是由自己来决定的。服务器300将“日文/中文”的混合字体200、变换表20、以及提取拼音表19发送至移动终端A。因为变换表20和提取拼音表19是按每种混合字体200所生成的,所以,服务器300可以确定应该发送的变换表20和提取拼音表19。字体要求单元31接收到的混合字体200、变换表20、以及提取拼音表19被保存在存储装置108中。· S20接下来,用户从输入装置106输入字母后,文字输入单元32将其变换为汉字。图11是表示文字输入画面的迁移例子的图。在该图中,被输入的是“niha0”(a)。 之后,文字输入单元32根据拼音将字母变换为汉字。因为同样的字母可能存在对应多个候补汉字的情况,所以,文字输入单元32可显示变换候补文字。在该图中,显示了 3个变换候补文字(b)。3个变换候补文字中,“1你好”是登记在Unicode 21的造字区域内的文字。这样,文字输入单元32就可以使用拼音读出造字区域的汉字。用户执行将“你好”这两个汉字发送至移动电话B的操作后,“你好”被确定为发送对象(即电子文件35) (c)。此时的“你好”的数值码为被登记在Unicode 21的造字区域时的数值码,所以,在移动终端B,根据该数值码,并不能显示“你好”的文字图像。· S30因此,码变换单元34需要将上述数值码变换为Unicode 21的数值码(d)。码变换单元34按每个文字对电子文件35中是否具有被登记在Unicode 21的造字区域的数值码进行判定。如果电子文件35中具有被登记在Unicode 21的造字区域的数值码,则通过参照变换表20,确定与该数值码相关联的“基本区域的数值码”(这里是指通信对方的Unicode 21的基本区域)。之后,用该“基本区域的数值码”取代电子文件35的数值码。· S40移动电话A从通信装置105将电子文件(此时为电子邮件)35发送至移动电话 B(e)。因为电子邮件的邮件头(mail header)中一般都记载了编码方式的指定信息(例如,“Content-Type :text/plain ;charset = “UTF-8”),所以,并不需要添附用于指定编码方式的信息;但是,如果电子文件35中并没有包含编码方式的指定信息,则需要在元数据 (metadata)等中记载编码方式的指定信息,然后,发送电子文件35和元数据。移动电话B接收电子邮件(f)。移动电话B可以根据邮件头内的编码方式的指定信息确定文字组,然后将电子文件35转换为文字图像,并对其进行显示(g)。该步骤与现有的移动电话相同,在移动电话B中不需要混合字体200。换言之,本实施方式的混合字体 200仅安装至发送侧的移动电话A中就可以实现上述功能。<从移动电话B向移动电话A发送电子邮件的情况>本实施方式的混合字体200在从移动电话B向移动电话A发送电子文件时也是有效的。图12是表示移动电话B的文字输入画面的一个例子的图。中国用户在移动电话B 中输入“nihao”(a)。当然也可以输入“nihao”以外的其他文字,这里,输入的是被登记在混合字体200的造字区域内的常用文字。移动电话B根据拼音将字母变换为汉字,因为中文不存在日文的平假名和片假名,所以,移动电话B将“nihao”直接变换为“你好”(b)。当然也可能出现具有多个变换候补文字的情况。这里,需要说明的是,对在中国所输入的、被包含在电子文件35中的“你好” 来说,从移动电话B来看,其是以Unicode 21的基本区域的数值码来记述的。用户执行将“你好”这两个汉字发送至移动电话A的操作后,移动电话B将电子文件(电子邮件)35发送至移动电话A (C)。移动电话A接收电子文件35 (d)。因为邮件头中一般都记载了例如UTF-8这样的编码方式,所以,移动电话A可以检测出将Unicode 21作为文字组来使用。但是,当移动电话A通过参照Unicode 21将电子文件35的数值码变换为文字图像时,因为基本区域内没有这样的数值码,所以,需要对造字区域进行检索(e)。换言之,从移动电话A来看,电子文件35中并不包含基本区域的数值码。当确定为是造字区域的数值码后,移动电话A的码变换单元34可以将与该数值码相关联的“造字区域的数值码”变换为文字图像,并将其显示在显示单元上(f)。因此,在移动电话A从移动电话B接收电子文件35的情况下,并不需要进行基于变换表20的变换。这样,通过在日文圈的移动电话A中追加中文圈的文字组,本实施方式的混合字体200可以使日文圈的移动电话A发送中文的电子文件35,同时,还可以使其接收中文的电子文件35。当在日文圈的移动电话A上生成日文的电子文件35时,还可以不对文字组进行切换地、原样地使用混合字体200,所以,并不降低用户的使用方便性。另外,当用户携带日语圈的移动电话A到中国时,无论是与当地的中国人还是与日本国内的日本人进行通信时,都可以原样地使用混合字体200来进行电子文件35的发送和接收。也就是说,用户可以省去在当地购买当地用移动电话的金钱和时间。[移动电话使用服务器的形态]移动电话如果具有混合字体200,数值码的变换也可以由服务器300来执行。图13是移动终端的字体利用系统500的概略构成图的一个例子。在图13中,与图 3相同的部分被赋予了相同的符号,并省略了其说明。下面,对该形态的字体利用系统500 的整体动作的步骤进行说明。
(1)移动电话A要求服务器300发送混合字体200。(2)移动电话A从服务器300接收混合字体200。(3)用户向移动电话A输入文字。移动电话A生成电子文件35,该电子文件35包含用于指定混合字体200的造字区域的数值码。(4)用户进行输入操作以发送数值码的变换要求以及电子文件35。(5)服务器300接收数值码的变换要求以及电子文件35。(6)服务器300通过使用变换表20将电子文件35内所包含的造字区域的数值码变换为(移动电话B的)基本区域的数值码。(7)服务器300将电子文件35发送至移动电话B。(8)移动电话B接收电子文件35,并显示文字图像。在这种情况下,移动电话A并不需要预先保存变换表20,所以,可以更加节省移动电话A的资源。[嵌入式装置中的混合字体200的利用形态]不仅是移动电话和PC,在嵌入式装置中,也可以显示用于操作菜单的文字、或者、 用于状态显示的文字。如果仅是如此,则应该安装的文字组是有限的;然而,还存在这样的情况,即用户需要输入节目的标题和评语、连接网络时需要输入检索用文字、以及、想自由地输入文字等。但是,一般来说,嵌入式装置在生产时并没有被确定为是在哪个国家中被使用,所以,在向复数个国家进行发货的嵌入式装置中,需要在其中预先保存所有这些国家的文字组。因此,就出现了这样的问题,即文字组占用了大量的存储资源,另外,随着国家数的增加,用于管理的成本也随之增加了。如果将混合字体200安装至嵌入式装置,就可以解决上述问题。图14是示意性地说明嵌入式装置中安装的混合字体200的利用形态的图的一个例子。作为嵌入式装置的蓝光碟机(blue-rayplayerWOO,经由网络400与服务器300相连。当然,除了蓝光碟机600之外,还可以是用户可输入文字的TV显像器、摄像机、或者、数码相机等。发货时,在蓝光碟机600中存储混合字体200和变换表20,其中登记了可能使用该蓝光碟机600的所有国家的文字组。在该图中,假定将文字组设为JCTK。这样,混合字体200的基本区域为日文的文字组,造字区域则登记了中文(简体)、中文(繁体)、以及韩文。日文圈、中文圈(简体)、中文圈(繁体)或韩文圈的用户使用遥控器或键盘等输入装置输入文字。被输入的文字可能是基本区域的文字,也可能是造字区域的文字。如果输入的是基本区域的文字,则蓝光碟机600不对其进行变换。但是,如果输入的是造字区域的文字,则蓝光碟机600根据变换表20将所输入的文字(电子文件35)的数值码变换为基本区域的数值码。具有基本区域的数值码的电子文件35被与映像文件或内容数据建立关联。例如, 蓝光碟40中记录了内容数据时,电子文件35被1对1地对应至内容数据,另外,电子文件 35也被记录在蓝光碟40中。另外,为了表示数值码是基于何种编码方式的数值码,也将记载了编码方式的指定信息的元数据与电子文件35建立关联,并将其记录于蓝光碟40中。用户将蓝光碟40放进PC 700时,PC 700通过根据元数据确定编码方式,可以将电子文件35的数值码变换为文字图像。另外,例如,不同语言圈的复数个用户共通使用一台蓝光碟机600时,通过使用一个混合字体200,可以输入各个国家的文字。另外,不仅是在发货时蓝光碟机600可以预先对混合字体200和变换表20进行存储,发货后,根据用户操作,也可以从服务器300向蓝光碟机600发行混合字体200和变换表20。与蓝光碟机600被使用的国家的语言无关,用户也可以下载与其他语言圈相对应的混合字体200。这样,蓝光碟机600的用户不管在哪个语言圈内都可以输入自国文字(或者,想使用的文字)。因此,混合字体200对诸如嵌入式装置这样的资源受制约的装置也是极为有效的。[通信的一对移动电话互相具有混合字体的形态]在至此为止的混合字体200的使用例中,发送电子文件35的移动电话A或接收电子文件35的移动电话A具有混合字体200。下面,对发送和接收电子文件35的一对移动电话A和移动电话B都具有混合字体200的情形的混合字体200的使用例进行说明。图15是移动电话A、B的字体利用系统500的概略结构图。在该图中,与图3相同的部分被赋予了相同的符号,并省略其说明。在图15中,移动终端A和移动终端B的两者都具有混合字体200以及变换表20。 移动电话A具有的混合字体200的文字组为“日文/中文”的组合,移动电话B具有的混合字体200的文字组为“中文/日文”的组合。移动电话A、B分别具有上述文字组的组合的混合字体200,就可以进行混含日文和中文的电子文件35的发送和接收。该形态的字体利用系统500的整体动作的步骤如下。(1)移动电话A要求服务器300发送混合字体200。(2)移动电话A从服务器300接收混合字体200以及变换表20。(3)用户向移动电话A输入文字。移动电话A生成电子文件35,该电子文件35包含用于指定混合字体200的造字区域的数值码以及用于指定基本区域的数值码(即同时包含日文和中文)。(4)用户进行输入操作以发送数值码的变换要求以及电子文件35。变换要求中也包含将移动电话A所使用的混合字体200的识别信息(以下称“HBF_ID”)36以及用于确定日文文字的语言判别表33添附至电子文件35这样的要求。(5)移动电话A利用变换表20将电子文件35中所包含的造字区域的数值码变换为(移动电话B的)基本区域的数值码。(6)移动电话A将电子文件35、语言判别表33以及HBF_ID 36发送至移动电话B。 移动电话B接收电子文件35、语言判别表33以及HBF_ID36。(7)移动电话B根据HBF_ID 36判定为包含日文文字,并要求服务器发送将日文登记在造字区域、将自国语(此时为中文)登记在基本区域的混合字体200。(8)移动电话B从服务器接收混合字体200和变换表20。(9)移动电话B对中文的数值码不进行变换,直接显示文字图像,但是,对日文的数值码,则根据变换表20将其变换为造字区域的数值码,然后再显示文字图像。因此,移动电话A即使向移动电话B发送混含日文和中文的电子文件35,因为两者都具有混合字体200,所以,移动电话B可以不产生乱码地对日文和中文进行显示。<基于移动终端A和B的混合字体的利用>图16是表示移动电话A向移动电话B发送电子文件35的步骤的流程图的一个例子。另外,图17是表示文字输入画面的迁移例子的图。· SllO字体要求单元31接收到用户操作后访问服务器300,要求发送混合字体200。用户为了输入中文而选择“日文/中文”组合的混合字体200。字体要求单元31根据用户操作向服务器要求发送“日文/中文”的混合字体200。服务器300将“日文/中文”的混合字体200、变换表20、以及、提取拼音表19发送至移动电话A。字体要求单元31所接收到的混合字体200、变换表20、以及、提取拼音表 19被保存在存储装置108中。· S120接下来,用户从输出装置108输入字母后,文字输入单元32将其变换为汉字。这里,用户输入的是中文的“你好”和日文的“二& ^ U”(尖子文件35) (a) (b)。用户执行将电子文件35发送至移动电话B的操作后,“你好”和“d tc b ii”被确定为发送对象(电子文件35)。此时的“你好”的数值码为被登记至Unicode 21的造字区域时的数值码,而“ 二 U: b这,,的数值码为Unicode 21的基本区域的数值码。根据由拼音所确定的混合字体200的文字是属于基本区域还是属于造字区域,文字输入单元32可以按照每个文字对语言(文字组)进行识别。· S130码变换单元34将造字区域的数值码变换为Unicode 21的基本区域的数值码(f)。 码变换单元34按每个文字对电子文件35中是否具有被登记至Unicode 21的造字区域的数值码进行判定。如果电子文件35中具有被登记至Unicode 21的造字区域的数值码,则参照变换表20确定与该数值码相关联的“基本区域的数值码”。之后,用“基本区域的数值码”来取代电子文书35的数值码。这样,电子文件35的数值码就都变为Unicode 21的基本区域的文字码,但是,移动电话B即使是Unicode 21的基本区域的文字也不与日文的显示相对应。另外,Unicode 21的基本区域也并不是按每个区域被划分为日文、中文、韩文、越文,所以,移动电话B根据电子文件35的数值码,并不能判别中文和日文。· S140因此,码变换单元34按照电子文件35的每个文字(每个数值码),根据是属于基本区域还是属于造字区域,赋予用于区分语言的语言ID。电子文件35生成时的(变换前的)数值码中的、被登记至Unicode 21的造字区域中的数值码(文字)被赋予中文的语言 ID,而被登记至基本区域中的数值码(文字)则被赋予日文的语言ID。码变换单元34例如可对全体文字赋予不重复的索引(index)(可为简单的连续索引),生成一与索引相关联地登记了语言ID的语言判别表33。这里,需要说明的是,用户一般很少按每个文字对中文和日文进行切换,所以,可以按每行、每句、每段或每页来赋予索引并生成语言判别表33。根据混合字体200的文字组的组合,基本区域的语言ID (此时为日文的J)和造字区域的语言ID(此时为中文的C)是显然可知的。本实施方式中,将语言判别表33添附至电子文件35。· S150另外,码变换单元34将HBF_ID 36添附至电子文件35。HBF_ID 36也是一种编码方式,所以,可被包含在邮件头。这里,需要说明的是,HBF_ID 36在服务器中被预先赋予了于混合字体200间不重复的具有一个意义的值,所以,根据HBF_ID 36,文字组的组合也可被确定为仅具有一个意义。· S160移动电话A从通信装置105将电子文件(此时为电子邮件)35、HBF_ID 36、以及、 语言判别表33发送至移动电话B。· S210移动电话B接收电子文件35、HBF_ID 36、以及、语言判别表33 (g),并能够显示此时可显示的文字。· S220因为电子文件35中被赋予了 HBF_ID 36,所以,移动电话B可判定混合字体200对电子文件35的显示来说是必要的。这样,移动电话B通过向服务器发送HBF_ID 36,可从服务器接收文字组为“中文/日文”的混合字体200以及变换表20。· S230移动电话B的码变换单元34参照语言判别表33确定变换所必须的文字。也就是说,因为电子文件35的数值码全部都变为了 Unicode 21的基本区域的数值码,所以,可对中文的文字组中不能变换的文字进行确定。在图17的例子中,被添附了“J”的文字表示尽管其数值码是基本区域但是在中国的移动电话B中却是不能被变换的文字。· S240对于确定为需要变换的文字,移动电话B的码变换单元34参照变换表20,将其基本区域的数值码变换为造字区域的数值码(h)。在图17中,“ ZLiz^ ii”这个日文被变换为造字区域的数值码。平假名这样的使用频度较高的文字被登记在具有“中文/日文”的文字组合的混合字体200的造字区域。· S250对于不需要变换的文字,移动电话B根据邮件头内的编码方式的指定信息确定文字组,然后将其变换为文字图像并显示至显示单元。这里,需要说明的是,因为移动电话200 接收了混合字体200,所以,混合字体200的基本区域的编码方式是显然可知的,因此,即使不根据邮件头部的编码方式确定文字组,编码方式也是显然可知的。同样,对于被确定为需要变换的文字,移动电话B读出与造字区域的数值码相关联的文字数据,然后将其转换为文字图像并显示至显示单元(k)。因此,移动电话A即使发送混含日文和中文的电子文件35,移动电话B通过下载与日文对应的混合字体200,移动电话B也可以对混含日文和中文的电子文件35进行正确的显示(即不出现乱码)。
上述使用方法在以日文为主的商业贸易中可以有效地防止出现误指定中文商品名等这样的错误,同样,在以中文为主的商业贸易中也可以有效地防止出现误指定日文商品名等这样的错误。另外,需要说明的是,因为日文和中文的文字的字体都被进行了统一化,所以,即使在日文和中文混杂出现的情况下,也不会降低文字的可视性、可识性以及美观性。以上对本发明的具体实施方式
进行了说明,但是,本发明并不局限于上述具体实施方式
,只要不脱离权利要求书的范围,亦可采用其他变化形式代替,但那些变化形式仍属于本发明所涉及的范围。本申请主张2010年6月7日申请的日本专利申请2010-130175号的优先权,并在本文中引用了该专利申请的全部内容。
权利要求
1.一种移动终端,其特征在于,具有自机字体数据,其中,基本区域内配置了第1文字集合,造字区域内配置了语言圈与所述第1文字集合不同的第2文字集合,根据数值码对所述第1文字集合的文字或所述第2 文字集合的文字进行指定;存储单元,用于保存电子文件,该电子文件中记述了用于指定所述第2文字集合的文字的第1数值码;数值码对应表,将所述第1数值码与用于指定预定字体数据中的基本区域内的所述第 2文字集合的文字的第2数值码建立关联;以及码变换单元,将所述电子文件中记述了的、用于指定所述自机字体数据中的所述造字区域内的文字的所述第1数值码变换为由所述数值码对应表建立了关联的所述第2数值码。
2.根据权利要求1所述的移动终端,其特征在于,具有接收单元,用于从其他移动终端接收所述电子文件,其中,将接收到了的所述电子文件中所记述的、所述自机字体数据中的所述造字区域内的所述第2数值码变换为文字图像并进行显示。
3.根据权利要求1或2所述的移动终端,其特征在于,所述第2文字集合是从所述第2文字集合的语言圈内的使用频度高的文字中提取出预定数量的文字的集合。
4.根据权利要求1所述的移动终端,其特征在于,所述第1文字集合的文字图像和所述第2文字集合的文字图像的字体、大小、线宽或基线中的至少一种被进行了统一化。
5.根据权利要求1所述的移动终端,其特征在于,所述自机字体数据中的所述造字区域内具有语言圈与所述第1文字集合以及所述第2 文字集合不同的第3文字集合,所述数值码对应表将所述第1数值码与用于指定预定字体数据中的基本区域内的所述第3文字集合的文字的第3数值码建立关联。
6.根据权利要求1所述的移动终端,其特征在于,所述第1文字集合的语言圈为日文圈,所述第2文字集合的语言圈为中文圈。
7.根据权利要求1所述的移动终端,其特征在于,所述自机字体数据的编码方式为Unicode。
8.根据权利要求1所述的移动终端,其特征在于,所述第2数值码根据GB2312或Big5的编码方式对所述第2文字集合的文字进行指定。
9.一种移动终端,经由网络与服务器相连,该服务器包含自机字体数据,其中,基本区域内配置了第1文字集合,造字区域内配置了语言圈与所述第1文字集合不同的第2文字集合,根据数值码对所述第1文字集合的文字或所述第2文字集合的文字进行指定;以及数值码对应表,将用于指定所述自机字体数据中的所述第2文字集合的文字的第1数值码与用于指定预定字体数据中的基本区域内的所述第2文字集合的文字的第2数值码建立关所述移动终端的特征在于,具有字体数据接收单元,用于接收所述自机字体数据;存储单元,用于保存电子文件,该电子文件中记述了用于指定所述第2文字集合的文字的所述第1数值码;以及电子文件发送单元,用于要求将所述电子文件中所包含的所述第一数值码变换为由所述数值码对应表建立了关联的所述第2数值码,同时,将所述电子文件发送至所述服务器。
10.一种移动终端,其特征在于,具有自机字体数据,其中,基本区域内配置了第1文字集合,造字区域内配置了语言圈与所述第1文字集合不同的第2文字集合,根据数值码对所述第1文字集合的文字或所述第2 文字集合的文字进行指定;存储单元,用于保存电子文件,该电子文件中记述了用于指定所述第2文字集合的文字的第1数值码、以及、用于指定所述第1文字集合的文字的第3数值码;数值码对应表,将所述第1数值码与用于指定他机字体数据中的基本区域内的所述第 2文字集合的文字的第2数值码建立关联;码变换单元,将所述电子文件中记述了的、用于指定所述自机字体数据中的所述造字区域的文字的所述第1数值码变换为由所述数值码对应表建立了关联的所述第2数值码; 以及电子文件发送单元,将所述电子文件、根据所述电子文件的数值码是属于基本区域还是造字区域所赋予的语言ID、以及、所述自机字体数据的识别信息发送至对方。
11.一种移动终端,其特征在于,具有电子文件接收单元,用于从权利要求10所述的移动终端接收所述电子文件、所述语言 ID、以及所述自机字体数据的识别信息;字体数据取得单元,根据所述自机字体数据的识别信息,取得所述第2文字集合被登记在基本区域而所述第1文字集合被登记在造字区域的所述他机字体数据、以及、将所述第3数值码与用于指定所述他机字体数据中的造字区域内的所述第1文字集合的文字的第 4数值码建立关联的第2数值码对应表;以及第2码变换单元,根据所述语言ID,对所述电子文件所记述的数值码中的、被登记在所述他机字体数据中的造字区域内的所述第3数值码进行指定,并将其转换为由所述第2数值码对应表建立了关联的所述第4数值码。
12.—种移动终端,经由网络与服务器相连,该服务器包含自机字体数据,其中,基本区域内配置了第1文字集合,造字区域内配置了语言圈与所述第1文字集合不同的第2文字集合,根据数值码对所述第1文字集合的文字或所述第2文字集合的文字进行指定;以及数值码对应表,将第1数值码与用于指定预定字体数据中的基本区域内的所述第2文字集合的文字的第2数值码建立关联,所述移动终端的特征在于,具有字体数据接收单元,用于接收所述自机字体数据;存储单元,用于存储电子文件,该电子文件中记述了用于指定所述第2文字集合的文字的所述第1数值码;以及电子文件发送单元,用于要求将所述电子文件中所包含的、用于指定所述自机字体数据中的所述造字区域内的文字的所述第1数值码变换为由所述数值码对应表建立了关联的所述第2数值码,同时,将所述电子文件发送至所述服务器。
13.一种服务器,其特征在于,具有自机字体数据,其中,基本区域内配置了第1文字集合,造字区域内配置了语言圈与所述第1文字集合不同的第2文字集合,根据数值码对所述第1文字集合的文字或所述第2 文字集合的文字进行指定;数值码对应表,将用于指定所述自机字体数据中的所述第2文字集合的文字的第1数值码与用于指定预定字体数据中的基本区域内的所述第2文字集合的文字的第2数值码建立关联;发送单元,将所述自机字体数据发送至移动终端;电子文件接收单元,从移动终端接收电子文件,该电子文件中记述了用于指定所述第2 文字集合的文字的所述第1数值码;以及码变换单元,将所述电子文件中记述了的、用于指定所述自机字体数据中的造字区域内的文字的所述第1数值码变换为由所述数值码对应表建立了关联的所述第2数值码。
14.一种机器,其特征在于,具有自机字体数据,其中,基本区域内配置了第1文字集合,造字区域内配置了语言圈与所述第1文字集合不同的第2文字集合,根据数值码对所述第1文字集合的文字或所述第2 文字集合的文字进行指定;存储单元,用于存储电子文件,该电子文件中记述了用于指定所述第2文字集合的文字的第1数值码;数值码对应表,将所述第1数值码与用于指定预定字体数据中的基本区域内的所述第 2文字集合的文字的第2数值码建立关联;码变换单元,将所述电子文件中记述了的、用于指定所述自机字体数据中的造字区域内的文字的所述第1数值码变换为由所述数值码对应表建立了关联的所述第2数值码;以及元数据生成单元,用于生成元数据,该元数据包含用于指定所述自机字体数据的编码方式的方式指定信息。
15.一种信息处理装置的文字编码方法,该信息处理装置具有自机字体数据,其中, 基本区域内配置了第1文字集合,造字区域内配置了语言圈与所述第1文字集合不同的第 2文字集合,根据数值码对所述第1文字集合的文字或所述第2文字集合的文字进行指定; 以及数值码对应表,将第1数值码与用于指定预定字体数据中的基本区域内的所述第2文字集合的文字的第2数值码建立关联,所述文字编码方法的特征在于,具有由码变换单元读出被保存在存储单元中的电子文件的步骤,该电子文件中记述了用于指定所述第2文字集合的文字的所述第1数值码;以及将所述电子文件中记述了的、用于指定所述自机字体数据中的造字区域内的文字的所述第1数值码变换为由所述数值码对应表建立了关联的所述第2数值码的步骤。
全文摘要
本发明的目的在于提供一种能够在资源受制约的计算机上输入不同语言圈的文字的移动终端等。该移动终端具有自机字体数据(200),其中,基本区域内配置了第1文字集合,造字区域内配置了语言圈与第1文字集合不同的第2文字集合,根据数值码对第1文字集合的文字或第2文字集合的文字进行指定;存储单元(108),用于保存电子文件,该电子文件中记述了用于指定第2文字集合的文字的第1数值码;数值码对应表(20),将第1数值码与用于指定预定字体数据中的基本区域内的第2文字集合的文字的第2数值码建立关联;以及码变换单元(34),将电子文件中记述了的、用于指定自机字体数据中的造字区域内的文字的第1数值码变换为由数值码对应表建立了关联的第2数值码。
文档编号H04M1/725GK102270195SQ20111014126
公开日2011年12月7日 申请日期2011年5月30日 优先权日2010年6月7日
发明者鲤沼敦 申请人:株式会社理光
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1