一种在pdf文档中显示文本的方法及系统的制作方法

文档序号:6369674阅读:134来源:国知局
专利名称:一种在pdf文档中显示文本的方法及系统的制作方法
技术领域
本发明涉及文档编辑领域,具体而言,涉及一种在PDF文档中显示文本的方法及系统。
背景技术
在PDF文档中编辑文本时,只有文本的字体与当前系统字体库中的字体匹配时,才可以进行编辑并正常显示。而由于文本中存在的内嵌字体和文本字体信息缺失都会导致文本无法编辑和正常显示。由于PDF文档中存在大量的内嵌字体,这些内嵌的字体与系统字体库中的字体不完全相同。在编辑含有内嵌字体的文本时,编辑器在系统的字体库中查找不到对应的字体,导致进行编辑的文本无法显示或者显示无法识别的乱码。PDF文档在生成的过程中,由于系统环境或生成工具不同的原因,一些文本中的字体信息可能丢失。在编辑字体信息缺失的文本时,编辑器在系统的字体库中查找不到对应的字体,导致进行编辑的文本无法显示或者显示无法识别的乱码。综上所述,由于文本中的内嵌字体与字体信息丢失的原因,会导致在PDF文档中编辑文本时,系统不能正常显示文本,导致用户不能对文本进行编辑,对用户的使用造成不便。

发明内容
本发明提供了一种在PDF文档中显示文本的方法及系统,用以解决现有技术中,用户在使用PDF文档编辑文本时,系统不能正常显示文本的问题。根据本发明的一个方面,提供了一种在PDF文档中显示文本的方法,包括在HF文档系统字体库中查找与文本字体相同的字体;如果查找失败,则将文本字体的名称与系统字体库中字体的名称进行匹配;获取与文本字体的名称相似程度最高的字体;使用获取到的字体显示文本。其中,在PDF文档系统字体库中查找与文本字体相同的字体包括根据字体信息在PDF文档系统字体库中查找与文本字体相同的字体。其中,上述字体信息包括以下至少一种字体的名称、字体是否为内嵌字体、字体的类型,字体的编码方式、以及字体支持的编码类型。进一步地,上述方法还包括将文本中的内嵌字体与PDF文档系统字体库中的字体一对一的映射,生成映射表;存储映射表;在将文本字体的名称与系统字体库中字体的名称进行匹配之前,还包括如果在字体库中查找失败,则在映射表中查找与文本字体对应的字体;如果在映射表中查找成功,则使用查找到的字体显示文本;如果在映射表中查找失败,则执行将文本的字体的名称与系统字体库中字体的名称进行匹配的步骤。其中,存储映射表包括将映射表存储至PDF系统字体库中。其中,获取与文本字体的名称相似程度最高的字体包括获取与文本字体的名称包含的相同标识最多的字体。根据本发明的另一个方面,提供了一种在PDF文档中显示文本的系统,包括第一查找模块,用于在PDF文档系统字体库中查找与文本字体相同的字体;匹配模块,用于当查找模块的查找失败时,将文本字体的名称与系统字体库中字体的名称进行匹配;获取模块,用于获取与文本字体的名称相似程度最高的字体;第一显示模块,用于使用获取到的字体显示文本。其中上述第一查找模块具体用于,根据字体信息在PDF文档系统字体库中查找与文本字体相同的字体。进一步地,上述系统还包括生成模块,用于将文本中的内嵌字体与PDF文档系统字体库中的字体一对一的映射,生成映射表;存储模块,用于存储映射表;第二查找模块,用于在第一查找模块在字体库中查找失败后,在映射表中查找与文本的字体对应的字体; 第二显示模块,用于在第二查找模块在映射表中查找成功后,使用查找到的字体显示文本;执行模块,用于在第二查找模块在映射表中查找失败后,执行将文本的字体的名称与系统字体库中字体的名称进行匹配的操作。其中,上述获取模块具体用于,获取与文本字体的名称中包含的相同标识最多的字体。通过本发明的技术方案,采用在PDF文档系统字体库中查找与文本字体相同的字体;如果查找失败,则将文本的字体的名称与系统字体库中字体的名称进行匹配,获取与文本字体的名称相似程度最高的字体;使用获取到的字体显示文本。可以实现用户在PDF文档中编辑文本时,能够正常显示文本字体的目的,进而方便了用户的使用。


图I是根据本发明实施例I的在PDF文档中显示文本的方法的流程图;图2是根据本发明实施例2的在PDF文档中显示文本的方法的流程图;图3是根据本发明实施例3的在PDF文档中显示文本的系统的结构框图;以及图4是根据本发明实施例3的另一种在PDF文档中显示文本的系统的结构框图。
具体实施例方式为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式
对本发明实施例作进一步详细的说明。实施例I图I是根据本发明实施例I的在PDF文档中显示文本的方法的流程图。如图I所示,该方法包括以下步骤步骤101 :在PDF文档系统字体库中查找与文本字体相同的字体;在该步骤中,可以根据字体信息在PDF文档系统字体库中查找与文本字体相同的字体,具体地,字体的信息包括以下至少一种字体的名称、字体是否为内嵌字体、字体的类型、字体的编码方式以及字体支持的编码类型。步骤102 :如果查找失败,则将文本的字体的名称与系统字体库中字体的名称进行匹配;
步骤103 :获取与文本字体的名称相似程度最高的字体;其中,相似程度最高的字体即为与文本字体的名称包含的相同标识最多的字体,例如,某字体的名称为Ariat,则将该名称与PDF系统字体库中的字体名称进行字体匹配,匹配出系统字体库中与该字体包含相同字母最多的字体名称为Arial,则Arial则为与Ariat相似程度最高的字体,此外,也可以预先设置相似程度匹配表,该表中可列出多个相似的字母,例如i与I为一对相似的字母,根据某字体与字体库中的字体包含的相似字体的个数计算出二者的相似度程度值,当相 似程度达到预设阈值时,可以确定与待识别字体相似程度最高的字体为与之匹配的字体。本实施例的在PDF文档中显示文本的方法,可以解决由于文本字体信息丢失而导致的文本在PDF文档中不能显示的问题,通过该匹配方法,可以提高在PDF文档中编辑文本的效率。步骤104 :使用获取到的字体显示文本。实施例2图2是根据本发明实施例2的在PDF文档中显示文本的方法的流程图。步骤201 :启动字体匹配流程;步骤202 :在PDF文档系统字体库中查找与文本字体相同的字体;步骤203 :如果在字体库中查找失败,则在预先存储的映射表中查找与文本的字体对应的字体;如果在映射表中查找成功,则执行步骤205,使用查找到的字体显示文本;步骤204 :如果在映射表中查找失败,则进行近似匹配,即则将文本的字体的名称与系统字体库中字体的名称进行匹配,获取与文本字体的名称相似程度最高的字体;如果匹配成功,则执行步骤205,使用获取到的字体显示文本。步骤206:结束流程。在进行上述步骤之前,可以事先建立好内嵌字体与PDF系统字体库中的字体的映射表,具体地,将的文本中的内嵌字体与PDF文档系统字体库中的字体一对一的映射,生成映射表,进一步地,还可以针对不同的内嵌字体,建立不同种类的内嵌字体的映射表。同时,为了便于后续使用,将每次建立的映射表存储至PDF文档系统字体库,这样可以在后续使用时,同时在系统字体库与映射表中查找编辑文本所需要的字体,提高了 PDF文档中文本编辑的效率,方便了用户的使用。本实施例的在PDF文档中显示文本的方法,可以解决由于文本中包含内嵌字体而导致文本在系统中不能正常显示的问题。实施例3图3是根据本发明实施例3的在PDF文档中显示文本的系统的结构框图。如图3所示,该在PDF文档中显示文本的系统30包括第一查找模块31,用于在PDF文档系统字体库中查找与文本字体相同的字体;其中,该第一查找模块31具体用于,根据字体信息在PDF文档系统字体库中查找与文本字体相同的字体。匹配模块32,用于当查找模块的查找失败时,将文本的字体的名称与系统字体库中字体的名称进行匹配;获取模块33,用于获取与文本字体的名称相似程度最高的字体;该获取模块33具体用于,获取与文本字体的名称中包含的相同标识最多的字体。
第一显示模块34,用于使用获取到的字体显示文本。图4是根据本发明实施例3的另一种在PDF文档中显示文本的系统的结构框图。该系统40包括以下模块生成模块41,用于将的文本中的内嵌字体与PDF文档系统字体库中的字体一对一的映射,生成映射表;存储模块42,用于存储映射表;第一查找模块43,用于在PDF文档系统字体库中查找与文本字体相同的字体;第二查找模块44,用于在第一查找模块在字体库中查找失败后,在映射表中查找与文本的字体对应的字体;
第二显示模块45,用于在第二查找模块在映射表中查找成功后,使用查找到的字体显示文本;执行模块46,用于在第二查找模块在映射表中查找失败后,执行将文本的字体的名称与系统字体库中字体的名称进行匹配的操作。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
权利要求
1.一种在PDF文档中显示文本的方法,其特征在于,包括 在PDF文档系统字体库中查找与文本字体相同的字体; 如果查找失败,则将所述文本字体的名称与所述系统字体库中字体的名称进行匹配; 获取与所述文本字体的名称相似程度最高的字体; 使用获取到的字体显示文本。
2.根据权利要求I所述的方法,其特征在于,所述在HF文档系统字体库中查找与文本字体相同的字体包括 根据字体信息在所述PDF文档系统字体库中查找与所述文本字体相同的字体。
3.根据权利要求2所述的方法,其特征在于,所述字体信息包括以下至少一种 字体的名称、字体是否为内嵌字体、字体的类型,字体的编码方式、以及字体支持的编码类型。
4.根据权利要求I所述的方法,其特征在于,所述方法还包括 将文本中的内嵌字体与所述PDF文档系统字体库中的字体一对一的映射,生成映射表; 存储所述映射表; 所述在将所述文本字体的名称与所述系统字体库中字体的名称进行匹配之前,还包括 如果在所述字体库中查找失败,则在所述映射表中查找与所述文本字体对应的字体; 如果在所述映射表中查找成功,则使用查找到的字体显示所述文本; 如果在所述映射表中查找失败,则执行将所述文本的字体的名称与所述系统字体库中字体的名称进行匹配的步骤。
5.根据权利要求4所述的方法,其特征在于,所述存储所述映射表包括 将所述映射表存储至所述PDF系统字体库中。
6.根据权利要求I所述的方法,其特征在于,所述获取与所述文本字体的名称相似程度最高的字体包括 获取与所述文本字体的名称包含的相同标识最多的字体。
7.一种在PDF文档中显示文本的系统,其特征在于,包括 第一查找模块,用于在PDF文档系统字体库中查找与文本字体相同的字体; 匹配模块,用于当所述查找模块的查找失败时,将所述文本字体的名称与所述系统字体库中字体的名称进行匹配; 获取模块,用于获取与所述文本字体的名称相似程度最高的字体; 第一显示模块,用于使用获取到的字体显示所述文本。
8.根据权利要求7所述的系统,其特征在于,所述第一查找模块具体用于, 根据字体信息在所述PDF文档系统字体库中查找与所述文本字体相同的字体。
9.根据权利要求7所述的系统,其特征在于,所述系统还包括 生成模块,用于将文本中的内嵌字体与所述PDF文档系统字体库中的字体一对一的映射,生成映射表; 存储模块,用于存储所述映射表; 第二查找模块,用于在所述第一查找模块在所述字体库中查找失败后,在所述映射表中查找与所述文本的字体对应的字体; 第二显示模块,用于在所述第二查找模块在所述映射表中查找成功后,使用查找到的字体显示所述文本; 执行模块,用于在所述第二查找模块在所述映射表中查找失败后,执行将所述文本的字体的名称与所述系统字体库中字体的名称进行匹配的操作。
10.根据权利要求7所述的系统,其特征在于,所述获取模块具体用于,获取与所述文本字体的名称中包含的相同标识最多的字体。
全文摘要
本发明公开了一种在PDF文档中显示文本的方法及系统,用以解决现有技术中,用户在使用PDF文档编辑文本时,系统不能正常显示文本的问题。通过本发明的技术方案,采用在PDF文档系统字体库中查找与文本字体相同的字体;如果查找失败,则将文本的字体的名称与系统字体库中字体的名称进行匹配,获取与文本字体的名称相似程度最高的字体;使用获取到的字体显示文本。通过该技术方案,可以实现用户在PDF文档中编辑文本时,能够正常显示文本字体的目的,进而方便了用户的使用。
文档编号G06F17/30GK102681978SQ20121014994
公开日2012年9月19日 申请日期2012年5月15日 优先权日2012年5月15日
发明者原野 申请人:深圳市万兴软件有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1