元件名称提取系统及方法

文档序号:6334508阅读:412来源:国知局
专利名称:元件名称提取系统及方法
技术领域
本发明涉及一种元件名称提取系统及方法。
背景技术
一般而言,带有图档的文件,如专利文件,其图档中只会标注每个元件的标号,如果用户需要查看一个元件标号对应的元件名称,需要切换到说明书中去查找。这样既费时又费力,尤其是当一幅图中的元件标号数量很多时,会给用户阅览专利图档带来很大的不便。

发明内容
鉴于以上内容,有必要提供一种元件名称提取系统及方法,其可预先从文件的文字说明书中提取图档的所有元件标号及每个元件标号所对应的元件名称,当用户将光标放置于图档的一个元件标号上时,将实时显示出该元件标号对应的元件名称。在一个实施例中,该方法包括如下步骤从存储器中读取一个文本文档的全文;在该文本文档全文中查找所有的元件标号,并记录下每个元件标号在该文本文档中的位置;及根据每个元件标号在该文本文档中的位置,从该文本文档全文中提取每个元件标号对应的元件名称,并创建一个元件表。前述方法可以由电子设备(如电脑)执行,其中该电子设备具有附带了图形用户界面(⑶I)的显示屏幕、一个或多个处理器、存储器以及保存在存储器中用于执行这些方法的一个或多个模块、程序或指令集。在某些实施例中,该电子设备提供了包括无线通信在内的多种功能。用于执行前述方法的指令可以包含在被配置成由一个或多个处理器执行的计算机程序产品中。相较于现有技术,所述的元件名称提取系统及方法,其可预先从文件的文字说明书中提取图档的所有元件标号及每个元件标号所对应的元件名称,当用户将光标放置于图档的一个元件标号上时,将实时显示出该元件标号对应的元件名称,极大地方便了用户浏览文件的图档。


图1是本发明元件名称提取系统较佳实施例的应用环境示意图。图2是元件名称提取系统的功能模块图。图3是本发明元件名称提取方法的较佳实施例的流程图。图4是图3中步骤S2的具体流程图。图5是图3中步骤S3的具体流程图。
图6是本发明中元件表的示意图。主要元件符号说明
权利要求
1.一种元件名称提取方法,其特征在于,该方法包括如下步骤 从存储器中读取一个文本文档的全文;在该文本文档全文中查找所有的元件标号,并记录下每个元件标号在该文本文档中的位置;及根据每个元件标号在该文本文档中的位置,从该文本文档全文中提取每个元件标号对应的元件名称,并创建一个元件表。
2.如权利要求1所述的元件名称提取方法,其特征在于,所述元件标号在该文本文档中的位置等于当前读取的字符的序号。
3.如权利要求1所述的元件名称提取方法,其特征在于,所述在该文本文档全文中查找所有的元件标号,并记录下每个元件标号在该文本文档中的位置的步骤包括根据该文本文档全文的长度依次读取每个字符;如果该读取的字符不是结束符,则判断该读取的字符是否为有效数字,如果该读取的字符为无效数字,则读取该文本文档的下一个字符;及如果该读取的字符为有效数字,记录该数字为元件标号,同时记录下该元件标号在该文本文档中的位置,然后读取该文本文档的下一个字符,直到整个文本文档读取完毕。
4.如权利要求3所述的元件名称提取方法,其特征在于,如果该读取的字符满足下列条件之一,则判定该读取的字符为无效数字(1)该读取的字符以0开头;(2)该读取的字符包括百分号“%”;(;3)该读取的字符为小数;(4)该读取的字符前面包括字符“FIG. ”、 "FIGS. ”或“图”。
5.如权利要求1所述的元件名称提取方法,其特征在于,所述从该文本文档全文中提取每个元件标号对应的元件名称,并创建一个元件表的步骤包括根据元件标号在该文本文档中的位置依次读取每个元件标号; 从该元件标号的位置向前提取预设数量的字符串,并对所述提取的字符进行倒排序, 得到一个排序后的字符串;当所有元件标号读取完毕后,根据元件标号对排序后的字符串进行分组; 在每个元件标号的分组中对排序后的字符串进行比对,找出最长的相同字符作为该元件标号对应的元件名称;及根据每个元件的标号及该元件标号对应的元件名称创建一个元件表。
6.如权利要求5所述的元件名称提取方法,其特征在于,所述根据元件标号对排序后的字符串进行分组的步骤包括如果排序后的字符串包括预先设定格式的字符串,则将该排序后的字符串拆分成两个或两个以上的字符串,并根据元件标号进行分组。
7.如权利要求5所述的元件名称提取方法,其特征在于,所述在每个元件标号的分组中对排序后的字符串进行比对,找出最长的相同字符作为该元件标号对应的元件名称的步骤包括如果一个元件标号的分组中只有一个数据,则从该元件标号的位置向前,在该元件标号排序后的字符串中寻找第一个预设的修饰词;将该第一个预设的修饰词与该元件标号之间的字符提取出来,作为该元件标号对应的元件名称;及如果没有找到预设的修饰词,则判定该元件标号无效。
8.如权利要求7所述的元件名称提取方法,其特征在于,如果该文本文档为英文,所述预设的修饰词为a,an,或the,如果该文本文档为简体中文,则所述修饰词为“一”或“第 _■”ο
9.一种电脑,包括存储器;一个或多个处理器;以及一个或多个模块,所述一个或多个模块被存储在所述存储器中并被配置成由所述一个或多个处理器执行,所述一个或多个模块包括文档读取模块,用于从存储器中读取一个文本文档的全文;元件标号查找模块,用于在该文本文档全文中查找所有的元件标号,并记录下每个元件标号在该文本文档中的位置;及元件标号提取模块,用于根据每个元件标号在该文本文档中的位置,从该文本文档全文中提取每个元件标号对应的元件名称,并创建一个元件表。
10.如权利要求9所述的电脑,其特征在于,所述元件标号在该文本文档中的位置等于当前读取的字符的序号。
全文摘要
一种元件名称提取系统及方法,该方法包括步骤从存储器中读取一个文本文档的全文;在该文本文档全文中查找所有的元件标号,并记录下每个元件标号在该文本文档中的位置;根据每个元件标号在该文本文档中的位置,从该文本文档全文中提取每个元件标号对应的元件名称,并创建一个元件表。利用本发明可以预先从专利文件的说明书中提取所有元件标号及每个元件标号所对应的元件名称。
文档编号G06F17/22GK102455997SQ20101052145
公开日2012年5月16日 申请日期2010年10月27日 优先权日2010年10月27日
发明者叶建发, 李忠一, 肖伟清 申请人:鸿富锦精密工业(深圳)有限公司, 鸿海精密工业股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1