实现图档拟合的数据处理设备、系统及方法

文档序号：6587269阅读：98来源：国知局

专利名称：实现图档拟合的数据处理设备、系统及方法
技术领域：
本发明涉及一种图档处理系统及方法，特别是涉及一种实现图档拟合的数据处理设备、系统及方法。
背景技术：
目前，在根据设计的图档进行量测作业时，进行量测作业的许多参数存放在所有可以转换成像素参数的格式(例如PDF、CAD、TIF、JPG等)的档案中，而现有的量测软体无法对这类格式的档案中的离散信息(例如图元及文字)进行有效识别，从而在量测作业时，不能够快速准确地提取量测作业所需要的量测数据，从而给量测作业带来很大的不便、错误频出。

发明内容
鉴于以上内容，有必要提供一种实现图档拟合的数据处理设备，能够快速从图档中识别和提取图元及文字信息，从而提高图档数据提取的效率及准确性。一种实现图档拟合的数据处理设备，该数据处理设备包括存储器及处理器。该存储器用于存储图档拟合系统、图档设计系统及标准文字信息。该处理器用于运行存储的图档拟合系统，以执行以下步骤(il)接收图档设计系统设计的待识别的图档；(i2)从存储器中接收标准文字信息；(i3)根据接收的标准文字信息生成标准文字库；(i4)从接收的图档中提取文字或图元；(i5)根据标准文字库对提取的文字进行拟合，并根据图元方程限定的标准图元对提取的图元进行拟合，以输出与标准文字或图元匹配的文字或图元。其中，在保证步骤il于步骤i4之前执行，且步骤i2于步骤i3之前执行的情况下，步骤il、i2、i3 及i4之间的执行顺序可以调整。此外，还有必要提供一种实现图档拟合的方法，能够快速从图档中识别和提取图元及文字信息，从而提高图档数据提取的效率及准确性。一种实现图档拟合的方法，适用于装置有图档设计系统的数据处理设备。该方法包括步骤(a)接收图档设计系统设计的待识别的图档；(b)从数据处理设备的存储器中接收标准文字信息；(c)根据接收的标准文字信息生成标准文字库；(d)从接收的图档中提取文字或图元；(e)根据标准文字库对提取的文字进行拟合，并根据图元方程限定的标准图元对提取的图元进行拟合，以输出与标准文字或图元匹配的文字或图元。其中，在保证步骤 a于步骤d之前执行，且步骤b于步骤c之前执行的情况下，步骤a、b、c及d之间的执行顺序可以调整。此外，还有必要提供一种实现图档拟合的系统，能够快速从图档中识别和提取图元及文字信息，从而提高图档数据提取的效率及准确性。一种实现图档拟合的系统，该系统运行于装置有图档设计系统的数据处理设备。该系统按照如下步骤运行(fl)接收图档设计系统设计的待识别的图档；(f2)从数据处理设备的存储器中收标准文字信息；(f3)根据接收的标准文字信息生成标准文字库；(f4)从接收的图档中提取文字或图元；(f5)根据标准文字库对提取的文字进行拟合，并根据图元方程限定的标准图元对提取的图元进行拟合，以输出与标准文字或图元匹配的文字或图元。其中，在保证步骤Π于步骤f4之前执行，且步骤f2于步骤f3之前执行的情况下，步骤Π、f2、f3及f4之间的执行顺序可以调整。相较现有技术，本发明根据标准文字库及标准图元，对从图档中提取的文字与图元采用最小二乘法拟牛顿迭代公式进行最佳拟合迭代，实现了图元及文字的快速识别及准确提取，从而提高了图档数据提取的效率及准确性。

图1是本发明图档拟合系统较佳实施例的运行环境图。图2是本发明图档拟合方法较佳实施例的具体实施流程图。图3是图2中步骤S12的细化流程图。图4是图3中步骤S120及步骤S121的操作示意图。图5是图2中步骤S13的细化流程图。图6是图2中步骤S15的细化流程图。
具体实施例方式如图1所示，是本发明图档拟合系统较佳实施例的运行环境图。该图档拟合系统 13运行于计算机1中。该计算机1还包括图档设计系统12、处理器10、存储器11及显示器15。该图档设计系统12用于进行图档的设计操作，例如，可以是CAD(c0mputer aided design，计算机辅助设计)系统。在本实施例中，该图档拟合系统13作为一个单独运行的程序系统为图档设计系统12设计的图档进行拟合；在本发明的其他实施例中，该图档拟合系统13还可以作为图档设计系统12的一个程序模块，为图档设计系统12设计的图档进行拟合。该显示器15用于显示图档设计系统12设计的图档，及显示图档拟合系统13的图档拟合结果。在本实施例中，该存储器11用于存储该图档拟合系统13、图档设计系统12及标准文字信息；在本发明的其他实施例中，该图档拟合系统13、图档设计系统12及标准文字信息存储在不同的存储器中。对本领域的技术人员来说，可以显而易见的知悉如下内容该计算机1仅是一个较佳的技术手段，其显然容易被其他任意适用的数据处理设备(例如服务器、机器人等) 所等效替换。以下是结合本实施例逐步实现对图档进行拟合的内容，即该处理器10运行该图档拟合系统13对图档设计系统12设计的图档进行拟合的内容。如图2所示，是本发明图档拟合方法较佳实施例的具体实施流程图。步骤S10，接收图档设计系统12设计的待识别的图档。步骤S11，从存储器11中接收标准文字信息。在本实施例中，所述标准文字信息指的是 103 个键盘符组成的 ASCII 码(American Standard Code for Information Interchange，美国信息互换标准代码)；在本发明的其他实施例中，所述标准文字信息还可包括其他任意适用的文字信息。
6
步骤S12，根据接收的标准文字信息生成标准文字库。本步骤的详细信息见下文关于图3的描述部分。步骤S13，从接收的图档中提取文字或图元。本步骤的详细信息见下文关于图5的描述部分。步骤S15，根据标准文字库对提取的文字进行拟合，并根据图元方程限定的标准图元对提取的图元进行拟合，以输出与标准文字或图元匹配的文字或图元。本步骤的详细信息见下文关于图6的描述部分。步骤S16，对文字或图元的拟合结果进行纠错。在本实施例中，步骤S16进一步包括步骤找出与所有标准文字或图元都不匹配的文字或图元，及/或找出与多个标准文字或图元匹配的文字或图元；根据找出的文字或图元生成一个错误列表；将生成的错误列表输出至显示器15上进行显示。如图3所示，是图2中步骤S12的细化流程图。在本实施例中，图2中步骤S12进一步包括步骤S120，采用固定边长的正方形格子方式分割标准文字。如图4所示，标准文字 A被用正方形格子方式进行了分割，每一个格子表示一个像素点。步骤S121，提取分割后的标准文字有效点的坐标。如图4所示，标准文字A被分割后，在像素点中，黑色表示有效点，白色表示无效点。步骤S122，根据提取的有效点坐标及其与标准文字的对应关系生成标准文字库。如图5所示，是图2中步骤S13的细化流程图。在本实施例中，图2中步骤S13进一步包括步骤S130，对接收的图档分盒子。具体说来，步骤S130包括获取图档的包围盒；获取包围盒的最远点和最近点；通过等分步长并根据获取的最远点及最近点，将包围盒分割成多个正方形的小格子。步骤S131，根据分盒子，找出所有相交的线段，并对所有相交的线段分组输出。具体说来，步骤S131包括1、将图档的坐标原点作为起始点开始搜索，以找出一条线段Sl ；2、将线段Sl加入到相交列表(List)中，从所有分盒子限定的线段中搜索与List中线段相交的线段并添加到List中；3、直到找不到与List中线段相交的线段为止，将List中的线段组成线段组输出；4、清空List并将List中线段的最远点作为起始点向后继续搜索，在找到一条线段后重复执行步骤2、3及4，或者，在找不到线段后结束。在本实施例中，每一个输出的线段组代表一个文字或图元，组成一个文字或图元的线段相互之间必定具有特定相交关系，即组成一个文字或图元的任意一条线段必定与组成该文字或图元的至少一条其他线段相连。如图6所示，是图2中步骤S15的细化流程图。对文字或图元的拟合分为精拟合和粗拟合，在本实施例中，对待拟合的文字或图元采用了粗拟合和精拟合两种方式，在本发明的其他实施例中，对待拟合的文字或图元可以单独采用粗拟合或精拟合。所述粗拟合指的是只选取待拟合的文字或图元的部分有效点进行迭代拟合(例如每隔一个固定数量的有效点选取一个有效点，或者，选取待拟合的文字或图元的某个部分的所有有效点)；所述精拟合指的是选取待拟合的文字或图元的所有有效点进行迭代拟合。在本实施例中，图2中步骤S15进一步包括
步骤S150，预设一个迭代函数的精度值、一个相似度公差标准值及一个迭代步长 D，并选取一个待拟合的文字或图元。步骤S151，对选取的文字或图元的有效点进行选取，计算选取的文字或图元相对于一个标准文字或图元的迭代函数值。在本实施例中，选取的文字或图元相对于每一个标准文字或图元都有一个迭代函数值，且对于每一个标准文字或图元的迭代函数值都分别执行下述各步骤。在本实施例中，该迭代函数如下ΣX2f + η~Υ2Τ +(P~Z2f / = " /其中，Xl代表的是选取的所有有效点的X轴坐标矩阵，Yl代表的是选取的所有有效点的Y轴坐标矩阵，Zl代表的是选取的所有有效点的Z轴坐标矩阵；X2代表的是该标准文字或图元中与选取的有效点对应的点的X轴坐标矩阵，Y2代表的是该标准文字或图元中与选取的有效点对应的点的Y轴坐标矩阵，Z2代表的是该标准文字或图元中与选取的有效点对应的点的Z轴坐标矩阵。步骤S152，分析计算的迭代函数F (X)值是否大于预设的精度值。若计算的迭代函数F(X)值小于或等于预设的精度值，则转入执行下述步骤S157 ；或者，若计算的迭代函数F (X)值大于预设的精度值，则转入执行下述步骤S153。步骤S153，用最小二乘法拟牛顿迭代公式迭代F(X)，以使得F(X)值最小。步骤S154，分析是否有最小的F(X)值。若有最小的F(X)值，则转入执行下述步骤S155 ；或者，若没有最小的F(X)值，则转入执行下述步骤S157。步骤S155，根据预设的迭代步长D对选取的文字或图元的有效点进行空间平移，并根据平移后的有效点计算出对应的迭代函数F(X+1)值。步骤S156，分析F(X+1)值是否小于F(X)值。若F(X+1)值小于F(X)值，则返回执行步骤S153 ；或者，若F(X+1)值大于或等于 F(X)值，则返回执行步骤S155。步骤S157，输出当前F(X)值，并根据预设的相似度公差标准值，对选取的文字或图元，及当前F(X)值对应的标准文字或图元进行相似度公差检查。相似度公差检查包括若选取的文字或图元及当前F(X)值对应的标准文字或图元的相似度公差小于或等于预设的相似度公差标准值，则判定选取的文字或图元与当前F(X)值对应的标准文字或图元匹配；若选取的文字或图元及当前F(X)值对应的标准文字或图元的相似度公差大于预设的相似度公差标准值，则判定选取的文字或图元与当前F(X)值对应的标准文字或图元不匹配。步骤S158，分析是否还有待拟合的文字或图元没有拟合。若还有待拟合的文字或图元没有拟合，则转入执行上述步骤S150 ；或者，若所有待拟合的文字或图元都已经拟合，则转入执行下述步骤S159。步骤S159，输出与标准文字或图元匹配的文字或图元。最后所应说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或等同替换，而不脱离本发明技术方案的精神和范围。
权利要求
一种实现图档拟合的数据处理设备，其特征在于，该数据处理设备包括存储器，用于存储图档拟合系统、图档设计系统及标准文字信息；处理器，用于运行存储的图档拟合系统，以执行以下步骤(i1)接收图档设计系统设计的待识别的图档；(i2)从存储器中接收标准文字信息；(i3)根据接收的标准文字信息生成标准文字库；(i4)从接收的图档中提取文字或图元；(i5)根据标准文字库对提取的文字进行拟合，并根据图元方程限定的标准图元对提取的图元进行拟合，以输出与标准文字或图元匹配的文字或图元；其中，在保证步骤i1于步骤i4之前执行，且步骤i2于步骤i3之前执行的情况下，步骤i1、i2、i3及i4之间的执行顺序可以调整。
2.如权利要求1所述的数据处理设备，其特征在于，在步骤i5之后还包括步骤对文字或图元的拟合结果进行纠错。
3.如权利要求2所述的数据处理设备，其特征在于，步骤对文字或图元的拟合结果进行纠错包括找出与所有标准文字或图元都不匹配的文字或图元，及/或找出与多个标准文字或图元匹配的文字或图元；根据找出的文字或图元生成一个错误列表；将生成的错误列表输出至显示器上进行显示。
4.如权利要求1所述的数据处理设备，其特征在于，所述步骤i3包括采用固定边长的正方形格子方式分割标准文字；提取分割后的标准文字有效点的坐标；根据提取的有效点坐标及其与标准文字的对应关系生成标准文字库。
5.如权利要求1所述的数据处理设备，其特征在于，所述步骤i4包括对接收的图档分盒子；根据分盒子，找出所有相交的线段，并对所有相交的线段分组输出，其中，每一个输出的线段组代表一个文字或图元。
6.如权利要求1所述的数据处理设备，其特征在于，所述步骤i5包括( 51)预设一个迭代函数的精度值、一个相似度公差标准值及一个迭代步长，并选取一个待拟合的文字或图元；( 52)对选取的文字或图元的有效点进行选取，计算选取的文字或图元相对于各个标准文字或图元的迭代函数值；( 53)分析计算的每一个迭代函数值是否大于预设的精度值，若计算的迭代函数值小于或等于预设的精度值，则转入执行下述步骤i59，或者，若计算的迭代函数值大于预设的精度值，则转入执行下述步骤i55 ；( 55)用最小二乘法拟牛顿迭代公式对迭代函数进行迭代，以使得迭代函数值最小； ( 56)分析是否有最小的迭代函数值，若有最小的迭代函数值，则转入执行下述步骤 i57，或者，若没有最小的迭代函数值，则转入执行下述步骤i59 ；( 57)根据预设的迭代步长对选取的文字或图元的有效点进行空间平移，并根据平移后的有效点计算出对应的迭代函数值；( 58)分析平移后的迭代函数值是否小于迭代前的迭代函数值，若平移后的迭代函数值小于迭代前的迭代函数值，则返回执行步骤i55，或者，若平移后的迭代函数值大于或等于迭代前的迭代函数值，则返回执行步骤i57 ；( 59)输出当前迭代函数值，并根据预设的相似度公差标准值，对选取的文字或图元，及当前迭代函数值对应的标准文字或图元进行相似度公差检查；( 60)分析是否还有待拟合的文字或图元没有拟合，若还有待拟合的文字或图元没有拟合，则转入执行上述步骤i51，或者，若所有待拟合的文字或图元都已经拟合，则转入执行下述步骤 61 ；( 61)输出与标准文字或图元匹配的文字或图元。
7.一种实现图档拟合的方法，适用于装置有图档设计系统的数理设备，其特征在于，该方法包括步骤(a)接收图档设计系统设计的待识别的图档；(b)从数据处理设备的存储器中接收标准文字信息；(c)根据接收的标准文字信息生成标准文字库；(d)从接收的图档中提取文字或图元；(e)根据标准文字库对提取的文字进行拟合，并根据图元方程限定的标准图元对提取的图元进行拟合，以输出与标准文字或图元匹配的文字或图元；其中，在保证步骤a于步骤d之前执行，且步骤b于步骤c之前执行的情况下，步骤a、 b、c及d之间的执行顺序可以调整。
8.如权利要求7所述的实现图档拟合的方法，其特征在于，在步骤e之后还包括步骤对文字或图元的拟合结果进行纠错。
9.如权利要求8所述的实现图档拟合的方法，其特征在于，步骤对文字或图元的拟合结果进行纠错包括找出与所有标准文字或图元都不匹配的文字或图元，及/或找出与多个标准文字或图元匹配的文字或图元；根据找出的文字或图元生成一个错误列表；将生成的错误列表输出至显示器上进行显示。
10.如权利要求7所述的实现图档拟合的方法，其特征在于，所述步骤c包括采用固定边长的正方形格子方式分割标准文字；提取分割后的标准文字有效点的坐标；根据提取的有效点坐标及其与标准文字的对应关系生成标准文字库。
11.如权利要求7所述的实现图档拟合的方法，其特征在于，所述步骤d包括对接收的图档分盒子；根据分盒子，找出所有相交的线段，并对所有相交的线段分组输出，其中，每一个输出的线段组代表一个文字或图元。
12.如权利要求7所述的实现图档拟合的方法，其特征在于，所述步骤e包括(el)预设一个迭代函数的精度值、一个相似度公差标准值及一个迭代步长，并选取一个待拟合的文字或图元；(e2)对选取的文字或图元的有效点进行选取，计算选取的文字或图元相对于各个标准文字或图元的迭代函数值；(e3)分析计算的每一个迭代函数值是否大于预设的精度值，若计算的迭代函数值小于或等于预设的精度值，则转入执行下述步骤e9，或者，若计算的迭代函数值大于预设的精度值，则转入执行下述步骤e5;(e5)用最小二乘法拟牛顿迭代公式对迭代函数进行迭代，以使得迭代函数值最小； (e6)分析是否有最小的迭代函数值，若有最小的迭代函数值，则转入执行下述步骤 e7，或者，若没有最小的迭代函数值，则转入执行下述步骤e9 ；(e7)根据预设的迭代步长对选取的文字或图元的有效点进行空间平移，并根据平移后的有效点计算出对应的迭代函数值；(e8)分析平移后的迭代函数值是否小于迭代前的迭代函数值，若平移后的迭代函数值小于迭代前的迭代函数值，则返回执行步骤e5，或者，若平移后的迭代函数值大于或等于迭代前的迭代函数值，则返回执行步骤e7 ；(e9)输出当前迭代函数值，并根据预设的相似度公差标准值，对选取的文字或图元，及当前迭代函数值对应的标准文字或图元进行相似度公差检查；(ell)分析是否还有待拟合的文字或图元没有拟合，若还有待拟合的文字或图元没有拟合，则转入执行上述步骤el，或者，若所有待拟合的文字或图元都已经拟合，则转入执行下述步骤el2 ；(el2)输出与标准文字或图元匹配的文字或图元。
13. 一种实现图档拟合的系统，该系统运行于装置有图档设计系统的数据处理设备，其特征在于，该系统按照如下步骤运行(fl)接收图档设计系统设计的待识别的图档； (f2)从数据处理设备的存储器中接收标准文字信息； (f3)根据接收的标准文字信息生成标准文字库； (f4)从接收的图档中提取文字或图元；(f5)根据标准文字库对提取的文字进行拟合，并根据图元方程限定的标准图元对提取的图元进行拟合，以输出与标准文字或图元匹配的文字或图元；其中，在保证步骤fl于步骤f4之前执行，且步骤f2于步骤f3之前执行的情况下，步骤Π、f2、f3及f4之间的执行顺序可以调整。
全文摘要
本发明提供一种实现图档拟合的数据处理设备，其根据标准文字库及标准图元，对从图档中提取的文字与图元采用最小二乘法拟牛顿迭代公式进行最佳拟合迭代，实现了图元及文字的快速识别及准确提取，从而提高了图档数据提取的效率及准确性。本发明还提供一种实现图档拟合的系统及方法。
文档编号G06F17/50GK101937477SQ200910303788
公开日2011年1月5日申请日期2009年6月29日优先权日2009年6月29日
发明者吴新元, 张旨光, 王敏申请人:鸿富锦精密工业(深圳)有限公司;鸿海精密工业股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张旨光;吴新元;王敏
技术所有人：鸿富锦精密工业（深圳）有限公司;鸿海精密工业股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。