一种终端识别电话号码自动拨号或发送短信的方法

文档序号:6516325阅读:1458来源:国知局
一种终端识别电话号码自动拨号或发送短信的方法
【专利摘要】本发明公开了一种终端识别电话号码自动拨号或发送短信的方法,包括扫描终端(1)自动识别电话号码样本(2)上的电话号码、自动拨打电话或发送短信。其步骤为:扫描终端(1)内的摄像头摄取电话号码样本(2)上的图像信息,扫描终端(1)内电话号码识别软件识别电话号码样本(2)上的电话号码,扫描终端(1)内的自动拨号软件完成自动拨号,通过通信网络(4)连接用户终端(3)通话,或者扫描终端(1)内的自动发送短信软件通过通信网络(4)向用户终端(3)发送短信。本发明能够自动快速地识别电话号码,自动拨号或者发送短信。
【专利说明】一种终端识别电话号码自动拨号或发送短信的方法
【技术领域】
[0001]本发明涉及一种终端识别电话号码自动拨号或发送短信的方法,尤其涉及一种自动识别电话号码、自动拨号或发送短信的方法。属于计算机视觉中的字符识别及无线通信领域。
【背景技术】
[0002]市场调查分析:
随着电子商务这几年在中国的兴起,与之相关的快递行业也出现了快速发展。根据国家邮政总局官方网址公布的数字,2012年,全国规模以上快递服务企业业务量完成56.9亿件,同比增长54.8%。也就是说2012年相应的物流配送达到56.9亿次,全国快递员这一年需要发送总共56.9亿个短信或者电话通知快递的领取。但是,目前人工的电话通知或者短信通知方式需要手工拨号通知每一个取货人,正常情况下,单个手动拨号虽然只有十多秒,但是对于全国的快递员,每年耽搁在拨手机号码的时间就达569亿秒,不仅费时,而且费力,直接影响了整个快递行业终端的配送效率,增加了巨大的人力成本和时间成本。对于快递这个讲究实效性的行业来说,这样的时间成本很巨大。
[0003]技术背景介绍:
图像识别是人工智能的重要分支,其利用光学系统或者其他成像系统来获取图像信息,然后利用计算机来处理获取的大量的图像信息,以代替人类完成图像分类或辨识的任务。图像中的文字是图像内容的一个重要来源,给人们提供简短而重要的信息,因此图像文本识别在图像识别领域占有重要的地位。从文本的产生方式来分,图像文本可以分为人工文本和场景文本,人工文本是指人工加在图像上的文本,场景文本是图像上本身存在的文本。
[0004]国内外的研究人员在很早之前就已经开始了在图像中文字部分的提取和识别的研究,并且已经取得了巨大的成果。
[0005](I) 20 世纪 2O 年代
1929 年,德国科学家 Tausheck 第一个提出了 OCR (Optical Character Recognize,光字符识别)的概念,并申请了专利。
[0006](2) 20 世纪 60 年代
自从20世纪60年代初期出现第一代OCR (光字符识别)产品开始,又经过30多年的不断发展改进,各种OCR技术(其中包括手写体)的研究都取得了令人瞩目的成果。
[0007](3)20 世纪 70、80 年代
IBM公司是最早开发OCR产品的公司,1965年,纽约世界博览会上,IBM公司展出了他们的OCR产品——IBM1287。当时这款产品只能识别印刷体英文字母、数字以及部分符号,此外,只对指定的字体可识别。1983年,东芝公司发布了可以识别印刷体日文汉字的系统0CRV595,识别速度为70?100个汉字/秒,识别率达到99.5%。此后,东芝公司着手进行了手写体日文汉字的识别研究。[0008](4)汉字OCR技术的发展
汉字识别最早可追溯到20世纪60年代。1966年,IBM公司的Casey和Nagy发表了第一篇关于汉字识别的论文,提出了利用简单的模板匹配法进行识别,识别出了 1000个印刷体汉字。1970年代以来,对于汉字OCR系统,有代表性的有1977年东芝综合研究所研发的可以识别2000个汉字的印刷体汉字单字符识别系统;80年代初期,领先当时汉字识别的是武藏野电气研究所研发的印刷体汉字识别系统。
[0009](5 )中国对OCR的研究
中国在20世纪70年代才开始数字、字母及符号等识别技术进行研究,而对汉字识别的研究则是在70年代末起步。1989年,清华大学研究出了中文OCR软件——清华文通TH-OCRl.0版,这是中国首个中文OCR软件系统。
[0010]从此开始,中文OCR系统正式从实验阶段发展到市场阶段。清华在研发的印刷体汉字识别软件系统发布后,继续发布了 TH-OCR 92,其后,在1994年推出的TH-OCR 94,这是高性能的汉英混排的印刷体文本识别系统。20世纪90年代中后期,清华大学电子工程系对中文字符识别研究工作,令汉字识别的研究在印刷体、联机手写、脱机手写的汉字、数字和符号识别等领域获得了显著的成果。

【发明内容】

[0011]本发明的目的是为了克服现有技术的不足,而提出一种基于字符识别的自动手机拨号和短信发送方法。
[0012]本发明的目的是通过下述技术方案实现。
[0013]1、扫描终端I内的摄像头摄取电话号码样本2上的图像信息;
2、扫描终端I内电话号码识别软件识别电话号码样本2上的电话号码;
3、判断是否是有效电话号码;如果是无效的电话号码,返回到步骤I;
4、扫描终端I内的自动拨号软件完成自动拨号,通过通信网络4连接用户终端3通话;或者扫描终端I内的自动发送短信软件通过通信网络4向用户终端3发送短信。
[0014]所述的扫描终端I可以是内部安装有摄像头、电话号码识别软件、自动拨号软件、自动发送短信软件的手机。所述的用户终端3可以是连接通信网络4的具有通话功能或短信接收功能的电话设备。
[0015]扫描终端I识别电话号码采用图像分析中的字符识别技术,进行识别。不仅可以识别印刷体的0-9号码,还可以识别手写体0-9号码。其算法包含两个步骤,字符定位和字符识别。字符定位即通过用户选定大致区域,进行每个字符的精确定位与分割;而字符识别即对精确分割的每个字符进行识别。字符定位主要包含:区域定位、预处理以及字符分割三个步骤,当用户选定数字大致区域后,根据聚类算法准确定位号码区域;接下来,对区域进行去噪、自适应二值化以及形态学处理等预处理操作;最后,实现每个字符的精确分割,将单个字符所在区域用最小外接矩形框进行标示。而字符识别的步骤根据字符的性质不同而不同。当字符为印刷体的0-9数字时,建立一个包含各种印刷字体和大小的0~9数字的素材库,使用Tesseract-ocr算法进行训练,即可实现印刷体数字的识别。当字符为手写体的0-9数字时,同样建立一个各种手写字体和大小的0-9数字的素材库,训练时提取统计和结构特征训练SVM分类器;识别时,通过提取同样的特征,再通过训练好的SVM模型即可实现识别。
[0016]有益效果:本发明即是通过字符识别技术,自动快速识别电话号码,直接拨号或者发送短信。速度上优于人工拨号或发送短信。
【专利附图】

【附图说明】
[0017]图1为本发明的系统架构。
[0018]图2为本发明的流程图。
[0019]图3为本发明的字符识别总流程图。
[0020]图4为手写数字识别过程流程图。
【具体实施方式】
[0021]以下通过实施例并结合附图对本发明进行详细说明。
[0022]如图1是本发明的系统架构所示,本发明是基于由扫描终端1、电话号码样本2、通信网络4和用户终端3组成。扫描终端I扫描电话号码样本2上的电话号码,在扫描终端I内进行电话号码识别,并进行自动拨号或者生成短信,通过通信网络4与用户终端3进行通讯。
[0023]一般扫描终端I可以是手机,其照相机功能可以兼用取像扫描;电话号码样本2可以含有印刷体的电话号码,或者是手写体的电话号码,如信件封面、邮递包裹单;通信网络4可以包括现有的电信、移动、联通等通信网络;用户终端3可以是电话号码样本2上对应的用户电话终端。
[0024]如图2是本发明的流程所示,其步骤是:
1、启动扫描终端I上识读软件,开启摄像头读取电话号码样本2上的图像;
2、识别电话号码样本2上的电话号码;
3、扫描终端I自动拨通电话或者发送短信到用户终端3。
[0025]如图3本发明的字符识别总流程图所示,扫描终端I电话号码的过程包含两个步骤:字符定位和字符识别。字符定位即通过用户选定大致区域,进行每个字符的精确定位与分割;而字符识别即对精确分割的每个字符进行识别。字符定位主要包含:区域定位、预处理以及字符分割三个步骤,当用户选定数字大致区域后,根据聚类算法准确定位号码区域;接下来,对区域进行去噪、自适应二值化以及形态学处理等预处理操作;最后,实现每个字符的精确分割,将单个字符所在区域用最小外接矩形框进行标示。而字符识别的步骤根据字符的性质不同而不同。
[0026]当字符为印刷体的0-9数字时,建立一个包含各种印刷字体和大小的0-9数字的素材库,使用Tesseract-ocr算法进行训练,即可实现印刷体数字的识别。当字符为手写体的0-9数字时,同样建立一个各种手写字体和大小的0-9数字的素材库,训练时提取统计和结构特征训练SVM分类器;识别时,通过提取同样的特征,再通过训练好的SVM模型即可实现识别。
[0027]对于手写字识别,如图4所示是手写字识别的流程图。
[0028]手写字识别过程主要分成两大部分:离线学习和实时识别,后者建立在前者的基础上。离线学习,主要分为三个部分:(I)样本素材库建立;(2 )特征提取;(3 )分类器训练。素材库样本由手写字样本构成,本发明为阿拉伯数字的手写字样本。提取样本的统计和结构特征,形成特征字典,并将特征作为分类器训练的输入,通过分类识别一校验一改进分类器的过程优化分类器,最终得到分类手写字最优的分类器。实时识别,主要包含三个部分:(I)分割单个字符;(2)提取特征;(3)分类识别。通过将单个数字分割,并提取统计和结构特征,首先根据特征字典对特征进行局部优化,再送入离线学习部分生成的分类器,就可以得到分类结果,即最终的号码输出。
[0029]用Tesseract-ocr算法进行印刷体识别的过程如下:
(I)连通区域分析;(2)单个字符识别;(3)多次识别。通过连通区域分析找出单个字符。接下来对单个字符进行识别,并对初次识别效果不佳的字符进行分割和联想,对于多种可能,应用字典的距离计算,选择出最好的可能性。最后,通过多次识别,自适应将识别效果好的字符作为训练样本,对其他不好的字符进行再次识别,从而构造出自适应的分类器。
【权利要求】
1.一种终端识别电话号码自动拨号或发送短信的方法,其特征包括以下步骤: 步骤1:扫描终端(I)内的摄像头摄取电话号码样本(2)上的图像信息; 步骤2:扫描终端(I)内电话号码识别软件识别电话号码样本(2)上的电话号码; 步骤3:判断是否是有效电话号码;如果是无效的电话号码,返回到步骤I ; 步骤4:扫描终端(I)内的自动拨号软件完成自动拨号,通过通信网络(4)连接用户终端(3)通话;或者扫描终端(I)内的自动发送短信软件通过通信网络(4)向用户终端(3)发送短信。
2.根据权利要求1所述的一种终端识别电话号码自动拨号或发送短信的方法,其特征在于所述的扫描终端(I)可以是内部安装有摄像头、电话号码识别软件、自动拨号软件、自动发送短信软件的手机。
3.根据权利要求1所述的一种终端识别电话号码自动拨号或发送短信的方法,其特征在于所述的用户终端(3)可以是连接通信网络(4)的具有通话功能或短信接收功能的电话设备。
4.根据权利要求1所述的一种终端识别电话号码自动拨号或发送短信的方法,其特征在于所述的电话号码识别软件包括有以下步骤: 步骤1:字符定位:根据通过电话号码样本(2)上的图像信息,选定电话号码所在区域,进行预处理后,进行字符分割; 步骤2:字符识别:对于印刷体的0-9数字,采用Tesseract-ocr算法进行识别;对于手写体的0-9数字,采用统计和结构特征训练SVM分类器识别。
5.根据权利要求4所述的一种终端识别电话号码自动拨号或发送短信的方法,其特征在于所述的Tesseract-ocr算法包括以下步骤:(I)连通区域分析;(2)单个字符识别;(3)多次识别。
6.根据权利要求1所述的一种终端识别电话号码自动拨号或发送短信的方法,其特征在于所述的统计和结构特征训练SVM分类器算法包括以下步骤:离线学习和实时识别; 所述的离线学习包括:(I)样本素材库建立;(2)特征提取;(3)分类器训练; 所述的实时识别包括:(I)分割单个字符;(2)提取特征;(3)分类识别。
【文档编号】G06K9/20GK103595861SQ201310501585
【公开日】2014年2月19日 申请日期:2013年10月23日 优先权日:2013年10月23日
【发明者】刘峰, 徐子豪, 徐琼, 陈色桃 申请人:南京邮电大学, 广东迅通科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1