专利名称:一种用于移动终端的电话号码识别系统及其应用方法
技术领域:
本发明涉及移动终端领域,特别是用于移动终端的电话号码识别系统及其应用方法。
背景技术:
随着3G时代的降临,移动上网将成为日常生活一个常进行的行为,手机作为最主要的随 身移动终端,在移动上网过程中将扮演一个越来越重要的角色抓终端处理平台。
针对手机移动终端特性,在无线应用协议(Wireless Application Protocol, WAP)中 提出"无线电话应用程序接口 (Wireless Tel印hony Application Interface, WTAI)应用 ",该应用能将页面上的电话号码转为能被选中,点击可实现调用电话功能进行拨打(该号 码)的超链接。
无线标记语言(WirelessMarkupLanguage, WML)是一种从HTML继承而来的标记语言, 基于XML,比HTML更严格。WTAI属于WML语言其中一个标记,主要应用在各种WAP页面上。
现有技术中,由于WTAI属于WML语言其中一个标记,要实现"WTAI应用",需将页面上 电话号码使用WTAI语法进行标记。
WTAI不属于HTML标准语言,故以HTML页面为主体的各类WWW页面中是不存在该语法的。 需要页面编写者将电话使用WTAI语法进行标记,同时传统的WWW页面不存在该应用。
发明内容
本发明提供一种用于移动终端的电话号码识别系统,以解决现有技术的不足,使移动终 端访问的是不支持WTAI语法的普通的页面,也能获得WTAI应用支持。 本发明的另一目的在于提供一种该电话号码识别系统的应用方法。 为了实现第一个目的,采用的技术方案如下
本发明提供了一种用于移动终端的电话号码识别系统,所述系统从移动终端显示的页面 中识别数字序列并转换为能被移动终端所拨打的电话号码,该系统包括
识别模块,该识别模块从页面中识别出与电话号码有关的数字序列;
处理模块,该处理模块对识别模块所识别的数字序列进行处理,使该数字序列成为符合 电话号码编排规则的电话号码;
转换模块,该转换模块将处理模块处理后的电话号码根据无线电话应用程序接口规范转 换成能供移动终端直接拨打。识别模块根据以下识别条件识别与电话号码有关的数字序列
(21) 判断页面中是否包括关键字,关键字主要包括汉字的"电话"或者汉字的"联系 "或者英文的"Tel"或者英文的"Contact";
(22) 判断关键字后面是否紧接着分隔符,分隔符主要包括符号""、或者符号"( "、或者空格符号、或者汉字"是";
(23) 判断分隔符后面是否紧接着多位数字串; 当满足上述三个条件,则该多位数字串作为识别模块的识别结果。 处理模块对识别模块识别出的数字序列根据如下处理规则进行处理
(31) 如果数字序列之间存在空格,则删除该空格;
(32) 如果数字序列之间存在由符号"-"组成的区号分隔符,则删除该区号分隔符;
(33) 如果数字序列之间存在由符号"-"或者汉字"转"组成的分机分隔符,则删除 该分机分隔符。
其中区号为3位、4位、5位等,电话号码还包括特定服务号,如100S6,以及手机号等, 也就是不存在区号。
转换模块对处理模块输出的符合电话号码编排规则的电话号码根据无线电话应用程序接 口规范进行转换
(41) 在所述的符合电话号码编排规则的电话号码前插入字符串"wtai:〃wp/mc;", 得到符合无线电话应用程序接口规范的电话号码;
(42) 对所述的符合无线电话应用程序接口规范的电话号码,插入网页的超链接标记, 得到可通过移动终端直接拨打的可拨打的电话号码。
本发明的技术方案提供的技术方案,能自动地把网页里面的电话号码转换成符合WTAI语 法,能获得WTAI应用的网页,使移动终端能直接拨打电话。
作为一种优选的方案,进行识别的页面是WWW页面。WWW页面为html、 htm、 asp等页面。
作为另外一种优选方案,进行识别的页面是图像,摄像设备获取了图像以后,通过光学 字符识别技术(Optical Character Recognition,简称0CR),把图像转换成文字后,识别 模块对转换后的文字数据识别可能的电话号码。
作为更进一步的优选方案本发明公开的系统还设置有缓冲区,缓冲区存储经处理模块处 理后的页面。
为了实现第二个发明目的,采用的技术方案如下
本发明提供了一种用于移动终端的电话号码识别系统的应用方法,包括如下步骤(1) 将移动终端所显示的页面通过识别模块进行识别,从中获取与电话号码有关的数 字序列;
(2) 对步骤(1)识别出的数字序列通过处理模块进行处理,得到符合电话号码编排规 则的电话号码;
(3) 把步骤(2)处理后的符合电话号码编排规则的电话号码根据无线电话应用接口规 范进行转换,得到可通过移动终端直接拨打的电话号码。
其中的页面是移动终端从互联网所下载的WWW网页,或者是通过移动终端的摄像设备所 摄取的图像。
具体步骤如下
(101 )把从互联网上得到的网页数据或拍摄所得到的图像进行识别,从中识别出可能 的电话号码,采用如下条件识别电话号码
(10101) 判断数据中是否包括关键字,关键字主要包括汉字的"电话"或者汉字的" 联系"或者英文的"Tel"或者英文的"Contact";
(10102) 判断关键字后面是否紧接着分隔符,分隔符主要包括符号""、或者符号 "("、或者空格符号、或者汉字"是";
(10103) 判断分隔符后是否紧接着由多个数字组成的数字串; 当满足所述三个条件,则所述的数字串为步骤(101)所识别出的可能的电话号码;
(102) 对于识别出的可能的电话号码进行处理,得到符合电话号码编排规则的电话号 码,对识别出的可能的电话号码根据如下处理规则进行处理
(10201) 如果该数字序列之间存在空格,则删除该空格;
(10202) 如果该数字序列之间存在由符号"-"组成的区号分隔符,则删除该区号分隔
符;
(10203) 如果该数字序列之间存在由符号"-"或者汉字"转"组成的分机分隔符,则 删除该分机分隔符。
处理后的数字序列就是步骤(102)处理后的符合电话号码编排规则的电话号码;
(103) 把符合电话号码编排规则的电话号码根据无线电话应用接口规范进行转换,得 到可通过移动终端直接拨打的可拨打的电话号码
(10301) 在所述的符合电话号码编排规则的电话号码前插入字符串"wtai:〃wp/mc; ",得到符合无线电话应用程序接口规范的电话号码;
(10302) 对所述的符合无线电话应用程序接口规范的电话号码,插入网页的超链接标记,得到可通过移动终端直接拨打的可拨打的电话号码; 转换模块输出可拨打电话号码到所述输出设备。 WTAI是WML标准,其目前少量应用在WAP页面上。
对传统网络上WWW网站来说,由于WTAI仅对移动终端应用,其应用面狭隘,同时,WTAI 不是标准的HTML语法,因此导致了在标准的WWW页面上不会存在"WTAI应用"。
本发明能将原本不具备"WTAI应用"的页面自动处理成符合WTAI语法规范的页面,扩大 了WTAI的应用范围,使移动终端用户浏览网页更加方便和快捷。
图l是本发明的模块图。
图2是本发明的具体实施例流程图。
具体实施例方式
下面结合附图和具体实施方式
对本发明作进一步详细的说明。
本发明提供了一种用于移动终端的电话号码识别系统,所述系统从移动终端显示的页面 4中识别数字序列并转换为能被移动终端所拨打的电话号码,该系统包括
识别模块l,该识别模块1从页面4中识别出与电话号码有关的数字序列;
处理模块2,该处理模块对识别模块2所识别的数字序列进行处理,使该数字序列成为符 合电话号码编排规则的电话号码;
转换模块3,该转换模块3将处理模块处理后的电话号码根据无线电话应用程序接口规范 转换成能供移动终端直接拨打。
如图2所述,移动终端从互联网获取网页4,将页面内容输出到缓冲区5,在进行页面数 据加载的时,识别模块l对页面内容进行识别,识别出与电话号码有关的数字序列
与电话号码有关的数字序列有如下四种表现方式,本发明采用关键字方式判断
1. 简体或者繁体的汉字"电话"或者大写或者小写的英文"Tel" +半角/全角的"、 (、空格等任意符号"+数字;
2. 简体或者繁体的汉字"联系"或者大写或者小写的英文"Contact" +半角/全角的 ":、(、空格等任意符号"+数字;
3. 简体或者繁体的汉字"电话"或者大写或者小写的英文"Tel" + "是"+数字;
4. 简体或者繁体的汉字"联系"或者大写或者小写的英文"Tel" +任意字符+数字。 其中最后的数字是与电话号码有关的数字序列,对于符合规则的内容,进行标记,如下
所示,"〈起始标识〉"和"〈中止标识〉"之间的数字及符号就是与电话号码有关的数字序列〈起始标识〉xxxxxx〈中止标识〉。
对于可能的电话号码,识别模式2进行识别处理。 电话号码的表现方式包括
1. 纯数字是页面电话号码其中一个表现形式,这个表现形式还会包含另一种状态数 字之间存在半角或全角的空格符;
2. —些电话号码中含有区号,区号和实际号码之间可能有空格+半角/全角的"-";
3. —些含有电话号码后还有分机号码,实际号码和分机号码之间可能有空格+半角/全 角的"-"或简繁体"转"。
根据以上规则进行如下处理
a.电话号码之间存在半角/全角空格符,删除;
〈起始标识〉X X X X X X〈中止标识〉变为〈起始标识〉XXXXXX〈中止标识〉
b. 电话号码之间可能有区号,区号和实际号码之间可能有空格+半角/全角的"-"
,表现为xxx - xxxxxx,删除"空格+半角/全角的'-'";
〈起始标识〉xxx - xxxxxx〈中止标识〉变为〈起始标识〉xxxxxxxxx〈中止标识〉
c. 电话号码之间可能有分机号码,实际号码和分机号码之间可能有空格+半角/全
角的"-"或简繁体"转",表现为xxxxxx xxx或xxxxxx转xxx,将中止标识往前提到实际
号码
将〈起始标识〉xxxxxx xxx〈中止标识〉变为〈起始标识〉xxxxxx〈中止标识〉?xxx
a, b, c三个判断步骤是同时进行的。处理模块32对可能的电话号码经过上述规则
处理后在"〈起始标识〉"和"〈中止标识〉"之间的电话号码就是最终输出的符合电话号码编 排规则的电话号码。
转换模块3对处理模块2处理后的符合电话号码编排规则的电话号码进行WTAI转换处理 将"〈起始标识〉"和"〈中止标识〉"的内容使用"WTAI应用"语法,(如
wtai:〃wp/mc;〈 number >)划分出来,并删除标识
〈起始标识〉XXXXXXXXX〈中止标识〉变为wtai :〃wp/mc; XXXXXXXXX。并将转换后的内容进
行输出。
附图2显示了本发明的对一个www页面进行处理最终输出可直接通过移动终端拨打的电话 号码的流程示意图。
移动终端获取要处理的www页面4;移动终端把页面数据传给缓冲区5;
识别模块l对数据根据识别条件采用关键字进行判断,处理模块2根据处理规则对数据进 行处理;
经过转换模块3转换后得到输出处理后页面6; 输出处理后页面6能被光标选中,可直接通过移动终端拨打。
本发明还提供了一种优选方案,移动终端的摄影设备,摄像设备获取了图像以后,通过 光学字符识别技术(Optical Character Recognition,简称0CR),把图像转换成文字后, 识别模块1识别出可能的电话号码后输出给处理模块32,处理模块2把可能的电话号码处理成 符合电话号码编排规则的电话号码后输出给转换模块3,转换模块3根据无线电话应用程序接 口规范转换成可直接通过移动终端拨打的电话号码输出到移动终端,供客户拨打。
现今的移动终端中大多都有摄像功能,特别是具有名片识别功能,能自动识别名片上的 文字和号码,但识别后的号码并不能直接拨打,本发明的优选方案则能把识别后的号码,通 过本发明的系统转换成直接通过移动终端拨打的电话号码。
权利要求
1.一种用于移动终端的电话号码识别系统,所述系统从移动终端显示的页面中识别数字序列并转换为能被移动终端所拨打的电话号码,其特征在于,该系统包括识别模块,该识别模块从页面中识别出与电话号码有关的数字序列;处理模块,该处理模块对识别模块所识别的数字序列进行处理,使该数字序列成为符合电话号码编排规则的电话号码;转换模块,该转换模块将处理模块处理后的电话号码根据无线电话应用程序接口规范转换成能供移动终端直接拨打。
2 根据权利要求l所述的电话号码识别系统,其特征在于,所述的识 别模块根据以下识别条件识别与电话号码有关的数字序列(21) 判断页面中是否包括关键字,关键字主要包括汉字的"电话"或者汉字的"联 系"或者英文的"Tel"或者英文的"Contact";(22) 判断关键字后面是否紧接着分隔符,分隔符主要包括符号""、或者符号" ("、或者空格符号、或者汉字"是";(23) 判断分隔符后面是否紧接着多位数字串; 当满足上述三个条件,则该多位数字串作为识别模块的识别结果。
3 根据权利l所述的电话号码识别系统,其特征在于,所述的处理模 块对识别模块识别出的数字序列根据如下处理规则进行处理(31) 如果数字序列之间存在空格,则删除该空格;(32) 如果数字序列之间存在由符号"-"组成的区号分隔符,则删除该区号分隔符;(33) 如果数字序列之间存在由符号"-"或者汉字"转"组成的分机分隔符,则删除 该分机分隔符。
4 根据权利要求l所述的电话号码识别系统,其特征在于,所述的转 换模块对处理模块输出的符合电话号码编排规则的电话号码根据无线电话应用程序接口规范进行转换(41) 在所述的符合电话号码编排规则的电话号码前插入字符串"wtai:〃wp/mc;", 得到符合无线电话应用程序接口规范的电话号码;(42) 对所述的符合无线电话应用程序接口规范的电话号码,插入网页的超链接标记 ,得到可通过移动终端直接拨打的可拨打的电话号码。
5.根据权利要求l所述的电话号码识别系统,其特征在于,所述的页面是www页面。
6.根据权利要求l所述的电话号码识别系统,其特征在于,所述的页面为图像。
7.根据权利要求l所述的电话号码识别系统,其特征在于,所述系统 还设置有缓冲区,所述缓冲区存储经处理模块处理后的页面。
8. 一种权利要求l所述的电话号码识别系统的应用方法,其特征在于 包括如下步骤(1) 将移动终端所显示的页面通过识别模块进行识别,从中获取与电话号码有关的数 字序列;(2) 对步骤(1)识别出的数字序列通过处理模块进行处理,得到符合电话号码编排 规则的电话号码;(3) 把步骤(2)处理后的符合电话号码编排规则的电话号码根据无线电话应用接口 规范进行转换,得到可通过移动终端直接拨打的电话号码。
9.根据权利要求8所述的用于电话号码识别系统的应用方法,其特征 在于所述的页面是移动终端从互联网所下载的WWW网页,或者是通过移动终端的摄像设备 所摄取的图像。
10.根据权利要求8或9所述的用于电话号码识别系统的应用方法,其 特征在于,所述应用方法的具体步骤如下(101 )把从互联网上得到的网页数据或拍摄所得到的图像进行识别,从中识别出可能 的电话号码,采用如下条件识别电话号码(10101) 判断数据中是否包括关键字,关键字主要包括汉字的"电话"或者汉字的" 联系"或者英文的"Tel"或者英文的"Contact";(10102) 判断关键字后面是否紧接着分隔符,分隔符主要包括符号""、或者符 号"("、或者空格符号、或者汉字"是";(10103)判断分隔符后是否紧接着由多个数字组成的数字串; 当满足所述三个条件,则所述的数字串为步骤(101)所识别出的可能的电话号码;(102) 对于识别出的可能的电话号码进行处理,得到符合电话号码编排规则的电话号 码,对识别出的可能的电话号码根据如下处理规则进行处理(10201) 如果该数字序列之间存在空格,则删除该空格;(10202) 如果该数字序列之间存在由符号"-"组成的区号分隔符,则删除该区号分隔符;(10203) 如果该数字序列之间存在由符号"-"或者汉字"转"组成的分机分隔符, 则删除该分机分隔符。处理后的数字序列就是步骤(102)处理后的符合电话号码编排规则的电话号码;(103) 把符合电话号码编排规则的电话号码根据无线电话应用接口规范进行转换,得 到可通过移动终端直接拨打的可拨打的电话号码(10301) 在所述的符合电话号码编排规则的电话号码前插入字符串"wtai:〃wp/mc; ",得到符合无线电话应用程序接口规范的电话号码;(10302) 对所述的符合无线电话应用程序接口规范的电话号码,插入网页的超链接标 记,得到可通过移动终端直接拨打的可拨打的电话号码;转换模块输出可拨打电话号码到所述输出设备。
全文摘要
本发明涉及移动终端领域,特别是用于移动终端的电话号码识别系统及其应用方法。本发明提供了一种用于移动终端的电话号码识别系统,所述系统从移动终端显示的页面中识别数字序列并转换为能被移动终端所拨打的电话号码,该系统包括识别模块,该识别模块从页面中识别出与电话号码有关的数字序列;处理模块,该处理模块对识别模块所识别的数字序列进行处理,使该数字序列成为符合电话号码编排规则的电话号码;转换模块,该转换模块将处理模块处理后的电话号码根据无线电话应用程序接口规范转换成能供移动终端直接拨打。
文档编号H04W4/16GK101651938SQ20091030395
公开日2010年2月17日 申请日期2009年7月2日 优先权日2009年7月2日
发明者捷 梁 申请人:优视动景(北京)技术服务有限公司