一种数据匹配方法及系统的制作方法

文档序号:7767675阅读:380来源:国知局
专利名称:一种数据匹配方法及系统的制作方法
技术领域
本发明涉及数据处理技术领域,特别地,尤其涉及一种数据匹配方法及系统。
背景技术
随着移动通信技术的快速发展,越来越多的用户开始使用手机获取各种服务。不 同的运营商如移动、电信或者联通,SP (Service Provider,服务提供商),CP (Content Provider,内容提供商)也开始提供越来越多的手机服务,如WAP (Wireless Application Protocol无线应用协议)资讯、手机图片、手机铃声、手机阅读、手机杂志、手机游戏和手机 电视等,但由于不同手机厂家规范不同、不同手机采用的操作系统不同,以及手机自身的屏 幕、尺寸、支持的铃声格式、视频格式以及应用类型也不同,导致在如何为手机提供与之相 匹配的手机服务成为了手机服务开发者的一大难题。目前,为了解决手机与手机服务适配的问题,各大运营商、SP和CP均整理市面上 的所有手机的UA (User Agent,手机标识)建立了手机信息数据库。由于UA包含了厂商、型 号、版本以及MIDP (Mobile Information Device Profile,移动信息设备配置文件)等信 息,即便同一型号的手机其UA并不一致,例如:Nokia5310_CMCC/2. 0(pl6. 61. 1)Profile/ MIDP-2.1 Configuration/CLDC-1. 1 和 Nokia5310_CMCC/l. 0(08. 20)Profile/MIDP-2. 2 Configuration/CLDC-1.2,虽然都是Nokia5310型号的手机但是两个UA是不同的,所以数 据库以Nokia5310作为手机的匹配标识,将其存储于数据库中,并配置与之相匹配的手机 服务,即数据库的建立是依据截取UA中的表示手机型号的匹配标识而建立的。当手机用户 需要获取某个手机服务,例如获取手机杂志,手机用户将手机与服务商的服务器相连接, 手机发送数据给服务器,服务器搜索手机信息数据库中与该手机相匹配的手机服务。然而,手机在发送数据到服务器时,其发送的是UA,而不是数据库中所存储的匹配 标识,因此,当服务器匹配数据库中存储的匹配标识和其接收到UA,无法从数据库中搜索到 UA,进而无法识别手机发送的UA,进一步无法获取该手机所需的手机服务。

发明内容
有鉴于此,本发明提供一种数据匹配方法及系统,以解决现有技术中手机信息数 据库接收到的UA与数据库中存储的匹配标识不相符,进而无法从数据库中搜索到UA,无法 识别手机发送的UA,进一步无法获取该手机所需的手机服务的问题。本发明所提供的一种 数据匹配方法及系统的具体方案如下一种数据匹配方法,包括接收手机发送的手机标识UA ;获取所述手机标识UA的分组标识,所述分组标识为手机标识UA中依据预设规律 组合的字符串;参考预先设定的分组标识与正则表达式或字串规则的对应关系,选取与所述分组 标识相对应的正则表达式或字串规则;
使用所述正则表达式或字符规则,获取设置在该手机标识UA中的匹配标识;搜索预设的手机信息数据库中与所述获取的匹配标识相匹配的手机服务。本发明还提供一种数据匹配系统,包括接收装置,用于接收手机发送的手机标识UA ;与所述接收装置相连的分组标识获取装置,用于获取所述手机标识UA的分组标 识,所述分组标识为手机标识UA中依据预设规律组合的字符串;与所述分组标识获取装置相连的规则选取装置,用于参考预先设定的分组标识与 正则表达式或字串规则的对应关系,选取与所述分组标识相对应的正则表达式或字串规 则;与所述规则选取装置相连的匹配标识获取装置,用于使用所述正则表达式或字符 规则,获取设置在该手机标识UA中的匹配标识;与所述匹配标识获取装置相连的匹配装置,用于搜索预设的手机信息数据库中与 所述获取的匹配标识相匹配的手机服务。应用上述技术方案,接收到手机发送的手机标识后,获取该手机标识的分组标识, 进而选取与该分组标识相对应的正则表达式或者字串规则,使用正则表达式或字串规则获 取该手机标识的匹配标识。依据匹配标识获取与之相匹配的手机服务,因为手机信息数据 库中存储的手机服务是以匹配标识作为标记的,即搜索手机信息数据库中存储的与所获取 的匹配标识相同的匹配标识,进一步获取手机服务。由于手机信息数据库接收的是匹配标 识,所以解决了现有技术中现有技术中手机信息数据库接收到的为UA,而不是匹配标识,进 而无法从数据库中搜索到UA,无法识别手机发送的UA,进一步无法获取该手机所需的手机 服务的问题。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以 根据这些附图获得其他的附图。图1为实现本发明方法具体实施例一的流程图
图2为实现本发明方法具体实施例二的流程图
图3为实现本发明方法具体实施例三的流程图
图4为实现本发明方法具体实施例四的流程图
图5为实现本发明方法具体实施例五的流程图
图6为实现本发明方法具体实施例六的流程图
图7为图6的子流程图8为实现本发明方法具体实施例七的流程图
图9为实现本发明方法具体实施例八的流程图
图10为实现本发明方法具体实施例九的流程图
图11为实现本发明系统的结构示意图。
具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。实施例一申请人:经研究发现,手机获取手机服务时,通过搜索手机信息数据库中与该手机 相匹配的手机服务,进而获取该手机服务。然而手机发送的UA与手机信息数据库中存储的 匹配标识不相同,因此无法从数据库中搜索到UA,无法识别UA,进而无法获取该手机所需 的手机服务。为了解决上述问题,本发明实施例提供一种数据匹配方法,其流程图参见图1所 示,包括SlOl 接收手机发送的手机标识UA ;UA被携带于手机浏览器http请求头信息中传输,当接收的头信息时,提取头信息 中携带的UA。S102 获取所述手机标识的分组标识,所述分组标识为手机标识中依据预设规律 组合的字符串;前已述及,UA包含厂商、型号、版本以及MIDP等信息,例如Nokia2330C_ CMCC/2. 0 (08. 20) Profile/MIDP-2. 1 Conf iguration/CLDC-1. 1,其中Nokia2230 为手机型 号,此型号可能有类似Nokia2230dc,Nokia2230d,Nokia2230i等形式,CMCC特殊标识,表示 中国移动定制机,2. 0(08. 20)为发行时间,Profile/MIDP-2. 1 Configuration/CLDC-1. 1 表 示支持的kjava即MIDP和CLDC版本,分别为2. 1和1. 1。发明人经过多次实践发现,UA通过正则表达式或者字串规则处理后,即可获取该 UA的匹配标识,且匹配标识与数据库中存储的匹配标识相同不同型号的手机。而UA采用的 正则表达式或者字串规则依据该UA携带的分组标识来确定,该分组标识为UA中依据预设 规律组合的字符串,如上述UA中的“Nokia”字符串或者“CMCC”字符串。S103:参考预先设定的分组标识与正则表达式或字串规则的对应关系,选取与所 述分组标识相对应的正则表达式或字串规则;S104 使用所述正则表达式或字符规则,获取设置在该UA中的匹配标识;正则表达式是指用来描述一系列符合某个句法规则的字符串的单个字符串,由普 通字符和元字符组成,用于获取长字符串中的短字符串,例如(([a-zA-Z\d]+) (["a-zA-Z\ d] I ["a-zA-Z\d]+\s*) ([a-zA-Z\d]+) (["a-zA-Z\d] ? ) (r/\s\_\_]*))。使用该正 则表达式匹配 Nokia5800d-lb/10. 3. 007/sw_platform = S60 ;sw_platform_version =5. 0 ; java_build_version = 1. 3. 4 Profile/MIDP-2. 0 Configuration/CLDC-1. 1 UNTRUSTED/1.0的UA,其匹配结果为Nokia5800d,选取匹配结果中的第二组字符串—— Nokia5800d,即可获得该UA的匹配标识-Nokia5800d。同样,字串规则是发明人经过多次实践总结出来的多个长字符串中相同的短字 符串的字符排序规律,例如Nokia5310_/10. 3. 007/sw_platform = S60 ;sw_platform_ version = 5. O ; java_buiId—version = 1.3.4 Profile/MIDP-2. O Configuration/CLDC-1. 1 UNTRUSTED/1.0 禾口 Nokia5310_CMCC/2. 0(ρ16· 61. 1)Profile/MIDP—2. 1 Configuration/CLDC-1. 1,两个长字符串中短字符串“Nokia5310”都排列在长字符串的第 一个字符开始,到第一个“_”字符结束的位置。因此,通过字串规则也可以获取具有一定排 序规则的UA中的匹配标识,如上例中的Nokia5310。S105:搜索预设的手机信息数据库中与所述获取的匹配标识相匹配的手机服务。手机信息数据库以数据表的形式记录与手机匹配的手机服务,如表1所示。获取 到匹配标识后,通过搜索数据库,寻找与之相同的匹配标识,当所获取的匹配标识语数据库 中的某个匹配标识相同时,通过数据表即可获取该手机匹配的手机服务,用户进而选取所 需的手机服务下载。表1手机服务记录表
权利要求
1.一种数据匹配方法,其特征在于,包括接收手机发送的手机标识UA ;获取所述手机标识UA的分组标识,所述分组标识为手机标识UA中依据预设规律组合 的字符串;参考预先设定的分组标识与正则表达式或字串规则的对应关系,选取与所述分组标识 相对应的正则表达式或字串规则;使用所述正则表达式或字符规则,获取设置在该手机标识UA中的匹配标识;搜索预设的手机信息数据库中与所述获取的匹配标识相匹配的手机服务。
2.根据权利要求1所述的数据匹配方法,其特征在于,所述分组标识为依据LG、 LEN0V0、KONKA和Capitel中的任意一种预设规律组合的字符串,选取与所述分组标识相 对应的正则表达式具体为选取表达式为(([a-zA-Z\\d]+) (["a-zA-Z\\d] [a-zA-Z]+) (
+)([a-zA-Z\\+] ?))。
3.根据权利要求1所述的数据匹配方法,其特征在于,所述分组标识为依据BENQA 预设规律组合的字符串,选取与所述分组标识相对应的正则表达式具体为选取表达式为 (([a-zA-Z\\d]+) (\\\\));使用所述正则表达式,获取设置在该手机标识UA中的匹配标识包括使用所述正则表达式匹配所述手机标识UA,获取匹配结果;选取所述匹配结果中的第二组字符串,所述第二组字符串为该手机标识UA的匹配标识。
4.根据权利要求1所述的数据匹配方法,其特征在于,所述分组标识为依据 UNTRUSTED、GMCC和MIDP中任意一种预设规律组合的字符串,选取与所述分组标识相对应 的字串规则具体为选取字串规则为当手机标识UA中包含依据Panasonic规律组合的字 符串时,截取以Panasonic开始,到第一个“/”字符之前的字符;当手机标识UA中包含依据SonyEricsson规律组合的字符串时,截取手机标识UA中以 SonyEricsson开始,到第一个“/”字符或者第一个空格字符之前的字符。
5.根据权利要求1所述的数据匹配方法,其特征在于,所述分组标识为依据Philips、 CECT、TCL和HAIER中的任意一种预设规律组合的字符串,选取与所述分组标识相对应的正 则表达式具体为选取表达式为(([a-zA-Z\\d]+) (.) ([a-zA-Z\\d\\i] + |\/{l}));使用所述正则表达式,获取设置在该手机标识UA中的匹配标识包括使用所述正则表达式匹配所述手机标识UA,获取匹配结果;当该匹配结果的第三组字符串为“/”时,选取该匹配结果中的第二组字符串为所述手 机标识UA的匹配标识;当该匹配结果的第四组字符串为“/”时,拼接该匹配结果中的第二组字符串和第三组 字符串作为所述手机标识UA的匹配标识,否则拼接该匹配结果中的第二组字符串、第三组 字符串和第四组字符串作为所述手机标识UA的匹配标识。
6.根据权利要求1所述的数据匹配方法,其特征在于,所述分组标识为依据Nokia、 MOT、 SonyEricsson^ Samsung、DopocU Apple、ΑΜ0Ι、Amoi、BIRD、BENQ> CoolPad、DBTEL> GiONEE、Zte、NEC、TIANYU、KINGER和KEJIAN中的任意一种预设规律组合的字符串,选取与 所述分组标识相对应的正则表达式具体为选取表达式为(([a-zA-Z\\d]+) (["a-zA-Z\\d]I["a-zA-Z\\d]+\\s*) ([a-zA-Z\\d]+) (["a-zA-Z\\d] ? )([~\/\\s\\-\\]*));使用所述正则表达式,获取设置在该手机标识UA中的匹配标识包括使用所述正则表达式匹配所述手机标识UA,获取匹配结果;当所述匹配结果的第二组字符串为“Typhoon”或“DBT”或“AppleWebKit”,且第三组字 符串为“/”时,拼接该匹配结果中的第二组字符串、第三组字符串和第四组字符串作为所述 手机标识UA的匹配标识。
7.根据权利要求6所述的数据匹配方法,其特征在于,当该匹配结果的第二组字符串 为“Nokia”且第三组字符串为空白字符串时,拼接匹配结果中的第二组字符串和第四组字 符串作为所述手机标识UA的匹配标识。
8.根据权利要求6所述的数据匹配方法,其特征在于,当该匹配结果的第三组字符 串不是“/”,且第二组字符串的起始字符串不是“Nokia”且第二组字符串的起始字符串 不是“SonyEricsson”或者该匹配结果的第三组字符串不是“/”,且第二组字符串的起 始字符串为“Nokia”且第四组字符串的长度大于4,且第二组字符串的起始字符串不是 “SonyEricsson”时,判断匹配结果的第五组字符串是否为“/、*、-、_、+、(”中的任意一个;当第五组字符串不为“/、*、_、_、+、(”中任意一个时,判断匹配结果的第二组字符串是 否以“MOT”为起始字符串且匹配结果的第五组字符串是否为“\” ;当所述第二组字符串以“MOT”为起始字符串且第五组字符串为“\”时,拼接所述匹配 结果中第二组字符串、第三组字符串和第四组字符串作为所述手机标识UA的匹配标识。
9.根据权利要求8所述的数据匹配方法,其特征在于,当所述第二组字符串不以“MOT” 为起始字符串或者第五组字符串不为“\”时,判断匹配结果的第三组字符串是否为“(”且 第二组字符串是否包括“Nokia” ;当所述第三组字符串为“(”且第二组字符串包括“Nokia”时,选取匹配结果中第二组 字符串之后的字符串作为手机标识UA的匹配标识,否则,截取匹配结果的第一组字符串作 为手机标识UA的匹配标识。
10.根据权利要求8所述的数据匹配方法,其特征在于,当匹配结果的第五组字符串是 “/、*、-、_、+、(”中的任意一个时,判断匹配结果的第三组字符串是否为空白字符;当所述第三组字符串不为空白字符时,判断匹配结果的第五组字符串是否为空白字 符,且第六组字符串是否包括“.”,且第二组字符串是否为“MOT”字符;当第五组字符串不为空白字符或者第六组字符串包括“.”或者第二组字符串不为 “MOT”字符时,判断匹配结果的第五组字符串是否为“ + ”字符;当所述第五组字符串为“ + ”字符时,拼接匹配结果中第二组字符串、第三组字符串、第 四组字符串和第五组字符串作为手机标识UA的匹配标识。
11.根据权利要求10所述的数据匹配方法,其特征在于,当所述第五组字符串不为“+ ” 字符时,判断匹配结果的第五组字符串是否为“-”;当所述第五组字符串不为“_”时,判断匹配结果的第二组字符串是否为“TIANYU”,且 第三组字符串是否为“-”,且第五组字符串是否为“ / ” ;当第二组字符串为“TIANYU”,且第三组字符串为“-”,且第五组字符串为“/”时,拼接 匹配结果中第二组字符串、第三组字符串、第四组字符串和第六组字符串,且第四组字符串 和第六组字符串之间加有“_”,拼接后的字符串作为手机标识UA的匹配标识,否则,拼接匹配结果中第二组字符串、第三组字符串和第四组字符串作为手机标识UA的匹配标识。
12.根据权利要求11所述的数据匹配方法,其特征在于,当所述第五组字符串为“/、 *、-、_、+、(”中的任意一个,且第三组字符串不为空白字符,且第五组字符串不为空白字符, 且第六组字符串包含“.”,且第二组字符串不为“MOT”,且第五组字符串不为“ + ”,且第五组 字符串为“_”时,对第六组字符串采用(([a-zA_Z]+)([\\d])+)正则表达式匹配;判断第六组字符串是否匹配到字符串,当匹配到字符串时,拼接匹配结果中第二组字 符串、第三组字符串、第四组字符串、第五组字符串和第二匹配结果作为手机标识UA的匹 配标识,否则拼接匹配结果中第二组字符串、第三组字符串、第四组字符串、第五组字符串 和第六组字符串作为手机标识UA的匹配标识。
13.根据权利要求11所述的数据匹配方法,其特征在于,当所述第五组字符串为“/、 *、-、_、+、(”中的任意一个,且第三组字符串不为空白字符,且第五组字符串为空白字符,且 第六组字符串不包含“.,,,且第二组字符串为“MOT,,时,判断第四组字符串是否为“Μ0Τ0,,;当第四组字符串为“Μ0Τ0”时,将接收到的手机标识UA中的“Μ0Τ0”替换为空格, “_\\s”替换为“_”,生成新的手机标识,并返回执行选取与所述分组标识相对应的正则 表达式具体为选取表达式为(([a-zA-Z\\d] +) (["a-zA-Z\\d] | ["a-zA-Z\\d] +\\s*) ([a-zA-Z\\d]+) (["a-zA-Z\\d] ? ) (r\/\\s\\_\\]*)),否则,拼接匹配结果中第二组字 符串、第三组字符串、第四组字符串、第五组字符串和第六组字符串作为手机标识UA的匹 配标识。
14.根据权利要求10所述的数据匹配方法,其特征在于,当第五组字符串是“/、*、-、、 +、(”中的任意一个,且第三组字符串为空白字符时,判断第五组字符串是否为“_”或者为 空白字符;当第五组字符串为“_”或者为空白字符时,拼接匹配结果中第二组字符串、第三组字符 串、第四组字符串、第五组字符串和第六组字符串作为手机标识UA的匹配标识,否则拼接 匹配结果中第二组字符串、第三组字符串和第四组字符串作为手机标识UA的匹配标识。
15.根据权利要求6所述的数据匹配方法,其特征在于,当所述匹配结果中的第二组字 符串为“ Samsung”,且第三组字符串为“ / ”时,将所述接收到的手机标识UA中的“ /,,替换为 “_”,生成新的手机标识UA;获取新的手机标识UA的分组标识,分组标识为依据Nokia、MOT、SonyEricsson, Samsung、Dopod、Apple、AMOI、Amoi、BIRD、BENQ、CoolPad、DBTEL、GiONEE、Zte、NEC、TIANYU、 KINGER和KEJIAN中的任意一种预设规律组合的字符串,继续执行选取与所述分组标识相 对应的正则表达式具体为选取表达式为(([a-zA-Z\\d]+) (["a-zA-Z\\d] | ["a-zA-Z\\ d]+\\s*) ([a-zA-Z\\d]+) (["a-zA-Z\\d] ? ) ([~\V\\s\\-\\_]*))。
16.根据权利要求1所述的数据匹配方法,其特征在于,所述分组标识为依据Mozilla 和LG、Mozilla和M0T、Aplix和LG、Aplix和MOT中的任意一种预设规律组合的字符串,选 取与所述分组标识相对应的字串规则具体为选取字串规则为截取手机标识UA中以LG 或MOT开始,到第一个“/”字符之前的字符,所截取的字符组成的字符串为匹配标识。
17.根据权利要求1所述的数据匹配方法,其特征在于,所述分组标识为依据Mozilla 和 Nokia、Mozilla 和 Samsung/SAMSUNG、Mozilla 和 Apple、Aplix 和 Nokia、Aplix 和 Samsung/SAMSUNG, Aplix和Apple中的任意一种预设规律组合的字符串,选取与所述分组标识相对应的字串规则具体为选取字串规则为截取手机标识UA中以Nokia或Samsung/ SAMSUNG或Apple开始,到手机标识UA结尾之间的字符组成新的手机标识UA ;获取新的手机标识UA的分组标识,分组标识为依据Nokia、Samsung、和Apple中 的任意一种预设规律组合的字符串,继续执行选取与所述分组标识相对应的正则表 达式具体为选取表达式为(([a-zA-Z\\d]+) (["a-zA-Z\\d] | ["a-zA-Z\\d]+\\s*) ([a-zA-Z\\d]+)(["a-zA-Z\\d] ? )([~\/\\s\\-\\_]*))。
18.根据权利要求1所述的数据匹配方法,其特征在于,所述分组标识为依据 Huawei/1. 0/预设规律组合的字符串,选取与所述分组标识相对应的字串规则具体为选 取字串规则为将手机标识UA中的Huawei/1. 0/替换为Huawei,生成新的手机标识UA ;获取新的手机标识UA的分组标识,分组标识为依据Nokia、MOT、SonyEricsson, Samsung、Dopod、Apple、AMOI、Amoi、BIRD、BENQ、CoolPad、DBTEL、GiONEE、Zte、NEC、TIANYU、 KINGER和KEJIAN中的任意一种预设规律组合的字符串,继续执行选取与所述分组标识相 对应的正则表达式具体为选取表达式为(([a-zA-Z\\d]+) (["a-zA-Z\\d] | ["a-zA-Z\\ d]+\\s*)([a-zA-Z\\d]+)(["a-zA-Z\\d] ? )([~\/\\s\\-\\]*)); 使用所述正则表达式匹配所述手机标识UA,获取匹配结果;去除所述匹配结果中的“Huawei”字符串,将去除“Huawei”之后的匹配结果中字符串 拼接生成新的字符串,该新字符串为该手机标识UA的匹配标识。
19.一种数据匹配系统,其特征在于,包括 接收装置,用于接收手机发送的手机标识UA ;与所述接收装置相连的分组标识获取装置,用于获取所述手机标识UA的分组标识,所 述分组标识为手机标识UA中依据预设规律组合的字符串;与所述分组标识获取装置相连的规则选取装置,用于参考预先设定的分组标识与正则 表达式或字串规则的对应关系,选取与所述分组标识相对应的正则表达式或字串规则;与所述规则选取装置相连的匹配标识获取装置,用于使用所述正则表达式或字符规 则,获取设置在该手机标识UA中的匹配标识;与所述匹配标识获取装置相连的匹配装置,用于搜索预设的手机信息数据库中与所述 获取的匹配标识相匹配的手机服务。
全文摘要
本发明公开了一种数据匹配方法及系统。一种数据匹配方法,包括接收手机发送的手机标识UA;获取所述手机标识UA的分组标识,所述分组标识为手机标识UA中依据预设规律组合的字符串;参考预先设定的分组标识与正则表达式或字串规则的对应关系,选取与所述分组标识相对应的正则表达式或字串规则;使用所述正则表达式或字符规则,获取设置在该手机标识UA中的匹配标识;搜索预设的手机信息数据库中与所述获取的匹配标识相匹配的手机服务。
文档编号H04W8/18GK102006582SQ201010574498
公开日2011年4月6日 申请日期2010年12月6日 优先权日2010年12月6日
发明者倪红波, 吴春雷, 王海利, 莫文飞 申请人:南京朗睿软件科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1