用于线上的设备机型识别方法及装置与流程

文档序号:23306000发布日期:2020-12-15 11:36阅读:224来源:国知局
用于线上的设备机型识别方法及装置与流程

本发明涉及一种设备机型识别方法及装置,具体地说,特别涉及一种用于线上的设备机型识别方法及装置。



背景技术:

随着互联网技术的发展,在广告监测等数据收集场景中可收集到大量媒体回传的ua信息,或通过sdk直接获取媒体回传的机型信息。现有技术中,直接对原始日中信息中的ua信息中进行解析保存,当需要通过设备机型找到设备id从而进行投放的场景中,会直接通过提取某个有限时间段内的日志数据,通过解析的信息找到对应的设备id。

该方案的缺点是:

1、因回收日志数据整体量较大,当需要提取设备信息时,只能提取一段时间内的数据已提取设备机型,当该段时间内的数据覆盖不全时,则可提取的设备id也有限;

2、当收集的ua信息不完整,或现有的解析规则不能进行成功解析时,无法获取到设备机型,则无法提取设备id;

3、当解析出的机型信息不标准时,如相同机型的名称有大小写、带空格、带特殊后缀等情况则相同机型不能统一,无法进行有效的合并;

4、当解析出的机型信息不能直接识别时,如解析出的信息为入网机型代码,不能通过代码直接判断机型名,导致无法圈选需要的设备机型;

5、同设备id对应的设备机型可能不同,这种情况下需要有效选取到可能性最大的机型。

因此亟需开发一种克服上述缺陷用于线上的设备机型识别方法及装置。



技术实现要素:

针对上述问题,本发明提供一种用于线上的设备机型识别方法,其中,包括:

步骤s1:从日志数据中提取多个要素信息,根据多个所述要素信息建立设备id与原始机型名称对应地的初始映射关系表;

步骤s2:对所述原始机型名称进行标准化处理后获得标准机型名称,根据所述设备id与所述标准机型名称建立所述设备id与所述标准机型名称一一对应地最终映射关系表;

步骤s3:根据实时获得的日志数据通过所述最终映射关系表识别出设备的标准机型名称。

上述的设备机型识别方法,其中,多个所述要素信息包括:设备id、浏览器信息及/或sdk信息。

上述的设备机型识别方法,其中,所述步骤s1中包括:

步骤s11:从所述日志数据中提取设备id、浏览器信息及/或sdk信息;

步骤s12:根据所述浏览器信息及/或所述sdk信息获取原始机型名称;

步骤s13:根据所述设备id及所述原始机型名称构建初始映射关系表。

上述的设备机型识别方法,其中,所述步骤s2中包括:

步骤s21:对所述原始机型名称进行标准化处理获得多个初始标准机型名称;

步骤s22:根据媒体投票机制于多个所述初始标准机型名称中确定一个最终标准机型名称;

步骤s23:根据所述设备id与所述最终标准机型名称建立所述设备id与所述最终标准机型名称一一对应地最终映射关系表。

上述的设备机型识别方法,其中,所述步骤s22中,根据媒体信息从多个所述初始标准机型名称中选择出现次数最多的初始标准机型名称为最终标准机型名称。

本发明还提供一种用于线上的设备机型识别装置,其中,包括:

初始映射关系表构建单元,从日志数据中提取多个要素信息,根据多个所述要素信息建立设备id与原始机型名称对应地的初始映射关系表;

最终映射关系表构建单元,对所述原始机型名称进行标准化处理后获得标准机型名称,根据所述设备id与所述标准机型名称建立所述设备id与所述标准机型名称一一对应地最终映射关系表;

识别单元,根据实时获得的日志数据通过所述最终映射关系表识别出设备的标准机型名称。

上述的设备机型识别装置,其中,多个所述要素信息包括:设备id、浏览器信息及/或sdk信息。

上述的设备机型识别装置,其中,所述初始映射关系表构建单元包括:

提取模块,从所述日志数据中提取设备id、浏览器信息及/或sdk信息;

原始机型名称获得模块,根据所述浏览器信息及/或所述sdk信息获取原始机型名称;

第一输出模块,根据所述设备id及所述原始机型名称构建初始映射关系表。

上述的设备机型识别装置,其中,所述最终映射关系表构建单元包括:

标准化模块,对所述原始机型名称进行标准化处理获得多个初始标准机型名称;

选择模块,根据媒体投票机制于多个所述初始标准机型名称中确定一个最终标准机型名称;

第二输出模块,根据所述设备id与所述最终标准机型名称建立所述设备id与所述最终标准机型名称一一对应地最终映射关系表。

上述的设备机型识别装置,其中,所述选择模块根据媒体信息从多个所述初始标准机型名称中选择出现次数最多的初始标准机型名称为最终标准机型名称。

综上所述,本发明相对于现有技术其功效在于:本发明由于进行了机型的标准化映射,生成机型数据可积累、可汇总、可直接使用市场机型名称进行分析,为投放场景中的标签设计提供便利;同时本发明由于综合了统一设备id的所有设备信息,包括历史信息及多媒体回传信息,使机型数据更准确可信;另外,当同设备id存在多种不同机型时,该方案综合对比不同媒体的回传信息,在媒体互相不认识的前提下,最多媒体认为的初始标准机型名称即为该设备id的最终标准机型名称,经过该方案处理后机型信息准确率可达93%。

本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所指出的结构来实现和获得。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明的设备机型识别方法的流程图;

图2为图1中步骤s1的分步骤流程图;

图3为图1中步骤s2的分步骤流程图;

图4为本发明的设备机型识别方法的应用流程图;

图5为本发明的设备机型识别装置的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地说明,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

关于本文中所使用的“包含”、“包括”、“具有”、“含有”等等,均为开放性的用语,即意指包含但不限于。

关于本文中的“多个”包括“两个”及“两个以上”。

设备id(deviceid):用户的移动端设备标识,包括imei、idfa等,在广告投放中多用于对用户进行定向,是较为稳定且在广告投放中通用的用户设备识别标志;

浏览器信息(ua):useragent中文名为用户代理,简称ua,它是一个特殊字符串头,使得服务器能够识别客户使用的浏览器信息。信息包括硬件平台、系统软件、应用软件和用户个人偏好,通过ua可以分析出浏览器名称、浏览器版本号、渲染引擎、操作系统。

手机入网型号:手机厂商在工信部进行备案时使用的手机型号,改型号可能与商品在市场型号不同,但存在对应关系。

请参照图1,图1为本发明设备机型识别方法的流程图。如图1所示,本发明设备机型识别方法包括:

步骤s1:从日志数据中提取多个要素信息,根据多个所述要素信息建立设备id与原始机型名称对应地的初始映射关系表;

步骤s2:对所述原始机型名称进行标准化处理后获得标准机型名称,根据所述设备id与所述标准机型名称建立所述设备id与所述标准机型名称一一对应地最终映射关系表;

步骤s3:根据实时获得的日志数据通过所述最终映射关系表识别出设备的标准机型名称。

需要说明的是,本发明从原始日志数据中进行设备id与机型名称的提取,形成单独的数据表,使设备id映射唯一的设备机型名称,且积累长时间范围内的全部id类型及机型信息,通过最终映射关系表对设备机型进行可识别性翻译,使机型可直接识别。

其中,多个所述要素信息包括:设备id、浏览器信息及/或sdk信息。需要说明的是,本发明可以从日志数据中提取设备id及sdk信息,从sdk信息中获取原始设备机型名称,从而建立设备id与原始机型名称对应地的初始映射关系表,但当部分sdk信息为空时,本发明还可以从日志数据中提取浏览器信息,从浏览器信息中获取原始设备机型名称,因此原始机型名称实际为ua及sdk两个信息结合而得,从而建立设备id与原始机型名称对应地的初始映射关系表。

在本发明的另一实施例中,还可以从日志数据中提取设备id及浏览器信息,从浏览器信息中获取原始设备机型名称,当浏览器信息不完整时,还可通过sdk信息补充,从而建立设备id与原始机型名称对应地的初始映射关系表。

进一步地,请参照图2,图2为图1中步骤s1的分步骤流程图。如图2所示,所述步骤s1中包括:

步骤s11:从所述日志数据中提取设备id、浏览器信息及/或sdk信息;

步骤s12:根据所述浏览器信息及/或所述sdk信息获取原始机型名称;

步骤s13:根据所述设备id及所述原始机型名称构建初始映射关系表。

再进一步地,请参照图3,图3为图2中步骤s2的分步骤流程图。所述步骤s2中包括:

步骤s21:对所述原始机型名称进行标准化处理获得多个初始标准机型名称,对设备原始机型名称进行标准化处理,可以使数据可有效合并;

步骤s22:根据媒体投票机制于多个所述初始标准机型名称中确定一个最终标准机型名称,对同设备id不同机型,进行媒体投票处理,选择媒体投票高票者为最终标准机型名称,从而提高识别的准确率;

步骤s23:根据所述设备id与所述最终标准机型名称建立所述设备id与所述最终标准机型名称一一对应地最终映射关系表。

其中,所述步骤s22中,根据媒体信息从多个所述初始标准机型名称中选择出现次数最多的初始标准机型名称为最终标准机型名称。

请参照图4,图4为本发明的设备机型识别方法的应用流程图。结合图4,以下举一具体实施例对本发明的设备机型识别方法进行说明。

应用场景:

在手机厂商争夺市场时,客户会指定投放某种设备机型进行大量的广告投放,客户会指定投放某种设备机型,但当前的机型识别方式较为简单粗暴,通过设备机型,设备id的机型识别率及准确率都不能保证。

本发明:

1、通过广告监测回收ua信息,解析ua信息获取原始机型名称,并建立设备id对应原始机型名称的初始映射关系表;

其中,设备id、浏览器信息及sdk信息如下表所示:

2、对所有解析的原始设备机型名称进行一次人工标准化映射,将入网机型代码映射设备机型,并将所有相同机型映射到统一的市场通用机型名称,即初始标准机型名称;

3、对所有回收信息的设备id的机型进行汇总,统计每个媒体回传的机型信息,如出现同设备id的初始标准机型名称不统一,则取最多媒体的相同初始标准机型名称作为最终标准机型名称;该媒体回传信息持续保留更新,当设备id出现在更多媒体上时,将有更多的媒体进行投票,使得最终的投票结果更准确;

4、建立设备id唯一对应最终标准机型名称的最终映射关系表,如下表所示;

5、以上流程定期更新执行,保持对新日志中的设备id及新出现机型进行持续补充。

需要说明的是,该样例数据为不同数据源拼凑而来,非实际数据。其中媒体信息非真实日志中的数据形式,为做说明而简化展示。

请参照图5,图5为本发明的设备机型识别装置的结构示意图。如图5所示,本发明的设备机型识别装置包括:

初始映射关系表构建单元11,从日志数据中提取多个要素信息,根据多个所述要素信息建立设备id与原始机型名称对应地的初始映射关系表;

最终映射关系表构建单元12,对所述原始机型名称进行标准化处理后获得标准机型名称,根据所述设备id与所述标准机型名称建立所述设备id与所述标准机型名称一一对应地最终映射关系表;

识别单元13,根据实时获得的日志数据通过所述最终映射关系表识别出设备的标准机型名称。

其中,多个所述要素信息包括:设备id、浏览器信息及/或sdk信息。

进一步地,所述初始映射关系表构建单元11包括:

提取模块111,从所述日志数据中提取设备id、浏览器信息及/或sdk信息;

原始机型名称获得模块112,根据所述浏览器信息及/或所述sdk信息获取原始机型名称;

第一输出模块113,根据所述设备id及所述原始机型名称构建初始映射关系表。

再进一步地,所述最终映射关系表构建单元12包括:

标准化模块121,对所述原始机型名称进行标准化处理获得多个初始标准机型名称;

选择模块122,根据媒体投票机制于多个所述初始标准机型名称中确定一个最终标准机型名称;

第二输出模块123,根据所述设备id与所述最终标准机型名称建立所述设备id与所述最终标准机型名称一一对应地最终映射关系表。

更进一步地,所述选择模块122根据媒体信息从多个所述初始标准机型名称中选择出现次数最多的初始标准机型名称为最终标准机型名称。

综上所述,本发明改进了对设备id的机型设别方法,对设备id的赋予唯一机型名称,当多个机型回传信息时,使用多媒体投票逻辑选取最高可能的机型信息,同时通过本发明积累历史全量数据的设备id及机型信息,对设备id覆盖更全面,设备机型识别更准确。

尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1