一种针对数据对象的数据信息获取和分析的方法及装置的制作方法

文档序号:7649774阅读:208来源:国知局
专利名称:一种针对数据对象的数据信息获取和分析的方法及装置的制作方法
技术领域
本发明涉及数据处理领域,特别是针对数据对象的数据信息获取和分析的方法及装置。
背景技术
目前随着互联网技术应用的越来越广泛,人们很多的日常工作和娱乐都在网络上进行,互联网也为了满足人民日益增长的各种需求,提供了各种各样的服务,这些服务在互联网上以数据对象的形式存在,比如新闻、多媒体内容、网络广告等,人民为了享受这些服务,都需要对所提供的数据对象进行各种各样的操作,这些操作行为我们称之为针对数据对象的行为,这样既方便了广大互联网用户,也为各种服务提供商带来了无限商机,但随着互联网技术的发展,产生了越来越多阻碍其进步的因素,比如针对数据对象的操作,许多互联网用户出于各种目的会产生大量的无效的针对数据对象的操作,这些无效的针对数据对象的操作不仅消耗互联网资源,也给那些服务提供者带了大量的困扰,下面以互联网上最常见的网络广告为例来分析。
目前,互联网已经成为一种非常直接、有效的广告媒介,但令广告客户感到困扰的是,网络广告受到的点击有很大一部分都属于欺诈点击。在常规搜索模式下,当用户搜索某个关键字时,搜索结果页面中就会出现一些相关公司的广告。如果用户点击广告,广告客户就需要向搜索服务提供商支付一定的费用。通过这一模式,广告客户可以更有针对性地接触潜在用户,搜索服务提供商也可以获得丰厚的利润。但不幸的是,搜索服务提供商的网络广告系统成为了滋生点击欺诈的温床,因为欺骗该系统非常容易。如Google、雅虎和其它搜索服务提供商在第三方网站上投放了大量广告,并依据广告点击次数同相关网站共享部分营收。为了获得更多营收,很多缺乏道德感的网站会通过各种途径重复点击自己网站上的广告,而这些点击对于广告客户没有任何意义。此外,还有很多公司重复点击竞争对手的网络广告,目的是消耗竞争对手的广告预算。目前,点击欺诈已经成为阻碍网络广告市场健康发展的一大顽疾,各搜索厂商一直都致力于通过技术和服务等来防止减少点击欺诈的发生。雅虎公司发布的全新反点击欺诈技术就是在这方面的有力探索,它以点击分析过滤、历史行为分析过滤、AI模式识别过滤、雅虎趋势分析平台等四大技术特点有效防止和减少了点击欺诈的发生。凭借全球领先的搜索智能识别技术,雅虎公司的反点击欺诈系统可以对每一次点击的用户端信息、以及其他几十种常用的点击参数进行分析,智能判断其中的欺诈点击并进行直接过滤。其次,通过综合分析每一个浏览用户在一段时间内的点击行为,雅虎公司的反点击欺诈系统可以主动过滤其中存在的欺诈点击。尤其值得一提的是该反欺诈点击系统先进的AI模式识别过滤功能,它利用雅虎在各国家的反欺诈点击小组进行密切联系,共同建立了一个庞大的欺诈点击样例库。通过AI模式识别系统,对来自全球的样例库进行训练,使得AI模式识别系统可以综合多种特征准确识别出欺诈点击。除此之外,该反欺诈点击系统还建立了雅虎趋势分析平台,综合收集来自雅虎搜索引擎和雅虎搜索竞价的明细信息,基于历史采样统计,进行点击趋势分析,可以更加有效的防御一些未知的作弊方式,凭借领先的反点击欺诈技术,雅虎已经识别了数十亿次恶意点击,避免了广告客户的利益损失。
虽然像雅虎这一类的反欺诈点击技术能在一定程度上识别出点击欺诈,但由于它只是单纯的从点击网络广告的网络行为分析的基础上进行的识别,这样的技术具有以下一些缺陷首先,该类技术由于完全从用户的网络行为进行分析,不能真正完全地识别点击欺诈,因为欺诈者在网络上是可以完全按照真实用户的操作行为进行模拟广告点击的,这个是该类技术无法识别出来的。其次,运算方法复杂,需要积累大量用户数据进行分析,成本很高,例如雅虎公司的反欺诈系统中的核心技术AI模式识别过滤功能,需要在全球建立一个庞大的欺诈点击/无效点击样例库,对来自全球的样例库进行训练,使得AI模式识别系统可以综合多种特征准确识别出欺诈点击/无效点击,这样的系统需要大量的数据为基础,花费大量的人力物力才能做到。最后,误识别率高,常常会将一些真实的广告行为识别为欺诈行为,这样会使广告提供商承担大量的损失。
总之,需要本领域技术人员迫切解决的一个技术问题就是如何能够准确、有效的识别出针对数据对象的行为是有效、无效行为等类别。

发明内容
本发明所要解决的技术问题是提供一种能够有效的识别出针对数据对象的行为是有效行为、无效行为的类别,从而可以真正完全地识别出互联网用户针对网络上的数据对象的行为哪些是有效的,哪些是无效的,并且运算方法简单,成本低,误码率低,从而更加准确的排除无效行为。
为此,根据本发明的一实施例,公开了一种针对数据对象的数据信息获取和分析的方法,所述数据对象为包含网络行为和电话行为的数据对象,所述方法包括如下步骤接收第一用户触发,获取针对该数据对象的网络行为数据信息,所述数据信息包括用户的IP地址;发送第一用户和第二用户的电话号码,通知通信网络连接第一用户和第二用户完成通话;获取针对该数据对象的电话行为数据信息,所述数据信息包括用户的电话号码和有效通话时长;分析IP地址对应的电话号码,当某个IP地址的用户的有效通话时长小于预设时间,则此次触发行为无效。
优选的,所述方法还可以包括当某个IP地址用户在预置时间段内采用超过预定个数的电话号码进行通话,则该IP地址在预置时间段为无效IP地址,该无效IP地址在预置时间段对应的触发行为均无效。
优选的,所述电话行为数据信息的获取为通话结束后,接收通信网络实时返回的针对该数据对象的电话行为数据信息。
优选的,所述的IP地址、电话号码、有效通话时长对应存储在展示数据对象的网站的数据库中。
优选的,所述方法还可以包括将分散的针对同一数据对象的数据信息汇集后集中存储至一数据库中;所述同一数据对象分散在多个网站中进行展示。
优选的,所述的数据对象为网站上展示的网络广告。其中,所述获取的数据对象的电话行为的数据信息为通信网络提供给网站的通话记录,所述的通话记录包括呼叫终端客户的电话号码和网络广告厂商的电话号码、呼叫终端客户的IP、来源网址URL、有效通话开始时间、有效通话结束时间、有效通话时长、通话次数。
优选的,所述方法还可以包括获取用户的IP地址、通话记录;分析每个IP用户对应的通话记录,如果某个IP的用户的有效通话时间小于预设时间,或者某个IP的用户在预置时间段内采用超过预定个数的电话号码进行通话,则该IP用户为无效用户。
优选的,所述方法还可以包括获取用户的通话记录;分析不同电话号码的通话记录,如果某个电话号码的通话次数超过预设频率或者有效通话时长小于预设时间,则该电话用户为无效用户。
进一步,当IP用户为无效用户或者电话用户为无效用户时,确定该用户的本次点击行为无效,或者确定该用户之后的所有点击行为无效。
根据本发明的另一实施例,还公开了一种针对数据对象的数据信息获取和分析的装置,包含第一信息获取模块,用于接收第一用户触发,获取针对该数据对象的网络行为数据信息,所述数据信息包括用户的IP地址;第二信息获取模块,用于发送第一用户和第二用户的电话号码,通知通信网络连接第一用户和第二用户完成通话;以及,获取针对该数据对象的电话行为数据信息,所述数据信息包括用户的电话号码和有效通话时长;第一分析模块,用于分析IP地址对应的电话号码,当某个IP地址用户的有效通话时长小于预设时间,则此次触发行为无效。优选的,还可以包括,当某个IP的用户在预置时间段内采用超过预定个数的电话号码进行通话,则此次触发行为无效。
优选的,所述电话行为数据信息的获取为通话结束后,接收通信网络实时返回的针对该数据对象的电话行为数据信息。
优选的,所述装置还可以包括一存储模块,用来存储IP地址和对应的电话号码、有效通话时长,所述存储模块位于展示所述数据对象的网站中。
优选的,所述装置还可以包括一数据库,用于将分散的针对同一数据对象的数据信息汇集后集中存储;所述同一数据对象分散在多个网站中进行展示。
优选的,所述的数据对象为网站上展示的网络广告。
优选的,所述装置还可以包括第二分析模块,用于分析每个IP用户对应的通话记录,如果某个IP的用户的有效通话时间小于预设时间,或者某个IP的用户在预置时间段内采用超过预定个数的电话号码进行通话,则该IP用户为无效用户,该IP地址对应的此次触发行为为无效行为或者之后的所有触发行为均无效。
优选的,所述装置还可以包括第三分析模块,用于分析不同电话号码的通话记录,如果某个电话号码的通话次数超过预设频率或者有效通话时长小于预设时间,则该电话号码为无效号码,该电话号码对应的此次触发行为为无效行为或者之后的所有触发行为均无效。
与现有技术相比,本发明具有以下优点由于本发明采用分析的数据不但包括数据对象的网络行为数据信息,而且还包括电话行为数据信息,在获取网络行为数据信息的同时获取电话行为的数据信息,从而建立网络行为和电话行为数据信息的一一对应,这样有效的解决了数据信息的获取过程,而且为分析数据信息进行识别提供了更加准确的数据基础。
本发明利用获取的数据对象的网络行为和电话行为数据信息的一一对应,结合网络行为数据信息和电话行为数据信息进行综合分析,分析用户的IP地址对应的电话号码,如果某个IP地址的用户的有效通话时长小于预设时间,则该IP地址为无效IP地址,该电话号码为无效电话号码,从而确定该IP地址及电话号码对应的此次触发行为为无效行为。在这样结合两者数据的基础上进行的分析,比单纯的从数据对象的网络行为数据信息出发进行分析,能得到更加准确的结果,能更加有效的区别哪些行为是有效行为,哪些行为是无效行为,大大的提高了识别的准确率。
既可以实时的进行分析,也可以在一段时间内进行分析,不需要进行大量的数据采集,也不需要汇集大量的数据为基础进行分析,因此成本低,能节约大量的人力、物力及网络资源。
由于采用了网络行为数据信息结合电话行为数据信息作为综合分析的基础,因此能有效的降低误识别率,有效的提高识别效率。


图1是本发明的数据获取和分析的方法的流程图;图2是本发明数据获取的流程图;图3是本发明实施例所述的针对网络广告行为的数据信息获取和分析方法的流程图;图4是图3所示实施例的具体流程图;
图5是图3所示实施例数据分析的具体流程图;图6是本发明针对数据对象行为的数据获取和分析装置框图;图7是图6所示装置存储模块中数据存储的格式。
具体实施例方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式
对本发明作进一步详细的说明。
参照图1,示出了本发明一种针对数据对象行为的数据获取和分析的方法的流程图。
由获取针对数据对象的网络行为的数据信息步骤101、获取针对数据对象的电话行为的数据信息步骤102、存储数据信息步骤103、结合网络行为和电话行为所获取的数据信息进行分析步骤104、根据分析所获取的数据信息确定行为为有效或无效的步骤105组成。
在步骤101中,获取针对数据对象的网络行为的数据信息包括用户的IP地址,还可以包括用户的来源网址URL等其他与用户的网络行为有关的数据信息,当用户在互联网站上对数据对象进行有针对性的行为时,如点击该数据对象时,则位于网站的后台程序会将用户的IP地址、来源网址URL等信息记录下来,这种记录用户IP地址等信息的后台程序是现有技术,很容易就能实现,在此不过多赘述。步骤102,当用户对该数据对象进行有针对性的行为时,如点击该数据对象,在记录针对该数据对象的网络行为的数据信息时会请求用户输入电话号码,获取用户的电话行为的数据信息,该电话行为的数据信息包括用户的电话号码、有效通话时长等记录,该步骤会在后面做详细的描述。步骤103,存储获取的用户网络行为数据信息和电话行为数据信息,网络数据库会建立一个数据表,一一对应存储用户的网络行为数据信息如IP地址等信息和电话行为数据信息如电话号码和有效通话时长等信息。步骤104,在获取用户的网络行为数据信息和对应的电话行为数据信息后,结合用户的网络行为数据行为和用户电话行为数据信息综合进行分析,分析用户的IP地址对应的电话号码,当某个IP地址的用户的有效通话时长小于预设时间,则对该IP地址和电话号码进行处理,如为无效的IP地址和电话号码,或者把该IP地址和电话号码存入黑名单,该有效通话时长的预设时间可以设为2秒或5秒。当某个IP的用户更换不同的电话号码的次数超过预设频率,则对该IP地址和电话号码进行处理,如标记为无效的IP地址和电话号码,或者把该IP地址和电话号码存入黑名单。
当IP无效或者电话号码无效时,其对应的此次触发行为一定无效;更严格的情况,该无效IP或者无效电话号码之后的所有触发行为都是无效的。当然,也可以当IP或者电话号码多次被判定为无效后,再认定该无效IP或者无效电话号码之后的所有触发行为都是无效的,从而提高分析效率。
图2是获取用户针对数据对象的电话行为数据信息的具体流程图。包括获取数据对象网络行为数据信息的步骤、请求用户输入电话号码的步骤201、提供电话号码给通信网络步骤202、请求通信网络返回数据信息步骤203、以及存储所获取的数据信息步骤。
步骤201,当获取针对数据对象的网络行为数据信息时,请求用户输入电话号码,该请求的方式可以是弹出一个对话框,让用户输入电话号码,也可以是一看到数据对象就可以看到的电话号码输入框。步骤202,当用户在对话框或输入框输入电话号码后,把该电话号码提交给通话网络中心,如提交给电信通信网络,移动通信中心等都可以,同时还把提供数据对象的客户的电话号码提交给通话网络中心,如把网络广告客户的电话号码提交给通信中心,通信中心收到这两个电话号码以后,接通两个电话号码,这时,用户就可以和客户直接进行通话,用户可以对他感兴趣的数据对象向客户询问,定购等。步骤203,当用户和客户通信结束以后,再请求通信网络返回该次电话行为的数据信息,包括电话号码、有效通话时长等数据信息。存储步骤,在获取网络行为数据信息和电话行为数据信息以后,一一对应存储在数据库中。
为了更清楚的说明本发明的原理及数据处理过程,下面以一个具体的例子来说明本发明所述方法的详细过程。如图3,是本发明在网络广告领域的一个具体的应用。该网络广告为包含网络行为和电话行为的网络广告即包含网络行为和电话行为的数据对象的一个具体的例子,这种网络广告现在越来越成为互联网广告的主流,因为通过这样的网络广告,使得用户不仅仅只是浏览广告,产生视觉上的冲击,而且会使对广告商品感兴趣的用户直接方便的与广告客户沟通,既方便了客户,也使商家即广告客户获得了更大的利益。这样包含了网络行为和电话行为的网络广告以各种各样的形式存在,如在传统网络广告上面加了一个电话图标,当用户点击电话图标的时候,会弹出一个窗口提示他们输入自己的电话号码,然后再点击通话的按钮,通信网络就会拨通广告客户的号码,然后再拨通用户输入的号码,当用户拿起听筒时,就会听到广告客户的来电。通过这种网络广告的方式,可以使对广告产品感兴趣的用户直接和广告客户通话,进行直接的沟通,即为用户提供了方便,也使广告客户能获取更多的利益。这样的网络广告就是本发明所说的集成了网络行为和电话行为的数据对象,这样的网络广告最大的特点就是使存放网络广告的网站既能通过用户的网络行为如浏览行为等知道用户的信息,又能通过通信网络返回的数据信息知道用户的信息,前者的信息包括用户的IP地址、来源网址URL,后者包括用户的电话号码,有效通话时长、有效通话开始时间、有效通话结束时间、通话次数等信息。
在步骤301中,获取针对网络广告的网络行为的数据信息包括用户的IP地址,还可以包括用户的来源网址URL等其他与用户的网络行为有关的数据信息,当用户在互联网站上对网络广告进行有针对性的行为时,如点击该网络广告时,则位于网站的后台程序会将用户的IP地址、来源网址URL等信息记录下来,这种记录用户IP地址等信息的后台程序是现有技术,很容易就能实现,在此不过多赘述。步骤302,当用户对该网络广告进行有针对性的行为时,如点击该网络广告,在记录针对该网络广告的网络行为的数据信息时会请求用户输入电话号码,获取用户的电话行为的数据信息,该电话行为的数据信息包括用户的电话号码、有效通话时长等记录,该步骤会在上面做了详细的描述。步骤303,存储获取的用户网络行为数据信息和电话行为数据信息,网络数据库会建立一个数据表,一一对应存储用户的网络行为数据信息如IP地址等信息和电话行为数据信息如电话号码和有效通话时长等信息。步骤304,在获取用户的网络行为数据信息和对应的电话行为数据信息后,结合用户的网络行为数据行为和用户电话行为数据信息综合进行分析,分析用户的IP地址对应的电话号码,当某个IP地址的用户的有效通话时长小于预设时间,则对该IP地址和电话号码进行处理,如为无效的IP地址和电话号码,或者把该IP地址和电话号码存入黑名单,该有效通话时长的预设时间可以设为2秒或5秒。当某个IP的用户更换不同的电话号码的次数超过预设频率,则对该IP地址和电话号码进行处理,如标记为无效的IP地址和电话号码,或者把该IP地址和电话号码存入黑名单。从而判断出用户对该网络广告的点击,通话是不是欺诈的点击等,从而能够识别出无效用户的无效点击,有效用户的有效点击。
图4是图3所述步骤的更为详细的说明,下面以图4来具体说明本发明。
参照图4,当普通用户进入网站W1上摆放广告的网页P1,普通用户看到了网页P1上面的网络广告A1或者看到了广告A1的关联地址A2,如果用户看到的是广告页面,则进入左边的流程,用户点击广告A1,然后看到广告商品的页面P2,这时,网页W1上的程序就会分析该用户甲的行为数据从而获取用户甲的IP地址和来源网址URL等信息,位于网站W1上的程序获取这些信息后就会存储在网站的数据库中,用户在观看广告的同时也会看到电话号码输入框K1,用户甲在电话号码输入框K1中输入自己的电话号码N1,当用户输入完自己的电话号码以后,网站W1后台程序会记录下电话号码N1、该用户的IP地址及当时的时间,并将这些信息整体写入W1的数据库中,之后将该广告A1代表的产品商家S1的指定电话号码N2从数据库中读取出来,然后将两个号码N1和N2同时提交给电信通信网络。电信通信网络会依次拨通N1和N2这两个电话号码,顺序是先N2后N1。然后双方进行通话。通话结束以后,电信通信网络将通话记录,包括N1和N2这两个电话号码、呼叫终端客户N1的IP、来源网址URL、发起端电话、有效通话开始时间、有效通话结束时间、总有效通话时长等返给网站W1。网站W1将电信通信网络提供的相关数据信息,包括N1和N2这两个电话号码、呼叫终端客户N1的IP、来源网址URL、发起端电话、有效通话开始时间、有效通话结束时间、总有效通话时长等存贮起来。
如果用户在网页P1上看到的是广告A1的关联地址A2,则点击A2进入网站W2的广告页面P3,这时,网页W2上的程序就会分析该用户甲的行为数据从而获取用户甲的IP地址和来源网址URL等信息,位于网站W2上的程序获取这些信息后就会存储在网站的数据库中,用户在观看广告的同时也会看到电话号码输入框K1,用户甲在电话号码输入框K1中输入自己的电话号码N1,当用户输入完自己的电话号码以后,网站W2后台程序会记录下电话号码N1、该用户的IP地址及当时的时间,并将这些信息整体写入W2的数据库中,之后将该广告A1代表的产品商家S1的指定电话号码N2从数据库中读取出来,然后将两个号码N1和N2同时提交给电信通信网络。电信通信网络会依次拨通N1和N2这两个电话号码,顺序是先N2后N1。然后双方进行通话。通话结束以后,电信通信网络将通话记录,包括N1和N2这两个电话号码、呼叫终端客户N1的IP、来源网址URL、发起端电话、有效通话开始时间、有效通话结束时间、总有效通话时长等返给网站W2。网站W2将电信通信网络提供的相关数据信息,包括N1和N2这两个电话号码、呼叫终端客户N1的IP、来源网址URL、发起端电话、有效通话开始时间、有效通话结束时间、总有效通话时长等存贮起来。如果变通用户是在第三方网页上看到了广告及电话号码输入框K1,数据的处理流程与上面是相同的,所不同的只是数据存储在W3中,在此不再详述。
图5提供了具体进行分析的详细步骤流程图。
步骤501,从数据库中提取用户的IP地址,和相应的通话记录等数据,获取数据后,综合用户针对网络广告的行为的数据信息即综合IP地址和通话记录,以IP地址和通话记录的结合来分析,就可以从两个不同的角度对数据进行分析,步骤502,分析所有不同IP的用户,分析每个不同IP的用户的来源网址及通话历史记录,如果有某个IP用户的通话次数过于频繁或者有效通话时长过短或者某个IP的用户频繁的更换不同的电话号码,都作为无效用户处理,步骤503,从电话号码的角度来分析,当获取了用户的历史行为记录以后先分析所有不同电话号码的用户,分析每个不同电话号码的用户的IP和通话记录,如果有某个电话号码的用户的通话过于频繁或者有效通话时长过短,则作为无效用户处理。确定无效用户以后,就可以根据数据库存中存储的IP地址及电话号码等信息确定哪些点击行为是无效点击行为,哪些是有效点击行为,然后根据来源网址URL来判断这些无效用户的无效点击来源于哪个网站。
下面还是以网络广告这个具体的例子来说明通过网络行为和电话行为数据信息获取和分析的具体应用。通过上面的说明我们明确了无效点击的识别过程,通过本发明所述的方法分析出数据信息特征即针对网络广告的点击行为是有效还是无效行为以后,比如说某个IP地址的用户在某次通话中通话时长过短,刚该次的该IP地址和电话号码被标记为无效IP地址和电话号码,其对应的该次点击为无效点击,通过IP地址,电话号码,来源网址在数据库中的对应存储,我们很容易就能跟踪到该无效用户的来源网址URL,这样我们就可以知道在哪个网站发生了无效点击,从而广告客户对该网站的该次点击不需要付广告费,这样就能避免广告客户因为欺诈点击而付广告费。
本发明还提供了一种实施例,即把存放数据对象的各个网站所获取的数据全部集中存放在第三个网站的数据库中,如广告客户的网站中的数据库中,然后再把这些集中的数据信息按本发明的方法进行分析,通过这样的分析得到的数据信息特征能更加准确的识别出行为的种类。还是以网络广告为例,通常一个广告客户的一个网络广告是不止投放一个网站的,它通常会投放在大量的网站上,我们把这些网站称为网站联盟。虽然通过前面的实施例可以知道在每个网站上分别进行分析,从而识别出行为的类别,但这样还不够精确和准确的识别出行为类别。还会发生这样一种情况,比如说一个无效的用户,它在每个网站上都无效点击一次网络广告,进行一次无效的电话行为,这时如果每个网站都独立分析的话是不能识别出该行为的。但如果把这个用户的数据信息集中到一个数据库存中进行分析,就能准确的识别出它的行为类别来了。
请参阅图6,是本发明针对数据对象行为的数据获取和分析装置框图。
由第一信息获取模块601、第二信息获取模块602、存储模块603、分析模块604组成。
第一信息获取模块用来获取针对数据对象网络行为的数据信息,这些信息包括用户的IP地址、来源网址URL等,第二信息获取模块用来获取针对数据对象电话行为的数据信息,包括用户的电话号码、有效通话时长等数据信息。存储模块存储的是一一对应的用户网络行为数据信息和电话行为数据信息,如一个用户的IP地址、电话号码、有效通话时长等。分析模块用来分析用户的IP地址对应的电话号码,当某个IP地址的用户的有效通话时长小于预设时间,则该IP地址为无效IP地址,该电话号码为无效电话号码,从而对该IP地址和电话号码进行处理,如放入黑名单。
图7是本发明存储模块中表格的格式,它存储的是用户的IP地址信息,以及与IP地址对应的电话号码,有效通话时长等信息,还可以包括用户的来源网址URL、通话次数等其它的网络行为信息和电话行为信息。
还是以网络广告来具体介绍本发明所述装置。
首先用户进入互联网站,看到存放在网站上的网络广告,当用户点击该网络广告时,第一信息获取模块获取用户的IP地址,来源网址URL等网络行为的数据信息,在获取网络行为数据信息时,请求用户输入电话号码,当用户输入完电话号码后,将该号码及存放在网站数据库中的该广告客户的电话号码一并提交给通信网络,通信网络接通这两电话号码,通话结束以后,第二信息获取模块请求通信网络返回该电话行为的数据信息,如用户的电话号码,有效通话时长等。在获取网络行为和电话行为数据信息以后,存储模块将网络行为数据信息和电话行为数据行为一一对应存储起来,该存储模块可以位于存入网络广告的网站,也可位于第三方网站,如广告客户的网站上。分析模块从存储模块中提取数据信息,并进行分析,分析用户的IP地址对应的电话号码,当某个IP地址的用户的有效通话时长小于预设时间,则对该IP地址和电话号码进行处理,如为无效的IP地址和电话号码,或者把该IP地址和电话号码存入黑名单,该有效通话时长的预设时间可以设为2秒或5秒。当某个IP的用户更换不同的电话号码的次数超过预设频率,则对该IP地址和电话号码进行处理,如标记为无效的IP地址和电话号码,或者把该IP地址和电话号码存入黑名单。则该无效IP地址和电话号码所对应的此次行为为无效行为。
以上对本发明所提供的一种数据信息获取和分析的方法及装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式
及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限定。
权利要求
1.一种针对数据对象的数据信息获取和分析的方法,其特征在于,所述数据对象为包含网络行为和电话行为的数据对象,所述方法包含如下步骤接收第一用户触发,获取针对该数据对象的网络行为数据信息,所述数据信息包括用户的IP地址;发送第一用户和第二用户的电话号码,通知通信网络连接第一用户和第二用户完成通话;获取针对该数据对象的电话行为数据信息,所述数据信息包括用户的电话号码和有效通话时长;分析IP地址对应的电话号码,当某个IP地址的用户的有效通话时长小于预设时间,则此次触发行为无效。
2.根据权利要求1所述的一种数据信息获取和分析的方法,其特征在于,还包括当某个IP地址用户在预置时间段内采用超过预定个数的电话号码进行通话,则该IP地址在预置时间段为无效IP地址,该无效IP地址在预置时间段对应的触发行为均无效。
3.根据权利要求1所述的一种数据信息获取和分析的方法,其特征在于,所述电话行为数据信息的获取为通话结束后,接收通信网络实时返回的针对该数据对象的电话行为数据信息。
4.根据权利要求1所述的一种数据信息获取和分析的方法,其特征在于,所述的IP地址、电话号码、有效通话时长对应存储在展示数据对象的网站的数据库中。
5.根据权利要求4所述的一种数据信息获取和分析的方法,其特征在于,还包括将分散的针对同一数据对象的数据信息汇集后集中存储至一数据库中;所述同一数据对象分散在多个网站中进行展示。
6.根据权利要求1所述的一种数据信息获取和分析的方法,其特征在于,所述的数据对象为网站上展示的网络广告。
7.根据权利要求6所述的一种数据信息获取和分析的方法,其特征在于,所述获取的数据对象的电话行为的数据信息为通信网络提供给网站的通话记录,所述的通话记录包括呼叫终端客户的电话号码和网络广告厂商的电话号码、呼叫终端客户的IP、来源网址URL、有效通话开始时间、有效通话结束时间、有效通话时长、通话次数。
8.根据权利要求7所述的一种数据信息获取和分析的方法,其特征在于,还包括获取用户的IP地址、通话记录;分析每个IP用户对应的通话记录,如果某个IP的用户的有效通话时间小于预设时间,或者某个IP的用户在预置时间段内采用超过预定个数的电话号码进行通话,则该IP用户为无效用户。
9.根据权利要求7所述的一种数据获取和分析的方法,其特征在于,还包括获取用户的通话记录;分析不同电话号码的通话记录,如果某个电话号码的通话次数超过预设频率或者有效通话时长小于预设时间,则该电话用户为无效用户。
10.根据权利要求8或9所述的一种数据信息获取和分析的方法,其特征在于,当IP用户为无效用户或者电话用户为无效用户时,确定该用户的本次点击行为无效,或者确定该用户之后的所有点击行为无效。
11.一种针对数据对象的数据信息获取和分析的装置,其特征在于,包含第一信息获取模块,用于接收第一用户触发,获取针对该数据对象的网络行为数据信息,所述数据信息包括用户的IP地址;第二信息获取模块,用于发送第一用户和第二用户的电话号码,通知通信网络连接第一用户和第二用户完成通话;以及,获取针对该数据对象的电话行为数据信息,所述数据信息包括用户的电话号码和有效通话时长;第一分析模块,用于分析IP地址对应的电话号码,当某个IP地址用户的有效通话时长小于预设时间,则此次触发行为无效。
12.根据权利要求11所述的一种针对数据对象的数据信息获取和分析的装置,其特征在于,还包括当某个IP的用户在预置时间段内采用超过预定个数的电话号码进行通话,则此次触发行为无效。
13.根据权利要求11所述的一种针对数据对象的数据信息获取和分析的装置,其特征在于,所述电话行为数据信息的获取为通话结束后,接收通信网络实时返回的针对该数据对象的电话行为数据信息。
14.根据权利要求11所述的一种针对数据对象的数据信息获取和分析的装置,其特征在于,还包括一存储模块,用来存储IP地址和对应的电话号码、有效通话时长,所述存储模块位于展示所述数据对象的网站中。
15.根据权利要求14所述的一种针对数据对象的数据信息获取和分析的装置,还包括一数据库,用于将分散的针对同一数据对象的数据信息汇集后集中存储;所述同一数据对象分散在多个网站中进行展示。
16.根据权利要求11所述的一种针对数据对象的数据信息获取和分析的装置,其特征在于,所述的数据对象为网站上展示的网络广告。
17.根据权利要求16所述的一种数据信息获取和分析的装置,其特征在于,还包括第二分析模块,用于分析每个IP用户对应的通话记录,如果某个IP的用户的有效通话时间小于预设时间,或者某个IP的用户在预置时间段内采用超过预定个数的电话号码进行通话,则该IP用户为无效用户,该IP地址对应的此次触发行为为无效行为或者之后的所有触发行为均无效。
18.根据权利要求16所述的一种数据信息获取和分析的装置,其特征在于,还包括第三分析模块,用于分析不同电话号码的通话记录,如果某个电话号码的通话次数超过预设频率或者有效通话时长小于预设时间,则该电话号码为无效号码,该电话号码对应的此次触发行为为无效行为或者之后的所有触发行为均无效。
全文摘要
本发明提供了一种针对数据对象的数据信息获取和分析的方法和装置,所述数据对象为包含网络行为和电话行为的数据对象,所述方法包含如下步骤接收第一用户触发,获取针对该数据对象的网络行为数据信息,所述数据信息包括用户的IP地址;发送第一用户和第二用户的电话号码,通知通信网络连接第一用户和第二用户完成通话;获取针对该数据对象的电话行为数据信息,所述数据信息包括用户的电话号码和有效通话时长;分析IP地址对应的电话号码,当某个IP地址的用户的有效通话时长小于预设时间,则此次触发行为无效。本发明由于采用了网络行为数据信息结合电话行为数据信息作为综合分析的基础,因此能有效的降低误识别率,有效的提高识别效率。
文档编号H04L12/24GK101014072SQ200710080269
公开日2007年8月8日 申请日期2007年2月15日 优先权日2007年2月15日
发明者田军, 陈永斌, 郭庆, 李俊 申请人:北京互联易通信息技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1