搜索数据的处理方法及装置与流程

文档序号:11864748阅读:411来源:国知局
搜索数据的处理方法及装置与流程

本公开实施例涉及数据处理技术领域,尤其涉及一种搜索数据的处理方法及装置。



背景技术:

在传统金融贷款业务的过程中,银行需要对客户的各种信息(如身份信息、存款贷款、工作信息、每月流水、不动资产等)进行征信协查,这些信息有些可以通过各大银行实现互联的网络数据平台获取,有些却需要银行相关的业务人员预审以及实地查看客户的各个数据信息,花费周期漫长,造成了传统金融贷款的效率低下。

而在移动互联网时代,通过移动终端用户的行为对用户信用进行评估,即通过行为金融学的方式评估用户的信用,从而实现终端用户的贷款业务,是目前终端中逐渐成熟的一种方式,跟传统金融贷款比,行为金融贷款不需要太多人工干预,它是根据用户日常生活中的行为在终端中得到的体现,刻画用户的金融画像,进而评估用户的信用实现其信用贷款的方式。

用户用户画像一词具有很重要的场景因素,以数据描述和了解客户,人是异常复杂的动物,信息纬度也非常复杂,仅通过外部的数据来进行人物的刻画是十分低端的,信用信息和人口属性为主,强相关信息,忽略弱关联信息,权重值以上的可以作为其用户画像的刻画数据,用户刻画时的几个纬度如人口属性、信用纬度、消费特征、兴趣爱好、社交信息等,画像数据的整理和集中,找到同业务场景中相关的数据,对数据进行分类和标签化,并根据业务需要判断是否需要引入外部数据,如银行信征中心、社交软件等,本公开提供了一种通过对个人的第一搜索数据的处理可得出对应用户的信用评价的方法。

而如何使用户行为在终端中的体现转化成确切的数据,从而使这些数据更好地判断用户的信用级别,进而服务于金融风险控制,是目前亟需解决的一个问题。

公开内容

本公开提供一种搜索数据的处理方法及装置,使得通过用户终端中的第一搜索数据的处理得出对应的行为及其信用评价,从而更好地实现对用户的行为的判断。

第一方面,本公开实施例提供了一种搜索数据的处理方法,所述方法包括:

上传若干用户在搜索引擎中的第一搜索数据至云数据平台;

筛选出所述第一搜索数据中频率权重大于等于预设权重的第二搜索数据;

获取所述第二搜索数据,以及所述第二搜索数据的标识信息;

根据所述第二搜索数据的标识信息,以及在搜索引擎内出现的第一搜索数据中包括的第二搜索数据的数量,获得信用权重。

本公开的实施例提供的技术方案可以包括以下有益效果:通过云数据平台对第一搜索数据进行筛选得出其中权重较大的第二搜索数据以及各第二搜索数据对应的标识信息,通过该标识信息以及第二搜索数据在搜索引擎内出现的第一搜索数据的比重,计算得出信用权重,从而完成对用户的金融行为的分析,无须再花费大量人力物力对该用户的实际金融情形考察,很好地通过第一搜索数据实现了用户的金融行为作出评价判断,并且对用户的金融画像方面的刻画也起到了十分重要的作用。

结合另一方面,在另一方面的一种可能的实现方式中,所述上传在搜索引擎中的第一搜索数据至云数据平台之前,包括:

获取在各搜索引擎中的浏览数据集合;

获取所述浏览数据集合中每项浏览数据的使用频率;

比较该使用频率与预设使用频率,选取使用频率大于等于预设使用频率的浏览数据作为第一搜索数据;

所述第一搜索数据为删除了低于预设使用频率的浏览数据以后的浏览数据集合。

本公开的实施例提供的技术方案可以包括以下有益效果:在将第一搜索数据上传到云数据平台之前,可进一步对搜索引擎中出现的浏览数据进行筛选以得到待上传的第一搜索数据,对于使用频率低于预设使用频率的无作用浏览数据作出丢弃操作,从而使得在第一搜索数据的源头上保证了第一搜索数据的质量。

结合另一方面,在另一方面的一种可能的实现方式中,获取所述第二搜索数据,以及所述第二搜索数据的标识信息时,包括:

获取每一所述第二搜索数据的出现次数;

将出现次数最多的第二搜索数据作为聚类数据;

获取所述聚类数据在所述云数据平台中的标识信息。

本公开的实施例提供的技术方案可以包括以下有益效果:通过在第二搜索数据中出现次数最多的第二搜索数据作为聚类数据,并且获取该聚类数据在云数据平台上被打上的标识信息,该标识信息为对第二搜索数据的聚类结果作出的标签,该标签能够反应该用户最经常进行的金融行为,进而可反映出该用户金融行为所对应的信用评价。

结合另一方面,在另一方面的一种可能的实现方式中,所述上传若干用户在搜索引擎中的第一搜索数据至云数据平台时,包括:

获取在搜索引擎中的浏览数据;

按照数据属性对各所述浏览数据进行划分,以得到类型权重;

将类型权重大于预设阈值的浏览数据作为第一搜索数据上传至云数据平台。

本公开的实施例提供的技术方案可以包括以下有益效果:对用户的搜索引擎中出现的浏览数据的另一种筛选方式,通过数据属性对浏览数据进行划分,从而得到类型权重大于预设阈值的浏览数据上传,使得通过较为准确地获取该用户的标识信息,从而更准确地对该用户的金融行为作出信用评价。

结合另一方面,在另一方面的一种可能的实现方式中,根据所述第二搜索数据的标识信息,以及在搜索引擎内出现的第一搜索数据中包括的第二搜索数据的数量,获得信用权重,包括:

根据第一搜索数据判断得出应用场景;

根据各应用场景所对应的数据关联强度,以及第一搜索数据的类型权重,计算得出各第二搜索数据的关联比重;

根据所述关联比重以及标识信息得到对应的信用权重。

本公开的实施例提供的技术方案可以包括以下有益效果:数据关联强度可作为对信用评价的一处常量K,通过该常量K使得得出信用权重时各用户站在同统一的评价标准,从而使得用户的信用权重更为客观,更接近于真实的用户的信用评价。

结合另一方面,在另一方面的一种可能的实现方式中,上传在搜索引擎中的第一搜索数据至云数据平台时,包括:

获取各所述第一搜索数据的应用场景;

对应用场景进行粗粒度分析,以得到在粗粒度分析所体现的分析规则内包括的第一搜索数据。

本公开的实施例提供的技术方案可以包括以下有益效果:各所述第一搜索数据的应用场景的粗粒度分析,同样地作为对第一搜索数据的一种筛选方式,可以通过一定的筛选规则得出第二搜索数据,通过粗粒度分析的方式可使得所述第一搜索数据能够得到更为准确的分类结果。

第二方面,本公开还提供了一种搜索数据的处理装置,其具体的技术方案包括如下:

上传模块,被配置用于上传在搜索引擎中的第一搜索数据至云数据平台;

筛选模块,被配置用于筛选出所述第一搜索数据中频率权重大于等于预设权重的第二搜索数据;

获取模块,被配置用于获取所述第二搜索数据,以及所述第二搜索数据的标识信息;

权重计算模块,被配置用于根据所述第二搜索数据的标识信息,以及在搜索引擎内出现的第一搜索数据中包括的第二搜索数据的数量,获得的信用权重。

结合另一方面,在另一方面的一种可能的实现方式中,所述装置还包括:

浏览获取模块,被配置用于获取所述在各搜索引擎中的浏览数据集合;

频率获取模块,被配置用于获取所述浏览数据集合中每项浏览数据的使用频率;

比较模块,被配置用于比较该使用频率与预设使用频率,选取使用频率大于等于预设使用频率的浏览数据作为第一搜索数据,丢弃使用频率小于预设使用频率的浏览数据;

其中,所述上传模块中的所述第一搜索数据为删除了低于预设使用频率的浏览数据以后的浏览数据集合。

结合另一方面,在另一方面的一种可能的实现方式中,所述权重计算模块还包括:

次数获取模块,被配置用于获取每一所述第二搜索数据的出现次数;

聚类数据模块,被配置用于将出现次数最多的第二搜索数据作为聚类数据;

标识获取模块,被配置用于获取所述聚类数据在所述云数据平台中的标识信息。

结合另一方面,在另一方面的一种可能的实现方式中,所述上传模块还包括:

浏览数据模块,被配置用于获取在搜索引擎中的浏览数据;

类型划分模块,被配置用于按照数据属性对各所述浏览数据进行划分,以得到类型权重;

数据上传模块,被配置用于将类型权重大于预设阈值的浏览数据作为第一搜索数据上传至云数据平台。

结合另一方面,在另一方面的一种可能的实现方式中,所述权重计算模块还包括:

判断模块,被配置用于根据第一搜索数据判断得出应用场景;

关联比重计算模块,被配置用于根据各应用场景所对应的数据关联强度,以及第一搜索数据的类型权重,计算得出各第二搜索数据的关联比重;

第二权重计算模块,根据所述关联比重以及标识信息得到对应的信用权重。

结合另一方面,在另一方面的一种可能的实现方式中,所述上传模块还包括:

场景获取模块,被配置用于获取各所述第一搜索数据的应用场景;

粒度分析模块,被配置用于对应用场景进行粗粒度分析,以得到在粗粒度分析所体现的分析规则内包括的第一搜索数据。

第三方面,本公开还提供了一种搜索数据的处理装置,包括:

处理器;

用于存储处理器可执行指令的存储器;

其中,所述处理器被配置为:

上传在搜索引擎中的第一搜索数据至云数据平台;

筛选出所述第一搜索数据中频率权重大于等于预设权重的第二搜索数据;

获取所述第二搜索数据,以及所述第二搜索数据的标识信息;

根据所述第二搜索数据的标识信息,以及在所述搜索引擎内出现的第一搜索数据中包括的第二搜索数据的数量,获得信用权重。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

图1为本公开示例性实施例所述的一种搜索数据的处理方法的流程示意图;

图2为本公开示例性实施例的浏览数据筛选的流程示意图;

图3为本公开示例性实施例的聚类时的标签示意图;

图4为本公开示例性实施例的类型权重的示意图;

图5为本公开示例性实施例的应用场景的方法示意图;

图6为本公开示例性实施例的一种搜索数据的处理装置框图;

图7是根据一示例性实施例示出的一种用于第一搜索数据的处理方法的装置800的框图。

具体实施方式

下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本公开,而非对本公开的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本公开相关的部分而非全部结构。

在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图中将各步骤描述成顺序的处理,但是其中的许多步骤可以并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排,当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图内的其它步骤。处理处理可以对应于方法、函数、规程、子例程、子程序等。

本公开涉及一种搜索数据的处理方法及装置,其主要运用于在通过终端进行信用评价以实现金融风险控制的场景中,通过云数据平台对出现在终端搜索引擎中的搜索数据进行筛选、聚类分析、信用权重的计算等,使得通过云数据平台的数据分析即可以获得用户的信用权重,通过该信用权重可以更好地评价用户的金融行为,从而更好地为金融风险控制服务,避免了将金融款项发放给信用不良好的用户。

本实施例可适用于带有搜索引擎的终端中以进行信用评价的情况中,该方法可以由终端的控制装置来执行。其中,该装置可以由软件和/或硬件来实现,一般地可集成于终端中,或者云数据平台的服务管理中心来控制。

用户通过终端(如手机、pad等具有搜索功能的终端)中的搜索引擎,或者终端中安装的应用程序app的搜索引擎,搜索数据,获得资讯。这些搜索项可以用于侧写用户的金融能力。实现时,可以通过账号、移动终端标识等信息标识出哪些搜索数据归属于同一个用户。

例如,用户注册的手机号码,绑定的唯一终端标识,各种购物网站的账号等。云数据平台接收到终端上传的来自终端浏览器的第一搜索数据a、来自购物网站的第一搜索数据b、来自操作系统搜索的第一搜索数据c后,可以根据上传该第一搜索数据a、c的终端标识确定第一搜索数据a、c属于用户A,根据购物网站的账号确定第一搜索数据b也属于用户A。

如图1所示,本公开示例性实施例所述的一种搜索数据的处理方法,该方法可适用于终端中,其具体包括如下步骤:

在步骤110中,上传在搜索引擎中的第一搜索数据至云数据平台;

智能型终端的搜索引擎,可以包括独立的能够用于网络连接的搜索引擎,如百度、谷歌、必应等,也可以为在客户端某一应用的搜索引擎,例如一些购物应用中在网站中搜索物品时形成的第一搜索数据。

第一搜索数据可以为在对应的搜索引擎内进行搜索时的历史浏览数据经过筛选后的第一搜索数据。

云数据平台提供有效的数据接口,接收各移动终端的原始数据(第一搜索数据)并为相关的数据统计提供服务,例如数据的集成、分析、融合、分配以及聚合等。

在终端中可通过有线或无线的数据接口将在搜索引擎中出现的第一搜索数据上传至云数据平台。

在步骤120中,筛选出第一搜索数据中频率权重大于等于预设权重的第二搜索数据;

云数据平台中进行对第一搜索数据的聚合分析,在上传的第一搜索数据较多时,可通过关键字监控的方式对上传的第一搜索数据进行分析,在通过关键字分析时,每一关键字可为在第一搜索数据可能出现的一个或多个第一搜索数据,该关键字所包括的第一搜索数据能够更好地体现金融行为,例如,该关键字为“贷”,则其相关的第一搜索数据可以包括“骗贷”、“贷款”、“高利贷”等,与该关键字相关的第一搜索数据作为第二搜索数据,并且每一第二搜索数据具有其对应的标识信息,该标识信息对应的为各与关键字相关的第一搜索数据的信用风险值。

在可采取的另一种方式中,该关键字监控的方式还可进行变通,例如可为:

在云数据平台中对第一搜索数据中的频率权重进行统计;

将统计后的频率权重大于等于预设权重的各第一搜索数据,作为第二搜索数据;

以在云数据平台中的所有终端上传的第一搜索数据作为计算基数,获取频率权重时,通过计算某一终端上传的各第一搜索数据在该计算基数中的相同的第一搜索数据的比例得出所述频率权重,即频率权重为各所述第一搜索数据在云数据平台中现出的频率,而预设权重可通过云数据平台预先设置。

在步骤130中,获取第二搜索数据,以及第二搜索数据的标识信息;

在通过步骤120中频率权重的筛选之后,可得出对应的第二搜索数据,同时可获取在对各第二搜索数据的标识信息。

标识信息为对各第二搜索数据的标签,该标签为各第二搜索数据的常规信用权重。在出现该第二搜索数据时一般可判断该终端的该种金融行为的常规的信用权重。

信用权重为一信用评价值,为一个确定的能够反映出用户金融行为风险的数值。

在步骤140中,根据第二搜索数据的标识信息,以及在搜索引擎内出现的第一搜索数据中包括的第二搜索数据的数量,获得信用权重。

各第二搜索数据即标识信息为一常规信用权重M,第二搜索数据所占对应的第一搜索数据的比重为一常量N,则此时该信用权重P=M×N,该信用权重P用以评价该用户的与金融业务相关的金融行为。

在本公开示例性实施例的另一实施场景中,如图2所示,步骤110之前,还包括对浏览数据进行筛选后再上传至云数据平台的步骤,以使得对于搜索引擎中出现的浏览数据进行初步筛选,其步骤包括如下:

在步骤210中,获取在各搜索引擎中的浏览数据集合;

在搜索引擎中出现的浏览数据集合中有可能包括有用的第一搜索数据,例如“贷款”、“风险”、“金融行业”等,以及无意义的浏览数据,例如一些数字及被打乱的字母,“2ad”/“lkdo”等。

在步骤220中,获取浏览数据集合中每项浏览数据的使用频率;

搜索引擎中出现的每一项浏览数据,均会由于使用习惯以及搜索引擎是否为常用搜索引擎等因素而具有不同的使用频率,对浏览数据的使用频率进行统计。

在步骤230中,比较该使用频率与预设使用频率,选取使用频率大于等于预设使用频率的浏览数据作为第一搜索数据;;

对于浏览数据集合中,有用的浏览数据的使用频率较预设使用频率高时,使该民浏览数据作为将要上传的第一搜索数据使用,而对于一些无意义的使用频率低于预设使用频率的浏览数据,可以作出丢弃操作,也可以进行其它形式的处理。

因此,在搜索引擎中的第一搜索数据至云数据平台时中的第一搜索数据为删除了低于预设使用频率的无意义的浏览数据以后的浏览数据集合中使用频率大于预设使用频率的浏览数据。

在本公开示例性实施例的一种实施方式中,如图3所示,在进行所述步骤120时,包括有对第二搜索数据进行聚类分析以得到其标识信息的步骤,从而使得对数据的分析能够从大数据分析的角度更加智能地得到其标识信息,其具体的步骤包括如下:

在步骤310中,获取每一第二搜索数据的出现次数。

其中的第二搜索数据,可以为对最原始的浏览数据集合中二次筛选分析以后的结果,此时的第二搜索数据较能够反映真实的与金融方面相关的数据情形,统计其中的第二搜索数据的出现次数,出现次数为每一第二搜索数据在所有的第一搜索数据中总共出现的次数。

在步骤320中,将出现次数最多的第二搜索数据作为聚类数据。

一般情况下,在第二搜索数据中出现次数最多的第二搜索数据只有一个,此时,将该出现次数最多的第二搜索数据作为聚类数据,而在一些情况下,可能出现不同的第二搜索数据的出现次数相同的情形,例如,出现对于第二搜索数据中的“贷款”和“套现”的出现次数同为A次(A大于等于2),则根据情况分别进行分析:

对于能够计算得出第二搜索数据的使用频率的情况:

分别获取第二搜索数据中的“贷款”和“套现”的使用频率B和C,此时聚类数据可选择其中的任意一个,然而该聚类数据的出现次数A1=A×(1+(1-B)×(1-C)),即,相应地在该情况下提升聚类数据的出现次数。

对于无法计算得出第二搜索数据的使用频率的情况:

直接使该聚类数据的出现次数A1=K1×A,其中K1为一大于1的常数,可通过数据的统计对其进行设置。

在步骤330中,获取聚类数据在云数据平台中的标识信息。

对于获取得到的聚类数据,其对应地在所述云数据平台中具有一标识信息,该标识信息为该聚类数据的标签,通常为一能够反映信用评价的评价系数,例如,当该聚类数据为“高利贷”时,所述标识信息可以低于0.6,即不建议向该用户进行贷款。

在本公开示例性实施例的另一实施场景中,如图4所示,在进行所述步骤110时,还可以进行的方式是对搜索引擎中的浏览数据进行类型划分,以在上传第一搜索数据之前对搜索引擎中的浏览数据进行另一种方式的筛选,该过程的具体操作步骤包括如下:

在步骤410中,获取在搜索引擎中的浏览数据;

同所述步骤210,在移动终端中的搜索引擎中出现的浏览数据集合,可能包括有用的第一搜索数据,例如“贷款”、“风险”、“金融行业”、“高利贷”以及“套现”等,以及无用的或无意义的浏览数据,例如一些数字及被打乱的字母,“2ad”/“lkdo”等。

在步骤420中,按照数据属性对各所述浏览数据进行划分,以得到类型权重;

数据属性可为浏览数据的类型特征属性,对浏览数据进行划分时可得到不同类型特征的浏览数据,每一个类型的浏览数据均对应地具有一类型权重。

在步骤430中,将类型权重大于预设阈值的浏览数据作为第一搜索数据上传至云数据平台。

将类型权重与预设阈值作比较,对于类型权重大于预设阈值的浏览数据进行上传,而类型权重小于预设阈值的浏览数据则丢弃。

通过本实施方式中的通过类型特性对浏览数据进行筛选后作为第一搜索数据上传至云数据平台,在进一步的聚类分析时,能够根据同一类型特性的第一搜索数据进行聚类分析,无须再通过新的方式再一次对第一搜索数据进行聚类,从而便于后续方法的执行。

如图5所示,为本公开示例性实施例给出的信用权重的计算过程,其通过第一搜索数据的应用场景,以及其关联强度,综合得出影响信用权重的常量,进而更准确地得出信用评价,实现这一过程的步骤包括如下:

在步骤510中,根据第一搜索数据判断得出应用场景;

应用场景可以是应用程序,即第一搜索数据的来源,例如可以是微博、百度、浏览器、facebook、google mobile等的搜索引擎,也可以是在终端中社交网络的传播途径也反映的应用场景。

在步骤520中,根据各应用场景所对应的数据关联强度,以及第一搜索数据的类型权重,计算得出各第二搜索数据的关联比重;

从不同的应用场景中得出的第一搜索数据,其对应地有不同的数据关联强度,例如从微博搜索引擎中得到的第一搜索数据的数据关联强度,其一般大于从google mobil中得到的第一搜索数据的数据关联强度,该数据关联强度同时也可分为强关联和弱关联,对于强关联的数据其强度值可设置为大于1,对于弱关联的数据其强度值可设置为小于1,而且基于步骤420中涉及的方法得到的类型权重,综合得出第一搜索数据的关联比重,该关联比重可以作为第一搜索数据的另一常量K,由于关联强度的不同,常量K通常也不同,因此,通过应用场景判断的方式,可以得出不同的用户的信用权重,即对用户的信用评价。

在步骤530中,根据所述关联比重以及标识信息得到对应的信用权重。

根据由数据关联强度、类型权重得出的关联比重,以及第一搜索数据经过筛选之后的标识信息,综合得出对应的信用权重。

在本公开示例性实施例可能的另一实施方式中,在对第一搜索数据进行分类时,可通过粗粒度分析的方法对第一搜索数据进行分析而得到聚类结果,其具体的实施过程包括如下:

获取各所述第一搜索数据的应用场景;

所述应用场景可以为第一搜索数据的来源的具体应用程序,同步骤510中的应用场景。

对应用场景进行粗粒度分析,以得到在粗粒度分析所体现的分析规则内包括的第一搜索数据。

以第一搜索数据的应用场景作为基本元素进行粗粒度分析,即在相同的应用场景下得到的第一搜索数据可作为一个大的类,以便于对同一来源的第一搜索数据的聚类分析。

本公开的方法的实施工作可包括:

(1)、获取上传的第一搜索数据;

在云数据平台保存了每一用户近期的第一搜索数据,即用户的浏览数据经过关键字/词的筛选之后的第一搜索数据。可以通过账号、移动终端标识等信息标识出第一搜索数据归属于一个用户。

(2)、选取其中n名用户的数据进行分析;

获取云数据平台中n名用户的第一搜索数据,其中,所述n为符合大数据思想一个常数。

(3)、对关键字/词信息进行聚类分析,比如100000条数据包含有意义的词有680000多个,根据词语在文档中出现的频率选择其中出现次数大于100的10000个词语作为特征词,用TFIDF(TF-IDF(term frequency–inverse document frequency))方法构建特征向量,然后使用Kmeans算法进行聚类。

(4)、得到聚类分析的结果,对不同的聚类结果打上标识信息的标签,比如下面两个聚类结果:

kinds=类别标号,size:类别包含的用户数(类别标号、标签)

kinds:0

size:284

The max K attr:奖:0.488501双色球:0.323055彩票:0.127598浏览器:0.098957乐透:0.095484uc:0.091905彩:0.056511香港:0.047539六合:0.045029星彩开:0.034489走势:0.032245福利:0.030691色球:0.028976号码:0.026521直播:0.021853星彩:0.020399体育:0.020218马会开:0.019988万能:0.019321预测:0.017427选:0.017284快播:0.016266排列:0.015760钥匙:0.015745现场:0.014799今天:0.014467福彩:0.011413和合彩:0.010900体彩:0.010795红米:0.010228助手:0.009482规则:0.008244新闻:0.007878预报:0.007857星星:0.007622铃声:0.007602福彩双:0.007538走:0.007521记录:0.007437空调:0.007362天:0.007328试机:0.007200违章:0.007033时时:0.007004超级:0.006974期:0.006936火车票:0.006843快乐:0.006821法:0.006739东风:0.006712

#################################################################

kinds:1

size:121

The max K attr:怀孕:0.447857孕妇:0.119114月:0.087769多久:0.045541症状:0.043221肚子:0.042059初期:0.041532女子:0.040367司机:0.035727老婆:0.031274胎儿:0.029885同房:0.028104宝宝:0.026618测:0.024536月经:0.024181梦见:0.022584影响:0.021118期间:0.020735喝:0.020239三个:0.019241痛:0.019191生:0.018830疼:0.018731女孩:0.018346四个:0.018296女儿:0.017824几个:0.017724滴滴:0.017649父亲:0.017171老公:0.017167反应:0.016697几天:0.015458孩子:0.014972男子:0.014660孕:0.014398多月:0.014194注意:0.014002正常:0.013803打车:0.013532姨妈:0.013331遭:0.013144流产:0.013130女人:0.012853想:0.012767五个:0.011992算:0.011927书记:0.011885男孩:0.011764

#################################################################

则kinds 0的标识信息可以为彩票,kinds 1的标识信息可以为怀孕。

通过获取云数据平台中kinds的标识信息的风险值,综合以上方法中涉及的对该标识信息的影响因素,如第一搜索数据的类型权重、数据关联强度、使用频率、聚类结果等综合计算得出对应的信用权重,以评价信用等级。

上述的方法可以每隔一预定的时间,重新获取对标识信息计算其新的信用权重,当信用权重的值大于某一风险值时,则可以通过上报到金融数据中心对该用户的网络金融行为作出限制。

图6为本公开提供的一种搜索数据的处理装置的框图,如图6所示,本公开的一种搜索数据的处理装置主要包括上传模块610、筛选模块620、获取模块630以及权重计算模块640,其中的两两模块之间可实现通讯连接,且均可与用户终端的中心控制单元保持通讯连接。

其中的上传模块610,被配置用于上传在搜索引擎中的第一搜索数据至云数据平台;

筛选模块620,被配置用于筛选出所述第一搜索数据中频率权重大于等于预设权重的第二搜索数据;

获取模块630,获取所述第二搜索数据,以及所述第二搜索数据的标识信息;

权重计算模块640,被配置用于根据所述第二搜索数据的标识信息,以及在每一用户的搜索引擎内出现的第一搜索数据中包括的第二搜索数据的数量,获得信用权重。

在本公开示例性实施例的另一实施场景中,所述装置还包括:

浏览获取模块,被配置用于获取在各搜索引擎中的浏览数据集合;

频率获取模块,被配置用于获取所述浏览数据集合中每项浏览数据的使用频率;

比较模块,被配置用于比较该使用频率与预设使用频率,选取使用频率大于等于预设使用频率的浏览数据作为第一搜索数据,丢弃使用频率小于预设使用频率的浏览数据;

其中,所述上传模块中的所述第一搜索数据为删除了低于预设使用频率的浏览数据以后的浏览数据集合。

在本公开示例性实施例的另一实施场景中,所述权重计算模块630还包括:

次数获取模块,被配置用于获取每一所述第二搜索数据的出现次数;

聚类数据模块,被配置用于将出现次数最多的第二搜索数据作为聚类数据;

标识获取模块,被配置用于获取所述聚类数据在所述云数据平台中的标识信息。

在本公开示例性实施例的另一实施场景中,所述上传模块610还包括:

浏览数据模块,被配置用于获取在搜索引擎中的浏览数据;

类型划分模块,被配置用于按照数据属性对各所述浏览数据进行划分,以得到类型权重;

数据上传模块,被配置用于将类型权重大于预设阈值的浏览数据作为第一搜索数据上传至云数据平台。

在本公开示例性实施例的另一实施场景中,所述权重计算模块630还包括:

判断模块,被配置用于根据的第一搜索数据判断得出应用场景;

关联比重计算模块,被配置用于根据各应用场景所对应的数据关联强度,以及第一搜索数据的类型权重,计算得出各第二搜索数据的关联比重;

第二权重计算模块,根据所述关联比重以及标识信息得到对应的信用权重。

在本公开示例性实施例的另一实施场景中,所述上传模块610还包括:

场景获取模块,被配置用于获取各所述第一搜索数据的应用场景;

粒度分析模块,被配置用于对应用场景进行粗粒度分析,以得到在粗粒度分析所体现的分析规则内包括的第一搜索数据。

上述实施例中提供的搜索数据的处理装置可执行本公开中任意实施例中所提供的搜索数据的处理方法,具备执行该方法相应的功能模块和有益效果,未在上述实施例中详细描述的技术细节,可参见本公开任意实施例中所提供的搜索数据的处理方法。

本公开还提供了一种搜索数据的处理装置,包括:

处理器;

用于存储处理器可执行指令的存储器;

其中,所述处理器被配置为:

上传在搜索引擎中的第一搜索数据至云数据平台;

筛选出所述第一搜索数据中频率权重大于等于预设权重的第二搜索数据;

获取所述第二搜索数据,以及所述第二搜索数据的标识信息;

根据所述第二搜索数据的标识信息,以及在所述搜索引擎内出现的第一搜索数据中包括的第二搜索数据的数量,获得信用权重。

该处理器还被配置为可以执行上述搜索数据的处理方法。

将意识到的是,本公开也扩展到适合于将本公开付诸实践的计算机程序,特别是载体上或者载体中的计算机程序。程序可以以源代码、目标代码、代码中间源和诸如部分编译的形式的目标代码的形式,或者以任何其它适合在按照本公开的方法的实现中使用的形式。也将注意的是,这样的程序可能具有许多不同的构架设计。例如,实现按照本公开的方法或者系统的功能性的程序代码可能被再分为一个或者多个子例程。

用于在这些子例程中间分布功能性的许多不同方式将对技术人员而言是明显的。子例程可以一起存储在一个可执行文件中,从而形成自含式的程序。这样的可执行文件可以包括计算机可执行指令,例如处理器指令和/或解释器指令(例如,Java解释器指令)。可替换地,子例程的一个或者多个或者所有子例程都可以存储在至少一个外部库文件中,并且与主程序静态地或者动态地(例如在运行时间)链接。主程序含有对子例程中的至少一个的至少一个调用。子例程也可以包括对彼此的函数调用。涉及计算机程序产品的实施例包括对应于所阐明方法中至少一种方法的处理步骤的每一步骤的计算机可执行指令。这些指令可以被再分成子例程和/或被存储在一个或者多个可能静态或者动态链接的文件中。

另一个涉及计算机程序产品的实施例包括对应于所阐明的系统和/或产品中至少一个的装置中每个装置的计算机可执行指令。这些指令可以被再分成子例程和/或被存储在一个或者多个可能静态或者动态链接的文件中。

计算机程序的载体可以是能够运载程序的任何实体或者装置。例如,载体可以包含存储介质,诸如(ROM例如CDROM或者半导体ROM)或者磁记录介质(例如软盘或者硬盘)。进一步地,载体可以是可传输的载体,诸如电学或者光学信号,其可以经由电缆或者光缆,或者通过无线电或者其它手段传递。当程序具体化为这样的信号时,载体可以由这样的线缆或者装置组成。可替换地,载体可以是其中嵌入有程序的集成电路,所述集成电路适合于执行相关方法,或者供相关方法的执行所用。

应该留意的是,上文提到的实施例是举例说明本公开,而不是限制本公开,并且本领域的技术人员将能够设计许多可替换的实施例,而不会偏离所附权利要求的范围。在权利要求中,任何放置在圆括号之间的参考符号不应被解读为是对权利要求的限制。动词“包括”和其词形变化的使用不排除除了在权利要求中记载的那些之外的元素或者步骤的存在。在元素之前的冠词“一”或者“一个”不排除复数个这样的元素的存在。本公开可以通过包括几个明显不同的元件的硬件,以及通过适当编程的计算机而实现。在列举几种装置的装置权利要求中,这些装置中的几种可以通过硬件的同一项来体现。在相互不同的从属权利要求中陈述某些措施的单纯事实并不表明这些措施的组合不能被用来获益。

如果期望的话,这里所讨论的不同功能可以以不同顺序执行和/或彼此同时执行。此外,如果期望的话,以上所描述的一个或多个功能可以是可选的或者可以进行组合。

如果期望的话,上文所讨论的各步骤并不限于各实施例中的执行顺序,不同步骤可以以不同顺序执行和/或彼此同时执行。此外,在其他实施例中,以上所描述的一个或多个步骤可以是可选的或者可以进行组合。

虽然本公开的各个方面在独立权利要求中给出,但是本公开的其它方面包括来自所描述实施方式的特征和/或具有独立权利要求的特征的从属权利要求的组合,而并非仅是权利要求中所明确给出的组合。

这里所要注意的是,虽然以上描述了本公开的示例实施方式,但是这些描述并不应当以限制的含义进行理解。相反,可以进行若干种变化和修改而并不背离如所附权利要求中所限定的本公开的范围。

本领域普通技术人员应该明白,本公开实施例的装置中的各模块可以用通用的计算装置来实现,各模块可以集中在单个计算装置或者计算装置组成的网络组中,本公开实施例中的装置对应于前述实施例中的方法,其可以通过可执行的程序代码实现,也可以通过集成电路组合的方式来实现,因此本公开并不局限于特定的硬件或者软件及其结合。

本领域普通技术人员应该明白,本公开实施例的装置中的各模块可以用通用的移动终端来实现,各模块可以集中在单个移动终端或者移动终端组成的装置组合中,本公开实施例中的装置对应于前述实施例中的方法,其可以通过编辑可执行的程序代码实现,也可以通过集成电路组合的方式来实现,因此本公开并不局限于特定的硬件或者软件及其结合。

图7是根据一示例性实施例示出的一种用于第一搜索数据的处理方法的装置800的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发装置,游戏控制台,平板装置,医疗装置,健身装置,个人数字助理等。

参照图7,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)接口812,传感器组件814,以及通信组件816。

处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。

存储器804被配置为存储各种类型的数据以支持在装置800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储装置或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。

电源组件806为装置800的各种组件提供电源。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电源相关联的组件。

多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当装置800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。

I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到装置800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。

通信组件816被配置为便于装置800和其他装置之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。

在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理装置(DSPD)、可编程逻辑元件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。

在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储装置等。

注意,上述仅为本公开的较佳实施例及所运用技术原理。本领域技术人员会理解,本公开不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本公开的保护范围。因此,虽然通过以上实施例对本公开进行了较为详细的说明,但是本公开不仅仅限于以上实施例,在不脱离本公开构思的情况下,还可以包括更多其他等效实施例,而本公开的范围由所附的权利要求范围决定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1