数据标签化方法和装置与流程

文档序号:19741174发布日期:2020-01-18 05:14阅读:1189来源:国知局
数据标签化方法和装置与流程

本说明书涉及数据处理技术领域,特别涉及一种数据标签化方法。本说明书同时涉及一种数据标签化装置,一种计算设备,以及一种计算机可读存储介质。



背景技术:

数据的标签化处理是指对数据集中的正负样本进行标定的过程。网络支付系统在处理底线风险时,需要进行大量的交易、账户以及身份维度的管控;底线风险多属于无监督风险,可以依赖的风险标签多基于投诉,覆盖不全且时效性相对滞后。而巨大的管控量级、强力的管控手段,都需要管控策略在系统性上的稳定性与高准确率,因此将无监督或者缺乏标签的半监督风险标签化、有监化,将其置入准确率与覆盖率的既有风险评估体系,成为当下风险管理工作的当务之急。

以监管机构对非银支付机构的监管为例,很重要的一个关切方面便是非银机构不能支持网络非法交易平台(包含网站和智能应用)的非法交易资金支付(或称入金、充值)。由于社会客观存在网络非法交易严重的问题,且网络支付体系可被利用的收单交易和转账支付类产品较多,部署风险策略防控时,虽然策略体系准确度基本达到95%甚至99%的级别,但因为稽核量大,常有误稽核的现象发生;此外尚有很多较隐蔽的非法交易游离在防控之外,难于发现。

虽然现有技术中存在一些数据标签化的方式,例如依赖于用户投诉的事后打击,如果阈值设定为投诉足够多、来源足够分散,准确率接近100%,但是时效性较差。此外,还可采用钓鱼方式模拟用户去相关平台和智能应用下单,准确率为100%,但是容易被黑产攻防、技术方面搭建及运维成本较大,需要耗费较大的审理人力资源。



技术实现要素:

有鉴于此,本说明书实施例提供了一种数据标签化方法。本说明书同时涉及一种数据标签化装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。

根据本说明书实施例的第一方面,提供了一种数据标签化方法包括:根据第一预设规则基于原始数据识别出至少两种识别信息;以及基于所述至少两种识别信息中的一种识别信息调整另一种识别信息。

根据本说明书实施例的第二方面,提供了一种数据标签化装置包括:识别模块,配置为根据第一预设规则基于原始数据识别出至少两种识别信息;以及调整模块,配置为基于所述至少两种识别信息中的一种识别信息调整另一种识别信息。

根据本说明书实施例的第三方面,提供了一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述指令时实现所述数据标签化方法的步骤。

根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现所述数据标签化方法的步骤。

本申请实施例提供的一种数据标签化方法和装置,在基于交易数据识别出至少两种识别信息后,可基于该至少两种识别信息中的一种识别信息调整另一种识别信息,由此可大大提高识别信息的识别准确率和覆盖度。此外,整个识别过程可自动化智能执行,并不需要人工参与,由此也显著提高了时效性,节省了人力成本。

附图说明

图1示出了本说明书一实施例提供的计算设备的结构框图;

图2示出了本说明书一实施例提供的一种数据标签化方法的流程图;

图3示出了本说明书一实施例提供的一种数据标签化方法中调整非法集资收款账户信息的流程图;

图4示出了本说明书一实施例提供的一种数据标签化方法中调整非法集资收款账户信息的流程图;

图5示出了本说明书一实施例提供的一种数据标签化方法中调整非法集资交易信息的流程图;

图6示出了本说明书一实施例提供的另一种数据标签化方法中调整非法集资交易信息的流程图;

图7示出了本说明书一实施例提供的一种数据标签化方法的流程图;

图8示出了本说明书一实施例提供的一种数据标签化方法中调整异常收款账户信息的流程图;

图9示出了本说明书另一实施例提供的一种数据标签化方法中调整异常收款账户信息的流程图;

图10示出了本说明书另一实施例提供的另一种数据标签化方法中调整异常收款账户信息的流程图;

图11示出了本说明书另一实施例提供的一种数据标签化方法中调整异常收款账户信息的流程图;

图12示出了本说明书一实施例提供的一种数据标签化方法中调整异常交易信息的流程图;

图13示出了本说明书另一实施例提供的一种数据标签化方法中调整异常交易信息的流程图;

图14示出了本说明书另一实施例提供的另一种数据标签化方法中调整异常交易信息的流程图;

图15示出了本说明书一实施例提供的一种数据标签化方法中调整异常支付账户信息的流程图;

图16示出了本说明书另一实施例提供的一种数据标签化方法中调整异常支付账户信息的流程图;

图17示出了本说明书另一实施例提供的另一种数据标签化方法中调整异常支付账户信息的流程图;

图18示出了本说明书一实施例提供的一种数据标签化装置的结构示意图。

图19示出了本说明书一实施例提供的第二种数据标签化装置的结构示意图。

图20示出了本说明书一实施例提供的第三种数据标签化装置的结构示意图。

具体实施方式

在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。

在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

在本申请中,提供了一种数据标签化方法。本说明书同时涉及一种数据标签化装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。

图1示出了本说明书一实施例提供的计算设备100的结构框图。该计算设备100的部件包括但不限于存储器110和处理器120。处理器120与存储器110通过总线130相连接,数据库150用于保存数据。

计算设备100还包括接入设备140,接入设备140使得计算设备100能够经由一个或多个网络160通信。这些网络的示例包括公用交换电话网(pstn)、局域网(lan)、广域网(wan)、个域网(pan)或诸如因特网的通信网络的组合。接入设备140可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(nic))中的一个或多个,诸如ieee802.11无线局域网(wlan)无线接口、全球微波互联接入(wi-max)接口、以太网接口、通用串行总线(usb)接口、蜂窝网络接口、蓝牙接口、近场通信(nfc)接口等等。

在本说明书的一个实施例中,计算设备100的上述部件以及图1中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图1所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。

计算设备100可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或pc的静止计算设备。计算设备100还可以是移动式或静止式的服务器。

其中,处理器120可以执行图2所示数据标签化方法中的步骤。图2示出了根据本说明书一实施例的数据标签化方法的流程图,包括步骤202至步骤208。

本申请实施例的数据标签化方法包括:

步骤202:根据第一预设规则基于原始数据识别出至少两种识别信息。

原始数据为待标签化的源数据,识别信息则为将原始数据标签化后获得的信息,例如在非法交易识别场景,待标签化的源数据就可为交易数据,非法交易、非法交易的收款方或非法交易的出款方就可为标签化后的识别信息。然而应当理解,原始数据和识别信息的具体内容可根据该数据标签化方法的应用场景而调整,本申请对原始数据和识别信息的具体内容并不做严格限定。

还应当理解,用于识别出识别信息的第一预设规则也可根据该数据标签化方法的具体应用场景的需求而调整,通过分析获取原始数据的各种特征,并基于该第一预设规则对原始数据进行分类以识别出该至少两种识别信息即可,本申请对该第一预设规则的具体内容并不做严格限定。

步骤204:基于至少两种识别信息中的一种识别信息调整另一种识别信息。

虽然在步骤202中基于第一预设规则识别出了两种识别信息,但受第一预设规则本身的限制,此时识别出的识别信息的准确率和覆盖率可能是不足够的。但由于识别出的识别信息都来自于原始信息,因此识别出的识别信息之间应当存在特征上的关联,因此对于一种识别信息而言,若能够同时参考其他识别信息来进行调整,必然能提高该一种识别信息的准确率和覆盖率。

由此可见,本申请实施例提供的一种数据标签化方法,在基于原始数据识别出至少两种识别信息后,可基于该至少两种识别信息中的一种识别信息调整另一种识别信息,由此可大大提高识别信息的识别准确率和覆盖度。此外,整个识别过程可自动化智能执行,并不需要人工参与,由此也显著提高了时效性,节省了人力成本。

一个可选的实施例中,原始数据为交易数据,至少两种识别信息包括非法集资收款账户信息和非法集资交易信息,因此基于至少两种识别信息中的一种识别信息调整另一种识别信息其实可包括基于非法集资收款账户信息调整非法集资交易信息,以及基于非法集资交易信息调整非法集资收款账户信息两个方面。

一个可选的实施例中,如图3所示,基于非法集资交易信息调整非法集资收款账户信息包括:

步骤302:基于交易信息获取所有收款账户。

步骤304:基于非法集资交易信息,判断收款账户参与的非法集资交易在该收款账户参与的所有交易中的占比是否大于第一预设值。

步骤306:当收款账户参与的非法集资交易在该收款账户参与的所有交易中的占比大于第一预设值时,基于非法集资收款账户信息判断该收款账户是否属于非法集资收款账户。

步骤308:当该收款账户并不属于非法集资收款账户时,将该收款账户加入非法集资收款账户信息。

当收款账户参与的非法集资交易在该收款账户参与的所有交易中的占比大于第一预设值时,说明该收款账户参与了很多的非法集资交易,该收款账户应当被识别为非法集资收款账户,因此当该收款账户并不属于非法集资收款账户时,应当将该收款账户加入非法集资收款账户信息,以提高非法集资收款账户信息的识别覆盖率。

一个可选的实施例中,如图4所示,基于非法集资交易信息调整非法集资收款账户信息包括:

步骤402:基于非法集资收款账户信息获取所有非法集资收款账户。

步骤404:基于非法集资交易信息和交易信息,当判断为非法集资收款账户参与的非法集资交易在该非法集资收款账户参与的所有交易中的占比小于第二预设值时,将该非法集资收款账户从非法集资收款账户信息中移除。

当判断为非法集资收款账户参与的非法集资交易在该非法集资收款账户参与的所有交易中的占比小于第二预设值时,说明该非法集资收款账户其实并没有参加很多被识别为非法集资交易的交易,即该非法集资收款账户被误识别为非法集资收款账户了,此时将该非法集资收款账户从非法集资收款账户信息中移除,以提高非法集资收款账户的识别准确率。

一个可选的实施例中,如图5所示,基于非法集资收款账户信息调整非法集资交易信息包括:

步骤502:基于交易信息获取所有收款账户。

步骤504:基于非法集资交易信息以及非法集资收款账户信息,当判断收款账户参与的非法集资交易在该收款账户参与的所有交易中的占比大于第三预设值,且该收款账户属于非法集资收款账户时,将该收款账户未被识别为非法集资交易的交易加入非法集资交易信息。

当判断收款账户参与的非法集资交易在该收款账户参与的所有交易中的占比大于第三预设值,且该收款账户已被识别为非法集资收款账户时,说明该收款账户所参与的其他交易很可能也是非法交易,此时将该收款账户未被识别为非法集资交易的交易加入非法集资交易信息以提高非法集资交易的识别准确率。

一个可选的实施例中,如图6所示,基于非法集资收款账户信息调整非法集资交易信息包括:

步骤602:基于交易信息获取所有收款账户。

步骤604:基于非法集资交易信息以及非法集资收款账户信息,当判断收款账户参与的非法集资交易在该收款账户参与的所有交易中的占比小于第四预设值,且该收款账户并不属于非法集资收款账户时,将该收款账户已被识别为非法集资交易的交易从非法集资交易信息中移除。

当判断收款账户参与的非法集资交易在该收款账户参与的所有交易中的占比小于第四预设值,且该收款账户并不属于非法集资收款账户时,说明该收款账户所参与的所有交易应当不是非法集资交易,此时为了进一步提高非法集资交易的准确率,可将该收款账户已被识别为非法集资交易的交易从非法集资交易信息中移除。

一个可选实施例中,如图7所示,该数据标签化方法可包括:

步骤702:根据第一预设规则基于交易数据识别出异常交易信息、异常支付账户信息和异常收款账户信息。

交易数据可为采集到的或直接从第三方获取的某一时间段内特定应用场景下的所有交易信息,该交易信息中不仅可包括交易的金额、时间、地点和账户等信息,还可包括交易的出资方的账户和收款方的账户等参与交易的账户信息。异常支付账户信息为基于预设规则根据交易数据识别出的异常支付账户的属性信息,例如异常支付账户账号、以及与该异常支付账户账号对应的识别为异常支付账户的概率等。异常收款账户信息为基于预设规则根据交易数据识别出的异常收款账户的属性信息,例如异常收款账户账号、以及与该异常收款账户账号对应的识别为异常收款账户的概率等。

应当理解,用于识别交易信息、异常支付账户信息和异常收款账户信息的第一预设规则可根据应用场景的需求而调整,本申请对该第一预设规则的具体内容并不做严格限定。

步骤704:基于异常交易信息和异常支付账户信息调整异常收款账户信息。

基于异常交易信息和异常支付账户信息可有助于判断异常收款账户信息中的异常收款账户是否识别准确,是否有清白的账户被误判为异常收款账户,以及是否有异常收款账户被漏掉。

步骤706:基于调整之前或调整之后的异常支付账户信息和异常收款账户信息调整异常交易信息。

基于异常支付账户信息和异常收款账户信息可有助于判断异常交易信息中的异常交易是否识别准确,是否有清白的交易被误判为异常交易,以及是否有异常交易被漏掉。由于基于异常支付账户信息和异常收款账户信息对于异常收款账户信息的调整是实时进行的,因此此时参考的异常支付账户信息可能是基于步骤704调整之前或基于步骤704调整之后的。

步骤708:基于调整之前或调整之后的异常交易信息和异常收款账户信息调整异常支付账户信息。

基于异常交易信息和异常收款账户信息可有助于判断异常支付账户信息中的异常支付账户是否识别准确,是否有清白的账户被误判为异常支付账户,以及是否有异常支付账户被漏掉。由于基于异常交易信息和异常收款账户信息对于异常支付账户信息的调整是实时进行的,因此此时参考的异常交易信息可能是基于步骤706调整之前或基于步骤706调整之后的。

由此可见,本申请实施例提供的一种数据标签化方法,在基于交易数据识别出异常交易信息、异常支付账户信息和异常收款账户信息后,异常交易信息可根据异常支付账户信息和异常收款账户信息进行进一步调整,异常支付账户信息可根据异常交易信息和异常收款账户信息进行进一步调整,同时异常收款账户信息也可根据异常支付账户信息和异常交易信息进行进一步调整,由此可大大提高异常交易信息、异常支付账户信息和异常收款账户信息的识别准确率和覆盖度。此外,整个识别过程可自动化智能执行,并不需要人工参与,由此也显著提高了时效性,节省了人力成本。

一个可选的实施例中,如图8所示,基于异常交易信息和异常支付账户信息调整异常收款账户信息的具体过程可包括如下步骤:

步骤802:基于交易数据获取参与交易的所有收款账户和所有支付账户,基于异常支付账户信息获取参与异常交易的所有异常支付账户。

步骤804:当所有异常支付账户在所有支付账户中的占比大于第五预设值时,基于异常收款账户信息,获取参与交易的所有收款账户中未被识别为异常收款账户的账户。

步骤806:将所获取的账户加入异常收款账户信息。

当异常支付账户在所有支付账户中的占比大于第五预设值时,说明很有可能这些交易都是异常交易,此时可将参与交易的没有被识别为异常收款账户的账户都算作异常收款账户,并加入异常收款账户信息,从而提高异常收款账户的识别覆盖率。

一个可选的实施例中,如图9所示,基于异常交易信息和异常支付账户信息调整异常收款账户信息的具体过程可包括如下步骤:

步骤902:基于异常收款账户信息和异常支付账户信息获取参与异常交易的异常收款账户和异常支付账户。

步骤904:当参与异常交易的异常收款账户中同时为异常支付账户的账户占比小于第六预设值时,将参与异常交易的异常收款账户从异常收款账户信息中移除。

由于在一些异常交易中,一般异常收款账户同时也会作为异常支付账户。例如在非法交易场景中,非法交易收款账户有时是轮换的。因此,当参与异常交易的异常收款账户中同时为异常支付账户的账户占比小于第六预设值时,说明这些异常交易很可能并不是异常交易,因而参与这些异常交易的异常收款账户也可能是误识别,需要从异常收款账户信息中移除,以提高异常收款账户识别的准确性。

一个可选的实施例中,如图10所示,基于异常交易信息和异常支付账户信息调整异常收款账户信息的具体过程可包括如下步骤:

步骤1002:基于异常交易信息获取异常交易的收款方的所有交易。

步骤1004:当异常交易在所有交易中的占比大于第七预设值时,判断收款方是否在异常收款账户信息中。

步骤1006:当收款方并未在异常收款账户信息中时,将收款方的账户加入异常收款账户信息。

当异常交易在所有交易中的占比大于第七预设值时,说明其他的交易也可能是异常交易,而并未基于第一预设规则被识别出来,此时可将这些没有被识别为异常收款账户的收款方的账户加入异常收款账户信息,以提高异常收款账户的识别覆盖率。

一个可选的实施例中,如图11所示,基于异常交易信息和异常支付账户信息调整异常收款账户信息的具体过程可包括如下步骤:

步骤1102:基于异常收款账户信息获取异常收款账户参与的交易。

步骤1104:基于异常交易信息,当异常收款账户参与的交易中被识别为异常交易的占比小于第八预设值时,将异常收款账户从异常收款账户信息中移除。

当异常收款账户参与的交易中被识别为异常交易的占比小于第八预设值时,说明该异常收款账户很可能并不是异常收款账户,而是被误识别出来的,此时可将该异常收款账户从异常收款账户信息中移除,以提高异常收款账户的识别准确率。

一个可选的实施例中,如图12所示,基于异常支付账户信息和调整之前或调整之后的异常收款账户信息调整异常交易信息的具体过程可包括如下步骤:

步骤1202:基于异常支付账户信息获取异常支付账户的个人信息。

步骤1204:基于第二预设规则,当根据异常支付账户的个人信息判断异常支付账户为清白账户时,将异常支付账户参与的异常交易从异常交易信息中移除。

应当理解,第二预设规则可根据实际应用场景而调整,例如可当在调取异常支付账户的个人信息后发现,该异常支付账户为不可能具备大额支付能力的账户时,例如未成年账户,则说明该异常支付账户实际上很可能为清白账户,此时可将该异常支付账户参与的异常交易从异常交易信息中移除,以提高异常交易识别的准确率。

一个可选的实施例中,如图13所示,基于异常支付账户信息和调整之前或调整之后的异常收款账户信息调整异常交易信息的具体过程可包括如下步骤:

步骤1302:基于调整之前或调整之后的异常收款账户信息获取异常收款账户参与的交易。

步骤1304:基于异常交易信息,当异常收款账户参与的交易中被识别为异常交易的占比大于第九预设值时,将异常收款账户参与的交易中未被识别为异常交易的交易加入异常交易信息。

当异常收款账户参与的交易中被识别为异常交易的占比大于第九预设值时,说明该异常收款账户参与的交易中未被识别为异常交易的交易也很可能是异常交易,此时便可将这些未被识别为异常交易的交易加入异常交易信息,以提高异常交易的识别覆盖率。

一个可选的实施例中,如图14所示,基于异常支付账户信息和调整之前或调整之后的异常收款账户信息调整异常交易信息的具体过程可包括如下步骤:

步骤1402:基于交易数据和调整之前或调整之后的异常收款账户信息获取未被识别为异常收款账户的收款方。

步骤1404:基于异常交易信息,当判断为收款方的所有交易中识别为异常交易的占比低于第十预设值时,将收款方被识别为异常交易的交易从异常交易信息中移除。

当收款方的所有交易中识别为异常交易的占比低于第十预设值时,说该收款方应当并不是异常收款账户,该收款方所参与的交易也应当不是异常交易。此时可将收款方被识别为异常交易的交易从异常交易信息中移除,以提高异常交易的识别准确性。

一个可选的实施例中,如图15所示,基于调整之前或调整之后的异常交易信息和异常收款账户信息调整异常支付账户信息的具体过程可包括如下步骤:

步骤1502:基于交易数据和异常收款账户信息获取与异常收款账户进行交易的所有账户。

步骤1504:基于异常支付账户信息,当判断为与异常收款账户进行交易的所有账户中被识别为异常支付账户的占比大于第十一预设值时,将与异常收款账户进行交易的所有账户中未被识别为异常支付账户的账户加入异常支付账户信息。

当与异常收款账户进行交易的所有账户中被识别为异常支付账户的占比大于第十一预设值时,说明该异常收款账户进行的交易很可能都是异常交易,而参与这些交易的支付账户也很可能都是异常支付账户,此时可将与与异常收款账户进行交易的所有账户中未被识别为异常支付账户的账户加入异常支付账户信息,以提高异常支付账户的识别覆盖率。

一个可选的实施例中,如图16所示,基于调整之前或调整之后的异常交易信息和异常收款账户信息调整异常支付账户信息的具体过程可包括如下步骤:

步骤1602:基于交易数据和调整之前或调整之后的异常交易信息,获取参与的异常交易在参与的所有交易中占比大于第十二预设值的支付账户。

步骤1604:当所获取的支付账户并未在异常支付账户信息中时,将所获取的支付账户加入异常支付账户信息。

当一个支付账户参与的异常交易占据其参与的所有交易的很大部分时,该支付账户很有可能是异常支付账户。同时当该支付账户并未在异常支付账户信息中时,说明该支付账户并未基于第一预设规则被识别出来,此时可将该支付账户加异常支付账户信息,以提高异常支付账户的识别覆盖率。

一个可选的实施例中,如图17所示,基于调整之前或调整之后的异常交易信息和异常收款账户信息调整异常支付账户信息的具体过程可包括如下步骤:

步骤1702:基于异常支付账户信息,获取异常支付账户所参与的所有交易。

步骤1704:基于调整之前或调整之后的异常交易信息,当异常支付账户参与的所有交易中被识别为异常交易的占比小于第十三预设值时,将异常支付账户从异常支付账户信息中移除。

当异常支付账户参与的所有交易中被识别为异常交易的占比小于第十三预设值时,说该异常支付账户所参与的交易可能并不是异常交易,且该异常支付账户也存在误识别,此时可将该异常支付账户从异常支付账户信息中移除,以提高异常支付账户的识别准确性。

应当理解,上述图3至图17实施例所示的调整过程中所涉及的第一预设值、第二预设值、第三预设值、第四预设值、第五预设值、第六预设值、第七预设值、第八预设值、第九预设值、第十预设值、第十一预设值、第十二预设值和第十三预设值可根据实际场景的需求而设定和调整,本申请对这些预设值的具体大小并不做限定。

还应当理解,上述图3至图17实施例所示的调整过程实际上是可以任意组合的。在本申请一实施例中,也可以同时实现上述图3至图17实施例所示的所有调整过程,从而实现异常交易信息、异常支付账户信息和异常收款账户信息的彼此互相参考和互相调整,以进一步提供异常交易识别的准确率和覆盖率。

与上述方法实施例相对应,本说明书还提供了数据标签化装置实施例,图18示出了本说明书一实施例提供的一种数据标签化装置的结构示意图。如图18所示,该数据标签化装置1800包括:

识别模块1801,配置为根据第一预设规则基于原始数据识别出至少两种识别信息;以及

调整模块1802,配置为基于至少两种识别信息中的一种识别信息调整另一种识别信息。

本申请实施例提供的一种数据标签化装置,在基于原始数据识别出至少两种识别信息后,可基于该至少两种识别信息中的一种识别信息调整另一种识别信息,由此可大大提高识别信息的识别准确率和覆盖度。此外,整个识别过程可自动化智能执行,并不需要人工参与,由此也显著提高了时效性,节省了人力成本。

一个可选的实施例中,如图19所示,原始数据为交易数据,至少两种识别信息包括非法集资收款账户信息和非法集资交易信息;

其中,调整模块1802包括:

第一调整单元18021,配置为基于非法集资收款账户信息调整非法集资交易信息;以及

第二调整单元18022,配置为基于非法集资交易信息调整非法集资收款账户信息。

一个可选的实施例中,第二调整单元18022进一步配置为:基于交易信息获取所有收款账户;基于非法集资交易信息,判断收款账户参与的非法集资交易在该收款账户参与的所有交易中的占比是否大于第一预设值;当收款账户参与的非法集资交易在该收款账户参与的所有交易中的占比大于第一预设值时,基于非法集资收款账户信息判断该收款账户是否属于非法集资收款账户;以及当该收款账户并不属于非法集资收款账户时,将该收款账户加入非法集资收款账户信息。

一个可选的实施例中,第二调整单元18022进一步配置为:基于非法集资收款账户信息获取所有非法集资收款账户;基于非法集资交易信息和交易信息,当判断为非法集资收款账户参与的非法集资交易在该非法集资收款账户参与的所有交易中的占比小于第二预设值时,将该非法集资收款账户从非法集资收款账户信息中移除。

一个可选的实施例中,第一调整单元18021进一步配置为:基于交易信息获取所有收款账户;基于非法集资交易信息以及非法集资收款账户信息,当判断收款账户参与的非法集资交易在该收款账户参与的所有交易中的占比大于第三预设值,且该收款账户属于非法集资收款账户时,将该收款账户未被识别为非法集资交易的交易加入非法集资交易信息。

一个可选的实施例中,第一调整单元18021进一步配置为:基于交易信息获取所有收款账户;基于非法集资交易信息以及非法集资收款账户信息,当判断收款账户参与的非法集资交易在该收款账户参与的所有交易中的占比小于第四预设值,且该收款账户并不属于非法集资收款账户时,将该收款账户已被识别为非法集资交易的交易从非法集资交易信息中移除。

一个可选的实施例中,如图20所示,原始数据为交易数据,至少两种识别信息包括异常交易信息、异常支付账户信息和异常收款账户信息

其中,调整模块1802包括:

第三调整单元18023,配置为基于异常交易信息和异常支付账户信息调整异常收款账户信息;

第四调整单元18024,配置为基于异常支付账户信息以及调整之前或之后的异常收款账户信息调整异常交易信息;以及

第五调整单元18025,配置为基于调整之前或之后的异常交易信息和异常收款账户信息调整异常支付账户信息。

由此可见,本申请实施例提供的一种数据标签化装置1800,在基于交易数据识别出异常交易信息、异常支付账户信息和异常收款账户信息后,异常交易信息可根据异常支付账户信息和异常收款账户信息进行进一步调整,异常支付账户信息可根据异常交易信息和异常收款账户信息进行进一步调整,同时异常收款账户信息也可根据异常支付账户信息和异常交易信息进行进一步调整,由此可大大提高异常交易信息、异常支付账户信息和异常收款账户信息的识别准确率和覆盖度。此外,整个识别过程可自动化智能执行,并不需要人工参与,由此也显著提高了时效性,节省了人力成本。

一个可选的实施例中,调整模块1802第三调整单元18023进一步配置为:基于交易数据获取参与交易的所有收款账户和所有支付账户,基于异常支付账户信息获取参与异常交易的所有异常支付账户;当所有异常支付账户在所有支付账户中的占比大于第五预设值时,基于异常收款账户信息,获取参与交易的所有收款账户中未被识别为异常收款账户的账户;以及将所获取的账户加入异常收款账户信息。

一个可选的实施例中,调整模块1802第三调整单元18023进一步配置为:基于异常收款账户信息和异常支付账户信息获取参与异常交易的异常收款账户和异常支付账户;当参与异常交易的异常收款账户中同时为异常支付账户的账户占比小于第六预设值时,将参与异常交易的异常收款账户从异常收款账户信息中移除。

一个可选的实施例中,调整模块1802第三调整单元18023进一步配置为:基于异常交易信息获取异常交易的收款方的所有交易;当异常交易在所有交易中的占比大于第七预设值时,判断收款方是否在异常收款账户信息中;以及当收款方并未在异常收款账户信息中时,将收款方的账户加入异常收款账户信息。

一个可选的实施例中,调整模块1802第三调整单元18023进一步配置为:基于异常收款账户信息获取异常收款账户参与的交易;以及基于异常交易信息,当异常收款账户参与的交易中被识别为异常交易的占比小于第八预设值时,将异常收款账户从异常收款账户信息中移除。

一个可选的实施例中,调整模块1802第四调整单元18024进一步配置为:基于异常支付账户信息获取异常支付账户的个人信息;以及基于第二预设规则,当根据异常支付账户的个人信息判断异常支付账户为清白账户时,将异常支付账户参与的异常交易从异常交易信息中移除。

一个可选的实施例中,调整模块1802第四调整单元18024进一步配置为:基于调整之前或调整之后的异常收款账户信息获取异常收款账户参与的交易;以及基于异常交易信息,当异常收款账户参与的交易中被识别为异常交易的占比大于第九预设值时,将异常收款账户参与的交易中未被识别为异常交易的交易加入异常交易信息。

一个可选的实施例中,调整模块1802第四调整单元18024进一步配置为:基于交易数据和调整之前或调整之后的异常收款账户信息获取未被识别为异常收款账户的收款方;以及基于异常交易信息,当判断为收款方的所有交易中识别为异常交易的占比低于第十预设值时,将收款方被识别为异常交易的交易从异常交易信息中移除。

一个可选的实施例中,调整模块1802第五调整单元18025进一步配置为:基于交易数据和异常收款账户信息获取与异常收款账户进行交易的所有账户;基于异常支付账户信息,当判断为与异常收款账户进行交易的所有账户中被识别为异常支付账户的占比大于第十一预设值时,将与异常收款账户进行交易的所有账户中未被识别为异常支付账户的账户加入异常支付账户信息。

一个可选的实施例中,调整模块1802第五调整单元18025进一步配置为:基于交易数据和异常交易信息,获取参与的异常交易在参与的所有交易中占比大于第十二预设值的支付账户;以及当所获取的支付账户并未在异常支付账户信息中时,将所获取的支付账户加入异常支付账户信息。

一个可选的实施例中,调整模块1802第五调整单元18025进一步配置为:基于异常支付账户信息,获取异常支付账户所参与的所有交易;以及基于调整之前或调整之后的异常交易信息,当异常支付账户参与的所有交易中被识别为异常交易的占比小于第十三预设值时,将异常支付账户从异常支付账户信息中移除。

上述数据标签化装置1800中的各个模块的具体功能和操作已经在上面的数据标签化方法中进行了详细介绍,因此,这里将省略其重复描述。

本说明书一实施例中还提供一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,处理器执行指令时实现的数据标签化方法的步骤。

本申请一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现如前数据标签化方法的步骤。

上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的数据标签化方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述数据标签化方法的技术方案的描述。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。

计算机指令包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。

需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本申请所必须的。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。

以上公开的本申请优选实施例只是用于帮助阐述本申请。可选实施例并没有详尽叙述所有的细节,也不限制该申请仅为的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本申请的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本申请。本申请仅受权利要求书及其全部范围和等效物的限制。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1