数据筛选方法、数据展示方法、装置、设备及存储介质与流程

文档序号:17537499发布日期:2019-04-29 14:09阅读:163来源:国知局
数据筛选方法、数据展示方法、装置、设备及存储介质与流程

本发明涉及数据处理技术领域,特别是涉及一种数据筛选方法、数据展示方法、装置、设备及存储介质。



背景技术:

在日常生活中,经常需要对一些数据进行筛选,以用于业务、生活、投资等方面的指导。通过数据筛选,可以直观地了解到相关业务、投资等方面的情况,从而可以更好地规避风险(例如,市场风险、黑天鹅事件等)等。

然而,现有技术在进行数据排序时,通常只考虑单一因素。例如,常规期权异动以价格成交量作为主要参数,考虑的方式也只以单只期权做考量。这种方式所反映出来的情况就存在片面性。

因此,现有技术因为只考虑单一因素而存在数据筛选不准确的缺陷。



技术实现要素:

本发明实施例的目的在于提供一种数据筛选方法、数据展示方法、装置、设备及存储介质,以解决如何准确地筛选数据的技术问题。

为了实现上述目的,本发明的第一方面,提供了以下技术方案:

一种数据筛选方法,其包括:

获取多个待筛选数据;

确定各待筛选数据的多个数据异常变化因子和多个数据异常变化维度;

基于所述各待筛选数据的所述多个数据异常变化因子和所述多个数据异常变化维度,利用多因子模型分别对所述各待筛选数据进行检测,分别得到所述多个待筛选数据的异常变化量;

基于所述多个待筛选数据的异常变化量和预定的阈值,进行阈值筛选,得到多个目标数据。

进一步地,基于所述各待筛选数据的所述多个数据异常变化因子和所述多个数据异常变化维度,利用多因子模型分别对所述各待筛选数据进行检测,分别得到所述多个待筛选数据的异常变化量的步骤具体包括:

将所述各待筛选数据的所述多个数据异常变化因子和所述多个数据异常变化维度进行加权求和;

判断各待筛选数据的求和结果分别与预定目标是否相匹配;

根据匹配结果,通过机器学习的方法分别对所述各待筛选数据的所述多个数据异常变化因子进行打分,并将打分结果作为所述各待筛选数据的异常变化量。

进一步地,基于所述多个待筛选数据的异常变化量和预定的阈值,进行阈值筛选,得到多个目标数据的步骤,具体包括:

将所述多个待筛选数据的异常变化量分别与预定的阈值进行比较;

按照预定的顺序对各比较结果进行排序;

对各排序结果进行截取,筛选出所述多个目标数据。

为了实现上述目的,本发明的第二方面,还提供了以下技术方案:

一种数据展示方法,其包括:

获取待展示数据;其中,所述待展示数据通过如权利要求1-3中任一所述的数据筛选方法获得;

将所述待展示数据与预定的标的相结合;

对结合结果进行展示。

为了实现上述目的,本发明的第三方面,还提供了以下技术方案:

一种数据筛选装置,其特征在于,包括:

第一获取模块,用于获取多个待筛选数据;

确定模块,用于确定各待筛选数据的多个数据异常变化因子和多个数据异常变化维度;

检测模块,用于基于所述各待筛选数据的所述多个数据异常变化因子和所述多个数据异常变化维度,利用多因子模型分别对所述各待筛选数据进行检测,分别得到所述多个待筛选数据的异常变化量;

筛选模块,用于基于所述多个待筛选数据的异常变化量和预定的阈值,进行阈值筛选,得到多个目标数据。

进一步地,所述检测模块具体用于:

将所述各待筛选数据的所述多个数据异常变化因子和所述多个数据异常变化维度进行加权求和;

判断各待筛选数据的求和结果分别与预定目标是否相匹配;

根据匹配结果,通过机器学习的方法分别对所述各待筛选数据的所述多个数据异常变化因子进行打分,并将打分结果作为所述各待筛选数据的异常变化量。

进一步地,所述筛选模块具体用于:

将所述多个待筛选数据的异常变化量分别与预定的阈值进行比较;

按照预定的顺序对各比较结果进行排序;

对各排序结果进行截取,筛选出所述多个目标数据。

为了实现上述目的,本发明的第四方面,还提供了以下技术方案:

一种数据展示装置,其包括:

第二获取模块,用于获取待展示数据;其中,所述待展示数据通过如本发明第二方面所述的数据筛选装置获得;

结合模块,用于将所述待展示数据与预定的标的相结合;

展示模块,用于对结合结果进行展示。

为了实现上述目的,本发明的第五方面,还提供了以下技术方案:

一种电子设备,其包括处理器和存储器;其中:

所述存储器,用于存放计算机程序;

所述处理器,用于执行所述存储器上所存放的程序时,实现本发明第一方面和第二方面中任一所述的方法步骤。

为了实现上述目的,本发明的第六方面,还提供了以下技术方案:

一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现本发明第一方面和第二方面中任一所述的方法步骤。

本发明实施例提供一种数据筛选方法、数据展示方法、装置、设备及存储介质。其中,该数据筛选方法包括:获取多个待筛选数据;确定各待筛选数据的多个数据异常变化因子和多个数据异常变化维度;基于各待筛选数据的多个数据异常变化因子和多个数据异常变化维度,利用多因子模型分别对各待筛选数据进行检测,分别得到多个待筛选数据的异常变化量;基于多个待筛选数据的异常变化量和预定的阈值,进行阈值筛选,得到多个目标数据。

与现有技术仅仅考虑单一因素不同的是,本发明实施例通过采取上述技术方案,基于多个数据异常变化因子和多个数据异常变化维度,进行数据筛选,选取的多个因子更加接近实际情况,提高了数据筛选的准确性,所筛选出来的数据能够反映实际情况,更能接近于市场真实的信息,还有助于对市场进行准确的预测,例如,在投资领域,有助于投资者更好地投资,从而使得用户通过少量的信息,简便地了解市场数据,并能快速地查看市场情绪。

为了能更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而得以体现。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为根据本发明实施例的数据筛选方法的流程示意图;

图2为根据本发明实施例的数据展示方法的流程示意图;

图3为根据本发明实施例的期权异动榜的展示效果示意图;

图4为根据本发明实施例的数据筛选装置的结构示意图;

图5为根据本发明实施例的数据展示装置的结构示意图。

具体实施方式

下面通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本发明,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。

还需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。

另外,在以下描述中,提供具体细节是为了便于透彻理解实例。然而,所属领域的技术人员将理解,可在没有这些特定细节的情况下实践所述方面。

为了解决如何准确地筛选数据的技术问题,本发明实施例提供一种数据筛选方法。如图1所示,该数据筛选方法主要包括如下步骤s100至步骤s130。其中:

s100:获取多个待筛选数据。

其中,待筛选数据例如可以是期权数据、股票数据等。该待筛选数据可以通过雪球舆情指数获得。

s110:确定各待筛选数据的多个数据异常变化因子和多个数据异常变化维度。

其中,多个数据异常变化因子包括但不限于:数据溢出异常因子、数据交换异常因子、数据保持量异常因子、数据变换率异常因子、数据收支错配因子等。本领域技术人员可以根据不同技术领域的实际情况设定相应的数据异常变化因子。以期权数据为例,数据异常变化因子可以包括:期权价格异动因子、期权成交量异动因子、期权持仓量异动因子、期权换手率异动因子、期权底层资产错配因子等。

其中,多个数据异常变化维度包括但不限于:数据待处理的初始时刻、数据在未来设定时期内的交易时刻等。仍以期权数据为例,数据异常变化维度例如可以包括期权行权日、期权的初始交易时刻等。

与现有技术采用单一因素来考虑数据异常变化的方式不同,本发明实施例通过采取多个数据异常变化因子和数据异常变化维度,可以为得到更准确的数据筛选结果提供数据基础。

s120:基于该各待筛选数据的多个数据异常变化因子和多个数据异常变化维度,利用多因子模型分别对该各待筛选数据进行检测,分别得到该多个待筛选数据的异常变化量。

其中,该多因子模型基于套利定价原理,以多个因子参数为标准,对待排序数据是否满足多个因子参数进行判断,将满足这些多个因子参数的数据筛选出来;然后,按照预定的顺序进行排序。

在一些可选的实施例中,本步骤具体可以包括如下步骤s121至步骤s123。其中:

s121:将各待筛选数据的多个数据异常变化因子和多个数据异常变化维度进行加权求和。

s122:判断各待筛选数据的求和结果分别与预定目标是否相匹配。

其中,预定目标例如可以为预定的分布规则(例如,正态分布规则、高斯分布规则)、边际效应规则(例如,从价内到价外的边际成长规则)等。

如果待筛选数据的求和结果符合预定目标,则说明没有数据异常发生;如果待筛选数据的求和结果不符合预定目标,则说明存在数据异常。

仍以期权数据为例,对于期权价格异动因子而言,计算波动率与期权成交价格的乘积;将该乘积作为期权价格异动;判断该乘积是否与预定目标相匹配,也就是判断该乘积是否符合该预定目标。对于期权成交量异动因子而言,计算近期(例如,近三日、近一周等)内的期权成交量,以及从价内到价外的边际成长值;判断所计算的期权成交量异动因子与5倍的、从价内到价外的边际成长值相匹配。对于期权持仓量异动因子而言,计算近期(例如,近三日、近一周等)内的期权持仓量,以及从价内到价外的边际成长值;判断所计算的期权持仓量异动因子与5倍的、从价内到价外的边际成长值相匹配。

s123:根据匹配结果,通过机器学习的方法分别对各待筛选数据的多个数据异常变化因子进行打分,并将打分结果作为该各待筛选数据的异常变化量。

仍沿用上例,对于期权价格异动因子而言,如果匹配结果为该乘积不符合预定目标,则为期权价格异动打分为100分(分值可以跟分制式进行任意选取);如果匹配结果为该乘积符合预定目标,则为期权价格异动打分为0分。对于期权成交量异动因子而言,如果匹配结果为期权成交量异动因子大于5倍的、从价内到价外的边际成长值,则赋予期权成交量异动因子100分;如果匹配结果为期权成交量异动因子小于等于5倍的、从价内到价外的边际成长值,则赋予期权成交量异动因子0分。对于期权持仓量异动因子而言,如果匹配结果为期权持仓量异动因子大于5倍的、从价内到价外的边际成长值,则为期权持仓量异动因子打分为100分;如果匹配结果为期权持仓量异动因子小于等于5倍的、从价内到价外的边际成长值,则为期权持仓量异动因子打分为0分。

本步骤以多因子模型作为数据筛选的策略模型,利用各待筛选数据的多个数据异常变化因子和多个数据异常变化维度,进行数据筛选,可以得到准确的异常变化量,其更符合实际应用情况,例如,能够反映实际的市场情绪,可以为用户提供更可靠的应用指导,例如,可以使用户据此而对未来的市场情绪的变化做出预测。

s130:基于该多个待筛选数据的异常变化量和预定的阈值,进行阈值筛选,得到多个目标数据。

在本步骤中,根据预定的阈值,对待筛选数据的异常变化量进行阈值筛选。

具体地,本步骤具体可以包括如下步骤s131至步骤s133。其中:

s131:将该多个待筛选数据的异常变化量分别与预定的阈值进行比较。

s132:按照预定的顺序对比较结果进行排序。

s133:对排序结果进行截取,筛选出该多个目标数据。

举例来说,通过对排序结果进行截取,可以筛选出排名在前10名的目标数据。

以期权为例,现有技术在检测期权异动时,以期权价格成交量作为参考参数。这种仅以单一参数作为依据的方式,对数据的筛选时片面的,不能反映期权市场的真实异动情况,难以对未来期权市场作出合理的预测。而本发明实施例提供的技术方案,可有助于期权投资者更好地规避市场风险和黑天鹅事件等。

综上所述,与现有技术仅仅考虑单一因素不同的是,本发明实施例通过采取上述技术方案,基于多个数据异常变化因子和多个数据异常变化维度,进行数据筛选,选取的多个因子更加接近实际情况,提高了数据筛选的准确性,所筛选出来的数据能够反映实际情况,更能接近于市场真实的信息,还有助于对市场进行准确的预测,例如,在投资领域,有助于投资者更好地投资,从而使得用户通过少量的信息,简便地了解市场数据,并能快速地查看市场情绪。

基于与上述数据筛选方法实施例相同的技术构思,本发明实施例还提供一种数据展示方法。如图2所示,该数据展示方法主要包括如下步骤s200至步骤s220。其中:

s200:获取待展示数据;其中,该待展示数据通过上述数据筛选方法实施例获得;

s210:将该待展示数据与预定的标的相结合;

s220:对结合结果进行展示。

其中,预定的标的例如可以为底层标的等。

以异动期权为例,本发明实施例可以将待展示数据与期权底层标的进行结合展示。由于期权可以表示市场对于底层资产未来的情绪。因此,将待展示数据与期权底层标的进行结合展示,可有助于预测未来底层资产是否会发生变动。以待展示数据为期权数据为例,图3示例性地示出了期权异动榜的展示效果示意图,其中具体示出了期权名称、最新价格、涨跌幅和成家量的排序。

其中,展示方式包括但不限于图文混排的方式、数据表格的方式、动画配以文字和数据的方式等。

本发明实施例通过将预定的标的与待展示数据相结合进行展示,有助于用户更加直观、全面地了解所展示的数据,从而使得用户基于所展示的数据,获得有用的信息,以便于更好地指导相关业务、投资等事件。

有关本实施例的工作原理、所要解决的技术问题以及取得的技术效果可以参考前述实施例中的相关说明,在此不再赘述。

在上文中,虽然按照上述的顺序描述了数据筛选方法实施例和数据展示方法实施例中的各个步骤,本领域技术人员应清楚,本发明实施例中的步骤并不必然按照上述顺序执行,其也可以倒序、并行、交叉等其他顺序执行,而且,在上述步骤的基础上,本领域技术人员也可以再加入其他步骤,这些明显变型或等同替换的方式也应包含在本发明的保护范围之内,在此不再赘述。

下面为本发明装置实施例,本发明装置实施例用于执行本发明方法实施例实现的步骤,为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明方法实施例。在本发明各个装置实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。

本发明实施例提供一种数据筛选装置。如图4所示,该数据筛选装置主要包括:获取模块41、确定模块42、检测模块43和筛选模块44。其中,获取模块41用于获取多个待筛选数据。确定模块42用于确定各待筛选数据的多个数据异常变化因子和多个数据异常变化维度。检测模块43用于基于各待筛选数据的多个数据异常变化因子和多个数据异常变化维度,利用多因子模型分别对各待筛选数据进行检测,分别得到多个待筛选数据的异常变化量。筛选模块44用于基于多个待筛选数据的异常变化量和预定的阈值,进行阈值筛选,得到多个目标数据。

在一个优选的实施例中,该检测模块43具体用于:将各待筛选数据的多个数据异常变化因子和多个数据异常变化维度进行加权求和;判断各待筛选数据的求和结果分别与预定目标是否相匹配;根据匹配结果,通过机器学习的方法分别对各待筛选数据的多个数据异常变化因子进行打分,并将打分结果作为各待筛选数据的异常变化量。

在一个优选的实施例中,该筛选模块44具体用于:将多个待筛选数据的异常变化量分别与预定的阈值进行比较;按照预定的顺序对各比较结果进行排序;对各排序结果进行截取,筛选出多个目标数据。

与现有技术仅仅考虑单一因素不同的是,本发明实施例通过采取上述技术方案,利用获取模块41、确定模块42、检测模块43和筛选模块44,基于多个数据异常变化因子和多个数据异常变化维度,进行数据筛选,选取的多个因子更加接近实际情况,提高了数据筛选的准确性,所筛选出来的数据能够反映实际情况,更能接近于市场真实的信息,还有助于对市场进行准确的预测,例如,在投资领域,有助于投资者更好地投资,从而使得用户通过少量的信息,简便地了解市场数据,并能快速地查看市场情绪。

有关上述装置实施例的工作原理、所要解决的技术问题以及取得的技术效果可以参考前述实施例中的相关说明,在此不再赘述。

本发明实施例还提供一种数据展示装置。如图5所示,该数据展示装置主要包括:第二获取模块51、结合模块52和展示模块53。其中,第二获取模块51用于获取待展示数据;其中,待展示数据通过上述数据筛选装置实施例获得。结合模块52用于将待展示数据与预定的标的相结合。展示模块53用于对结合结果进行展示。

有关本实施例的工作原理、所要解决的技术问题以及取得的技术效果可以参考前述实施例中的相关说明,在此不再赘述。

另外,本发明实施例还提供一种电子设备,其包括处理器和存储器;其中,存储器用于存放计算机程序。处理器用于执行所述存储器上所存放的程序时,实现数据筛选方法实施例或数据展示方法实施例所述的方法步骤。

当然,本领域技术人员应能理解,上述服务器还可以包括通信接口、通信总线等公知的结构部件。其中,处理器、通信接口和存储器通过通信总线完成相互间的通信。

上述处理器例如可以为中央处理器(centralprocessingunit,简称cpu)、网络处理器(networkprocessor,np)等;还可以是数字信号处理器(digitalsignalprocessing,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(fieldprogrammablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

上述存储器可以包括随机存取存储器(randomaccessmemory,ram),也可以包括非易失性存储器(non-volatilememory,nvm),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。

上述通信总线例如可以是外设部件互连标准(peripheralcomponentinterconnect,pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。

上述电子设备包括但不限于智能手机、计算机、服务器、平板电脑、车载终端、可穿戴设备等。

有关本实施例的工作原理、所解决的技术问题、所实现的技术效果等可以参考前述方法实施例中的相关说明,在此不再赘述。

再者,本发明实施例还提供一种计算机可读存储介质。该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现数据筛选方法实施例或数据展示方法实施例所述的方法步骤。

上述计算机可读存储介质可以包括但不限于随机存取存储器(ram)、动态随机存取存储器(dram)、静态随机存取存储器(sram)、只读存储器(rom)、可编程只读存储器(prom)、可擦写可编程只读存储器(eprom)、电可擦写可编程只读存储器(eeprom)、闪存(例如,nor型闪存或nand型闪存)、内容可寻址存储器(cam)、聚合物存储器(例如,铁电聚合物存储器)、相变存储器、双向开关半导体存储器、硅-氧化物-氮化硅-氧化硅-硅(silicon-oxide-nitride-oxide-silicon,sonos)存储器、磁卡或者光卡,亦或是其他任意适当类型的计算机可读存储介质。

有关本实施例的工作原理、所解决的技术问题、所实现的技术效果等可以参考前述方法实施例中的相关说明,在此不再赘述。

以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

还需要指出的是,在本公开的系统和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。

本说明书中的各个实施例均采用相关的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。可以不脱离由所附权利要求定义的教导的技术而进行对在此所述的技术的各种改变、替换和更改。此外,本公开的权利要求的范围不限于以上所述的处理、机器、制造、事件的组成、手段、方法和动作的具体方面。可以利用与在此所述的相应方面进行基本相同的功能或者实现基本相同的结果的当前存在的或者稍后要开发的处理、机器、制造、事件的组成、手段、方法或动作。因而,所附权利要求包括在其范围内的这样的处理、机器、制造、事件的组成、手段、方法或动作。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1