数据排序方法、数据展示方法、装置、设备和存储介质与流程

文档序号:17548488发布日期:2019-04-30 18:02阅读:166来源:国知局
数据排序方法、数据展示方法、装置、设备和存储介质与流程

本发明涉及数据处理技术领域,特别是涉及一种数据排序方法、数据展示方法、装置、设备和存储介质。



背景技术:

在日常生活中,经常需要对一些数据进行排序,以用于业务、生活、投资等方面的指导。以数据排行榜为例,通过股票数据关注榜、销售数据排行榜、用户点击率排行榜等,可以直观地了解到相关业务、投资等方面的情况,从而可以更好地规避风险(例如,市场风险、黑天鹅事件等)等。

然而,现有技术在进行数据排序时,通常只考虑单一因素。以股票数据关注榜为例,通常只由某一平台产生的股票关注数据生成。可见,现有的数据排序方法片面地基于单一数据而生成,从而难以客观地反映实际情况。

因此,现有技术因为考虑的因素单一而存在数据排行不准确的缺陷。



技术实现要素:

本发明实施例的目的在于提供一种数据排序方法,以解决如何对数据进行准确排序的技术问题。此外,还提供一种数据展示方法、装置、设备和存储介质。

为了实现上述目的,本发明的第一方面,提供了以下技术方案:

一种数据排序方法,其包括:

确定多个待排序数据的、多个因子及其维度和多个预定的因子目标数据及其维度;其中,所述多个因子分别与预定的事件解释相关联;

基于所述多个因子及其维度和所述多个预定的因子目标数据及其维度,利用机器学习的方法,确定出多个因子参数;

确定所述多个因子参数的权重;

基于所述多个因子参数及其权重,通过多因子模型,对所述多个待排序数据进行排序,得到排序数据。

进一步地,基于所述多个因子及其维度和所述多个预定的因子目标数据及其维度,利用机器学习的方法,确定出多个因子参数的步骤,具体包括:

将所述各预定的因子目标数据划分为多个预定的子因子目标数据;

基于所述多个因子及其维度和所述多个预定的子因子目标数据及其维度,构建目标函数;

利用梯度下降法优化所述目标函数,以确定出所述多个因子参数。

进一步地,基于所述多个因子参数及其权重,通过多因子模型,对所述多个待排序数据进行排序,得到排序数据的步骤,具体包括:

分别计算所述多个待排序数据的、所述各因子参数分别与其权重的乘积;

分别计算所述多个待排序数据的、各个乘积的求和;

分别比较所述多个待排序数据的各个求和结果;

根据比较结果,对所述多个待排序数据进行排序。

为了实现上述目的,本发明的第二方面,还提供了以下技术方案:

一种数据展示方法,其包括:

获取根据权利要求1-3中任一所述数据排序方法获得的排序数据;

根据预定的阈值,筛选所述排序数据;

对筛选出的排序数据进行展示。

为了实现上述目的,本发明的第三方面,还提供了以下技术方案:

一种数据排序装置,其包括:

第一确定模块,用于确定多个待排序数据的、多个因子及其维度和多个预定的因子目标数据及其维度;其中,所述多个因子分别与预定的事件解释相关联;

第二确定模块,用于基于所述多个因子及其维度和所述多个预定的因子目标数据及其维度,利用机器学习的方法,确定出多个因子参数;

第三确定模块,用于确定所述多个因子参数的权重;

排序模块,用于基于所述多个因子参数及其权重,通过多因子模型,对所述多个待排序数据进行排序,得到排序数据。

进一步地,所述第二确定模块具体用于:

将所述各预定的因子目标数据划分为多个预定的子因子目标数据;

基于所述多个因子及其维度和所述多个预定的子因子目标数据及其维度,构建目标函数;

利用梯度下降法优化所述目标函数,以确定出所述多个因子参数。

进一步地,所述排序模块具体用于:

分别计算所述多个待排序数据的、所述各因子参数分别与其权重的乘积;

分别计算所述多个待排序数据的、各个乘积的求和;

分别比较所述多个待排序数据的各个求和结果;

根据比较结果,对所述多个待排序数据进行排序。

为了实现上述目的,本发明的第四方面,还提供了以下技术方案:

一种数据展示装置,其包括:

获取模块,用于获取根据权利要求1-3中任一所述数据排序装置获得的排序数据;

筛选模块,用于根据预定的阈值,筛选所述排序数据;

展示模块,用于对筛选出的排序数据进行展示。

为了实现上述目的,本发明的第五方面,还提供了以下技术方案:

一种电子设备,其包括处理器和存储器;其中,

所述存储器,用于存放计算机程序;

所述处理器,用于执行所述存储器上所存放的程序时,实现本发明第一方面或第二方面所述的方法步骤。

为了实现上述目的,本发明的第六方面,还提供了以下技术方案:

一种计算机可读存储介质,其中,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现本发明第一方面或第二方面所述的方法步骤。

本发明实施例提供一种数据排序方法、数据展示方法、装置、设备和存储介质。其中,该数据排序方法包括确定多个待排序数据的、多个因子及其维度和多个预定的因子目标数据及其维度;其中,多个因子分别与预定的事件解释相关联;基于多个因子及其维度和多个预定的因子目标数据及其维度,利用机器学习的方法,确定出多个因子参数;确定多个因子参数的权重;基于多个因子参数及其权重,通过多因子模型,对多个待排序数据进行排序,得到排序数据。

现有技术因为仅仅考虑单一因素而进行数据排序而存在排序不准确,难以反映实际情况的缺陷。本发明实施例通过采取上述技术方案,以更多的数据为基础,选取的多个因子更加接近实际情况,生成的数据排行榜能够反映实际情况,更能接近于市场真实的信息,还有助于对市场进行准确的预测,例如,在投资领域,有助于投资者更好地投资,从而使得用户通过少量的信息,简便地了解市场数据,并能快速地查看市场情绪。

为了能更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而得以体现。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为根据本发明实施例的数据排序方法的流程示意图;

图2a为根据本发明实施例的数据展示方法的流程示意图;

图2b为根据本发明实施例的股票关注榜的展示示意图;

图3为根据本发明实施例的数据排序装置的结构示意图;

图4为根据本发明实施例的数据展示装置的结构示意图。

具体实施方式

下面通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本发明,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。

还需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。

另外,在以下描述中,提供具体细节是为了便于透彻理解实例。然而,所属领域的技术人员将理解,可在没有这些特定细节的情况下实践所述方面。

目前,一些数据排行榜仅考虑单一因素而进行数据排序。这样所得到的数据排行榜并不能够反映实际情况。以股票数据关注榜单为例,该股票数据关注榜单利用任一平台所产生的股票关注数据生成。由于该股票数据关注榜单由单一数据生成;所以,其并不能很好地反映出市场对于标的的真实情绪,由此也就不能真正地帮助到投资者获取市场中的情绪信息。

鉴于此,为了解决如何反映实际情况的技术问题,本发明实施例提供一种数据排序方法。如图1所示,该数据排序方法主要包括如下步骤s100至步骤s130。

其中:

s100:确定多个待排序数据的、多个因子及其维度和多个预定的因子目标数据及其维度;其中,该多个因子与预定的事件解释相关联。

其中,该待排序数据例如可以是股票关注数据、期货关注数据等资产数据,也可以是图书关注数据等排行数据。

在实际应用中,该待排序数据可以以任意形式进行表示。以股票关注数据为例,可以使用关注指数来表示。

在本步骤中,因子例如包括但不限于:关注人数、讨论次数、发布次数、分享次数等。其中,关注人数可以表示诸如底层资产等有很多人关注,未来可能会有影响到诸如股票、期权、黄金等资产的事件发生。讨论次数可以表示当前已经发生了事件,引起了讨论,在未来可能还会引起连续相关事件的发生。发布次数(例如,新闻发布次数)可以表示官方或媒体等对诸如资产等的关注度高,可能会放大非重要事件的影响。分享次数可以表示事件的造成的影响所波及的范围。

因子维度包括但不限于:累计值、统计值、成长率等。其中,累计值表示连续的关注度。统计值表示近一段时间(例如,近一周、近一月等)内的市场关注度。成长率表示连续关注度上升的速率。

与现有技术仅考虑单一因素而得到排序数据的方式相比,本发明实施例所采用了多个因子,可以更全面地为后续步骤提供数据排序基础,由此有助于准确的数据排序。

其中,预定的因子目标数据例如可以是下周热度、下月波动率、下周波动率大于2倍以上的近30日波动率等。本领域技术人员可以根据实际情况来确定。以下周股票热度为例,因为考虑到股票热度的提高能够代表底层资产波动率的加大;因此,可以考虑将下周底层标的的热度作为预定的因子目标数据。预定的因子目标数据的维度包括但不限于:长期关注目标数据、短期关注目标数据、关注的持续程度与变化目标数据等。

在本步骤中,预定的事件解释例如可以是经济事件解释、物理变化事件解释等。

以经济事件解释为例,并具体以股票为例,该经济事件解释是指,假设任一只股票的当期价外期权持仓总数暴增,则在行权日附近会引起巨大的波动。其中,因为该股票的当期价外期权持仓总数暴增,所以,这说明有机构或个人提前得知了内幕信息;故,在行权日附近会引起巨大的波动。

本发明实施例通过将多个因子分别与预定的事件解释相关联,可以使得后续处理结果,基于与该事件解释相关联的事件现象进行训练,从而可以使得数据排序结果符合实际情况。

s110:基于该多个因子及其维度和该多个预定的因子目标数据及其维度,利用机器学习的方法,确定出多个因子参数。

在本步骤中,为各个因子赋予预定的因子目标数据;然后,利用机器学习的方法,例如,可以采用有监督学习的方法来拟合分类器模型,筛选出多个因子参数。

优选地,步骤s110具体可以包括如下步骤s111至步骤s113。其中:

s111:将各预定的因子目标数据划分为多个预定的子因子目标数据。

以下周热度为例,其可以划分为关注人数增量目标数据、关注人数减量目标数据等。

本步骤通过对预定的因子目标数据进行划分,将划分后的因子目标数据作为与多个因子进行联合学习,得到因子参数。

s112:基于该多个因子及其维度和多个预定的子因子目标数据及其维度,构建目标函数。

其中,目标函数反映了因子及其维度与预定的子因子目标数据及其维度之间的函数关系。该目标函数包括损失函数和正则化项。

s113:利用梯度下降法优化该目标函数,以确定出多个因子参数。

举例来说,将关注人数分别乘以统计值和成长率,得到关注人数中间多个因子参数。将讨论次数分别乘以累计值、统计值和成长率,得到讨论次数中间多个因子参数。将发布次数分别乘以累计值、统计值和成长率,得到发布次数中间多个因子参数。将分享次数分别乘以累计值、统计值和成长率,得到分享次数中间多个因子参数。然后,将关注人数增量目标数据和注人数减量目标数据,分别与长期关注目标数据、短期关注目标数据、关注的持续程度与变化目标数据相乘,得到长期关注增量目标数据、长期关注减量目标数据、短期关注增量目标数据、短期关注减量目标数据、关注的增量持续程度与变化目标数据、关注的减量持续程度与变化目标数据。再为关注人数、讨论次数、发布次数和分享次数,分别赋予长期关注增量目标数据、长期关注减量目标数据、短期关注增量目标数据、短期关注减量目标数据、关注的增量持续程度与变化目标数据、关注的减量持续程度与变化目标数据,利用机器学习的方法,确定出关注人数、讨论次数、发布次数和分享次数的数值,作为因子参数,以用于多因子模型。

本发明实施例通过对多个预定的因子目标数据进行子目标的划分,可以为通过后续步骤得到准确的排序数据提供基础。

s120:确定多个因子参数的权重。

在本步骤中,可以使用等权重,例如,可以将每个因子参数权重设置为相同的数值,例如1、2等。还可以通过信息系数均值加权方法来求取多个因子参数的权重。当然,也可以基于历史数值,赋予多个因子参数的权重。本发明对此不作限定。举例而言,以待排序数据为股票数据为例,可以利用股票的市值大小,对多个因子参数赋予相应的权重。

s130:基于多个因子参数和该多个因子参数的权重,通过多因子模型,对待排序数据进行排序,得到排序数据。

其中,该多因子模型基于套利定价原理,以多个因子参数为标准,对待排序数据是否满足多个因子参数进行判断,将满足这些多个因子参数的数据筛选出来;然后,按照预定的顺序进行排序。

在一个优选的实施例中,本步骤s130可以包括:

s131:分别计算多个待排序数据的、各个因子参数分别与其权重的乘积;

s132:分别计算多个待排序数据的、各个乘积的求和;

s133:分别比较多个待排序数据的各个求和结果;

s134:根据比较结果,对多个待排序数据进行排序。

具体而言,根据各个因子参数,对各个待排序数据进行打分。针对其中任一待排序数据而言,将各个打分后的多个因子参数与其各自的权重进行加权运算,从而得到最终得分。最后,将各个待排序数据的最终得分,按照预定的排序进行排序,例如,可以按照从大到小的顺序对各个待排序数据的最终得分进行排序。

本步骤以多因子模型作为数据排序的策略模型,基于与事件解释相关联的多个因子,对待排序数据进行排序,可以得到准确的排序数据,其更符合实际应用情况,例如,能够反映实际的市场情绪,可以为用户提供更可靠的应用指导,例如,可以使用户据此而对未来的市场情绪的变化做出预测。

综上所述,本发明实施例通过采取上述技术方案,与现有技术相比,以更多的数据为基础,选取的多个因子更加接近实际情况,生成的数据排行榜能够反映实际情况,更能接近于市场真实的信息,还有助于对市场进行准确的预测,例如,在投资领域,有助于投资者更好地投资,从而使得用户通过少量的信息,简便地了解市场数据,并能快速地查看市场情绪。

基于与上述数据排序方法实施例相同的技术构思,本发明实施例还提供一种数据展示方法。如图2a所示,该数据展示方法主要包括:

s200:获取排序数据;

s210:根据预定的阈值,筛选该排序数据;

s220:对筛选出的排序数据进行展示。

在本实施例中,可以通过表格、数字配图标、动画配以数字和文字等形式进行展示,本发明对此不作限定。图2b示例性地示出了股票关注榜的展示示意图。

有关本实施例的详细说明、解决的技术问题以及实现的技术效果可以参考前述实施例中的相关说明,在此不再赘述。

与现有技术以单一数据榜单(例如,股票榜单)进行展示的方式相比,本发明实施例通过采取上述技术方案对数据进行展示,可以为用户展示准确的数据排序,从而为该用户提供更合理的指导。

在上文中,虽然按照上述的顺序描述了数据排序方法和数据展示方法实施例中的各个步骤,本领域技术人员应清楚,本发明实施例中的步骤并不必然按照上述顺序执行,其也可以倒序、并行、交叉等其他顺序执行,而且,在上述步骤的基础上,本领域技术人员也可以再加入其他步骤,这些明显变型或等同替换的方式也应包含在本发明的保护范围之内,在此不再赘述。

下面为本发明装置实施例,本发明装置实施例用于执行本发明方法实施例实现的步骤,为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明方法实施例。在本发明各个装置实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。

本发明实施例提供一种数据排序装置。如图3所示,该装置主要包括:第一确定模块31、第二确定模块32、第三确定模块33和排序模块34。其中,

第一确定模块31用于确定多个待排序数据的、多个因子及其维度和多个预定的因子目标数据及其维度;其中,多个因子分别与预定的事件解释相关联。第二确定模块32用于基于多个因子及其维度和多个预定的因子目标数据及其维度,利用机器学习的方法,确定出多个因子参数。第三确定模块33用于确定多个因子参数的权重。排序模块34用于基于多个因子参数及其权重,通过多因子模型,对多个待排序数据进行排序,得到排序数据。

在一个优选的实施例中,第二确定模块具体用于:将各预定的因子目标数据划分为多个预定的子因子目标数据;基于多个因子及其维度和多个预定的子因子目标数据及其维度,构建目标函数;利用梯度下降法优化目标函数,以确定出多个因子参数。

在一个优选的实施例中,排序模块具体用于:分别计算多个待排序数据的、各因子参数分别与其权重的乘积;分别计算多个待排序数据的、各个乘积的求和;分别比较多个待排序数据的各个求和结果;根据比较结果,对多个待排序数据进行排序。

有关上述各实施例的详细说明、解决的技术问题以及实现的技术效果可以参考前述数据排序方法实施例中的相关说明,在此不再赘述。

综上所述,本发明实施例利用第一确定模块31、第二确定模块32、第三确定模块33和排序模块34,以更多的数据为基础,选取的多个因子更加接近实际情况,生成的数据排行榜能够反映实际情况,更能接近于市场真实的信息,还有助于对市场进行准确的预测,例如,在投资领域,有助于投资者更好地投资,从而使得用户通过少量的信息,简便地了解市场数据,并能快速地查看市场情绪。

另外,本发明实施例还提供一种数据展示装置。如图4所示,该数据展示装置主要包括:获取模块41、筛选模块42和展示模块43。其中,获取模块41用于获取根据数据排序装置实施例获得的排序数据。筛选模块42用于根据预定的阈值,筛选排序数据。展示模块43用于对筛选出的排序数据进行展示。

有关本实施例的详细说明、解决的技术问题以及实现的技术效果可以参考前述数据排序方法实施例中的相关说明,在此不再赘述。

本发明实施例通过获取模块41、筛选模块42和展示模块43,对数据进行展示,可以为用户展示准确的数据排序,从而为该用户提供更合理的指导。

此外,本发明实施例还提供一种电子设备,其包括处理器和存储器;其中,存储器用于存放计算机程序。处理器用于执行存储器上所存放的程序时,实现数据排序方法实施例或数据展示方法实施例所述的方法步骤。

当然,本领域技术人员应能理解,上述服务器还可以包括通信接口、通信总线等公知的结构部件。其中,处理器、通信接口和存储器通过通信总线完成相互间的通信。

上述处理器例如可以为中央处理器(centralprocessingunit,简称cpu)、网络处理器(networkprocessor,np)等;还可以是数字信号处理器(digitalsignalprocessing,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(fieldprogrammablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

上述存储器可以包括随机存取存储器(randomaccessmemory,ram),也可以包括非易失性存储器(non-volatilememory,nvm),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。

上述通信总线例如可以是外设部件互连标准(peripheralcomponentinterconnect,pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。

有关本实施例的工作原理、所解决的技术问题、所实现的技术效果等可以参考前述方法实施例中的相关说明,在此不再赘述。

再者,本发明实施例还提供一种计算机可读存储介质。其中,计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现数据排序方法实施例或数据展示方法实施例所述的方法步骤。

上述计算机可读存储介质可以包括但不限于随机存取存储器(ram)、动态随机存取存储器(dram)、静态随机存取存储器(sram)、只读存储器(rom)、可编程只读存储器(prom)、可擦写可编程只读存储器(eprom)、电可擦写可编程只读存储器(eeprom)、闪存(例如,nor型闪存或nand型闪存)、内容可寻址存储器(cam)、聚合物存储器(例如,铁电聚合物存储器)、相变存储器、双向开关半导体存储器、硅-氧化物-氮化硅-氧化硅-硅(silicon-oxide-nitride-oxide-silicon,sonos)存储器、磁卡或者光卡,亦或是其他任意适当类型的计算机可读存储介质。

有关本实施例的工作原理、所解决的技术问题、所实现的技术效果等可以参考前述方法实施例中的相关说明,在此不再赘述。

以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

还需要指出的是,在本公开的系统和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。

本说明书中的各个实施例均采用相关的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。可以不脱离由所附权利要求定义的教导的技术而进行对在此所述的技术的各种改变、替换和更改。此外,本公开的权利要求的范围不限于以上所述的处理、机器、制造、事件的组成、手段、方法和动作的具体方面。可以利用与在此所述的相应方面进行基本相同的功能或者实现基本相同的结果的当前存在的或者稍后要开发的处理、机器、制造、事件的组成、手段、方法或动作。因而,所附权利要求包括在其范围内的这样的处理、机器、制造、事件的组成、手段、方法或动作。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1