数据信息的筛选方法和系统与流程

文档序号:18196408发布日期:2019-07-17 05:53阅读:379来源:国知局
数据信息的筛选方法和系统与流程

本公开实施例涉及互联网技术领域,特别涉及数据信息的筛选方法和系统。



背景技术:

随着互联网技术的发展,用户可通过浏览网页等方式获取所关注的企业的数据信息。或者获取所关注的企业的某部分数据信息。如,财务报表数据信息和年度报表数据信息等。当然,也可获取相关企业的财务报表数据信息和年度报表数据信息等。相关企业是指同一行业的企业,如苹果公司和三星公司。

在现有技术中,主要由用户基于其自身的数据需求获取与该数数据需求对应的数据信息。或者,通过工作人员在获取到用户的数据需求时,搜索与该数据需求对应的数据信息,并将数据信息推送至用户对应的终端。



技术实现要素:

本公开实施例提供一种数据信息的筛选方法和系统。

第一方面,本公开实施例提供了一种数据信息的筛选方法,包括:

获取用户的浏览记录和初始数据需求;

根据所述浏览记录确定至关键字;

根据所述关键字和所述初始数据需求确定目标数据需求;

响应于获取到与所述目标数据需求对应的数据信息,将所述数据信息发送至所述用户对应的终端。

在一些实施例中,如果所述初始数据需求携带数据类别,则所述根据所述关键字和所述初始数据需求确定目标数据需求,包括:

计算所述关键字与所述数据类别之间的偏离程度;

确定最小的偏离程度;

根据所述最小的偏离程度确定所述目标需求。

在一些实施例中,所述计算所述关键字与所述数据类别之间的偏离程度,包括:

计算所述关键字与所述数据类别之间的匹配度;

根据所述匹配度计算所述偏离程度。

在一些实施例中,所述计算所述关键字与所述数据类别之间的匹配度,包括:

获取所述数据类别和所述关键字在预设的三维坐标中的位置信息;

根据所述关键字的位置信息和所述数据类别的位置信息确定所述匹配度。

在一些实施例中,所述根据所述关键字的位置信息和所述数据类别的位置信息确定所述匹配度,包括:

根据式1确定所述匹配度式1:

其中,为第k次递归时所述关键字的位置信息,为第k次递归时所述数据类别的位置信息。

在一些实施例中,所述确定最小的偏离程度,包括:

根据式2确定所述最小的偏离程度mindk,式2:

其中,m、n和p为预设的与所述三维坐标中的三个位置分别对应的阈值。

在一些实施例中,所述根据所述最小的偏离程度确定所述目标需求,包括:

根据式3对所述最小偏离程度对应的关键字进行无监督学习,得到无监督学习结果,式3:

响应于当前递归次数大于预设阈值,将所述无监督学习结果确定为所述目标需求;

其中,dmink为k次递归匹配度的最小值。

第一方面,本公开实施例提供了一种数据信息的筛选系统,包括:

获取模块,用于获取用户的浏览记录和初始数据需求;

确定模块,用于根据所述浏览记录确定至关键字;

所述确定模块还用于,根据所述关键字和所述初始数据需求确定目标数据需求;

发送模块,用于响应于获取到与所述目标数据需求对应的数据信息,将所述数据信息发送至所述用户对应的终端。

在一些实施例中,如果所述初始数据需求携带数据类别,则所述确定模块具体用于:

计算所述关键字与所述数据类别之间的偏离程度;

确定最小的偏离程度;

根据所述最小的偏离程度确定所述目标需求。

在一些实施例中,所述确定模块具体用于:

计算所述关键字与所述数据类别之间的匹配度;

根据所述匹配度计算所述偏离程度。

在一些实施例中,所述确定模块具体用于:

获取所述数据类别和所述关键字在预设的三维坐标中的位置信息;

根据所述关键字的位置信息和所述数据类别的位置信息确定所述匹配度。

在一些实施例中,所述确定模块具体用于:

根据式1确定所述匹配度式1:

其中,为第k次递归时所述关键字的位置信息,为第k次递归时所述数据类别的位置信息;

根据式2确定所述最小的偏离程度mindk,式2:

其中,m、n和p为预设的与所述三维坐标中的三个位置分别对应的阈值;

根据式3对所述最小偏离程度对应的关键字进行无监督学习,得到无监督学习结果,式3:

响应于当前递归次数大于预设阈值,将所述无监督学习结果确定为所述目标需求;

其中,dmink为k次递归匹配度的最小值。

本公开实施例提供的获取用户的浏览记录和初始数据需求,根据浏览记录确定至关键字,根据关键字和初始数据需求确定目标数据需求,响应于获取到与目标数据需求对应的数据信息,将数据信息发送至用户对应的终端的技术方案,实现了为用户筛选全面的数据信息的技术效果,且节约了成本,提高了效率。

附图说明

附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开的实施例一起用于解释本公开,并不构成对本公开的限制。通过参考附图对详细示例实施例进行描述,以上和其他特征和优点对本领域技术人员将变得更加显而易见,在附图中:

图1为本公开实施例的数据信息的筛选方法的示意图;

图2为本公开实施例的确定目标需求的方法的示意图;

图3为本公开实施例的数据信息的筛选系统的示意图;

附图标记:

1、获取模块,2、确定模块,3、发送模块。

具体实施方式

为使本领域的技术人员更好地理解本发明的技术方案,下面结合附图对本发明提供的数据信息的筛选方法和系统进行详细描述。

在下文中将参考附图更充分地描述示例实施例,但是所述示例实施例可以以不同形式来体现且不应当被解释为限于本文阐述的实施例。反之,提供这些实施例的目的在于使本公开透彻和完整,并将使本领域技术人员充分理解本公开的范围。

如本文所使用的,术语“和/或”包括一个或多个相关列举条目的任何和所有组合。

本文所使用的术语仅用于描述特定实施例,且不意欲限制本公开。如本文所使用的,单数形式“一个”和“该”也意欲包括复数形式,除非上下文另外清楚指出。还将理解的是,当本说明书中使用术语“包括”和/或“由……制成”时,指定存在所述特征、整体、步骤、操作、元件和/或组件,但不排除存在或添加一个或多个其他特征、整体、步骤、操作、元件、组件和/或其群组。

本文所述实施例可借助本公开的理想示意图而参考平面图和/或截面图进行描述。因此,可根据制造技术和/或容限来修改示例图示。因此,实施例不限于附图中所示的实施例,而是包括基于制造工艺而形成的配置的修改。因此,附图中例示的区具有示意性属性,并且图中所示区的形状例示了元件的区的具体形状,但并不旨在是限制性的。

除非另外限定,否则本文所用的所有术语(包括技术和科学术语)的含义与本领域普通技术人员通常理解的含义相同。还将理解,诸如那些在常用字典中限定的那些术语应当被解释为具有与其在相关技术以及本公开的背景下的含义一致的含义,且将不解释为具有理想化或过度形式上的含义,除非本文明确如此限定。

根据本公开实施例的一个方面,本公开实施例提供了数据信息的筛选方法。

请参阅图1,图1为本公开实施例的数据信息的筛选方法的示意图。

如图1所示,该方法包括:

s1:获取用户的浏览记录和初始数据需求。

其中,浏览记录是指用户通过终端进行网站等浏览时产生的记录。根据用户的浏览记录,可获悉用户关注的网站等。如果本实施例主要用于为用户筛选其所关注的企业的财报数据信息和年报数据信息。那么,在本实施例中,主要根据用户的浏览记录获悉用户关注的企业,以及该企业的具体项目和相关的数据信息等。

终端可以是移动设备例如手机、笔记本电脑平板电脑、个人数字助理等,也可以是固定设备,例如台式电脑等。

其中,数据需求是指期望获取到的数据信息的请求。也就是说,数据需求体现了用户期望获取具体的某企业(包括一个企业或多个企业)的数据信息,或者,该企业的具体某方面的数据信息(如财报数据信息或年报数据信息等)。

此处的初始数据需求是一个相对概念,即是用户初次设置的关于数据信息的数据需求。

s2:根据浏览记录确定至关键字。

其中,关键字是指能够最大程度概括用户所要查找的信息内容的字或词。

s3:根据关键字和初始数据需求确定目标数据需求。

同理,该步骤中的目标数据需求亦是一个相对概念。目标数据需求时相对于初始数据需求而言的。

该步骤实际是对初始数据需求进行拓展的步骤。由于不同的企业之间的数据信息之间可能存在相互影响。或者,同一企业之间的不同的数据类别之间也存在相互影响。如,同一企业的销售数据类别会受成本数据类别影响。这两种数据类别为存在直接影响的数据类别。而某些不同的两种数据类别之间却是间接影响,此处不再列举。

通过关键字的方式对初始数据需求进行拓展,得到目标数据需求。使得用户在数据信息方面的需求被横向放大,进而可实现在将与初始数据需求对应的数据信息发送至用户对应的终端时,亦将与初始数据需求对应的数据信息相关的数据信息亦发送至用户对应的终端,以用户对数据信息的需求全面性。而又不至于将不相关的数据信息也发送至用户,避免给用户造成数据信息繁杂,浪费用户时间成本的弊端。

当然,在根据关键字和初始数据需求确定了目标数据需求时,可先向用户对应的终端发送询问信息,即是否将初始数据需求修改为目标数据需求。并在接收到用户通过其对应的终端反馈的确认的信息时,确定基于目标数据需求进行数据信息的筛选。

如:用户的初始数据需求为获取企业a的数据信息的请求。在经过上述步骤后,得到了与企业a制造相同产品的企业b。则通过用户对应的终端询问用户是否亦获取企业b的数据信息。如果用户通过其对应的终端反馈是,则不仅将企业a的数据信息发送至用户对应的终端,并且将企业b的数据信息亦发送至用户对应的终端。

当然,如果用户的初始数据需求为获取企业a的销售额的数据信息的请求。在经过上述步骤后,得到了在企业a中与销售额的数据信息相关的进货成本。则通过用户对应的终端询问用户是否亦获取企业a的进货成本的数据信息。如果用户通过其对应的终端反馈是,则不仅将企业a的销售额的数据信息发送至用户对应的终端,并且将企业a的进货成本的数据信息亦发送至用户对应的终端。

结合图2可知,在一些实施例中,初始数据需求携带数据类别,s3包括:

s3-1:计算关键字与数据类别之间的偏离程度。

其中,数据类别是指基于不同的用户的需求而对企业的各类数据信息进行分类后得到的数据的类别。如,财务报表数据信息对应的为财报数据类别,年度报表数据信息对应的为年报数据类别。当然,数据类别的分类也可以进一步细化,如营业额数据类别,净利润数据类别等。

在一些实施例中,s3-1包括:

s3-1-1:计算关键字与数据类别之间的匹配度。

在一些实施例中,s3-1-1包括:

s3-1-1-1:获取数据类别和关键字在预设的三维坐标中的位置信息。

s3-1-1-2:根据关键字的位置信息和数据类别的位置信息确定匹配度。

在一些实施例中,s3-1-1-2包括:

根据式1确定所述匹配度式1:

其中,为第k次递归时关键字的位置信息,为第k次递归时数据类别的位置信息。

s3-1-2:根据匹配度计算偏离程度。

s3-2:确定最小的偏离程度。

根据式2确定最小的偏离程度mindk,式2:

其中,m、n和p为预设的与三维坐标中的三个位置分别对应的阈值。

具体地,m对应i,n对应j,p对应t。

当关键字的数量为一个时,则最小的偏离程度即为该关键字对应的偏离程度。

当关键字的数量为多个时,则每一个关键字分别对应一个匹配度,且对应一个偏离程度。则将多个偏离程度进行比较,从中选择最小的偏离程度。具体实现的方式包括:

方式1:依次将多个偏离程度进行比较,直至比较完所有的偏离程度,得到最小的偏离程度。

方式2:对多个偏离程度进行降序排列,排序后的最后一个偏离程度即为最小的偏离程度。

方式3:对多个偏离程度进行升序排列,排序后的第一个偏离程度即为最小的偏离程度。

当然,也可使用其它的从多个偏离程度中确定最小的偏离程度的方式,此处不再赘述。

如果,最小的偏离程度有两个。即,存在两个相同的偏离程度,且该偏离程度为最小的偏离程度。则可从两个相同的偏离程度中随机选取一个作为最小的偏离程度。当然,也可将最小的偏离程度确定为两个。

s3-3:根据最小的偏离程度确定目标需求。

当最小的偏离程度为一个时,则根据该最小偏离程度确定目标需求。

当最小偏离程度为多个时,则分别根据该两个偏离程度确定目标需求。

在一些实施例中,s3-3包括:

s3-3-1:根据式3对最小偏离程度对应的关键字进行无监督学习,得到无监督学习结果,式3:

其中,dmink为k次递归匹配度的最小值。

响应于当前递归次数大于预设阈值,执行s3-3-2:将无监督学习结果确定为目标需求。

其中,无监督学习结果为与最小偏离程度对应的关键字相关的文本、ppt和word中的一种或多种。

响应于当前递归次数小于或等于预设阈值,执行s3-3-3:将当前递归次数加1,并返回至s3-1。

s4:响应于获取到与目标数据需求对应的数据信息,将数据信息发送至用户。

当获取到任意数据信息时,均会判断该数据信息是否为与目标数据需求对应的数据信息。即,判断该数据信息是否为用户所关注的企业的数据信息或者,与该企业相关的企业的数据信息。或者,判断该数据信息是否为用户所关注的某企业的数据类别的数据信息,或者该数据类别相关的数据类别的数据信息。如果不是,则直接过滤掉。如果是,则将该数据信息发送至用户。

可以理解的是,数据信息可分为内容数据信息和标题数据信息。其中,内容数据信息是指该数据信息不仅包括标题,还包括具体的数据内容的数据信息。标题数据信息是指只有标题的数据信息,而没有与该标题相关的具体内容的数据信息。如,当数据信息中仅包含通知性质的信息时,如某公司下个月将发布3月份的财报信息,则说明该数据信息为没有内容的数据信息,即该数据信息为标题数据信息。而当某数据信息中包含了3月份的财报信息时,则说明该数据信息为内容数据信息。

在一些实施例中,当获取到的数据信息为与目标数据需求对应的数据信息时,则先判断该数据信息为内容数据信息还是标题数据信息。

如果为标题数据信息,则根据该标题数据信息生成短信,并将短信发送至用户对应的终端。

如果为内容数据信息,则根据该内容数据信息生成彩信,并将彩信发送至用户对应的终端。

在一些实施例中,初始数据需求和目标数据需求中均携带用户对应的终端的标识。且预先构建用户对应的终端与编号之间的映射关系。

在生成短信或彩信时,先根据目标数据需求确定用户对应的终端的标识,基于标识对短信或彩信进行编号,并基于编号将短信或彩信发送至用户对应的终端。

在一些实施例中,当需要发送的为彩信时,则开启5g通信,基于5g通信将彩信发送至用户对应的终端。

根据本公开实施例的另一个方面,本公开实施例提供了数据信息的筛选系统。

请参阅图3,图3为本公开实施例的数据信息的筛选系统的示意图。

如图3所示,该系统包括:

获取模块1,用于获取用户的浏览记录和初始数据需求;

确定模块2,用于根据浏览记录确定至关键字;

确定模块2还用于,根据关键字和初始数据需求确定目标数据需求;

发送模块3,用于响应于获取到与目标数据需求对应的数据信息,将数据信息发送至用户对应的终端。

在一些实施例中,确定模块2具体用于:

计算关键字与数据类别之间的偏离程度;

确定最小的偏离程度;

根据最小的偏离程度确定目标需求。

在一些实施例中,确定模块2具体用于:

计算关键字与数据类别之间的匹配度;

根据匹配度计算偏离程度。

在一些实施例中,确定模块2具体用于:

获取数据类别和关键字在预设的三维坐标中的位置信息;

根据关键字的位置信息和数据类别的位置信息确定所述匹配度。

在一些实施例中,确定模块2具体用于:

根据式1确定匹配度式1:

其中,为第k次递归时关键字的位置信息,为第k次递归时数据类别的位置信息。

在一些实施例中,确定模块2具体用于:

根据式2确定最小的偏离程度mindk,式2:

其中,m、n和p为预设的与三维坐标中的三个位置分别对应的阈值。

在一些实施例中,确定模块2具体用于:

根据式3对最小偏离程度对应的关键字进行无监督学习,得到无监督学习结果,式3:

响应于当前递归次数大于预设阈值,将无监督学习结果确定为目标需求;

其中,dmink为k次递归匹配度的最小值。

本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于ram、rom、eeprom、闪存或其他存储器技术、cd-rom、数字多功能盘(dvd)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。

本文已经公开了示例实施例,并且虽然采用了具体术语,但它们仅用于并仅应当被解释为一般说明性含义,并且不用于限制的目的。在一些实例中,对本领域技术人员显而易见的是,除非另外明确指出,否则可单独使用与特定实施例相结合描述的特征、特性和/或元素,或可与其他实施例相结合描述的特征、特性和/或元件组合使用。因此,本领域技术人员将理解,在不脱离由所附的权利要求阐明的本公开的范围的情况下,可进行各种形式和细节上的改变。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1