一种基于大数据的信息稳定性分析系统的制作方法

文档序号:13760433阅读:162来源:国知局

本发明涉及信息处理技术领域,尤其涉及一种基于大数据的信息稳定性分析系统。



背景技术:

大数据指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。对大量消费者提供产品或服务的企业可以利用大数据进行精准营销,做小而美模式的中长尾企业可以利用大数据做服务转型,面临互联网压力之下必须转型的传统企业需要与时俱进充分利用大数据的价值。现有技术中,关于技术信息、客户信息、品牌信息、以及一切与人的属性或行为有关的信息的处理均采用人工处理的方式,决策者进行数据梳理和判断时需要花费较大的时间,容易出错。并且针对,信息的稳定性缺少直观的定量分析,导致决策时很难判断。



技术实现要素:

为克服现有技术中存在的针对品牌信息稳定性缺少定量分析的问题,本发明提供了一种基于大数据的信息稳定性分析系统。

一种基于大数据的信息稳定性分析系统,包括:指标数据分析计算模块,对数据获取的数据进行组合线型处理得到对应的指标数据;评价程度分析模块,用于对指标数据分析计算模块得到的指标数据进行分析得到评价程度;信息偏向度计算模块,用于分析计算数据中对于评价程度的偏向度;衰减系数计算模块,根据评价程度分析模块计算得到的评价程度分析计算信息的衰减系数;稳定性指数计算模块,以2为底数,衰减系数计算模块计算得到的衰减系数为指数进行运算,并进行去整扩大相应的倍数得到稳定性指数。

进一步的,还包括时效性指数计算模块,用于根据信息的衰减系数与偏向度的差值进行指数运算得到时效性指数。

进一步的,还包括有效期计算模块,根据时效性指数的对数值与信息的衰减系数与偏向度的差值的对数值进行线性计算得到有效期。

进一步的,还包括数据获取模块,用于获取有效信息的数据;数据输入模块,用于输入相关的行为或者对象的信息数据;数据获取模块和数据输入模块获取的数据输出到指标数据分析计算模块。

进一步的,所述数据获取模块包括还一结构化分析模块,将数据获取模块的数据结果进行结构化分析。

进一步的,还包括稳定性输出模块,用于输出衰减系数计算模块和稳定性指数计算模块计算模块的计算结果,并将稳定性指数计算模块的计算结果与参比数据进行比较,输出参数数据区间的名称。

进一步的,所述稳定性输出模块包括稳定性指数比对单元和输出单元,所述稳定性指数比对单元用于将稳定性指数计算模块的计算结果与参比数据进行比较,所述输出单元用于输出输出衰减系数计算模块和稳定性指数计算模块计算模块的计算结果,并将稳定性指数比对单元的比对结果进行输出。

进一步的,所述输出单元包括输出界面和决策建议匹配器,所述决策建议匹配器用于将输出结果与决策建议匹配并输出。

进一步的,还包括稳定性指数参比数据库,用于存放稳定性指数参比数据,所述稳定性指数参比数据包括多个稳定性指数参比数据区间。

进一步的,所述评价程度为正面评价程度与加权的负面评价程度之和。

与现有技术相比,本发明的有益效果是:

本发明能够基于网络或者获取某一行为或者对象的与人的决策有关的数据,其通过对数据进行科学的处理,并将有关的指标进行定量的数值量化,通过建立参比数据库将稳定性指数进行划分区间,通过输出直观的区间名称,便于理解信息数据,从而利于决策,避免对信息数据理解错误导致财产损失。并且决策者能够通过定量的数据,直观的判断信息的相对影响力的大小,使得对信息的决策处理更为直观快捷。

附图说明

图1是本发明的结构示意图。

具体实施方式

以下结合附图和实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

如图1所示,本具体实施方式披露了一种基于大数据的信息稳定性分析系统,所述大数据的内容可以是技术信息、客户信息、品牌信息、以及一切与人的属性或行为有关的信息,这些数据可以是结构化的或者非结构化的。所述系统包括:

数据获取模块,用于获取有效信息的数据;优选的,其用于获取网络数据库中的关于的数据,通过互联网将系统与网络上的数据库进行连接,从而获取关于信息的数据。其中,网络数据库是通过对网络用户发起问卷调查和对指定区域的信息收集而生成的数据库。更进一步,所述数据源可以是非结构化数据。所述数据可以是分布在网络上的跟某一技术主题有关的技术信息,例如“3D打印”,也可以是跟某一对象有关的数据,例如跟某一品牌有关的数据,也可以是跟人的行为有关的数据,例如,乘坐公共交通工具有关的数据。

优选的,所述数据获取模块包括以下组成部分:

一参数获取模块,用于获取数据的指标及其数值范围,所述范围可以是一个时间段,例如早上八点到十点;一个具体的地区,例如北京市;一个特定的人群,例如学生;或者一个具体的行为,例如上车刷卡;或者一个具体的对象,例如一个或者几个品牌、一个或者几个企业。非限制性地,参数获取模块连接至移动互联网和/或因特网等网络,接收来自于网络的数据。例如,数据获取模块可连接到一具有调查反馈功能的在线网站,访问者通过该网站提交或者留下数据信息。例如,当需要获取于某一对象有关的人数统计时,例如需要获取某一时间段通过地铁进站口刷卡的人数、或者需要获取某一时间段在办公室登录电脑的特定人群、或者需要获取对某一家或者几家企业知晓的人数、对某一学校口碑的反馈、以及对某几个商标知晓的人数等等。该网站对受访者人数、受访者的反馈结果进行统计后发送至参数获取模块;另一方面,可选地,该网站可直接将受访者的反馈结果发送至参数获取模块,由参数获取模块进行访问人数的统计。此外,本领域的技术人员应当理解,所述网站的数量可以不止一个,同一网站所提供的数据的内容也可以不止一个,也就是说,参数获取模块可以与多个在线网站通过有线或无线的方式相连接,获取多个在线网站的反馈信息。优选的,对于调查某一行为或者对象而言,所述信息的数据包括指定区域内的人口总数、对该行为或者对象知晓的人数、访问人数、与该类似行为或者对象有关的其他行为或对象的数量、愿意作出该行为或者选择该对象的人数和不愿意作出该行为或者选择该对象的人数等。例如,调查获取的对象可以是选择高速铁路出行、到某企业就职、对某一个学校知名度的调查、对某一品牌知名度的调查等。

一数据输入模块,用于输入相关的行为或者对象的信息数据;优选的,数据获取模块还可以设置输入单元,通过人工输入的方式录入数据,可以通过键盘输入、语音输入等方式实现。一结构化分析模块,将参数获取模块的数据结果进行结构化分析。因为参数获取模块获取的数据可能不具有结构化特点,而要进行定量分析的前提是数据结构化,因此结构化分析模块对参数获取模块所提供的数据进行结构化。例如参数获取模块可能是基于摸一个关键词、一份调查问卷、一段采访内容进行搜集获取,其所反馈的可能是一段文字、一段文字和图片、一个没有表头的表格、一份调查问卷中的简要回答等。结构化分析模块首先建立一个结构化的表格,而后对参数获取模块的数据进行关键词抽取或者特定字符、字符串的匹配、简短语义的匹配,将抽取的结果或者匹配的结果插入到结构化表格中。另一方面,结构化分析模块也对参数获取模块的数据进行统计,将统计的结果插入到结构化表格中。例如,该结构化表格可以包括但不限于:访问某一网站的人数、时间段、倾向性意见等等。

指标数据分析计算模块,用于将从数据获取模块和数据输入模块获取的数据进行组合线型处理得到对应的指标数据;该模块内存储有各个指标数据的计算公式和计算代码,通过计算代码将获取或输入的数据带入公式计算得到指标数据,所述指标数据包括普通群体的人数(也可以是使用某一个app的人数,或者接受调查反馈的人数)、某一行为或者对象的知名度、一个普通群体中的个体完全知道某一行为或者对象所要传播的信息量的极值、平均认知度、由知名度而来的基本信息量、评价程度、一个特定环境的平均评价程度和调整系数指数函数中的底数。指标数据中还包括多镒信息重复率,某一行为或者对象对已某一事物的关注重复度往往受到其他同领域的行为或者对象的影响,所述同一领域的全部事物在同一行为或者对象上重复的平均时间间隔与该事物在同一行为或者对象上重复的时间间隔的比值作为该事物的多镒信息重复率。多镒信息重复率反映了其在同领域内的相对性的特征。优选的,在本发明的一个具体实施例中通过来表示多镒信息重复率。

评价程度分析模块,用于根据取得的必要信息数据进行正面评价程度和负面评价程度额计算。在取得了必要的信息数据之后,通过计算机将获取的数据进行相应的组合线型处理得到相应的指标数据,所述指标数据包括但不限于:与某一个行为或者对象有关的总人数,例如乘坐高速列车的群体数量、使用3D打印技术的客户数量、某一个著名品牌消费者人群总数等;该行为或者对象的知晓程度,例如对高速列车了解程度、对3D打印设备性能了解的程度、对某一品牌知名度等;普通群体完全知道该行为或者对象所要传播的信息量的极值,例如普通乘客对高铁完全了解所需要传播的最大信息量、对普通技术人员3D打印完全技术了解所要传播的信息量的极值、某一个地区的家长要完全了解某一个学校所要传播的最大信息量、普通消费者对某一个品牌认知所要传播的信息量的极值;该行为或者对象当前平均认知度,例如当前对高速列车的平均认知度、对3D打印技术的平均认知度、对某一个学校的平均认知度、对某一个企业或者品牌的平均认知度。

此外,对某一行为或者对象可进一步分析其评价程度,通过如下公式计算得到:式中,α1为评价程度,x为发生的真实采用或接受行为或者对象的普通群体样本中,采纳或者接受该行为或对象时与特定的行为提供者无关的个体数目;例如,对于选择高速列车出行的行为进行分析时,x表示作出该选择时不考虑特定的列车车型的个体数量,在对3D打印技术的选择行为进行分析时,x表示选择3D打印技术时不考虑特定的成型工艺(例如激光烧结、电子束烧结)的个体数量,在分析是否选择学校就读时,x表示不考虑该学校的名称的个体数量,同样,在分析某一品牌的选择时,x表示作出该选择时与具体厂家无关的个体数量。sx为发生的真实采用或接受行为或者对象的普通群体样本的总数量;y为拒绝该行为或者对象的普通群体样本中,原因是与该行为或者对象直接有关的选项的消个体人数;例如,对于选择高速列车出行的行为进行分析时,x表示对高速列车本身不接纳的个体数量,在对3D打印技术的选择行为进行分析时,x表示对3D打印技术时不考虑的个体数量,在分析是否选择学校就读时,x表示因某一个学校本身而拒绝的个体数量,同样,在分析某一品牌的选择时,x表示因品牌原因拒绝的个体数量。sy为选择该行为或者对象的替代行为或者对象的个体数量;例如,对于选择高速列车出行的行为进行分析时,y表示选择飞机、汽车等其他出行方式的个体数量,在对3D打印技术的选择行为进行分析时,y表示选择现有的成型工艺的个体数量,在分析是否选择某一学校就读时,y表示选择其他学校的个体数量,同样,在分析某一品牌的选择时,y表示同业竞争者品牌商品的消费者样本的消费者数目;η为变频系数。

上述评价程度是普通群体对一个行为或者对象的好感度。上述信息可以通过对非结构化数据中的关键词和主题进行抓取和分析得到,也可以通过简单的调研获取,然后汇总并求出平均数,是个百分比表达的度的指标。

科学统计表明,即使是再成熟的技术、再便捷的新科技、口碑再好的学校、医院、企业、品牌、或者某一个公众人物,也会有反感的人。也就是说,对一个行为或者对象并不能存在100%接受的现象,评价程度有好有坏。

本发明进一步将对行为或对象的评价程度分为正面评价程度、负面评价程度。有关正面评价程度的分析方法为:式中,有关负面评价程度的分析方法为:

因此,关于某一行为或者对象的评价程度的度量是将正负评价程度合计,而且负评价程度对普通个体的影响更大,因此,在合计的算式中需要对负评价程度进行加权,并且使用变频系数进行处理,最终评价程度通过如下计算公式得到:

变频系数η是普通个体对该行为或者对象所在的特定环境的关注度(例如行业关注度)和媒体对其的关注度有关的系数,该变频系数可以依赖于更大规模的数据进行计算得到,例如在分析对高速列车出行时,普通群体不限于经常出行的人群,而是可以将几乎不出行的群体也纳入进来;在分析3D打印时可以将整个装备制造领域的企业纳入进来,在分析学校或者品牌时,可以将能接触到更大地区的学校或者整个行业的品牌的群体也纳入进来。在具体计算式,可以将关注度从0至9分为10个等级,同样将媒体对其的关注度的关注度划分为10个等级,用1×2矩阵来表示,如:(1,2),表示消费者对该品牌所在行业的关注度等级为1,媒体对企业的关注度等级为2;根据矩阵位置,即可建立相应的映射关系,通过该矩阵而获得相应的变频系数。本领域的技术人员应当理解,所述变频系数的具体计算方式可以有多样性,本发明中所提到的普通个体对该行为或者对象所在的特定环境的关注度(例如行业关注度)和媒体对其的关注度是可以量化的,期间之间的映射关系也是可以根据具体情况设定的,本发明不限于具体的映射方式和数据,例如变频系数η可以取值1、2、3、……,也可以是分数形式或者其他无理数。

信息偏向度计算模块,用于分析计算数据中对于评价程度的偏向度。评价程度的偏向度是指用户在决策中,多次表现出来对某个行为或者事物或者人物有偏向性的(而非随意的)行为反应。它是一种行为过程,也是一种心理(决策和评估)过程。在本具体实施例中,评价程度的偏向度通过偏向度测量模型分析计算得到。偏向度测量模型系统由态度、价值及领导地位、体现价值及差别化、沟通及行为五大类十个变量所构成。在对具体的偏向度测量模型进行测量时,此测量模型系统中的变量可作为一个备选变量,选择其中一些适当变量,并赋予其一定的权重。即通过对各个因素按照权重进行比例分配,加权求和得到最终的偏向度。

衰减系数计算模块,根据评价程度分析模块计算得到的评价程度分析计算信息的衰减系数。可行的,在本发明的一个具体实施方式中可通过如下计算公式计算得到,

其中,式中,Γ为衰减系数;N2为调整参数,调整参数的数值由同领域的竞争状况决定,具体的可通过查阅调研得到的数据表获得;为多镒信息重复率;为评价程度。

衰减系数是某一行业、某一事物或者某个人物对用户的影响力,而评价程度和多镒信息重复率则是评价其影响力的两个重要因素,并且成反比关系。因此将多镒信息重复率与评价程度的比值作为衰减系数。

稳定性指数计算模块,以2为底数,衰减系数计算模块计算得到的衰减系数为指数进行运算,并进行去整扩大相应的倍数得到稳定性指数。其中,扩大倍数根据不同的行业、事物或者人物采用不同的标准,处于同一领域的采用相同的倍数。

优选的,该系统还可以包括稳定性输出模块,用于输出衰减系数计算模块和稳定性指数计算模块计算模块的计算结果,并将稳定性指数计算模块的计算结果与参比数据进行比较,输出参数数据区间的名称。其中参比数据来自稳定性指数参比数据库,其根据预先设置好的分配区间,将稳定想指数计算模块能够计算得到的所有数据进行划分区间。区间的名称即是该数值下的,稳定性指数对应的直观名称。稳定性输出模块能够将计算得到的数值和参比数据对应的区间名称进行输出。可行的,其通过一计算机数据库和一处理器进行,并且处理器连接有一缓存设备,其能够将计算机数据库内的数据区间名称进行缓存,并通过处理控制用于输出。

在本发明的一个可行的具体实施例中,所述稳定性输出模块包括稳定性指数比对单元和输出单元,所述稳定性指数比对单元用于将稳定性指数计算模块的计算结果与参比数据进行比较,所述输出单元用于输出输出衰减系数计算模块和稳定性指数计算模块计算模块的计算结果,并将稳定性指数比对单元的比对结果进行输出。优选的,所述输出单元包括输出界面和决策建议匹配器,所述决策建议匹配器用于将输出结果与决策建议匹配并输出。并且,输出单元可通过一液晶显示器进行输出,并且能够将决策建议进行一并显示。这样决策者能够根据输出的结果和决策意见进行合理的规划,避免数据理解错误,造成损失。并通过输出直观的参比数据的区间名称,能够使决策者更加直观的理解结果,使得分析结果更加易于非专业人员的理解。

在本发明的另一具体实施例中,还包括一时效性指数计算模块,用于根据信息的衰减系数与偏向度的差值进行指数运算得到时效性指数。优选的,时效性指数通过如下计算公式得到:

<mrow> <mi>&gamma;</mi> <mo>=</mo> <msup> <mrow> <mo>&lsqb;</mo> <mfrac> <mn>1</mn> <mrow> <mi>&Gamma;</mi> <mo>-</mo> <mi>L</mi> </mrow> </mfrac> <mo>&rsqb;</mo> </mrow> <mi>t</mi> </msup> <mo>;</mo> </mrow>

式中,γ为时效性指数;Γ为衰减系数;L为偏向度;t为信息的有效期。同样的,时效性指数也可以通过稳定性输出模块进行输出,用户根据时效性指数的大小能够直观的看出分析的信息与同领域的其他信息的相对差异,时效性指数越大,其相对影响力越大,时效性指数越小,相对影响力越小,与同领域平均水平差的越多。

根据时效性指数计算模块计算得到的结果,还能够计算出信息的有效期。可行的,在本发明的另一个具体实施例中,根据时效性指数的对数值与信息的衰减系数与偏向度的差值的对数值进行线性计算得到有效期。具体通过如下计算公式计算得到,

式中,t为有效期;γ为时效性指数;Γ为衰减系数;L为偏向度。与时效性指数相类似,有效期同样反映信息在同领域内的相对影响力,用户通过有效期值的大小能够直观的判断信息的相对影响力的大小,有效期长则该信息的相对影响力较大,若有效期较短则相对影响力较小。

上述说明示出并描述了本发明的优选实施例,如前所述,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1