一种基于大数据的信息定量分析系统的制作方法

文档序号:10655457阅读:187来源:国知局
一种基于大数据的信息定量分析系统的制作方法
【专利摘要】本发明提供了一种基于大数据的信息定量分析系统,包括指标数据分析计算模块,对数据获取的数据进行组合线型处理得到对应的指标数据;信息总量分析计算模块,将指标数据分析计算模块得到的数据进行分析和调整运算得到信息总量;比值分析计算模块,用于对得到的信息总量和信息基本量以及输入的信息延伸量通过相应的比值计算得到信息质量比值;信息均值比计算模块,用于根据指标数据分析计算模块得到的指标数据进行分析计算信息均值比;信息稳定性分析计算模块,用于对信息的衰减系数、稳定性指数、时效性指数和有效期的计算。本发明通过直观的定量分析的方法,以直观的形式输出结果,使得数据更容易理解,避免了数据理解错误造成财产损失。
【专利说明】
-种基于大数据的信息定量分析系统
技术领域
[0001] 本发明设及信息数据处理技术领域,尤其设及一种基于大数据的信息定量分析系 统。
【背景技术】
[0002] 大数据指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数 据集合,是需要新处理模式才能具有更强的决策力、桐察发现力和流程优化能力来适应海 量、高增长率和多样化的信息资产。对大量消费者提供产品或服务的企业可W利用大数据 进行精准营销,做小而美模式的中长尾企业可W利用大数据做服务转型,面临互联网压力 之下必须转型的传统企业需要与时俱进充分利用大数据的价值。现有技术中,关于技术信 息、客户信息、品牌信息、W及一切与人的属性或行为有关的信息的处理均采用人工处理的 方式,决策者进行数据梳理和判断时需要花费较大的时间,容易出错。
[0003] 依托大数据对某一个行为或者一个对象的优劣度分析和决策过程中,数据的处 理、数据与数据之间的关系模型的合理性将直接影响到分析的结果,如何对获取到的数据 进行处理并发现各数据之间的逻辑关系也是现有技术中无法解决的问题。

【发明内容】

[0004] 为克服现有技术中存在的针对品牌特性缺少定量化分析的问题,本发明提供了一 种基于大数据的信息定量分析系统。
[0005] -种基于大数据的信息定量分析系统,包括指标数据分析计算模块,对数据获取 的数据进行组合线型处理得到对应的指标数据;信息总量分析计算模块,将指标数据分析 计算模块得到的数据进行分析和调整运算得到信息总量;比值分析计算模块,用于对得到 的信息总量和信息基本量W及输入的信息延伸量通过相应的比值计算得到信息质量比值; 信息均值比计算模块,用于根据指标数据分析计算模块得到的指标数据进行分析计算信息 均值比;信息稳定性分析计算模块,用于对信息的衰减系数、稳定性指数、时效性指数和有 效期的计算。
[0006] 进一步的,还包括参比数据库,用于存储信息总量参比数据、信息质量比值参比数 据、信息均值比参比数据和稳定性指数参比数据,所述信息总量参比数据、信息质量比值参 比数据、信息均值比参比数据和稳定性指数参比数据分别通过独立的存储单元进行存储形 成数据库。
[0007] 进一步的,还包括输出模块,用于输出信息总量分析计算模块、比值分析计算模 块、信息均值比计算模块和信息稳定性分析计算模块的分析计算结果;将信息总量分析计 算模块、比值分析计算模块、信息均值比计算模块和信息稳定性分析计算模块的分析计算 结果与参比数据库内的数据进行比对,并输出参比数据库内各个参比数据的区间名称。
[000引进一步的,所述输出模块包括比对单元、结果匹配数据库和输出单元,所述比对单 元用于将信息总量分析计算模块、比值分析计算模块、信息均值比计算模块和信息稳定性 分析计算模块的分析计算结果与参比数据库内的数据进行比对,并将比对的结果与结果匹 配数据库内的数据进行匹配;所述结果匹配数据库和输出单元用于存放与比对结果相匹配 的结果数据;所述输出单元用于输出比对单元的比对结果。
[0009] 进一步的,还包括数据获取模块,用于获取有效信息的数据;数据输入模块,用于 输入相关的行为或者对象的信息数据;数据获取模块和数据输入模块获取的数据输出到指 标数据分析计算模块。
[0010] 进一步的,所述数据获取模块包括还一结构化分析模块,将参数获取模块的数据 结果进行结构化分析。
[0011] 进一步的,所述指标数据包括:与某一个行为或者对象有关的总人数,普通群体完 全知道该行为或者对象所要传播的信息量的极值,该行为或者对象当前平均认知度。
[0012] 进一步的,普通群体完全知道该行为或者对象所要传播的信息量的极值依据该行 为或者对象的备选、替代的行为或者对象的数量而确定。
[0013] 进一步的,所述指标数据包括:多个目标范围内与某一个行为或者对象有关的总 人数,多个目标范围内普通群体完全知道该行为或者对象所要传播的信息量的极值,多个 目标范围内的该行为或者对象当前平均认知度。
[0014] 进一步的,所述信息总量计算模块在计算信息总量之前,先对指标数据中的平均 认知度、评价程度和调整系数指数函数中的底数进行运算得到比例因子,用于调整计算结 果;所述评价程度为正面评价程度与加权的负面评价程度之和。
[0015] 与现有技术相比,本发明的有益效果是:
[0016] 本发明能够基于网络或者获取某一行为或者对象的与人的决策有关的数据,其通 过对数据进行科学的处理,并将有关的指标进行定量的数值量化,通过建立参比数据库将 信息总量、信息质量比值、信息均值比和稳定性指数进行划分区间,并通过将区间的名称与 预先设置的匹配结果进行匹配,输出直观的信息分析结果,便于理解信息数据,从而利于决 策,避免对信息数据理解错误导致财产损失。
【附图说明】
[0017] 图1是本发明的结构示意图。
【具体实施方式】
[0018] W下结合附图和实施例,对本发明进行进一步详细说明。应当理解,此处所描述的 具体实施例仅用W解释本发明,并不用于限定本发明。
[0019] 如图1所示,本【具体实施方式】披露了一种基于大数据的信息定量分析系统,所述大 数据的内容可W是技术信息、客户信息、品牌信息、W及一切与人的属性或行为有关的信 息,运些数据可W是结构化的或者非结构化的。所述系统包括:
[0020] 数据获取模块,用于获取有效信息的数据;优选的,其用于获取网络数据库中的关 于的数据,通过互联网将系统与网络上的数据库进行连接,从而获取关于信息的数据。其 中,网络数据库是通过对网络用户发起问卷调查和对指定区域的信息收集而生成的数据 库。更进一步,所述数据源可W是非结构化数据。所述数据可W是分布在网络上的跟某一技 术主题有关的技术信息,例如"3D打印",也可W是跟某一对象有关的数据,例如跟某一品牌 有关的数据,也可W是跟人的行为有关的数据,例如,乘坐公共交通工具有关的数据。
[0021 ]优选的,所述数据获取模块包括W下组成部分:
[0022] -参数获取模块,用于获取数据的指标及其数值范围,所述范围可W是一个时间 段,例如早上八点到十点;一个具体的地区,例如北京市;一个特定的人群,例如学生;或者 一个具体的行为,例如上车刷卡;或者一个具体的对象,例如一个或者几个品牌、一个或者 几个企业。非限制性地,参数获取模块连接至移动互联网和/或因特网等网络,接收来自于 网络的数据。例如,数据获取模块可连接到一具有调查反馈功能的在线网站,访问者通过该 网站提交或者留下数据信息。例如,当需要获取于某一对象有关的人数统计时,例如需要获 取某一时间段通过地铁进站口刷卡的人数、或者需要获取某一时间段在办公室登录电脑的 特定人群、或者需要获取对某一家或者几家企业知晓的人数、对某一学校口碑的反馈、W及 对某几个商标知晓的人数等等。该网站对受访者人数、受访者的反馈结果进行统计后发送 至参数获取模块;另一方面,可选地,该网站可直接将受访者的反馈结果发送至参数获取模 块,由参数获取模块进行访问人数的统计。此外,本领域的技术人员应当理解,所述网站的 数量可W不止一个,同一网站所提供的数据的内容也可W不止一个,也就是说,参数获取模 块可W与多个在线网站通过有线或无线的方式相连接,获取多个在线网站的反馈信息。优 选的,对于调查某一行为或者对象而言,所述信息的数据包括指定区域内的人口总数、对该 行为或者对象知晓的人数、访问人数、与该类似行为或者对象有关的其他行为或对象的数 量、愿意作出该行为或者选择该对象的人数和不愿意作出该行为或者选择该对象的人数 等。例如,调查获取的对象可W是选择高速铁路出行、到某企业就职、对某一个学校知名度 的调查、对某一品牌知名度的调查等。
[0023] -数据输入模块,用于输入相关的行为或者对象的信息数据;优选的,数据获取模 块还可W设置输入单元,通过人工输入的方式录入数据,可W通过键盘输入、语音输入等方 式实现。一结构化分析模块,将参数获取模块的数据结果进行结构化分析。因为参数获取模 块获取的数据可能不具有结构化特点,而要进行定量分析的前提是数据结构化,因此结构 化分析模块对参数获取模块所提供的数据进行结构化。例如参数获取模块可能是基于摸一 个关键词、一份调查问卷、一段采访内容进行捜集获取,其所反馈的可能是一段文字、一段 文字和图片、一个没有表头的表格、一份调查问卷中的简要回答等。结构化分析模块首先建 立一个结构化的表格,而后对参数获取模块的数据进行关键词抽取或者特定字符、字符串 的匹配、简短语义的匹配,将抽取的结果或者匹配的结果插入到结构化表格中。另一方面, 结构化分析模块也对参数获取模块的数据进行统计,将统计的结果插入到结构化表格中。 例如,该结构化表格可W包括但不限于:访问某一网站的人数、时间段、倾向性意见等等。
[0024] 在取得了必要的信息数据之后,通过计算机将获取的数据进行相应的组合线型处 理得到相应的指标数据,所述指标数据包括但不限于:与某一个行为或者对象有关的总人 数,例如乘坐高速列车的群体数量、使用3的T印技术的客户数量、某一个著名品牌消费者人 群总数等;该行为或者对象的知晓程度,例如对高速列车了解程度、对3D打印设备性能了解 的程度、对某一品牌知名度等;普通群体完全知道该行为或者对象所要传播的信息量的极 值,例如普通乘客对高铁完全了解所需要传播的最大信息量、对普通技术人员3D打印完全 技术了解所要传播的信息量的极值、某一个地区的家长要完全了解某一个学校所要传播的 最大信息量、普通消费者对某一个品牌认知所要传播的信息量的极值;该行为或者对象当 前平均认知度,例如当前对高速列车的平均认知度、对3D打印技术的平均认知度、对某一个 学校的平均认知度、对某一个企业或者品牌的平均认知度。
[0025] 具体的,其中对于某一行为或者对象的人群总数即W地域为划分的当地人口总 数,即步骤一中指定区域内的人口总数。
[0026] 优选地,在利用大数据进行分析某一行为或者对象时,可W定义对该行为或对象 的知名度,知名度意指受众对某一行为或者对象知晓程度的度量指标,即有多少知晓该行 为或对象。在分析计算时,知名度可W采用知晓该行为或者对象的人数与总人数的比值。
[0027] 优选的,在求解上述极值Z值之前,还需要确定目标人群的总数,W及目标人群的 结构。按照目标人群的结构进行分层取样,并按照其结构的比例安排调研的样本。此外,普 通群体完全知道该行为或者对象所要传播的信息量的极值Z可W依据该行为或者对象的备 选、替代的行为或者对象的数量而确定,例如可W根据普通群体选择其备选、替代的行为或 者对象概率发生时的信息公式而定。例如普通乘客对高铁完全了解所需要传播的最大信息 量可W由普通乘客对其他交通工具的种类数量而定、对普通技术人员3D打印完全技术了解 所要传播的信息量的极值可W根据现有的型材成型工艺的规模数量而定、某一个地区的家 长要完全了解某一个学校所要传播的最大信息量可W根据该地区内其他同性质的学校的 数量确定、普通消费者对某一个品牌认知所要传播的信息量的极值可W依据行业内的备选 品牌数目等概率发生时的信息公式而定。可W认为普通群体完全知道该行为或者对象所要 传播的信息量的极值Z是认知度达到100%时的信息量。
[00%]正如前文所述,对于交通工具而言,存在高铁、飞机、汽车等多种选择,对于3D打印 技术而言同样也存在其替代的技术,对于某一个学校、某一个品牌而言,在其所在的区域或 者行业也存在其他的竞争性的学校或者品牌。也就是说,在一个特定的环境中,某一个行为 或者对象存在至少一种或者多种备选或者替代的行为或者对象。经验表明,每个普通群体 的对某一个行为或者对象认知度能够到达的最大值都是一个确定的值。一个普通群体完全 知道一个技术、一个学校、一种新的出行方式、一个品牌所要传播的信息量,或者说一个消 费者在一个具体的环境中,对其中一个行为或者对象掌握的所有信息的量是个确定的值, 它依据其备选或者替代的行为或者对象的数量而定。
[0029] 可W认为,某一个行为或者对象认知度能够到达的最大值是依据"在备选对象或 者行为发生概率相等时该对象或行为信息量最大"的原则下,根据该行为或者对象所处的 环境中的总体行为或者对象数目而确定的值。
[0030] 本发明中,普通群体中的个体完全知道某一行为或者对象所要传播的信息量的极 值通过如下技术公式计算得到:
[0031]
[0032] 式中,P(Xi)为某一个体对第i个行为或者对象选择的概率,n为一个特定环境中的 该行为或对象的个数。
[0033] 此外,对某个行为或者对象平均认知度是通过将一个普通个体完全知道一个该行 为或者对象所要传播的信息量的极值与1的差值进行等分得到的。在一定知名度的情况下, 每个个体知晓该行为或者对象的样本其信息量为1时,每个个体对该行为或者对象的认知 程度有差异。Rmax是满信息的情况,一个普通个体对该行为或者对象的所有信息都掌握,满 信息对该个体来说就是100%有效到达。Rmax到I就是认知深度,将Rmax-I等分用来表示其中 任一普通个体达到的有效认知程度,称为某一个体达到任意一个程度,表示为r = Xir%,并 由此可W得到一个平均认知度的值。
[0034] 此外,对某一行为或者对象可进一步分析其评价桿)^?.^^1;1通过一设置的评价 程度计算模块实现。通过设置在内部的如下公式计算得到: 式中,Ol为评价程 度,X为发生的真实采用或接受行为或者对象的普通群体样本中,采纳或者接受该行为或对 象时与特定的行为提供者无关的个体数目;例如,对于选择高速列车出行的行为进行分析 时,X表示作出该选择时不考虑特定的列车车型的个体数量,在对3D打印技术的选择行为进 行分析时,X表示选择3D打印技术时不考虑特定的成型工艺(例如激光烧结、电子束烧结)的 个体数量,在分析是否选择学校就读时,X表示不考虑该学校的名称的个体数量,同样,在分 析某一品牌的选择时,X表示作出该选择时与具体厂家无关的个体数量。Sx为发生的真实采 用或接受行为或者对象的普通群体样本的总数量;y为拒绝该行为或者对象的普通群体样 本中,原因是与该行为或者对象直接有关的选项的消个体人数;例如,对于选择高速列车出 行的行为进行分析时,X表示对高速列车本身不接纳的个体数量,在对3D打印技术的选择行 为进行分析时,X表示对3D打印技术时不考虑的个体数量,在分析是否选择学校就读时,X表 示因某一个学校本身而拒绝的个体数量,同样,在分析某一品牌的选择时,X表示因品牌原 因拒绝的个体数量。Sy为选择该行为或者对象的替代行为或者对象的个体数量;例如,对于 选择高速列车出行的行为进行分析时,y表示选择飞机、汽车等其他出行方式的个体数量, 在对3D打印技术的选择行为进行分析时,y表示选择现有的成型工艺的个体数量,在分析是 否选择某一学校就读时,y表示选择其他学校的个体数量,同样,在分析某一品牌的选择时, y表示同业竞争者品牌商品的消费者样本的消费者数目;n为变频系数。
[0035] 上述评价程度是普通群体对一个行为或者对象的好感度。上述信息可W通过对非 结构化数据中的关键词和主题进行抓取和分析得到,也可W通过简单的调研获取,然后汇 总并求出平均数,是个百分比表达的度的指标。
[0036] 科学统计表明,即使是再成熟的技术、再便捷的新科技、口碑再好的学校、医院、企 业、品牌、或者某一个公众人物,也会有反感的人。也就是说,对一个行为或者对象并不能存 在100 %接受的现象,评价程度有好有坏。
[0037] 本发明进一步将对行为或对象的评价程度分为正面评价程度、负面评价浩底。有 关正面评价程度的分析方法为
式中,有关负面评价程度的分析方法巧
[0038] 因此,关于某一行为或者对象的评价程度的度量是将正负评价程度合计,而且负 评价程度对普通个体的影响更大,因此,在合计的算式中需要对债评价浩底巧行加权,并且 使用变频系数进行处理,最终评价程度通过如下计算公式得到
[0039] 变频系数Tl是普通个体对该行为或者对象所在的特定环境的关注度(例如行业关 注度)和媒体对其的关注度有关的系数,该变频系数可W依赖于更大规模的数据进行计算 得到,例如在分析对高速列车出行时,普通群体不限于经常出行的人群,而是可W将几乎不 出行的群体也纳入进来;在分析3D打印时可W将整个装备制造领域的企业纳入进来,在分 析学校或者品牌时,可W将能接触到更大地区的学校或者整个行业的品牌的群体也纳入进 来。在具体计算式,可W将关注度从O至9分为10个等级,同样将媒体对其的关注度的关注度 划分为10个等级,用1 X 2矩阵来表示,如:(1,2),表示消费者对该品牌所在行业的关注度等 级为1,媒体对企业的关注度等级为2;根据矩阵位置,即可建立相应的映射关系,通过该矩 阵而获得相应的变频系数。本领域的技术人员应当理解,所述变频系数的具体计算方式可 W有多样性,本发明中所提到的普通个体对该行为或者对象所在的特定环境的关注度(例 如行业关注度)和媒体对其的关注度是可W量化的,期间之间的映射关系也是可W根据具 体情况设定的,本发明不限于具体的映射方式和数据,例如变频系数n可W取值1、2、 3、……,也可W是分数形式或者其他无理数。
[0040] 此外,上述特定环境的平均评价程度通过如下公式计算得离
式中,Q为普 通群体中的一类个体的数量,运类个体受其他个体的影响进行选择,也就是说该个体是由 于收到他人的影响而做出的决策;Sz为作出过该行为或者选择过该对象的消费者总数。例 如在分析对高速列车出行时,Q为因受其他人影响而选择坐高铁的人数,Sz为已经乘坐过高 铁的人数;在分析3D打印时,Q为因受其他人口碑影响而选择3D打印技术的人数,Sz为已经 使用过3D打印的人数,在分析学校或者品牌时,Q为因受其他人的评价影响而选择该学校或 者该品牌的人数,Sz为已经在该学校就读或者选择了该品牌的人数。
[0041] 指标数据分析计算模块,用于将从数据获取模块和数据输入模块获取的数据进行 组合线型处理得到对应的指标数据;该模块内存储有各个指标数据的计算公式和计算代 码,通过计算代码将获取或输入的数据带入公式计算得到指标数据,所述指标数据包括普 通群体的人数(也可W是使用某一个app的人数,或者接受调查反馈的人数)、某一行为或者 对象的知名度、一个普通群体中的个体完全知道某一行为或者对象所要传播的信息量的极 值、平均认知度、由知名度而来的基本信息量、评价程度、一个特定环境的平均评价程度和 调整系数指数函数中的底数。得到的指标数据用于计算该行为或者对象的信息总量。
[0042] 信息总量分析计算模块,用于将指标数据分析计算模块得到的数据进行分析和调 整运算得到信息总量;该模块在计算信息总量之前,首先对指标数据中的平均认知度、评价 程度和调整系数指数函数中的底数进行运算得到比例因子,用于调整计算结果。
[0043] 某一行为或者对象的信息是对该某一行为或者对象事实的不确定性的消除;其信 息量就是对运种不确定性的消除程度的度量。
[0044] 将调整系数指数函数中的底数为底数,评价程度与一特定环境平均评价程度的差 值与该平均评价程度的比值作为指数进行指数运算得到比例因子;将信息基本量与比例因 子进行调整运算得到信息总量;信息总量通过如下计算公式计算得到:
[0045]
[0046] 式中,S为特定群体人群总数;Z为某一行为或者对象的知名度;Rmax-个普通群体 中的个体完全知道某一行为或者对象所要传播的信息量的极值;r为某一行为或者对象的 平均认知度;m为由知名度而来的某一行为或者对象的基本信息量;a为评价程度;&为一特 定环境的平均评价度;化为调整系数指数函数中的底数。
[0047] 比值分析计算模块,用于对得到的信息总量和信息基本量W及输入的信息延伸量 通过相应的比值计算得到信息质量比值。具体的,通过对得到的信息总量和信息基本量W 及输入的信息延伸量通过相应的比值计算得到信息质量比值;采用如下公式计算信息基本 量:J=[SXZ+(Rmax-DXrXmXs];式中,J为某一行为或者对象的信息基本量;S为普通群 体人群总数;Z为某一行为或者对象的知名度;Rmax-个普通群体中的个体完全知道某一行 为或者对象所要传播的信息量的极值;r为某一行为或者对象的平均认知度;m为由知名度 而来的某一行为或者对象的基本信息量,其中m即由知名度而来的某一行为或者对象的基 本信息量为目标人群总数与某一行为或者对象的知名度的乘积。
[0048] 某一行为或者对象的信息是对该某一行为或者对象事实的不确定性的消除;其信 息量就是对运种不确定性的消除程度的度量。
[0049] 将调整系数指数函数中的底数为底数,评价程度与一特定环境平均评价程度的差 值与该平均评价程度的比值作为指数进行指数运算得到比例因子;将信息基本量与信息总 量计算模块计算得到的信息总量的比值作为信息基本量的贡献率。
[0050] 优选的,品牌信息基本量的贡献率通过如下计算公式计算得到:
式 中0表示信息的基本量的贡献率;J表示信息基本量;所述化表示信息总量。信息基本量贡献 率是信息基本量和总的信息量的比值。该值越小表示基本量在整个行为或对象信息作用中 所占比重越小,该行为或对象的外界依赖性越小。
[0051] 将信息延伸增量与信息总量的比值作为信息延伸增量的贡献率。优选的,其中信 息延伸增量采用输入的方法输入到计算机系统中,信息延伸量的贡献率通过如下计算公式 计算得到:
[0052] 信息延伸增量贡献率=(信息延伸增量/总信息量)*100%。
[0053] 延伸是指将某一行为或对象扩展到不同的行为或对象上。例如,对于高速列车出 行分析而言,其延伸可W是将高铁与其他的交通工具换乘对接;对于3D打印技术而言,其延 伸可W是用于建筑物的应用;对于学校而言,延伸指的是可W提供低一级别或者高一级别 的教学;对于品牌而言,可W是将该品牌应用于其他产品上。
[0054] 将信息总量与信息基本量和信息延伸增量的差值与信息总量的比值作为信息质 的贡献率。优选的,信息质的贡献率通过如下计算公式计算得到:
[0055] 信息质贡献率=(总信息量-信息基本量-信息延伸增量)/(总信息量)* 100 %
[0056] 信息质的贡献率,意指该行为或者对象通过评价程度获得的其质量在信息总量中 所占的比值。
[0057] 将信息质的贡献率与品牌信息基本量的贡献率和信息延伸量的贡献率的和进行 比值计算得到信息质量比;信息质量比值通过如下计算公式计算得到:
[005引信息质量比=信息质的贡献率/(信息基本量的贡献率+信息延伸增量的贡献率)。
[0059] 信息质量比值反映的是某一个行为或者对象通过评价程度获得的其质量比重占 总的行为或对象质量的比例,其反映出一个行为或对象的真实质量情况。
[0060] 信息均值比计算模块,用于根据指标数据分析计算模块得到的指标数据进行分析 计算信息均值比。优选的,用于此模块的信息计算数据的获取W各个不同的范围进行划分, 包括较大范围的总的数据,也包括较小的指定范围的小范围数据。例如全国范围的数据和 某一指定人群或者的地区的数据。其分别用于计算全国范围的信息总量和信息平均值,W 及指定人群或地区的信息总量和信息平均值。特别的,指定地区的信息总量和信息平均值 用于和全国范围的信息总量和信息平均值进行比较判断该地区范围的信息是否具有地域 特质。在本发明的另一可行的【具体实施方式】中,对于某个指定人群的信息总量和信息平均 值与全国范围的信息总量和信息平均值进行比较判断则能够判断该信息是否具有某个人 群的倾向特质。例如,对乘坐出租车的人群的信息统计分析中,通过对青年人乘坐出租车的 信息总量和信息平均值与全国人乘坐出租车的信息总量与信息平均值进行比较,前者的信 息平均值远远大于后者,则可说乘坐出租车的人群分布具有青年人偏向特质。
[0061] 通过信息总量计算模块计算出小范围信息总量和大范围的信息总量,优选的,信 息均值比计算模块还包括一平均信息量计算模块。通过信息总量计算模块计算得到的小范 围信息总量和大范围的信息总量,进行计算小范围和大范围的信息量平均值。
[0062] 平均信息量计算模块,用于计算指定范围的信息总量的平均值;其中包括多个组 成单元,分别用于计算各个不同范围的信息总量的平均值。具体的,各个范围的信息总量与 该范围的样本数的比值作为该范围的信息总量的平均值。可行的,其可W是某一地区或某 一群体内的信息总量与该地区或群体的人数的比值。
[0063] 由于信息总量的平均值计算与同一个模块内进行,而其包括多个范围的数据计 算,为提高可行性,可行的,在本发明的一个【具体实施方式】中,通过设置一数据存放模块,用 于临时存放各个范围的信息总量的平均值。存放的数据可用于信息均值比计算或者直接用 于判断比较。
[0064] 在本发明的另一具体实施例中,还可W通过一数据处理判断模块对信息的特质进 行比较判断,具体是将小范围的信息总量的平均值与大范围的信息总量的平均值进行比 较,若小范围的信息总量的平均值大于大范围的信息总量的平均值一定的倍数则判断该信 息具有该小范围的特质。其中,该小范围可W是一个区域或者一个群体。特别的,当该小范 围是一个区域时,则判断该信息具有该区域的地域特质。此外,信息特质的判断还可W通过 信息均值比计算模块进行计算出一个定量的数值与信息均值比参比数据库内的信息均值 比参比数据进行比较,并得出其特质。优选的,信息均值比参比数据被分成若干个区间,当 计算得到的信息均值比落在某一个区间内时,则该信息具有该区间的特质。优选的,将小范 围的信息总量平均值与大范围的信息总量的平均值的比值作为该信息的均值比。
[0065] 信息稳定性分析计算模块,用于对信息的衰减系数、稳定性指数、时效性指数和有 效期的计算。可行的,在本发明的的一个【具体实施方式】中,所述信息稳定性分析计算模块包 括衰减系数计算单元、稳定性指数计算单元、时效性指数计算单元和有效期计算单元。
[0066] 所述衰减系数计算单元根据如前所述的评价程度计算模块的计算结果进行分析 计算衰减系数。优选的,在信息稳定性计算模块进行分析计算之前,需要在指标数据计算模 块中对多溢信息重复率进行计算,其中多溢信息重复率是某一行为或者对象对已某一事物 的关注重复度往往受到其他同领域的行为或者对象的影响,所述同一领域的全部事物在同 一行为或者对象上重复的平均时间间隔与该事物在同一行为或者对象上重复的时间间隔 的比值作为该事物的多溢信息重复率。多溢信息重复率反映了其在同领域内的相对性的特 征。优选的,在本发明的一个具体实施例中通过来表示多溢信息重复率。
[0067] 衰减系数计算单元,用于计算信息的衰减系数,可行的,在本发明的一个具体实施 方式中可通过如下计算公式计算得到
[0068] 其中,式中,r为衰减系数;化为调整参数,调整参数的数值由同领域的竞争状况 决定,具体的可通过查阅调研得到的数据表获得;^为多溢信息重复率;^+9^为评价程 度。
[0069] 衰减系数是某一行业、某一事物或者某个人物对用户的影响力,而评价程度和多 溢信息重复率则是评价其影响力的两个重要因素,并且成反比关系。因此将多溢信息重复 率与评价程度的比值作为衰减系数。
[0070] 稳定性指数计算单元,W2为底数,衰减系数计算单元计算得到的衰减系数为指数 进行运算,并进行去整扩大相应的倍数得到稳定性指数。其中,扩大倍数根据不同的行业、 事物或者人物采用不同的标准,处于同一领域的采用相同的倍数。
[0071] 优选的,在本发明的另一【具体实施方式】中,在进行稳定性分析的同时,评价程度分 析模块还应当包含一偏向度分析计算模块,用于对信息偏向度的分析计算。评价程度的偏 向度是指用户在决策中,多次表现出来对某个行为或者事物或者人物有偏向性的(而非随 意的)行为反应。它是一种行为过程,也是一种屯、理(决策和评估)过程。在本具体实施例中, 评价程度的偏向度通过偏向度测量模型分析计算得到。偏向度测量模型系统由态度、价值 及领导地位、体现价值及差别化、沟通及行为五大类十个变量所构成。在对具体的偏向度测 量模型进行测量时,此测量模型系统中的变量可作为一个备选变量,选择其中一些适当变 量,并赋予其一定的权重。即通过对各个因素按照权重进行比例分配,加权求和得到最终的 偏向度。
[0072] 时效性指数计算单元,用于根据信息的衰减系数与偏向度的差值进行指数运算得 到时效性指数。优选的,时效性指数通过如下计算公式得到:
[0073]
[0074] 式中,T为时效性指数;r为衰减系数;L为偏向度;t为信息的有效期。同样的,时 效性指数也可W通过稳定性输出模块进行输出,用户根据时效性指数的大小能够直观的看 出分析的信息与同领域的其他信息的相对差异,时效性指数越大,其相对影响力越大,时效 性指数越小,相对影响力越小,与同领域平均水平差的越多。
[0075] 根据时效性指数计算单元计算得到的结果,还能够计算出信息的有效期。可行的, 在本发明的另一个具体实施例中,根据时效性指数的对数值与信息的衰减系数与偏向度的 差值的对数值进行线性计算得到有效期。具体通过如下计算公式计算得到,
[0076] 式中,t为有效期;r为时效性指数;r为衰减系数;L为偏向度。与时效性指数相类 似,有效期同样反映信息在同领域内的相对影响力,用户通过有效期值的大小能够直观的 判断信息的相对影响力的大小,有效期长则该信息的相对影响力较大,若有效期较短则相 对影响力较小。
[0077] 参比数据库,用于存储信息总量参比数据、信息质量比值参比数据、信息均值比参 比数据和稳定性指数参比数据,所述信息总量参比数据、信息质量比值参比数据、信息均值 比参比数据和稳定性指数参比数据分别通过独立的存储单元进行存储形成数据库。优选 的,参比数据库内的数据根据信息总量分析计算模块、比值分析计算模块、信息均值比计算 模块和信息稳定性分析计算模块的分析计算结果进行划分区间,每个独立的存储单元内的 数据库的划分区间均建立独立的映射标签用于区分,当各个模块的计算结果在相应的区间 内时,所对应的计算结果与相对应的区间的映射标签之间建立映射关系。其中,信息总量分 析计算模块输出的是信息总量,比值分析计算模块输出的信息质量比值,信息均值比计算 模块输出的是信息均值比,稳定性分析计算模块输出的是衰减系数、稳定性指数、时效性指 数和有效期,参比数据库内的参比数据及稳定性指数参比数据,并且稳定性指数与对应的 映射标签之间建立映射关系。
[007引输出模块,用于输出信息总量分析计算模块、比值分析计算模块、信息均值比计算 模块和信息稳定性分析计算模块的分析计算结果;将信息总量分析计算模块、比值分析计 算模块、信息均值比计算模块和信息稳定性分析计算模块的分析计算结果与参比数据库内 的数据进行比对,并输出参比数据库内各个参比数据的区间名称,输出模块获取的参比数 据的名称还包括对应的参比数据区间的映射标签。优选的,所述输出模块包括比对单元、结 果匹配数据库和输出单元,所述比对单元用于将信息总量分析计算模块、比值分析计算模 块、信息均值比计算模块和信息稳定性分析计算模块的分析计算结果与参比数据库内的数 据进行比对,并将比对的结果与结果匹配数据库内的数据进行匹配。优选的,通过将每个计 算结果对应的映射标签匹配结果,并且每个映射标签与计算结果之间存在对应的映射关 系。从而在输出结果的时候避免结果与数据发生错乱。所述结果匹配数据库和输出单元用 于存放与比对结果相匹配的结果数据,优选的,所述结果匹配数据库包括各个独立的存储 单元内的数据库的数据区间的组合结果,通过映射关系进行匹配,由输出单元进行输出供 决策者查看。所述输出单元用于输出比对单元的比对结果,并将据信息总量分析计算模块、 比值分析计算模块、信息均值比计算模块和信息稳定性分析计算模块分析计算结果的值进 行输出。可行的,在本发明的一个【具体实施方式】中,通过一液晶显示器将输出单元输出的结 果进行显示。
[0079]上述说明示出并描述了本发明的优选实施例,如前所述,应当理解本发明并非局 限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和 环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改 动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附 权利要求的保护范围内。
【主权项】
1. 一种基于大数据的信息定量分析系统,其特征在于,包括指标数据分析计算模块,对 数据获取的数据进行组合线型处理得到对应的指标数据;信息总量分析计算模块,将指标 数据分析计算模块得到的数据进行分析和调整运算得到信息总量;比值分析计算模块,用 于对得到的信息总量和信息基本量以及输入的信息延伸量通过相应的比值计算得到信息 质量比值;信息均值比计算模块,用于根据指标数据分析计算模块得到的指标数据进行分 析计算信息均值比;信息稳定性分析计算模块,用于对信息的衰减系数、稳定性指数、时效 性指数和有效期的计算。2. 根据权利要求1所述的一种基于大数据的信息定量分析系统,其特征在于,还包括参 比数据库,用于存储信息总量参比数据、信息质量比值参比数据、信息均值比参比数据和稳 定性指数参比数据,所述信息总量参比数据、信息质量比值参比数据、信息均值比参比数据 和稳定性指数参比数据分别通过独立的存储单元进行存储形成数据库。3. 根据权利要求2所述的一种基于大数据的信息定量分析系统,其特征在于,还包括输 出模块,用于输出信息总量分析计算模块、比值分析计算模块、信息均值比计算模块和信息 稳定性分析计算模块的分析计算结果;将信息总量分析计算模块、比值分析计算模块、信息 均值比计算模块和信息稳定性分析计算模块的分析计算结果与参比数据库内的数据进行 比对,并输出参比数据库内各个参比数据的区间名称。4. 根据权利要求3所述的一种基于大数据的信息定量分析系统,其特征在于,所述输出 模块包括比对单元、结果匹配数据库和输出单元,所述比对单元用于将信息总量分析计算 模块、比值分析计算模块、信息均值比计算模块和信息稳定性分析计算模块的分析计算结 果与参比数据库内的数据进行比对,并将比对的结果与结果匹配数据库内的数据进行匹 配;所述结果匹配数据库和输出单元用于存放与比对结果相匹配的结果数据;所述输出单 元用于输出比对单元的比对结果。5. 根据权利要求1所述的一种基于大数据的信息定量分析系统,其特征在于,还包括数 据获取模块,用于获取有效信息的数据;数据输入模块,用于输入相关的行为或者对象的信 息数据;数据获取模块和数据输入模块获取的数据输出到指标数据分析计算模块。6. 根据权利要求5所述的一种基于大数据的信息定量分析系统,其特征在于,所述数据 获取模块包括还一结构化分析模块,将参数获取模块的数据结果进行结构化分析。7. 根据权利要求1所述的一种基于大数据的信息定量分析系统,其特征在于,所述指标 数据包括:与某一个行为或者对象有关的总人数,普通群体完全知道该行为或者对象所要 传播的信息量的极值,该行为或者对象当前平均认知度。8. 根据权利要求7所述的一种基于大数据的信息定量化分析系统,其特征在于,普通群 体完全知道该行为或者对象所要传播的信息量的极值依据该行为或者对象的备选、替代的 行为或者对象的数量而确定。9. 根据权利要求7所述的一种基于大数据的信息定量化分析系统,其特征在于,所述指 标数据包括:多个目标范围内与某一个行为或者对象有关的总人数,多个目标范围内普通 群体完全知道该行为或者对象所要传播的信息量的极值,多个目标范围内的该行为或者对 象当前平均认知度。10. 根据权利要求1所述的一种基于大数据的信息定量化分析系统,其特征在于,所述 信息总量计算模块在计算信息总量之前,先对指标数据中的平均认知度、评价程度和调整
【文档编号】G06Q10/06GK106021622SQ201610564765
【公开日】2016年10月12日
【申请日】2016年7月18日
【发明人】周云
【申请人】周云
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1