一种全球内衣行业数据收集与分析平台及其分析方法与流程

文档序号:11952877阅读:253来源:国知局
本发明属于计算机
技术领域
,涉及一种全球内衣行业数据收集与分析平台及其分析方法。
背景技术
:全球内衣行业大数据指数与分析平台,简称内衣指数平台,其提供的内衣数据涵盖了全国地市以及内衣各个类目的批发和零售方面的数据,通过对这些数据内容的深度挖掘,以专业报告和价格指数的方式帮助政府和企业分析国内外内衣市场行情。对政府而言,该平台提供的内衣行业电商指数可以让省内地区政府及时准确的了解到该区域近期的内衣市场行情,结合当地自身情况,配合企业加强优势行业的竞争力,改善弱势行业的产业结构;对企业而言,该平台提供的企业分析报告和内销指数、景气指数能及时、全面、可观的掌握产品、市场动向,形成最具价值的行业市场商业情报解决方案。让企业能够随时、及时地了解国内的内衣行业状况,开拓新兴市场。不仅如此,该平台还能帮助他们掌握国外市场客户的企业资信情况,正确辨别优质买家,进而建立直接合作。此外,通过该平台还能洞悉产品结构变化,掌握市场最前沿信息,监控行业动态发展;全面监控现有买家的采购忠诚度,及时避免合作危机;全面了解市场供求变化状况,及时调整市场战略;把握全球竞争对手发展状况,随时调整竞争策略。技术实现要素:本发明实施例提供了一种全球内衣行业数据收集与分析平台及其分析方法,平台主要核心业务通过数据采集功能,从内衣行业市场、内衣相关企业或政府方面获取数据,然后通过对数据的清洗、加工处理为分析人员提供分析问题的重要基础。分析人员通过数据分析后为内衣市场相关企业或是投资者提供决策支持,为政府对市场经济进行宏观把控给予帮助。同时通过平台内衣数据资源优势,为社会提供及时有效的价格指数等经济信息,为行业可能的趋势做出前瞻性的预警,成为内衣行业市场经济发展的风向标,其主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析外贸相关的多维数据,做出归纳性的推理,从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息,从中挖掘出潜在的模式,帮助决策者(政府、企业、投资者)调整市场策略,减少风险,做出正确的决策。一种全球内衣行业数据收集与分析平台及其分析方法,包括系统平台,管理平台和应用平台,所述的系统平台主要采用SQLServer2008R2主从数据库用于满足平台的数据存储、快速数据处理,实现主从服务器负载均衡,同时,预设主从服务器同步时间为20分钟,即每隔20分钟主数据库向从数据库同步一次确定数据同步的间隔时间;所述的管理平台包括数据采集模块、清洗转换模块和数据挖掘分析模块,所述的数据采集模块通过政策、行业、企业或其他渠道进行初期信息的收集任务,并通过清洗转换模块对收集到的信息进行加工、去重、分类、缺失项处理将信息储存于主从数据库,后通过数据挖掘分析模块对储存的信息进行分析;所述的应用平台包括综合指数发布模块、分类指数发布模块、指数分析模块、指数报告模块和指数知识模块,所述的综合指数发布模块发布的指数包括内销指数、景气指数、全省指数,其中,内销指数指的是全球内衣网网站内的所有品类综合价格指数,景气指数是用来衡量全球内衣网销售情况景气程度的一个指标,全省指数反映的是全省内衣电子商务行业的价格指数,所述的分类指数发布模块用来发布内衣行业各二级分类的价格指数,以反映一定时期内二级类目价格的变动情况,所述的指数分析报告模块对各指数的涨跌情况进行了分析,所述的指数报告模块从行业各个角度、行业的发展情况进行了深入的解读,所述的指数知识模块解读各指数代表的意义。一种全球内衣行业数据收集与分析方法,包括对预期价格指数的预测,其特征在于:所述的分析方法采用逻辑回归算法与隐马尔可夫的维特比预测算法相结合的LOGISTIC-VITERBI预测技术进行预测分析:(1)使用逻辑回归算法对价格指数的整体变化趋势进行预测;Logistic函数又称为增长函数,其一般的表达式为P=11+exp(-z),-∞<z<+∞]]>Logistic回归模型:令Y服从二项分布,取值为0,1。Y=1的概率为π(Y=1),则m个自变量分别为X1,X2……Xm所对应的Logistic回归模型为π(Y=1)=exp(β0+β1X1+β2X2+...+βmXm)1+exp(β0+β1X1+β2X2+...+βmXm)]]>(2)维特比算法通过动态规划隐马尔可夫模型对价格指数进行具体地预测;首先导入两个变量ψ和δ,定义在时刻t状态为i的所有单个路径重概率最大值为δt(i)=maxi1,i2,...it-1p(it=i,it-1,...,i1,ot,...,o1|λ),i=1,2,...,N]]>由定义可得递推公式为δt+1(i)=max1≤j≤N[δt(j)aji]bi(ot+1),i=1,2,...,N;t=1,2,...,T-1]]>定义在时刻t状态为i的所有单个路径(i1,i2,……,il)中概率最大的路径的第t-1个结点为ψt(i)=argmax1≤j≤N[δt-1(j)aji],i=1,2,...,N]]>(3)综合两种算法和时间序列算法最终确定预测值。所述的分析方法通过链式加权法计算并确定价格指数,其步骤如下:首先,计算相邻年份每个品类商品的平均价格,计算各年价值总和;其次,利用这两个相邻的平均价格之比,计算可比价格变化率;再次,基于基期价格计算的基期产值,乘以此比率,可得到可比价格的次年产值,以此类推可计算基期以后年份的产值;最后,此价格与根据次年价格计算的次年产值之比,即为次年价格平减指数,或价格变动指数。本发明产生的优点是:1、数据安全存储的问题:采用SQLServer2008R2主从数据库进行数据同步,既保证了数据的安全性又提高了数据查询等操作的运行效率。2、价格指数预测问题:采用逻辑回归算法与隐马尔可夫的维特比预测算法相结合的LOGISTIC-VITERBI预测技术对平台中的价格指数进行预测分析。3、价格指数计算问题:主要采用链式加权法进行全球内衣相关价格指数的计算,使价格指数的计算具有连续性和延续性,避免出现不同指标间对比、合并或转换时发生错误的情况。具体实施方式下面对其实施方式进一步的说明。系统平台主要包括建设平台所需要的各种硬件和软件设备等,主要涉及设备及技术层面,是平台建设的基础部分。数据是该平台进行数据分析、指数计算与预测的基础,为了保证本平台数据的完整性以及提高平台运行速度,采用SQLServer2008R2主从数据库进行数据同步。采用同步方案后,为平台提供了三方面的优势:实现了主数据库和从数据库之间负载均衡;提高了系统的可用性,在主数据库宕机后,从数据库转换为主数据库的角色继续工作,不影响系统的正常运行,数据不会丢失;另一方面,在处理数据时对主从服务器进行不同的分工,例如可以在主服务器进行查询分析,在从服务器进行其他操作。通过SQLServer2008R2数据同步功能,可以实现主从服务器负载均衡,将主数据库需要进行的查询操作、更新操作等工作按照一定的同步方案分配给从数据库,使得从数据库起到备份作用的同时,为主数据库分担一部分工作,提供更好、更快的用户体验。本平台考虑了两种同步方案。第一种方案是主数据库主要承担更新、删除、插入的工作,同时进行部分查询的工作;从数据库只需负责数据查询的工作。当查询操作的任务量较大,而主数据库处于空闲状态时,将查询任务切分一部分到主数据库进行处理。此种方案,既实现了主数据库完成数据的增删改操作,主数据库可以实现到从数据库的同步,又可以在空闲时分担从数据库的查询任务,提高用户进行数据查询时的响应速度。第二种方案是主数据库只实现数据的增加、删除、更改系列操作,而不进行数据查询的处理;从数据库只进行查询操作,当主数据库的数据变动后,实时同步到从数据库。这种方案适合于大部分更新操作都是由管理员进行的操作。采用这种方案,从数据库的查询任务较重,可以通过设置多台从数据库解决这个问题,这样主数据库只进行数据的更新操作,多台从数据库负责数据的查询,既保证了数据的安全性,同时也提高了应用程序的响应速度,改善了用户体验。这两种方案都是可行的,并有各自的优势,具体确定使用哪种方案,需要根据本平台的业务需求而定。如果本平台的查询任务压力小,而增加、删除、更新操作相对较少,则使用第一种方案;如果本平台的查询任务较重,可以选择第二种方案。实现主从数据库的负载均衡,关键是确定数据同步的间隔时间。考虑到本平台的业务特点,预设同步时间为20分钟,即每隔20分钟主数据库向从数据库同步一次。根据后期的实际情况,同步时间可以及时调整。管理平台主要对内衣市场的各种数据信息进行采集、加工、处理、储存、分析等,包括对数据的去重、分类、缺失项处理等。平台主要核心业务通过数据采集功能,从内衣行业市场、内衣相关企业或政府方面获取数据,然后通过对数据的清洗、加工处理为分析人员提供分析问题的重要基础。分析人员通过数据分析后为内衣市场相关企业或是投资者提供决策支持,为政府对市场经济进行宏观把控给予帮助。同时通过平台内衣数据资源优势,为社会提供及时有效的价格指数等经济信息,为行业可能的趋势做出前瞻性的预警,成为内衣行业市场经济发展的风向标,其主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析外贸相关的多维数据,做出归纳性的推理,从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息,从中挖掘出潜在的模式,帮助决策者(政府、企业、投资者)调整市场策略,减少风险,做出正确的决策。应用平台主要是面向用户提供的各类功能服务的管理,这些功能模块主要包括内衣行业各子分类指数情况展示、指数分析报告等相关服务。在内衣市场销售预测分析环节,技术路线大体上分为:确定预测目标、收集预测资料、选择预测方法以及评价预测结果。详细对各种分析方法进行对比性研究,具体有:定性预测法、逐步回归预测法、自回归移动平均法、逻辑回归算法与隐马尔可夫的维特比预测等算法。重点从两个方面分析了各预测模型。一方面是针对各预测方法的原理与特点进行研究,得出各个预测方法的优势与劣势;另一方面是对预测结果的比较。结合了各预测模型的精度和时间跨度,得出各种预测方法的适用性,选择适当的预测方法。价格指数作为衡量一定时期内衡量内衣相关商品的价格水平随时间而变动的相对数,反映居民购买商品价格水平的变动情况。本平台主要采用链式加权法进行计算,它是间接的计算价格指数的方法,即先计算实际产出,然后根据实际产出和最终价格计算产出对比计算价格平减指数;它的优点在于考虑了权重的动态变化,所以设置更加科学、不断变化的权重是链式加权法的关键。链式加权法计算价格指数的步骤如下:首先,计算相邻年份每个品类商品的平均价格,计算各年价值总和;其次,利用这两个相邻的平均价格之比,计算可比价格变化率;再次,基于基期价格计算的基期产值,乘以此比率,可得到可比价格的次年产值,以此类推可计算基期以后年份的产值;最后,此价格与根据次年价格计算的次年产值之比,即为次年价格平减指数,或价格变动指数。如果价格指数的商品只有一种,采用链式加权法和直接计算法的指数结果是一样的,链式加权法的优点在于考虑了权重的动态变化,所以设置更加科学、不断变化的权重是链式加权法的关键。(1)根据内衣行业各商品各个月份的平均价格、总销售量和总销售额,采用链式加权法计算价格指数,2015年各月份销售情况如下表:平均价格(元)销售量(个)销售额(元)月份65.45134221692986569.9196.71125272461122333.9263.2435751243402718126.2363.179737849842130041.9475.675111945272898505.3567.315819614871970684672.0272411458053981848.2771.086452774002763498.6896.49752602082816768.5979.549275692992585087.11095.936861846124358956.411117.36268597833854028.312经计算可得,2015年各月份的价格指数分别为85、185、130、115、107、136、117、128、143、117、154和142。(2)维特比算法通过动态规划隐马尔可夫模型对价格指数地变化趋势进行预测;对于价格指数的预测,N=3对应了价格指数上升、不变、下降三个状态,M=4对应了涨价、降价、不变和促销四种价格变化情况,而“涨价、不变、涨价、降价、涨价、涨价”则是一个观测序列,对应状态序列则设为T=6:1、2、1、3、1、1。建立状态转移概率分布A如下所示。0.250.30.450.40.30.30.550.30.15建立观测特征在各个状态的观测概率分布B如下所示。初始化状态概率分布pi为0.50.30.2。采用维特比算法进行预测,得到预测状态序列为1、2、1、3、1、1。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1