基于大数据技术的供应链管理决策支持系统的制作方法

文档序号:14187046阅读:258来源:国知局

本发明涉及信息处理领域,尤其涉及一种基于大数据技术的供应链管理决策支持系统。



背景技术:

现有信息系统(如电子数据交换系统,即edi)被用来实现信息共享,从而促进供应链有效决策的确定。

供应链经理主要依据供应链成员的交易数据和内部系统数据来针对管理、规划和操作任务做出高质量的商业或管理决策。然而,其他来源的有用数据,尤其是诸如推特、博客、新闻、邮件以及脸书的数据并没有作为依据而被分析和参与决策制定。



技术实现要素:

本发明针对诸如推特、博客、新闻、邮件以及脸书的数据并没有作为依据而被分析和参与供应链管理决策制定的问题,提出了一种供应链管理决策支持系统。

本发明提出的技术方案如下:

本发明提出了一种供应链管理决策支持系统,包括:

信息获取模块,用于从大数据源提取数据,并转换其格式,再发送给分析处理模块;

分析处理模块,用于从信息获取模块所发送的数据中搜索有用的信息,并对其集成和分析,从而提供分析结果;

可视化模块,用于显示分析结果;以及

支持模块,包括知识库、纺织品分类法数据库和访问控制子模块;知识库用于为信息获取模块和分析处理模块提供历史数据,以用于完成分析任务;纺织品分类法数据库用于为信息获取模块和分析处理模块提供纺织品分类法,以用于完成分析任务;访问控制子模块用于对登陆供应链管理决策支持系统上的账号进行权限分配。

本发明上述的供应链管理决策支持系统中,所述信息获取模块包括:

内容过滤器,用于滤除大数据源中的噪声数据;

文本预处理单元,用于解析由内容过滤器过滤后的数据,以得到文本;

变址单元,用于在文本中寻找并确定关键词;

命名实体识别单元,用于对文本中的词语按照预定义类别进行定位和分类;

域分类单元,用于将文本按照预定义规则划分到不同领域中;

内容评分单元,用于对文本的与纺织与时尚产业的相关性进行评分。

本发明上述的供应链管理决策支持系统中,变址单元用于通过tf-idf算法计算多个词语在文本中的权重,并取权重最大的预设数量的词语作为关键词。

本发明上述的供应链管理决策支持系统中,所述分析处理模块包括内容挖掘子模块、供应链管理分析引擎和决策支持子模块;

内容挖掘子模块用于处理文本,并从中发现有用的信息;

供应链管理分析引擎用于对由信息获取模块所发送的数据进行分析,从而给出供应链管理分析报告;

决策支持子模块用于存储分别与供应链管理分析报告对应的决策规则和解决方案;还用于对供应链管理分析报告基于对应决策规则给出对应解决方案。

本发明上述的供应链管理决策支持系统中,内容挖掘子模块用于逐句扫描文本的标题和内容,并基于评分方案对文本句子中的情感词语给出对应的基础分数,还对情感词语的前缀词语进行检查,并按照前缀词语对情感词语的改变程度给予不同的加成分数,再计算加成分数与基础分数的乘积,以此记为该句子的分数;还用于将文本中所有句子的分数加合并进行归一化,从而计算得到文本的分数;

内容挖掘子模块还用于将与产品或营销活动相关文本按照文本的分数递减排列;可视化模块用于显示该按照文本的分数递减排列的与产品或营销活动相关文本。

本发明上述的供应链管理决策支持系统中,内容挖掘子模块还用于将文本的分数与预设积极情绪阈值以及预设消极情绪阈值进行比较;若文本的分数大于预设积极情绪阈值时,则文本具有积极情绪;若文本的分数大于预设消极情绪阈值,并小于预设积极情绪阈值,则文本具有中立情绪;若文本的分数小于预设消极情绪阈值,则文本具有消极情绪;

内容挖掘子模块还用于计算与产品或营销活动相关文本的主观性:

其中,s为与产品或营销活动相关文本的主观性;

pa为具有积极情绪的文本的数量;

na为具有消极情绪的文本的数量;

za为具有中立情绪的文本的数量;

可视化模块用于显示所述主观性。

本发明上述的供应链管理决策支持系统中,内容挖掘子模块还用于计算与产品或营销活动相关文本的极性:

其中,p为与产品或营销活动相关文本的极性;

pa为具有积极情绪的文本的数量;

na为具有消极情绪的文本的数量;

可视化模块用于显示所述极性。

本发明的基于大数据技术的供应链管理决策支持系统能够提供以下供应链管理服务:1)供应链管理决策支持系统可基于产品定位分析结果给重新排序服务的时间、重新排序的内容、重新排序的位置以及重新排序的数量提出建议;2)供应链管理决策支持系统可在发现用户极端情绪时,基于客户情绪报告提醒用户采取相应的行动。3)供应链管理决策支持系统还可在成本分析报告显示成本使用没有效率时能够为用户展示哪种成本是没有效率的,如原材料成本高于以前合同的标准;为了找寻节省成本的机会,用户会寻找可能节省成本的途经,从而提高成本使用效率。

附图说明

下面将结合附图及实施例对本发明作进一步说明,附图中:

图1示出了本发明实施例的供应链管理决策支持系统的功能模块示意图;

图2示出了本发明实施例的供应链管理决策支持系统的评分方案的程序代码图;

图3示出了凝聚层次聚类的程序代码图;

图4为图1所示的决策支持子模块所获取的数据分类图;

图5示出了产品需求预测调整的流程图。

具体实施方式

为了使本发明的技术目的、技术方案以及技术效果更为清楚,以便于本领域技术人员理解和实施本发明,下面将结合附图及具体实施例对本发明做进一步详细的说明。

如图1所示,基于大数据技术的供应链管理决策支持系统包括:信息获取模块(用于信息提取、转换和加载)、分析处理模块、支持模块以及可视化模块。

信息获取模块用于从大数据源提取数据,并转换其格式,发送给分析处理模块;大数据源可以包括其他数据库(如erp和pos)、供应链成员以及互联网等。信息获取模块从大数据源中所获取的数据包括结构化数据和非结构化数据。在这里,结构化数据定义为可以用数据库二维逻辑表来逻辑表达实现的数据,如行数据等;而非结构化数据定义为不方便用数据库二维逻辑表来逻辑表达实现的数据,如所有格式的办公文档、文本、图片、标准通用标记语言下的子集xml、html、音频和视屏等。对于结构化数据,信息获取模块可以完成诸如标准化、校验、编码、合并以及拆分等转换过程,从而实现格式的转换。对于非结构化数据,本发明主要聚焦于文本,并且,所获取的文本内容主要采用中文或英文。具体地,信息获取模块包括:

内容过滤器,用于滤除大数据源中的噪声数据。从大数据源中提取出来的数据可能会包含低质量内容,如拼写错误、无法实现的内容(如谣言)以及恶意内容,这些低质量的内容(即噪声数据)需要在被解析之前滤除掉。在本实施例中,通过检查数据源(如检查数据源是否是可信的网站等)、基于其他文本的查重检验以及使用约定俗成的知识和语言学规则可实现滤除噪声数据。

文本预处理单元,用于解析由内容过滤器过滤后的数据,以得到文本;具体地,文本预处理单元会执行清理和解析任务,如停用词的移除、分割、找出词干或者词形还原;文本预处理单元还用于将文本以一种适合分析的结构(如向量空间模型)存储下来。

变址单元,用于在文本中寻找并确定关键词;在本实施例中,变址单元通过词语在文本中的权重来寻找关键词。该权重是通过tf-idf算法计算得到,即

其中,wi,j表示词语i在文本j中的权重;

tfi,j表示词语i在文本j中的词频;

idfi表示词语i的逆文档频率;

n表示文本的总数目;

ni表示具有词语i的文本的数目。

然后,变址单元取权重最大的预设数量的词语作为关键词。

可以理解,变址单元可以将文本j表示为对应的向量有:

其中,为与文本j对应的向量;

win,j表示词语in在文本j中的权重。

这样,非结构化数据就可以转换成结构化数据。

命名实体识别单元,用于对文本中的词语按照预定义类别进行定位和分类;例如,命名实体识别单元可以将词语按照人名、组织名、地理位置名、产品名或产品类别以及情感表达进行归类,并为这些词语标识相应的释文。例如,对于“2015年太阳裙新款已在优衣库有售”这句话,在命名实体识别单元处理后,会变为“2015年[时间]太阳裙[产品类别]新款已在优衣库[公司]有售”。其中,可以看到,时间和公司会被识别出来,而词语“太阳裙”会基于纺织行业分类法以产品类别进行标示。

域分类单元,用于将文本按照预定义规则划分到不同领域中;例如,基于预定义规则,文本会划分到社交媒体(包括微博、脸书以及推特),新闻和电子商务。

内容评分单元,用于对文本的与纺织与时尚产业的相关性进行评分。在这里,评分过程是基于预定义规则来实现的,例如,若文本中具有与纺织相关的关键词,则该文本将被评价较高分数;反之,具有在预定义规则定义的“不想要”的关键词的文本将被评价较低分数。然后,内容评分单元会将文本按照分数高低进行排列,以用于进一步的分析。

分析处理模块,用于从信息获取模块所发送的数据中搜索有用的信息,并对其集成和分析,从而提供分析结果;该分析处理模块包括三个子模块:内容挖掘子模块、供应链管理(即supplychainmanagement)分析引擎和决策支持子模块。

其中,内容挖掘子模块用于挖掘非结构化数据中有用的信息,具体来说,是用于从信息获取模块所发出的数据中确定数据内容、竞争优势和意见。具体地,内容挖掘子模块可用于处理文本,并从中发现有用的信息。

在本实施例中,基于信息获取模块所发送的数据,内容挖掘子模块通过算法可以确定客户情绪、内容群集和竞争优势。

a、客户情绪的确定

情绪分析涉及观点挖掘,并对客户针对诸如产品、服务、组织、个体、问题、活动、话题及其属性的观点、情绪、评价、估价、态度以及情感进行分析。基于情绪分析的结果,供应链管理决策支持系统可以发现产品和服务的满意水平、客户的购买意向、产品的认知度以及在数字世界的营销活动后的影响力等。同时,对于倾向于购买产品的客户,供应链管理决策支持系统也能基于ip地址或客户的社交网站状态来追踪客户的位置。

因为由信息获取模块所发送的文本涉及产品或营销活动,内容挖掘子模块首先会根据评分方案判断文本是否是积极的、中立的或消极的。内容挖掘子模块会逐句扫描文本的标题和内容;如果某一句子包含有关键词(例如,产品或营销活动的名字)和预定义词典的情感词语(不同的情感词语具有不同的分数),那么内容挖掘子模块会基于评分方案给出一个与情感词语对应的基础分数。内容挖掘子模块还可以基于预定义词典对情感词语的前缀词语进行检查,来判断该前缀词语是否对情感词语进行了加强、减弱或改变词意,并按照前缀词语对情感词语的改变程度给予不同的加成分数,并计算加成分数与基础分数的乘积,以此记为该句子的分数。在这里,评分方案的程序如图2所示。

内容挖掘子模块还会将文本中所有句子的分数加合并进行归一化,从而计算得到文本的分数;内容挖掘子模块还用于将与产品或营销活动相关文本按照文本的分数递减排列。优选地,内容挖掘子模块还可以将文本的分数与预设情绪阈值进行比较,从而得到文本所表达的情绪。在本实施例中,若文本的分数大于预设积极情绪阈值时,则文本所表达的情绪是积极的。若文本的分数大于预设消极情绪阈值,并小于预设积极情绪阈值,则文本所表达的情绪是中立的;若文本的分数小于预设消极情绪阈值,则文本所表达的情绪是消极的。

为了获知产品或营销活动能否引起客户的反响或讨论,内容挖掘子模块还用于计算和监控与产品或营销活动相关文本的主观性。在本实施例中,与产品或营销活动相关文本的主观性s为:

其中,s为与产品或营销活动相关文本的主观性;

pa为具有积极情绪的文本的数量;

na为具有消极情绪的文本的数量;

za为具有中立情绪的文本的数量。

如果由信息获取模块所发送的与某一产品或营销活动相关文本中具有较多的情绪或情感内容时,则与该产品或营销活动相关文本的主观性较高,这也就意味着有很多客户就该产品或营销活动表达了观点或情感。

为了对产品或营销活动的情绪分析进行量化,本发明还定义了与产品或营销活动相关文本的极性p:

其中,p为与产品或营销活动相关文本的极性;

pa为具有积极情绪的文本的数量;

na为具有消极情绪的文本的数量;

内容挖掘子模块用于计算与产品或营销活动相关文本的极性p;如果某一产品或营销活动的相关文本的极性越高,则该产品或营销活动会使客户具有更多的积极情绪。

b、客户行为

客户行为通常会被自托管电商基于大数据技术捕捉到。基于大数据技术,内容挖掘子模块能够将所有用户行为合并。例如,如果一个客户经常搜寻和查看一个样式或颜色的产品,那么内容挖掘子模块将认为,该样式或颜色是该客户的最爱。同样地,基于产品的点击率,内容挖掘子模块也能判断客户是否对该产品有兴趣。包括购买总量、购物篮中的未处理项目、一天登陆时间、登陆时长等其他数据也能够被分析来确定客户行为。

c、内容群集

群集技术在没有任何预定义分类的情况下可将相似文本归为一类。文本内容的相似度可以被计算出来,相似的内容将被归为一类。因此,基于近一段时间内文本的内容群集结果,内容挖掘子模块可识别“热门话题”、顶尖时尚、市场趋势以及相关话题/公司/人物。两个文本d1和d2的相似度可通过余弦相似度公式计算得到:

其中,s(d1,d2)为两个文本d1和d2的相似度;

w1k为词语k在文本d1中的权重;

w2k为词语k在文本d2中的权重;

n为两个文本d1和d2所有词语的总数目。

在供应链管理决策支持系统中,我们采用凝聚层次聚类,这是一种自下而上的群集方法。图3示出了凝聚层次聚类的基本算法。在确定了凝聚集和词频后,每个群集的每个词语的权重能够被计算出来。每个群集的所有词语可根据其权重递减方式来分类。群集ci中的话题ti表示权重最高的五个词语,分别为[词语i1,词语i2,词语i3,词语i4,词语i5]。

基于不同目的,群集过程也不同。如检测“热门”话题,被分析的文本应该采用最近一段时间的文本,并且要聚焦于新闻或社交媒体的文本。如要检测顶尖时尚,被分析的文本的时间范围应该要更长一些(例如,一个月),并且,需要分析来自时尚相关新闻和社交媒体的文本。

d、竞争优势

通过电商网站和主要竞争者在线商店,网站上的竞争者信息可以被抓取。通过利用内容挖掘技术,诸如产品分类、产品描述、价格、排名、存货水平、折扣等数据可被获取。因此,供应链管理决策支持系统能够将这些数据和公司数据进行比较,从而获知相比于主要竞争者的竞争优势,如产品价格、免运费、促销活动以及增值服务等。

供应链管理分析引擎用于从工业供应链管理有效性方面和特殊性方面对由信息获取模块所发送的数据进行分析,从而给出供应链管理分析报告;

一般地,供应链管理分析引擎包括5个主要模块:需求计划模块、生产计划和排序模块、分销计划模块、运输计划模块以及企业或供应链分析模块。其中,需求计划模块用于采用统计工具、因果要素和层次分析等手段对由信息获取模块所发送的数据进行分析,从而预测产品的需求。生产计划和排序模块用于分析企业内部和供应商生产设施的物料和能力的约束,并基于需求计划模块所预测的产品的需求,编制产品的生产进度计划。分销计划模块用于基于产品的生产进度计划,制定分销计划,从而保证产品可订货、可盈利以及可使用。运输计划模块用于确定将产品送达客户的最佳途径。企业或供应链分析模块用于显示企业或供应链的图示模型,从而帮助企业从战略功能上对工厂和分销中心进行调整,从而对供应链进行分析,注意和发掘问题。

决策支持子模块用于存储分别与供应链管理分析报告对应的决策规则和解决方案;还用于对供应链管理分析报告基于对应决策规则给出对应解决方案。如图4所示,决策支持子模块还用于从采购因素、生产因素、时间因素、市场因素以及库存因素对供应链管理分析报告的数据进行分析,从而确定产品定位。

采购因素

采购因素的数值由三个因素确定:订货单、采购周期以及采购成本。

产品生产用的所有原材料的订货单必须被评估。订货单的数值通过评估以下三个子因素确定:

1、在途:当原材料库存即将不足时,公司尚未偿付的原材料订货单需要被评估,从而确定原材料在途订货单是否充足以满足生产需要。

2、订货提前期:尚未偿付的原材料订货单的等待时间需要被评估,从而确定订购原材料在预计到达日期是否充足。

3、替代品:当原材料库存或订货单即将出现短缺时,原材料可能的替代品需要被确定。

生产因素

生产因素的数值由三个因素确定:生产能力、生产成本以及生产提前期。生产能力通过评估两个子因素(即人力资源能力、机器能力)确定,以适应生产的增长。

市场因素

市场因素的数值通过以下三个因素确定:需求预测、行业趋势和竞争因素。

需求预测是通过评估以下六个子因素来确定:

1、价格;

2、市场规模;

3、市场占有率;

4、促销作用:即促销的效果(如果有促销的话);

5、客户行为;包括客户对产品提出的具体要求和特点(包括颜色、尺寸和风格)以及产品相对流行的城市或国家。

6、客户情绪;主要是对产品给出积极评价的客户数量;

7、销售业绩;来自b2c平台驱动程序的销售点数据;

竞争因素是通过评估以下三个子因素来确定:

1、竞争优势(诸如产品价格、免运费、促销活动和附加业务);

2、市场占有率;

3、市场规模。

行业趋势是通过以下两个子因素来确定:

1、顶尖时尚:用于确定新产品的可能性;

2、热门话题:由需求预测确定;

库存因素

库存因素的数值由以下四个子因素来确定:仓储能力、仓储成本、库存水平以及到期日。库存水平代表公司目前库存状态;库存水平通过以下两个子因素来确定:工作进度水平和原材料水平。

时间因素

时间因素的数值通过产品生命周期和季节性属性来确定。

支持模块也包括三个子模块,即知识库、纺织品分类法数据库和访问控制子模块,并通过该三个子模块给决策支持子模块提供操作和智力分析提供支持。其中,知识库用于为信息获取模块和分析处理模块提供历史数据,以用于完成分析任务;纺织品分类法数据库用于为信息获取模块和分析处理模块提供纺织品分类法,以用于完成分析任务;访问控制子模块用于对登陆供应链管理决策支持系统上的账号进行权限分配。所述账号包括管理员账号和普通账号,管理员账号和普通账号具有不同的权限,所能访问的信息范围是不同的。在这里,普通账号的权限受到管理员账号的控制。

如图5所示,图5示出了产品需求预测调整的流程图。信息获取模块获取大数据源的数据,内容挖掘子模块从大数据源的数据中挖掘与产品相关的信息,供应链管理分析引擎对与产品相关的信息以及来自供应链成员的交易数据和内部系统数据进行分析,从而给出供应链管理分析报告;决策支持子模块针对供应链管理分析报告给出对应解决方案,从而实现产品需求预测的调整。可视化模块用于显示分析结果,为供应链管理决策提供以下分析报告:

产品分析报告、成本分析报告、渠道关系和能力评估报告、供应链状态报告、客户情绪报告和客户行为报告。

在上述报告中,可视化模块可以显示按照文本的分数递减排列的与产品或营销活动相关文本、与产品或营销活动相关文本的主观性以及极性。

决策实施例

在分析后做出的决策包括为公司(如纺织公司)选择销售策略。如公司会推出新的一系列休闲运动鞋,并采用广告(如电视广告、杂志广告和传单广告)来宣传他们的产品,并持续超过1个月。公司愿意为新产品选择合适的销售策略;这种决策的确定需要聘用一个领域的专家完成。

具体地,专家首先需要收集信息并检测市场因素。部分信息收集过程可采用本发明的供应链管理决策支持系统完成,包括客户意见和要求、新产品相对流行的区域、竞争状况、休闲运动鞋的顶尖时尚性和销售表现。

专家还要检测库存状况。专家会调查库存因素,如原材料水平和仓储能力。专家复核的其他因素包括产品生命周期和季节性属性,这是实现产品预估需求精确性的显著驱动器之一。

专家然后会获得如下结论:新产品需求很高(即,许多客户对新产品满意,促销活动非常成功,最后一个月的销售表现很好),客户最喜爱的颜色和风格分别是红色和风格a,杭州是休闲运动鞋最受欢迎的城市。因此,专家会建议,公司应该增加红色和风格a的休闲运动鞋的库存水平,尤其是杭州的库存水平。

本发明的基于大数据技术的供应链管理决策支持系统能够提供以下供应链管理服务:

1)供应链管理决策支持系统可基于产品定位分析结果给重新排序服务的时间、重新排序的内容、重新排序的位置以及重新排序的数量提出建议;

2)供应链管理决策支持系统可在发现用户极端情绪时,基于客户情绪报告提醒用户采取相应的行动。

3)供应链管理决策支持系统还可在成本分析报告显示成本使用没有效率时能够为用户展示哪种成本是没有效率的,如原材料成本高于以前合同的标准;为了找寻节省成本的机会,用户会寻找可能节省成本的途经,从而提高成本使用效率。

4)供应链管理决策支持系统还可基于渠道关系和能力评估报告给渠道关系改进,渠道成员奖励或移除,寻找怎么样的渠道成员提出建议。

应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1