一种生产销售商品的推荐方法及系统与流程

文档序号:17996706发布日期:2019-06-22 01:17阅读:126来源:国知局
一种生产销售商品的推荐方法及系统与流程

本发明企业生产规划领域,特别涉及一种生产销售商品的推荐方法及系统。



背景技术:

如今信息爆炸的时代信息过载过于严重。如今大部分的推荐算法是根据用户的个性化设计。这些推荐算法根据用户的购买、浏览、收藏等记录,为用户推荐一些还没被该用户购买过的商品。这些推荐算法可以有效提高用户的购买能力和活跃度,因此提升电商平台的竞争力。

目前的推荐算法主要是针对为用户推荐商品,而根据企业和生产商的生产能力而推荐适合生产的商品的推荐算法却很少。

对于企业和生产商而言,在开始生产新的商品时,有非常多的选择,但是具体生产哪些商品会带来哪些经济效应却是未知的。具体销售或生产什么样的商品能够快速提高企业或生产商的竞争力和经济复杂度是每个企业或生产商最关心的问题。

为企业或生产商推荐生产或销售的产品的算法有基于扩散的推荐算法-hybrids算法、最近度增加算法(degreeincrease,id)和时间感知概率扩散算法(time-awareprobabilisticspreading,tprobs)等,但是在真实的贸易场景中,地理位置是一个非常重要的特征。根据不同的地区,甚至出口商品到不同的国家,都需要有不同的策略,要根据当地的地理位置做出一些判断,而这些算法没有考虑到在真实的贸易情况中,所有企业或生产商出售的商品也会考虑地理位置的情况,对于不同的地理位置的国家或城市,企业或生产商应该根据该位置信息制定不同的生产或销售方案,影响了推荐的准确性。因此,提供一种根据地理位置向企业或生产商推荐生产商品的算法非常重要。



技术实现要素:

本发明的目的是提供一种生产销售商品的推荐方法及系统,以实现根据地理位置向企业或生产商推荐生产商品,提高推荐的准确性。

为实现上述目的,本发明提供了如下方案:

一种生产销售商品的推荐方法,所述推荐方法包括如下步骤:

获取目标企业的地理位置;

获取以所述地理位置为中心的预设范围内的所有企业的位置信息,得到位置信息集合,并获取每个企业生产销售的商品信息,得到商品信息集合;所述商品信息包括商品种类、数量和生产时间;

根据所述地理位置、所述位置信息集合及所述商品信息集合,计算目标企业与预设范围内的每个企业的相似度;

根据所述目标企业与预设范围内的每个企业的相似度,计算所述商品信息集合中每种商品的推荐分数;

将推荐分数大于预设阈值的商品设置为推荐商品,推荐给所述目标企业。

可选的,所述根据所述地理位置、所述位置信息集合及所述商品信息集合,计算目标企业与预设范围内的每个企业的相似度,具体包括:

根据所述地理位置、所述位置信息结合及所述商品信息结合,利用公式计算目标企业与预设范围内的每个企业的相似度;

其中,fij表示目标企业i与预设范围内的企业j的相似度;m表示所述商品信息集合中商品的种类数;aiα和ajα分别表示目标企业i和预设范围内的企业j的第α种商品的生产状态;d(i,j)表示目标企业i与预设范围内的企业j的距离;θ表示地理位置信息比重参数;kα表示第α种商品的度,kj表示预设范围内的企业j的度;λ表示可调参数。

可选的,所述根据所述目标企业与预设范围内的每个企业的相似度,计算所述商品信息集合中每种商品的推荐分数,具体包括:

根据所述目标企业与预设范围的每个企业的相似度,利用公式计算商品信息集合中每种商品的推荐分数;

其中,fiβ表示商品β推荐给目标企业i的推荐分数;n表示预设范围内企业的数量;ajβ表示预设范围内的企业j的商品β的生产状态,fij表示目标企业i与预设范围内的企业j的相似度,kj表示预设范围内的企业j的度,kβ表示商品β的度;λ表示可调参数。

可选的,所述获取以所述地理位置为中心的预设范围内的所有企业的位置信息,得到位置信息集合,并获取每个企业生产销售的商品信息,得到商品信息集合,之后还包括:

对所述位置信息集合和所述商品信息集合中的数据进行数据清洗,得到清洗后的位置信息集合和清洗后的商品信息集合;

将清洗后的商品信息集合中的数据转化成预设格式,得到转化后的商品信息集合。

一种生产销售商品的推荐系统,所述推荐系统包括:

地理位置获取模块,用于获取目标企业的地理位置;

位置信息集合和商品信息集合获取模块,用于获取以所述地理位置为中心的预设范围内的所有企业的位置信息,得到位置信息集合,并获取每个企业生产销售的商品信息,得到商品信息集合;所述商品信息包括商品种类、数量和生产时间;

相似度计算模块,用于根据所述地理位置、所述位置信息集合及所述商品信息集合,计算目标企业与预设范围内的每个企业的相似度;

推荐分数计算模块,用于根据所述目标企业与预设范围内的每个企业的相似度,计算所述商品信息集合中每种商品的推荐分数;

推荐模块,用于将推荐分数大于预设阈值的商品设置为推荐商品,推荐给所述目标企业。

可选的,所述相似度计算模块,具体包括:

相似度计算子模块,用于根据所述地理位置、所述位置信息结合及所述商品信息结合,利用公式计算目标企业与预设范围内的每个企业的相似度;

其中,fij表示目标企业i与预设范围内的企业j的相似度;m表示所述商品信息集合中商品的种类数;aiα和ajα分别表示目标企业i和预设范围内的企业j的第α种商品的生产状态;d(i,j)表示目标企业i与预设范围内的企业j的距离;θ表示地理位置信息比重参数;kα表示第α种商品的度,kj表示预设范围内的企业j的度;λ表示可调参数。

可选的,所述推荐分数计算模块,具体包括:

推荐分数计算子模块,用于根据所述目标企业与预设范围的每个企业的相似度,利用公式计算商品信息集合中每种商品的推荐分数;

其中,fiβ表示商品β推荐给目标企业i的推荐分数;n表示预设范围内企业的数量;ajβ表示预设范围内的企业j的商品β的生产状态,fij表示目标企业i与预设范围内的企业j的相似度,kj表示预设范围内的企业j的度,kβ表示商品β的度;λ表示可调参数。

可选的,所述推荐系统,还包括:

数据清理模块,用于对所述位置信息集合和所述商品信息集合中的数据进行数据清洗,得到清洗后的位置信息集合和清洗后的商品信息集合;

格式转化模块,用于将清洗后的商品信息集合中的数据转化成预设格式,得到转化后的商品信息集合。

根据本发明提供的具体实施例,本发明公开了以下技术效果:

本发明公开了一种生产销售商品的推荐方法及系统,所述推荐方法包括:获取目标企业的地理位置;获取以所述地理位置为中心的预设范围内的所有企业的位置信息,得到位置信息集合,并获取每个企业生产销售的商品信息,得到商品信息集合;根据所述地理位置、所述位置信息集合及所述商品信息集合,计算目标企业与预设范围内的每个企业的相似度;根据所述目标企业与预设范围内的每个企业的相似度,计算所述商品信息集合中每种商品的推荐分数;将推荐分数大于预设阈值的商品设置为推荐商品,推荐给所述目标企业。本发明基于扩散的推荐算法,并在计算企业的相似度的过程中考虑的地理位置信息,提高了推荐的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明提供的一种生产销售商品的推荐方法的流程图;

图2为本发明提供的一种生产销售商品的推荐方法的验证方法的流程图;

图3为本发明提供的概率扩散算法的计算过程图;

图4为本发明提供的热扩散算法的计算过程图;

图5为本发明提供的一种生产销售商品的推荐系统的结构图。

具体实施方式

本发明的目的是提供一种生产销售商品的推荐方法及系统,以实现根据地理位置向企业或生产商推荐生产商品,提高推荐的准确性。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对发明作进一步详细的说明。

实施例1

本发明实施例1提供了一种生产销售商品的推荐方法。

如图1所示,所述推荐方法包括如下步骤:

步骤101,获取目标企业的地理位置。

步骤102,获取以所述地理位置为中心的预设范围内的所有企业的位置信息,得到位置信息集合,并获取每个企业生产销售的商品信息,得到商品信息集合;所述商品信息包括商品种类、数量和生产时间。对所述位置信息集合和所述商品信息集合中的数据进行数据清洗,得到清洗后的位置信息集合和清洗后的商品信息集合,数据清洗主要是消除错误、冗余和数据噪音;将清洗后的商品信息集合中的数据转化成预设格式,即,按照规则将所获得的各个生产商或企业的各种销售数据集转化为统一的形式,将多个数据源中的数据合并,并存放到一个一致的数据存储中,得到转化后的商品信息集合。为了更好地从数据库中读入数据,需要将数据中的每个企业和每种类型的商品都定义一个唯一的数字id,所以进一步将数据分为三个表格,第一个表格是企业与其生产过的商品,第二个表格是企业id与企业名称,商品id与商品名称的对应表格。第三个表格是位置信息中需要使用到的每两个企业之间的距离信息d(i,j)。

步骤103,根据所述地理位置、所述位置信息集合及所述商品信息集合,计算目标企业与预设范围内的每个企业的相似度;具体的,根据所述地理位置、所述位置信息结合及所述商品信息结合,利用公式计算目标企业与预设范围内的每个企业的相似度;其中,fij表示目标企业i与预设范围内的企业j的相似度;m表示所述商品信息集合中商品的种类数;aiα和ajα分别表示目标企业i和预设范围内的企业j的第α种商品的生产状态;d(i,j)表示目标企业i与预设范围内的企业j的距离;θ表示地理位置信息比重参数;kα表示第α种商品的度,kj表示预设范围内的企业j的度;λ表示可调参数。

步骤104,根据所述目标企业与预设范围内的每个企业的相似度,计算所述商品信息集合中每种商品的推荐分数;具体的,根据所述目标企业与预设范围的每个企业的相似度,利用公式计算商品信息集合中每种商品的推荐分数;其中,fiβ表示商品β推荐给目标企业i的推荐分数;n表示预设范围内企业的数量;ajβ表示预设范围内的企业j的商品β的生产状态,fij表示目标企业i与预设范围内的企业j的相似度,kj表示预设范围内的企业j的度,kβ表示商品β的度;λ表示可调参数。由于目前所有企业和生产商在开发新的产品时,更倾向于开发与目前出口产品类似的产品。本发明还可以根据出口记录过滤大量信息并为企业推荐合适的出口产品类似的商品。

步骤105,将推荐分数大于预设阈值的商品设置为推荐商品,推荐给所述目标企业。

实施例2

本发明实施例2提供一种生产销售商品的推荐方法的验证方法。

如图2所示,所述验证方法包括如下步骤:

采集企业或生厂商的地理位置信息、企业数量、商品数量、时间、商品种类的数据。企业的地理位置信息可通过搜索获得,企业已经生产的生产商品的数量、种类和时间等信息需要从企业的数据库中获取。

收集企业或生产商的生产数据,对数据进行预处理,具体的步骤报包括:1)数据清洗:数据清洗主要是消除错误、冗余和数据噪音,还要按照规则将所获得的各个生产商或企业的各种销售数据集转化为统一的形式。2)数据集成:将多个数据源中的数据合并,并存放到一个一致的数据存储中。

为了更好地从数据库中读入数据,需要将数据中的每个企业和每种类型的商品都定义一个唯一的数字id,所以进一步将数据分为三个表格,第一个表格是企业与其生产过的商品,第二个表格是企业id与企业名称,商品id与商品名称的对应表格。第三个表格是地理位置信息中需要使用到的每两个企业之间的距离信息d(i,j)。

为了确定不同推荐算法的性能,将本发明的考虑地理位置信息的推荐算法与其他普通的推荐算法进行对比。该步骤主要是使用了不同的推荐算法模型对企业进行商品推荐。以下是每个推荐算法具体的计算过程。

基于扩散的推荐算法可以分为概率扩散算法和热扩散算法。在概率扩散算法中先读入处理好的数据,再将公式中的λ设置为1。利用公式计算出fij,即目标企业i与预设范围内的企业j的相似度。将公式fij的结果代入公式中,可计算出对于目标企业i来说,商品β被推荐的推荐分数,将所有的商品的推荐分数按从高到低排序后存入数据库。

热扩散算法的过程与概率扩散算法相似。先读入处理好的数据,再将公式中的λ设置为0。利用公式计算出fij,即目标企业i与预设范围内的企业j的相似度。将公式fij的结果代入公式中,可计算出对于目标企业i来说,商品β被推荐的推荐分数,将所有的商品的推荐分数按从高到低排序后存入数据库,如图3为概率扩散算法的计算过程,如图4为热扩散算法的计算过程。在图3中,每一个企业用一个圆形表示,每一个商品用一个矩形表示。对于第一个深色的圆形对应的企业,开始计算推荐给该企业每个商品的得分。首先将该企业有生产过的商品设置为1,将数值在商品侧平均分,再传递到企业侧。例如第一个商品有两个企业出口过,则每个出口过它的企业将得到1/2的值。最后一个商品有三个企业出口过,则每个出口过它的企业将得到1/3的值。在企业侧的得分是其出口过所有商品的得分加和,所以第一个深色的圆形对应的企业,得到的总分为1/2+1/3=5/6。同理,再以相同的方法将分数扩散回商品侧,就可以得到概率扩散算法中每个商品的得分。

在图4中,每一个企业用一个圆形表示,每一个商品用一个矩形表示。对于第一个深色的圆形对应的企业,开始计算推荐给该企业每个商品的得分。首先将该企业有生产过的商品设置为1,将数值在企业侧平均分,再传递到企业侧。例如企业1一共生产过两个商品,两个商品的数值都是1,所以扩散到企业1的分数为(1*1/2+1*1/2)=1。再如,企业2一共生产过两个商品,且一个商品的分数为1,一个商品的分数为0,则企业2的分数为(1*1/2+0*1/2)=1/2。同理,再以相同的方法将分数扩散回商品侧,就可以得到热扩散算法中每个商品的得分。

根据最近度增加算法的过程,首先读入处理好的数据,再设置算法的时间窗口τ的长度,在实验中,本发明将该参数值设为5,即使用每5年的数据做一个对比。参数ε的取值为1*10-5,它将和每个商品五年的生产情况对比相乘,以区分一些五年对比情况相同的商品。最终利用公式δk'α(t,τ)=δkα(t,τ)+εkα(t)计算出对于目标企业i来说,商品β被推荐的分数,其中,δkα(t,τ)=kα(t)-kα(t-τ)是时间窗口长度τ内商品增加的度。其中,kα(t)是商品α在时间t的度,商品α的度等于销售过商品α的企业或生产商的数量。τ为选定的时间窗口长度,例如,当τ为5,t为2006时,δkα(t,τ)等于2006年商品α的度减去2001年商品α的度,即对比2006年和2001年,增加了多少个销售商品α的企业或生产商。最终每个商品都会得到一个推荐分数。由在时间窗口τ内许多商品的δkα(t,τ)相等,但是kα(t)却不相同。若直接将δkα(t,τ)作为每个商品最后的得分,则很多商品会并列。为了区分每个商品的得分,我们添加了参数ε,它的取值很小,本发明中取1*10-5,这确保了εkα(t)不会改变δkα(t,τ)的排名,但又能对每个商品α做出区分,最终得到每个商品的得分δk'α(t,τ)并将所有的商品的推荐分数按从高到低排序后存入数据库。

时间感知概率扩散算法:先从数据库中读入处理好的数据,该算法是基于扩散的推荐算法与最近度增加算法的结合。即将每个商品的推荐分数是基于扩散算法的推荐分数与基于最近度增加算法的推荐分数相乘。该方法的目的是在基础的扩散推荐算法中添加入时间的因素。最终可计算出对于目标企业i来说,商品β被推荐的分数,并将所有的商品的推荐分数按从高到低排序后存入数据库。

本发明引入地理位置信息对基于扩散的推荐算法的改进算法。首先读入数据库中的处理好的企业与商品的数据,并且读入企业之间的地理位置数据d(i,j)。利用公式计算出对于目标企业i来说,商品β被推荐的分数。并将所有的商品的推荐分数按从高到低排序后存入数据库。

数据库中已经存储了每个推荐算法对于企业的推荐列表。根据推荐列表计算每种算法的精确度与召回率。最终将精确度最好的推荐算法的推荐结果显示在主页中。

最终主页显示的是含地理位置信息的推荐算法的推荐列表。表1显示的是对企业1-10的推荐结果。例如第一行,对企业1的推荐排名前十的商品的id为64,42,50,299,104,166,30,88,513,123。根据商品id可以从数据库中查找到具体的商品信息。

表1

验证的结构表明,本发明考虑了地理位置信息的算法,提高了生产销售商品推荐的精确度。

本发明增加地理位置信息的技术构思除了可以应用于基于扩散的推荐算法(当λ=1时的概率扩散算法-probabilisticspreading,probs和当λ=0时的热扩散算法-heatspreading,heats),还可以应用于最近度增加算法(degreeincrease,di)和时间感知概率扩散算法(time-awareprobabilisticspreading,tprobs)。本发明先根据每个企业或生产商的生产情况,使用普通的推荐算法与含地理位置的推荐算法,为每个企业或生产商推荐适合生产的新商品。得到每个算法的推荐列表后,进一步对比了每个算法的精确度与召回率,判断结果如表2和表3所示,其中,表2为普通的推荐算法得到的推荐列表的精确度(p(20))和召回率(r(20)),表3为含地理位置的推荐算法得到的推荐列表的精确度(p(20))和召回率(r(20)),可见含地理位置信息的推荐算法相比于普通算法在精确度和召回率中都有很好的提高。其中θ是地理位置信息算法的可调参数,它用于调控地理位置信息在整个算法中所占的比重。

表2

表3

实施例3

本发明提供一种生产销售商品的推荐系统。

如图5所示,所述推荐系统包括:

地理位置获取模块501,用于获取目标企业的地理位置。

位置信息集合和商品信息集合获取模块502,用于获取以所述地理位置为中心的预设范围内的所有企业的位置信息,得到位置信息集合,并获取每个企业生产销售的商品信息,得到商品信息集合;所述商品信息包括商品种类、数量和生产时间。

相似度计算模块503,用于根据所述地理位置、所述位置信息集合及所述商品信息集合,计算目标企业与预设范围内的每个企业的相似度;相似度计算模块503具体包括:相似度计算子模块,用于根据所述地理位置、所述位置信息结合及所述商品信息结合,利用公式计算目标企业与预设范围内的每个企业的相似度;其中,fij表示目标企业i与预设范围内的企业j的相似度;m表示所述商品信息集合中商品的种类数;aiα和ajα分别表示目标企业i和预设范围内的企业j的第α种商品的生产状态;d(i,j)表示目标企业i与预设范围内的企业j的距离;θ表示地理位置信息比重参数;kα表示第α种商品的度,kj表示预设范围内的企业j的度;λ表示可调参数。

推荐分数计算模块504,用于根据所述目标企业与预设范围内的每个企业的相似度,计算所述商品信息集合中每种商品的推荐分数;所述推荐分数计算模块504,具体包括:推荐分数计算子模块,用于根据所述目标企业与预设范围的每个企业的相似度,利用公式计算商品信息集合中每种商品的推荐分数;其中,fiβ表示商品β推荐给目标企业i的推荐分数;n表示预设范围内企业的数量;ajβ表示预设范围内的企业j的商品β的生产状态,fij表示目标企业i与预设范围内的企业j的相似度,kj表示预设范围内的企业j的度,kβ表示商品β的度;λ表示可调参数。

推荐模块505,用于将推荐分数大于预设阈值的商品设置为推荐商品,推荐给所述目标企业。

所述推荐系统,还包括:

数据清理模块,用于对所述位置信息集合和所述商品信息集合中的数据进行数据清洗,得到清洗后的位置信息集合和清洗后的商品信息集合;

格式转化模块,用于将清洗后的商品信息集合中的数据转化成预设格式,得到转化后的商品信息集合。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。

本文中应用了具体个例对发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1