一种大数据前置仓选址方法及装置与流程

文档序号:36711285发布日期:2024-01-16 12:06阅读:17来源:国知局
一种大数据前置仓选址方法及装置与流程

本发明涉及数据处理,尤其涉及一种大数据前置仓选址方法及装置。


背景技术:

1、前置仓即以仓储形式售卖生鲜、零售百货的连锁商铺,顾客无需线下到店购物,可直接通过线上app或小程序进行商品下单,由店铺人员或专业人员完成货物分拣及上门投递。根据售卖内容的不同,目前前置仓主要包括生鲜类、百货类、酒水类等,市面常见的前置仓包括朴朴生活超市、每日优鲜、美宜佳优选等。与传统超市便利店不同的是,前置仓对配送及客源的需求相对更为突出。前置仓的每个门店都是一个中小型的仓储配送中心,这使得总部中央大仓只需对门店供货,也能够覆盖最后一公里。消费者下单后,商品从附近的零售店里发货,而不是从远在郊区的某个仓库发货。这使得它在门店3公里范围内可以做到30分钟送达。

2、据艾瑞咨询的数据,中国前置仓即时零售市场规模在近几年来,飞速增长,随之而来前置仓的数量也是不断增长。每新增一个店铺,就涉及到店铺的选址,在连锁店铺的生命周期内,“选址”是非常重要的一个环节。覆盖用户情况、交通便捷性、竞争情况、租金等对于店铺的选址相对具有较为明显的指定意义。

3、然而传统选址方式和寻路选址模式都有各自的缺点:传统选址方式更偏向选址员的个人经验,且选址员专业培训不充分,在实际操作过程中凭个人经验成分多,缺乏客观,适用场景较为单一,对选址员业务专业性要求较大,选址逻辑可能千差万别,更换场景后选址员经验带来的指导价值会明显降低,数据收集和处理成分少、分析和操作工具少,缺乏标准化的选址评价工具;

4、a-star探路算法等寻路算法在实际应用中受计算精度影响较大,道路精度越高也就意味着计算量的大幅度增长,而应用场景中选址可能需要考虑三四公里内的路径花销计算,同时结合实际生活中大多采用电瓶车、摩托车等进行配送的情况,在路径计算时可能需要计算到很多县乡级小路及各种非标准道路,通过该类算法进行计算时开销较大。

5、中国发明专利cn 115034706 a公开了一种确定前置仓配送范围的方法、装置和计算设备,其中方法包括:各子区域包括第一类子区域和第二类子区域,根据各子区域对应的历史订单数据,确定各子区域的配送需求信息;基于各子区域的配送需求信息和待优化区域的各前置仓的配送能力,确定每个子区域对应的唯一前置仓;针对任一前置仓,根据前置仓对应的子区域确定前置仓的配送范围。


技术实现思路

1、针对上述现有技术中存在的问题,本发明提供了一种大数据前置仓选址方法及装置,本发明要解决的技术问题是提供一种能够降低计算开销和模型计算量的具有强适用性的大数据前置仓选址方法及装置。

2、为实现上述目的,一方面本发明提供了一种大数据前置仓选址方法,所述方法包括下列步骤:

3、步骤s1:获取基础数据;

4、步骤s2:对基础数据进行转换,用以降低数据容量;

5、步骤s3:对步骤s2处理后的数据进行模型计算;

6、步骤s4:将计算结果数据进行呈现,实现全流程业务交互。

7、进一步地,基础数据的转换包括构建指标特征、对边界进行模糊化处理以及判断数据点位是否处于区域范围内。

8、进一步地,所述指标特征包括:基础特征数据、区域特征和道路信息。

9、进一步地,所述指标特征是以“人员和车辆能够到达”作为基本要求进行构建。

10、进一步地,所述指标特征以非机动车辆能够到达区域作为数据统计范围,计算在所述区域下的各类数据指标水平。

11、进一步地,采用凸包算法进行区域边界的优化和判断数据点位是否在所述区域内。

12、进一步地,在所述步骤s2中,采用凸包算法进行区域边界的优化包括以下步骤:

13、(1)将基础数据中的原始点位进行排序,以经度从小到大排序,当经度相同时以纬度从小到大排序;

14、(2)遍历所有原始点位,并与上一个点位对比,移除重复的点位;

15、(3)记录凸包边界点位;

16、(4)判断当前点位是否为预估凸包点位,若判定为预估点位时,对前序点位依次做判断,删除非凸包数据;

17、(5)输出凸包点位组成的凸包集合st。

18、进一步地,在所述步骤s2中,采用凸包算法判断数据点位是否在所述区域内包括以下步骤:

19、(1)遍历计算点位p与凸包集合st中的点位之间的距离,若所有的距离都大于设定值,结束判断过程,输出结果为:在覆盖范围之外;

20、(2)将计算点位p与凸包集合st作为原始数据点位集合,运行凸包算法优化区域边界,输出新的凸包集合st_new,计算完成后判断计算点位p是否在新的凸包集合st_new中。

21、进一步地,所述基础数据包括:网络爬虫数据、公开服务数据、运营商数据、前置仓商家自有数据和道路数据。

22、进一步地,所述步骤s3中,模型计算包括数据准备、数据集划分、模型训练、超参数调节、模型泛化和模型评估;使用分类模型进行计算,并结合softmax输出评分情况,用以表示该选址点位的综合评估情况

23、进一步地,所述步骤s4中,通过公共地图服务接口及前后端网络开发技术,将计算结果数据展示在地图,完成全流程业务交互。

24、另一方面,本技术提供一种大数据前置仓选址装置,所述装置包括:数据获取模块、数据转换模块、模型计算模块、web前后端服务管理模块和外部数据接入模块,所述装置采用上述方法对前置仓进行选址。

25、进一步地,在所述数据获取模块中,通过scrapy、selenium技术工具,爬取现有前置仓店铺作为训练数据,并通过公开poi服务获取不同区域下的商业活动信息数据;使用运营商信息服务接口,获取到各区域下的人员和客流指标信息。

26、进一步地,数据转换模块将基础数据经过基础对齐处理,然后通过所述凸包算法进一步降低数据容量,简化模型计算。

27、进一步地,在所述模型计算模块中使用常见分类模型,并通过结合softmax输出评分情况,用以表示所述选址点位的综合评估情况。

28、进一步地,在所述web前后端服务管理模块中,通过公共地图服务接口及前后端网络开发技术,将数据展示在地图中;完成全流程业务交互。

29、通过具有上述特征的一种大数据前置仓选址方法及装置,通过采用“非机动车辆能够到达区域”进行数据划分,降低了特异性数据对模型的影响;使用凸包算法思想,减少模型计算量,提高模型性能;将数据集中其余点位包裹在内,优化了边界,使收到的数据更加全面。而且通过凸包计算优化边界后,会使组成边界范围的点位的数量大幅下降,这使得判断指定点位是否在覆盖区域内的计算变得简单高效。

30、本发明通过引入大数据及机器学习建模的方式,综合多方数据来源,形成一套相对客观有效的前置仓选址评估模型;借助模型“一次训练,多次使用”的方式,降低计算开销,并通过模型算法中“模型泛化”的优化处理,提高其适用性;通过一系列优化技术手段,进一步降低模型计算量,提供模型计算效率;通过结合模型参数、模型评分等信息,形成一套包括数据获取、数据转换、模型预测、综合评估完整流程的选址评估体系。使用了更为一般化的建模思想,通用性更强可拓展性强,用户可根据业务规则创建新的特征指标,或引入其他业务领域数据。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1