一种基于聚类算法的共享单车优化调配方法、控制装置、电子设备及其存储介质与流程

文档序号：23714550发布日期：2021-01-24 05:09阅读：92来源：国知局

[0001]
本发明属于公共交通规划和数据挖掘技术领域，尤其涉及一种基于聚类算法的共享单车优化调配方法、控制装置、电子设备及其存储介质。

背景技术：

[0002]
随着共享理念的快速崛起，共享单车为响应市场需要也应运而生。共享单车产生初期，对城市的交通出行产生了很好的促进作用，也有效贯彻了低碳出行的环保倡议。但随着市场需求的不断扩大，共享单车数量急剧增多，单车随意停放、缺乏管理的现象日趋严重，逐渐给城市的市容市貌带来了负面影响。如何优化共享单车的调配使用、使管理方法行之有效，也成为共享理念可持续发展的研究性课题之一。
[0003]
目前，共享单车的调配使用方案仅依靠简单的数据统计和经验决断，没有借助大数据清洗、大数据挖掘和大数据可视化技术，导致数据存在主观性判断过强、分析过程略显粗糙、分析结论不准确的问题，同时，也无法形成直观的可视化效果。

技术实现要素：

[0004]
本发明为了弥补现有技术的不足，提供一种基于聚类算法的共享单车优化调配方法、控制装置、电子设备及其存储介质，将聚类算法与大数据清洗、大数据挖掘和大数据可视化技术相结合，通过大规模的数据采集和聚类分析，实现共享单车快捷、高效且准确的调配使用，还将数据分析结果进行可视化呈现，使管理更加直观高效，大大缓解了城市交通压力、愈加优化出行需要。
[0005]
本发明的实施例是这样实现的：
[0006]
第一方面，本发明实施例提供了一种基于聚类算法的共享单车优化调配方法，应用于服务器，具体实现步骤是：通过采集共享单车特定时间段的骑行数据，用聚类的方法对整个城市任意时段的骑行起点数据、骑行终点数据做预测和判断，计算出骑行目标的期望值。同时，针对每个区域内骑行次数、骑行时间、骑行距离等骑行特征的数据做定量分析，为共享单车的高效利用提供数据支持。
[0007]
进一步地，对骑行特征进行筛选，利用k-means聚类算法对筛选后数据的骑行特征进行分类，对分类后数据进行可视化分析，根据分析结果预测聚类的坐标。
[0008]
进一步地，定量分析是指通过大量数据的聚类分析和可视化呈现后，由效果图的经纬度(聚类的坐标)从地图上判断出聚类的位置，通常聚类较多的位置出现在人员密集、流动性大的区域，为共享单车的高效利用提供数据支持。
[0009]
第二方面，本发明实施例还提供了通过执行程序实现基于聚类算法的共享单车优化调配方法，应用于服务器，具体实现步骤是：把一个城市的单车数据输入程序中，利用聚类算法进行计算，对计算结果进行数据可
视化。
[0010]
第三方面，本发明实施例还提供了一种基于聚类算法的共享单车优化调配控制装置，应用于服务器，该控制装置包括以下模块：数据采集和清洗模块：从共享单车数据源采集骑行数据，对不完整、重复、无关数据进行清洗，得到标准、干净、合规的数据，选择所需时间段，设置数据清洗标准，即筛选标准参数值，对骑行特征进行有效性筛选；数据挖掘模块：利用聚类算法从筛选后数据集合中挖掘数据特征，得到特征分类并存储在特征分类库；可视化呈现模块：将分类后数据特征进行连线，得到各个区域的骑行辐射图，可根据骑行辐射图中的聚类效果做相应的放缩，使呈现效果最优化；调配优化模块：通过可视化效果分析，预测所需时间段共享单车大量聚集的位置，并根据可视化效果需要进行调参，得到单车调配最优方案。
[0011]
进一步地，数据采集和清洗模块还包括数据采集子模块和特征筛选子模块。
[0012]
进一步地，数据挖掘模块还包括聚类计算子模块和特征分类库。
[0013]
进一步地，放缩方式可通过随机洗牌算法筛选出有代表性的数据，将放缩后数据进行连线，根据连线效果调整放缩范围。
[0014]
进一步地，调参方式可通过调整骑行特征的筛选标准参数值，或者调整聚类算法的质心和数量来优化调配方案。
[0015]
第四方面，本发明实施例还提供了一种电子设备，包括：存储器和处理器，存储器与处理器连接，存储器用于存储程序代码指令，处理器用于调用存储器中存储的程序代码指令，按照获得的程序执行如第一、二方面实施例所提供的方法。
[0016]
第五方面，本发明实施例还提供了一种存储介质，该存储介质存储有处理器可执行的程序代码指令，存储介质包括多条程序代码指令，多条指令被配置成使处理器执行如第一、二方面实施例所提供的方法。
[0017]
本发明提供的一种基于聚类算法的共享单车优化调配方法、控制装置、电子设备及其存储介质，相比于现有技术具有以下优点：本发明将聚类算法与大数据清洗、大数据挖掘和大数据可视化技术相结合，通过大规模的数据采集和聚类分析，实现共享单车快捷、高效且准确的调配使用，还将数据分析结果进行可视化呈现，使管理更加直观高效，大大缓解了城市交通压力、愈加优化出行需要。
附图说明
[0018]
图1为实施例一提供的一种基于聚类算法的共享单车优化调配方法的流程图。
[0019]
图2、3为实施例二提供的采用基于聚类算法的共享单车优化调配方法通过执行程序来实现的可视化效果图。
[0020]
图4为实施例三提供的一种基于聚类算法的共享单车优化调配控制装置的示意图。
[0021]
图5为实施例四提供的一种电子设备的结构示意图。
[0022]
图6为实施例五提供的一种网络系统的交互示意图。
具体实施方式
[0023]
上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可以找说明书的内容予以实施，并且为了让本发明的上述和其他目的、特征和有点能够更明显易懂，以下为本发明的具体实施方式。实施例一
[0024]
参见图1，为本实施例提供的一种基于聚类算法的共享单车优化调配方法，所举实例只用于解释本发明，并非用于限定本发明的范围。该方法具体包括以下步骤：s1、大规模采集数据；s2、对数据进行清洗和特征选择，利用聚类算法进行计算；s3、数据可视化效果判断；s4、效果好，得到共享单车优化调配结论；s5、否则，修改聚类的分类个数重新运行算法，或者修改清洗数据的参数值。
[0025]
其中，s1中所述“采集数据”是指：从共享单车运营系统中读取骑行数据，多为表格文件。
[0026]
其中，s2还包括以下步骤：s2.1、对骑行特征进行筛选；s2.2、利用k-means聚类算法对筛选后数据的骑行特征进行分类，得到分类图；s2.3、对分类后数据进行可视化分析；s2.4、根据分析结果预测聚类的坐标。
[0027]
其中，s2.1中所述“对骑行特征进行筛选”是指：筛选出需要的时间段，利用二维欧氏距离计算骑行距离。对骑行距离、骑行时间等骑行特征进行有效性的筛选。二维欧氏距离计算公式是：公式中，dist为点(x
2
，y
2
)与点(x
1
，y
1
)之间的欧式距离，|x|为点(x
2
，y
2
)到原点的欧氏距离。骑行距离过短和骑行时间过短都不符合正常骑行的标准，本实施例中，采用骑行距离的筛选标准是1公里以上，骑行时间的筛选标准是1分钟以上，还可以视实际情况具体分析和制定其他筛选标准的参数值，骑行特征根据参数值不同而不同。
[0028]
其中，s2.2还包括以下步骤：s2.2.1、输入k值；s2.2.2、从数据集合中随机选择k个数据点作为初始质心；s2.2.3、计算集合中各个数据与初始质心的二维欧氏距离，距离近的归为一类；s2.2.4、利用算法在一类中选择新的质心；s2.2.5、判断新的质心与初始质心的距离；s2.2.6、当距离小于固定阈值，得到聚类分类数据，否则继续s2.2.3。
[0029]
其中，s2.2.4中所述“利用算法在一类中选择新的质心”是指：使用误差平方和(sum of the squared error，sse)作为聚类的目标函数，两次运行k 均值产生的两个不同的簇集，选择sse为最小值的簇集作为新的质心。误差平方和计算公式是：
公式中，k表示k个初始质心，c
i
表示第i个质心，dist表示二维欧氏距离。
[0030]
其中，s2.2.6中所述“固定阈值”是指：根据聚类计算和可视化效果的需要，可人为设置固定参数值，当参数值为7时，聚类后可视化效果最好。
[0031]
其中，s2.3还包括以下步骤：s2.3.1、取骑行终点数据的平均数；s2.3.2、利用随机洗牌算法计算骑行起点数据；s2.3.3、将骑行终点数据的平均数与骑行起点数据进行连线；s2.3.4、得到各个区域骑行数据的辐射图。
[0032]
其中，s2.3.1中所述“取骑行终点数据的平均数”原因是现实情况中，数据分布图呈现二维正态分布，如果单纯取骑行起点数据的平均数与骑行终点数据的平均数，得到的骑行区域的可视化效果图并不准确。
[0033]
其中，s2.3.2中所述“随机洗牌算法”是指：假设骑行起点数据的数组从0开始，共有y个数据，从数组中随机抽取一个p点[0，y)，并重复从剩下的数组中抽取p点，直到数组中的数据全部取完，抽取出的数据形成一个随机打乱的骑行起点数据数组；随机洗牌的目的是从一个大的数据集合中筛选出有代表性的数组进行相应的放缩，利于可视化呈现。
[0034]
其中，s2.3.3中所述“连线”的数量，可以根据聚类后该类数量做相应的放缩，利于各个骑行区域的可视化呈现。
[0035]
其中，s2.3.4中所述“辐射图”是指数据进行聚类后，模拟出各个区域的骑行数据分布图。
[0036]
其中，s2.4中所述“预测聚类的坐标”是指在当前统计时段，预测能出现大量共享单车的位置，即通过对骑行起点数据的聚类分析和对骑行终点数据的平均值计算，得出用户大量集中使用共享单车的坐标，从而达到共享单车优化调配的目的。
[0037]
其中，s3中所述“效果判断”是指：通过大量数据的聚类分析和可视化呈现后，由效果图的经纬度从地图上判断出聚类的位置，通常聚类较多的位置出现在地铁、小区、商业区等人员密集、流动性大的区域，因此，如果位置出现偏差，可判定为可视化效果不好。
[0038]
其中，s5中所述“修改聚类的分类个数重新运行算法，或者修改清洗数据的参数值”是指：当可视化效果不好时，一是可以通过修改聚类的质心和数量重新进行k-means聚类算法计算；二是可以修改骑行特征的筛选参数值，进而优化可视化效果。
[0039]
其中，本实施例所述方法是应用于实施例四中所述电子设备200的解调方法。实施例二
[0040]
参见图2、3，为本实施例提供的采用基于聚类算法的共享单车优化调配方法通过程序进行实现的可视化效果图，所举实例只用于解释本发明，并非用于限定本发明的范围。该方法具体包括以下步骤：s101、把一个城市的单车数据输入程序中，程序实现如下：
s102、利用聚类算法进行计算，程序实现如下：
程序执行完成后，数据计算结果如下：
由上表数据可知：通过聚类计算得到聚类具体坐标，可以在地图中直接定位相应的聚点坐标(起止坐标)和分类数量，以便做进一步的统计分析。s103、数据可视化，程序实现如下：
程序执行完成后，得到可视化效果图2和图3，效果图是根据共享单车某一天11 点到12点骑行起点和骑行终点的数据做的聚类分析，聚集的焦点就是骑行终点的坐标，线条数量就是这个分类相对骑行的人数。
[0041]
其中，图2是部分数据聚类后的效果图，图3是全量数据聚类后的效果图，从聚点的经纬度上对比地图可以看出：共享单车的骑行终点基本都在地铁站和商业区附近。其意义
在于：根据上一个小时的数据，可聚类分析出共享单车聚集停放最多的位置，以便为下一小时的出行定量分配共享单车，达到更高的骑行利用率。
[0042]
其中，本实施例所述方法是按照实施例一中所述方法通过执行程序代码完成共享单车的优化调配。实施例三
[0043]
参见图4，为本实施例提供的一种基于聚类算法的共享单车优化调配控制装置210，所举实例只用于解释本发明，并非用于限定本发明的范围。该控制装置具体包括以下模块：数据采集和清洗模块212：从共享单车数据源211采集骑行数据，对不完整、重复、无关数据进行清洗，得到标准、干净、合规的数据，选择所需时间段，设置数据清洗标准，即筛选标准参数值，对骑行特征进行有效性筛选；数据挖掘模块213：利用聚类算法从筛选后数据集合中挖掘数据特征，得到特征分类并存储在特征分类库；可视化呈现模块214：将分类后数据特征进行连线，得到各个区域的骑行辐射图，可根据骑行辐射图中的聚类效果做相应的放缩，使呈现效果最优化；调配优化模块215：通过可视化效果分析，预测所需时间段共享单车大量聚集的位置，并根据可视化效果需要进行调参，得到单车调配最优方案。
[0044]
其中，数据采集和清洗模块212进一步包括以下内容：数据采集子模块2121：从共享单车数据源采集骑行数据；特征筛选子模块2122：对不完整、重复、无关数据进行清洗，得到标准、干净、合规的数据，选择所需时间段，利用二维欧氏距离计算骑行距离，设置筛选标准参数值，对骑行距离、骑行时间、骑行次数等骑行特征进行有效性筛选。
[0045]
其中，数据挖掘模块213进一步包括以下内容：聚类计算子模块2131：利用k-means聚类算法从筛选后数据集合中随机选择初始质心，计算集合中各个数据到初始质心的距离，将相近数据归为一类并计算新的质心，当距离小于固定阈值，得到特征分类；特征分类库2132：用于存储聚类计算子模块输出的分类数据。
[0046]
其中，放缩方式可通过随机洗牌算法筛选出有代表性的数据，将放缩后数据进行连线，根据连线效果调整放缩范围。
[0047]
其中，调参方式可通过调整数据的清洗标准，即骑行特征的筛选参数值，比如骑行距离、骑行时间等，或者调整数据的挖掘标准，即聚类算法的质心和数量，以优化调配方案。
[0048]
其中，本实施例所述共享单车优化调配控制装置210，其实现原理及产生的技术效果与实施例一和实施例二中各所述方法相同，为简要描述，本实施例中未提及之处，可参考前述方法实施例中相应内容。实施例四
[0049]
参见图5，为本实施例提供的一种电子设备200，所举实例只用于解释本发明，并非用于限定本发明的范围。所述电子设备200包括：共享单车优化调配控制装置210、存储器220和处理器230。
[0050]
其中，所述共享单车优化调配控制装置210、存储器220、处理器230 各元件相互之
间直接或间接地电性连接，以实现数据的传输或交互。
[0051]
其中，上述各元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述共享单车优化调配控制装置210包括至少一个可以软件或固件 (firmware)的形式存储于所述存储器220中或固化在所述电子设备200的操作系统(0s)中的软件功能模块。所述处理器230用于执行所述存储器220中存储的可执行模块，比如，所述共享单车优化调配控制装置210包括的软件功能模块或计算机程序。
[0052]
其中，所述存储器220不限于随机存取存储器(ram)，只读存储器(rom)，可编程只读存储器(prom)，可擦除只读存储器(eprom)，电可擦除只读存储器(eeprom)等。
[0053]
其中，所述存储器220用于存储程序，所述处理器230在接收到执行指令后，执行所述程序。本发明实施例一实施例二中所执行的方法均可以应用于本实施例所述电子设备200的处理器230中，或者由处理器230实现。
[0054]
其中，所述处理器230可能是一种集成电路芯片，具有信号的处理能力。所述处理器230可以是通用处理器，包括中央处理器(cpu)、网络处理器(np) 等；还可以是数字信号处理器(dsp)、专用集成电路(asic)、现成可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器，或者也可以是任何常规的处理器等。
[0055]
其中，本实施例所述电子设备200可以是实施例五中所述服务器110。实施例五
[0056]
参见图6，为本实施例提供的一种网络系统100，所举实例只用于解释本发明，并非用于限定本发明的范围。所述网络系统100包括：服务器110和客户终端120，客户终端120通过网络与服务器110进行数据交互。
[0057]
其中，所述服务器110在数据载入加速时，将预设提示信息发送至与所述服务器110通信的客户终端120。
[0058]
其中，所述服务器110不限于网络服务器、数据库服务器、云端服务器等。所述客户终端120不限于个人电脑(pc)、智能手机、平板电脑、移动上网设备(mid)、个人数字助理(pda)等电子设备。
[0059]
需要说明的是，本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。并且，各个实施例公开并不局限于上面已经描述并在附图中示出的精确结构，还可以在不脱离其范围进行各种修改和改变。
[0060]
以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围不局限于此，任何熟悉本技术领域的技术人员在本发明的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：汪敏;严妍;肖国泉;裴非;肖克;彭祖剑;邵罗树;张博
技术所有人：北京开普云信息科技有限公司
我是此专利的发明人

上一篇：一种人力资源管理用档案收纳装置的制作方法
上一篇：一种金豪红茶及其制备方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。