一种融合多模态的车辆管理平台流量实时监控管理方法

文档序号:33182042发布日期:2023-02-04 05:15阅读:23来源:国知局
一种融合多模态的车辆管理平台流量实时监控管理方法

1.本发明属于云计算和人工智能领域,具体涉及一种基于极大熵算法的基础上引入融合权重矩阵来实现多模态的融合,然后将该算法应用到新能源车辆管理平台的流量实时监控中,通过调整每个类型信息上的权重来突出某个类型数据的重要性,然后通过类中心迁移学习的方法保护数据隐私,以此能够快速识别流量来保证系统稳定安全的运行。


背景技术:

2.伴随着移动互联网快速兴起和发展,各种各样的新能源车辆智能管理平台随之出现,通过此智能管理平台来实现能源管理,能耗控制,仪表盘管理平台,在线监测,数据统计,控制系统,互联系统,规范性管理系统,能耗仪表盘,能耗统计等,实现能源管理的流程控制。新能源车辆智能管理平台系统的出现及发展,在为车辆管理开发提供巨大便利的同时,其系统本身、以及其中部署的应用和服务的监控任务也开始面临巨大的挑战,如何实时监控新能源车辆管理平台的多模块流量成为一项很重要的课题。
3.根据安文娟提出的方法,智能车辆访问管理平台的流量类别大致可以分为六类,分别为自然的流量、黑链流量、外链流量、网站关键词流量、友情链接的流量,站群流量。不管何种类型的流量都可以分为文本流量,图形流量和音频流量。基于此类分类,针对上述问题,相关研究人员提出利用无监督的聚类算法来实现新能源车辆管理平台流量的实时监控。如苏欣在2008年提出了“基于聚类算法的流量识别方法研究及系统实现”来实现流量识别从而提高系统的安全性与稳定性;如安文娟等人在2013提出了“基于聚类算法的实时ip流量识别技术研究”,实现ip流量的实时识别。
4.传统的极大熵聚类算法采用欧式距离来计算样本的隶属度,因此在针对高维度、数据量少以及有缺失和失真情况下的数据集时无法获取到准确的聚类中心。然而实际的新能源智能车辆管理系统中组件是多样性的及组件间异构的特性导致原始的流量数据过于庞杂(高维度),而且对于新部署的智能车辆管理平台,往往无法积累大量可靠的数据,所以其数据量稀少。因此会严重影响极大熵聚类算法的实际适用范围和性能。现有研究表明mec主要是针对单一视角数据的聚类方法,该算法在面对多视角聚类任务时只能单独对每一个视角进行独立聚类分析以获取各视角下的聚类结果,然后使用集成学习机制)将每一视角下的聚类结果进行统一,最终得到全局意义下的聚类结果,但是人为地把多视角数据分解为多个单一视角数据进行处理,会因各个视角的聚类结果存在明显差异影响最终获取的全局聚类结果,造成算法性能较差或不稳定。


技术实现要素:

5.针对上述问题,本发明在传统极大熵聚类算法的基础上,引入融合权重矩阵来实现多模态划分的融合,提出了融合多模态极大熵聚类算法(multi-view clustering algorithm,mvca)。该算法通过调整每个类型信息上的权重来体现某个类型数据的重要性,并融合权重矩阵将每个类型信息上聚类结果进行融合,并在聚类的过程中通过类中心迁移
学习来保护数据隐私。将mvca算法应用到新能源车辆管理平台的流量实时监控中,从而能够快速识别流量,从而能够从极大的保证系统的稳定安全的运行。
6.本发明的技术方案:
7.一种融合多模态的车辆管理平台流量实时监控管理方法,所述的车辆管理平台流量实时监控管理方法是通过以下系统实现的:
8.存放在车辆管理平台中的历史知识模块、实时采集新能源车辆请求流量的实时采集流量模块、聚类算法实时识别模块和请求流量处理结果模块;
9.所述的历史知识模块用于存放学习总结得到的高级知识,即通过聚类算法对新能源车辆操作请求流量进行分析总结得到的高级知识,并将抽象总结得到的高级知识存放在指定的数据库(块存储)。高级知识在实时识别算法中作为历史知识,这些知识信息包括对申请访问操作的车辆型号信息、访问指令信息、访问时间,访问频率等信息的抽象总结;
10.所述的实时采集新能源车辆的请求流量模块,即实时采集新能源车辆终端向车辆管理平台请求操作的指令流量信息,这是车辆管理平台中提供的一个功能,统称为消息总线功能;所有新能源车辆的请求都必须通过此总线来访问到车辆管理平台,车辆管理平台才会根据终端车辆的请求信息来分发最终的操作指令。如驾驶员想通过语音来获取今天的天气信息,首先汽车终端会通过语音识别模块来识别出驾驶员的指令,然后将其指令发送到车企的车辆管理平台,车辆管理平台会根据终端车辆的请求信息来分发最终的操作指令,最后通过新能源车辆终端进行解析来获取最终的天气信息。为了尽可能合理的使用车企的车辆管理平台,需要对其请求的流量进行实时监控,从而实现车辆管理平台中流量均衡和提高流量利用效率。这就需要车辆管理平台对终端车辆的访问流量进行实时识别,然后对恶意流量进行屏蔽,对正常流量信息进行分发。
11.所述的聚类算法实时识别模块,本发明在极大熵算法的基础上引入融合权重矩阵来实现多模态的融合,即融合多模态的极大熵聚类算法。并将该算法应用到新能源车辆管理平台的流量实时监控中,通过调整每个流量类别上的权重来突出某个类型流量数据的重要性;最后通过融合多模态的极大熵聚类算法对请求流量进行分类。系统会根据聚类算法分类的结果进行分类处理,如上述所述,系统应该对恶意流量进行屏蔽,对正常流量信息进行分发。
12.所述的结果处理模块是根据聚类结果进行针对性的处理,车辆流量类别大致可以分为六类,分别为自然流量、黑链流量、外链流量、系统关键词流量、友情链接的流量和站群流量。为了尽可能合理的使用车辆管理平台中的宽带流量,需要对其请求的流量进行实时监控,针对黑链流量和外链请求流量,需要其进行屏蔽,不能让这些非法流量占用车辆管理平台的宽带流量,但又需要对其余类型的流量进行正常分发。
13.一种融合多模态的车辆管理平台流量实时监控管理方法,其特征在于多模态聚类算法,其步骤如下:
14.步骤1.1、算法输入,聚类任务数据集x、总类别数c、迭代上限f、最小阈值ε、参数γ,η,λ,即后文的平衡因子,所述的聚类任务数据集是指通过消息总线的所有流量信息,这里其抽象为数据集x,x={view1,view2,view3,......viewk};终端车辆请求信息分为六类,其中k表示当前流量类别。
15.步骤1.2、多模态学习的聚类中心需要根据历史经验给出,采用传统的mec算法对
历史采集到的流量信息(前一时刻采集的流量信息)进行聚类任务,从而获取到历史的流量信息聚类中心。
16.步骤1.3、初始化隶属度矩阵u(0),z={z
i,t
},w={wi},设置迭代次数为1;其中u是聚类隶属度,表示数据属于某个类的可能性,其取值范围为[0,1],0表示其数据不属于某个类别,1表示其数据完全属于某个类别;第一z表示具体的某时刻流量数据融合划分到某个视角上的可能性,其取值范围为[0,1],z为0表示最不可能,1表示最有可能。z
i,t
表示第t时刻数据划分在第i个视角聚类中的重要程度,i代表视角,即车辆端发送操作请求指令的相关组件模块,不同视角对应不同的数据来源,反映在车上就是车辆不同的组件模块。w表示终端车辆不同组件模块的权重(对应视角),流量监控算法可以通过迭代自动更新其类别权重,wi表示第i个视角的数据权重。
[0017]
步骤1.4、根据公式(1.1),得最新聚类类中心v(n+1),使用v(n+1)更新其中表示历史聚类中心中的第s个视角(视角用以区分车辆终端的不同组件模块)的第k类的聚类中心;k是类别;c是总类别数量;λ为平衡因子,λ大于0;v
i,k
是目标域中第i个视角的第k类的聚类中心;u
kj,t
表示在t时刻数据上的第j个样本相对于第k个类中心的隶属度;是划分融合项,实现了不同视角划分重要性是否属于第i个视角上的聚类结果的融合;x
j,k
表示k类别第j个流量数据样本;α是lagrange乘子;
[0018][0019]
步骤1.5、车辆访问流量的聚类类中心u迭代公式如1.2所示,其中wi表示第i个视角上的权重;z
i,t
表示第t时刻数据划分在第i个视角聚类中的重要程度;x
j,k
表示k类别第j个流量数据样本;v
i,k
是目标域中第i个视角的第k类的聚类中心;k表示车辆请求流量属于第k类别;请求流量的类别c,本发明针对的请求流量类别大体分为六类,故c取6;γ为平衡因子,γ>0。
[0020][0021]
步骤1.6、车辆访问流量的隶属度z={z
i,t
},其中||x
j,k-v
i,k
||2表示在k类型数据上的第j个样本与目标域中第i个视角的第k类的聚类中心之间的距离,具体迭代公式如下1.3所示;wi表示第i个视角上的权重;u
kj,t
表示在t时刻数据上的第j个样本相对于第k个类中心的隶属度;n表示样本数量;η∈[0,1]称为平衡因子;x
j,k
表示k类别第j个流量数据样本;v
i,k
是目标域中第i个视角的第k类的聚类中心;请求流量的类别c,本发明针对的请求流量类别大体分为六类,故c取6。
[0022][0023]
步骤1.7、车辆访问流量的聚类类别的权重w={wi}迭代公式如1.4所示。请求流量的类别c;n表示样本数量;z
i,t
表示第t时刻数据划分在第i个视角聚类中的重要程度;u
kj,t
表示在t时刻数据上的第j个样本相对于第k个类中心的隶属度;x
j,k
表示k类别第j个流量数据样本;v
i,k
是目标域中第i个视角的第k类的聚类中心;η∈[0,1]称为平衡因子;
[0024][0025]
步骤1.8、若||u(t+1)-u(t)||f<ε或累计迭代时间超过设置的阈值中止,否则t=t+1,并返回步骤1.3;
[0026]
步骤1.9、输出当前数据集最优类中心v,即终端车辆六大类请求流量的类型中心,隶属度u,划分融合矩阵z和多模态权重w。
[0027]
本发明的有益效果:本发明在极大熵算法的基础上引入融合权重矩阵来实现多模态的融合,即融合多模态的极大熵聚类算法。并将该算法应用到新能源车辆管理平台的流量实时监控中,通过调整每个类型信息上的权重来突出某个类型数据的重要性,然后通过类中心迁移学习的方法保护数据隐私,以此能够快速识别流量来保证系统稳定安全的运行。
附图说明
[0028]
图1是整体流程示意图
[0029]
图2是新能源车辆管理平台架构图,从而指出监控服务所在的位置
[0030]
图3是具体算法示意图
具体实施方式
[0031]
2.1迁移学习策略
[0032]
传统的模糊划分聚类算法基本上都是以欧式距离来计算每个待分类样本到类中心的隶属度。因此在聚类任务目标数据集比较密集或污染的情况下,使用传统的聚类算法得到的类中心往往趋于一致,从而导致最终的聚类任务失败。本发明针对传统的极大熵提出迁移学习策略,在mec算法中加入惩罚项,使其聚类类中心相互远离,从而有效避免其类中心趋于一致的问题,具体公式如2.1。
[0033][0034]
在2.1公式中λ》0,表示上一次聚类中心中的第s类的类中心,c是指定的分类数量,λ为平衡因子,vi是目标域中第i个视角的类中心,k表示自定义的视角数量(车辆发送操作请求指令的不同模块数)。根据公式只有在当前类中心尽可能的远离其余类别类中心才能取到最小的值,而通过此对抗惩罚项可以确保在任一聚类任务中都能够使得类中心相互排斥远离,从而在不借助其余知识的前提下就能够彻底解决聚类类中心一致的问题,就是历史数据的抽象出来的高级知识。
[0035]
2.2融合权重矩阵策略
[0036]
为了解决传统极大熵聚类算法在多模态聚类任务中无法获取令人满意的聚类结果的问题,本发明引入了融合权重矩阵策略,具体公式如下:
[0037][0038]
其中k是车辆发送操作请求指令的不同模块数,wk表示第k个类型数据上的权重,c表示类别总数、n表示样本总数,||x
j,k-v
i,k
||2表示在k类型数据上的第j个样本与第i个视角的类中心之间的距离,u
kj,t
表示在t时刻数据上的第j个样本相对于第k个类中心的隶属度,v
i,k
是目标域中第i个视角的第k类的聚类中心,z
i,t
表示第t时刻数据划分在第i个视角聚类中的重要程度。其中是划分融合项,实现了不同视角划分重要性是否属于第i个视角上的聚类结果的融合。
[0039]
2.3算法描述
[0040]
将2.1中提出的类中心惩罚项和2.2提出的融合权重矩阵两个策略应用在传统的极大熵聚类算法上,我们可以构建出融合多模态极大熵聚类算法(multi-view clustering algorithm,mvca),对于一个多模态样本数据集x={view1,view2,view3,......viewk},其中k表示有k个类型数据,其中k≥1,因此mvca具体公式如下:
[0041][0042]
上式中的约束项如下
[0043][0044][0045][0046]
公式2.3~2.6中,wi表示第i个视角上的权重,c表示类别总数、n表示样本总数,||x
j,k-v
i,k
||2表示在k类型数据上的第j个样本与目标域中第i个视角的第k类的聚类中心之间的距离,u
kj,t
表示在t时刻数据上的第j个样本相对于第k个类中心的隶属度,v
i,k
是目标域中第i个视角的第k类的聚类中心,z
i,t
表示第t时刻数据划分在第i个视角(车辆发送操作请求指令的不同模块)聚类中的重要程度。公式中的α,γ,η,λ,k,k,c均为非负数。
[0047]
根据lagrange条件极值最优解的方法可解出式(2.2)类中心和隶属度的迭代公式。我们首先构建lagrange表达式,如下,其中αj为lagrange乘子:
[0048][0049]
分别求l
mvca
(u,z,w,v)关于u
kj,t
和v
i,k
的偏导数可得其迭代公式,具体推到如下。
[0050]
(1)类中心迭代公式
[0051]
令则
[0052][0053]
解之得类中心vi迭代公式:
[0054][0055]
(2)隶属度迭代公式
[0056]
令则
[0057][0058]
根据并结合1.10可以解得
[0059][0060]
(3)划分融合权重迭代公式
[0061]
因为可以构建2.7的lagrange表达式,由于同理也可以构建起lagrange表达式。具体如
[0062][0063]
因此
[0064][0065]
同理可以得到多模态重要性迭代公式。
[0066][0067]
(4)多模态权重迭代公式
[0068]
同理根据多模态权重矩阵的约束项,也可以构建起表达式。具体如
[0069][0070]
同理可以得到多模态权重迭代公式:
[0071][0072]
mvca算法的具体步骤如下:
[0073][0074]
新能源车辆管理流量采集是通过扫描各个组件中各自任务列表内的任务,获取各个组件模块需要采集的对象,然后通过snmp的网络监控方式进行数据采集,并将采集到端口字节信息和时间作为一条数据写入消息服务队列中,分析服务模块会读取消息队列来获取到数据,然后进行分析和存放。其整体数据信息如图1所示。该方法中需要利用的永久化新能源车辆管理数据库中的历史高级知识10,数据采集模块20,多模态聚类算法30,根据聚类结果进行判断处理的模块40和最终流量结果输出50。
[0075]
图2是本发明基于的新能源车辆管理平台架构图,图中指出本发明监控服务所在的位置。因本发明方法是基于新能源车辆管理平台的,有些功能比如消息总线就可以借用平台的功能,平台的其他功能模块非发明专利部分只作简单展示。
[0076]
本次聚类算法主要应用在从消息队列读取数据并进行分析模块中,由于从持久化数据库读取到的信息涵括了新能源车辆管理平台中的多样化的组件流量,其中包括组件端口信息,端口数据,数据颗粒度,链路流量,访问量,cpu使用情况,流速,带宽利用率,丢包率,错包率,用户ip和访问时间等信息。然后基于持久化的数据信息来进行历史知识总结,根据安文娟提出的流量分类方法,可以对历史数据按六类进行分类中介,并将总结出的信息作为历史高级知识应用在当前流量分类中。由于不同组件模块的流量具有自身特性,因此为了充分考虑不同组件间的特性,本发明算法采用多模态的方式来完成不同组件间流量的监控。具体的算法示意图如图3所示。永久化在新能源车辆管理数据库中的历史高级知识
32是通过对历史的流量信息31进行聚类算法总结得出的。然后将这写信息应用在当前的聚类任务中,根据当前的流量信息33然后基于多模态聚类算法来获取当前的聚类算法34测试从而实现能够快速识别流量来保证系统稳定安全的运行。
[0077]
根据上述方法,我们选择几个经典的聚类算法进行对比,从实验中,可以发现本发明所提的方法在各个实验中都具有更好的效果。
[0078][0079]
通过mvac算法进行分析后,可以从网络的性能,带宽,成本,使用体验,用户感知等方面出发来实现最优化的网络配置
[0080]
综上所述,在互联网飞速发展的背景下,为了服务新能源车企,满足海量web应用的快速部署,自动维护,自动监控,自动扩容等需求,从而产生了新能源车辆管理平台技术。与此同时,如何在确保新能源车辆管理平台中数据隐私性的前提下来完成整个数据的实时监控的问题也随之出现。为了解决上述问题,相关研究人员提出了利用聚类算法来实现新能源车辆管理中流量自动分类,但新能源车辆管理系统中组件多样性不仅可能导致流量失真,而且每个模块中的流量监控方式不同,因此使用传统的聚类算法很难取得满意的结果。针对此问题,本发明在极大熵算法的基础上引入融合权重矩阵来实现多模态的融合,即融合多模态的极大熵聚类算法。并将该算法应用到新能源车辆管理平台的流量实时监控中,通过调整每个类型信息上的权重来突出某个类型数据的重要性,然后通过类中心迁移学习的方法保护数据隐私,以此能够快速识别流量来保证系统稳定安全的运行。
[0081]
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1