本技术涉及计算机,特别涉及一种源站的检测方法、装置、电子设备及计算机存储介质。
背景技术:
1、目前,自媒体时代下的各类平台逐渐越来越多,对于平台下的实时舆情内容检测的需求也越来越高。
2、现有技术中,对多种平台下的各类用户监控,并且收集各类舆情信息的效率非常,并占用了大量的资源消耗。如何在不影响监控效率,确定源站的耗能,以便后续进行合理规划,成为了急需解决的问题。
技术实现思路
1、有鉴于此,本技术提供一种源站的检测方法、装置、电子设备及计算机存储介质,有效的提高了监控效率以及降低时延,同时确定源站的耗能,并可以根据源站的耗能,在后续对源站系统进行合理的规划。
2、本技术第一方面提供了一种源站的检测方法,包括:
3、针对每一个源站,当对所述源站中的目标账户进行检测时,记录所述目标账户的目标数据;其中,所述目标账户为需要进行监控的账户;所述目标账户的目标数据至少包括:更新项目以及更新项目的数量;
4、根据日空间的时间分片数量、所述更新项目和每日数据进行向量化的周期生成目标矩阵;
5、根据所述目标矩阵,确定所述目标账户的的日请求量;
6、根据所有所述目标账户的日请求量,确定所述源站的日请求量;
7、根据所述源站的日请求量以及源站的日最大请求量,确定源站系统整体的耗能。
8、可选的,所述根据日空间的时间分片数量、所述更新项目和每日数据进行向量化的周期生成目标矩阵,包括:
9、通过连续时间记录更新项目,得到目标数据表格;
10、根据日空间的时间分片数量以及所述目标数据表格,建立目标函数;
11、通过所述目标函数将每日数据进行向量化统计,得到第一目标向量;其中,所述第一目标向量至少包括第一权向量;所述第一权向量表示所述目标账户内对应时间分片下的更新次数;
12、基于所述第一权向量、所述日空间的时间分片数量和每日数据进行向量化的周期生成目标矩阵。
13、可选的,所述第一目标向量还包括第二权向量,所述第二权向量表示所述目标账户内对应时间分片下的文章数量,所述源站的检测方法,还包括:
14、根据所述第一权向量、所述第二权向量以及第二目标向量确定目标时间分片数量;其中,所述第二目标向量为对于所述第一权向量和所述第二权向量存在唯一且相等的n维基向量;所述目标分片数量为最合理的分片数量。
15、可选的,所述根据所述目标矩阵,确定所述目标账户的的日请求量,包括:
16、对所述目标矩阵中的每一个分列进行合理性矫正,得到目标二进制分布序列;其中,所述目标二进制分布序列满足伯努利分布;
17、将所述目标二进制分布序列带入预测模型,输出得到更新概率序列;其中,所述更新概率序列包括所述账号在每一个时间分片下的更新概率;
18、根据所述更新概率序列,生成轮询频率序列;
19、根据轮询频率序列和时间切片的单位时长计算得到所述目标账户的日请求量;其中,所述时间切片的单位时长为总时长与时间分片数量的商。
20、可选的,所述将所述目标二进制分布序列带入预测模型,输出得到更新概率序列,包括:
21、将所述目标二进制分布序列带入自回归模型中进行计算,得到目标转移概率;
22、根据所述目标转移概率,确定更新概率序列;其中,所述更新概率序列包括所述账号在每一个时间分片下的更新概率。
23、可选的,所述目标账户的目标数据还可以包括所述目标账户的更新时间、源站系统检测到所述目标账户更新时的时间和源站系统检测的延迟时间;所述源站系统检测的延迟时间为所述源站系统检测到所述目标账户更新时的时间与所述目标账户的更新时间的差,所述源站的检测方法,还包括:
24、根据所述源站系统检测的延迟时间以及通过连续时间记录更新项目的次数确定当前检测环境的检测延迟;
25、根据日发帖次数以及目标检测延迟,确定使用所述预测模型后的检测延迟;其中,所述日发帖次数为所有源当日发帖次数的平均值;所述目标检测延迟为使用所述预测模型后的延迟时间;
26、根据所述使用所述预测模型后的检测延迟和所述当前环境下的检测效率的比例,确定源站系统整体的提升效率。
27、可选的,所述源站的检测方法,还包括:
28、针对每一个源站,根据所述源站中的目标账户数量和所述源站的日最大请求量,确定轮询的时间间隔的范围。
29、本技术第二方面提供了一种源站的检测装置,包括:
30、第一记录单元,用于针对每一个源站,当对所述源站中的目标账户进行检测时,记录所述目标账户的目标数据;其中,所述目标账户为需要进行监控的账户;所述目标账户的目标数据至少包括:更新项目以及更新项目的数量;
31、第一生成单元,用于根据日空间的时间分片数量、所述更新项目和每日数据进行向量化的周期生成目标矩阵;
32、第一确定单元,用于根据所述目标矩阵,确定所述目标账户的的日请求量;
33、第二确定单元,用于根据所有所述目标账户的日请求量,确定所述源站的日请求量;
34、第三确定单元,用于根据所述源站的日请求量以及源站的日最大请求量,确定源站源站系统整体的耗能。
35、可选的,所述第一生成单元,包括:
36、第二记录单元,用于通过连续时间记录更新项目,得到目标数据表格;
37、建立单元,用于根据日空间的时间分片数量以及所述目标数据表格,建立目标函数;
38、向量化统计单元,用于通过所述目标函数将每日数据进行向量化统计,得到第一目标向量;其中,所述第一目标向量至少包括第一权向量;所述第一权向量表示所述目标账户内对应时间分片下的更新次数;
39、第一生成子单元,用于基于所述第一权向量、所述日空间的时间分片数量和每日数据进行向量化的周期生成目标矩阵。
40、可选的,所述第一目标向量还包括第二权向量,所述第二权向量表示所述目标账户内对应时间分片下的文章数量,所述源站的检测装置,还包括:
41、第四确定单元,用于根据所述第一权向量、所述第二权向量以及第二目标向量确定目标时间分片数量;其中,所述第二目标向量为对于所述第一权向量和所述第二权向量存在唯一且相等的n维基向量;所述目标分片数量为最合理的分片数量。
42、可选的,所述第一确定单元,包括:
43、矫正单元,用于对所述目标矩阵中的每一个分列进行合理性矫正,得到目标二进制分布序列;其中,所述目标二进制分布序列满足伯努利分布;
44、带入单元,用于将所述目标二进制分布序列带入预测模型,输出得到更新概率序列;其中,所述更新概率序列包括所述账号在每一个时间分片下的更新概率;
45、第二生成单元,用于根据所述更新概率序列,生成轮询频率序列;
46、计算单元,用于根据轮询频率序列和时间切片的单位时长计算得到所述目标账户的日请求量;其中,所述时间切片的单位时长为总时长与时间分片数量的商。
47、可选的,所述带入单元,包括:
48、带入子单元,用于将所述目标二进制分布序列带入自回归模型中进行计算,得到目标转移概率;
49、第五确定单元,用于根据所述目标转移概率,确定更新概率序列;其中,所述更新概率序列包括所述账号在每一个时间分片下的更新概率。
50、可选的,所述目标账户的目标数据还可以包括所述目标账户的更新时间、源站系统检测到所述目标账户更新时的时间和源站系统检测的延迟时间;所述源站系统检测的延迟时间为所述源站系统检测到所述目标账户更新时的时间与所述目标账户的更新时间的差,所述源站的检测装置,还包括:
51、第六确定单元,用于根据所述源站系统检测的延迟时间以及通过连续时间记录更新项目的次数确定当前检测环境的检测延迟;
52、第七确定单元,用于根据日发帖次数以及目标检测延迟,确定使用所述预测模型后的检测延迟;其中,所述日发帖次数为所有源当日发帖次数的平均值;所述目标检测延迟为使用所述预测模型后的延迟时间;
53、第八确定单元,用于根据所述使用所述预测模型后的检测延迟和所述当前环境下的检测效率的比例,确定源站系统整体的提升效率。
54、可选的,源站的检测装置,还包括:
55、第九确定单元,用于针对每一个源站,根据所述源站中的目标账户数量和所述源站的日最大请求量,确定轮询的时间间隔的范围。
56、本技术第三方面提供了一种电子设备,包括:
57、一个或多个处理器;
58、存储装置,其上存储有一个或多个程序;
59、当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如第一方面中任意一项所述的源站的检测方法。
60、本技术第四方面提供了一种计算机存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如第一方面中任意一项所述的源站的检测方法。
61、由以上方案可知,本技术提供一种源站的检测方法、装置、电子设备及计算机存储介质,所述源站的检测方法包括:首先,针对每一个源站,当对所述源站中的目标账户进行检测时,记录所述目标账户的目标数据;其中,所述目标账户为需要进行监控的账户;所述目标账户的目标数据至少包括:更新项目以及更新项目的数量;之后,根据日空间的时间分片数量、所述更新项目和每日数据进行向量化的周期生成目标矩阵;再根据所述目标矩阵,确定所述目标账户的的日请求量;根据所有所述目标账户的日请求量,确定所述源站的日请求量;最后,根据所述源站的日请求量以及源站的日最大请求量,确定源站系统整体的耗能。有效的提高了监控效率以及降低时延,同时确定源站的耗能,并可以根据源站的耗能,在后续对源站系统进行合理的规划。