一种数据处理方法、装置、设备以及可读存储介质与流程

文档序号:35051030发布日期:2023-08-06 03:49阅读:18来源:国知局
一种数据处理方法、装置、设备以及可读存储介质与流程

本技术涉及计算机,尤其涉及一种数据处理方法、装置、设备以及可读存储介质。


背景技术:

1、对于某个业务应用(如互联网行业中的网盘应用),不同使用者对业务应用的使用行为路径,可以用于业务应用经营者进行分析以对应用进行优化。其可以为业务应用实现理想的数据驱动,为布局调整提供科学指导。而为让业务应用的使用者沿着最优访问路径前进,需要策展者结合需求与使用则的使用行为路径对业务应用的功能进行布局调整。这种通过使用者的使用行为路径来对业务应用进行分析优化的方法,对业务应用涉及的优化与改进有很大的帮助,可以用于监测和优化各模块的转化率,也可以发现某些冷僻的功能点。

2、相关技术中,在获取使用者在业务应用中的使用行为路径时,需要获取到使用者的每一个使用行为,然后基于每个使用行为来生成使用行为路径。然而,对于不同的业务应用,其业务功能是具有多样性与复杂性的,使用者对于业务应用的使用行为是混乱重复的,那么所生成的使用行为路径是非常冗余累赘的,这将严重增加路径分析的难度,降低路径分析的效率与效果;而为了减少使用行为路径的冗余性,相关技术采用局部路径生成方法,通过对局部的使用行为来生成使用行为路径,但是这种方法所获取的使用行为路径较短,不够全面,仅适用于对局部功能进行分析,所得到的路径分析结果也不够准确全面。可见,当前亟需一种可以全面准确地生成低冗余的使用行为路径的方式,用以便捷准确地进行路径分析。


技术实现思路

1、本技术实施例提供一种数据处理方法、装置、设备以及可读存储介质,可以简化业务应用的使用路径表达,提升生成路径的全面准确性。

2、本技术实施例一方面提供了一种数据处理方法,包括:

3、基于使用对象在业务应用中所执行的n个操作行为,构建使用路径向量;n为正整数;使用路径向量记录有n个操作行为中每个操作行为分别对应的行为节点;

4、基于使用路径向量中n个行为节点的节点重复属性,确定使用路径向量的路径压缩规则;

5、按照路径压缩规则对使用路径向量中的n个行为节点进行节点去重处理,得到使用路径向量对应的压缩路径向量;

6、若压缩路径向量存在异常,则基于压缩路径向量与参考路径向量集合中每个参考路径向量之间的向量相似度,对压缩路径向量进行路径修复处理,得到压缩路径向量对应的修复路径向量。

7、本技术实施例一方面提供了一种数据处理装置,包括:

8、向量构建模块,用于基于使用对象在业务应用中所执行的n个操作行为,构建使用路径向量;n为正整数;使用路径向量记录有n个操作行为中每个操作行为分别对应的行为节点;

9、规则确定模块,用于基于使用路径向量中n个行为节点的节点重复属性,确定使用路径向量的路径压缩规则;

10、节点去重模块,用于按照路径压缩规则对使用路径向量中的n个行为节点进行节点去重处理,得到使用路径向量对应的压缩路径向量;

11、路径修复模块,用于若压缩路径向量存在异常,则基于压缩路径向量分别与参考路径向量集合中每个参考路径向量之间的向量相似度,对压缩路径向量进行路径修复处理,得到压缩路径向量对应的修复路径向量;每个参考路径向量所包含的行为节点的节点属性均为操作正常属性。

12、在一个实施例中,向量构建模块基于使用对象在业务应用中所执行的n个操作行为,构建使用路径向量的具体实现方式,包括:

13、获取使用对象在业务应用中所执行的n个操作行为,确定n个操作行为中每个操作行为分别对应的行为节点,得到n个行为节点;使用对象通过执行n个操作行为完成与业务应用相匹配的业务流程;n个操作行为包括操作行为si,n个行为节点包括行为节点ki,i为正整数;

14、获取操作行为si的操作执行时刻,将操作行为si的操作执行时刻确定为行为节点ki对应的节点时刻;

15、确定n个行为节点中每个行为节点分别对应的节点时刻,按照n个节点时刻之间的时间早晚顺序,将n个行为节点进行排序,得到行为节点序列;

16、按照行为节点序列的排列顺序对n个行为节点进行向量构建处理,得到使用路径向量。

17、在一个实施例中,向量构建模块按照行为节点序列的排列顺序对n个行为节点进行向量构建处理,得到使用路径向量的具体实现方式,包括:

18、按照行为节点序列的排列顺序,依次将行为节点序列中处于相邻序列位置的两个行为节点确定为一组节点对,得到n-1组节点对;n-1组节点对包含节点对wj,j为正整数;

19、在节点对wj包含的第一行为节点与第二行为节点之间,构建从第一行为节点指向第二行为节点的边,得到节点对wj对应的有向边;行为节点序列中,第一行为节点位于第二行为节点之前;

20、当得到n-1组节点对中每组节点对分别对应的有向边时,将包含行为节点序列以及n-1组有向边的向量,确定为使用路径向量。

21、在一个实施例中,业务应用提供不同的特定核心功能,业务应用所提供的特定核心功能,是由业务应用的应用开发对象将业务应用的配置功能集合中的常规功能进行过滤后所得到的;使用对象在业务应用中所执行的操作行为,是基于业务应用所提供的特定核心功能所产生的。

22、在一个实施例中,规则确定模块基于使用路径向量中n个行为节点的节点重复属性,确定使用路径向量的路径压缩规则的具体方式,包括:

23、获取使用路径向量中n个行为节点的节点重复属性;

24、在节点重复属性为单节点重复属性时,将配置压缩规则集合中的单节点压缩规则确定为使用路径向量的路径压缩规则;

25、在节点重复属性为多节点重复属性时,将配置压缩规则集合中的多节点压缩规则确定为使用路径向量的路径压缩规则;

26、在节点重复属性为混合节点重复属性时,将配置压缩规则集合中的混合节点压缩规则确定为使用路径向量的路径压缩规则;混合节点压缩规则包含单节点压缩规则与多节点压缩规则。

27、在一个实施例中,使用路径向量中n个行为节点的节点重复属性为混合节点重复属性,路径压缩规则为混合节点压缩规则;

28、节点去重模块按照路径压缩规则对使用路径向量中的n个行为节点进行节点去重处理,得到使用路径向量对应的压缩路径向量的具体方式,包括:

29、按照混合节点压缩规则中包含的单节点压缩规则,对使用路径向量中的n个行为节点进行单节点去重处理,得到中间去重路径向量;

30、按照混合节点压缩规则中包含的多节点压缩规则,对中间去重路径向量进行多节点去重处理,得到使用路径向量对应的压缩路径向量。

31、在一个实施例中,节点去重模块按照混合节点压缩规则中包含的单节点压缩规则,对使用路径向量中的n个行为节点进行单节点去重处理,得到中间去重路径向量的具体方式,包括:

32、按照混合节点压缩规则中包含的单节点压缩规则,在使用路径向量中获取连续重复的q个行为节点;q为大于1且小于n的正整数;

33、将连续重复的q个行为节点均确定为待去重节点,将使用路径向量中的q-1个待去重节点进行删除处理;

34、将删除q-1个待去重节点后的使用路径向量确定为中间去重路径向量。

35、在一个实施例中,节点去重模块按照混合节点压缩规则中包含的多节点压缩规则,对中间去重路径向量进行多节点去重处理,得到使用路径向量对应的压缩路径向量的具体方式,包括:

36、按照混合节点规则中包含的多节点压缩规则,统计中间去重路径向量所包含的行为节点的第一节点数量;

37、基于第一节点数量对中间去重路径向量进行子集长度配置处理,得到中间去重路径向量对应的可选子集长度;可选子集长度小于或等于第一节点数量的一半;

38、按照可选子集长度对中间去重路径向量包含的行为节点进行节点分组处理,得到节点分组子集集合;

39、对节点分组子集集合进行子集去重处理,得到使用路径向量对应的压缩路径向量。

40、在一个实施例中,节点去重模块按照可选子集长度对中间去重路径向量包含的行为节点进行节点分组处理,得到节点分组子集集合的具体方式,包括:

41、按照可选子集长度,基于中间去重路径向量中行为节点的排列顺序,依次获取d个起始可选节点,得到起始可选节点序列;d为正整数;起始可选节点序列中,位于序列起始位置的起始可选节点是指中间去重路径向量中位于路径起始位置的行为节点;起始可选节点序列中的两个相邻起始可选节点,在中间去重路径向量中间隔e个行为节点;e是将可选子集长度进行递减处理后所得到的;d个起始可选节点包含起始可选节点sv,v为正整数;

42、按照中间去重路径向量中行为节点的排列顺序,在中间去重路径向量中依次获取位于起始可选节点sv之后的e个行为节点;

43、按照中间去重路径向量中行为节点的排列顺序,依次将起始可选节点sv与位于起始可选节点sv之后的e个行为节点进行排列,将排列得到的节点序列确定为起始可选节点sv对应的节点分组子集;

44、当确定出d个起始可选节点中,每个起始可选节点分别对应的节点分组子集时,将每个起始可选节点分别对应的节点分组子集所组成的集合确定为节点分组子集集合。

45、在一个实施例中,节点分组子集集合包括节点分组子集ra,a为正整数;节点分组子集ra为w个行为节点所组成的节点序列;w为可选子集长度;

46、节点去重模块对节点分组子集集合进行子集去重处理,得到使用路径向量对应的压缩路径向量的具体方式,包括:

47、将节点分组子集ra中位于序列起始位置的行为节点确定为目标行为节点,将目标行为节点在中间去重路径向量中所处的路径位置,确定为节点分组子集ra对应的子集位置;

48、当确定出节点分组子集集合中,每个节点分组子集分别对应的子集位置时,按照每个节点分组子集分别对应的子集位置将每个节点分组子集进行排序,得到子集序列;

49、将子集序列中连续重复的g个节点分组子集均确定为待去重子集,将子集序列中的g-1个待去重子集进行删除处理;g为大于1且小于节点分组子集集合中,所包含的节点分组子集的子集总数量的正整数;

50、将删除g-1个待去重子集后的子集序列确定为使用路径向量对应的压缩路径向量。

51、在一个实施例中,在节点去重模块按照路径压缩规则对使用路径向量中的n个行为节点进行节点去重处理,得到使用路径向量对应的压缩路径向量之后,数据处理装置还包括:

52、属性确定模块,用于对压缩路径向量中所包含的行为节点进行节点检测处理,确定压缩路径向量中所包含的行为节点的节点属性;

53、异常确定模块,用于在压缩路径向量中存在节点属性为操作故障属性的行为节点时,确定压缩路径向量存在异常。

54、在一个实施例中,路径修复模块基于压缩路径向量与参考路径向量集合中每个参考路径向量之间的向量相似度,对压缩路径向量进行路径修复处理,得到压缩路径向量对应的修复路径向量的具体方式,包括:

55、获取参考路径向量集合,确定压缩路径向量分别与参考路径向量集合中每个参考路径向量之间的向量相似度,得到向量相似度集合;

56、在向量相似度集合中获取最大向量相似度,将参考路径向量集合中最大向量相似度所指示的参考路径向量,确定为压缩路径向量对应的目标路径向量;

57、按照目标路径向量所包含的行为节点,对压缩路径向量所包含的行为节点进行修正处理,得到压缩路径向量对应的修复路径向量。

58、在一个实施例中,参考路径向量集合中包括参考路径向量lb,b为正整数;向量相似度集合中包括压缩路径向量与参考路径向量lb之间的向量相似度;

59、路径修复模块确定压缩路径向量分别与参考路径向量集合中每个参考路径向量之间的向量相似度,得到向量相似度集合的具体方式,包括:

60、确定压缩路径向量转换为参考路径向量lb的最少编辑频率;

61、将频率映射表中与最少编辑频率具有映射关系的相似度,确定为压缩路径向量与参考路径向量lb之间的向量相似度;频率映射表包括编辑频率集合与相似度集合之间的映射关系,编辑频率集合中的一个编辑频率与相似度集合中的一个相似度之间存在映射关系。

62、在一个实施例中,在路径修复模块得到压缩路径向量对应的修复路径向量之后,数据处理装置还包括:

63、向量过滤模块,用于将参考路径向量集合中与修复路径向量相同的参考路径向量进行过滤处理,得到过滤参考路径向量集合;

64、集合确定模块,用于将修复路径向量与过滤参考路径向量集合中的每个参考路径向量,均确定为聚类路径向量,得到聚类路径向量集合;

65、聚类模块,用于对聚类路径向量集合进行聚类处理,得到包含j个类簇的类簇分布结果;j个类簇的一个类簇中包含一个或多个聚类路径向量;j为大于1的正整数;

66、核心向量获取模块,用于获取j个类簇中每个类簇的类簇中心,将j个类簇中心均确定为业务应用的核心路径向量;

67、推送模块,用于将j个核心路径向量推送至业务应用的应用运营对象,以使应用运营对象基于j个核心路径向量对业务应用进行分析运营处理。

68、本技术实施例一方面提供了一种计算机设备,包括:处理器和存储器;

69、存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行本技术实施例中的方法。

70、本技术实施例一方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序包括程序指令,程序指令当被处理器执行时,执行本技术实施例中的方法。

71、本技术的一个方面,提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机程序,处理器执行该计算机程序,使得该计算机设备执行本技术实施例中一方面提供的方法。

72、在本技术实施例中,对于业务应用中的使用行为路径,可以以向量进行量化,具体的,在使用对象在业务应用中执行n个操作行为后,可以构建记录有各个操作行为对应的行为节点的使用路径向量,而通过向量量化使用行为路径的方式,可以利用向量的运算特性,统计出使用路径向量中连续重复的行为节点,并对连续重复的行为节点进行去重处理,从而可以减少路径冗余,无需采用局部路径生成方法,即可起到路径压缩作用,且本技术所得到的压缩路径向量,并非仅包含局部的操作行为,而是覆盖有使用对象在业务应用中的整体全面的操作行为,由此可以很好地实现路径的全面性与准确性。此外,由于业务应用的版本升级、测试等情况,使用对象在业务应用的使用过程中可能出现使用异常的情况,而本技术对于异常的路径(如压缩路径向量存在异常时),可以利用向量的运算特性,利用异常的压缩路径向量与参考路径向量之间的向量相似度,来对异常的压缩路径向量进行路径修复处理,使之转换为非异常的路径,由此可以进一步提升路径的准确性与合理性。综上,本技术可以以向量量化使用对象在业务应用中的使用路径,利用向量的运算特征可以对路径向量进行去重处理以及修复处理,从而可以在简化业务应用的使用路径表达的同时,提升生成路径的全面准确性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1