数据打标方法、装置、存储介质和设备与流程

文档序号:32341232发布日期:2022-11-26 09:51阅读:142来源:国知局
数据打标方法、装置、存储介质和设备与流程

1.本技术涉及大数据领域,尤其涉及一种数据打标方法、装置、存储介质和设备。


背景技术:

2.金融企业为了更好地服务客户,通常会安排专业人员对业务系统所生成的客户数据进行分析,得到客户对金融业务的满意度和期望值,并依据客户的满意度和期望值来调整金融业务。然而,由于客户数据的类型较多、且数据量较大,仅凭人工对客户数据进行分析,工作量较大,工作难度也会较高,从而降低客户数据的分析效率。
3.为此,如何提高客户数据的分析效率,成为本领域亟需解决的问题。


技术实现要素:

4.本技术提供了一种数据打标方法、装置、存储介质和设备,目的在于提高客户数据的分析效率。
5.为了实现上述目的,本技术提供了以下技术方案:
6.一种数据打标方法,包括:
7.对从业务系统中获取的各个客户数据进行大数据分析,得到业务场景集合;所述业务场景集合包括多个业务场景,以及与每个所述业务场景对应的客户数据;
8.对于每个所述业务场景,对与所述业务场景对应的客户数据进行解析,得到所述业务场景的词根库;所述词根库包括所述业务场景的关键词、与所述业务场景对应的客户数据的关键词;
9.对所述业务场景的关键词、与所述业务场景对应的客户数据的关键词进行划分,得到所述业务场景的词根树;
10.基于所述词根树,生成所述业务场景的标签生成规则;
11.利用所述标签生成规则,对与所述业务场景对应的客户数据进行打标,得到携带有词根标签的客户数据。
12.可选的,所述基于所述词根树,生成所述业务场景的标签生成规则,包括:
13.对所述词根树进行编译,得到有向图;
14.对所述有向图进行语法转换,得到抽象语法树;
15.对所述抽象语法树进行逻辑转换,得到查询块序列;
16.对所述查询块序列进行分析,得到逻辑查询计划;
17.对所述逻辑查询计划进行物理转换,得到物理查询计划;
18.根据所述物理查询计划,生成决策有向图;所述决策有向图包括标签生成规则。
19.可选的,所述利用所述标签生成规则,对与所述业务场景对应的客户数据进行打标,得到携带有词根标签的客户数据之后,还包括:
20.通过预设界面向用户展示各个所述客户数据,以每个所述客户数据的词根标签。
21.可选的,所述对所述业务场景的关键词、与所述业务场景对应的客户数据的关键
词进行划分,得到所述业务场景的词根树,包括:
22.利用解析树模型算法,对所述业务场景的关键词、与所述业务场景对应的客户数据的关键词进行划分,得到所述业务场景的词根树。
23.一种数据打标装置,包括:
24.大数据分析单元,用于对从业务系统中获取的各个客户数据进行大数据分析,得到业务场景集合;所述业务场景集合包括多个业务场景,以及与每个所述业务场景对应的客户数据;
25.词根解析单元,用于对于每个所述业务场景,对与所述业务场景对应的客户数据进行解析,得到所述业务场景的词根库;所述词根库包括所述业务场景的关键词、与所述业务场景对应的客户数据的关键词;
26.划分单元,用于对所述业务场景的关键词、与所述业务场景对应的客户数据的关键词进行划分,得到所述业务场景的词根树;
27.规则生成单元,用于基于所述词根树,生成所述业务场景的标签生成规则;
28.打标单元,用于利用所述标签生成规则,对与所述业务场景对应的客户数据进行打标,得到携带有词根标签的客户数据。
29.可选的,所述规则生成单元具体用于:
30.对所述词根树进行编译,得到有向图;
31.对所述有向图进行语法转换,得到抽象语法树;
32.对所述抽象语法树进行逻辑转换,得到查询块序列;
33.对所述查询块序列进行分析,得到逻辑查询计划;
34.对所述逻辑查询计划进行物理转换,得到物理查询计划;
35.根据所述物理查询计划,生成决策有向图;所述决策有向图包括标签生成规则。
36.可选的,还包括:
37.展示单元,用于通过预设界面向用户展示各个所述客户数据,以每个所述客户数据的词根标签。
38.可选的,所述划分单元具体用于:
39.利用解析树模型算法,对所述业务场景的关键词、与所述业务场景对应的客户数据的关键词进行划分,得到所述业务场景的词根树。
40.一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,所述程序执行所述的数据打标方法。
41.一种数据打标设备,包括:处理器、存储器和总线;所述处理器与所述存储器通过所述总线连接;
42.所述存储器用于存储程序,所述处理器用于运行程序,其中,所述程序运行时执行所述的数据打标方法。
43.本技术提供的技术方案,对从业务系统中获取的各个客户数据进行大数据分析,得到业务场景集合。业务场景集合包括多个业务场景,以及与每个业务场景对应的客户数据。对于每个业务场景,对与业务场景对应的客户数据进行解析,得到业务场景的词根库。词根库包括业务场景的关键词、与业务场景对应的客户数据的关键词。对业务场景的关键词、与业务场景对应的客户数据的关键词进行划分,得到业务场景的词根树。基于词根树,
生成业务场景的标签生成规则。利用标签生成规则,对与业务场景对应的客户数据进行打标,得到携带有词根标签的客户数据。利用本技术所示方案,可为各个客户数据进行打标,得到携带有词根标签的各个客户数据,以便用户依据词根标签作为参考,对客户数据进行分类,减少客户数据的分析工作量,有效提高客户数据的分析效率。
附图说明
44.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
45.图1a为本技术实施例提供的一种数据打标方法的流程示意图;
46.图1b为本技术实施例提供的一种数据打标方法的流程示意图;
47.图2为本技术实施例提供的另一种数据打标方法的流程示意图;
48.图3为本技术实施例提供的一种数据打标装置的架构示意图;
49.图4为本技术实施例提供的一种数据打标设备的架构示意图。
具体实施方式
50.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
51.如图1a和图1b所示,为本技术实施例提供的一种数据打标方法的流程示意图,包括如下步骤:
52.s101:对从业务系统中获取的各个客户数据进行大数据分析,得到业务场景集合。
53.其中,业务场景集合包括多个业务场景,以及与每个业务场景对应的客户数据。
54.s102:对于每个业务场景,对与业务场景对应的客户数据进行解析,得到业务场景的词根库。
55.其中,词根库包括业务场景的关键词、客户数据的关键词。
56.s103:对业务场景的关键词、与业务场景对应的客户数据的关键词进行划分,得到业务场景的词根树。
57.其中,可以利用解析树模型算法,对业务场景的关键词、与业务场景对应的客户数据的关键词进行划分,得到业务场景的词根树。
58.s104:对业务场景的词根树进行编译,得到业务场景的有向图。
59.s105:对业务场景的有向图进行语法转换,得到业务场景的抽象语法树。
60.s106:对业务场景的抽象语法树进行逻辑转换,得到业务场景的查询块序列。
61.其中,查询块序列包括多个查询块,每个查询块均代表业务场景的一种抽象语法。
62.s107:对业务场景的查询块序列进行分析,得到业务场景的逻辑查询计划。
63.s108:对业务场景的逻辑查询计划进行物理转换,得到业务场景的物理查询计划。
64.s109:根据业务场景的物理查询计划,生成业务场景的决策有向图。
65.其中,决策有向图包括标签生成规则。
66.s110:利用标签生成规则,对与业务场景对应的客户数据进行打标,得到携带有词根标签的客户数据。
67.s111:通过预设界面向用户展示各个客户数据,以每个客户数据的词根标签。
68.综上所述,利用本实施例所示方案,可为各个客户数据进行打标,得到携带有词根标签的各个客户数据,以便用户依据词根标签作为参考,对客户数据进行分类,减少客户数据的分析工作量,有效提高客户数据的分析效率。
69.需要说明的是,上述实施例提及的s101,为本技术所示数据打标方法的一种可选的实现方式。此外,上述实施例提及的s111,也为本技术所示据打标方法的一种可选的实现方式。为此,上述实施例提及的流程,可以概括为图2所示的方法。
70.如图2所示,为本技术实施例提供的另一种数据打标方法的流程示意图,包括如下步骤:
71.s201:对从业务系统中获取的各个客户数据进行大数据分析,得到业务场景集合。
72.其中,业务场景集合包括多个业务场景,以及与每个业务场景对应的客户数据。
73.s202:对于每个业务场景,对与业务场景对应的客户数据进行解析,得到业务场景的词根库。
74.其中,词根库包括业务场景的关键词、与业务场景对应的客户数据的关键词。
75.s203:对业务场景的关键词、与业务场景对应的客户数据的关键词进行划分,得到业务场景的词根树。
76.s204:基于词根树,生成业务场景的标签生成规则。
77.s205:利用标签生成规则,对与业务场景对应的客户数据进行打标,得到携带有词根标签的客户数据。
78.综上所述,利用本实施例所示方案,可为各个客户数据进行打标,得到携带有词根标签的各个客户数据,以便用户依据词根标签作为参考,对客户数据进行分类,减少客户数据的分析工作量,有效提高客户数据的分析效率。
79.需要说明的是,本发明提供的数据打标方法可用于人工智能领域、区块链领域、分布式领域、云计算领域、大数据领域、物联网领域、移动互联领域、网络安全领域、芯片领域、虚拟现实领域、增强现实领域、全息技术领域、量子计算领域、量子通信领域、量子测量领域、数字孪生领域或金融领域。上述仅为示例,并不对本发明提供的数据打标方法的应用领域进行限定。
80.本发明提供的数据打标方法可用于金融领域或其他领域,例如,可用于金融领域中的交易应用场景。其他领域为除金融领域之外的任意领域,例如,电力领域。上述仅为示例,并不对本发明提供的数据打标方法的应用领域进行限定。
81.与上述本技术实施例提供的数据打标方法相对应,本技术实施例还提供了一种数据打标装置。
82.如图3所示,为本技术实施例提供的一种数据打标装置的架构示意图,包括:
83.大数据分析单元100,用于对从业务系统中获取的各个客户数据进行大数据分析,得到业务场景集合;业务场景集合包括多个业务场景,以及与每个业务场景对应的客户数据。
84.词根解析单元200,用于对于每个业务场景,对与业务场景对应的客户数据进行解析,得到业务场景的词根库;词根库包括业务场景的关键词、与业务场景对应的客户数据的关键词。
85.划分单元300,用于对业务场景的关键词、与业务场景对应的客户数据的关键词进行划分,得到业务场景的词根树。
86.可选的,划分单元300具体用于:利用解析树模型算法,对业务场景的关键词、与业务场景对应的客户数据的关键词进行划分,得到业务场景的词根树。
87.规则生成单元400,用于基于词根树,生成业务场景的标签生成规则。
88.可选的,规则生产单元400具体用于:对词根树进行编译,得到有向图;对有向图进行语法转换,得到抽象语法树;对抽象语法树进行逻辑转换,得到查询块序列;对查询块序列进行分析,得到逻辑查询计划;对逻辑查询计划进行物理转换,得到物理查询计划;根据物理查询计划,生成决策有向图;决策有向图包括标签生成规则。
89.打标单元500,用于利用标签生成规则,对与业务场景对应的客户数据进行打标,得到携带有词根标签的客户数据。
90.展示单元600,具体用于:通过预设界面向用户展示各个客户数据,以每个客户数据的词根标签。
91.综上所述,利用本实施例所示方案,可为各个客户数据进行打标,得到携带有词根标签的各个客户数据,以便用户依据词根标签作为参考,对客户数据进行分类,减少客户数据的分析工作量,有效提高客户数据的分析效率。
92.本技术还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的程序,其中,程序执行上述本技术提供的数据打标方法。
93.本技术还提供了一种数据打标设备,如图4所示,包括:处理器401、存储器402和总线403。处理器401与存储器402通过总线403连接,存储器402用于存储程序,处理器401用于运行程序,其中,程序运行时执行上述本技术提供的数据打标方法,包括如下步骤:
94.对从业务系统中获取的各个客户数据进行大数据分析,得到业务场景集合;所述业务场景集合包括多个业务场景,以及与每个所述业务场景对应的客户数据;
95.对于每个所述业务场景,对与所述业务场景对应的客户数据进行解析,得到所述业务场景的词根库;所述词根库包括所述业务场景的关键词、与所述业务场景对应的客户数据的关键词;
96.对所述业务场景的关键词、与所述业务场景对应的客户数据的关键词进行划分,得到所述业务场景的词根树;
97.基于所述词根树,生成所述业务场景的标签生成规则;
98.利用所述标签生成规则,对与所述业务场景对应的客户数据进行打标,得到携带有词根标签的客户数据。
99.具体的,在上述实施例的基础上,所述基于所述词根树,生成所述业务场景的标签生成规则,包括:
100.对所述词根树进行编译,得到有向图;
101.对所述有向图进行语法转换,得到抽象语法树;
102.对所述抽象语法树进行逻辑转换,得到查询块序列;
103.对所述查询块序列进行分析,得到逻辑查询计划;
104.对所述逻辑查询计划进行物理转换,得到物理查询计划;
105.根据所述物理查询计划,生成决策有向图;所述决策有向图包括标签生成规则。
106.具体的,在上述实施例的基础上,所述利用所述标签生成规则,对与所述业务场景对应的客户数据进行打标,得到携带有词根标签的客户数据之后,还包括:
107.通过预设界面向用户展示各个所述客户数据,以每个所述客户数据的词根标签。
108.具体的,在上述实施例的基础上,所述对所述业务场景的关键词、与所述业务场景对应的客户数据的关键词进行划分,得到所述业务场景的词根树,包括:
109.利用解析树模型算法,对所述业务场景的关键词、与所述业务场景对应的客户数据的关键词进行划分,得到所述业务场景的词根树。
110.本技术实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基于这样的理解,本技术实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。
111.本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。
112.对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本技术。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下,在其它实施例中实现。因此,本技术将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1