一种信息确定方法、装置、设备及存储介质与流程

文档序号:29128539发布日期:2022-03-05 00:52阅读:70来源:国知局
一种信息确定方法、装置、设备及存储介质与流程

1.本技术属于通信技术领域,尤其涉及一种信息确定方法、装置、设备及存储介质。


背景技术:

2.随着固定宽带用户的增多,固定宽带运营商为了满足用户的体验需求,需要准确地检测出固定宽带业务流程中使用户体验差的故障点,从而针对使用户体验差的故障点进行优化。
3.目前,一般以用户体验为出发点,通过梳理定宽带业务流程中影响客户体验的环节,对每个环节制定了相应的指标评价体系和装维服务规范,以根据指标评价体系和装维服务规范评价用户体验;或通过在宽带网络的关键环节选取一些无故障节点作为基准,再把其它节点与这些基准节点进行状态差异对比,从而预测其他节点是否有潜在的影响用户体验的故障。
4.现有的方法不能准确确定影响用户体验的故障点。


技术实现要素:

5.本技术实施例提供一种信息确定方法、装置、设备及存储介质,能够确定宽带用户的满意度信息,从而能够根据满意度信息确定影响用户体验的故障点。
6.第一方面,本技术实施例提供一种信息确定方法,该方法包括:
7.获取目标用户的多个维度的宽带指标对应的目标业务数据,其中,多个维度包括基础信息、家庭网络、承载网络、业务质量、服务质量、访问行为中的至少两个维度;
8.将目标业务数据输入第一预测模型,得到多个满意度信息中每个满意度信息对应的概率值,确定最大的概率值对应的满意度信息为目标用户的第一满意度信息,其中,第一预测模型为根据多个维度的宽带指标和多个维度的宽带指标对应的业务数据构建和训练得到的。
9.在一种可能的实现方式中,在将目标业务数据输入第一预测模型之前,该方法还包括:
10.获取训练样本集和测试样本集,训练样本集包括多个训练样本,每个训练样本包括多个维度的宽带指标和多个维度的宽带指标对应的第一业务数据;测试样本集包括多个测试样本,每个测试样本包括实际满意度信息、多个维度的宽带指标和多个维度的宽带指标对应的第二业务数据;
11.采用训练样本集中每个训练样本的多个维度的宽带指标和多个维度的宽带指标对应的第一业务数据,构建和训练多个第二预测模型,得到多个第二预测模型和每个第二预测模型的第一性能信息;
12.采用测试样本集中每个测试样本的多个维度的宽带指标、多个维度的宽带指标对应的第二业务数据和实际满意度信息,分别测试每个第二预测模型,得到每个第二预测模型的第二性能信息;
13.根据第一性能信息和/或第二性能信息,确定满足预设条件的第二预测模型为第一预测模型。
14.在一种可能的实现方式中,采用训练样本集中每个训练样本的多个维度的宽带指标和多个维度的宽带指标对应的第一业务数据,构建和训练多个第二预测模型,得到多个第二预测模型,包括:
15.采用训练样本集中每个训练样本的多个维度的宽带指标和多个维度的宽带指标对应的第一业务数据,通过多粒度扫描多个维度的宽带指标,提取特征向量;
16.根据特征向量和预设的多个满意度信息,构建和训练多个级联森林,得到多个第二预测模型,每个级联森林中的每个随机森林包括至少一种决策树,每种决策树的数量为多个预设数量中的任一预设数量。
17.在一种可能的实现方式中,第一性能信息包括构建和训练的时间,第二性能信息包括准确率。
18.在一种可能的实现方式中,获取训练样本集和测试样本集包括:
19.获取多个样本,每个样本包括多个维度的宽带指标、多个维度的宽带指标对应的原始业务数据和实际满意度信息;
20.对多个样本的原始业务数据中的连续特征数据进行离散化处理,得到第一特征矩阵,第一特征矩阵包括多个维度的宽带指标和多个维度的宽带指标对应的第一原始业务数据,第一原始业务数据表征对原始业务数据离散化处理后的数据;
21.对第一特征矩阵中的第一原始业务数据进行均衡处理,得到第二特征矩阵,第二特征矩阵包括多个维度的宽带指标和多个维度的宽带指标对应的第二原始业务数据,第二原始业务数据表征对第一原始业务数据均衡处理后的数据;
22.划分第二特征矩阵为训练样本集和第一样本集;
23.根据第一样本集和第一样本集中每个样本的实际满意度信息,生成测试样本集。
24.第二方面,本技术实施例提供了一种信息确定装置,该装置包括:
25.获取模块,用于获取目标用户的多个维度的宽带指标对应的目标业务数据,其中,多个维度包括基础信息、家庭网络、承载网络、业务质量、服务质量、访问行为中的至少两个维度;
26.确定模块,用于将目标业务数据输入第一预测模型,得到多个满意度信息中每个满意度信息对应的概率值,确定最大的值对应的满意度信息为目标用户的第一满意度信息,其中,第一预测模型为根据多个维度的宽带指标和多个维度的宽带指标对应的业务数据构建和训练得到的。
27.在一种可能的实现方式中,获取模块,还用于获取训练样本集和测试样本集,训练样本集包括多个训练样本,每个训练样本包括多个维度的宽带指标和多个维度的宽带指标对应的第一业务数据,测试样本集包括多个测试样本,每个测试样本包括实际满意度信息、多个维度的宽带指标和多个维度的宽带指标对应的第二业务数据;
28.装置还包括:
29.构建和训练模块,用于采用训练样本集中每个训练样本的多个维度的宽带指标和多个维度的宽带指标对应的第一业务数据,构建和训练多个第二预测模型,得到多个第二预测模型和每个第二预测模型的第一性能信息;
30.测试模块,用于采用测试样本集中每个测试样本的多个维度的宽带指标、多个维度的宽带指标对应的第二业务数据和实际满意度信息,分别测试每个第二预测模型,得到每个第二预测模型的第二性能信息;
31.确定模块,还用于根据第一性能信息和/或第二性能信息,确定满足预设条件的第二预测模型为第一预测模型。
32.第三方面,本技术实施例提供了一种电子设备,该设备包括:处理器以及存储有计算机程序指令的存储器;处理器执行计算机程序指令时,实现如第一方面或者第一方面的任一可能实现方式中的方法。
33.第四方面,本技术实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如第一方面或者第一方面的任一可能实现方式中的方法。
34.第五方面,本技术实施例提供了一种计算机程序产品,其特征在于,计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备执行如第一方面或者第一方面的任一可能实现方式中的方法。
35.本技术实施例提供的信息确定方法、装置、设备及存储介质,获取了目标用户的多个维度的宽带指标对应的目标业务数据,将目标业务数据输入第一预测模型,得到多个满意度信息中每个满意度信息对应的概率值,确定最大的值对应的满意度信息为得到目标用户的第一满意度信息,由于多个维度包括基础信息、家庭网络、承载网络、业务质量、服务质量、访问行为中的至少两个维度,充分采用了影响用户体验的宽带指标,第一预测模型为根据多个维度的宽带指标和多个维度的宽带指标对应的业务数据构建和训练得到的,所以采用多个维度的宽带指标对应的目标业务数据和第一预测模型能够准确地确定宽带用户的满意度信息,满意度信息反映出用户体验,从而能够根据满意度信息确定影响用户体验的故障点。
附图说明
36.为了更清楚地说明本技术实施例的技术方案,下面将对本技术实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
37.图1是本技术实施例提供的一种信息确定方法的流程示意图;
38.图2是本技术实施例提供的另一种信息确定方法的流程示意图;
39.图3是本技术实施例提供的一种信息确定装置结构示意图;
40.图4是本技术实施例提供的一种电子设备的硬件结构示意图。
具体实施方式
41.下面将详细描述本技术的各个方面的特征和示例性实施例,为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本技术进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本技术,并不被配置为限定本技术。对于本领域技术人员来说,本技术可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本技术的示例来提供对本技术更好的理
解。
42.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括
……”
限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
43.随着固定宽带用户的增多,固定宽带运营商为了满足用户的体验需求,需要准确地检测出固定宽带业务流程中使用户体验差的故障点,从而针对使用户体验差的故障点进行优化。目前,一般以用户体验为出发点,通过梳理定宽带业务流程中影响客户体验的环节,对每个环节制定了相应的指标评价体系和装维服务规范,以根据指标评价体系和装维服务规范评价用户体验;或通过在宽带网络的关键环节选取一些无故障节点作为基准,再把其它节点与这些基准节点进行状态差异对比,从而预测其他节点是否有潜在的影响用户体验的故障。现有的方法不能准确确定影响用户体验的故障点。
44.为解决上述问题,本技术实施例提供一种信息确定方法、装置、设备及存储介质,获取了目标用户的多个维度的宽带指标对应的目标业务数据,将目标业务数据输入第一预测模型,得到多个满意度信息中每个满意度信息对应的概率值,确定最大的值对应的满意度信息为得到目标用户的第一满意度信息,由于多个维度包括基础信息、家庭网络、承载网络、业务质量、服务质量、访问行为中的至少两个维度,充分采用了影响用户体验的宽带指标,第一预测模型为根据多个维度的宽带指标和多个维度的宽带指标对应的业务数据构建和训练得到的,所以采用多个维度的宽带指标对应的目标业务数据和第一预测模型能够准确地确定宽带用户的满意度信息,满意度信息反映出用户体验,从而能够根据满意度信息确定影响用户体验的故障点。
45.本技术实施例提供的方法中发送业务请求端可以是能够进行数据处理的终端,如服务器、电脑等设备。
46.下面将结合图1详细阐述本技术实施例提供的一种信息确定方法。
47.如图1所示,该方法可以包括以下步骤:
48.s110,获取目标用户的多个维度的宽带指标对应的目标业务数据。
49.在技术人员需要维护某区域的宽带网络时,通过终端确定该区域内宽带用户的体验,终端获取目标用户的多个维度的宽带指标对应的目标业务数据。
50.目标用户为上述区域的宽带用户中的任一用户。
51.多个维度可以包括基础信息、家庭网络、承载网络、业务质量、服务质量、访问行为中的至少两个维度。
52.在一个示例中,基础信息、家庭网络、承载网络、业务质量、服务质量和访问行为中的每个维度可以包括至少一个一级宽带指标,每个一级宽带指标可以包括至少一个二级宽带指标,每个维度包括的一级宽带指标、每个一级宽带指标包括的二级宽带指标如表1所示。
53.表1一级维度、二级维度和宽带指标
[0054][0055]
[0056][0057]
[0058]
在上面阐述s110获取目标用户的多个维度的宽带指标对应的目标业务数据的方法后,下面阐述确定目标用户的满意度信息的方法。
[0059]
s120,将目标业务数据输入第一预测模型,得到多个满意度信息中每个满意度信息对应的概率值,确定最大的概率值对应的满意度信息为目标用户的第一满意度信息。
[0060]
终端将目标业务数据输入第一预测模型,得到多个满意度信息中每个满意度信息对应的概率值,第一预测模型确定最大的概率值对应的满意度信息为得到目标用户的第一满意度信息,并输出第一满意度信息。
[0061]
第一预测模型为根据多个维度的宽带指标和多个维度的宽带指标对应的业务数据构建和训练得到的。
[0062]
在一个实施例中,满意度信息可以是“满意”或“不满意”,“满意”反映出目标用户使用宽带时的体验较好;“不满意”反映出目标用户使用宽带时的体验较差。终端通过第一预测模型根据目标业务数据,得到计算得到“满意”对应的概率值和“不满意”对应的概率值,第一预测模型通过比较“满意”对应的概率值和“不满意”对应的概率值,输出最大的概率值对应的满意度信息为目标用户的第一满意度信息。当一满意度信息为“不满意”时,进一步地确定影响用户体验的故障点。
[0063]
本技术实施例提供的信息确定方法,获取了目标用户的多个维度的宽带指标对应的目标业务数据,将目标业务数据输入第一预测模型,得到多个满意度信息中每个满意度信息对应的概率值,确定最大的值对应的满意度信息为得到目标用户的第一满意度信息,由于多个维度包括基础信息、家庭网络、承载网络、业务质量、服务质量、访问行为中的至少两个维度,充分考虑了影响用户体验的宽带指标,第一预测模型为根据多个维度的宽带指标和多个维度的宽带指标对应的业务数据构建和训练得到的,所以采用多个维度的宽带指标对应的目标业务数据和第一预测模型能够准确地确定宽带用户的满意度信息,满意度信息反映出用户体验,从而能够根据满意度信息确定影响用户体验的故障点。
[0064]
在一些实施例中,在将目标业务数据输入第一预测模型之前,即s120,之前,如图2所示,该方法还可以包括以下步骤;
[0065]
s130,获取训练样本集和测试样本集。
[0066]
终端获取样本集,将样本集划分为训练样本集和测试样本集。
[0067]
训练样本集包括多个训练样本,每个训练样本包括多个维度的宽带指标和多个维度的宽带指标对应的第一业务数据;测试样本集包括多个测试样本,每个测试样本包括实际满意度信息、多个维度的宽带指标和多个维度的宽带指标对应的第二业务数据。
[0068]
s140,采用训练样本集中每个训练样本的多个维度的宽带指标和多个维度的宽带指标对应的第一业务数据,构建和训练多个第二预测模型,得到多个第二预测模型和每个第二预测模型的第一性能信息。
[0069]
终端采用训练样本集中每个训练样本的多个维度的宽带指标和多个维度的宽带指标对应的第一业务数据,构建和训练多个第二预测模型,得到多个第二预测模型和每个第二预测模型的第一性能信息。
[0070]
在一个实施例中,第二预测模型为级联森林,终端采用训练样本集中每个训练样本的多个维度的宽带指标和多个维度的宽带指标对应的第一业务数据,多粒度扫描多个维度的宽带指标后,构建和训练多个级联森林,得到多个级联森林。
[0071]
在一个实施例中,第一性能信息包括构建和训练的时间,终端构建和训练得到多个第二预测模型和每个第二预测模型的构建和训练的时间。
[0072]
s150,采用测试样本集中每个测试样本的多个维度的宽带指标、多个维度的宽带指标对应的第二业务数据和实际满意度信息,分别测试每个第二预测模型,得到每个第二预测模型的第二性能信息。
[0073]
终端将测试样本集中每个测试样本的多个维度的宽带指标、多个维度的宽带指标对应的第二业务数据输入每个第二预测模型,得到每个预测模型确定的满意度信息,将每个预测模型确定的满意度信息和实际满意度信息比对,得到每个第二预测模型的第二性能信息。
[0074]
在一个实施例中,第二性能信息包括准确率,终端测试每个第二预测模型,得到每个第二预测模型确定的满意度信息,将每个预测模型确定的满意度信息和实际满意度信息比对,得到每个第二预测模型的准确率。
[0075]
在一个实施例中,终端将测试样本集划分为多个子测试样本集。对于每个第二预测模型,分别将每个子测试样本集输入第二预测模型,得到每个子测试样本集对应的准确率和召回率,计算每份子测试样本对应的准确率和召回率的调和平均数,得到第二预测模型对应的多个调和平均数,计算多个调和平均数的均值,得到第二预测模型的目标调和平均数,目标调和平均数即为第二性能信息。
[0076]
s160,根据第一性能信息和/或第二性能信息,确定满足预设条件的第二预测模型为第一预测模型。
[0077]
技术人员预先根据需求设置预设条件,终端根据第一性能信息和/或第二性能信息,确定多个第二预测模型中,满足预设条件的第二预测模型为第一预测模型。
[0078]
在一个实施例中,第一性能信息包括构建和训练的时间,第二性能信息包括准确率或目标调和平均数,预设条件包括满足构建和训练的时间最短、准确率最高或目标调和平均数最大中的至少一项,确定满足构建和训练的时间最短、准确率最高或目标调和平均数最大中的至少一项的第二预测模型为第一预测模型。
[0079]
本技术实施例提供的方法,终端先获取了训练样本集和测试样本集,根据训练样本集构建和训练了多个第二预测模型,并采用测试样本集测试每个第二预测模型,得到每个第二预测模型的第一性能信息和第二性能信息,将第一性能信息和/或第二性能信息满足预设条件的第二预测模型为第一预测模型,得到了满足需求的第一预测模型,为确定用户的满意度信息提供支持。
[0080]
在一些实施例中,获取训练样本集和测试样本集,即s130可以包括以下步骤:
[0081]
首先,获取多个样本。
[0082]
每个样本包括多个维度的宽带指标、多个维度的宽带指标对应的原始业务数据和实际满意度信息。
[0083]
实际满意度信息包括宽带用户使用宽带时实际的满意度信息。
[0084]
技术人员在维护某区域的宽带网络前,通过终端获取该区域内宽带用户的多个维度的宽带指标对应的原始业务数据和实际满意度信息。
[0085]
在一个示例中,实际满意度信息为“满意”或“不满意”,多个维度的宽带指标如表1所示,终端获取某区域内宽带用户的150000份样本数据,每份样本数据包括多个维度的宽
带指标对应的原始业务数据和每份样本数据的实际满意度信息。
[0086]
其次,对多个样本的原始业务数据中的连续特征数据进行离散化处理,得到第一特征矩阵,第一特征矩阵包括多个维度的宽带指标和多个维度的宽带指标对应的第一原始业务数据。
[0087]
第一原始业务数据表征对原始业务数据离散化处理后的数据。
[0088]
连续特征数据表示在一定取值区间内可以任意取值的宽带指标对应的特征数据。
[0089]
在一个示例中,采用对多个样本的原始业务数据中的连续特征数据使用离散方法c4.5进行离散化处理。
[0090]
在一个示例中,终端获取某区域内宽带用户的150000份样本数据,多个维度的宽带指标如表1所示,共47个宽带指标,其中,持续运行时长、onu光功率、端口速率、业务不可用时长、关联olt上联链路负载、关联pon口链路负载、关联olt上联链路收光光衰、tcp握手时延、http首次响应时延、电视播放时长、宽带在线时长、宽带累计流量和宽带长期未上网时长对应的原始特征数据为连续特征数据,终端对这些宽带指标对应的原始特征数据进行离散化处理,对这些指标以外的宽带指标对应的原始特征数据不进行离散化处理,得到离散化处理后的第一原始业务数据,根据多个维度的宽带指标和每个宽带指标对应的第一原始业务数据,生成第一特征矩阵,第一特征矩阵的维度为150000
×
47,包括150000份样本的47个宽带指标对应的第一原始业务数据。
[0091]
再次,对第一特征矩阵中的第一原始业务数据进行均衡处理,得到第二特征矩阵,第二特征矩阵包括多个维度的宽带指标和多个维度的宽带指标对应的第二原始业务数据。
[0092]
第二原始业务数据表征对第一原始业务数据均衡处理后的数据。
[0093]
终端对第一特征矩阵中的第一原始业务数据中不均衡的数据进行均衡处理,对第一原始业务数据中均衡的数据不进行均衡处理,处理得到均衡处理后的第二原始业务数据,根据多个维度的宽带指标和每个宽带指标对应的第二原始业务数据,生成第二特征矩阵。
[0094]
在一个示例中,第一特征矩阵的维度为150000
×
47,均衡处理后的第一特征矩阵的维度为800000
×
47,包括800000份样本的47个宽带指标对应的第二原始业务数据。
[0095]
再次,划分第二特征矩阵为训练样本集和第一样本集。
[0096]
终端将第二特征矩阵中的样本划分随机为划分为训练样本集和第一样本集,每个样本集中的样本包括多个维度的宽带指标和多个维度的宽带指标对应的第二原始业务数据。
[0097]
在一个示例中,第二特征矩阵的维度为800000
×
47,将800000份样本按照9:1的比例,随机划分到训练样本集和第一样本集,得到包括720000份样本的训练样本集和包括80000份样本的第一样本集。
[0098]
最后,根据第一样本集和第一样本集中每个样本的实际满意度信息,生成测试样本集。
[0099]
终端根据第一样本集中,每个样本和每个样本的实际满意度信息,生成测试样本集。
[0100]
在一个示例中,第一样本集包括80000份样本,终端根据80000份样本和每个样本的实际满意度信息,生成测试样本集。
[0101]
本技术实施例提供的方法,通过对多个样本的原始业务数据进行离散化处理得到第一特征矩阵,对第一特征矩阵进行均衡处理,得到第二特征矩阵,精第二特征矩阵中的样本划分为训练样本集和第一样本集,基于第一样本集中的样本和每个样本的实际满意度信息生成测试样本集,得到了构建和训练第二预测模型的训练样本集和测试第二预测模型的测试样本集,为构建、训练和测试第二预测模型提供样本。
[0102]
在一些实施例中,采用训练样本集中每个训练样本的多个维度的宽带指标和多个维度的宽带指标对应的第一业务数据,构建和训练多个第二预测模型,得到多个第二预测模型,即s140,可以包括以下步骤。
[0103]
先采用训练样本集中每个训练样本的多个维度的宽带指标和多个维度的宽带指标对应的第一业务数据,通过多粒度扫描多个维度的宽带指标,提取特征向量。
[0104]
在一个示例中,每个训练样本包括如表1所示的47个宽带指标,和每个宽带指标对应的第一业务数据,设置三种长度、滑动步长均为1的滑动窗口,其中,n=宽带指标的数量,即n=47,表示向上取整,所以三种滑动窗口长度分别为12、24和36,经这3种滑动窗口滑动分别扫描47个宽带指标,分别获得36个长度为12的特征向量,24个长度为24的特征向量,以及12个长度为36的特征向量。采用两个随机森林,每个随机森林包括多个决策树,每个决策树输出“满意”或“不满意”这两种满意度信息中的一种。将通过每种滑动窗口获得的特征向量分别输入两个随机森林,通过三种滑动窗口分别得到36
×2×
2=144、24
×2×
2=96、和12
×2×
2=48维特征向量,即共288维特征向量。
[0105]
然后,根据特征向量和预设的多个满意度信息,构建和训练多个级联森林,得到多个第二预测模型。
[0106]
级联森林中的每个随机森林包括至少一种决策树,每种决策树的数量为多个预设数量中的任一预设数量。
[0107]
在一个实施例中,预设的多个满意度信息包括“满意”和“不满意”两个满意度信息。级联森林中每一级包含4个随机森林,每个随机森林中可以包括逻辑回归树(logistic regression,lr)、极端随机树(extremely randomized trees,et)、极端梯度提升树(extreme gradient boosting,xgb)三种决策树种至少一种决策树,每种决策数据的数量为5、10、20、30四个预设数量中的任意一个。级联森林的第一级中4个随机森林会生成8维特征向量,联合288维概率特征向量组成296维特征向量作为第二级输入,以此类推。在构建当前级时,经过交叉验证的验证准确率相比于前一层没有提升,那么级联森林的构建就此停止,完成构建和训练级联森林,即完成构建和训练第二预测模型。
[0108]
随机森林中的决策树一般使用分类回归决策树(cart),cart是一种非线性分析的二叉决策树,即能处理连续性变量。样本的业务数据的划分是决策树生成的重要环节,cart决策树使用gini系数度量数据属性,该系数可用下式计算:
[0109][0110]
其中,k
gini
表示gini系数,p(i|t)表示第t个样本在第i类的概率,n为样本总数。决策树的gini系数与分类准确度成反比,即gini系数越小,分类越准确。cart树的分裂依据是用决策树的gini系数最小作为分裂原则。假设对于一个样本集,包括s个样本,可以根据宽带指标a划分为两类,两类分别包括s1和s2个样本,则该划分的gini指数为:
[0111][0112]
决策树停止生长的条件为:1)所有宽带指标均完成决策参与过程;2)一个节点的样本同属一个类别;3)决策树达到预先的设置深度。对于任意一颗决策树,随机森林算法随机选取一部分特征进行决策树生成,在子树生成过程中自动选取最优特征。
[0113]
在一个示例中,第一性能信息包括构建和训练的时间,第二性能信息包括准确率和/或目标调和平均数。在构建和训练多个第二预测模型后,得到每个第二预测模型的构建和训练的时间将,测试样本输入每个第二预测模型,得到每个第二预测模型的准确率和/或目标调和平均数,综合考虑第一性能信息和第二性能信息,确定满足预设条件的第一预测模型的随机森林中包括lr、et、xgb三种决策树,lr、et、xgb决策树的数量分别为10、20和5。
[0114]
本技术实施例提供的方法采用训练样本集中每个训练样本的多个维度的宽带指标和多个维度的宽带指标对应的第一业务数据,构建和训练了多个第二预测模型,为确定用户的满意度信息提供模型。
[0115]
本行申请实施例还提供一种信息确定装置,如图3所示,该装置300可以包括获取模块310和确定模块320。
[0116]
获取模块310,用于获取目标用户的多个维度的宽带指标对应的目标业务数据。
[0117]
其中,多个维度包括基础信息、家庭网络、承载网络、业务质量、服务质量、访问行为中的至少两个维度;
[0118]
确定模块320,用于将目标业务数据输入第一预测模型,得到多个满意度信息中每个满意度信息对应的概率值,确定最大的值对应的满意度信息为目标用户的第一满意度信息。
[0119]
其中,第一预测模型为根据多个维度的宽带指标和多个维度的宽带指标对应的业务数据构建和训练得到的。
[0120]
本技术实施例提供的信息确定装置,获取了目标用户的多个维度的宽带指标对应的目标业务数据,将目标业务数据输入第一预测模型,得到多个满意度信息中每个满意度信息对应的概率值,确定最大的值对应的满意度信息为得到目标用户的第一满意度信息,由于多个维度包括基础信息、家庭网络、承载网络、业务质量、服务质量、访问行为中的至少两个维度,充分采用了影响用户体验的宽带指标,第一预测模型为根据多个维度的宽带指标和多个维度的宽带指标对应的业务数据构建和训练得到的,所以采用多个维度的宽带指标对应的目标业务数据和第一预测模型能够准确地确定宽带用户的满意度信息,满意度信息反映出用户体验,从而能够根据满意度信息确定影响用户体验的故障点。
[0121]
在一些实施例中,获取模块310,还用于获取训练样本集和测试样本集。
[0122]
训练样本集包括多个训练样本,每个训练样本包括多个维度的宽带指标和多个维度的宽带指标对应的第一业务数据,测试样本集包括多个测试样本,每个测试样本包括实际满意度信息、多个维度的宽带指标和多个维度的宽带指标对应的第二业务数据;
[0123]
装置300还可以包括训练模块330、测试模块340。
[0124]
构建和训练模块330,用于采用训练样本集中每个训练样本的多个维度的宽带指标和多个维度的宽带指标对应的第一业务数据,构建和训练多个第二预测模型,得到多个第二预测模型和每个第二预测模型的第一性能信息。
[0125]
在一个实施例中,第一性能信息包括构建和训练的时间。
[0126]
测试模块340,用于采用测试样本集中每个测试样本的多个维度的宽带指标、多个维度的宽带指标对应的第二业务数据和实际满意度信息,分别测试每个第二预测模型,得到每个第二预测模型的第二性能信息。
[0127]
在一个实施例中,第二性能信息包括准确率。
[0128]
确定模块350,还用于根据第一性能信息和/或第二性能信息,确定满足预设条件的第二预测模型为第一预测模型。
[0129]
本技术实施例提供的装置先获取了训练样本集和测试样本集,根据训练样本集构建和训练了多个第二预测模型,并采用测试样本集测试每个第二预测模型,得到每个第二预测模型的第一性能信息和第二性能信息,将第一性能信息和/或第二性能信息满足预设条件的第二预测模型为第一预测模型,得到了满足需求的第一预测模型。
[0130]
在一些实施例中,获取模块310,可以具体用于:
[0131]
获取多个样本,每个样本包括多个维度的宽带指标、多个维度的宽带指标对应的原始业务数据和实际满意度信息。
[0132]
对多个样本的原始业务数据中的连续特征数据进行离散化处理,得到第一特征矩阵,第一特征矩阵包括多个维度的宽带指标和多个维度的宽带指标对应的第一原始业务数据,第一原始业务数据表征对原始业务数据离散化处理后的数据。
[0133]
对第一特征矩阵中的第一原始业务数据进行均衡处理,得到第二特征矩阵,第二特征矩阵包括多个维度的宽带指标和多个维度的宽带指标对应的第二原始业务数据,第二原始业务数据表征对第一原始业务数据均衡处理后的数据。
[0134]
划分第二特征矩阵为训练样本集和第一样本集。
[0135]
根据第一样本集和第一样本集中每个样本的实际满意度信息,生成测试样本集。
[0136]
本技术实施例提供的装置,通过对多个样本的原始业务数据进行离散化处理得到第一特征矩阵,对第一特征矩阵进行均衡处理,得到第二特征矩阵,精第二特征矩阵中的样本划分为训练样本集和第一样本集,基于第一样本集中的样本和每个样本的实际满意度信息生成测试样本集,得到了构建和训练第二预测模型的训练样本集和测试第二预测模型的测试样本集,为构建、训练和测试第二预测模型提供样本。
[0137]
在一些实施例中,构建和训练模块330,可以具体用于:
[0138]
采用训练样本集中每个训练样本的多个维度的宽带指标和多个维度的宽带指标对应的第一业务数据,通过多粒度扫描多个维度的宽带指标,提取特征向量。
[0139]
根据特征向量和预设的多个满意度信息,构建和训练多个级联森林,得到多个第二预测模型,每个级联森林中的每个随机森林包括至少一种决策树,每种决策树的数量为多个预设数量中的任一预设数量。
[0140]
本技术实施例提供的装置,采用训练样本集中每个训练样本的多个维度的宽带指标和多个维度的宽带指标对应的第一业务数据,构建和训练了多个第二预测模型,为确定用户的满意度信息提供模型。
[0141]
本技术实施例提供的信息确定装置执行图1和图2所示的方法中的各个步骤,并能够实现确定宽带用户的满意度信息,从而能够根据满意度信息确定影响用户体验的故障点的技术效果,为简洁描述,再此不在详细赘述。
[0142]
图4示出了本技术实施例提供的一种电子设备的硬件结构示意图。
[0143]
在电子设备可以包括处理器401以及存储有计算机程序指令的存储器402。
[0144]
具体地,上述处理器401可以包括中央处理器(cpu),或者特定集成电路(application specific integrated circuit,asic),或者可以被配置成实施本技术实施例的一个或多个集成电路。
[0145]
存储器402可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器402可包括硬盘驱动器(hard disk drive,hdd)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(universal serial bus,usb)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器402可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器402可在综合网关容灾设备的内部或外部。在特定实施例中,存储器402是非易失性固态存储器。在特定实施例中,存储器402包括只读存储器(rom)。在合适的情况下,该rom可以是掩模编程的rom、可编程rom(prom)、可擦除prom(eprom)、电可擦除prom(eeprom)、电可改写rom(earom)或闪存或者两个或更多个以上这些的组合。
[0146]
处理器401通过读取并执行存储器402中存储的计算机程序指令,以实现图1和图2所示实施例中的任意一种信息确定方法。
[0147]
在一个示例中,电子设备还可包括通信接口403和总线410。其中,如图4所示,处理器401、存储器402、通信接口403通过总线410连接并完成相互间的通信。
[0148]
通信接口403,主要用于实现本技术实施例中各模块、装置、单元和/或设备之间的通信。
[0149]
总线410包括硬件、软件或两者,将电子设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(agp)或其他图形总线、增强工业标准架构(eisa)总线、前端总线(fsb)、超传输(ht)互连、工业标准架构(isa)总线、无限带宽互连、低引脚数(lpc)总线、存储器总线、微信道架构(mca)总线、外围组件互连(pci)总线、pci-express(pci-x)总线、串行高级技术附件(sata)总线、视频电子标准协会局部(vlb)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线410可包括一个或多个总线。尽管本技术实施例描述和示出了特定的总线,但本技术考虑任何合适的总线或互连。
[0150]
该电子设备可以执行本技术实施例中的信息确定方法,从而实现结合图1和图2描述的息确定方法。
[0151]
另外,结合上述实施例中的信息确定方法,本技术实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种信息确定方法。
[0152]
本技术实施例还提供一种计算机程序产品,计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备执行上述实施例中的任意一种信息确定方法。
[0153]
需要明确的是,本技术并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本技术的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本技术的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
[0154]
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组
合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(asic)、适当的固件、插件、功能卡等等。当以软件方式实现时,本技术的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、rom、闪存、可擦除rom(erom)、软盘、cd-rom、光盘、硬盘、光纤介质、射频(rf)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
[0155]
还需要说明的是,本技术中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本技术不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
[0156]
以上所述,仅为本技术的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本技术的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1