审计程序数据处理方法及装置与流程

文档序号:30519276发布日期:2022-06-25 04:22阅读:244来源:国知局
审计程序数据处理方法及装置与流程

1.本技术涉及文本处理领域,也可用于金融领域,具体涉及一种审计程序数据处理方法及装置。


背景技术:

2.近年来,审计工作的信息化建设发展较快。大数据时代下,审计的智能化显得尤为重要,其中,审计程序是审计工作宝贵的知识和财富,也是审计工作的重要标准和审计检查实施的重要指导。
3.目前审计人员查询审计程序的模式是:审计员通过查找以前的审计程序获取重点审计点。随着审计程序的增多,这种查找方式一方面会占用审计员的大量时间。另一方面,没有充分利用审计程序的多源信息,未能关注到多源信息的重要性,随着审计程序的增多,这种逐一查找、筛选的模式是比较耗时的,久而久之降低了审计效率。


技术实现要素:

4.针对现有技术中的问题,本技术提供一种审计程序数据处理方法及装置,能够有效提高审计效率和准确率。
5.为了解决上述问题中的至少一个,本技术提供以下技术方案:
6.第一方面,本技术提供一种审计程序数据处理方法,包括:
7.根据各审计程序的标题数据和正文数据,确定对应的审计程序特征;
8.根据当前用户的历史审计程序查询数据和对应的所述审计程序特征,确定用户特征;
9.根据所述审计程序特征和所述用户特征确定所述用户对各审计程序的查询可能性,并根据所述各审计程序的查询可能性生成审计程序推荐列表至所述用户处。
10.进一步地,所述根据各审计程序的标题数据和正文数据,确定对应的审计程序特征,包括:
11.根据预设词嵌入方法对各审计程序的标题数据和正文数据进行低维空间表示,得到对应的语义向量;
12.根据各所述语义向量的相关性权值和重要性权值,确定所述审计程序的审计程序特征。
13.进一步地,在所述根据各所述语义向量的相关性权值和重要性权值之前,包括:
14.根据各所述语义向量之间的上下文语义关系,确定对应的相关性权值;
15.根据各所述语义向量传递的信息量大小,确定对应的重要性权值。
16.进一步地,在所述根据预设词嵌入方法对各审计程序的标题数据和正文数据进行低维空间表示,得到对应的语义向量之前,包括:
17.使用抽取式文本摘要方法将所述审计程序的原始正文数据转变成具有概括性含义的文本摘要,其中,所述原始正文数据包括业务范围、控制目标、应有的控制措施、测试要
点以及测试方法中的至少一种;
18.将所述文本摘要设定为所述审计程序的正文数据。
19.进一步地,所述使用抽取式文本摘要方法将所述审计程序的原始正文数据转变成具有概括性含义的文本摘要,包括:
20.将所述审计程序的原始正文数据进行整合,将经过整合后的原始正文数据进行语句分割,得到各句子的词向量;
21.计算各所述词向量之间的相似性,得到相似性矩阵;
22.根据所述相似性矩阵中各句子的相似度,确定各句子的重要性数值,将重要性数值大于阈值的句子确定为所述原始正文数据的文本摘要。
23.进一步地,所述根据各所述语义向量的相关性权值和重要性权值,确定所述审计程序的审计程序特征,还包括:
24.确定所述标题数据和所述正文数据的视图重要性权值;
25.根据所述视图重要性权值、各所述语义向量的相关性权值和重要性权值,确定所述审计程序的审计程序特征。
26.进一步地,在所述根据各审计程序的标题数据和正文数据,确定对应的审计程序特征之前,包括:
27.对各审计程序的标题数据和正文数据进行文本预处理,得到经过文本预处理后的标题数据和正文数据,其中,所述文本预处理包括切词处理、设定停用词过滤处理以及设定非重要词过滤处理中的至少一种。
28.进一步地,所述根据当前用户的历史审计程序查询数据和对应的所述审计程序特征,确定用户特征,包括:
29.确定当前用户的历史审计程序查询数据对应查询到的审计程序;
30.根据该审计程序的相关性权值和重要性权值,确定用户特征。
31.进一步地,所述根据所述审计程序特征和所述用户特征确定所述用户对各审计程序的查询可能性,包括:
32.根据所述审计程序特征和所述用户特征计算所述用户对各审计程序的点击预测值;
33.根据预设非线性激活函数将所述点击预测值映射为查询可能性数值。
34.第二方面,本技术提供一种审计程序数据处理装置,包括:
35.审计程序特征确定模块,用于根据各审计程序的标题数据和正文数据,确定对应的审计程序特征;
36.用户特征确定模块,用于根据当前用户的历史审计程序查询数据和对应的所述审计程序特征,确定用户特征;
37.查询推荐模块,用于根据所述审计程序特征和所述用户特征确定所述用户对各审计程序的查询可能性,并根据所述各审计程序的查询可能性生成审计程序推荐列表至所述用户处。
38.进一步地,所述审计程序特征确定模块包括:
39.语义向量确定单元,用于根据预设词嵌入方法对各审计程序的标题数据和正文数据进行低维空间表示,得到对应的语义向量;
40.程序特征计算单元,用于根据各所述语义向量的相关性权值和重要性权值,确定所述审计程序的审计程序特征。
41.进一步地,所述审计程序特征确定模块还包括:
42.相关性确定单元,用于根据各所述语义向量之间的上下文语义关系,确定对应的相关性权值;
43.重要性确定单元,用于根据各所述语义向量传递的信息量大小,确定对应的重要性权值。
44.进一步地,所述审计程序特征确定模块还包括:
45.文本摘要单元,用于使用抽取式文本摘要方法将所述审计程序的原始正文数据转变成具有概括性含义的文本摘要,其中,所述原始正文数据包括业务范围、控制目标、应有的控制措施、测试要点以及测试方法中的至少一种;
46.正文确定单元,用于将所述文本摘要设定为所述审计程序的正文数据。
47.进一步地,所述文本摘要单元包括:
48.词向量分割子单元,用于将所述审计程序的原始正文数据进行整合,将经过整合后的原始正文数据进行语句分割,得到各句子的词向量;
49.相似性矩阵构建子单元,用于计算各所述词向量之间的相似性,得到相似性矩阵;
50.句子重要性确定子单元,用于根据所述相似性矩阵中各句子的相似度,确定各句子的重要性数值,将重要性数值大于阈值的句子确定为所述原始正文数据的文本摘要。
51.进一步地,所述审计程序特征确定模块还包括:
52.视图重要性确定单元,用于确定所述标题数据和所述正文数据的视图重要性权值;
53.结合视图确定特征单元,用于根据所述视图重要性权值、各所述语义向量的相关性权值和重要性权值,确定所述审计程序的审计程序特征。
54.进一步地,还包括:
55.文本预处理单元,用于对各审计程序的标题数据和正文数据进行文本预处理,得到经过文本预处理后的标题数据和正文数据,其中,所述文本预处理包括切词处理、设定停用词过滤处理以及设定非重要词过滤处理中的至少一种。
56.进一步地,所述用户特征确定模块包括:
57.历史查询单元,用于确定当前用户的历史审计程序查询数据对应查询到的审计程序;
58.用户特征计算单元,用于根据该审计程序的相关性权值和重要性权值,确定用户特征。
59.进一步地,所述查询推荐模块包括:
60.点击预测单元,用于根据所述审计程序特征和所述用户特征计算所述用户对各审计程序的点击预测值;
61.激活映射单元,用于根据预设非线性激活函数将所述点击预测值映射为查询可能性数值。
62.第三方面,本技术提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的审计程序数据处理
方法的步骤。
63.第四方面,本技术提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述的审计程序数据处理方法的步骤。
64.第五方面,本技术提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现所述的审计程序数据处理方法的步骤。
65.由上述技术方案可知,本技术提供一种审计程序数据处理方法及装置,通过考虑审计程序标题和正文中词语相关性,确定各个审计程序的特征,通过考虑当前用户的历史查询记录,确定该用户的特征,结合各个审计程序的特征和该用户的特征,确定该用户查询各审计程序的可能性,并预先将高可能性的审计程序推送至用户处以供选择,由此能够有效提高审计效率和准确率。
附图说明
66.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
67.图1为本技术实施例中的审计程序数据处理方法的流程示意图之一;
68.图2为本技术实施例中的审计程序数据处理方法的流程示意图之二;
69.图3为本技术实施例中的审计程序数据处理方法的流程示意图之三;
70.图4为本技术实施例中的审计程序数据处理方法的流程示意图之四;
71.图5为本技术实施例中的审计程序数据处理方法的流程示意图之五;
72.图6为本技术实施例中的审计程序数据处理方法的流程示意图之六;
73.图7为本技术实施例中的审计程序数据处理方法的流程示意图之七;
74.图8为本技术实施例中的审计程序数据处理方法的流程示意图之八;
75.图9为本技术实施例中的审计程序数据处理装置的结构图之一;
76.图10为本技术实施例中的审计程序数据处理装置的结构图之二;
77.图11为本技术实施例中的审计程序数据处理装置的结构图之三;
78.图12为本技术实施例中的审计程序数据处理装置的结构图之四;
79.图13为本技术实施例中的审计程序数据处理装置的结构图之五;
80.图14为本技术实施例中的审计程序数据处理装置的结构图之六;
81.图15为本技术实施例中的审计程序数据处理装置的结构图之七;
82.图16为本技术实施例中的审计程序数据处理装置的结构图之八;
83.图17为本技术实施例中的电子设备的结构示意图。
具体实施方式
84.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
85.本技术技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
86.考虑到现有技术中审计程序的查找方式耗时且效率低下的问题,本技术提供一种审计程序数据处理方法及装置,通过考虑审计程序标题和正文中词语相关性,确定各个审计程序的特征,通过考虑当前用户的历史查询记录,确定该用户的特征,结合各个审计程序的特征和该用户的特征,确定该用户查询各审计程序的可能性,并预先将高可能性的审计程序推送至用户处以供选择,由此能够有效提高审计效率和准确率。
87.为了能够有效提高审计效率和准确率,本技术提供一种审计程序数据处理方法的实施例,参见图1,所述审计程序数据处理方法具体包含有如下内容:
88.步骤s101:根据各审计程序的标题数据和正文数据,确定对应的审计程序特征。
89.可选的,每个审计程序是由标题数据和正文数据组成的长文本,本技术可以首先用结构化表示方法表示标题数据和正文数据。
90.具体的,为了避免数据的稀疏性,本技术使用低维空间表示的词嵌入方法,对审计程序的标题数据和正文数据进行重新表示,得到的向量视为审计程序的语义向量。
91.可选的,本技术可以利用审计程序文本中词之间的相互关系,引入自注意力机制分别学习标题数据和正文数据的上下文词语表示。在同一审计程序文本中,不同的词传递的信息量不一样,也就是重要性不同。因此,本技术可以对标题数据和正文数据学习词的重要性。另外,还可以从视图层面学习标题数据和正文数据的重要性,最终得到审计程序的特征表示。
92.步骤s102:根据当前用户的历史审计程序查询数据和对应的所述审计程序特征,确定用户特征。
93.可选的,所述当前用户即进行审计程序查询的用户,例如为一审计员,审计员历史查询的审计程序之间存在一定程度的关联性,而且传递出的信息量也不一样,因此本技术可以从关联性和信息量去学习审计员历史审计程序的特征,最后得到审计员基于历史审计程序的特征表示,即用户的特征表示。
94.步骤s103:根据所述审计程序特征和所述用户特征确定所述用户对各审计程序的查询可能性,并根据所述各审计程序的查询可能性生成审计程序推荐列表至所述用户处。
95.可选的,本技术可以结合上述得到的所述审计程序特征和所述用户特征,以此确定所述用户对各审计程序的查询可能性,即用户可能查询的某些审计程序,并将其预先生成推荐列表推送至用户处以供用户选择,由此免去用户手动查询的过程。
96.从上述描述可知,本技术实施例提供的审计程序数据处理方法,能够通过考虑审计程序标题和正文中词语相关性,确定各个审计程序的特征,通过考虑当前用户的历史查询记录,确定该用户的特征,结合各个审计程序的特征和该用户的特征,确定该用户查询各审计程序的可能性,并预先将高可能性的审计程序推送至用户处以供选择,由此能够有效提高审计效率和准确率。
97.为了能够确定表征文本自身特征的审计程序特征,在本技术的审计程序数据处理方法的一实施例中,参见图2,上述步骤s101还可以具体包含如下内容:
98.步骤s201:根据预设词嵌入方法对各审计程序的标题数据和正文数据进行低维空间表示,得到对应的语义向量。
99.可选的,在词嵌入层对标题数据使用结构化的表示方法,如word2vector,获得低维语义向量
100.可选的,在词嵌入层根据正文数据的文本摘要得到对应的低维语义向量
101.步骤s202:根据各所述语义向量的相关性权值和重要性权值,确定所述审计程序的审计程序特征。
102.可选的,本技术采用注意力分布计算方法确定各所述语义向量的相关性权值和重要性权值。
103.具体的,对于标题数据,本技术基于上下文语义关系,审计程序标题数据的词之间具有的相关性,计算出每个词与其他词的相关性权值然后,由于在审计程序的标题中不同的词传递的信息量是不一样的,由此本技术计算每个词在整个标题里的重要性最后信息加权平均,获得标题的特征向量:
[0104][0105]
可选的,根据上下文信息间隔,选取不同的相关性算法,如cnn-dssm,lstm-dssm。
[0106]
具体的,对于正文数据(或者正文数据的文本摘要),本技术首先计算出每个词与其他词的相关性权值然后由于在审计程序正文中不同的词传递的信息量是不一样的,本技术计算每个词在整个正文里的的重要性最后信息加权平均,获得正文的特征向量:
[0107][0108]
可选的,计算相似度(注意力分布)可以采用如加性模型、点积模型、缩放点模型、双线性模型。
[0109]
可选的,由于以上权重学习主要是从词的角度出发,但是标题数据和正文数据作为不同的整体,从不同的角度对审计程序进行描述,传递出的信息量是不一样的。因此本技术还可以从视图层面计算出两者的重要性,分别为v
t
和vb。
[0110]
最终,获得的审计程序特征表示为:
[0111]
t=v
trt
+vbrb[0112]
为了能够准确确定词义向量间的关系,在本技术的审计程序数据处理方法的一实施例中,参见图3,在上述步骤s202之前,还可以具体包含如下内容:
[0113]
步骤s301:根据各所述语义向量之间的上下文语义关系,确定对应的相关性权值。
[0114]
步骤s302:根据各所述语义向量传递的信息量大小,确定对应的重要性权值。
[0115]
举例来说,对于标题数据,本技术基于上下文语义关系,审计程序标题数据的词之间具有的相关性,计算出每个词与其他词的相关性权值然后,由于在审计程序的标题中不同的词传递的信息量是不一样的,由此本技术计算每个词在整个标题里的重要性
[0116]
为了能够精简审查程序的正文,在本技术的审计程序数据处理方法的一实施例中,参见图4,在上述步骤s201之前,还可以具体包含如下内容:
[0117]
步骤s401:使用抽取式文本摘要方法将所述审计程序的原始正文数据转变成具有概括性含义的文本摘要,其中,所述原始正文数据包括业务范围、控制目标、应有的控制措施、测试要点以及测试方法中的至少一种。
[0118]
步骤s402:将所述文本摘要设定为所述审计程序的正文数据。
[0119]
可选的,每个审计程序是由标题和正文组成的长文本,其中,本技术对于审计程序的正文可以使用抽取式文本摘要的方法textrank,将正文转变成具有概括性含义的短文本,即使用抽取式文本摘要的方法,对正文数据进行摘要处理。
[0120]
为了能够准确对正文进行摘要抽取,在本技术的审计程序数据处理方法的一实施例中,参见图5,上述步骤s401还可以具体包含如下内容:
[0121]
步骤s501:将所述审计程序的原始正文数据进行整合,将经过整合后的原始正文数据进行语句分割,得到各句子的词向量。
[0122]
步骤s502:计算各所述词向量之间的相似性,得到相似性矩阵。
[0123]
步骤s503:根据所述相似性矩阵中各句子的相似度,确定各句子的重要性数值,将重要性数值大于阈值的句子确定为所述原始正文数据的文本摘要。
[0124]
举例来说,首先本技术将审计程序的多条原始正文数据整合为一条文本数据,然后,将该文本数据分割成单个的句子,得到句子的词向量表示,接着,计算词向量之间的相似性,并存于矩阵中:
[0125][0126]
其中,wsi指第i个句子,wk指第k个单词,|wsi|指句子i中的单词数。
[0127]
然后,利用相似性矩阵,以句子为节点、相似性为边构建图,计算句子的textrank值:
[0128][0129]
其中,ws(vi)指句子vi的重要性,d是阻尼系数,w
ij
表示边的权重,即句子的相似度;
[0130]
最后,取前topk的排名最高的句子构成审计程序正文数据的文本摘要。
[0131]
为了能够从视图层面确定重要性,在本技术的审计程序数据处理方法的一实施例中,参见图6,上述步骤s101还可以具体包含如下内容:
[0132]
步骤s601:确定所述标题数据和所述正文数据的视图重要性权值。
[0133]
步骤s602:根据所述视图重要性权值、各所述语义向量的相关性权值和重要性权值,确定所述审计程序的审计程序特征。
[0134]
可选的,由于以上权重学习主要是从词的角度出发,但是标题数据和正文数据作为不同的整体,从不同的角度对审计程序进行描述,传递出的信息量是不一样的。因此本技术还可以从视图层面计算出两者的重要性,分别为v
t
和vb。
[0135]
最终,获得的审计程序特征表示为:
[0136]
r=v
trt
+vbrb[0137]
为了能够提高数据处理效率,在本技术的审计程序数据处理方法的一实施例中,
在步骤s101之前,还可以具体包含如下内容:
[0138]
对各审计程序的标题数据和正文数据进行文本预处理,得到经过文本预处理后的标题数据和正文数据,其中,所述文本预处理包括切词处理、设定停用词过滤处理以及设定非重要词过滤处理中的至少一种。
[0139]
为了能够准确确定用户的特征,在本技术的审计程序数据处理方法的一实施例中,参见图7,上述步骤s102还可以具体包含如下内容:
[0140]
步骤s701:确定当前用户的历史审计程序查询数据对应查询到的审计程序。
[0141]
步骤s702:根据该审计程序的相关性权值和重要性权值,确定用户特征。
[0142]
可选的,在历史数据中,审计员查询审计程序时它们之间有一定的关联性的,基于上述审计程序学习结果,计算出对应的相关性然后,由于查询出来的审计程序对于审计员是不一样的,计算出审计程序的权值最后信息加权平均,得到审计员的特征表示向量为:
[0143][0144]
为了能够准确确定用户对各审计程序的查询可能性,在本技术的审计程序数据处理方法的一实施例中,参见图8,上述步骤s103还可以具体包含如下内容:
[0145]
步骤s801:根据所述审计程序特征和所述用户特征计算所述用户对各审计程序的点击预测值。
[0146]
可选的,据所述审计程序特征和所述用户特征计算审计员点击候选审计程序的可能性(即点击预测值)为:
[0147][0148]
步骤s802:根据预设非线性激活函数将所述点击预测值映射为查询可能性数值。
[0149]
可选的,本技术可以使用sigmoid激活函数将所述点击预测值映射为查询可能性数值,具体公式为:
[0150][0151]
为了能够有效提高审计效率和准确率,本技术提供一种用于实现所述审计程序数据处理方法的全部或部分内容的审计程序数据处理装置的实施例,参见图9,所述审计程序数据处理装置具体包含有如下内容:
[0152]
审计程序特征确定模块10,用于根据各审计程序的标题数据和正文数据,确定对应的审计程序特征。
[0153]
用户特征确定模块20,用于根据当前用户的历史审计程序查询数据和对应的所述审计程序特征,确定用户特征。
[0154]
查询推荐模块30,用于根据所述审计程序特征和所述用户特征确定所述用户对各审计程序的查询可能性,并根据所述各审计程序的查询可能性生成审计程序推荐列表至所述用户处。
[0155]
从上述描述可知,本技术实施例提供的审计程序数据处理装置,能够通过考虑审计程序标题和正文中词语相关性,确定各个审计程序的特征,通过考虑当前用户的历史查
询记录,确定该用户的特征,结合各个审计程序的特征和该用户的特征,确定该用户查询各审计程序的可能性,并预先将高可能性的审计程序推送至用户处以供选择,由此能够有效提高审计效率和准确率。
[0156]
为了能够确定表征文本自身特征的审计程序特征,在本技术的审计程序数据处理装置的一实施例中,参见图10,所述审计程序特征确定模块10包括:
[0157]
语义向量确定单元11,用于根据预设词嵌入方法对各审计程序的标题数据和正文数据进行低维空间表示,得到对应的语义向量。
[0158]
程序特征计算单元12,用于根据各所述语义向量的相关性权值和重要性权值,确定所述审计程序的审计程序特征。
[0159]
为了能够准确确定词义向量间的关系,在本技术的审计程序数据处理装置的一实施例中,参见图11,所述审计程序特征确定模块10还包括:
[0160]
相关性确定单元13,用于根据各所述语义向量之间的上下文语义关系,确定对应的相关性权值。
[0161]
重要性确定单元14,用于根据各所述语义向量传递的信息量大小,确定对应的重要性权值。
[0162]
为了能够精简审查程序的正文,在本技术的审计程序数据处理装置的一实施例中,参见图12,所述审计程序特征确定模块10还包括:
[0163]
文本摘要单元15,用于使用抽取式文本摘要方法将所述审计程序的原始正文数据转变成具有概括性含义的文本摘要,其中,所述原始正文数据包括业务范围、控制目标、应有的控制措施、测试要点以及测试方法中的至少一种。
[0164]
正文确定单元16,用于将所述文本摘要设定为所述审计程序的正文数据。
[0165]
为了能够准确对正文进行摘要抽取,在本技术的审计程序数据处理装置的一实施例中,参见图13,所述文本摘要单元15包括:
[0166]
词向量分割子单元151,用于将所述审计程序的原始正文数据进行整合,将经过整合后的原始正文数据进行语句分割,得到各句子的词向量。
[0167]
相似性矩阵构建子单元152,用于计算各所述词向量之间的相似性,得到相似性矩阵。
[0168]
句子重要性确定子单元153,用于根据所述相似性矩阵中各句子的相似度,确定各句子的重要性数值,将重要性数值大于阈值的句子确定为所述原始正文数据的文本摘要。
[0169]
为了能够从视图层面确定重要性,在本技术的审计程序数据处理装置的一实施例中,参见图14,所述审计程序特征确定模块10还包括:
[0170]
视图重要性确定单元17,用于确定所述标题数据和所述正文数据的视图重要性权值。
[0171]
结合视图确定特征单元18,用于根据所述视图重要性权值、各所述语义向量的相关性权值和重要性权值,确定所述审计程序的审计程序特征。
[0172]
为了能够提高数据处理效率,在本技术的审计程序数据处理装置的一实施例中,还具体包含有如下内容:
[0173]
文本预处理单元,用于对各审计程序的标题数据和正文数据进行文本预处理,得到经过文本预处理后的标题数据和正文数据,其中,所述文本预处理包括切词处理、设定停
用词过滤处理以及设定非重要词过滤处理中的至少一种。
[0174]
为了能够准确确定用户的特征,在本技术的审计程序数据处理装置的一实施例中,参见图15,所述用户特征确定模块20包括:
[0175]
历史查询单元21,用于确定当前用户的历史审计程序查询数据对应查询到的审计程序。
[0176]
用户特征计算单元22,用于根据该审计程序的相关性权值和重要性权值,确定用户特征。
[0177]
为了能够准确确定用户对各审计程序的查询可能性,在本技术的审计程序数据处理装置的一实施例中,参见图16,所述查询推荐模块30包括:
[0178]
点击预测单元31,用于根据所述审计程序特征和所述用户特征计算所述用户对各审计程序的点击预测值。
[0179]
激活映射单元32,用于根据预设非线性激活函数将所述点击预测值映射为查询可能性数值。
[0180]
从硬件层面来说,为了能够有效提高审计效率和准确率,本技术提供一种用于实现所述审计程序数据处理方法中的全部或部分内容的电子设备的实施例,所述电子设备具体包含有如下内容:
[0181]
处理器(processor)、存储器(memory)、通信接口(communications interface)和总线;其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;所述通信接口用于实现审计程序数据处理装置与核心业务系统、用户终端以及相关数据库等相关设备之间的信息传输;该逻辑控制器可以是台式计算机、平板电脑及移动终端等,本实施例不限于此。在本实施例中,该逻辑控制器可以参照实施例中的审计程序数据处理方法的实施例,以及审计程序数据处理装置的实施例进行实施,其内容被合并于此,重复之处不再赘述。
[0182]
可以理解的是,所述用户终端可以包括智能手机、平板电子设备、网络机顶盒、便携式计算机、台式电脑、个人数字助理(pda)、车载设备、智能穿戴设备等。其中,所述智能穿戴设备可以包括智能眼镜、智能手表、智能手环等。
[0183]
在实际应用中,审计程序数据处理方法的部分可以在如上述内容所述的电子设备侧执行,也可以所有的操作都在所述客户端设备中完成。具体可以根据所述客户端设备的处理能力,以及用户使用场景的限制等进行选择。本技术对此不作限定。若所有的操作都在所述客户端设备中完成,所述客户端设备还可以包括处理器。
[0184]
上述的客户端设备可以具有通信模块(即通信单元),可以与远程的服务器进行通信连接,实现与所述服务器的数据传输。所述服务器可以包括任务调度中心一侧的服务器,其他的实施场景中也可以包括中间平台的服务器,例如与任务调度中心服务器有通信链接的第三方服务器平台的服务器。所述的服务器可以包括单台计算机设备,也可以包括多个服务器组成的服务器集群,或者分布式装置的服务器结构。
[0185]
图17为本技术实施例的电子设备9600的系统构成的示意框图。如图17所示,该电子设备9600可以包括中央处理器9100和存储器9140;存储器9140耦合到中央处理器9100。值得注意的是,该图17是示例性的;还可以使用其他类型的结构,来补充或代替该结构,以实现电信功能或其他功能。
[0186]
一实施例中,审计程序数据处理方法功能可以被集成到中央处理器9100中。其中,
中央处理器9100可以被配置为进行如下控制:
[0187]
步骤s101:根据各审计程序的标题数据和正文数据,确定对应的审计程序特征。
[0188]
步骤s102:根据当前用户的历史审计程序查询数据和对应的所述审计程序特征,确定用户特征。
[0189]
步骤s103:根据所述审计程序特征和所述用户特征确定所述用户对各审计程序的查询可能性,并根据所述各审计程序的查询可能性生成审计程序推荐列表至所述用户处。
[0190]
从上述描述可知,本技术实施例提供的电子设备,通过考虑审计程序标题和正文中词语相关性,确定各个审计程序的特征,通过考虑当前用户的历史查询记录,确定该用户的特征,结合各个审计程序的特征和该用户的特征,确定该用户查询各审计程序的可能性,并预先将高可能性的审计程序推送至用户处以供选择,由此能够有效提高审计效率和准确率。
[0191]
在另一个实施方式中,审计程序数据处理装置可以与中央处理器9100分开配置,例如可以将审计程序数据处理装置配置为与中央处理器9100连接的芯片,通过中央处理器的控制来实现审计程序数据处理方法功能。
[0192]
如图17所示,该电子设备9600还可以包括:通信模块9110、输入单元9120、音频处理器9130、显示器9160、电源9170。值得注意的是,电子设备9600也并不是必须要包括图17中所示的所有部件;此外,电子设备9600还可以包括图17中没有示出的部件,可以参考现有技术。
[0193]
如图17所示,中央处理器9100有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该中央处理器9100接收输入并控制电子设备9600的各个部件的操作。
[0194]
其中,存储器9140,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器9100可执行该存储器9140存储的该程序,以实现信息存储或处理等。
[0195]
输入单元9120向中央处理器9100提供输入。该输入单元9120例如为按键或触摸输入装置。电源9170用于向电子设备9600提供电力。显示器9160用于进行图像和文字等显示对象的显示。该显示器例如可为lcd显示器,但并不限于此。
[0196]
该存储器9140可以是固态存储器,例如,只读存储器(rom)、随机存取存储器(ram)、sim卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为eprom等。存储器9140还可以是某种其它类型的装置。存储器9140包括缓冲存储器9141(有时被称为缓冲器)。存储器9140可以包括应用/功能存储部9142,该应用/功能存储部9142用于存储应用程序和功能程序或用于通过中央处理器9100执行电子设备9600的操作的流程。
[0197]
存储器9140还可以包括数据存储部9143,该数据存储部9143用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器9140的驱动程序存储部9144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。
[0198]
通信模块9110即为经由天线9111发送和接收信号的发送机/接收机9110。通信模
块(发送机/接收机)9110耦合到中央处理器9100,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。
[0199]
基于不同的通信技术,在同一电子设备中,可以设置有多个通信模块9110,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)9110还经由音频处理器9130耦合到扬声器9131和麦克风9132,以经由扬声器9131提供音频输出,并接收来自麦克风9132的音频输入,从而实现通常的电信功能。音频处理器9130可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器9130还耦合到中央处理器9100,从而使得可以通过麦克风9132能够在本机上录音,且使得可以通过扬声器9131来播放本机上存储的声音。
[0200]
本技术的实施例还提供能够实现上述实施例中的执行主体为服务器或客户端的审计程序数据处理方法中全部步骤的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的执行主体为服务器或客户端的审计程序数据处理方法的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
[0201]
步骤s101:根据各审计程序的标题数据和正文数据,确定对应的审计程序特征。
[0202]
步骤s102:根据当前用户的历史审计程序查询数据和对应的所述审计程序特征,确定用户特征。
[0203]
步骤s103:根据所述审计程序特征和所述用户特征确定所述用户对各审计程序的查询可能性,并根据所述各审计程序的查询可能性生成审计程序推荐列表至所述用户处。
[0204]
从上述描述可知,本技术实施例提供的计算机可读存储介质,通过考虑审计程序标题和正文中词语相关性,确定各个审计程序的特征,通过考虑当前用户的历史查询记录,确定该用户的特征,结合各个审计程序的特征和该用户的特征,确定该用户查询各审计程序的可能性,并预先将高可能性的审计程序推送至用户处以供选择,由此能够有效提高审计效率和准确率。
[0205]
本技术的实施例还提供能够实现上述实施例中的执行主体为服务器或客户端的审计程序数据处理方法中全部步骤的一种计算机程序产品,该计算机程序/指令被处理器执行时实现所述的审计程序数据处理方法的步骤,例如,所述计算机程序/指令实现下述步骤:
[0206]
步骤s101:根据各审计程序的标题数据和正文数据,确定对应的审计程序特征。
[0207]
步骤s102:根据当前用户的历史审计程序查询数据和对应的所述审计程序特征,确定用户特征。
[0208]
步骤s103:根据所述审计程序特征和所述用户特征确定所述用户对各审计程序的查询可能性,并根据所述各审计程序的查询可能性生成审计程序推荐列表至所述用户处。
[0209]
从上述描述可知,本技术实施例提供的计算机程序产品,通过考虑审计程序标题和正文中词语相关性,确定各个审计程序的特征,通过考虑当前用户的历史查询记录,确定该用户的特征,结合各个审计程序的特征和该用户的特征,确定该用户查询各审计程序的可能性,并预先将高可能性的审计程序推送至用户处以供选择,由此能够有效提高审计效率和准确率。
[0210]
本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或计算机程序
产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0211]
本发明是参照根据本发明实施例的方法、设备(装置)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0212]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0213]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0214]
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1