整合定性资料及定量资料进行稽核准则推荐的系统及方法与流程

文档序号:23684717发布日期:2021-01-23 09:12阅读:93来源:国知局
整合定性资料及定量资料进行稽核准则推荐的系统及方法与流程

[0001]
本发明涉及自然语言处理领域,具体关于一种推荐系统及方法,尤其指整合定性资料及定量资料进行稽核准则推荐的系统及方法。


背景技术:

[0002]
过去在财务稽核中有如us 8,050,988 b2以及us 2006/0106686 a1就财务风险提出结构化的稽核系统与从风险面提出财务稽核的机会与建议,其他如us7885841 b2、us5765138、us7346527 b2、us2008/019546 a1、us8504412 b1等专利也包含如稽核计画与稽核项目产生的自动化。
[0003]
虽有利用如自然语言处理的推荐系统过去公开或公告如us 2016/0148327 a1、us 2018/0165696 a1以及cn 107807962 b,但未能考虑供应商的风险可能与其背景资讯如规模、经营绩效及运营时间等定量资讯。


技术实现要素:

[0004]
本发明的目的在于提供一种整合定性资料及定量资料进行稽核准则推荐的系统及方法,能够考虑供应商经营的背景资讯,客观地建立稽核发现与经营指标的相关性。
[0005]
基于此,本发明主要采用下列技术手段,来实现上述目的。
[0006]
一种整合定性资料及定量资料进行稽核准则推荐的系统,包含:一储存模组,用于接收供应商稽核的一进行中分析资料及储存过去已完成供应商稽核的一历史分析资料,所述进行中分析资料及所述历史分析资料皆包含一稽核发现的定性资料及一供应商经营数据的定量资料;一主题模型转换模组,连接所述储存模组,用于分析所述历史分析资料的所述稽核发现,以建立一主题模型或更新所述主题模型,并取得一主题模型概率分布,所述主题模型转换模组并依所述主题模型转换所述进行中分析资料的所述稽核发现;一特征向量模组,连接所述主题模型转换模组及所述储存模组,用于依据所述主题模型概率分布及所述历史分析资料的所述供应商经营数据产生对应的一特征向量集合,所述特征向量模组并用于产生对应所述进行中分析资料的一特征向量值;一归类模组,连接所述特征向量模组,用于对所述特征向量集合进行聚类分析并决定所述特征向量值所属的一聚类;一推荐模组,连接所述归类模组及所述主题模型转换模组,用于接收供应商稽核所用的一稽核准则清单,并依据所述特征向量值所属的所述聚类就相关的一主题产生对应的一推荐稽核准则各项。
[0007]
进一步,所述归类模组运算所述特征向量值与各个所述聚类的重心的一距离值,以所述距离值为最小的所述聚类作为所述特征向量值所属的所述聚类。
[0008]
进一步,所述供应商经营数据的定量资料至少包含一供应商人数资料、一营业额资料、一经营时间资料的任一或组合。
[0009]
一种整合定性资料及定量资料进行稽核准则推荐的方法,包含:由一储存模组接收供应商稽核的一进行中分析资料及储存过去已完成供应商稽核的一历史分析资料,所述
进行中分析资料及所述历史分析资料皆包含一稽核发现的定性资料及一供应商经营数据的定量资料;由一主题模型转换模组分析所述历史分析资料的所述稽核发现,以建立一主题模型或更新所述主题模型,并取得一主题模型概率分布及依所述主题模型转换所述进行中分析资料的所述稽核发现,以供一特征向量模组依据所述主题模型概率分布及所述历史分析资料的所述供应商经营数据产生对应的一特征向量集合与所述进行中分析资料的一特征向量值;以一归类模组就所述特征向量集合进行聚类分析并决定所述特征向量值所属的一聚类,以供一推荐模组接收供应商稽核所用的一稽核准则清单,并依据所述特征向量值所属的所述聚类,就相关的一主题产生对应的一推荐稽核准则各项。
[0010]
进一步,所述特征向量集合运用k-平均演算法(k-means clustering)进行聚类分析。
[0011]
进一步,所述归类模组运算所述特征向量值与各个所述聚类的重心的一距离值,以所述距离值为最小的所述聚类作为所述特征向量值所属的所述聚类。
[0012]
进一步,聚类分析可经加权k-平均(weighted k-means)特征选择演算降低建立聚类分析的特征向量的维数。
[0013]
进一步,所述主题模型概率分布至少运用隐含狄利克雷分布(latent dirichlet allocation,lda)或非负矩阵分解(non-negative matrix factorization)其一建立。
[0014]
进一步,所述供应商经营数据的定量资料至少包含一供应商人数资料、一营业额资料、一经营时间资料的任一或组合。
[0015]
根据上述技术特征可达成以下功效:
[0016]
1.稽核准则的推荐考虑供应商经营的背景资讯(如规模、经营绩效及运营时间等定量资讯),将较仅以自然语言处理推荐提供较为适合的稽核准则。
[0017]
2.就过去所搜集的稽核发现的定性资讯及供应商相关的定量资讯,定期以自然语言处理及非监督学习就供应商进行聚类分析并进行特征选择,可客观地建立稽核发现与经营指标的相关性。
附图说明
[0018]
图1本发明一实施例的系统方块示意图。
[0019]
图2本发明另一实施例中包含建模步骤及稽核准则推荐步骤的详细流程示意图。
[0020]
【符号说明】
[0021]
100
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
系统
[0022]
1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
储存模组
[0023]
11
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
进行中分析资料
[0024]
111
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
进行中稽核发现
[0025]
112
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
进行中供应商经营数据
[0026]
12
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
历史分析资料
[0027]
121
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
已完成稽核发现
[0028]
122
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
历史供应商经营数据
[0029]
2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
主题模型转换模组
[0030]
3
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
特征向量模组
[0031]
30
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
特征向量集合
[0032]
31
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
特征向量值
[0033]
4
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
归类模组
[0034]
40
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
聚类分析
[0035]
5
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
推荐模组
[0036]
50
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
稽核准则清单
[0037]
51
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
推荐稽核准则各项
[0038]
s10
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
建模步骤
[0039]
s100
ꢀꢀꢀꢀꢀꢀꢀꢀ
建模步骤的步骤一
[0040]
s101
ꢀꢀꢀꢀꢀꢀꢀꢀ
建模步骤的步骤二
[0041]
s102
ꢀꢀꢀꢀꢀꢀꢀꢀ
建模步骤的步骤三
[0042]
s103
ꢀꢀꢀꢀꢀꢀꢀꢀ
建模步骤的步骤四
[0043]
s104
ꢀꢀꢀꢀꢀꢀꢀꢀ
建模步骤的步骤五
[0044]
s105
ꢀꢀꢀꢀꢀꢀꢀꢀ
建模步骤的步骤六
[0045]
s106
ꢀꢀꢀꢀꢀꢀꢀꢀ
建模步骤的步骤七
[0046]
s107
ꢀꢀꢀꢀꢀꢀꢀꢀ
建模步骤的步骤八
[0047]
s108
ꢀꢀꢀꢀꢀꢀꢀꢀ
建模步骤的步骤九
[0048]
s109
ꢀꢀꢀꢀꢀꢀꢀꢀ
建模步骤的步骤十
[0049]
s110
ꢀꢀꢀꢀꢀꢀꢀꢀ
建模步骤的步骤十一
[0050]
s111
ꢀꢀꢀꢀꢀꢀꢀꢀ
建模步骤的步骤十二
[0051]
s112
ꢀꢀꢀꢀꢀꢀꢀꢀ
建模步骤的步骤十三
[0052]
s20
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
稽核准则推荐步骤
[0053]
s200
ꢀꢀꢀꢀꢀꢀꢀꢀ
稽核准则推荐步骤的步骤一
[0054]
s201
ꢀꢀꢀꢀꢀꢀꢀꢀ
稽核准则推荐步骤的步骤二
[0055]
s202
ꢀꢀꢀꢀꢀꢀꢀꢀ
稽核准则推荐步骤的步骤三
[0056]
s203
ꢀꢀꢀꢀꢀꢀꢀꢀ
稽核准则推荐步骤的步骤四。
具体实施方式
[0057]
下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。
[0058]
图1揭示本发明一实施例整合定性资料及定量资料进行稽核准则推荐的系统100,实施上可为云端系统或是单机设备,主要包含一储存模组1、一主题模型转换模组2、一特征向量模组3、一归类模组4及一推荐模组5;上述系统100是用于执行本发明另一实施例整合定性资料及定量资料进行稽核准则推荐的方法;以下,将先进一步具体说明上述整合定性资料及定量资料进行稽核准则推荐的系统:
[0059]
所述储存模组1用于接收供应商稽核的一进行中分析资料11及储存过去已完成供应商稽核的一历史分析资料12;所述进行中分析资料11包含一定性资料,即一进行中稽核发现111,及一定量资料,即一进行中供应商经营数据112;所述进行中稽核发现111为稽核人员对被稽核供应商于稽核过程中所见的客观陈述,资料为文字形式,一旦稽核完成则所
述进行中稽核发现111状态更新为一已完成稽核发现121;所述进行中供应商经营数据112为一数值性资料集合,可包含但不限于例如一供应商人数资料、一营业额资料、一经营时间资料等;所述进行中供应商经营数据112可以事先搜集获得,稽核完成后状态更新为一历史供应商经营数据122,历史分析资料12为所述已完成稽核发现121及所述历史供应商经营数据122的总称。
[0060]
所述主题模型转换模组2连接所述储存模组1,定期就所述已完成稽核发现121更新一主题模型,以取得一主题模型概率分布。所述主题模型概率分布至少可运用隐含狄利克雷分布(latent dirichlet allocation,lda)演算法或非负矩阵分解(non-negative matrix factorization,nmf)其一建立。所述主题模型转换模组2以最新的一主题模型,分别对所述储存模组1储存的所述已完成稽核发现121及对所述储存模组1接收的所述进行中稽核发现111进行映射转换成所述主题模型的线性组合而产生所述主题模型概率分布。
[0061]
所述特征向量模组3连接所述主题模型转换模组2及所述储存模组1,将所述已完成稽核发现121的所述主题模型概率分布读入并与所述储存模组1储存的所述历史供应商经营数据122做结合运算,以产生一特征向量集合30,同时将所述进行中稽核发现111的所述主题模型概率分布读入并与所述储存模组1中的所述进行中供应商经营数据112做结合运算产生一特征向量值31。
[0062]
所述归类模组4连接所述特征向量模组3,可就所述特征向量集合30利用如组内最小平方和演算法决定一最适聚类数,并以所述最适聚类数利用如k-平均演算法(k-means clustering)将所述特征向量集合30进行聚类分析40;在进行聚类分析40时,所述特征向量集合30就所述进行中供应商经营数据112与所述已完成稽核发现121的所述主题模型概率分布进行结合运算,而一特征向量的各维对聚类分析结果的贡献与影响有异,因此归类模组4可以利用weighted k-means进行特征选择以降低建立聚类分析40的所述特征向量的维数;并决定所述特征向量值31所属的一聚类;具体而言,所述归类模组4会通过运算所述特征向量值31与各个所述聚类的重心的一距离值,并可将所述距离值为最小的所述聚类决定为所述特征向量值31所属的所述聚类。
[0063]
接着,所述推荐模组5连接所述归类模组4及所述主题模型转换模组2,用于接收供应商稽核所用的一稽核准则清单50,并依据所述归类模组4所决定的所述特征向量值31所属的所述聚类,由所述聚类重心的座标,取得相关性高的至少一主题,利用所述主题模型以词频-逆向文件频率(term frequency-inverse document frequency,tf-idf)至所述稽核准则清单50中查询传回依相关排序的各所述主题对应的一推荐稽核准则各项51。
[0064]
以下实施例并结合图2,将进一步详细说明所述整合定性资料及定量资料进行稽核准则推荐的方法的详细内容,主要包含一建模步骤s10及一稽核准则推荐步骤s20。所述建模步骤s10主要是依据一储存模组中的一已完成稽核发现、一稽核准则清单及一历史供应商经营数据(例如供应商人数资料、营业额资料、经营时间资料等)进行聚类分析,可以仅执行一次,也可以是定期或不定期的更新。所述稽核准则推荐步骤s20则是可将新提供的一进行中稽核发现、一进行中供应商经营数据进行归类,以提供对应的一推荐稽核准则各项。
[0065]
所述建模步骤s10包含:
[0066]
一建模步骤的步骤一s100:建立一稽核事件,输入一稽核准则清单至一推荐模组,并自所述储存模组输出所有既存的一供应商的一编号及对应所述编号的所述已完成稽核
发现(csv档)。
[0067]
一建模步骤的步骤二s101:所述主题模型转换模组利用pandas工具读入所述建模步骤的步骤一s100所输出的所述已完成稽核发现。
[0068]
一建模步骤的步骤三s102:所述主题模型转换模组利用gensim工具对所述建模步骤的步骤二s101中的所述已完成稽核发现进行分词。
[0069]
一建模步骤的步骤四s103:所述主题模型转换模组以spacy工具与nltk(natural language tool kit)工具对所述建模步骤的步骤三s102中分词后的所述已完成稽核发现进行停用词移除与词根提取等前处理。要补充说明的是,上述pandas、gensim、spacy、nltk皆为python程式语言的自然语言或数据分析处理软件工具。
[0070]
一建模步骤的步骤五s104:所述主题模型转换模组将所述建模步骤的步骤四s103处理后的所述已完成稽核发现转换至词频(term frequency)空间向量。
[0071]
一建模步骤的步骤六s105:所述主题模型转换模组以隐含狄利克雷分布(latent dirichlet allocation,lda)演算法对所述建模步骤的步骤五s104处理后的所述已完成稽核发现建立一主题模型并最佳化。
[0072]
一建模步骤的步骤七s106:所述主题模型转换模组将所述已完成稽核发现映射成所述主题模型的一主题模型概率分布,亦即d=σφt,其中,d为所述已完成稽核发现,t为所述主题模型,而φ为t于d的中的概率。
[0073]
一建模步骤的步骤八s107:一特征向量模组取出φ并自所述储存模组读入一定量资讯,即所述历史供应商经营数据v并作结合运算,产生一特征向量f=v+=φ,并由所有的所述特征向量f构成一特征向量集合f
n

[0074]
一建模步骤的步骤九s108:一归类模组对所述特征向量集合f
n
利用k-平均演算法进行分析,以最小组内平方和(within-cluster sum of squares,wcss)求得一最适聚类数k。
[0075]
一建模步骤的步骤十s109:就m维所述特征向量f随意给定w
j
,但其中,w
j
为对应m个所述特征向量值的权重集合。
[0076]
一建模步骤的步骤十一s110:给定β(β>1)及k,随意给定一聚类重心z
k
,固定两者递回依次解最小的(c,z,w),其中,c
il
为一正交矩阵,仅当i=l时为1,亦即是仅计算n个x与其所属聚类重心z
k
的距离值。
[0077]
一建模步骤的步骤十二s111:m=p+q,依w
j
大小自m中选择p而q≧0,且p中的r为选取的φ,更详细的说,所述建模步骤的步骤十二s111自m个所述特征向量值中,选择前p个权重w较大的所述特征向量值,剩余q个所述特征向量值未被选择,而这p个所述特征向量值中,有r个所述特征向量值来自于所述主题模型概率分布。
[0078]
一建模步骤的步骤十三s112:以r个主题利用tf-idf对所述稽核准则清单查询传回依相关排序的各所述主题对应的一稽核准则各项。
[0079]
所述稽核准则推荐步骤s20包含:
[0080]
一稽核准则推荐步骤的步骤一s200:所述储存模组接收来自一用户端(例如智慧型手机、笔记型电脑、平板电脑等)的一进行中分析资料,所述进行中分析资料包含所述进
行中供应商经营数据及所述进行中稽核发现。
[0081]
一稽核准则推荐步骤的步骤二s201:所述归类模组对所述进行中分析资料的所述进行中稽核发现以已建立的所述主题模型进行映射而得d
a
=σφ
a
t
a
,a代表所述稽核事件。
[0082]
一稽核准则推荐步骤的步骤三s202:所述归类模组以p
a
个特征计算与各所述聚类的重心zk间的最小距离,决定当时的所述聚类c
a

[0083]
一稽核准则推荐步骤的步骤四s203:所述推荐模组自c
a
的重心依与所述主题的相关程度依序推荐由所述建模步骤的步骤十三s112所生成的对应的所述稽核准则各项给所述用户端,即所述推荐稽核准则各项。
[0084]
借此,使用者可于稽核现场即时上传供应商经营数据及稽核发现,其中,稽核发现经主题模型(topic model)转换运算后形成主题分布,并整合供应商经营数据以非监督学习(如k-means运算法)后就原先聚类进行归类后,取该类中概率较高的主题排序后,便可依序传回各主题的对应推荐稽核准则各项做为稽核机会的参考。
[0085]
综合上述实施例的说明,当可充分了解本发明的操作、使用及本发明产生的功效,惟以上所述实施例仅为本发明的较佳实施例,当不能以此限定本发明实施的范围,即依本发明申请专利范围及发明说明内容所作简单的等效变化与修饰,皆属本发明涵盖的范围内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1