本发明涉及企业信息智能诊断领域,尤其涉及一种企业智能诊断信息生成方法、装置、设备和存储介质。
背景技术:
1、企业诊断是对企业的经营状况、运营问题和潜在风险进行全面分析和评估,进而了解当前的经营情况,发现问题和机会,并提出相应的改进措施和战略建议,企业诊断通常用于辅助企业高层、金融机构或管理培训公司等对企业战略和风险进行评估及诊断。
2、目前,现有的企业诊断都是依靠专门的分析师查阅大量资料,手动整理并根据经验判断,由于信息的数量较大,且数据诊断的结果根据分析师的经验判断的原因,存在查询诊断效率较差,根据经验判断的结果并不完全可靠的问题。
3、为了解决上述问题,现有技术中采用聚类和分类方法收集企业内部数据,对数据进行分析方案,聚类是无监督学习,让机器自己对海量文本分类,而分类是有监督学习,是用户定义一些类别,然后机器根据用户给定的类别进行分类,现有技术聚类和分类方法在信息挖掘中存在遗漏,无法满足用户的需求,很难保证信息挖掘的全面性,而且现有的信息诊断方法很难对数据准确的分组;另外,现有技术中的企业诊断方法对采集到的数据进行笼统分析,没有针对性的数据分析对象,因此,还存在数据分析结果不可靠的缺陷。
4、综上所述,亟需一种企业智能诊断信息生成方法,来解决现有企业诊断方法中存在的信息挖掘不全面、难以实现精确分组和数据分析结果不可靠的问题。
技术实现思路
1、本发明实施例提供了一种企业智能诊断信息生成方法、装置、设备和存储介质,旨在解决现有企业诊断方法中存在的信息挖掘不全面、难以实现精确分组,以及数据分析结果不可靠的问题。
2、本发明实施例是这样实现的,提供了一种企业智能诊断信息生成方法,包括:
3、获取源数据,对所述源数据进行预处理,生成预处理数据,所述预处理数据中包含多个对象,所述对象为词汇和/或短语;
4、采用聚类模型、分类模型和主题挖掘建模的方式分别对所述预处理数据中的对象进行分组,生成对应的主题集和概率分布,其中,每个主题集中包含一个或者多个主题,每个主题中包含一个或者多个对象,概率分布为各模型预测所述对象分别隶属于不同主题的概率;
5、将所述对应的主题集进行归一化处理,并对所述归一化处理后的主题集分别配置相应模型的权重值;
6、根据所述概率分布和所述相应模型的权重值,计算各对象在所有模型中预测概率的加权分数,选出所述加权分数最高的主题类别作为最终的分组结果;
7、对所述分组结果进行信息提取和分析,生成诊断结果摘要。
8、更进一步地,根据所述分组结果进行信息提取和分析,生成诊断结果摘要的步骤,具体为:
9、对所述分组结果进行关键词抽取生成所述分组结果的核心文本;
10、对所述核心文本进行情感分析,以识别所述核心文本的情感极性;
11、根据所述情感分析结果,生成企业评价诊断摘要。
12、更进一步地,述关键词包括实体信息、正面信息或负面信息。
13、更进一步地,根据所述分组结果进行信息提取和分析,生成诊断结果摘要的步骤,具体为:
14、对所述分组结果进行命名实体信息抽取生成所述分组结果的实体信息;
15、对所述实体信息进行时间序列分析,以识别事件随时间的变化趋势;
16、根据所述时间序列分析结果,生成企业事件梳理摘要。
17、更进一步地,所述实体信息为名称、地点、时间,或者事件中的其中之一或其任意组合。
18、更进一步地,根据所述分组结果进行信息提取和分析,生成诊断结果摘要的步骤,具体为:
19、对所述分组结果进行关键词抽取生成所述分组结果的核心文本,同时对所述分组结果进行命名实体信息抽取生成所述分组结果的实体信息;
20、对所述核心文本进行情感分析,同时对所述实体信息进行时间序列分析;
21、根据所述情感分析结果和所述时间序列分析结果,生成企业综合诊断结果摘要。
22、更进一步地,所述建模为采用lda模型进行商业主题建模。
23、本发明实施例还提供了一种企业智能诊断信息生成装置,包括:
24、数据预处理单元,用于获取源数据,对所述源数据进行预处理,生成预处理数据,所述预处理数据中包含多个对象,所述对象为词汇和/或短语;
25、多模型分组单元,用于采用聚类模型、分类模型和主题挖掘建模的方式分别对所述预处理数据中的对象进行分组,生成对应的主题集和概率分布,其中,每个主题集中包含一个或者多个主题,每个主题中包含一个或者多个对象,概率分布为各模型预测所述对象分别隶属于不同主题的概率;
26、归一化处理单元,用于将所述对应的主题集进行归一化处理,并对所述归一化处理后的主题集分别配置相应模型的权重值;
27、计算分组结果单元,用于根据所述概率分布和所述相应模型的权重值,计算各对象在所有模型中预测概率的加权分数,选出所述加权分数最高的主题类别作为最终的分组结果;
28、摘要输出单元,用于对所述分组结果进行信息提取和分析,生成诊断结果摘要。
29、本发明实施例还提供了一种企业智能诊断信息生成设备,包括:存储器和处理器;
30、所述存储器,用于存储程序;
31、所述处理器,用于执行所述程序,实现上述的企业智能诊断信息生成方法的各个步骤。
32、本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现上述的企业智能诊断信息生成方法的各个步骤。
33、通过对源数据进行预处理,之后分别经过主题聚类、主题分类和潜在主体挖掘,可挖掘出预处理数据潜在的关联,并根据潜在关联获取分组依据,这样可更准确的将数据分组;通过对三个模型的输出进行标准化或归一化处理,提高企业诊断结果的可靠性,根据各模型的权重计算加权分数,选出分数最高的主题类别,作为最终的分组结果,提高了分组结果的准确性。
34、同时,针对分组结果采用先信息提取,再侧重分析的方式,包括对不同主题类别的文本资料分别采用关键词提取算法和命名实体信息抽取的算法来实现信息抽取,并对信息抽取结果进行情感分析和时间序列分析以及综合分析,最终生成面向企业不同对象的诊断结果,实现有针对性的数据分析对象,使诊断结果更具有侧重点和结果更可靠。
1.一种企业智能诊断信息生成方法,其特征在于,包括:
2.如权利要求1所述的企业智能诊断信息生成方法,其特征在于,根据所述分组结果进行信息提取和分析,生成诊断结果摘要的步骤,具体为:
3.如权利要求2所述的企业智能诊断信息生成方法,其特征在于,所述关键词包括实体信息、正面信息或负面信息。
4.如权利要求1所述的企业智能诊断信息生成方法,其特征在于,根据所述分组结果进行信息提取和分析,生成诊断结果摘要的步骤,具体为:
5.如权利要求4所述的企业智能诊断信息生成方法,其特征在于,所述实体信息为名称、地点、时间,或者事件中的其中之一或其任意组合。
6.如权利要求1所述的企业智能诊断信息生成方法,其特征在于,根据所述分组结果进行信息提取和分析,生成诊断结果摘要的步骤,具体为:
7.如权利要求1所述的企业智能诊断信息生成方法,其特征在于,所述建模为采用lda模型进行商业主题建模。
8.一种企业智能诊断信息生成装置,其特征在于,包括:
9.一种企业智能诊断信息生成设备,其特征在于,包括:存储器和处理器;
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1至7中任一项所述的企业智能诊断信息生成方法的各个步骤。