应用智能辅助决策的大数据处理方法及智能辅助决策系统与流程

文档序号:36821274发布日期:2024-01-26 16:29阅读:24来源:国知局
本发明涉及大数据,特别涉及一种应用智能辅助决策的大数据处理方法及智能辅助决策系统。
背景技术
::1、智能辅助决策是一个涵盖了大数据处理、机器学习、人工智能等技术的复杂过程。一些应用于智能辅助决策的大数据处理技术包括数据挖掘、机器学习、分布式存储和处理、实时流处理、数据可视化、云确定和数据湖等。2、其中,数据挖掘通过使用各种统计分析方法,如关联性分析、聚类分析、分类分析等,从大规模、复杂、动态变化的数据中提取有价值的信息和知识。机器学习通过训练模型,使其能够从大量数据中学习并预测结果,包括监督学习(如决策树、神经网络和支持向量机)、无监督学习(如聚类和主成分分析)以及强化学习。对于非常大的数据集,通常需要在多台机器上进行分布式存储和处理。hadoop和spark是两个广泛使用的开源框架,它们可以处理pb级别的数据。apache kafka、storm、flink等工具提供了实时流数据处理的功能,这对于需要快速响应的决策系统至关重要。数据可视化可以将复杂的数据以图形方式展示,帮助用户更好地理解数据并做出决策,常用的数据可视化工具有tableau、powerbi等。以上各种技术相互结合,可以实现智能辅助决策的全过程,从数据收集、预处理、分析到最终的决策制定。3、当智能辅助决策应用在话题分析处理领域时,如何准确地实现话题的实时追踪预警以避免话题爆炸导致的服务器崩溃,是其中一个需要攻克的技术问题。技术实现思路1、本发明至少提供一种应用智能辅助决策的大数据处理方法及智能辅助决策系统。2、本发明的技术方案是通过如下至少部分实施例实现的。3、一种应用智能辅助决策的大数据处理方法,应用于智能辅助决策系统,所述方法包括:4、对于第一互联网社群对话信息和依据该第一互联网社群对话信息抽取所得的第二互联网社群对话信息,分别通过预调试的lda话题抽取网络中的第一神经网络分支进行针对目标在线话题的识别操作,得到对应的第一对话文本语义关系谱和第二对话文本语义关系谱;其中,所述目标在线话题为所述第一互联网社群对话信息中包括的新闻舆情话题;5、通过所述第一对话文本语义关系谱和所述第二对话文本语义关系谱,得到对话文本交叉语义关系谱;其中,所述对话文本交叉语义关系谱用于指示所述目标在线话题的评论观点集;6、针对所述第一互联网社群对话信息和所述对话文本交叉语义关系谱,通过所述lda话题抽取网络中依据局部聚焦策略的第二神经网络分支进行针对所述目标在线话题的识别操作,得到与所述目标在线话题相应的话题文本;7、利用所述话题文本进行实时追踪预警决策。8、优选的,所述第一神经网络分支包括第一特征映射节点和第二特征映射节点;所述第一特征映射节点包括采用设定方式连接的第一文本语义挖掘核和第一文本语义拼接核;所述第一文本语义拼接核中每一可逆层的输出通道皆与所述第二特征映射节点的输入通道相连;9、所述对于第一互联网社群对话信息和依据该第一互联网社群对话信息抽取所得的第二互联网社群对话信息,分别通过预调试的lda话题抽取网络中的第一神经网络分支进行针对目标在线话题的识别操作,得到对应的第一对话文本语义关系谱和第二对话文本语义关系谱,包括针对所述第一互联网社群对话信息和所述第二互联网社群对话信息分别实施以下处理:10、通过所述第一文本语义挖掘核,针对输入的互联网社群对话信息进行针对所述目标在线话题的文本语义挖掘处理;11、通过所述第一文本语义拼接核,针对所述第一文本语义挖掘核的输出进行针对所述目标在线话题的文本语义拼接处理;12、通过所述第二特征映射节点,针对所述第一文本语义拼接核中每一可逆层的输出进行针对所述目标在线话题的文本语义映射处理,得到所述第一神经网络分支生成的对话文本语义关系谱。13、优选的,所述通过所述第一对话文本语义关系谱和所述第二对话文本语义关系谱,得到对话文本交叉语义关系谱,包括:14、针对所述第二对话文本语义关系谱进行衍生扩展,以使衍生扩展后的第二对话文本语义关系谱维度与所述第一对话文本语义关系谱一致;15、针对所述第一对话文本语义关系谱和所述衍生扩展后的第二对话文本语义关系谱进行求和处理,得到全局对话文本语义关系谱;16、针对所述第一对话文本语义关系谱和所述衍生扩展后的第二对话文本语义关系谱进行作差处理,得到阶段对话文本语义关系谱;17、依据所述全局对话文本语义关系谱和所述阶段对话文本语义关系谱,针对所述目标在线话题的评论观点集进行挖掘,得到经高亮处理的对话文本交叉语义关系谱。18、优选的,所述针对所述第一对话文本语义关系谱和所述衍生扩展后的第二对话文本语义关系谱进行求和处理,得到全局对话文本语义关系谱,包括:19、针对所述衍生扩展后的第二对话文本语义关系谱进行优化,以过滤掉所述第二对话文本语义关系谱中的噪声语义关系集,得到优化后的第二对话文本语义关系谱;20、针对所述优化后的第二对话文本语义关系谱,挖掘所述优化后的第二对话文本语义关系谱中所述目标在线话题的评论观点集,并对该评论观点集进行更新,得到更新后的第二对话文本语义关系谱;21、将所述第一对话文本语义关系谱和所述更新后的第二对话文本语义关系谱进行求和处理,得到全局对话文本语义关系谱。22、优选的,所述目标在线话题包括话题热度不大于设定热度门限的第一在线话题和话题热度大于所述设定热度门限的第二在线话题;23、所述依据所述全局对话文本语义关系谱和所述阶段对话文本语义关系谱,针对所述目标在线话题的评论观点集进行挖掘,得到经高亮处理的对话文本交叉语义关系谱,包括:24、针对所述全局对话文本语义关系谱中所述目标在线话题的评论观点集进行挖掘,得到第一评论观点集信息;25、针对所述第一评论观点集信息与所述阶段对话文本语义关系谱进行乘积处理,得到所述第一在线话题的评论观点集信息;26、针对所述第一评论观点集信息与所述第一在线话题的评论观点集信息进行作差处理,得到所述第二在线话题的评论观点集信息;27、针对所述第一在线话题的评论观点集信息指示的评论观点集进行更新,并依据更新后的第一在线话题的评论观点集信息、所述全局对话文本语义关系谱和更新前的第一在线话题的评论观点集信息得到所述第一在线话题除评论观点集信息外的第一文本数据;28、依据更新后的第一在线话题的评论观点集信息、所述第二在线话题的评论观点集信息和所述全局对话文本语义关系谱得到所述第二在线话题除评论观点集信息外的第二文本数据;29、依据设定变量与所述全局对话文本语义关系谱的比较结果确定所述第一互联网社群对话信息中的非关键文本;30、依据所述非关键文本、所述第一在线话题的评论观点集信息、所述第一文本数据、所述第二在线话题的评论观点集信息、所述第二文本数据得到对话文本交叉语义关系谱。31、优选的,所述第二神经网络分支包括第三特征映射节点和第四特征映射节点;所述第三特征映射节点包括采用设定方式连接的第二文本语义挖掘核和第二文本语义拼接核;所述第二文本语义挖掘核包括最少两个语义提炼算子,该语义提炼算子包括级联的由最少一个局部聚焦层和与该局部聚焦层连接的特征压缩层构成的最少一个单元,和由最少一个可逆层和与该可逆层连接的特征压缩层构成的最少一个单元;所述第二文本语义拼接核包括最少两个语义拼接算子,该语义拼接算子包括级联的由最少一个可逆层和与该可逆层连接的衍生扩展层构成的最少一个单元,和由最少一个局部聚焦层和与该局部聚焦层连接的衍生扩展层构成的最少一个单元;所述第二文本语义拼接核中的每一可逆层和每一局部聚焦层皆与所述第四特征映射节点连接;32、所述针对所述第一互联网社群对话信息和所述对话文本交叉语义关系谱,通过所述lda话题抽取网络中依据局部聚焦策略的第二神经网络分支进行针对所述目标在线话题的识别操作,得到与所述目标在线话题相应的话题文本,包括:33、通过所述第二文本语义挖掘核,结合所述对话文本交叉语义关系谱,依据局部聚焦策略针对所述第一互联网社群对话信息进行针对所述目标在线话题的文本语义挖掘处理;34、通过所述第二文本语义拼接核,结合所述对话文本交叉语义关系谱,依据局部聚焦策略针对所述第二文本语义挖掘核的输出进行针对所述目标在线话题的文本语义拼接处理;35、通过所述第四特征映射节点,针对所述第二文本语义拼接核中每一可逆层和每一局部聚焦层的输出进行针对所述目标在线话题的文本语义映射处理,得到与所述目标在线话题相应的话题文本。36、优选的,所述局部聚焦层包括用于依据输入的对话文本语义关系谱进行局部聚焦处理的第一组件和用于依据所述对话文本交叉语义关系谱提取语义特征块的第二组件;所述第一组件包括级联的第一可逆子模型、局部聚焦子模型和第二可逆子模型;所述第一可逆子模型的输出通道与所述第二可逆子模型的输出通道间隔相连;所述第二组件与所述局部聚焦子模型连接;37、通过所述局部聚焦层针对输入的对话文本语义关系谱和所述对话文本交叉语义关系谱进行局部聚焦处理,包括:38、通过所述第一可逆子模型,针对输入的对话文本语义关系谱进行文本语义映射处理,得到中间对话文本语义关系谱;39、通过所述局部聚焦子模型,依据所述中间对话文本语义关系谱针对所述第二组件生成的每一局部文本语义关系谱确定索引特征,针对所述第二组件生成的每一局部文本语义关系谱中的每一语义特征块确定标识特征和属性特征,并依据所述索引特征、所述标识特征和所述属性特征进行局部聚焦处理,得到焦点化文本语义关系谱;40、通过所述第二可逆子模型,针对所述焦点化文本语义关系谱进行文本语义映射处理,得到所述第二可逆子模型的输出,并将该输出与第一可逆子模型的输出进行求和得到当前局部聚焦层生成的对话文本语义关系谱。41、优选的,通过所述第二组件依据所述对话文本交叉语义关系谱提取语义特征块,包括:42、针对所述对话文本交叉语义关系谱进行拆解,得到最少两个局部文本语义关系谱;43、针对每一局部文本语义关系谱中包括的高亮语义进行特征集成,得到各高亮语义对应的语义特征块;其中,所述高亮语义包括非关键文本、第一在线话题的评论观点集信息、第一文本数据、第二在线话题的评论观点集信息、第二文本数据;所述第一在线话题包括所述目标在线话题中话题热度不大于设定热度门限的在线话题;所述第二在线话题包括所述目标在线话题中话题热度大于所述设定热度门限的在线话题;所述第一文本数据包括所述第一在线话题中除评论观点集信息外的数据;所述第二文本数据包括所述第二在线话题除评论观点集信息外的数据。44、优选的,所述lda话题抽取网络经由以下步骤调试得到:45、获取网络调试样本,所述网络调试样本中包括多个样本互联网社群对话信息,且每一样本互联网社群对话信息具有对应于所述目标在线话题的评论观点集上的先验关键词的注释信息;46、依据所述网络调试样本对lda话题抽取网络进行循环调试,直到符合设定完成要求,得到完成调试的lda话题抽取网络;47、其中,在每一次循环调试中,通过设定网络代价指标,依据lda话题抽取网络生成的话题预测文本中对应于所述目标在线话题的评论观点集上的预测关键词的判别信息与所述注释信息,确定lda话题抽取网络生成的预测结果与先验结果之间的目标代价变量,并依据该目标代价变量进行模型参量改进。48、在一些独立性设计思路下,所述设定网络代价指标包括采用交叉熵的第一调试代价;所述通过设定网络代价指标,依据lda话题抽取网络生成的话题预测文本中对应于所述目标在线话题的评论观点集上的预测关键词的判别信息与所述注释信息,确定lda话题抽取网络生成的预测结果与先验结果之间的目标代价变量,包括:49、针对当前样本互联网社群对话信息中的每一所述先验关键词,确定当前文本单位到该先验关键词的词向量差异的置信度;50、通过所述第一调试代价,依据所述置信度、所述判别信息和所述注释信息,确定lda话题抽取网络生成的预测结果与先验结果之间的交叉熵代价变量,并依据该交叉熵代价变量确定目标代价变量。51、在一些独立性设计思路下,所述设定网络代价指标还包括第二调试代价,该第二调试代价包括依据情感特征进行限制的量化指标;52、所述通过设定网络代价指标,依据lda话题抽取网络生成的话题预测文本中对应于所述目标在线话题的评论观点集上的预测关键词的判别信息与所述注释信息,确定lda话题抽取网络生成的预测结果与先验结果之间的目标代价变量,包括:53、针对当前样本互联网社群对话信息中的每一第一在线话题,依据所述判别信息对应的预测关键词进行识别处理得到预测识别结果,并依据所述注释信息对应的先验关键词进行识别处理得到先验识别结果;所述第一在线话题为所述目标在线话题中话题热度不大于设定热度门限的在线话题;54、通过所述第二调试代价,依据所述预测识别结果和所述先验识别结果确定lda话题抽取网络生成的预测结果与先验结果之间的共性评分;55、基于所述交叉熵代价变量和所述共性评分确定目标代价变量。56、在一些独立性设计思路下,所述识别处理包括:57、以处于所述第一在线话题的评论观点集上的评论词句为基准,以该第一在线话题的平均话题热度的1/2为识别周期,针对评论观点集上的每一个评论词句进行识别,得到与该评论词句相关的剩余设定变量个识别词句,并以该识别词句对应的分布标签得到识别结果。58、一种智能辅助决策系统,包括:处理器、存储器以及网络接口;所述处理器与所述存储器、所述网络接口相连;所述网络接口用于提供数据通信功能,所述存储器用于存储程序代码,所述处理器用于调用所述程序代码,以执行上述方法。59、一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在运行时执行应用智能辅助决策的大数据处理方法。60、一种计算机程序产品,包括计算机程序或计算机可执行指令,所述计算机程序或计算机可执行指令被处理器执行时,实现应用智能辅助决策的大数据处理方法。61、本发明实施例提供一种应用智能辅助决策的大数据处理方法,在获取到需要进行互联网社群对话信息拆解的第一互联网社群对话信息时,可以依据该第一互联网社群对话信息进行信息抽取得到第二互联网社群对话信息,并通过预调试的lda话题抽取网络中的第一神经网络分支,分别对于第一互联网社群对话信息和第二互联网社群对话信息中的目标在线话题进行识别操作,得到与第一互联网社群对话信息对应的第一对话文本语义关系谱和与第二互联网社群对话信息对应的第二对话文本语义关系谱;其中,目标在线话题为互联网社群对话信息中包括的新闻舆情话题;这样,可以对于第一对话文本语义关系谱和第二对话文本语义关系谱进行交叉,得到用于指示目标在线话题(新闻舆情)的评论观点集的对话文本交叉语义关系谱;在该基础上,对于第一互联网社群对话信息和对话文本交叉语义关系谱,可以通过lda话题抽取网络中依据局部聚焦策略的第二神经网络分支进行针对目标在线话题的识别操作,得到与目标在线话题相应的话题文本。最后利用话题文本进行实时追踪预警决策。62、可见,本发明的实施能够首先针对不同文本细粒度的输入的互联网社群对话信息进行针对目标在线话题的识别操作,得到分别对应的对话文本语义关系谱,这样交叉所得的对话文本语义关系谱可以得到表征有目标在线话题(新闻舆情)的评论观点集,基于此,再结合对话文本交叉语义关系谱依据局部聚焦策略对第一互联网社群对话信息进行针对目标在线话题的识别操作,可以有效提高新闻舆情话题的相关文本拆解的准确性,且综合挖掘的评论观点集进行互联网社群对话信息抽取,还能够显著提升对话题热度较低的目标在线话题的敏感性,以实现准确、可靠的话题文本拆解。这样一来,可以利用精准且噪声率低的话题文本进行实时追踪预警决策,避免舆情爆发带来的服务器崩溃。63、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本发明的技术方案。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1