一种基于社会宏观经济指标的联动神经网络模型的案件趋势动态预测方法与流程

文档序号:18786398发布日期:2019-09-29 17:53阅读:242来源:国知局
一种基于社会宏观经济指标的联动神经网络模型的案件趋势动态预测方法与流程

本发明涉及案件趋势预测技术领域,具体是一种基于社会宏观经济指标的联动神经网络模型的案件趋势动态预测方法,属于信息处理技术领域。



背景技术:

智慧法院的建设,是人民法院促进审判体系和审判能力现代化,推进司法为民、公正为民的重要环节。司法效率有利于司法公正,司法改革过程中不仅要注重公正,也要注重效率,如何在保证司法公正的前提下,提升司法效率,是当前进一步推进智慧法院建设的重要内容。一个致力于研究案件的趋势、走向,合理配置司法资源,节约司法成本,提高司法效率进一步推进智慧法院建设的法院案件预测分析系统是大势所趋。

司法大数据是人民法院的重要信息资源。加强对司法大数据的整合、研究和应用,不但是推进人民法院审判体系和审判能力现代化的现实需要,更是加速推进“智慧法院”建设的必然要求。

在大力促进智慧法院的信息化、智能化建设,提高司法公平效率,优化司法资源配置的大背景下,研究案件数量的增长趋势和走向,研究司法资源的合理配置,研究社会经济以及政策因子等对案件数的影响程度,对于优化司法资源配置具有极其重要的意义。实际上,各地决策人员经常关注的是那些对案件趋势变动有影响的社会因子,并且希望能够采取某种方式来量化这种影响过程。特别地,如何实现在更改某些指标未来的值的时候,能够时事观察到未来案件的趋势变动情况,提前做好相应的防备措施,对当地的决策人员提供宏观决策辅助服务具有积极的意义。

基于此,中国专利cn201710099485.8公开一种应用于行政执法领域的案件趋势预测分析通用方法,涉及行政执法领域,针对不同类型的数据库,通过可视化的形式配置数据源,选择导入数据表及字段,根据对历史关键数据及当前关键数据的分析,制定案件趋势预测模型规则;找出重点执法关注区域,重点执法关注对象,进行重点监管,帮助执法人员有效预测区域内未来案发情况,做好事先有效的监管预防,规范相关营业场所,净化社会环境。

上述现有的技术仅仅是概述性地描述了一种行政执法领域的案件趋势预测的通用方法,没有具体对实现的技术细节做详细说明,无法复现。通过实际数据观察到,总体案件数量和很多宏观社会经济指标都是呈现逐年波动上升的趋势,这在感性上说明了他们之间的相关关系。因此本发明主要是利用各大社会经济指标对案件数量趋势进行预测和解释,同时支持用户修改某些指标的值来影响未来案件数量的变化趋势,对决策者提供动态的决策辅助

基于此,本发明提供了一种基于社会宏观经济指标的联动神经网络模型的案件趋势动态预测方法,其主要通过建立各个地区(省、市、区、法院等)的社会宏观经济指标(比如gdp、人口数量、房价、零售总额、居民收入、固定资产等)和案件(总体案件、行政案件、刑事案件、民商事案件以及其他一些热门案由案件等)数量之间的联动神经网络模型,实现对案件数量的自动预测,并且提供社会因子之间的相关关系和社会因子对案件趋势变动的影响过程,为当地的决策人员提供宏观决策辅助服务,以解决上述背景技术中提出的问题。



技术实现要素:

本发明的目的在于提供一种基于社会宏观经济指标的联动神经网络模型的案件趋势动态预测方法,以解决上述背景技术中提出的问题。

为实现上述目的,本发明提供如下技术方案:

一种基于社会宏观经济指标的联动神经网络模型的案件趋势动态预测方法,该案件趋势动态预测方法通过网络爬虫或者直接获取的方式,获取到某地区的社会宏观经济指标的历史数据和某类型案件历史数据之后,通过建模和预测,其包括以下步骤:

(i)利用社会宏观经济指标来预测案件趋势,给案件变动提供了可解释性因子;

(ii)利用联动神经网络模型来建立多个社会宏观经济指标和案件数量之间的函数映射关系,可以定量描述社会宏观经济指标之间的相关关系;

(iii)通过修改社会宏观经济指标未来的变动值,动态观察案件数量的变动情况。

进一步,作为优选,建模过程,包括以下步骤:

(1)模型假设:为了以下算法细节以及公式描述的方便性,假设有a、b、c、d四个社会宏观经济指标(实际上社会宏观经济指标有很多,我们在实践中使用了30个左右的指标,如gdp、房价、常住人口、流动人口、固定资产、零售总额、就业人数、进出口总额、固定资产、地方财政等等,下文的“指标”或者“社会宏观经济指标”都是指这里说的“社会宏观经济指标”),如果指标数量不是4个,则可以根据算法细节和公式的描述进行类似修改;案件数量用n来表示,i表示第i年,第一年对应的i为1。

(1.1)训练指标趋势外推模型:经过数据可视化观察和分析,发现指标的趋势比较明显,大部分呈现出稳步上升的趋势,因此,利用可以使用模型来拟合它们的趋势。先利用神经网络对a、b、c、d分别训练趋势外推模型,模型的输入是i,输出是对应的每年的指标的值。其中,所述的趋势外推模型为时间序列模型、回归模型或者神经网络模型,模型训练完成之后预测未来一年的指标值,预测的指标值用于后续预测案件数量未来一年的值。

(1.2)训练指标-案件数量相关模型:经过分析发现,指标和案件之间呈现出较强的相关关系,包括正相关和负相关。根据机器学习模型在数据分布为正态分布或者近似正态分布时的有效性,将数据进行一定的处理和转换,使得数据近似满足正态分布。然后分别利用神经网络模型建立四个指标a、b、c、d和n的相关模型,分别记为模型:a-n、b-n、c-n、d-n,其中指标是自变量,案件数量是因变量;

(1.3)组合以上模型,用于案件趋势预测:

将以上a-n、b-n、c-n、d-n四个模型合并成一个模型,合并的方法是加权求和,每个模型的权重为计算出之后归一化的结果。

上述公式中的:

wj表示加权求和的第j个模型对最终案件影响的权重(归一化之前);

lossj训练第j个模型所产生的损失;

ρj指标与案件数量的相关系数;

var(aj)模型预测历史案件的增幅的标准差。

进一步,作为优选,在获取到某地区的社会宏观经济指标的历史数据和某类型案件历史数据中,其历史数据可以是年度数据、季度数据或者月份数据。

进一步,作为优选,在建立模型之前,需要将指标数据和案件数量进行标准化,即将数据按照比例缩放,使之落入一个特定的区间,以消除量纲和数量级差异对模型带来的不良影响。

进一步,作为优选,该案件趋势动态预测方法使用多个社会宏观经济指标作为自变量,建立联动的神经网络案件趋势预测模型

与现有技术相比,本发明的有益效果是:

(1)本发明利用社会宏观经济指标来预测案件趋势,给案件变动提供了可解释性因子;

(2)本发明利用联动神经网络模型来建立多个社会宏观经济指标和案件数量之间的函数映射关系,可以定量描述社会宏观经济指标之间的相关关系以及社会宏观经济指标和案件趋势变化之间的关系;

(3)本发明通过修改社会宏观经济指标未来的模型预测值,动态观察案件数量的变动情况。

(4)本发明并不是利用案件数据本身来预测未来的趋势,而是将多个社会宏观经济指标作为自变量,案件数量作为因变量,将社会宏观经济指标对案件数量的影响进行量化,可以为案件数量的趋势变动提供可解释性,为当地相关决策人员提供决策辅助。

(5)本发明不是概述性地说明案件趋势预测的实现过程,而是考虑到一个地区的案发数量是受到众多社会宏观因素的影响,因此使用多个社会宏观经济指标作为自变量,建立联动的神经网络案件趋势预测模型,并提供了详细的步骤、公式和模型,不仅能够提高案件数量预测的准确率,也能够给案件变动原因作出合理的解释,还能够找到案件数量和社会宏观经济指标之间的定量关系,为当地相关决策人员提高辅助决策参考

附图说明

图1为一种基于社会宏观经济指标的联动神经网络模型的案件趋势动态预测方法的流程示意图;

具体实施方式

请参阅图1,本发明实施例中,一种基于社会宏观经济指标的联动神经网络模型的案件趋势动态预测方法,该案件趋势动态预测方法通过网络爬虫或者直接获取的方式,获取到某地区的社会宏观经济指标的历史数据和某类型案件历史数据之后,通过建模和预测,其包括以下步骤:

(i)利用社会宏观经济指标来预测案件趋势,给案件变动提供了可解释性因子;

(ii)利用联动神经网络模型来建立多个社会宏观经济指标和案件数量之间的函数映射关系,可以定量描述社会宏观经济指标之间的相关关系;

(iii)通过修改社会宏观经济指标未来的变动值,动态观察案件数量的变动情况。

本发明通过网络爬虫或者直接获取的方式,获取到某地区的社会宏观经济指标的历史(年度、季度、月份等)数据和某类型案件历史(年度、季度、月份等)数据之后,分以下两个步骤实现建模和预测过程。

在本实施例中,以下所述历史数据均是以“年”为单位。

对于其他实施例,其他季度和月份等的模型也是同样的道理与方法。

对于模型训练步骤,其包括以下方法与步骤:

(1)为了以下算法细节以及公式描述的方便性,假设有a、b、c、d四个社会宏观经济指标,需要指出的是,实际上社会宏观经济指标有很多,我们在实践中使用了30个左右的指标,如gdp、房价、常住人口、流动人口、固定资产、零售总额、就业人数、进出口总额、固定资产、地方财政等等,下文的“指标”或者“社会宏观经济指标”都是指这里说的“社会宏观经济指标”,如果指标数量不是4个,则可以根据算法细节和公式的描述进行类似修改;案件数量用n来表示,i表示第i年,第一年对应的i为1。

(1.1)训练指标趋势外推模型

经过可视化观察和分析,发现指标的趋势比较明显,大部分呈现出稳步上升的趋势,因此可以利用模型来拟合它们的趋势。先利用神经网络对a、b、c、d分别训练趋势外推模型,模型的输入是i,输出是对应的每年的指标的值。这里的趋势外推模型可以是时间序列模型,也可以是回归模型,甚至可以是神经网络模型,不做限定,具体用什么模型根据实际效果确定。模型训练完成之后需要预测未来一年的指标值,用于后续预测案件数量未来一年的值。

(1.2)训练指标-案件数量相关模型

经过分析发现,指标和案件之间呈现出较强的相关关系,包括正相关和负相关。根据机器学习模型在数据分布为正态分布或者近似正态分布时的有效性,将数据进行一定的处理和转换,使得数据近似满足正态分布。然后分别利用神经网络模型建立四个指标a、b、c、d和n的相关模型,分别记为模型:a-n、b-n、c-n、d-n,其中指标是自变量,案件数量是因变量。

在实验过程中发现,在建立模型之前,需要将指标数据和案件数量进行标准化,将数据按照比例缩放,使之落入一个特定的区间,以消除量纲和数量级差异对模型带来的不良影响。

(1.3)组合以上模型,用于案件趋势预测

将以上a-n、b-n、c-n、d-n四个模型合并成一个模型,合并的方法是加权求和,每个模型的权重为计算出之后归一化的结果。

上述公式中的:

wj表示加权求和的第j个模型对最终案件影响的权重(归一化之前);

lossj训练第j个模型所产生的损失;

ρj指标与案件数量的相关系数;

var(aj)模型预测历史案件的增幅的标准差。

(2)模型预测

以上得到的加权求和的预测模型可以用来预测未来一年或多年的案件趋势,同时相应指标的趋势外推模型也可以用来预测社会宏观经济指标未来一年或者多年的值。在很多情况下,决策人员可能比较关注指标趋势的变动对案件趋势变动的影响,即单个或者多个指标在未来不同的变化情况下,案件会作出怎样的变化。

因此模型预测分为两种情况:用户不修改未来一年的指标趋势外推模型的预测值、用户修改未来一年的指标趋势外推模型的预测值(包括修改一个指标预测值和修改多个指标预测值)。

值得注意的是,实际上,社会宏观经济指标的变化常用增减幅度来计算,而不是直接用变化的绝对值,比如人们熟知的国内gdp增速目前在7%左右。因此以下说的对指标的值的修改,实际上指的是对增减幅的修改。

(2.1)用户不修改未来一年的指标预测值的情况比较简单,直接使用上述指标对应的趋势外推模型预测各指标未来的趋势,然后使用指标未来的趋势和加权求和的联动神经网络模型的预测案件趋势即可。

(2.2)对于用户修改未来一年的单个指标预测值值,需要默认用户修改的值是“正确”的,因为比如gpd这种社会宏观经济指标每一年的变动范围大概是可以预见的,否则如果用户不加思考胡乱修改一个值,那么得到的最终结果也是不可靠的。考虑到很多社会经济指标之间是有相互关系的,这也可以从他们之间的相关系数可以观察到。因此用户修改了模型预测的某一个指标未来一年的预测值之后,其他的指标未来一年的预测值也需要相应地做出变化,把这种情况叫做“联动”。这种“联动”的变化关系,是与它们之间的相关系数有明显关系的。假定其他用户未修改的指标的未来的趋势变化随用户修改的指标的未来的趋势变化规律如下:

为了描述的方便,同样假设有a、b、c、d四个指标,模型预测未来一年它们的增幅分别为ga,gb,gc,gd,用户将指标a未来一年的增幅ga改为了ga1,且a与b、c、d的相关系数分别为ρab、ρac、ρad,则b、c、d未来一年相应的增幅变化率的计算方法如下:

e)指标a的增幅的变化率:

f)指标b未来一年相应的变化后的增幅应该为:

gb1=(1+ρab×r)×gb

g)指标c未来一年相应的变化后的增幅应该为:

gc1=(1+ρac×r)×gc

h)指标d未来一年相应的变化后的增幅应该为:

gd1=(1+ρad×r)×gd

(2.3)对于用户修改未来一年的多个指标的预测值,问题要复杂一些。因为用户同时修改的多个指标的变化幅度不会和它们的趋势外推模型预测的变化幅度一致,但此时还是依然认为用户修改的结果是正确的,只不过其他未修改的指标未来一年的变化情况只会受到和它们最相关的那个被修改的指标的影响,具体如下:

同样假设有a、b、c、d四个指标,模型预测起来一年它们的变化分别为ga,gb,gc,gd,用户将指标a未来一年的变化幅度ga改为了ga1,同时将指标b未来一年的变化幅度gb改为了gb1,且a与c、d的相关系数分别为ρac、ρad,b与c、d的相关系数分别为ρbc、ρbd,则c、d未来一年相应的变化幅度的计算方法如下:

d)指标a的增幅的变化率:

e)指标b的增幅的变化率:

f)指标c未来一年相应的变化幅度应该变为:

gc1=(1+max(ρac,ρbc)×r)×gc

其中r=ra,如果ρac≥ρbc;否则r=rb。

a)指标d未来一年相应的变化幅度应该变为:

gd1=(1+max(ρad,ρbd)×r)×gd

其中r=ra,如果ρad≥ρbd;否则r=rb。

在知道了a、b、c、d四个指标未来一年的变化后的增幅之后,也就可以算出a、b、c、d四个指标未来一年变化后的实际值,然后利用加权求和的神经网络模型计算出案件未来一年的变化后的实际值,即可得到用户修改指标值后未来一年案件的值。因此通过修改一个指标的变化,用户可以直观地看到案件相应的变化情况,即指标对案件的影响情况。

本发明利用社会宏观经济指标来预测案件趋势,给案件变动提供了可解释性因子;利用联动神经网络模型来建立多个社会宏观经济指标和案件数量之间的函数映射关系,可以定量描述社会宏观经济指标之间的相关关系;通过修改社会宏观经济指标未来的变动值,动态观察案件数量的变动情况。

与现有技术相比,本发明并不是利用案件数据本身来预测未来的趋势,而是将社会宏观经济指标作为自变量,案件数量作为因变量,将社会宏观经济指标对案件数量的影响进行量化,可以为案件数量的趋势变动提供可解释性,为当地决策人员提供决策辅助。本发明不是概述性地说明案件趋势预测的实现过程,而是考虑到一个地区的案发数量是受到众多社会宏观因素的影响,因此使用多个社会宏观经济指标作为自变量,建立联动的神经网络案件趋势预测模型,并提供了详细的步骤、公式和模型,不仅能够提高案件数量预测的准确率,也能够给案件变动原因作出合理的解释,还能够找到案件数量和社会宏观经济指标之间的定量关系,为当地的决策人员提高辅助决策参考。

以上所述的,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1