一种基于改进KNN的检察官个性化推荐方法

文档序号:26050821发布日期:2021-07-27 15:25阅读:73来源:国知局
一种基于改进KNN的检察官个性化推荐方法
本发明涉及个性化推荐
技术领域
,尤其涉及一种基于改进knn的检察官个性化推荐方法。
背景技术
:knn(k最近邻)算法是数据挖掘中的常见分类算法之一,即通过计算目标点与邻近节点的欧式距离,从中选出k个最邻近的节点来表示目标点。在检察院办案流程中,案件分配问题直接关系到案件的办理效率、检察官的办案积极性和激励制度的完善。司法改革以来,很多学者都对如何实现案件与检察官最优匹配这一问题进行过研究,但是目前的研究仅仅出于定性分析阶段,除了列举智能分案需要完成哪些具体目标之外,并没有具体给出影响智能分案结果的因素有哪些。因为不同案件由于案件类型存在较大差异,所以其所适合办理的检察官也会有所不同。通过对案件工作量和检察官办理案件的能力的分析,对不同类型的案件进行分配,并结合检察官的当前负荷,能有效得实现案件与检察官的最优匹配。技术实现要素:为解决上述技术问题,本发明提出一种基于改进knn的检察官个性化推荐方法,通过对待推荐检察官列表进行检察官期望工作量分析,检察官当前办理案件的期望工作量预测,进行个性化检察官推荐,实现新到案件的分配。一种基于改进knn的检察官个性化推荐方法,包括以下步骤:步骤1:对检察院办案数据进行预处理,提取所有检察官数据得到检察官列表,获得其中每个检察官的办理历史案件集合以及检察官当前办理案件集合;步骤2:根据每个检察官历史办理的案件,计算检察官承办每个案件的期望工作量;然后对案件按照案件类型进行划分,根据案件期望工作量,计算检察官办理每类案件的期望工作量;所述案件期望工作量ts,如下式所示:其中dts表示案件s的办案时长,πc表示第c次迭代的权重,ρ表示固定时间区间内案件总数;计算每类案件的平均期望工作量ds,如下式所示:其中s表示每类案件的总数;得到检察官办理每类案件的平均期望工作量f,如下式所示:其中q表示检察官办理每类案件的案件总数。步骤3:根据检察官当前办理的案件,使用回归决策树模型预测检察官当前办理的每个案件的期望工作量,并基于检察官办理的历史案件的期望工作量计算检察官的当前工作负荷,具体包括以下步骤:步骤3.1:在训练数据集所在的输入空间中,递归地将每个区域划分为两个子区域并决定每个子区域上的输出值,构建二叉决策树:步骤3.2:整合数据集,将案件期望工作量,每类案件的平均期望工作量,检察官办理每类案件的平均期望工作量与历史案件集合进行整合,生成数据集d;步骤3.3:建立回归预测树模型,其中输入为包含案件期望工作量的数据集d,输出为检察官当前工作负荷fs(x);步骤3.4:选择数据集d最优切分变量j与切分点s,对下式进行求解,遍历变量j,对切分变量j扫描切分点s,选择使上式达到最小值的对(j,s);其中参数c1,c2表示叶子节点的样本值,r1和r2两个区域代表的是二叉树所划分的两个区域,即样本集合,xi表示数据集d中的案件数据,yi表示数据集d中每个案件的期望工作量;所述二叉树以变量j的特征值s作为逻辑判断条件;步骤3.5:用步骤3.4得到的对(j,s)划分数据集d区域并决定相应的输出值,如下式所示:其中nm表示两个区域的样本数,表示参数c1,c2的最佳估值,x表示案件数据集合。其中,r1(j,s)={x|x(j)≤s},r2(j,s)={x|x(j)>s}其中x(j)表示切分变量j下的案件数据集合;步骤3.6:继续对两个r1,r2子区域执行步骤3.4、步骤3.5,直至满足固定迭代次数停止;步骤3.7:将输入数据集d划分为m个区域r1,r2,...,rm生成回归决策树:其中i为指示函数,步骤3.8:根据回归决策树预测当前检察官办理案的期望工作量,并计算检察官当前工作负荷fs(x):其中n表示当前检察官在办案件总数,f(xi)表示案件i的期望工作量;步骤4:根据检察官历史案件的期望工作量和检察官的当前工作负荷,利用改进的knn算法进行检察官的个性化推荐,获取最适合办理新到案件的检察官;所述检察官个性化推荐是要从待推荐检察官集合中选择与新到案件最匹配的检察官,测试数据集中每个案件都分配个最优检察官;步骤4.1:使用回归预测树模型预测新到案件的期望工作量为wnew,计算新到案件与该类案件的平均期望工作量navg的偏差δwnew;δwnew=wnew-navg步骤4.2:根据待推荐检察官集合中k个检察官,结合新到案件的移送案由,计算检察官办理该类案件的期望工作量mnow与该类型案件的平均工作量navg的标准偏差δmnow,偏差越大,反应该检察官办理该类型案件能力越强。δmnow=navg-mnow步骤4.3:依据最近邻算法(knn),找出δwnew最邻近的δmnow,并结合检察官的当前负荷fs(x),推荐最优的检察官;其中fs(x)avg表示该k个待推荐检察官的平均工作负荷,fs(x)max表示该k个待推荐检察官的最大工作负荷,fs(x)min表示待推荐检察官的最小工作负荷。本发明所产生的有益效果在于:本技术方案提供了一种基于改进knn的检察官个性化推荐方法,可以根据案件的复杂程度和检察官的当前负荷,实现检察官实时个性化的推荐,提高案件的分配合理性,提高案件办理效率。附图说明图1是本发明实施例的个性化推荐方法流程图;图2是本发明实施例的检察官期望工作量计算方法流程图;图3是本发明实施例的检察官办理每类案件的数量以及期望工作量示意图;其中,图(a)-检察官办理每类案件的数量示意图,图(b)-检察官办理每类案件的期望工作量示意图。具体实施方式下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。一种基于改进knn的检察官个性化推荐方法,如图1所示,包括以下步骤:步骤1:对检察院办案数据进行预处理,提取所有检察官数据得到检察官列表,获得其中每个检察官的办理历史案件集合以及检察官当前办理案件集合;本实施例中通过检察院提供的api数据接口,定时获取数据并保存在历史案件数据库。采集的办案数据包括:案件基本信息表、人员编码表、案件类别编码表、部门业务分配表、人员角色分配表、业务编码表、单位编码表、卷宗基本信息表、卷宗目录表、涉案财物信息表、涉案财物鉴定信息表、受理日志表、送案日志表、送案嫌疑人记录表。步骤2:根据每个检察官历史办理的案件,计算检察官承办每个案件的期望工作量;然后对案件按照案件类型进行划分,根据案件期望工作量,计算检察官办理每类案件的期望工作量,如图2所示;所述期望工作量的计算采用em迭代平均计算的方法,然后根据历史案件的办理天数,结合每个检察官历史办理案件集合和当前办理案件集合,采用em迭代平均计算的方法计算历史案件的期望工作量,并根据案件类型对案件进行划分,计算每类案件的平均期望工作量,以及检察官办理每类案件的平均期望工作量,如图3所示。所述案件期望工作量ts,如下式所示:其中dts表示案件s的办案时长,πc表示第c次迭代的权重,ρ表示固定时间区间内案件总数;计算每类案件的平均期望工作量ds,如下式所示:其中s表示每类案件的总数;得到检察官办理每类案件的平均期望工作量f,如下式所示:其中q表示检察官办理每类案件的案件总数。步骤3:根据检察官当前办理的案件,使用回归决策树模型预测检察官当前办理的每个案件的期望工作量,并基于检察官办理的历史案件的期望工作量计算检察官的当前工作负荷,具体包括以下步骤:步骤3.1:在训练数据集所在的输入空间中,递归地将每个区域划分为两个子区域并决定每个子区域上的输出值,构建二叉决策树:步骤3.2:整合数据集,将案件期望工作量,每类案件的平均期望工作量,检察官办理每类案件的平均期望工作量与历史案件集合进行整合,生成数据集d;步骤3.3:建立回归预测树模型,其中输入为包含案件期望工作量的数据集d,输出为检察官当前工作负荷fs(x);步骤3.4:选择数据集d最优切分变量j与切分点s,对下式进行求解,遍历变量j,对切分变量j扫描切分点s,选择使上式达到最小值的对(j,s);其中参数c1,c2表示叶子节点的样本值,r1和r2两个区域代表的是二叉树所划分的两个区域,即样本集合,xi表示数据集d中的案件数据,yi表示数据集d中每个案件的期望工作量;所述二叉树以变量j的特征值s作为逻辑判断条件;步骤3.5:用步骤3.4得到的对(j,s)划分数据集d区域并决定相应的输出值,如下式所示:其中nm表示两个区域的样本数,表示参数c1,c2的最佳估值,x表示案件数据集合。其中,r1(j,s)={x|x(j)≤s},r2(j,s)={x|x(j)>s}其中x(j)表示切分变量j下的案件数据集合;步骤3.6:继续对两个r1,r2子区域执行步骤3.4、步骤3.5,直至满足固定迭代次数停止;步骤3.7:将输入数据集d划分为m个区域r1,r2,...,rm生成回归决策树:其中i为指示函数,步骤3.8:根据回归决策树预测当前检察官办理案的期望工作量,并计算检察官当前工作负荷fs(x):其中n表示当前检察官在办案件总数,f(xi)表示案件i的期望工作量;步骤4:根据检察官历史案件的期望工作量和检察官的当前工作负荷,利用改进的knn算法进行检察官的个性化推荐,获取最适合办理新到案件的检察官;所述检察官个性化推荐是要从待推荐检察官集合中选择与新到案件最匹配的检察官,测试数据集中每个案件都分配个最优检察官。为了避免案件频繁分到某几位检察官和案件的积压,步骤4.1:使用回归预测树模型预测新到案件的期望工作量为wnew,计算新到案件与该类案件的平均期望工作量navg的偏差δwnew;偏差越大,反映新到案件越复杂。δwnew=wnew-navg步骤4.2:根据待推荐检察官集合中k个检察官,结合新到案件的移送案由,计算检察官办理该类案件的期望工作量mnow与该类型案件的平均工作量navg的标准偏差δmnow,偏差越大,反应该检察官办理该类型案件能力越强。δmnow=navg-mnow步骤4.3:依据最近邻算法(knn),找出δwnew最邻近的δmnow,并结合检察官的当前负荷fs(x),推荐最优的检察官;其中fs(x)avg表示该k个待推荐检察官的平均工作负荷,fs(x)max表示该k个待推荐检察官的最大工作负荷,fs(x)min表示待推荐检察官的最小工作负荷。本实施例中提出的检察官个性化推荐方法对通过某地级检察院,以及下属的2个区检察院的总共1364条案件数据进行测试,计算检察官个性化推荐准确率,测试结果如下:表1.检察官个性化推荐列表检察院检察官个数案件类型总数分配准确个数案件总数分案准确率**市检察院275626530588.2%**市**区检察院155051858890.1%**市**区检察院184641447189.3%最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1