一种基于文本分类的政企服务派单方法及系统与流程

文档序号:29809072发布日期:2022-04-27 02:14阅读:116来源:国知局
一种基于文本分类的政企服务派单方法及系统与流程

1.本发明涉及文本分类技术领域,具体涉及一种基于文本分类的政企服务派单方法及系统。


背景技术:

2.为了更加高效地掌握企业的诉求,许多地方都建立了政企服务系统。通过政企服务系统,企业办事人员可以随时随地提交相关的业务咨询文本,政企服务系统操作人员将该业务咨询文本派送到对应的业务解答人员,然后业务解答人员在政企服务系统中直接回复企业办事人员,这样实现了“让数据多跑路,企业少跑腿”,从而节省了大量的时间和精力。
3.随着政企服务系统的不断发展壮大,政企服务系统中接收的业务咨询文本的数量日益增多。面对数量巨大的业务咨询文本,如何将大量的业务咨询文本派送到对应的业务解答人员是一项非常具有挑战性的技术难题。为此,研究人员提出了基于机器学习的方法对业务咨询文本进行分类,然后根据业务咨询文本的类别将其派送到负责该类别业务咨询的业务解答人员。然而,当前的政企服务系统对业务咨询文本进行分类时,存在业务咨询文本的分类精度不够的缺点,影响政企服务系统的派单效率。


技术实现要素:

4.本发明目的在于提供一种基于文本分类的政企服务派单方法及系统,以解决现有技术中所存在的一个或多个技术问题,至少提供一种有益的选择或创造条件。
5.为了实现上述目的,本发明提供以下技术方案:
6.一种基于文本分类的政企服务派单方法,所述方法包括以下步骤:
7.步骤s100、设置业务咨询文本的类别数量;
8.步骤s200、在政企服务系统中创建多个数据库表;其中,每个数据库表对应一个业务咨询文本的类别;
9.步骤s300、从政企服务系统中抽取出业务咨询文本数据集;
10.步骤s400、将业务咨询文本数据集划分为训练数据集和测试数据集;
11.步骤s500、确定业务咨询文本分类器;
12.步骤s600、利用改进的鲸鱼优化算法优化设计业务咨询文本分类器,得到优选的业务咨询文本分类器;
13.步骤s700、获取用户输入的业务咨询文本;
14.步骤s800、利用优选的业务咨询文本分类器对用户输入的业务咨询文本进行分类,得到用户输入的业务咨询文本对应的类别,将用户输入的业务咨询文本写入到该类别对应的数据库表中,以实现业务咨询的派单。
15.进一步,所述步骤s600包括以下步骤:
16.步骤s601,设置种群大小wsize,最大搜索代数mwt;
17.步骤s602,确定业务咨询文本分类器的优化设计训练参数;
18.步骤s603,确定业务咨询文本分类器的优化设计训练参数的数量epn;
19.步骤s604,设置当前搜索代数t=0;
20.步骤s605,随机产生wsize个个体组成种群,其中每个体都存储了业务咨询文本分类器的epn个优化设计训练参数;
21.步骤s606,计算种群中每个个体的适应值;
22.步骤s607,找出种群中适应值最小的个体记为最优个体minwp;
23.步骤s608,在[0,1]区间内生成一个随机实数kpr;
[0024]
步骤s609,如果kpr小于0.5,则转到步骤s616,否则转到步骤s610;
[0025]
步骤s610,根据公式(1)计算优秀个体的数量wen:
[0026][0027]
步骤s611,如果wen小于2,则设置wen=2,否则保持wen的值不变;
[0028]
步骤s612,从种群中选择出适应值最小的wen个个体,然后计算出所选择的wen个个体的平均值wemean;
[0029]
步骤s613,根据公式(2)计算反向学习值ov:
[0030]
ov=(wlb+wub)
×
wf1-wemean
ꢀꢀ
(2);
[0031]
其中,wf1是[0,1]区间内的随机实数;wlb表示当前种群的搜索下界;wub表示当前种群的搜索上界;
[0032]
步骤s614,根据公式(3)执行反向螺旋捕猎算子:
[0033][0034]
其中,个体下标ni=1,2,...,wsize;wx
ni
表示种群中的第ni个个体;tv表示螺旋搜索值;wv
ni
表示个体wx
ni
的子个体;wf2是[0,1]区间内的随机实数;wk为[-1,1]区间内的随机实数;π为圆周率;exp表示以自然常数e为底的指数函数;cos表示余弦函数;
[0035]
步骤s615,转到步骤s621;
[0036]
步骤s616,根据公式(4)计算步长因子ws:
[0037][0038]
其中,wf3是[0,1]区间内的随机实数,wd为收敛因子;
[0039]
步骤s617,如果ws的绝对值小于1,则转到步骤s618,否则转到步骤s620;
[0040]
步骤s618,根据公式(5)执行反向包围捕猎算子:
[0041][0042]
其中,wf4是[0,1]区间内的随机实数;wf5是[0,1]区间内的随机实数;bv表示包围搜索值;
[0043]
步骤s619,转到步骤s621;
[0044]
步骤s620,根据公式(6)执行随机搜寻算子:
[0045]
wv
ni
=wx
ruk-ws
×
|2
×
wf1
×
wx
ni-wx
ruk
|
ꢀꢀ
(6);
[0046]
其中,wx
ruk
表示种群中随机选择出来的个体;
[0047]
步骤s621,计算子个体wv
ni
的适应值;
[0048]
步骤s622,如果子个体wv
ni
的适应值小于个体wx
ni
的适应值,则在种群中利用子个体wv
ni
替换个体wx
ni
,否则保持个体wx
ni
不变;
[0049]
步骤s623,找出种群中适应值最小的个体记为最优个体minwp;
[0050]
步骤s624,设置当前搜索代数t=t+1;
[0051]
步骤s625,如果当前搜索代数t小于最大搜索代数mwt,则转到步骤s608,否则转到步骤s626;
[0052]
步骤s626,从最优个体minwp中提取出业务咨询文本分类器的epn个优化设计训练参数,利用得到的epn个优化设计训练参数在训练数据集上训练出业务咨询文本分类器,即得到优选的业务咨询文本分类器。
[0053]
一种计算机可读存储介质,所述计算机可读存储介质上存储有基于文本分类的政企服务派单程序,所述基于文本分类的政企服务派单程序被处理器执行时实现如上述任意一项所述的基于文本分类的政企服务派单方法的步骤。
[0054]
一种基于文本分类的政企服务派单系统,所述系统包括:
[0055]
至少一个处理器;
[0056]
至少一个存储器,用于存储至少一个程序;
[0057]
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现上述任一项所述的基于文本分类的政企服务派单方法。
[0058]
本发明的有益效果是:本发明公开一种基于文本分类的政企服务派单方法及系统,本发明应用改进的鲸鱼优化算法来优化设计业务咨询文本分类器,利用优选得到的业务咨询文本分类器对用户输入的业务咨询文本进行分类,然后根据分类结果将用户输入的业务咨询文本写入到对应的数据库表,从而实现业务咨询的派单。本发明应用改进的鲸鱼优化算法提升了业务咨询文本的分类精度,能够提高政企服务系统的派单效率。
附图说明
[0059]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0060]
图1是本发明实施例中基于文本分类的政企服务派单方法的流程示意图。
具体实施方式
[0061]
以下将结合实施例和附图对本技术的构思、具体结构及产生的技术效果进行清楚、完整的描述,以充分地理解本技术的目的、方案和效果。需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。
[0062]
参考图1,如图1所示为本技术实施例提供的一种基于文本分类的政企服务派单方法,所述方法包括以下步骤:
[0063]
步骤s100、设置业务咨询文本的类别数量;
[0064]
在一实施例中,将业务咨询文本的类别数量记为mg,所述业务咨询文本的类别数量设置为mg=8;
[0065]
步骤s200、在政企服务系统中创建多个数据库表;其中,每个数据库表对应一个业务咨询文本的类别;
[0066]
可以理解,数据库表的数量也为mg;
[0067]
步骤s300、从政企服务系统中抽取出业务咨询文本数据集;
[0068]
步骤s400、将业务咨询文本数据集划分为训练数据集和测试数据集;
[0069]
步骤s500、确定业务咨询文本分类器;
[0070]
在一实施例中,所述业务咨询文本分类器为基于xgboost的文本分类器;
[0071]
步骤s600、利用改进的鲸鱼优化算法优化设计业务咨询文本分类器,得到优选的业务咨询文本分类器;将优选的业务咨询文本分类器记为tcm;
[0072]
步骤s700、获取用户输入的业务咨询文本;
[0073]
步骤s800、利用优选的业务咨询文本分类器对用户输入的业务咨询文本进行分类,得到用户输入的业务咨询文本对应的类别,将用户输入的业务咨询文本写入到该类别对应的数据库表中,以实现业务咨询的派单。
[0074]
作为上述实施例的改进,步骤s600中,所述利用改进的鲸鱼优化算法优化设计业务咨询文本分类器,包括以下步骤:
[0075]
步骤s601,设置种群大小wsize,最大搜索代数mwt;
[0076]
在一实施例中,设置种群大小wsize=30,最大搜索代数mwt=200;
[0077]
步骤s602,确定业务咨询文本分类器的优化设计训练参数;
[0078]
步骤s603,确定业务咨询文本分类器的优化设计训练参数的数量epn;
[0079]
在一实施例中,设置epn=3;
[0080]
步骤s604,设置当前搜索代数t=0;
[0081]
步骤s605,随机产生wsize个个体组成种群,其中每个体都存储了业务咨询文本分类器的epn个优化设计训练参数;
[0082]
步骤s606,计算种群中每个个体的适应值;
[0083]
在一实施例中,所述计算种群中每个个体的适应值的方法为:对于种群中的第ni个个体wx
ni
,首先从个体wx
ni
中提取出xgboost的学习率,决策树的最大深度和决策树的数量,然后利用得到的xgboost的学习率,决策树的最大深度和决策树的数量在训练数据集上训练出基于xgboost的业务咨询文本分类器wtm
ni
,计算业务咨询文本分类器wtm
ni
在测试测试数据集上的分类错误率werr,将个体wx
ni
的适应值设置为werr,其中个体下标ni=1,2,...,wsize;从而得到种群中每个个体的适应值。
[0084]
步骤s607,找出种群中适应值最小的个体记为最优个体minwp;
[0085]
步骤s608,在[0,1]区间内生成一个随机实数kpr;
[0086]
步骤s609,如果kpr小于0.5,则转到步骤s616,否则转到步骤s610;
[0087]
步骤s610,根据公式(1)计算优秀个体的数量wen:
[0088]
[0089]
步骤s611,如果wen小于2,则设置wen=2,否则保持wen的值不变;
[0090]
步骤s612,从种群中选择出适应值最小的wen个个体,然后计算出所选择的wen个个体的平均值wemean;
[0091]
步骤s613,根据公式(2)计算反向学习值ov:
[0092]
ov=(wlb+wub)
×
wf1-wemean
ꢀꢀ
(2);
[0093]
其中,wf1是[0,1]区间内的随机实数;wlb表示当前种群的搜索下界;wub表示当前种群的搜索上界;
[0094]
步骤s614,根据公式(3)执行反向螺旋捕猎算子:
[0095][0096]
其中,个体下标ni=1,2,...,wsize;wx
ni
表示种群中的第ni个个体;tv表示螺旋搜索值;wv
ni
表示个体wx
ni
的子个体;wf2是[0,1]区间内的随机实数;wk为[-1,1]区间内的随机实数;π为圆周率;exp表示以自然常数e为底的指数函数;cos表示余弦函数;
[0097]
步骤s615,转到步骤s621;
[0098]
步骤s616,根据公式(4)计算步长因子ws:
[0099][0100]
其中,wf3是[0,1]区间内的随机实数,wd为收敛因子;
[0101]
步骤s617,如果ws的绝对值小于1,则转到步骤s618,否则转到步骤s620;
[0102]
步骤s618,根据公式(5)执行反向包围捕猎算子:
[0103][0104]
其中,wf4是[0,1]区间内的随机实数;wf5是[0,1]区间内的随机实数;bv表示包围搜索值;
[0105]
步骤s619,转到步骤s621;
[0106]
步骤s620,根据公式(6)执行随机搜寻算子:
[0107]
wv
ni
=wx
ruk-ws
×
|2
×
wf1
×
wx
ni-wx
ruk
|
ꢀꢀ
(6);
[0108]
其中,wx
ruk
表示种群中随机选择出来的个体;
[0109]
步骤s621,计算子个体wv
ni
的适应值;
[0110]
步骤s622,如果子个体wv
ni
的适应值小于个体wx
ni
的适应值,则在种群中利用子个体wv
ni
替换个体wx
ni
,否则保持个体wx
ni
不变;
[0111]
步骤s623,找出种群中适应值最小的个体记为最优个体minwp;
[0112]
步骤s624,设置当前搜索代数t=t+1;
[0113]
步骤s625,如果当前搜索代数t小于最大搜索代数mwt,则转到步骤s68,否则转到步骤s626;
[0114]
步骤s626,从最优个体minwp中提取出业务咨询文本分类器的epn个优化设计训练参数,利用得到的epn个优化设计训练参数在训练数据集上训练出业务咨询文本分类器,即得到优选的业务咨询文本分类器。
[0115]
现有技术中,xgboost是一种很有潜力的文本分类方法。然而,当将xgboost应用到政企服务系统中对业务咨询文本进行分类时,xgboost的参数设置会在很大程度上影响业务咨询文本的分类精度,容易出现文本分类精度不够的缺点。影响政企服务系统的派单效率。本发明以基于xgboost的文本分类器为例,提供了一种应用改进的鲸鱼优化算法来优化设计业务咨询文本分类器的具体实施例,能够提升业务咨询文本的分类精度,从而提高政企服务系统的派单效率。
[0116]
与图1的方法相对应,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有基于文本分类的政企服务派单程序,所述基于文本分类的政企服务派单程序被处理器执行时实现如上述任意一实施例所述的基于文本分类的政企服务派单方法的步骤。
[0117]
与图1的方法相对应,本发明实施例还提供一种基于文本分类的政企服务派单系统,所述系统包括:
[0118]
至少一个处理器;
[0119]
至少一个存储器,用于存储至少一个程序;
[0120]
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现上述任一实施例所述的基于文本分类的政企服务派单方法。
[0121]
上述方法实施例中的内容均适用于本系统实施例中,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
[0122]
所述处理器可以是中央处理单元(central-processing-unit,cpu),还可以是其他通用处理器、数字信号处理器(digital-signal-processor,dsp)、专用集成电路(application-specific-integrated-circuit,asic)、现场可编程门阵列(field-programmable-gate-array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述基于文本分类的政企服务派单系统的控制中心,利用各种接口和线路连接整个基于文本分类的政企服务派单系统可运行装置的各个部分。
[0123]
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述基于文本分类的政企服务派单系统的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smart-media-card,smc),安全数字(secure-digital,sd)卡,闪存卡(flash-card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
[0124]
尽管本技术的描述已经相当详尽且特别对几个所述实施例进行了描述,但其并非旨在局限于任何这些细节或实施例或任何特殊实施例,而是应当将其视作是通过参考所附权利要求,考虑到现有技术为这些权利要求提供广义的可能性解释,从而有效地涵盖本技术的预定范围。此外,上文以发明人可预见的实施例对本技术进行描述,其目的是为了提供
有用的描述,而那些目前尚未预见的对本技术的非实质性改动仍可代表本技术的等效改动。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1