工单处理方法、装置及系统与流程

文档序号:17927135发布日期:2019-06-15 00:29阅读:373来源:国知局
本申请涉及计算机领域,尤其涉及一种工单处理方法、装置及系统。
背景技术
::在运营商处理客户保障、客户投诉或者进行设备维护时通常需要利用对应的工单系统进行逐级流转,各个岗位的人员完成对应的工作,从而完成对应的工作处理。现有的工单处理方法中,依靠工单处理平台可以完成工单的自动流转审批和存档。但是在最主要的问题分析和处理环节还依靠人工完成。人工对问题进行分析和处理很大程度上依赖处理人员的工作经验。处理效率较低且容易出错。尤其是处理人员没有相关处理经验时,将对工单的处理效率和正确率造成极大影响。技术实现要素:本申请实施例提供一种工单处理方法和装置,能够自动对工单进行问题分析确定工单处理方案,大大提高了工单处理效率和正确率。为达到上述目的,本申请采用如下技术方案:第一方面,本申请提供了一种工单处理系统,该系统包括:第一数据库,所述第一数据库用于存储多个历史工单及各个所述历史工单对应的处理方案;模型训练模块,用于根据至少一个所述历史工单进行工单分类模型训练生成工单分类模型;工单推荐模块,用于根据所述工单分类模型确定待处理工单的工单类型;所述工单推荐模块,还用于根据所述待处理工单的工单类型对所述待处理工单进行相似工单匹配,确定匹配度最高的第一工单;所述工单推荐模块,还用于将所述第一工单的处理方案确定为所述待处理工单的处理方案。第二方面,本申请提供了一种工单处理方法,该方法包括:获取第一数据库中的至少一个历史工单;对至少一个所述历史工单中的关键字进行模型训练生成工单分类模型;根据所述工单分类模型对待处理工单进行分类,确定所述待处理工单的类型;从与所述待处理工单类型相同的历史工单中匹配与所述待处理工单相似度最高的第一历史工单,并将所述第一历史工单的处理方案确定为所述待处理工单的处理方案。第三方面,本申请提供了一种工单处理装置,该装置包括:获取模块,用于获取第一数据库中的至少一个历史工单;处理模块,用于对至少一个所述历史工单中的关键字进行模型训练生成工单分类模型;所述处理模块,还用于根据所述工单分类模型对待处理工单进行分类,确定所述待处理工单的类型;所述处理模块,还用于从与所述待处理工单类型相同的历史工单中匹配与所述待处理工单相似度最高的第一历史工单,并将所述第一历史工单的处理方案确定为所述待处理工单的处理方案。第四方面,本申请提供了一种工单处理装置,该装置包括:处理器和存储器;其中,存储器用于存储一个或多个程序,该一个或多个程序包括计算机执行指令,当该工单处理装置运行时,处理器执行该存储器存储的该计算机执行指令,以使该工单处理装置执行上述第一方面及其任意一种实现方式所述的工单处理方法。第五方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得所述计算机执行上述第一方面及其任意一种实现方式所述的工单处理方法。第六方面,本申请提供了一种包含指令的计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行上述第一方面及其任意一种实现方式所述工单处理方法。本申请实施例提供的工单处理方法、装置及系统,通过获取第一数据库中的至少一个历史工单。对至少一个所述历史工单中的关键字进行模型训练生成工单分类模型。根据所述工单分类模型对待处理工单进行分类,确定所述待处理工单的类型。从与所述待处理工单类型相同的历史工单中匹配与所述待处理工单相似度最高的第一历史工单,并将所述第一历史工单的处理方案确定为所述待处理工单的处理方案。因此本申请提供的工单处理方法、装置及系统,能够自动根据待处理工单的类型和关键字特征推荐最相似的历史工单,并确定该历史工单对应的解决方案。大大提高了工单处理的效率和正确率。附图说明图1为本申请实施例提供的一种工单处理系统的系统架构图;图2为本申请实施例提供的一种工单处理方法的流程图;图3为本申请实施例提供的一种工单处理装置的结构示意图;图4为本申请实施例提供的另一种工单处理装置的结构示意图。具体实施方式下面将结合附图对本申请提供的工单处理方法、装置及系统进行详细的描述。本申请的说明书以及附图中的术语“第一”和“第二”等是用于区别不同的对象,而不是用于描述对象的特定顺序。此外,本申请的描述中所提到的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括其他没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。需要说明的是,本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其他实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。在本申请的描述中,除非另有说明,“多个”的含义是指两个或两个以上。以下,对本申请涉及的技术进行解释,以方便读者理解:逆文件频率(inversedocumentfrequency,idf)指数:idf指数是某一个文件中的词语在其他文件中出现的频率指数。一个文件中的词语在其他文件中出现的次数越少,该词语越能表示该文件与其他文件的类别区分。idf指数是一个词语普遍重要性的度量。词语的idf指数可以由总文件数目除以包含该词语的文件数目,再将得到的商取以10为底的对数得到。词频-逆文件频率(termfrequencyinversedocumentfrequency,tf-idf)指数:tf-idf指数用来表示一个词语对一个文件集或者语料库中的一份文件的重要程度。它是一种在idf指数的基础上增加词语在文件中出现的频率来进一步描述一个词语的重要程度。该词语对文件的重要性随着它在该文件中出现的次数成正比增加,随着它在语料库中其他文件出现的次数成反比下降。也就是说如果一个词语在该文件中出现的频率越高,且在其他文件中出现的频率越低,就表示该词语对该文件越重要。词向量:词向量用于机器学习的数据输入层,在本申请中,使用word2vec词向量转化工具将文本词汇转化为对应的向量。在自然语言处理中,最细粒度到词,对于机器学习,数学模型只接受数值输入,而自然语言中词语是高度抽象的,是符号形式的,因此需要构建f(x)->y的映射,将词用唯一的数值向量表示。其中构建f(x)->y映射的过程叫做词嵌入模型训练,f映射关系即为训练后的嵌入模型,模型中存储的每个词所对应的唯一权重向量,即为词向量。词嵌入模型训练有多种算法模型,较为主流的算法是skip-gram和cbow,使用word2vec可以很好的支持这两种算法模型,在指定向量位数n后,在word2vec初始化时直接为每个词随机生成一个n维的向量,并且把这个n维向量作为模型参数进行训练,并得到效果不错的词向量嵌入模型。虽然该模型中包含了词的词性以及词与词的各种关联特征,但是对于机器学习而言,词向量嵌入模型的映射关系特征表示效果并不是关键,而是真正关心的产物只是模型训练完后模型中存储的词权重向量,即词向量。神经网络模型:神经网络模型是由大量处理单元互相连联组成的信息处理系统,通过模拟人类大脑神经网络处理和记忆信息的方式进行信息处理。神经网络模型由大量计算节点(激励函数或输出函数)组成,每两个节点之间的连接代表一个对于通过该连接的信号的加权值。在神经网络模型中,输入数据之后,神经网络模型根据自身的学习训练对输入数据选择对应的运算节点进行运算,输出运算结果。同时,神经网络在数据运算过程中还可以不断学习进化,根据工作人员等对运算结果的反馈不断优化自身的运算过程,神经网络模型运算训练次数越多,得到的结果反馈越多,计算的结果越准确。在本申请中,神经网络模型中输入待处理工单关键字的词向量,输出代表该待处理工单的类型的词向量。根据输出结果是否符合要求对神经网络模型不断进行调参优化,当输出的结果符合预期值时,可以认为神经网络模型建立完成,在后续的神经网络模型的工作运算过程中,神经网络模型还可以根据工作人员对结果的反馈继续进行优化。局部敏感哈希算法:局部敏感哈希是近似最近邻搜索算法中的一种,在高维数据空间中表现优异。自然语言数据具有很高的维度,怎样快速地从高维数据集中找到一个或多个最相似数据是一个难点。通过一个哈希函数(hashfunction)将数据映射到一个哈希表(hashtable),通过哈希表的索引,来使搜索时间从线性搜索的o(n)降到o(1),从而达到快速索引的目的。局部敏感哈希算法基于一个假设,如果两个文本在原有的数据空间是相似的,那么分别经过哈希函数转换以后的它们也具有很高的相似度;相反,如果它们本身是不相似的,那么经过转换后它们应仍不具有相似性。因而使用局部敏感哈希算法对高维词向量进行计算,得到一个这样的哈希函数,该函数可以用用来从海量的数据中挖掘出相似的数据。稠密矢量聚类索引:稠密矢量聚类索引是局部敏感哈希算法的一种实现,但是在对原始算法的实现中加入了很多改进,采用分块压缩等方法来加速查找,比如分块方法,在对特征空间被切分为ncells个块,数据被划分到这些块中,归属关系存储在ncells个节点的倒排列表中,搜索时,检索离目标距离最近的nprobe个块,根据倒排列表检索nprobe个块中的所有数据;索引就绪后,可以设置多组测试数据来调整检索方法,进一步优化精确度和搜索时间,最终得到索引。本申请实施例提供的工单处理方法可以应用于工单处理系统中。如图1所示,该工单处理系统100包括:第一数据库101、模型训练模块102、工单推荐模块103。其中,所述第一数据库101用于存储多个历史工单及各个所述历史工单对应的处理方案;该历史工单中包含所有类型的工单,并提供了各个工单的解决方案。该第一数据库101用于为模型训练模块中的工单分类模型训练提供训练材料(即第一数据库中存储的历史工单)。在第一数据库101中存储的历史工单均预先经行过分类打标,确定各个历史工单的详细分类。所述模型训练模块102用于对历史工单进行训练生成工单训练模型。上述训练生成工单训练模型的过程具体为:模型训练模块102获取第一数据库中的历史工单,采用idf算法获取所有历史工单的关键字,生成idf文本语料库。设置业务词汇表和停用词字典,为业务词汇表和停用词字典中的词设置不同权重,例如将业务词汇中的词(如停机、抵消、抵扣以及故障等)设置较高权重,提高该关键字对工单的重要程度。为停用词字典中的词(如用户、网络、的等常用的无效高频词汇)设置较低权重,降低其在文件关键字中的重要程度。采用if-idf算法根据上述设置的权重从idf文本语料库中进一步抽取关键字,以使抽取的关键字更加准确,更加符合工单业务的实际场景。将上述采用if-idf算法抽取的关键字转换为词向量,并根据工单中的词汇关系对词向量进行线性组合生成工单向量指纹库(不同打标类型的历史工单生成不同的向量指纹库)。根据上述打标的历史工单详细分类对工单向量指纹库中的向量进行分类打标。将打标后的向量输入预先搭建的神经网络分类模型中进行分类模型训练,并根据训练结果不断对神经网络分类模型参数进行优化,以使得神经网络分类模型输出的结果(工单分类结果)高于预期的准确度,将此时训练得到的神经网络分类模型作为工单分类模型,供模型训练模块103使用。所述工单推荐模块103用于加载上述工单分类模型并获取待处理工单,采用idf算法,if-idf算法对待处理工单进行关键字提取。对提取的关键字做向量转换生成词向量,将待处理工单的词向量输入上述工单分类模型中,获取工单分类模型的输出结果。根据输出结果确定待处理工单的工单类型。根据确定的工单类型确定其对应的工单向量指纹库。确定工单向量指纹库之后,采用局部敏感哈希算法建立稠密矢量聚类索引,在工单向量指纹库中查找与待处理工单相似度最高的历史工单。将该相似度最高的历史工单与工单处理方案作为待处理工单的处理方案。可选的,该工单处理系统中还包括爬虫模块104和第二数据库105。其中,第二数据库105,用于存储所述工单分类模型。爬虫模块104用于从所述第一数据库中获取至少一个所述历史工单,并将至少一个所述历史工单发送至所述模型训练模块102中。还用于将所述待处理工单发送至所述工单推荐模块103,以及将所述第二数据库中的所述工单分类模型发送至所述工单推荐模块103。本申请实施例还提供了一种操作界面,工单处理人员可以根据操作界面对上述工单处理系统进行操作(例如,选取待处理工单,将推荐完成的待处理工单导入第一数据库作为历史工单等操作)。该操作界面还可以显示上述工单推荐模块推荐的相似度最高的历史工单和工单处理方案。本申请实施例提供了一种工单处理方法。应用于如图1所示的工单处理系统中。所述方法可以由该工单处理系统执行。如图2所示,所述方法包括s201-s204。s201、获取第一数据库中的至少一个所述历史工单。具体为,爬虫模块从第一数据库中获取部分或全部历史工单(为使工单分类模型分类准确,参与模型训练的历史工单数量越多越好。该历史工单可能为数万份或者数十万份)。将获取到的历史工单全部发送至模型训练模块中。s202、对至少一个所述历史工单中的关键字进行模型训练生成工单分类模型。具体为,对所述历史工单中的词语进行频率统计和逆向文件频率计算确定所述历史工单的关键字。对所述历史工单的关键字进行向量转换,生成历史工单的关键字向量集合。对所述关键字向量集合进行神经网络模型训练,生成所述工单分类模型。该步骤可以由上述工单处理系统的模型训练模块执行。将该步骤具体可以分为:第一步分词和第二步模型训练。第一步分词,先对历史工单数据进行分词,具体为:采用idf算法获取所有历史工单的关键字,生成idf文本语料库。设置业务词汇表和停用词字典,为业务词汇表和停用词字典中的词设置不同权重,例如将业务词汇中的词(如停机、抵消、抵扣或者故障等)设置较高权重。为停用词字典中的词(如用户、网络或的等常用的无效高频词汇)设置较低权重,降低其在文件关键字中的影响。采用if-idf算法根据上述设置的权重从idf文本语料库中进一步抽取关键字,以使抽取的关键字更加准确,更加符合工单业务的实际场景。第二步模型训练,对分词后的关键字进行模型训练,具体为:将上述采用if-idf算法抽取的关键字转换为词向量,并根据工单中的词汇关系对词向量进行线性组合生成工单向量指纹库。根据上述打标的历史工单详细分类对工单向量指纹库中的向量进行分类打标。将打标后的向量输入预先搭建的神经网络分类模型中进行分类模型训练,并根据训练结果不断对神经网络分类模型参数进行优化,以使得神经网络分类模型输出的结果(工单分类结果)高于预期的准确度,将此时训练得到的神经网络分类模型作为工单分类模型。s203、根据所述工单分类模型对待处理工单进行分类,确定所述待处理工单的类型。具体为,获取所述待处理工单,并对所述待处理工单进行频率统计和逆向文件频率计算确定所述历史工单的关键字。对所述待处理工单的关键字进行向量转换,生成所述待处理工单的关键字向量集合。将所述待处理工单的关键字向量集合导入所述工单分类模型中,确定所述待处理工单的类型。该步骤可以由工单处理系统的工单推荐模块执行。工单推荐模块加载上述工单分类模型并获取待处理工单,采用idf算法,if-idf算法对待处理工单进行关键字提取。对提取的关键字做向量转换生成词向量,将待处理工单的词向量输入上述工单分类模型中,获取工单分类模型的输出结果。根据输出结果确定待处理工单的工单类型。根据确定的工单类型确定其对应的工单向量指纹库。确定工单向量指纹库之后,采用局部敏感哈希算法建立稠密矢量聚类索引,在工单向量指纹库中查找与待处理工单相似度最高的历史工单。将该相似度最高的历史工单与工单处理方案作为待处理工单的处理方案。s204、匹配与所述待处理工单类型相似度最高的第一历史工单,并确定所述第一历史工单的处理方案为所述待处理工单的处理方案。具体为,对至少一个所述历史工单进行分类;利用局部敏感哈希算法对各种类型的历史工单建立工单索引;根据与待处理工单类型相同的历史工单的工单索引查找与所述待处理工单相似度最高的历史工单。该步骤可以由工单处理系统的工单推荐模块执行。本申请实施例提供的工单处理方法、装置及系统,通过获取第一数据库中的至少一个历史工单。对至少一个所述历史工单中的关键字进行模型训练生成工单分类模型。根据所述工单分类模型对待处理工单进行分类,确定所述待处理工单的类型。从与所述待处理工单类型相同的历史工单中匹配与所述待处理工单相似度最高的第一历史工单,并将所述第一历史工单的处理方案确定为所述待处理工单的处理方案。因此本申请提供的工单处理方法、装置及系统,能够自动根据待处理工单的类型和关键字特征推荐最相似的历史工单,并确定该历史工单对应的解决方案。大大提高了工单处理的效率和正确率。本申请实施例可以根据上述方法示例对信号检测装置进行功能模块或者功能单元的划分,例如,可以对应各个功能划分各个功能模块或者功能单元,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块或者功能单元的形式实现。其中,本申请实施例中对模块或者单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。如图3所示,本申请提供了一种工单处理装置,应用于权利要求1-2任一项所述的工单处理系统中;用于执行前述工单处理方法。所述装置包括:获取模块301,用于获取第一数据库中的至少一个历史工单。处理模块302,用于对至少一个所述历史工单中的关键字进行模型训练生成工单分类模型。所述处理模块302,还用于根据所述工单分类模型对待处理工单进行分类,确定所述待处理工单的类型。所述处理模块302,还用于从与所述待处理工单类型相同的历史工单中匹配与所述待处理工单相似度最高的第一历史工单,并将所述第一历史工单的处理方案确定为所述待处理工单的处理方案。可选的,所述处理模块302,还用于:对所述历史工单中的词语进行频率统计和逆向文件频率计算确定所述历史工单的关键字。对所述历史工单的关键字进行向量转换,生成历史工单的关键字向量集合。对所述关键字向量集合进行神经网络模型训练,生成所述工单分类模型。可选的,所述装置包括:所述获取模块301,还用于获取所述待处理工单。所述处理模块302,还用于对所述待处理工单进行频率统计和逆向文件频率计算确定所述历史工单的关键字。所述处理模块302,还用于对所述待处理工单的关键字进行向量转换,生成所述待处理工单的关键字向量集合。所述处理模块302,还用于将所述待处理工单的关键字向量集合导入所述工单分类模型中,确定所述待处理工单的类型。可选的,所述处理模块302,还用于:对至少一个所述历史工单进行分类。利用局部敏感哈希算法对各种类型的历史工单建立工单索引。根据与待处理工单类型相同的历史工单的工单索引查找与所述待处理工单相似度最高的历史工单。图4示出了上述实施例中所涉及的工单处理装置的又一种可能的结构示意图。该工单处理装置包括:处理器402和通信接口403。处理器402用于对工单处理装置的动作进行控制管理,例如,执行上述处理模块302执行的步骤,和/或用于执行本文所描述的技术的其它过程。通信接口403用于支持工单处理装置与其他网络实体的通信。例如,执行上述获取模块301执行的步骤,和/或用于执行本文所描述的技术的其它过程。工单处理装置还可以包括存储器401和总线404,存储器401用于存储工单处理装置的程序代码和数据。其中,存储器401可以是工单处理装置中的存储器等,该存储器可以包括易失性存储器,例如随机存取存储器;该存储器也可以包括非易失性存储器,例如只读存储器,快闪存储器,硬盘或固态硬盘;该存储器还可以包括上述种类的存储器的组合。上述处理器402可以是实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。该处理器可以是中央处理器,通用处理器,数字信号处理器,专用集成电路,现场可编程门阵列或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。所述处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,dsp和微处理器的组合等。总线404可以是扩展工业标准结构(extendedindustrystandardarchitecture,eisa)总线等。总线404可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本申请实施例提供一种包含指令的计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行上述方法实施例所述的工单处理方法。本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得所述计算机执行上述方法实施例所示的方法流程中的工单处理方法。其中,计算机可读存储介质,例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(randomaccessmemory,ram)、只读存储器(read-onlymemory,rom)、可擦式可编程只读存储器(erasableprogrammablereadonlymemory,eprom)、寄存器、硬盘、光纤、便携式紧凑磁盘只读存储器(compactdiscread-onlymemory,cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合、或者本领域熟知的任何其它形式的计算机可读存储介质。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于特定用途集成电路(applicationspecificintegratedcircuit,asic)中。在本申请实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何在本申请揭露的技术范围内的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1