投诉业务的数据处理方法、装置、计算机设备及存储介质与流程

文档序号:17492124发布日期:2019-04-23 20:42阅读:212来源:国知局
投诉业务的数据处理方法、装置、计算机设备及存储介质与流程

本发明涉及计算机技术领域,尤其涉及一种投诉业务的数据处理方法、装置、计算机设备及存储介质。



背景技术:

随着社会经济的发展,集团企业在不断壮大,在各不同地区均设置有对应的业务机构,不同的业务机构也根据实际需要进行业务扩展,业务的快速增长也往往带来一些新的负面问题。

通常消费者以投诉的形式将这些负面问题反映到业务咨询部门中,随着业务范围扩大,投诉案件量也增加,使得在查询各机构的投诉案件时,或者,在需要统计某一投诉类型的案件分布情况时,需要先通过人工的方式,对各个地区的投诉案件量进行合并,再进行查询,这使得处理投诉业务的人力成本高,且查询效率低。



技术实现要素:

本发明实施例提供一种投诉业务的数据处理方法、装置、计算机设备和存储介质,以解决处理投诉业务的人力成本高,且查询效率低的问题。

一种投诉业务的数据处理方法,包括:

若接收到业务投诉请求,则获取所述业务投诉请求中包含的投诉信息;

对所述投诉信息进行解析,得到文本格式的投诉文档,其中,所述投诉文档包括投诉内容和被投诉机构的机构标识;

使用预设的归类方法,确定所述投诉内容对应的投诉类型;

建立所述投诉内容、所述投诉内容对应的投诉类型和所述被投诉机构的机构标识之间的关联关系,并基于所述投诉内容、投诉内容对应的所述投诉类型、所述被投诉机构的机构标识和所述关联关系生成一条投诉记录,将所述投诉记录存入到预设的投诉数据库中;

在接收到投诉业务的查询请求时,获取所述查询请求中包含的关键字信息,其中,所述关键字信息包括所述投诉类型或者所述机构标识;

在所述预设的投诉数据库中,查询所述投诉类型或者所述机构标识对应的所述投诉内容,得到查询结果。

一种投诉业务的数据处理装置,包括:

请求接收模块,用于若接收到业务投诉请求,则获取所述业务投诉请求中包含的投诉信息;

信息解析模块,用于对所述投诉信息进行解析,得到文本格式的投诉文档,其中,所述投诉文档包括投诉内容和被投诉机构的机构标识;

类型确定模块,用于使用预设的归类方法,确定所述投诉内容对应的投诉类型;

关联建立模块,用于建立所述投诉内容、所述投诉内容对应的投诉类型和所述被投诉机构的机构标识之间的关联关系,并基于所述投诉内容、投诉内容对应的所述投诉类型、所述被投诉机构的机构标识和所述关联关系生成一条投诉记录,将所述投诉记录存入到预设的投诉数据库中;

查询获取模块,用于在接收到投诉业务的查询请求时,获取所述查询请求中包含的关键字信息,其中,所述关键字信息包括所述投诉类型或者所述机构标识;

业务查询模块,用于在所述预设的投诉数据库中,查询所述投诉类型或者所述机构标识对应的所述投诉内容,得到查询结果。

一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述投诉业务的数据处理方法的步骤。

一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述投诉业务的数据处理方法的步骤。

本发明实施例提供的投诉业务的数据处理方法、装置、计算机设备及存储介质,在接收到针对机构的业务投诉请求时,获取业务投诉请求中包含的投诉信息,并对投诉信息进行解析,得到文本格式的投诉文档,进而使用预设的归类方法,确定投诉内容对应的投诉类型,为投诉内容、投诉内容对应的投诉类型和被投诉机构的机构标识建立关联关系,并基于投诉内容、投诉内容对应的投诉类型、被投诉机构的机构标识和关联关系生成一条投诉记录,将投诉记录存入到预设的投诉数据库中,当接收到投诉业务的查询请求时,获取请求中包含的关键字信息,进而在预设的投诉数据库中存储的投诉记录中,查询关键字信息,得到查询结果,实现了对获取到的投诉信息进行自动分类并按照投诉类型和机构标识关联保存到数据库,并在需要对投诉信息进行查询时,能够直接从数据库的相应字段中查询所需信息,提高了投诉业务分类汇总的智能化程度,节约了人力资源,同时也提高了投诉业务查询的效率。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的投诉业务的数据处理方法的应用环境示意图;

图2是本发明实施例提供的投诉业务的数据处理方法的实现流程图;

图3是本发明实施例提供的投诉业务的数据处理方法中步骤s20的实现流程图;

图4是本发明实施例提供的投诉业务的数据处理方法中步骤s30的实现流程图;

图5是本发明实施例提供的投诉业务的数据处理方法中步骤生成投诉预警图的实现流程图;

图6为本发明实施例提供的投诉业务的数据处理方法中投诉预警图的一示例图;

图7是本发明实施例提供的投诉业务的数据处理装置的示意图;

图8是本发明实施例提供的计算机设备的示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1,图1示出本发明实施例提供的投诉业务的数据处理方法的应用环境。该投诉业务的数据处理方法应用在集团各个机构的业务投诉的汇总查询场景中。该业务投诉的汇总查询场景包括服务端和客户端,其中,客户端向服务端传输投诉信息,并在需要查询时,向服务端发送包含关键字的查询请求。服务端接收客户端传输的投诉信息,并对投诉信息进行归类存储,并在接收到客户端的查询请求时,从存储的投诉信息中查询与查询请求中的关键字匹配的投诉信息,并得到查询结果。客户端具体可以但不限于是各种个人电脑、便携式计算机、手机和平板电脑等智能设备,服务端具体可以用独立的服务器或者多个服务器组成的服务器集群实现。

请参阅图2,图2示出本发明实施例提供的一种投诉业务的数据处理方法,以该方法应用在图1中的服务端为例进行说明,详述如下:

s10:若接收到业务投诉请求,则获取业务投诉请求中包含的投诉信息。

具体地,在接收到客户端发送的业务投诉请求时,通过网络传输协议,获取该业务投诉请求中包含的投诉信息。

其中,网络传输协议包括但不限于:互联网控制报文协议(internetcontrolmessageprotocol,icmp)、地址解析协议(arpaddressresolutionprotocol,arp)和文件传输协议(filetransferprotocol,ftp)等。

其中,投诉信息是指包含用户针对集团中的机构产品或者业务上的一些意见或投诉的信息。其具体可以是用户通过电话通讯、网络客服、邮件和调查表等途径传达给客户端,因而,该投诉信息的文件格式包括但不限于:语音格式和文本格式等。

容易理解地,用户通过与客户端进行电话通讯进行投诉产生的通话记录,客户端将以电话录音的形式对通话记录进行保存,得到语音格式的投诉信息;用户通过与网络客服进行聊天咨询产生的记录,客户端将以文本的形式对这些记录进行保存,并生成投诉信息;用户以邮件和调查表途径传递给客户端的投诉信息,客户端对这些信息进行文本内容提取,得到文本格式的投诉信息。

需要说明的是,以上所列举的投诉信息的格式类型及获取途径,仅为本实施例优选的方式,不应当理解为对投诉类型的格式类型和获取途径的限制,实际也可包括其他格式类型,以及可以是其他获取途径,此处不做具体限定。

s20:对投诉信息进行解析,得到文本格式的投诉文档,其中,投诉文档包括投诉内容和被投诉机构的机构标识。

具体地,在获取到投诉信息后,对投诉信息进行解析,得到包含投诉内容和被投诉机构的机构标识的文本格式的投诉文档。

其中,对投诉信息进行解析,是指将投诉信息转换为预设格式,进而提取指定格式的投诉信息中,包含投诉内容和被投诉机构的机构标识的信息。对投诉信息进行解析,具体可采用格式转换、正则匹配和相似度计算等方式,具体解析方式依据实际得到的投诉信息不同而进行灵活选取。

其中,投诉内容是指投诉信息中包含的针对机构产品或业务相关的投诉的具体情况,被投诉机构的机构标识是指投诉内容所对应的投诉机构的机构标识。

s30:使用预设的归类方法,确定投诉内容对应的投诉类型。

具体地,使用预设的归类方法,将获取到的投诉内容划分到相应的投诉类型。

其中,投诉类型是指投诉信息所对应的投诉的类型,例如:投诉类型为“充值失败”和投诉类型为“客服不专业”等,投诉类型是根据投诉业务的业务需求,预先通过人工的方式进行设置。

其中,预设的归类方法,是指通过对投诉内容进行分析,从而得到投诉内容对应的投诉类型的方法,具体可以是通过聚类算法来实现,例如,k-means聚类算法,通过聚类算法,对投诉内容中的关键字进行聚类,以各个投诉类型为不同的聚类中心,计算关键字与各个聚类中心的距离,将距离最近的聚类中心对应的投诉类型作为该投诉内容对应的投诉类型。

s40:建立投诉内容、投诉内容对应的投诉类型和被投诉机构的机构标识之间的关联关系,并基于投诉内容、投诉内容对应的投诉类型、被投诉机构的机构标识和关联关系生成一条投诉记录,将投诉记录存入到预设的投诉数据库中。

具体地,建立投诉内容、投诉内容对应的投诉类型和被投诉机构的机构标识之间的关联关系,并根据投诉内容、投诉内容对应的投诉类型、被投诉机构的机构标识和关联关系生成一条投诉记录,再将投诉记录存入到预设的投诉数据库中,以使后续可根据预设的投诉数据库中存储的投诉记录进行快速查询、预警,也可对存储的该投诉记录进行分析,确定投诉内容与投诉类型之间的关联,以使后续对投诉内容的归类更为准确。

s50:在接收到投诉业务的查询请求时,获取查询请求中包含的关键字信息,其中,关键字信息包括投诉类型或者机构标识。

具体地,在接收到客户端发送的关于投诉业务的查询请求时,通过网络传输协议获取该查询请求中包含的关键字信息,该关键字信息可以是表示投诉类型的关键字,也可以是表示机构标识的关键字,以使后续可以根据关键字信息,查询对应的投诉业务的情况。

容易理解地,在关键字信息为投诉类型时,即需要根据投诉类型来查询所有包含该投诉内容的投诉记录,在关键字信息为机构标识时,即表示,需要查询的内容为查询与该机构标识相关的所有投诉记录。

值得说明的是,关键字信息也可以是多种方式的结合信息,例如,关键字信息包括投诉类型和机构标识,该关键字信息表示需要查询的内容为该机构标识中,涉及该投诉类型的投诉记录。

s60:在预设的投诉数据库中,查询投诉类型或者机构标识对应的投诉内容,得到查询结果。

具体地,根据步骤s50中获取到的关键字信息,查询关键字信息相关的投诉记录,作为查询结果。

其中,具体查询方式可以通过数据库查询指令来进行查询,也可以是通过文本相似度进行关键字匹配的方式,可以实际情况而定,此处不作具体限制。

在本实施例中,在接收到针对机构的业务投诉请求时,获取业务投诉请求中包含的投诉信息,并对投诉信息进行解析,得到文本格式的投诉文档,进而使用预设的归类方法,确定投诉内容对应的投诉类型,为投诉内容、投诉内容对应的投诉类型和被投诉机构的机构标识建立关联关系,并基于投诉内容、投诉内容对应的投诉类型、被投诉机构的机构标识和关联关系生成一条投诉记录,将投诉记录存入到预设的投诉数据库中,当接收到投诉业务的查询请求时,获取请求中包含的关键字信息,进而在预设的投诉数据库中存储的投诉记录中,查询关键字信息,得到查询结果,实现了对获取到的投诉信息进行自动分类并按照投诉类型和机构标识关联保存到数据库,并在需要对投诉信息进行查询时,能够直接从数据库的相应字段中查询所需信息,提高了投诉业务分类汇总的智能化程度,节约了人力资源,同时也提高了投诉业务查询的效率。

在图2对应的实施例的基础之上,下面通过一个具体的实施例来对步骤s20中所提及的对投诉信息进行解析,得到文本格式的投诉文档的具体实现方法进行详细说明。

请参阅图3,图3示出了本发明实施例提供的步骤s20的具体实现流程,详述如下:

s21:获取投诉信息的文件格式。

具体地,获取到投诉信息后,需要先对投诉信息的文件格式进行判断,进而根据投诉信息的文件格式,来进行对应的解析,投诉类型的文件格式包括但不限于:文本格式和语音格式等。

其中,对文件格式的判断,可使用文件格式验证工具,例如tridnet工具,也可以使用filetypeutil类进行文件格式的判断,也可以对获取到的投诉信息的后缀名采用正则匹配的方式进行文件格式的确定,具体可根据实际情况进行选择,此处不作具体限制。

s22:若投诉信息的文件格式为文本格式,则从文本格式的投诉信息中查找预设的分隔符,并基于查找到的分隔符,对文本格式的投诉信息进行分割,得到至少两个分割文本。

具体地,在本实施例中,文本格式的投诉信息包括多个区块,不同区块之间用预设的分隔符分隔开,在投诉信息的文件格式为文本格式时,从该文本格式的投诉信息中查找预设的分隔符,并通过查找到的每个分隔符,对该文本格式的投诉信息进行分割,得到多个分割文本。

其中,预设的分隔符包括但不限于:符号、标记、文字和图案等,优选地,本提案采用符号“;”作为预设的分隔符。

其中,查找预设的分隔符,可使用正则匹配的方法,也可使用文本查询的方式,具体可依实际情况进行选取,此处不做限定。

值得说明的是,所述文本格式的投诉信息,可以是通过其他格式的投诉信息转换而来,也可以是人工记录得到,也可以是通过机器人客服或者人工客户,与客户进行网络会话的记录生成,具体也可以是通过其他方式获取,此处不作具体限制。

s23:通过预设的正则匹配式,对每个分割文本进行正则匹配,得到投诉内容对应的内容分割文本和被投诉机构的机构标识对应的标识分割文本。

具体地,投诉内容的起始位置和结束位置预设有固定标识,通过预设的正则表达式,对起始位置的固定标识和结束位置的固定标识进行匹配,即可得到包含投诉内容的内容分割文本,同时,在预设的投诉数据库中,存储有每个有可能被投诉的投诉机构的机构标识,通过预设的正则表达式,对分割文本进行匹配查询,找到包含投诉机构的机构标识的分割文本,作为标识分割文本。

例如,在一具体实施方式中,起始位置的固定标识为“请说明您的问题:”,结束位置的固定标识为“我们会尽快处理。”,通过预设的正则表达式对分割文本进行匹配,找到这两个固定标识,将这两个固定标识和则两个固定标识中间的部分作为内容分割文本。

s24:将内容分割文本和标识分割文本按照预设的组合方式进行整理,得到文本格式的投诉文档。

具体地,将步骤s23中获取的内容分割文本和标识分割文本按照预设的组合方式进行整理,即可得到文本格式的投诉文档。

其中,预设的组合方式可根据实际需要进行设置,例如,可以是一个表格的形式等,此处不做具体限制。

在本实施例中,获取投诉信息的文件格式,在投诉信息的文件格式为文本格式,从文本格式的投诉信息中查找预设的分隔符,并基于查找到的分隔符,对文本格式的投诉信息进行分割,得到至少两个分割文本,进而通过预设的正则匹配式,对每个分割文本进行正则匹配,得到投诉内容对应的内容分割文本和被投诉机构的机构标识对应的标识分割文本,再将内容分割文本和标识分割文本按照预设的组合方式进行整理,得到文本格式的投诉文档,使得从不规则的投诉信息,提取到投诉内容和被投诉机构的机构标识,并按照预设的方式进行组合,得到统一的文本格式的投诉文档,有利于后续进行快速归类存储,提高了投诉业务进行汇总的效率。

在一实施例中,在步骤s21之后,在步骤s22之前,若投诉信息的文件格式为语音格式,则该投诉业务的数据处理方法还包括:

若投诉信息的文件格式为语音格式,则对投诉信息进行语音转换文本操作,得到文本格式的投诉信息。

具体地,针对文件格式为语音格式的投诉信息,可以通过第三方工具,也可以通过语音转换文本算法,对投诉信息进行文本转换,得到文本格式的投诉信息。

其中,语音转换文本算法包括但不限于:基于马尔可夫模型(markovmodel)的音字转换算法、基于动态规划的viterbi算法和n-gram的自然语言语义分析算法等。

在本实施例中,在投诉信息的文件格式为语音格式时,对语音格式的投诉信息进行语音转换文本操作,得到文本格式的投诉信息,从而转换成文本格式的投诉信息的处理,在后续通过对文本格式的投诉信息进行处理,得到报案投诉内容和投诉类型的文本格式的投诉文档,从而实现了语音格式的投诉信息的提取。

在图2对应的实施例的基础之上,下面通过一个具体的实施例来对步骤s30中所提及的使用预设的归类方法,确定投诉内容对应的投诉类型的具体实现方法进行详细说明。

请参阅图4,图4示出了本发明实施例提供的步骤s30的具体实现流程,详述如下:

s31:从预设的投诉词典中分别获取每个预设的投诉类型对应的第一词向量,得到m个第一词向量,其中,m为预设的投诉类型的数量。

具体地,从预设的投诉词典中,获取每个预设类型对应的第一词向量,得到m个第一词向量,m为预设的投诉类型的数量,m的具体数值依据实际预设的投诉类型数量进行确定。

其中,每个预设的投诉类型对应唯一一个第一词向量,该第一词向量用于表示该投诉类型的语义在空间分布的情况。

预设的投诉词典可以根据数据库中存储好的投诉记录进行生成与更新,具体描述可参考另一在步骤s31之前,生成预设的投诉词典的实施例,为避免重复,此处不再赘述。

需要说明的是,后续步骤s32至步骤s33,与步骤s31之间,没有必然的先后执行顺序,其可以是并列执行的关系,此处不做限制。

s32:对投诉内容进行分词处理,得到g个待匹配分词,其中,g为正整数。

具体地,通过第三方分词工具,或者分词算法,对投诉内容进行分词处理,得到g个待匹配的分词,g的具体数值依据分词结果而定。

其中,常见的第三方分词工具包括但不限于:stanfordnlp分词器、ictclas分词系统、ansj分词工具和hanlp中文分词工具等。

其中,分词算法包括但不限于:最大正向匹配(maximummatching,mm)算法、逆向最大匹配(reversedirectionmaximummatchingmethod,rmm)算法、双向最大匹配(bi-directctionmatchingmethod,bm)算法、隐马尔科夫模型(hiddenmarkovmodel,hmm)和n-gram模型等。

s33:使用词向量的方式,对g个待匹配分词进行训练,得到g个第二词向量。

在人工智能中,词向量表示主要是指语言的形式化或数学的描述,以便在计算机中表示语言,并能让计算机程序自动处理。本实施例中所指的词向量的方式就是用向量的形式来表示待匹配分词。

具体地,将每个待匹配分词按照预设的语料库映射到向量中,将这些向量联系在一起,形成一个词向量空间,每个向量相当于是这个空间中的一个点,将每个向量作为一个第二词向量。

例如,某产品名称里面有宝马、奔驰这两个待匹配分词,根据预设的语料库,获取了这两个待匹配分词的所有可能分类:“汽车”、“奢侈品”、“动物”、“动作”和“美食”。因此,对这两个待匹配分词引入一种向量表示:

<汽车,奢侈品,动物,动作,美食>

根据统计学习的方法计算这两个待匹配分词属于每个分类的概率,计算机学到的可能是:

宝马=<0.5,0.2,0.2,0.0,0.1>

奔驰=<0.7,0.2,0.0,0.1,0.0>

可以理解地,第二词向量的每一维的值代表一个具有一定的语义和语法上能够解释的特征。

需要说明的是,每个待匹配分词对应唯一的第二词向量,每个第二词向量对应至少一个待匹配分词。

通过预设语料库,构建每个待匹配分词的第二词向量,使得将机器无法准确理解的文字转换成了机器容易识别并进行运算的词向量,有利于对待匹配分词进行更准确的归类。

进一步地,在构建第二词向量后,针对每个第二词向量,计算该第二词向量与其他第二词向量之间的空间距离,将与其他第二词向量空间距离均超过预设空间距离阈值的第二词向量确认为无效词向量,并剔除该无效词向量,以使每个第二词向量都尽可能正确地表示该第二词向量对应的待匹配分词在投诉内容中代表的语义。

s34:使用如下公式,计算每个第二词向量与每个第一词向量之间的余弦相似度值,得到m*g个余弦相似度值:

其中,ε为第二词向量与第一词向量之间的余弦相似度值,a为第一词向量,b为第二词向量,|a|为第一词向量的模,|b|为第二词向量的模。

具体地,针对每个第二词向量,根据上述公式,分别计算该第二词向量与m个第一词向量之间的余弦相似度值,共得到m个与该第二词向量相关的余弦相似度值,按照这种方法,共得到所有第二词向量对应的m*g个余弦相似度值。

值得说明的是,第一词向量和第二词向量均属于多维向量,其具体维度可依据实际需要进行设置,此处不做限定。

s35:从m*g个余弦相似度值中,获取值最大的余弦相似度值,作为目标相似度值。

具体地,余弦相似度值范围在0到1之间,当两个词向量的余弦相似度值为0,表示这两个词向量之间是独立的,也即,这两个词向量基本无关联,当这两个词向量的余弦相似度值越接近1,即可说明这两个词向量越相似性越大,从m*g个余弦相似度值中,获取值最大的余弦相似度值,作为目标相似度值,即找出与第二词向量最接近的第一词向量对应的余弦相似度值作为目标相似度值。

s36:获取目标相似度值对应的第一词向量,并将该第一词向量对应的投诉类型,确定为投诉内容对应的投诉类型。

具体地,获取到目标相似度对应的第一词向量,并将该第一词向量对应投诉类型确定为该投诉内容对应的投诉类型。

在本实施例中,从预设的投诉词典中分别获取每个预设的投诉类型对应的第一词向量,得到m个第一词向量,对投诉内容进行分词处理,得到g个待匹配分词,使用词向量的方式,对g个待匹配分词进行训练,得到g个第二词向量,并计算第二词向量到每个第一词向量之间的余弦相似度值,得到m*g个余弦相似度值,再从m*g个余弦相似度值中,获取值最大的余弦相似度值,作为目标相似度值,进而获取目标相似度值对应的第一词向量,并将该第一词向量对应的投诉类型,确定为投诉内容对应的投诉类型,通过计算词向量之间的相似度值,确定与预设投诉词典中的投诉类型最接近的投诉类型,使得得到投诉内容对应的投诉类型更为准备,有利于提高投诉类型归类的准确性。

在一实施例中,在步骤s31之前,该投诉业务的数据处理方法还包括:

根据预设的投诉数据库中存储的投诉记录,生成预设的投诉词典,其中,预设的投诉词典包括预设的投诉类型,以及每个投诉类型对应的第一词向量。

具体地,在从预设的投诉词典中分别获取每个预设的投诉类型对应的第一词向量,得到m个第一词向量之前,本实施例提供一种生成预设的投诉词典的方法,通过获取预设的投诉数据库中已存储的投诉记录,并将每条投诉记录中的投诉内容进行关键字提取,得到多个关键字,针对同一条投诉内容中提取到的关键字,将这些关键字通过预设的语料库转换为词向量的方式,并计算这些词向量的聚类中心,将聚类中心对应的词向量,作为该投诉内容对应的投诉类型的词向量,即该投诉类型对应的第一词向量,进而将每个投诉类型,以及投诉类型对应的第一词向量存入到投诉词典中,得到该预设的投诉词典。

其中,预设的语料库可以包括但不限于:现代汉语通用平衡语料库、北京口语语料查询系统、中国传媒大学文本语料库检索系统和中文新闻分类语料库等。

其中,将关键字通过预设的语料库转换成词向量的方式,可参考步骤s33的描述,为避免重复,此处不再赘述。

值得说明的是,预设的投诉词典可以根据预设的投诉数据库中的投诉记录的增加,进行定期或者手动更新,以使投诉类型对应的第一词向量兼容性更好,后续能更准确地与第二词向量进行匹配。

在本实施例中,根据预设的投诉数据库中存储的投诉记录,生成预设的投诉词典,使得这种通过历史投诉记录生成的投诉词典,在后续使用其中的第一词向量,与待匹配分词转换的第二词向量,进行匹配的准确度更高,提高了投诉类型选取的准确性。

在一实施例中,在到达预设时间或接收到报表生成指令时,生成投诉表,该投诉业务的数据处理方法还包括:

在到达预设时间或接收到报表生成指令时,根据预设的投诉数据库中存储的投诉记录,生成投诉表,其中,投诉表包括每个机构标识和机构标识对应的投诉值。

具体地,在达到预设的触发条件,例如到达预设时间或接收到报表生成指令时,服务端对预设的投诉数据库中已经存储的投诉记录进行分析,生成投诉表,其中,生成的投诉表中包括大不限于:每个机构标识和机构标识对应的投诉值等。

值得说明的是,可以针对不同的投诉类型设置不同的投诉标准值,该标准投诉值用于表示一条该投诉类型的投诉记录所占的投诉值,例如,投诉类型“错别字”对应的投诉标准值为1,投诉类型“充值失败”对应的投诉标准值为5。

其中,服务端对预设的投诉数据库中已经存储的投诉记录进行分析,生成投诉表,具体过程为:针对每个机构标识,从预设的投诉数据库中,获取该机构标识对应的所有投诉记录,针对同一投诉类型的投诉记录,统计该投诉记录的条数,并使用该投诉类型对应的投诉标准值乘以该投诉记录的条数,即得到该投诉类型的投诉值,进而将该机构标识对应的所有投诉类型的投诉值累加,即可得到该机构标识对应的投诉值。

例如,在一具体实施方式中,获取到机构标识为“pajryzt”的投诉记录为8条,其中,投诉类型为“错别字”的投诉记录5条,该投诉类型对应的投诉标准值为1;投诉类型为“充值失败”的投诉记录2条,该投诉类型对应的投诉标准值为5;投诉类型为“客服不专业”的投诉记录1条,该投诉类型对应的投诉标准值为8;则通过计算可得到投诉类型为“错别字”的投诉值为5、投诉类型为“充值失败”的投诉值为10,以及,投诉类型为“客服不专业”的投诉值为8,将这三种投诉类型对应的投诉值进行累加,即得到机构标识为“pajryzt”的投诉值为23。

在本实施例中,在到达预设时间或接收到报表生成指令时,根据预设的投诉数据库中存储的投诉记录,生成投诉表,使得管理人员可以通过查看该投诉表了解每个机构标识对应的投诉情况和每个投诉类型对应的投诉情况,有利于提高投诉业务的管理效率。

在一实施例中,在步骤在到达预设时间或接收到报表生成指令时,根据预设的投诉数据库中存储的投诉记录,生成投诉表之后,该投诉业务的数据处理方法还包括:

s71:根据机构标识与地区标识之间预设的对应关系,统计每个地区标识包含的投诉值。

具体地,在本实施例中,每个机构标识与地区标识之间预设有对应关系,根据该对应关系,可确定每个地区标识包含的机构标识,进而根据投诉表中每个机构标识对应的投诉值,统计出每个地区标识包含的投诉值。

容易理解地,在投诉表中,包含每个机构在各个投诉类型的投诉值,因而,在每个地区标识包含的投诉值中,也可以统计出各个投诉类型分别占的投诉值数值。

例如,在一具体实施方式中,统计出地区标识为“sz”的投诉值为18,其中,地区标识“sz”对应的投诉类型包括“商品损坏”和“客服不专业”,投诉类型“商品损坏”对应的投诉值为8,投诉类型“客服不专业”对应的投诉值为10。

s72:根据每个地区标识和每个地区标识包含的投诉值,生成投诉预警图。

具体地,针对每个地区标识,针对该地区包含的各种投诉类型对应的投诉值,生成投诉预警图,或者,也可根据实际需要,生成相应的投诉预警图表。

其中,投诉预警图的样式包括但不限于:趋势图、频数图、比重图和饼状图等。

在本实施例中,根据显示规则,显示各个地区标识的投诉预警图的图形模块对应的预警图颜色,以此来表示投诉值的状态,如图6所示,图6为投诉预警图的一示例图,显示规则具体是将各个地区标识的图形模块对应的投诉值汇总量代入到预设显示条件中,若投诉值超过预设正常阈值,则显示代表投诉预警的颜色,例如,紫色代表预警;若投诉值不超过预设预警阈值并且大于预设最小预警阈值,则显示代表投诉值正常的颜色,例如,绿色代表正常;若不存在投诉案件量或者小于预设最小阈值,则显示代表未设置指标的颜色,浅蓝色代表未设置指标。

值得说明的是,在任一地区标识的投诉值超过预设地区投诉值阈值,或者,针对任一地区标识,任一投诉类型对应的投诉值超过预设的投诉类型预设值时,将通过服务端的监控设备,向管理人员发送警告信息,发送警告信息的方式包括但不限于:发送短信、发送警告弹窗和发送语音提醒等。

在本实施例中,根据机构标识与地区标识之间预设的对应关系,统计每个地区标识包含的投诉值,根据每个地区标识和每个地区标识包含的投诉值,生成投诉预警图,使得每个地区标识中的预警信息以图表的形式展示出来,更为直观地显示了地区投诉案件的情况,有利于管理人员对投诉业务进行管理,并对超出预期的情况进行及时预警,提高了投诉业务预警的及时性。

应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

图7示出与上述实施例投诉业务的数据处理方法一一对应的投诉业务的数据处理装置的原理框图。如图7所示,该投诉业务的数据处理装置包括请求接收模块10、信息解析模块20、类型确定模块30、关联建立模块40、查询获取模块50和业务查询模块60。各功能模块详细说明如下:

请求接收模块10,用于若接收到业务投诉请求,则获取业务投诉请求中包含的投诉信息;

信息解析模块20,用于对投诉信息进行解析,得到文本格式的投诉文档,其中,投诉文档包括投诉内容和被投诉机构的机构标识;

类型确定模块30,用于使用预设的归类方法,确定投诉内容对应的投诉类型;

关联建立模块40,用于建立投诉内容、投诉内容对应的投诉类型和被投诉机构的机构标识之间的关联关系,并基于投诉内容、投诉内容对应的投诉类型、被投诉机构的机构标识和关联关系生成一条投诉记录,将投诉记录存入到预设的投诉数据库中;

查询获取模块50,用于在接收到投诉业务的查询请求时,获取查询请求中包含的关键字信息,其中,关键字信息包括投诉类型或者机构标识;

业务查询模块60,用于在预设的投诉数据库中,查询投诉类型或者机构标识对应的投诉内容,得到查询结果。

进一步地,信息解析模块20包括:

格式获取单元,用于获取投诉信息的文件格式;

文本分割单元,用于若投诉信息的文件格式为文本格式,则从文本格式的投诉信息中查找预设的分隔符,并基于查找到的分隔符,对文本格式的投诉信息进行分割,得到至少两个分割文本;

正则匹配单元,用于通过预设的正则匹配式,对每个分割文本进行正则匹配,得到投诉内容对应的内容分割文本和被投诉机构的机构标识对应的标识分割文本;

文本整合单元,用于将内容分割文本和标识分割文本按照预设的组合方式进行整理,得到文本格式的投诉文档。

该投诉业务的数据处理装置还包括:

语音转换文本模块,用于若投诉信息的文件格式为语音格式,则对投诉信息进行语音转换文本操作,得到文本格式的投诉信息。

进一步地,类型确定模块30包括:

第一词向量获取单元,用于从预设的投诉词典中分别获取每个预设的投诉类型对应的第一词向量,得到m个第一词向量,其中,m为预设的投诉类型的数量;

分词单元,用于对投诉内容进行分词处理,得到g个待匹配分词,其中,g为正整数;

第二词向量获取单元,用于使用词向量的方式,对g个待匹配分词进行训练,得到g个第二词向量;

余弦相似度计算单元,用于使用如下公式,计算每个第二词向量与每个第一词向量之间的余弦相似度值,得到m*g个余弦相似度值:

其中,ε为第二词向量与第一词向量之间的余弦相似度值,a为第一词向量,b为第二词向量,|a|为第一词向量的模,|b|为第二词向量的模;

目标相似度值获取单元,用于从m*g个余弦相似度值中,获取值最大的余弦相似度值,作为目标相似度值;

投诉类型确定单元,用于获取目标相似度值对应的第一词向量,并将该第一词向量对应的投诉类型,确定为投诉内容对应的投诉类型。

该投诉业务的数据处理装置还包括:

投诉词典生成模块,用于根据预设的投诉数据库中存储的投诉记录,生成预设的投诉词典,其中,预设的投诉词典包括预设的投诉类型,以及每个投诉类型对应的第一词向量。

该投诉业务的数据处理装置还包括:

投诉表生成模块,用于在到达预设时间或接收到报表生成指令时,根据预设的投诉数据库中存储的投诉记录,生成投诉表,其中,投诉表包括每个机构标识和机构标识对应的投诉值。

该投诉业务的数据处理装置还包括:

统计模块,用于根据机构标识与地区标识之间预设的对应关系,统计每个地区标识包含的投诉值;

预警图生成模块,用于根据每个地区标识和每个地区标识包含的投诉值,生成投诉预警图。

关于投诉业务的数据处理装置的具体限定可以参见上文中对于投诉业务的数据处理方法的限定,在此不再赘述。上述投诉业务的数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

图8是本发明一实施例提供的计算机设备的示意图。该计算机设备可以是服务端,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储投诉记录。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种投诉业务的数据处理方法。

在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例投诉业务的数据处理方法的步骤,例如图2所示的步骤s10至步骤s60。或者,处理器执行计算机程序时实现上述实施例投诉业务的数据处理装置的各模块/单元的功能,例如图7所示的模块10至模块60的功能。为避免重复,这里不再赘述。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。

在一实施例中,提供一计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例投诉业务的数据处理方法的步骤,或者,该计算机程序被处理器执行时实现上述实施例投诉业务的数据处理装置中各模块/单元的功能。为避免重复,这里不再赘述。

可以理解地,所述计算机可读存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、电载波信号和电信信号等。

以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1