来电处理方法、装置及系统与流程

文档序号:22254161发布日期:2020-09-18 13:21阅读:162来源:国知局

本发明涉及通信领域,尤其涉及一种来电处理方法、装置及系统。



背景技术:

现今电话通信属于日常生活中不可缺少的一种通信方式,但由于电话通信属于实时传送双向语音以进行会话的一种通信方式,如在实际使用中往往出现被叫终端未及时接听电话导致沟通不便。

为解决上述问题,专利公开文件(cn104917909a)中公开了一种基于通话的留言方法,根据预设的条件自动接听来电并接收主叫终端的留言,通过留言文件将通话意图告知被叫终端。

但上述技术方案仅能向被叫终端传达通话意图,且在实际生活中所留言文件所传递的仅是通话意图,或传递的信息不完整,仍需要被叫终端与主叫终端再次电话沟通,沟通效率低。



技术实现要素:

本发明针对现有技术中的缺点,提供了一种能够识别主叫终端来电意图的来电处理方案、装置及系统。

为了解决上述技术问题,本发明通过下述技术方案得以解决:

一种来电处理方法,包括以下步骤:

配置各来电意图所对应的应答数据;

接收主叫终端的来电后,判断是否自动接听所述来电;

当判定自动接听来电时,接听并录音,获取主叫终端发送的第一音频数据;

对所述第一音频数据进行意图分类,获得来电意图;

提取与所述来电意图相对应的应答数据,基于所述应答数据进行自动应答并录音。

作为一种可实施方式:

将所述第一音频数据进行语音识别,获得相应的音频文本;

从预设的知识库中提取与所述音频文本相匹配的对话文本,获得第一对话文本;

将所述第一对话文本对应的场景标签作为所述第一音频数据的来电意图。

作为一种可实施方式:

所述应答数据包括场景标签和应答对话数据;

基于所述场景标签提取相对应的应答数据。

作为一种可实施方式:

所述应答对话数据包括相对应的应答音频集和应答文本集;

从应答文本集中提取与音频文本相匹配的应答文本;

从应答音频集中提取回应与所述应答文本的应答音频,并将所述应答音频发送至主叫终端;

获取主叫终端发送的第二音频数据,对所述第二音频数据进行语音识别,获得相应的音频文本。

作为一种可实施方式:

将音频文本转换为主叫句向量;

将各对话文本或各应答文本转换为被叫句向量;

计算所述主叫句向量与相应的被叫句向量相似度,获得音频文本与各对话文本或各应答文本的相似度;

基于所述相似度提取与所述音频文本相匹配的对话文本或应答文本。

作为一种可实施方式,获得音频文本后,还包括来电提醒步骤,具体步骤为:

基于音频文本判断是否人工接听,当判定人工接听时发起来电提醒,提醒用户接听。

作为一种可实施方式:

应答数据还包括屏蔽场景标签和关键词提取数据;

通话结束后,根据所述屏蔽场景标签屏蔽主叫终端对应的来电号码,或根据关键词提取数据对各音频文本进行关键词提取,基于提取结果生成对话关键信息,推送录音及所述对话关键信息。

作为一种可实施方式,从预设的知识库中提取与所述音频文本相匹配的第一对话文本前还包括场景筛选步骤,具体步骤为:

提取主叫终端对应的身份数据,所述身份数据为空或群组分类;

根据预设的场景关联规则,提取与所述身份数据其相关联的场景标签;

基于所述场景标签从预设的知识库中提取对话文本,获得第二对话文本;

从所述第二对话文本中提取与所述音频文本相匹配的对话文本,获得第一对话文本。

本发明还提出一种来电处理装置,包括:

配置模块,用于配置各来电意图所对应的应答数据;

接听判断模块,用于接收主叫终端的来电后,判断是否自动接听所述来电;

来电接管模块,用于当判定自动接听来电时,接听并录音,获取主叫终端发送的第一音频数据;

意图判断模块,对所述第一音频数据进行意图分类,获得来电意图;

处理模块,用于提取与所述来电意图相对应的应答数据,基于所述应答数据进行自动应答并录音。

本发明还提出一种来电处理系统,包括主叫终端、被叫终端和服务器,其中被叫终端通过服务器接收主叫终端发起的来电,所述被叫终端包括上述来电处理装置。

本发明由于采用了以上技术方案,具有显著的技术效果:

本发明通过对主叫终端发送的第一音频数据进行意图分类,获得来电意图,从而根据预先配置各来电意图所对应的应答数据,进行自动应答,与现有通话留言的技术方案相比,能够基于主叫终端的来电意图进行有针对性的应答;不仅能够引导主叫终端完善通话信息,还能向主叫终端传递信息,从而进一步提高沟通效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明一种来电处理方法的流程示意图;

图2是本发明一种来电处理装置的模块连接示意图;

图3是图2中意图判断模块400的模块连接示意图;

图4是图2中处理模块500的模块连接示意图。

图中:

100为配置模块、200为接听判断模块、300为来电接管模块、400为意图判断模块、500为处理模块、410为文本识别单元、420为对话匹配单元、430为意图确定单元、440为场景筛选单元、510为应答数据提取单元、520为应答匹配单元、530为应答输出单元、540为应答识别单元、550为屏蔽单元、560为推送单元。

具体实施方式

下面结合实施例对本发明做进一步的详细说明,以下实施例是对本发明的解释而本发明并不局限于以下实施例。

实施例1、一种来电处理方法,如图1所示,包括以下步骤:

s100、配置各来电意图所对应的应答数据;

s200、接收主叫终端的来电后,判断是否自动接听所述来电;

s300、当判定自动接听来电时,接听并录音,获取主叫终端发送的第一音频数据;

s400、对所述第一音频数据进行意图分类,获得来电意图;

s500、提取与所述来电意图相对应的应答数据,基于所述应答数据进行自动应答并录音。

本实施例通过对主叫终端发送的第一音频数据进行意图分类,获得来电意图,从而根据预先配置各来电意图所对应的应答数据,进行自动应答,与现有通话留言的技术方案相比,能够基于主叫终端的来电意图进行有针对性的应答;

用户可根据实际情况,自行配置应答数据,如针对快递/外卖的来电意图,配置用于指定放置快递/外卖的地点的应答数据,如针对约吃饭的来电意图,配置用于询问时间、地点等信息的应答数据。由此可见,在实际使用中,不仅能够引导主叫终端完善通话信息,还能向主叫终端传递信息,进一步提高沟通效率。

步骤s200中接收主叫终端的来电后,可根据预设的接听条件判断是否自动接听所述来电;

本实施例中接听条件为来电超过10s未接听时自动接听,用户可根据实际需要自行设置,例如陌生来电自动接听,熟人来电超过10s未接听时自动接听,本实施例不对其做具体限定。

进一步地,步骤s400中对所述第一音频数据进行意图分类,获得来电意图的具体步骤为:

s410、将所述第一音频数据进行语音识别,获得相应的音频文本;

s420、从预设的知识库中提取与所述音频文本相匹配的对话文本,获得第一对话文本;

s430、将所述第一对话文本对应的场景标签作为所述第一音频数据的来电意图。

本实施例中将预先收集来电语料作为对话文本,将所述来电语料基于场景标签分类,构建知识库。

即,所述知识库包括若干各场景,每个场景下包含若干个常用应答剧本,每个剧本中包含若干对话文本,所述对话文本分为对话问题文本和对话回答文本,对话问题文本和对话回答文本相关联。

进一步地:

所述应答数据包括场景标签和应答对话数据;

所述应答对话数据包括相对应的应答音频集和应答文本集;

上述步骤s500中,提取与所述来电意图相对应的应答数据,基于所述应答数据进行自动应答并录音的具体步骤为:

s510、基于所述第一对话文本的场景标签提取相对应的应答音频集和应答文本集;

s520、从所述应答文本集中提取与音频文本相匹配的应答文本;

s530、从应答音频集中提取回应与所述应答文本的应答音频,并将所述应答音频发送至主叫终端;

s540、获取主叫终端发送的第二音频数据,对所述第二音频数据进行语音识别,获得相应的音频文本。

将所述音频文本作为步骤s520中的音频文本,重复上述步骤,直至通话结束;

注:对整个接听过程录音。

上述应答文本集包括相互关联的应答问题文本和应答回答文本,当所述应答文本为应答问题文本时,将与其相关联的应答回答文本的音频作为应答音频,当所述应答文本为应答回答文本时,从应答音频集中提取缺少回答的应答问题文本的音频或结束通话的音频作为应答音频。

本实施例中应答文本与音频文本相匹配,即,应答文本与音频文本的内容相一致,故当应答文本为应答问题文本时,获取回答该问题的应答音频反馈主叫终端,实现自动为主叫终端传递信息,而当应答文本为应答回答文本时,则可向主叫终端发送缺少回答的应答音频询问主叫终端,引导主叫终端提供用户关系的内容,完成主叫终端传递的信息,有效提高沟通效率。

进一步地,获得第一对话文本或应答文本的具体步骤为:

a、将音频文本转换为主叫句向量;

所述音频文本为第二音频数据/第二音频数据进行语音识别后获得的音频文本;

b、将各对话文本或各应答文本转换为被叫句向量;

c、计算所述主叫句向量与相应的被叫句向量相似度,获得音频文本与各第一对话文本或各应答文本的相似度;

d、基于所述相似度提取与所述音频文本相匹配的第一对话文本或应答文本。

本实施例利用知识库和应答文本集中的文本对初始语义模型进行训练,获得语义模型以及各文本的句子矩阵,即被叫句向量。

本实施例中初始语义模型采用现有已公开的bert模型和tfidf模型所构成的融合模型。

在实际使用中,将音频文本输入上述语义模型,由上述语义模型将所述音频文本转换为相应的句子矩阵,即,主叫句向量;

所述语义模型基于主叫句向量和与其相应的被叫句向量进行相似度计算,输出各被叫句向量与主叫句向量的相似度;

以相似度最大的对话文本或应答文本作为与所述音频文本相匹配的对话文本(即,第一对话文本)或应答文本。

进一步地,获得音频文本后,还包括来电提醒步骤,具体步骤为:

基于音频文本判断是否人工接听,当判定人工接听时发起来电提醒,提醒用户接听。

即,预先设置转接关键词,当从音频文本中识别到所述转接关键词时,判定人工接听时发起来电提醒。

进一步地:应答数据还包括屏蔽场景标签和关键词提取数据;

所述屏蔽场景标签用于指示是否屏蔽该来电,从而实现防骚扰的效果;

所述关键词提取数据用于指示需从各音频文本提取的关键信息类别,如时间、地点、姓名等,由用户根据实际需要自行设定。

通话结束后,根据所述屏蔽场景标签屏蔽主叫终端对应的来电号码,或根据关键词提取数据对各音频文本进行关键词提取,基于提取结果生成对话关键信息,推送录音及所述对话关键信息。

现有来电处理的技术方案为,当来电为陌生号码时,提取所述陌生号码的标签(快递、中介、推销、诈骗等),根据用户预先的配置信息判断是否接听所述来电,当判定为不接听时,挂断来电并将该陌生号码加入黑名单,但如中介、推销类电话,如果全部屏蔽可能会丢失所需要的信息,例如推销包括房产推销、理财推销、学历推销、广告推销、教育推销等,用户可能需要教育推销和房产推销,此时采用现有处理方法只能接听全部推销电话或屏蔽所有推销电话,无法满足用户需求。

本实施例对各来电意图配置所对应的应答数据,通过应答数据中的应答对话数据引导主叫终端补充用户感兴趣的信息,比如来电意图为房产推销时,可通过配置应答对话数据自动询问地段、价格等信息,提高工作效率;

通过关键词提取数据提取对话关键信息,以上述房产推销为例,关键词可设为地点和价格;以熟人约饭的场景为例,关键词可设为时间、地点等。

在实际使用中,用户可根据实际需要自行设定屏蔽场景标签屏蔽骚扰来电,还可自行配置关键词提取数据,为感兴趣的来电场景需提取的关键信息,便于用户浏览。

本实施例该通过对屏蔽场景标签的设计,判定是否屏蔽此类来电,例如通过屏蔽场景标签将诈骗(来电意图)设为将屏蔽的来电,当挂断该通话后,即可根据屏蔽场景标签将对应的来电号码拉入黑名单。

进一步地,步骤s420中从预设的知识库中提取与所述音频文本相匹配的第一对话文本前还包括场景筛选步骤,具体步骤为:

①、提取主叫终端对应的身份数据,所述身份数据为空或群组分类;

即,获取对应来电的来电号码,从对应被叫终端的电话簿中查询所述来电号码,但无查询结果时,该主叫终端的身份数据为空,当存在查询结果时,调取对应的群组分类,如联系人、家人、同事、客户等。

②、根据预设的场景关联规则,提取与所述身份数据其相关联的场景标签;

用户可根据实际需要,为各类身份配置与其关联的场景标签,如身份数据为空时对应的身份为陌生人,为其配置相关联的场景标签为外卖、快递、推销、诈骗等,如身份为家人,则为其配置相关联的场景为约吃饭、约看电影等。

③、基于所述场景标签从预设的知识库中提取对话文本,获得第二对话文本;

④、从所述第二对话文本中提取与所述音频文本相匹配的对话文本,获得第一对话文本。

即,从预设的知识库中提取关联的场景标签下的对话文本,基于所提取的对话文本进行相似度匹配,此时能够大大减少需要匹配的对话文本的数量,有效提高匹配速度。

案例、基于本案例对本实施例1所提出的来电处理方法进行详细介绍;

1、配置:

预先构建知识库和语义模型。

用户根据实际情况设置接听条件和场景关联规则、并配置应答数据;

接听条件为:陌生来电自动接听,熟人来电超过10s未接听时自动接听。

应答数据包括场景标签、应答对话数据、屏蔽场景标签、关键词提取数据。

2、自动接听:

接收主叫终端的来电后,获取来电号码,将来电号码与电话簿中保存的号码进行匹配,当无相匹配的号码时判定其为陌生来电,接听所述来电,否则等待10s用户仍未接听时接听所述来电。

注,用户可根据情况自行配置接听语音,所述接听语音可与来电身份相关联,例如本案例中,针对陌生来电,接听语音为“请问您是?”,其他来电的接听语音则为“请问您找***有什么事么?”。

3、智能识别来电意图:

获取主叫终端发送的对接听语音的回答,即获得第一音频数据。

基于来电身份和场景关联规则,从知识库中提取相应场景,将第一音频数据所转换的音频文本输入至语义模型中,基于语义模型输出的音频文本与上述场景中各对话文本的相似度确定来电意图。

例如来电为朋友,相应的音频文本为:晚上一起吃个饭吧;此时根据场景关联规则,从知识库中提取场景标签为约饭和约看电影的对话文本,通过语义模型从中找出与音频文本最接近的对话文本,此时所得对话文本的场景标签为约饭,故来电意图为约饭。

4、自动应答:

基于来电意图和应答对话数据进行应答,比如:

来电意图为约饭,此时根据用户配置的应答对话数据自动询问“在哪里吃饭”、“具体什么时间”等问题;

来电意图为快递/外卖,此时根据用户配置的应答对话数据自动回答“麻烦您将快递/外卖放在***处,谢谢”;来电意图为诈骗,此时根据用户配置的应答对话数据自动回答“不需要,谢谢”;

来电意图为房产推销,此时根据用户配置的应答对话数据进一步询问“请问房子的具体地址是?”、“请问房子的面积?”、“请问房子的价格?”;

5、屏蔽/信息推送:

挂断电话后,根据屏蔽场景标签判断用户是否屏蔽该场景的来电,当判断屏蔽时,将来电号码加入黑名单。

否则,根据关键词提取数据,从主叫终端发送的音频数据中提取对话关键信息,将录音机对话关键信息推送给用户。

对话关键信息为文本信息,用户无需听完完整的通话录音即可获得所关注的信息,节约用户时间,同时还推送原录音,以便用户核对上述对话关键信息。

4、语义模型再训练:

根据预设的周期,如每个月收集主叫终端所发送的第一语料(自动接听时主叫终端发送的语料),以及主叫终端和被叫终端通话时的第二语料(用户自主接听时的语料),基于第一语料和第二语料对知识库进行扩充,还对语义模型进行再训练。

本案例通过对知识库的扩充和语义模型的再训练,从而提取与音频文本相近似的对话文本/应答文本时,准确率更高。

实施例2、来电处理装置,如图2至图4所示,包括配置模块100(为图面的整洁,于图2中省略配置模块100与其他各模块的连线)、接听判断模块200、来电接管模块300、意图判断模块400和处理模块500;

所述配置模块100,用于配置各来电意图所对应的应答数据;

所述接听判断模块200,用于接收主叫终端的来电后,判断是否自动接听所述来电;

所述来电接管模块300,用于当判定自动接听来电时,接听并录音,获取主叫终端发送的第一音频数据;

所述意图判断模块400,对所述第一音频数据进行意图分类,获得来电意图;

所述处理模块500,用于提取与所述来电意图相对应的应答数据,基于所述应答数据进行自动应答并录音。

进一步地,参照图3,所述意图判断模块400包括文本识别单元410、对话匹配单元420和意图确定单元430。

所述文本识别单元410,用于将所述第一音频数据进行语音识别,获得相应的音频文本;

所述对话匹配单元420,从预设的知识库中提取与所述音频文本相匹配的对话文本,获得第一对话文本;

所述意图确定单元430,将所述第一对话文本对应的场景标签作为所述第一音频数据的来电意图。

进一步地,参照图4,处理模块500包括应答数据提取单元510、应答匹配单元520、应答输出单元530和应答识别单元540;

所述应答数据提取单元510,用于基于所述场景标签提取相对应的应答数据。

所述应答匹配单元520,用于从应答文本集中提取与音频文本相匹配的应答文本;

所述应答输出单元530,用于从应答音频集中提取回应与所述应答文本的应答音频,并将所述应答音频发送至主叫终端;

所述应答识别单元540,用于获取主叫终端发送的第二音频数据,对所述第二音频数据进行语音识别,获得相应的音频文本。

进一步地,处理模块500还包括屏蔽单元550和推送单元560;

所述屏蔽单元550,用于在通话结束后,根据所述屏蔽场景标签屏蔽主叫终端对应的来电号码;

所述推送单元560,用于在通话结束后,根据关键词提取数据对各音频文本进行关键词提取,基于提取结果生成对话关键信息,推送录音及所述对话关键信息。

进一步地,意图判断模块400还包括场景筛选单元440,所述场景筛选单元440被配置为:

提取主叫终端对应的身份数据,所述身份数据为空或群组分类;

根据预设的场景关联规则,提取与所述身份数据其相关联的场景标签;

基于所述场景标签从预设的知识库中提取对话文本,获得第二对话文本;

从所述第二对话文本中提取与所述音频文本相匹配的对话文本,获得第一对话文本。

对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

实施例3、来电处理系统,包括主叫终端、被叫终端和服务器,其中被叫终端通过服务器接收主叫终端发起的来电,所述被叫终端包括实施例2所述的来电处理装置。

本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

需要说明的是:

说明书中提到的“一个实施例”或“实施例”意指结合实施例描述的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,说明书通篇各个地方出现的短语“一个实施例”或“实施例”并不一定均指同一个实施例。

尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

此外,需要说明的是,本说明书中所描述的具体实施例,其零、部件的形状、所取名称等可以不同。凡依本发明专利构思所述的构造、特征及原理所做的等效或简单变化,均包括于本发明专利的保护范围内。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离本发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

当前第1页1 2 
当前第1页1 2 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!
1