一种即时打断AI语音的方法、系统及电子设备与流程

文档序号:24821953发布日期:2021-04-27 14:52阅读:311来源:国知局
一种即时打断AI语音的方法、系统及电子设备与流程
一种即时打断ai语音的方法、系统及电子设备
技术领域
1.本申请涉及ai机器人领域,尤其涉及一种即时打断ai语音的方法、系统及电子设备。


背景技术:

2.人工智能(artificial intelligence)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
3.人工智能应用层面的重点方向是计算机视觉、语音语义识别等,并在商业化这条路上越跑越快,与我们的日常生活也产生了越来越紧密的联系,ai语音机器人也应运而生。以呼叫中心系统为基础加入自然语言处理、语音识别、语义理解等多项人工智能技术形成的ai语音机器人,能够通过智能外呼、自动应答来代替人工接打电话,实现业务办理、推介引流、智能分析、远程客服等功能。
4.然而,绝大多数ai语音机器人,特别是应用在业务导航上,在确定用户意图后,ai语音机器人在解答过程中不允许用户进行打断,必须等到ai语音机器人说完对应的内容,才可以接收处理用户下一次的交互内容,以避免对话的混乱。
5.因此,现有的ai语音机器人智能性,交互效率以及交互友好性上还有待提高。


技术实现要素:

6.本申请要解决的技术问题,在于提供一种即时打断ai语音的方法、系统及电子设备,以解决在现有ai语音机器人无法被即时打断的技术问题。
7.为实现上述目的,本申请采用下述技术方案:第一方面,本申请提供一种即时打断ai语音的方法,应用于ai与用户的语音通话过程中,所述方法包括:获取所述ai的当前播放内容;在所述当前播放内容时间段内,采集用户呼入的语音流;对所述语音流进行检测获得检测结果,当所述检测结果中存在一个或多个打断意图时,将每个所述打断意图对应的ai播放内容加入打断队列中;当所述当前播放内容存在允许打断字段时,调用所述打断队列中的排序第一的所述ai播放内容对所述当前播放内容进行替换。
8.第二方面,本申请提供一种即时打断ai语音的系统,所述系统包括:第一获取单元,用于获取所述ai的当前播放内容;第一采集单元,用于在所述当前播放内容时间段内,采集用户呼入的语音流;第一检测单元,用于对所述语音流进行检测获得检测结果;第一添加单元,用于当所述检测结果中存在一个或多个打断意图时,将每个所述打断意图对应的ai播放内容加入打断队列中;第一执行单元,用于当所述当前播放内容存在允许打断字段时,调用所述打断队
列中的排序第一的所述ai播放内容对所述当前播放内容进行替换。
9.第三方面,本申请提供一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器执行以实现如上述第一方面所述的即时打断ai语音的方法。
10.第四方面,本申请提供一种计算机可读存储介质,,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器执行以实现上述第一方面所述的即时打断ai语音的方法。
11.本申请的有益效果是:本申请提供一种即时打断ai语音的方法、系统及电子设备,根据用户的打断意图队列对ai播放内容进行打断,提高了ai即时打断技术的灵活性。
附图说明
12.图1为本申请一个实施例提供的一种即时打断ai语音的方法流程示意图;图2为本申请一个实施例提供的一种对所述语音流进行检测获得检测结果的方法流程示意图;图3为本申请一个实施例提供的一种即时打断ai语音的系统的结构示意图;图4为本申请一个实施例提供的一种第一检测单元的结构示意图;图5为本申请一个实施例提供的一种电子设备的结构示意图。
具体实施方式
13.下面通过具体实施例,并结合附图,对本申请的技术方案作进一步的具体描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
14.现有业务导航以及导购类的ai语音机器人,当ai语音机器人在与用户对话时,ai机器人述说知识内容的过程中,此时用户只能当ai语音机器人述说完对应知识内容后才能进行后续的互动。但ai语音机器人说的内容是用户不感兴趣,或目前ai语音机器人正在说的内容是由于前一次用户交互,用户表达错误引起了ai语音机器人识别错误意图所错误述说的内容,并不是用户想要得知的内容,用户需要等待ai语音机器人完成述说后才能进行后续的互动,更不会进行上下文语境切换。实现更高效的ai互动,让用户感觉对话更流畅与自然。
15.因此,针对ai语音机器人难以被即时打断,本申请实施例提供一种即时打断ai语音的方法、系统及电子设备,根据用户的打断意图队列对ai播放内容进行打断,提高了ai即时打断技术的灵活性。
16.以下结合附图,详细说明本申请中各实施例提供的技术方案。
17.请参阅附图1,其示出了本申请一个实施例提供的一种即时打断ai语音的方法流程示意图,应用于ai与用户的语音通话过程中,所述方法包括:s101,获取所述ai的当前播放内容;
针对步骤s101,所述ai的当前播放内容为ai语音机器人当前轮次的播放内容。
18.s102,在所述当前播放内容时间段内,采集用户呼入的语音流;针对步骤s102,在ai语音机器人当前播放内容的时间段内,采集用户呼入的语音流,例如当前播放内容的播放时间为15s,从当前播放内容的开始时间0s至结束时间15s的时间段内,采集用户呼入的语音流。
19.s103,对所述语音流进行检测获得检测结果;s104,当所述检测结果中存在一个或多个打断意图时,将每个所述打断意图对应的ai播放内容加入打断队列中;可以理解,检测结果是用于判断用户呼入的语音流中是否包括打断意图的结果,检测结果可以是在用户呼入的语音流不存在打断意图,也就是此时ai语音机器人不用被打断;存在一个或多个打断意图,此时要开启判断是否要打断ai语音机器人。
20.打断队列是一个用于存储打断意图对应的ai播放内容的队列,当用户呼入的语音流中存在一个或多个打断意图时,将每个所述打断意图对应的ai播放内容加入打断队列中。
21.s105,当所述当前播放内容存在允许打断字段时,调用所述打断队列中的排序第一的所述ai播放内容对所述当前播放内容进行替换。
22.请参阅附图2,其示出了本申请一个实施例提供的一种对所述语音流进行检测获得检测结果的方法流程示意图,所述方法包括:s201,将所述语音流通过asr转换成所述语音流对应的文本内容;s202,通过nlp对所述文本内容进行识别获得识别结果;s203,所述识别结果与知识库进行匹配获得所述检测结果。
23.在一个实施例中,所述ai播放内容被配置有时间戳,所述ai播放内容根据时间戳的大小在所述打断队列中反向排序。
24.可以理解,针对用户呼入的语音流中的每一个打断意图,根据语音流中的每一个打断意图的获取时间对对应的ai播放内容配置时间戳,越先获取的ai播放内容对应的时间戳越小,越后获取的 ai播放内容对应的时间戳越大,将时间戳越大的ai播放内容排在打断队列的前面,时间戳越小的ai播放内容排在打断队列的后面。
25.在一个实施例中,调用所述打断队列中的排序第一的所述ai播放内容对所述当前播放内容进行替换之后,将所述当前播放内容添加至上下文寄存器中。
26.在一个实施例中,当所述检测结果中不存在打断意图时,从所述上下文寄存器中获取所述当前播放内容的上一次当前播放内容,将所述上一次当前播放内容以问句的形式向用户播放。
27.请参阅附图3,其示出了本申请一个实施例提供的一种即时打断ai语音的系统的结构示意图,所述系统包括:第一获取单元301,用于获取所述ai的当前播放内容;第一采集单元302,用于在所述当前播放内容时间段内,采集用户呼入的语音流;第一检测单元303,用于对所述语音流进行检测获得检测结果;第一添加单元304,用于当所述检测结果中存在一个或多个打断意图时,将每个所述打断意图对应的ai播放内容加入打断队列中;
第一执行单元305,用于当所述当前播放内容存在允许打断字段时,调用所述打断队列中的排序第一的所述ai播放内容对所述当前播放内容进行替换。
28.可以理解,所述系统中各个单元之间的交互模式可以为ipc(inter

process communication,进程间通信)或rpc(remote procedure call,远程过程调用)。
29.在一个实施例中,第一采集单元302被定义为以标准的语音数据格式采集用户呼入的语音流。
30.在一个实施例中,请参阅附图4,其示出了本申请一个实施例提供的一种第一检测单元的结构示意图,所述单元包括:asr子单元3031,用于将所述语音流通过asr转换成所述语音流对应的文本内容;nlp子单元3032,用于通过nlp对所述文本内容进行识别获得识别结果;匹配子单元3033,用于将所述识别结果与知识库进行匹配获得所述检测结果。
31.请参阅附图5,其示出了本申请一个实施例提供的一种电子设备的结构示意图,可以包括:至少一个网络接口502、存储器503和至少一个处理器501。电子设备中的各个组件通过总线系统504耦合在一起。可以理解,总线系统504用于实现这些组件之间的连接通信。总线系统504除包括数据总线之外,还包括电源总线、控制总线和状态信号总线,但是为了清楚说明起见,在附图5中将各种总线都标为总线系统504。
32.在一些实施方式中,存储器503存储了如下的元素,可执行模块或者数据结构,或者他们的子集,或者他们的扩展集:操作系统5031和应用程序5032。
33.其中,操作系统5031,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种寄出业务以及处理基于硬件的任务。应用程序5032,包含各种应用程序,例如媒体播放器(media player)、浏览器(browser)等,用于实现各种应用业务。实现本申请实施例方法的程序可以包含在应用程序中。
34.在上述实施例中,终端还包括:存储在存储器503上的至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集可由处理器501执行实现本申请实施例中所述任一即时打断ai语音的方法的步骤。
35.在一个实施例中,本申请还提供了一种计算机可读存储介质,计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器执行时实现本申请实施例中所述任一即时打断ai语音的方法的步骤。
36.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的至少一条指令、至少一段程序、代码集或指令集可存储于一非易失性计算机可读取存储介质中,所述的至少一条指令、至少一段程序、代码集或指令集在执行时,可实现本申请实施例中所述任一地图绘制方法的步骤。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram
(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
37.上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,这些均属于本申请的保护范围之内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1