互动式语音应答方法和系统与流程

文档序号：12183305阅读：438来源：国知局

本申请涉及通信
技术领域：
，特别涉及一种互动式语音应答方法及系统。
背景技术：
：互动式语音应答(InteractiveVoiceResponse，IVR)可以在呼叫中心(CallCenter)系统中电话呼入时提供自动语音应答的服务。大量的查询服务可以通过IVR服务来完成，从而可以大大的减少人工服务，节约服务成本，并且IVR服务还可以24小时连续不断的提供服务。在传统的IVR系统中，用户与系统交互的方式是通过电话的键盘。用户在进入IVR系统后，一般会听到相关的语音提示菜单。然后用户根据自己的需要可以按下键盘上相关的按键。系统根据用户按下的按键，从而查询相关的语音信息，最后播报语音。如今，用户也可以通过语音来与IVR系统交互。用户在进入IVR系统后，可以发送描述问题的语音，系统自动分析所述语音从而查找问题的答案的语音，最后播报语音。然而，上述的这些IVR服务的播报模式比较固定，通常只有一个固定的播报模式来服务所有的用户。然而，对于老年人用户来说，这种固定的播报模式由于播报语速过快，播报音量不够大，或者播报内容中可能存在的不容易理解的互联网名词，从而导致老年人用户不能得到较好的IVR服务，降低了用户体验。综上所述，现有技术中存在老年人用户不能得到较好的IVR服务，体验较差的问题。技术实现要素：本申请实施例的目的是提供一种互动式语音应答方法及系统，用以解决现有技术中存在老年人用户不能得到较好的IVR服务，体验较差的问题。为解决上述技术问题，本申请一实施例提供的互动式语音应答方法，包括：获取用户的问题分类及来电号码；根据来电号码查找对应的账户信息；判断所述账户信息是否符合老年人信息；若是，则根据所述问题分类查找相应的答案，并以老年人播报模式播报答案语音。本申请一实施例提供的互动式语音应答系统，包括：获取单元，用于获取用户的问题分类及来电号码；查找单元，用于根据来电号码查找对应的用户信息；判断单元，用于判断所述账户信息是否符合老年人信息；播放单元，用于在所述账户信息符合老年人信息时，根据所述问题分类查找相应的答案，并以老年人播报模式播报答案语音。由以上本申请实施例提供的技术方案可见，本申请实施例提供的一种互动式语音应答方法及系统，通过根据来电号码查找用户账户信息，进而判断所述账户信息是否符合老年人信息，对老年人用户可以以老年人播报模式播报答案语音，实现提高老年人用户的体验。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。图1为本申请一实施例中提供的互动式语音应答方法的流程图；图2为本申请一实施例中提供的互动式语音应答方法的流程图；图3为本申请一实施例中提供的互动式语音应答方法的流程图；图4为本申请一实施例中提供的互动式语音应答方法的流程图；图5为本申请一实施例中提供的互动式语音应答方法的流程图；图6为本申请一实施例中提供的互动式语音应答系统的模块示意图。具体实施方式为了使本
技术领域：
的人员更好地理解本申请中的技术方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。图1为本申请一实施例中提供的互动式语音应答方法的流程图。本实施例中，所述互动式语音应答方法包括如下步骤：S110：获取用户的问题分类及来电号码；所述问题分类可以是用户输入的问题的类型；所述来电号码可以是用户的电话号码。S120：根据来电号码查找对应的账户信息；一般的，每一个用户在注册账户时，都会填写有来电号码；所以可以根据用户的来电号码查询到对应的账户信息。这里的账户信息可以包括用户年龄或身份证。S130：判断所述账户信息是否符合老年人信息；若是，则执行S140；所述S130步骤，如图2所示具体可以包括如下步骤：S131：获取所述账户信息中的用户年龄；S132：判断所述用户年龄是否大于预设阈值，若是，则执行S140。所述预设阈值可以是根据综合相关因素的一个经验值。例如预设阈值为60岁，那么，判断时可以将所有用户年龄大于60岁的用户都符合老年人用户，并执行S140步骤。在本申请的另一实施例中，所述S130步骤，如图3所示具体可以包括如下步骤：S133：获取所述账户信息中的身份证；S134：根据所述身份证中的出生时间及当前时间，得到用户年龄；因为所述身份证中左起第7至10位数字为出生时间，所以可以将当前时间减去出生时间，从而得出用户年龄。例如，身份证中的出生时间为“1950”年，当前时间为“2015”年，那么2015-1950＝65，则得到用户年龄为65岁。S135：判断所述用户年龄是否大于预设阈值，若是，则执行S140。所述预设阈值可以是根据综合相关因素的一个经验值。例如预设阈值为60岁，那么，判断时可以将所有用户年龄大于60岁的用户都符合老年人用户，并执行S140步骤。在上一S130步骤的具体实施例中，由于用户填写的账户信息可能在很久以前，所以直接获取账户信息的用户年龄一般会偏小。所以在本实施例中，通过身份证的出生时间及当前时间可以准确的得到用户年龄。S140：根据所述问题分类查找相应的答案，并以老年人播报模式播报答案语音。根据所述问题分类在答案数据库中查找对应的答案。所述老年人播报模式可以包括降低播报语速、提高播报音量、将互联网名词替换为日常用词、使用尊称等的播报模式中的至少一种。所述互联网名词可以是从互联网中产生并应用于网络交流中的一种语言。互联网名词以互联网作为媒介进行传播，由于拥有广大的受众，并且在网络中传播迅速，所以在IVR系统中经常会用到互联网名词。由于老年人用户可能跟不上正常的播报语速，IVR系统可以适当的降低播报语速，使得老年人用户可以听清播报内容；或者老年人用户可以听力较差，对于正常的播报音量听不清，IVR系统可以适当的提高播报音量，使得老年人用户可以听清播报内容；或者老年人用户可能不能理解互联网名词代表的意思，IVR系统可以将互联网名词替换为日常用词，便于老年人用户理解；或者IVR系统可以对老年人用户更多的使用尊称，这样可以使得老年人用户不会太过紧张。IVR系统中可以配置如表1所示的互联网名词与日常用词对应关联的数据库；在判断用户为老年人用户时可以将答案中的互联网名词替换为日常用词。表1互联网名词日常用词粉丝崇拜者O2O将互联网与线下交易结合LBS基于您的位置提供的服务APP手机应用IOS手机系统安卓手机系统本申请实施例中，通过根据来电号码查找用户账户信息，进而判断所述账户信息是否符合老年人信息，可以实现以老年人播报模式播报答案语音，这样通过降低播报语速、提高播报音量、将互联网名词替换为日常用户、使用尊称等的方式，提高老年人用户的体验。在本申请基于上述图1的一个实施例中，在S110步骤之前，还可以有S101、S102、S103步骤，如图4所示：S101：接收用户输入的语音信息；S102：将所述语音信息转换为文本信息；A1：对所述语音信息进行分帧处理，提取音频特征例。如MFCC或PLP特征以及他们的一阶和二阶差分；A2：根据所述音频特征在音频特征数据库中进行比对，得出对应的文字；A3：依照时间顺序将各个文字组合为文本信息。由于不同的音频特征具有不同的频谱线，在音频特征数据库中记录有不同频谱线对应的文字，所以可以将提取的语音信息的音频特征在所述音频特征数据库中查出对应的文字，并依照时间顺序将文字组合为文本信息。S103：对所述文本信息进行最大匹配算法，得到问题分类；所述最大匹配算法可以包括正向最大匹配算法、逆向最大匹配算法和双向最大匹配算法中的至少一种。最大匹配算法(MaximumMatching)是以词典为依据，将完整的文本信息作为第一次的扫描单词，之后将逐字递减后的单词作为的扫描单词，在词典中进行扫描(为提升扫描效率，还可以跟据字数多少设计多个字典，然后根据字数分别从不同字典中进行扫描)。以下介绍所述正向最大匹配算法：所述正向最大匹配算法是在文本信息中从左往右取词，第一次为完整的文本信息，之后每次少取一个字，直到词典命中或剩下1个单字。例如，文本信息为“我要查询话费余额”；第一轮扫描：第1次：“我要查询话费余额”，扫描8字词典，结果为无，则减去最右边的一个字；第2次：“我要查询话费余”，扫描7字词典，结果为无，则减去最右边的一个字；······第8次：“我”，扫描1字词典，结果为有，则扫描中止，输出第1个词为“我”，去除第1个词后开始第2轮扫描，即“要查询话费余额”。第二轮扫描：第1次：“要查询话费余额”，扫描7字词典，结果为无，则减去最右边的一个字；第2次：“要查询话费余”，扫描6字词典，结果为无，则减去最右边的一个字；······第7次：“要”，扫描1字词典，结果为有，则扫描中止，输出第2个词为“要”，去除第2个词后开始第3轮扫描，即“查询话费余额”。第三轮扫描：第1次：“查询话费余额”，扫描6字词典，结果为无，则减去最右边的一个字；第2次：“查询话费余”，扫描4字词典，结果为无，则减去最右边的一个字；······第5次：“查询”，扫描2字词典，结果为有，则扫描中止，输出第3个词为“查询”，去除第3个词后开始第四轮扫描，即“话费余额”。第四轮扫描：第1次：“话费余额”，扫描4字词典，结果为有，则扫描中止，输出第4个词为“话费余额”，整体扫描结束。正向最大匹配法，最终分词结果为：“我/要/查询/话费余额”。以下介绍所述逆向最大匹配算法：所述逆向最大匹配算法与所述正向最大匹配算法不同之处在于，其在文本信息中是从右往左取词的，其它算法逻辑和正向最大匹配算法相同。依然以文本信息为“我要查询话费余额”为例；第一轮扫描：第1次：“我要查询话费余额”，扫描8字词典，结果为无，则减去最左边的一个字；第2次：“要查询话费余额”，扫描7字词典，结果为无，则减去最左边的一个字；······第5次：“话费余额”，扫描4字词典，结果为有，则扫描中止，输出第1个词为“话费余额”，去除第1个词后开始第二轮扫描，即“我要查询”。第二轮扫描：第1次：“我要查询”，扫描4字词典，结果为无，则减去最左边的一个字；第2次：“要查询”，扫描3字词典，结果为无，则减去最左边的一个字；第3次：“查询”，扫描2字词典，结果为有，则扫描中止，输出第2个词为“查询”，去除第2个词后开始第三轮扫描，即“我要”。第三轮扫描：第1次：“我要”，扫描2字词典，结果为无，则减去最左边的一个字；第2次：“要”，扫描1字词典，结果为有，则扫描中止，输出第3个词为“要”，去除第3个词后开始第四轮扫描，即“我”。第四轮扫描：第1次：“我”，扫描1字词典，结果为有，则扫描中止，输出第4个词为“我”，整体扫描结束。逆向最大匹配法，最终分词结果为：“我/要/查询/话费余额”。以下介绍所述双向最大匹配算法：所述双向最大匹配算法即正向最大匹配算法和逆向匹配算法都计算一遍，然后根据分词结果进行加权计算，选取加权后分值高的一种分词结果输出。所述加权计算可以字数越多的词分值越高，字数越少的词分值越低。例如单字词为0分，2字词为1分，3字词为2分，依次类推。举例说明：某一文本信息为“我们在野生动物园玩”；正向最大匹配算法，最终分词结果为：“我们/在野/生动/物/园/玩”，其中，两字词有3个，单字词为3个。则加权计算结果为1*3+0*3＝3分。逆向最大匹配算法，最终分词结果为：“我们/在/野生动物园/玩”，其中，五字词1个，两字词1个，单字字典词为2个。则加权计算结果为4*1+1*1+0*2＝5分。很明显的，逆向最大匹配算法的加权后分值高于正向最大匹配算法。因此最终输出为逆向最大匹配算法的分词结果。本实施例中，经过上述的最大匹配算法之后，可以将分词后的各个词在问题分类的数据库中匹配到问题分类。例如，“我/要/查询/话费余额”中，可以匹配到问题分类为“话费余额”。所述问题分类的数据库可以是系统中预先配置好的。在本申请基于上述图1的另一个实施例中，在S140步骤之后，还可以有S150步骤，如图5所示：S150：将所述账户信息发送给客服服务台。在IVR系统中，如果用户觉得播报的答案语音不满意或者用户对互联网不熟悉，则可以选择进入人工服务。现有技术中，接入人工服务后，客服人员并不能第一时间了解用户年龄，这样可能回答老年人用户的问题时会使用令老年人用户不了解的互联网名词，或者说话的语速过快，这样会降低老年人用户体验。通过本实施例，由于IVR系统可以将用户的账户信息发送给客服服务台，使得客服人员可以第一时间了解用户年龄，这样客服人员在回答老年人用户的问题时可以将互联网名词替换为日常用词或者降低语速，并且更多的使用尊称，实现提高老年人用户体验。图6为本申请一实施例中提供的互动式语音应答系统的模块示意图。本实施例中，所述互动式语音应答系统包括：获取单元210，用于获取用户的问题分类及来电号码；查找单元220，用于根据来电号码查找对应的用户信息；判断单元230，用于判断所述账户信息是否符合老年人信息；播放单元240，用于在所述账户信息符合老年人信息时，根据所述问题分类查找相应的答案，并以老年人播报模式播报答案语音。优选地，所述老年人播报模式包括降低播报语速、提高播报音量、将互联网名词替换为日常用词中的至少一种。优选地，所述判断单元230，具体可以包括：第一获取子单元，用于获取所述账户信息中的用户年龄；第一判断子单元，用于判断所述用户年龄是否大于预设阈值。优选地，所述判断单元230，具体可以包括：第二获取子单元，用于获取所述账户信息中的身份证；第二计算子单元，用于根据所述身份证中的出生时间及当前时间，得到用户年龄；第二判断子单元，用于判断所述用户年龄是否大于预设阈值。优选地，在所述获取单元210之前，还可以包括：接收单元，用于接收用户输入的语音信息；转换单元，用于将所述语音信息转换为文本信息；匹配单元，用于对所述文本信息进行最大匹配算法，得到问题分类。优选地，所述最大匹配算法可以包括正向最大匹配算法、逆向最大匹配算法和双向最大匹配算法中的至少一种。优选地，在所述播放单元240之后，还可以包括：发送单元，用于将所述账户信息发送给客服服务台。通过上述的实施例，不仅可以通过降低播报语速、提高播报音量、将互联网名词替换为日常用户、使用尊称等的方式，提高老年人用户的体验；而且在接入人工服务后，客服人员还可以第一时间通过客服服务台了解用户的年龄，这样客服人员在回答老年人用户的问题时可以将互联网名词替换为日常用词或者降低语速，并且更多的使用尊称，实现提高老年人用户体验。在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable LogicDevice,PLD)(例如现场可编程门阵列(FieldProgrammableGateArray，FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logiccompiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(HardwareDescriptionLanguage，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(AdvancedBooleanExpressionLanguage)、AHDL(AlteraHardwareDescriptionLanguage)、Confluence、CUPL(CornellUniversityProgrammingLanguage)、HDCal、JHDL(JavaHardwareDescriptionLanguage)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardwareDescriptionLanguage)等，目前最普遍使用的是VHDL(Very-High-SpeedIntegratedCircuitHardwareDescriptionLanguage)与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(ApplicationSpecificIntegratedCircuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC625D、AtmelAT91SAM、MicrochipPIC18F26K20以及SiliconeLabsC8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flashRAM)。内存是计算机可读介质的示例。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitorymedia)，如调制的数据信号和载波。还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。当前第1页1 2 3

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：费驰;
技术所有人：阿里巴巴集团控股有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。