对话系统与语音对话处理方法_2

文档序号：8285500阅读：来源：国知局

所述特定人的相关数据，如性别或年纪等等的生物特征、或是所述特定人的惯用语言或是居住地口音等等，利用上述的特征与接听人所回答的数据进行比对，以确认是否符合特定人身份。
[0020]本发明所提出外拨特定人的对话系统与语音对话处理方法，可以结合图形化使用者接口(Graphical User Interface)，或是选择性地使用录音系统，让进行后续作业的人员，例如谈判专家等进行接下来的业务。
[0021]由于对话过程的纪录，本发明所提出外拨特定人的对话系统，可使后续作业的人员选择客户回复的内容而进行分析，可大量节省人工的费用。另外，根据这些记录，可以在特定人对话时找他过去的对话内容调适语音模型与语言模型等，以便改进语音的辨识率。
[0022]另外，由于对话过程的纪录，后续作业的人员若是比对客户回复的声纹发现与过去记录相差甚大，此时警示相关人员可能有假冒的情况产生。
[0023]本发明所提出外拨特定人的对话系统，更加入了所谓的最佳打电话时间(BestTime To Call)的技术，经过一段时间的纪录，可由统计观察推算受话者最适当的联络时间，使得以后拨打的成功率能够显著提升。
[0024]本发明所提出外拨特定人的对话系统与语音对话处理方法，当进行信息传递程序，将对应于特定人的信息传送给接听人时，进一步检测异常状况，若发现异常状况发生时，则重新进入特定人身份确认流程。
[0025]上述的异常状况为发现此接听人的声纹不同时，则认定该异常状况发生。或是发现此接听人的回复持续既定次数无法辨识时，或是隔一段时间无任何响应时都可认定该异常状况发生。
[0026]上述重新进入特定人身份确认流程后，根据特定人数据产生与前一询问语音信号不重复的询问语音信号询问接听人。若是当此询问语音信号询问接听人后仍未完成确认，则在进行其它不重复的询问语音信号，直到完成确认为止。在不过度打扰客户的考虑下，在预设一定次数的重新询问仍然不能判断是否为本人时，系统会向受话者致歉后挂断。
[0027]为让本发明的上述特征和优点能更明显易懂，下文特举实施例，并配合所附图式，作详细说明如下。
【附图说明】
[0028]图1是绘示本发明的语音对话系统的一实施例的系统方块图；
[0029]图2为绘示本发明实施例的语音对话系统的系统作业流程示意图；
[0030]图2A为绘示本发明实施例的语音对话系统的系统作业流程中，加入声纹比对步骤的示意图。
[0031]【主要组件符号说明】
[0032]100:语音对话系统
[0033]110:对话系统
[0034]120:数据库
[0035]130:图形化使用者接口
[0036]140:拨接模块
[0037]150:录音模块
[0038]160:服务网络
【具体实施方式】
[0039]本发明所提出以对话系统配合数据库架构出一个对话系统与语音对话处理方法。模拟人员以语音合成的提示句询问是否为特定人，再由语音辨识以明确(Explicit)的方式或是不明确(Implicit)的方式确认是否符合特定人身份。
[0040]上述受话者以明确(Explicit)的方式回答时，例如明确回复他是我们所要找的人(如回答:我是)，且声纹特征与过去的纪录相符合，就可视同此特定人接听。而受话者若是以不明确(Implicit)的方式回复，例如询问受话方是否为此特定人时(如:请问您是王大明先生本人吗)，客户以比较中性而不否认的方式回答(如:嗯)，而再根据声纹特征符合就可视同此特定人。另外，若是客户以比较中性而不否认的方式回答时，虽然系统提问并没有确认受话方是否为此特定人(如:请问您是王大明先生吗)，如果语者声纹和过去的纪录一致，还是可以认定为是此特定人接听。而系统只有在认定是此特定人接电话的情况下，系统才会传达涉及隐私的信息。
[0041]本发明所提出外拨特定人的对话系统，针对确认特定人的方式，除了采用声纹特征方式外，可采用加入其它特征进行比对，而根据数据库取得特定人的相关数据，如性别或年纪等等的生物特征、或是特定人的惯用语言或是居住地口音等等，利用上述的特征与接听人所回答的数据进行比对，以确认是否符合特定人身份。
[0042]本发明所提出外拨特定人的对话系统，可以结合图形化使用者接口(GraphicalUser Interface,底下简称GUI)，或是选择性地使用录音系统，让进行后续作业的人员，例如谈判专家等进行接下来的业务。
[0043]由于对话过程的纪录，本发明所提出外拨特定人的对话系统，可使后续作业的人员只需要听需要后手继续联系的客户过去联络回复的内容而进行分析，可大量节省人工的费用。另外，根据这些记录，可以对完成的对话调适语音模型，以便改进语音的辨识率。
[0044]另外，由于对话过程的纪录，后续作业的人员若是比对客户回复的声纹发现与过去记录相差甚大，此时警示相关人员可能有假冒的情况产生。
[0045]本发明所提出外拨特定人的对话系统，更加入了所谓的最佳打电话时间(BestTime To Call，底下简称BTTC)的技术，经过一段时间的纪录，观察受话者最适当的联络时间，使得拨打的成功率能够显著提升。例如有些客户可能固定每个礼拜二开会，所以礼拜二联络都无法成功。所以根据过去拨打的纪录，星期五早上都可以找到人，因此，这些纪录就可以做Best Time To Call(BTTC)的参考，使以后拨打的触达率提高。
[0046]根据上述内容，本发明提出一种语音对话系统，包括对话控制器、语音辨识模块与语音产生模块。此对话控制器用以取得特定人数据，并根据特定人数据与一接听人连通后，并根据特定人数据以产生一询问语音信号，并传送给接听人；其中，由接听人根据该询问语音信号进行回复后产生一回复语音信号，针对该回复语音信号进行辨识后，取得一语音对应信号，此语音对应信号可以是预录语音或是合成语音其中之一。根据该语音对应信号进行特定人身份确认流程，并根据特定人身份确认流程的结果(本人/非本人/不确定)产生一对话控制信号，并据以产生一响应语音信号，并由传送给接听人继续特定人身份确认流程或结束对话。，在确认接听人就是特定人后，进行信息传递程序，将对应于特定人的信息传送给接听人。底下将以实际的实施例说明本发明所提出外拨特定人的对话系统。
[0047]请参照图1，系绘示本发明的对话系统的实施例的系统方块示意图。此语音对话系统100包括对话系统110、数据库120、图形化使用者接口(⑶I) 130、拨接模块140、录音模块150、及服务网络160。如图所示，图形化使用者接口(GUI) 130、录音模块150由虚线所标示，主要是因为这个此模块为选择性的功能，在此加入一并说明，然并非以此为限。
[0048]此对话系统110包括对话控制器111、语音辨识模块112及语音产生模块113。上述的语音辨识模块112例如是自动语音辨识(Automatic Speech Recognit1n，如图所示的“ASR”)，而语音产生模块113例如是文字转语音(Text to Speech，如图所示的“TTS”)模块，此仅为了说明本实施例，另一种方式可以是从多笔预录语音中选取对应的语音，或是合成所需要的语音，并不以此为限。而上述的服务网络160，例如是一种整合服务数字网络(Integrated Service Digital Network，如图所不的“ISDN”)或是一种公共交换电信网络(Public Switched Telephone Network，如图所不的 “PSTN”)。
[0049]在对话系统110中，对话控制器111、语音辨识模块112及语音产生模块113互相连接。而数据库120与对话控制器111、图形化使用者接口 130及录音模块150互相连接。图形化使用者接口 130则与录音模块150相互连接。而拨接模块140则是与对话控制器111相互连接，并通过录音模块150连接到服务网络160。录音模块150则是与对话控制器111相互连接。
[0050]此语音对话系统100中，由数据库120提供需要联络的客户的人名及与其基本数据，如电话、性别、年龄等等。对话系统110经由拨接或是网络连接等方式与指定的客户构成通连。此构成通连的方式，在此实施例中是透过拨接模块140，但并非以此为限。此拨接模块140透过ISDN或PSTN等服务网络160外拨给指定的客户，录音模块150则是有录音需求时才需要加以录音。通常此录音模块150介于拨接模块140和服务网络160之间，若服务网络160为ISDN系统，则可分析在线的ISDN封包并自动加以录音，若服务网络160为PSTN系统的话，可能就以并接的方式由拨接模块140驱动，把外拨时在线录到的语音加以储存。
[0051]对话系统110基本上由语音辨识模块112来辨识理解所接收的对话(语音数据)，再由语音产生模块113合成提示句来提问和引导客户回答我们想问的问题。对话控制器111则负责整个对话流程的控制。对受话者各种不同回答时，都要做所相对应的系统应对。
[0052]拨接模块140可以由电话卡再加上电话流程分析软件(Call Progress analysis，简称CPA)所组成。负责外拨时对受话方的状态，例如拨通、挂电话、空号、忙线、停话、传真机、或是进入语音信箱、录音机以

完整全部详细技术资料下载

当前第2页1 2 3 4 5