说话人验证方法和系统及媒体资源控制实体和处理实体的制作方法

文档序号:6562342阅读:158来源:国知局
专利名称:说话人验证方法和系统及媒体资源控制实体和处理实体的制作方法
技术领域
本发明涉及通信技术领域,特别是涉及一种说话人验证的方法、 一种说 话人验证的系统一种媒体资源控制实体和一种媒体资源处理实体。
背景技术
说话人验证技术是通过分析说话人语音特征,与已经采样语音样本进行 特征匹配,根据匹配结果而进行身份验证的技术。该技术通过分析语音样本 的唯一特性,例如发音的频率等特性,来验证出说话的人。说话人验证技术 使得人们可以通过说话的噪音来控制能否出入限制性的区域,访问对身份敏
感的数据,如电话银行、数据库服务、语音邮件等。语音样本称为声波紋 (voic印rint),是作为验证标准的语音采样,通常为直接录制的用户语音。 目前标准组织因特网工程任务组(Internet Engineering Task Force, IETF)中说话-睑证(SPEECHSC)工作组定义了说话人验证(Speaker Identifier/Speaker Verified, SI/SV)的应用网络架构。IETF在RFC4313中 提到该技术的应用场景和建议架构,如图l所示,其中建议采用应用服务器 (Application Server, AS)控制业务,下层采用媒体处理单元支持媒体处理 功能和与客户端的媒体交互,通过附加的SI/SV服务器接收来自应用服务 器的说话人验证命令,并接收媒体资源处理实体发送的语音进行说话人验 证,然后把验证结果上报给AS。其中SI/SV服务器与AS及媒体处理单元 间通过专门定义的SPEECHSC协议进行有关说话人验证/验证的控制信令交 互。
在媒体控制与承载分离的系统中,通常由媒体资源控制实体和媒体资源 处理实体与AS交互实现媒体资源服务。如需要在媒体控制与承载分离的系
统中实现说话人验证技术,根据上述说话人验证的网络架构,需要在媒体控 制与承载分离的系统中设置上述SI/SV服务器,并要更改现有的协议结构, 对现有网络改动大,并且也造成了网络升级的成本很高。

发明内容
有鉴于此,本发明的主要目的在于提供一种说话人验证的方法和系统, 以及一种媒体资源控制实体和媒体资源处理实体,能够不改变媒体控制与承 载分离系统的网络架构实现说话人验证技术。
为实现上述目的,本发明提供了一种说话人验证方法,该方法包括
A、 媒体资源控制实体指示媒体资源处理实体进行说话人验证处理;
B、 媒体资源处理实体接收说话人的语音输入并进行验证,将验证结果 上报给媒体资源控制实体。
本发明还提供了 一种说话人验证系统,该系统包括媒体资源控制实体和 孑泉体资源处理实体;
媒体资源控制实体用于指示媒体资源处理实体进行说话人验证处理,以 及接收来自媒体资源处理实体的验证结果;
媒体资源处理实体用于接收说话人的语音输入并进行验证,以及将验证
结果上报给媒体资源控制实体。
本发明还提供了 一种媒体资源控制实体,该媒体资源控制实体中包括 说话人验证及业务信息交互模块、控制模块和媒体控制交互模块;其中,
说话人验证及业务信息交互模块用于接收说话人验证命令,并将该验证 命令传送给控制模块,以及将来自控制模块的验证结果返回给发送所述说话 人验证命令的设备;
控制模块用于根据来自说话人验证及业务信息交互模块的说话人验证 命令生成说话人验证请求,并将该验证请求传送给媒体控制交互模块;以及 接收来自媒体控制交互模块的说话人验证结果,并将该验证结果传递给说话 人验证及业务信息交互模块;
媒体控制交互模块用于接收来自控制模块的说话人验证请求,并将该请 求转化为媒体控制协议支持的格式发送给媒体资源处理实体;以及接收来自 媒体资源处理实体的媒体控制协议支持格式的验证结果,并进行协议转换处 理为控制模块能够识别的信息后发送给控制模块。
本发明还提供了一种媒体资源处理实体,该媒体资源处理实体包括媒 体控制交互模块和说话人验证模块;其中,
媒体控制交互模块用于接收来自媒体资源控制实体的媒体控制协议形 式的说话人验证请求,并将该说话人验证请求转换为说话人验证模块能够识 别的信息后发送给该说话人验证模块,以及接收来自说话人验证模块的验证 结果,并将该验证结果转换为媒体控制协议发送给媒体资源控制实体;
说话人验证模块用于根据来自媒体控制交互模块的说话人验证请求获 取对应的声波紋和接收用户的语音输入,并通过所述获取的声波紋对接收的 用户输入的语音进行验证确定验证结果,以及将验证结果发送给媒体控制交 互模块。
由上述方案可以看出,本发明中通过媒体资源控制实体指示媒体资源处 理实体进行说话人验证处理,媒体资源处理实体根据媒体资源控制实体的指 示接收说话人的语音输入并进行验证,将验证结果上报给媒体资源控制实 体,不需要改变现有的承载控制分离的网络架构和协议结构,即实现了说话 人验证技术,减少了网络升级的成本。


图1为现有技术中实现说话人验证技术的网络架构示意图; 图2为本发明具体实施例中实现说话人验证技术的系统组成示意图; 图3为本发明具体实施例中媒体资源控制实体和媒体资源处理实体的 内部组成示意图4为本发明具体实施例中一种示例的网络组成示意图; 图5为本发明具体实施例中说话人验证方法的总体流程图;图6为本发明具体实施例中说话人验证方法一种示例的具体流程图。
具体实施例方式
为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明 作进一步的详细描述。
本发明的主要思想是,由媒体资源控制实体指示媒体资源处理实体进行
说话人验证处理;媒体资源处理实体接收说话人的语音输入并进行验证,将 验证结果上报给媒体资源控制实体,从而实现说话人验证技术。
媒体资源控制实体可以在接收到包括说话人声波紋信息的说话人验证
命令后,根据该验证命令向媒体资源处理实体发送包括上述说话人声波紋信 息的验证请求;媒体资源处理实体获取上述声波紋信息对应的声波紋,通过 该声波紋,对根据验证请求接收的用户语音输入进行验证,并将验证结果返 回给媒体资源控制实体。
上述声波紋信息可以包括声波紋路径和声波紋名称,则媒体资源处理实 体可以根据这些信息获取对应的声波紋。声波紋路径可以是本地路径,也可 以是可访问的网络服务器路径。声波紋名称可以采用字符串,在上述声波紋 路径下,声波故名称唯一对应于一个声波紋文件。
上述媒体资源控制实体可以是媒体资源控制器(Multimedia Resource Function Controller, MRFC )或者媒体网关控制器(Media Gateway Controller, MGC ),对应地,媒体资源处理实体为媒体资源处理器(Multimedia Resource Function Processor, MRFP )或者々某体网关(Media Gateway, MG )。
以下通过具体实施例对本发明进行详细说明。
本发明提供的一种实现说话人验证的系统的具体实施例如图2所示,包 括媒体资源控制实体21和媒体资源处理实体22。
其中,媒体资源控制实体21用于指示媒体资源处理实体22进行说话人 验证处理。具体地,媒体资源控制实体21可以接收来自AS,或者来自其他 用于发送媒体资源服务请求设备的包括说话人声波紋信息的说话人验证命
令,根据该验证命令向媒体资源处理实体22发送包括上述说话人声波紋信 息的i兌话人-验iiUt求。
媒体资源处理实体22用于根据媒体资源控制实体21的指示接收说话人 的语音输入并进行语音验证处理,将验证结果上报给媒体资源控制实体21。 具体地,媒体资源处理实体22接收来自媒体资源控制实体21的说话人验证 请求,并根据该请求中的说话人声波紋信息获取对应的声波紋。
如图3所示,媒体资源控制实体21中具体又包括说话人验证及业务信 息交互模块211、控制模块212和媒体控制交互模块213。
其中,说话人验证及业务信息交互模块211用于从应用服务器或者其他 用于发送々某体资源服务请求的设备,如业务呼叫会话功能实体(Service-Call Session Control Function, S-CSCF ) 4妄收业务信息,即包括说话人声波紋信 息的说话人验证命令,并将该验证命令传送给控制模块212,以及将来自控 制模块212的验证结果信息返回给业务应用服务器或者其他用于发送媒体 资源服务请求设备。当然,说话人验证及业务信息交互模块211还用于控制 模块212与应用服务器或者上述其他设备进行其他业务信息的交互。
控制模块212用于控制业务处理过程中呼叫的流程交互和状态机,就本 实施例中,具体涉及根据来自说话人验证及业务信息交互模块211的说话人 验证命令生成说话人验证请求,并将该验证请求传送给媒体控制交互模块 213;以及接收来自媒体控制交互模块213的说话人验证结果信息,并将该 验证结果信息传递给说话人验证及业务信息交互模块211 。
媒体控制交互模块213用于接收来自控制模块212的信息,将该信息转 化为媒体控制协议消息例如H.248协议消息发送给媒体资源处理实体22; 以及接收来自媒体资源处理实体22的信息,并转换为控制模块212能够验 证的信息传送给控制模块212。在本实施例中具体涉及接收来自控制模块 212的说话人验证请求,并将该请求转化为媒体控制协议,如H.248支持的 格式发送给媒体资源处理实体22中的媒体控制交互模块221;以及接收来 自媒体资源处理实体22中媒体控制交互模块223的媒体控制协议支持格式
的验证结果信息,并进行协议转换处理为控制模块212能够验证的信息后发
送给控制模块212。以下以媒体控制协议为H.248协议为例进行说明。
如图3所示,媒体资源处理实体22中具体又包括说话人验证模块220 和媒体控制交互模块221。
其中,媒体控制交互模块221用于接收来自媒体资源控制实体的H.248 协议格式的信息,并转换为说话人验证模块220能够验证的信息后传送给说 话人验证模块220;以及将来自说话人验证冲莫块220的信息转换为H.248协 议的格式后发送给媒体资源控制实体。在本实施例中具体涉及到接收来自媒 体资源控制实体21的媒体控制交互模块213的H.248协议格式的说话人验 证请求转换为说话人验证模块220能够验证的信息后传送给说话人验证模 块220;以及接收来自说话人验证模块220的验证结果信息,并将该信息转 化为H.248协议支持的格式发送给媒体资源控制实体21中的媒体控制交互 模块213。
说话人验证模块220用于根据接收的来自媒体控制交互模块的说话人 验证请求信息获取对应的声波紋和接收用户的语音输入,并通过所述获取的 声波紋对接收的用户输入的语音进行验证确定验证结果,以及将验证结果发 送给媒体控制交互模块221。
具体地,上述说话人验证;溪块220中可以包括控制^f莫块222、说话人 验证处理引擎223、声波紋获取模块224和说话人声音接收模块225。
控制模块222用于控制业务处理过程中呼叫的流程交互和状态机。就本 实施例中,具体涉及根据来自媒体控制交互模块221的说话人验证请求通知 声波紋获取模块224获取对应的声波紋并将获取的声波紋传送给说话人验 证处理引擎223,和控制说话人声音接收模块225接收来自用户的语音输入, 并将该语音输入传送给说话人验证处理引擎223,以及控制说话人验证处理 引擎223根据其接收的声波紋和用户语音输入进行说话人验证,并接收说话 人验证处理引擎223验证后返回的验证结果信息,将该结果信息传送给媒体 控制交互模块221。
说话人验证处理引擎223,用于接收来自声波紋获取模块224的声波紋 和来自说话人声音接收模块225的用户语音输入,即说话人的语音数据,并 根据声学特征把获取的声波紋和接收的用户语音输入进行对比,从而生成验 证结果信息,并将该验证结果信息发送给控制模块222。
声波紋获取模块224用于根据控制模块222的控制获取对应的声波紋, 以及将获取的声波紋传送给说话人验证处理引擎223。上述的说话人验证请 求中均包括对应说话人验证命令中的声波紋信息,则这里控制模块222向声 波紋获取模块224发送包括声波紋信息的获取声波紋命令,声波紋获取模块 224根据该声波紋信息中声波紋路径和声波紋名称到对应的地址获取对应的 声波紋,然后将该获取的声波紋传送给说话人验证处理引擎223。
说话人声音接收模块225,用于根据控制模块222的命令接收用户的语 音输入,并将接收的语音传送给说话人验证处理引擎223。
本实施例中的媒体资源控制实体可以是MGC,则对应的媒体资源处理 实体为MG;媒体资源控制实体也可以是MRFC,则对应的媒体资源处理实 体为MRFP。
下面再通过一个示例来说明本实施例基于的网络架构。如图4所示,为 本实施例应用于IP多媒体子系统(IP Multimedia Subsystem, IMS )网络中 的网络架构,包4舌AS、 S-CSCF、 MRFC和MRFP,则MRFC通过S-CSCF 接收来自AS的说话人验证命令,根据该命令指示MRFP获取对应的声波紋 和用户语音输入并进行验证,以及将验证结果信息返回给S-CSCF。当然IMS 网络中还包括其他的实体,但由于与本发明实施例的关系不大,所以这里没 有示出。
本发明提供的 一种实现说话人验证的方法具体实施例的总体流程如图5 所示,主要包括以下步骤
步骤501、媒体资源控制实体指示媒体资源处理实体进行说话人验证处
理;
步骤502、媒体资源处理实体根据媒体资源控制实体的指示接收说话人 的语音输入并进行验证,将验证结杲上报给媒体资源控制实体。
上述媒体资源控制实体和媒体资源处理实体可以是MGC和MG,或者 是MRFC和MRFP。以下以本实施例应用于IMS网络架构中为例,即上述 媒体资源控制实体和媒体资源处理实体是MRFC和MRFP为例,详细说明 本实施例。如图6所示,本实施例应用于IMS网络架构时具体包括如下步 骤
步骤601、 MRFC与MRFP之间的承载通道建立后,MRFC接收来自 S-CSCF的说话人验证命令,该命令中包括说话人的声波紋信息。这里的声 波紋信息为对应用户声波紋的路径和名称。S-CSCF发送给MRFC的说话人 验证命令通常是来自AS的,另外,AS也可以直接向MRFC发送说话人验 证命令。
MRFC中具体可以包括说话人验证及业务信息交互模块、控制模块和媒 体控制交互模块。则本步骤具体包括说话人验证及业务信息交互模块直接 或通过S-CSCF接收来自AS的业务信息,即包括说话人声波紋信息的说话 人验证命令,并将该说话人验证命令传送给控制模块。
步骤602、 MRFC将接收的说话人验证命令转化为说话人验证请求,并 将该请求转化为H.248消息格式通过其与MRFP之间的Mp接口发送给 MRFP。
具体地,本步骤中,可以是MRFC中的控制模块根据接收的说话人验 证命令生成说话人验证请求,并将该验证请求传送给媒体控制交互模块,媒 体控制交互模块将该验证请求转化为H.248协议支持的格式发送给MRFP。
本步骤中的说话人验证请求可以采用H.248协议中的Mod.r叫消息,其 中包括该业务会话端点Tl的信息,信号的取值为说话人验证。另外,该请 求中具体还可以包括如下信息中的一项或多项
1)声波紋标识;即声波紋信息,包括声波紋的路径和名称,其中声波 紋存放的路径可以为本地服务器路径,也可以为网络服务器路径;声波紋名 称采用字符串,但声波紋名称在指定路径下要求具有唯一性; 2) 分数阈值;取值范围为0-100,用于MRFP根据该阈值确认说话人 验证是否成功,匹配结果分数大于等于这个数值时,认为验证成功;
3) 初始提示音;当开始用户验证之前播放的提示音,用户根据提示音 进行语音输入;
4) 验证成功提示音;当匹配结果分数大于等于分数阈值时,播放成功 提示音;
5) 验证失败提示音;当匹配结果分数小于分数阈值时,播放失败提示
音;
6) 无输入允许提示的最大次数;当没有接收到用户语音时,通过初始 提示音提示用户进行语音输入的最大次数;
7) 等待说话人语音输入的定时器最大时长;本参数用来指示等待语音 输入的最大时间,超时则按照验证失败处理;
8) 语音输入结束检测按键;用户可以通过按键结束语音输入,可以通 过初始提示音向用户通知具体按键。
上述说话人验证请求包括的信息中,除声波紋标识为来自说话人验证命 令的之外,其他均为根据预先设置在MRFC中的对应信息生成。
步骤603、 MRFP接收到说话人验证请求后,向MRFC返回Mod,resp 消息其中包括端点Tl的信息。
MRFP中具体可以包括媒体控制交互模块、控制模块、说话人验证处理 引擎、声波紋获取模块和说话人声音接收模块。则本步骤中,由MRFP中的 媒体控制交互模块接收上述H.248协议格式的说话人验证请求,并将该请求 转换为MRFP中的控制模块能够识别的信息后传送给该控制模块;MRFP的 控制模块根据接收到的请求生成Mod.resp消息作为响应,并通过MRFP的 媒体控制交互模块发送给MRFC。
步骤604、 MRFP进行验证处理,具体包括根据说话人验证请求中的声 波纹标识中的声波紋路径和声波紋名称获取对应的声波紋,如果没有获取到 声波紋则在步骤605通过Not.req消息向MRFC返回验证失败的信息或者返
回错误信息;如果获取到声波紋,则向用户播放初始提示音并等待用户输入,
接收到用户语音输入后,MRFP对用户输入的语音和获取的声波紋样本进行 对比得到验证结果分数,如果验证结果分数大于等于分数阈值,则向用户发 送验证成功^是示音,并在步骤605通过Not.req消息向MRFC返回验证成功 的信息;如果验证结果分数小于分数阈值,则向用户发送验证失败提示音, 并在步骤605通过Not.req消息向MRFC返回验证失败的信息。
本步骤中,控制模块根据来自媒体控制交互模块的说话人验证请求通知 声波紋获取模块获取对应的声波紋并将获取的声波紋传送给说话人验证处 理引擎,并控制说话人声音接收模块向用户播放初始提示音,和接收来自用 户的语音输入;这里如果在上述等待说话人语音输入的定时器最大时长之 前,说话人声音接收模块接收到用户的语音输入,则在接收到语音输入结束 检测按键,或者预先设定的输入时长到达后,将该语音输入传送给说话人验 证处理引擎;如果在上述等待说话人语音输入的定时器最大时长到达后,还 没有接收到用户的语音输入,则通知说话人验证处理引擎,确定验证失败; 控制模块还控制说话人验证处理引擎根据其接收的声波紋和用户语音输入 进行说话人验证,说话人验证处理引擎根据声学特征把获取的声波紋和接收 的用户语音输入进行对比,从而生成匹配结果分数,将该分数与说话人验证 请求中的分数阈值进行对比,如果匹配结杲分数大于或等于该分数阈值,则 确定验证成功,通过说话人声音接收模块向用户播放验证成功提示音;否则, 确定验证失败,通过说话人声音接收模块向用户播放验证失败提示音;说话 人验证处理引擎将验证成功或者验证失败的验证结果,或者进一步包括的其 他信息、如匹配结果分数、用户输入语音的时长、声波纹标识等验证结果信 息发送给控制模块,控制模块将这些信息传送给媒体控制交互模块。如果本 步骤中涉及的各模块均为MRFP中的模块。
步骤605、 MRFP向MRFC返回验证结果信息,具体可以通过Not.req 消息携带该验证结果信息。这里的验证结果信息至少包括验证是否成功的信 息,此外还可以包括如下信息中的 一 项或多项1) 匹配值,即匹配结果分数,分数值可以为0-100之间,100匹配最 好,0匹配最差;
2) 输入语音的时长;
3) 声波紋标识。
MRFP中的媒体控制交互模块将接收的验证结果信息转换为H.248协议 支持的格式,并发送给MRFC。
步骤606、 MRFC接收到验证结果信息后,向MRFP返回Not.resp消息
进行响应。
本步骤具体包括,MRFC中的媒体控制交互模块接收来自MRFP的验证 结杲信息,并进行协议转换处理为MRFC中的控制模块能够识别的信息后 发送给该控制模块,控制模块接收到该信息后,通过媒体控制交互模块向 MRFP返回H.248协议格式的Not.resp消息进行响应。
步骤607、 MRFC将接收到的验证结果信息转化为其与S-CSCF之间的 Mr接口支持的消息,并发送给S-CSCF, S-CSCF再将该验证结果信息发送 给AS。当然,这里MRFC也可以将验证结果信息不通过S-CSCF而直接发 送给AS。
MRFC中的控制模块将接收的来自媒体控制交互模块的验证结果信息, 传递给说话人验证及业务信息交互模块,说话人验证及业务信息交互模块根 据该验证结果信息直接或通过S-CSCF向AS返回-睑证结果信息。
由上述具体实施例中描述的方案可以看出,本发明通过^ 某体资源控制实 体指示媒体资源处理实体进行说话人验证处理,媒体资源处理实体根据媒体
资源控制实体的指示接收说话人的语音输入并进行验证,将验证结果上报给 媒体资源控制实体,不需要改变现有的承栽控制分离的网络架构和协议结 构,即实现了说话人验证技术,减少了网络升级的成本。
此外,本发明通过提供一种包括说话人验证及业务信息交互模块、控制 模块和媒体控制交互模块的媒体资源控制实体,实现了现有网络架构中的媒 体资源控制实体能够支持说话人验证处理。
并通过提供一种包括媒体控制交互模块和说话人验证模块的媒体资源 处理实体,实现了现有网络架构中的媒体资源处理实体能够支持说话人验证 处理。
以上是对本发明具体实施例的说明,在具体的实施过程中可对本发明的 方法进行适当的改进,以适应具体情况的具体需要。因此可以理解,根据本 发明的具体实施方式
只是起示范作用,并不用以限制本发明的保护范围。
权利要求
1、一种说话人验证方法,其特征在于,该方法包括A、媒体资源控制实体指示媒体资源处理实体进行说话人验证处理;B、媒体资源处理实体接收说话人的语音输入并进行验证,将验证结果上报给媒体资源控制实体。
2、 根据权利要求1所述的方法,其特征在于,所述步骤A包括 媒体资源控制实体根据接收的包括说话人声波紋信息的说话人验证命令,并向媒体资源处理实体发送包括上述说话人声波紋信息的验证请求。
3、 根据权利要求2所述的方法,其特征在于,所述步骤B包括 媒体资源处理实体根据所述验证请求获取所述声波紋信息对应的声波紋,通过该声波紋对4艮据所述验证请求接收的用户语音输入进行验证,并将 验证结果返回给媒体资源控制实体。
4、 根据权利要求2或3中任一所述的方法,其特征在于,所述声波紋 信息包括声波紋路径和声波紋名称。
5、 根据权利要求3所述的方法,其特征在于,所述验证请求中进一步 包括下述各参数用于媒体资源处理实体确定说话人验证是否成功的阈值、 初始提示音、验证成功提示音、验证失败提示音、无输入允许提示的最大次 数、等待说话人语音输入的定时器最大时长或语音输入结束检测按键;或者 进一步包括以上各参数的任意组合;对应地,所述步骤B中,媒体资源处理实体根据所述阈值和用户语音输入与所述声波紋匹配的 结果确定说话人验证是否成功,或根据所述初始提示音参数在验证前提示用 户进行验证语音的输入,或根据所述验证成功提示音参数在验证通过后,进 行验证成功提示放音,或根据所述验证失败提示音在验证失败后,进行验证 失败提示放音,或根据所述无输入允许提示的最大次数在检测到用户没有语 音输入后,进行多次提示放音,或根据所述等待说话人语音输入的定时器最 大时长确定等待用户的语音输入,根据在该最大时长范围内没有接收到用户 的语音输入确定验证失败,或根据接收到的用户输入的所述语音输入结束检 测按键确定用户语音输入结束,或者执行上述各个步骤的任意组合。
6、 根据权利要求3所述的方法,其特征在于,步骤B中所述的验证结 果包括验证是否成功。
7、 根据权利要求6所述的方法,其特征在于,所述验证结果中进一步 包括匹配值、输入语音的时长或声波紋信息,或以上各项的任意组合。
8、 根据权利要求3所述的方法,其特征在于,如杲所述媒体资源处理 实体根据所述验证请求没有获取到所述声波紋信息对应的声波紋,则媒体资源处理实体向媒体资源控制实体上报错误信息,然后结束该流程。
9、 一种说话人验证系统,其特征在于,该系统包括媒体资源控制实体 和媒体资源处理实体;媒体资源控制实体用于指示媒体资源处理实体进行说话人验证处理,以 及接收来自媒体资源处理实体的验证结果;媒体资源处理实体用于接收说话人的语音输入并进行验证,以及将验证 结果上报给媒体资源控制实体。
10、 根据权利要求9所述的系统,其特征在于,该系统中进一步包括 业务服务器,用于向媒体资源控制实体发送说话人验证命令,以及接收媒体资源控制实体返回的验证结果;所述媒体资源控制实体接收所述说话人验证命令,并根据该验证命令生 成对应的说话人验证请求发送给媒体资源处理实体,且进一步将接收到的来 自媒体资源处理实体的验证结果上报给业务服务器。
11、 根据权利要求10所述的系统,其特征在于,该系统进一步包括业务呼叫会话控制功能实体,连接在应用服务器和媒体资源控制实体之间,用于接收来自应用服务器的说话人验证命令,并将该命令发送给媒体资源控 制实体,和接收来自媒体资源控制实体的验证结果,并将验证结果发送给应用服务器。
12、 根据权利要求9至11中任一所述的系统,其特征在于,所述的媒 体资源控制实体为媒体资源控制器,所述的媒体资源处理实体为媒体资源处理器;或者所述媒体资源控制实体为媒体网关控制器,所述的媒体资源处理 实体为媒体网关。
13、 一种媒体资源控制实体,其特征在于,该媒体资源控制实体中包括 说话人验证及业务信息交互模块、控制模块和媒体控制交互模块;其中,-乾话人验证及业务信息交互才莫块用于接收说话人验证命令,并将该验证 命令传送给控制模块,以及将来自控制模块的验证结果返回给发送所述说话 人验证命令的设备;控制模块用于根据来自说话人验证及业务信息交互模块的说话人验证 命令生成说话人验证请求,并将该验证请求传送给媒体控制交互模块;以及 接收来自媒体控制交互模块的说话人验证结果,并将该验证结果传递给说话 人验证及业务信息交互模块;媒体控制交互模块用于接收来自控制模块的说话人验证请求,并将该请 求转化为媒体控制协议支持的格式发送给媒体资源处理实体;以及接收来自 媒体资源处理实体的媒体控制协议支持格式的验证结果,并进行协议转换处 理为控制模块能够识别的信息后发送给控制模块。
14、 根据权利要求13所述媒体资源控制实体,其特征在于,所述媒体 资源控制实体为媒体资源控制器或媒体网关控制器。
15、 一种媒体资源处理实体,其特征在于,该媒体资源处理实体包括 媒体控制交互模块和说话人验证模块;其中,媒体控制交互模块用于接收来自媒体资源控制实体的媒体控制协议形 式的说话人验证请求,并将该说话人验证请求转换为说话人验证模块能够识 别的信息后发送给该说话人验证模块,以及接收来自说话人验证模块的验证 结果,并将该验证结果转换为媒体控制协议消息发送给媒体资源控制实体;说话人验证模块用于根据来自媒体控制交互模块的说话人验证请求获 取对应的声波紋和接收用户的语音输入,并通过所述获取的声波紋对接收的用户输入的语音进行验证确定验证结果,以及将验证结果发送给媒体控制交 互模块。
16、 根据权利要求15所述的々某体资源处理实体,其特征在于,所述说 话人验证模块中包括控制模块、说话人验证处理引擎、声波紋获取模块和 说话人声音接收模块;其中,控制模块用于根据来自媒体控制交互模块的说话人验证请求通知声波 紋获取模块获取对应的声波紋,并将获取的声波紋传送给说话人验证处理引 擎,和控制说话人声音接收模块接收来自用户的语音输入,并将该语音输入 传送给说话人验证处理引擎,以及控制说话人验证处理引擎根据其接收的声 波紋和用户语音输入进行说话人验证,并接收说话人验证处理引擎验证后返 回的验证结果,将该验证结果传送给媒体控制交互模块;说话人验证处理引擎用于接收来自声波紋获取模块的声波紋和来自说 话人声音接收模块的用户语音输入,并根据声学特征把获取的声波紋和接收 的用户语音输入进行对比,生成验证结果,并将该验证结果发送给控制模块;声波紋获取模块用于根据控制模块的控制获取对应的声波紋,以及将获 取的声波紋传送给说话人验证处理引擎;说话人声音接收模块用于根据控制模块的命令接收用户的语音输入,并 将接收的语音传送给说话人验证处理引擎。
17、 根据权利要求15或16所述的媒体资源处理实体,其特征在于,所 述媒体资源处理实体为媒体资源处理器或媒体网关。
全文摘要
本发明公开了一种说话人验证方法,该方法包括A.媒体资源控制实体指示媒体资源处理实体进行说话人验证处理;B.媒体资源处理实体接收说话人的语音输入并进行验证,将验证结果上报给媒体资源控制实体。本发明还公开了一种说话人验证系统、一种媒体资源控制实体和一种媒体资源处理实体。本发明中通过上述方案,不改变现有的承载控制分离的网络架构,即实现了说话人验证技术。
文档编号G06F21/32GK101192925SQ200610140308
公开日2008年6月4日 申请日期2006年11月20日 优先权日2006年11月20日
发明者许志勇 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1