基于多人语音游戏处理方法和装置与流程

文档序号：14696450发布日期：2018-06-15 21:34阅读：297来源：国知局

导航： X技术> 最新专利>休闲,运动,玩具,娱乐用品的装置及其制品制造技术

本申请涉及语音处理技术领域，尤其涉及一种基于多人语音游戏处理方法和装置。

背景技术：

随着互联网技术的发展，手游端的国战类、竞技类等游戏流行，其中，尤其是多人游戏语音的需求越来越强烈，在多人语音游戏中多个参与游戏的用户可以进行语音的交互，从而提高用户游戏的真实感。

然而，当多个玩家同时开语音时，往往多个语音混杂，难以抓取某个特定的语音，难以听清队友的语音或者是领队的语音信息，从而导致用户在游戏中的合作受到影响，提供的游戏服务质量不高。

申请内容

本申请提供一种基于多人语音游戏处理方法和装置，以解决现有技术中，由于其他用户语音信息的干扰，导致难以听清目标用户的语音信息的技术问题。

本申请实施例提供一种基于多人语音游戏处理方法，包括以下步骤：在网络游戏过程中，获取多个用户在同一时刻输入的多个语音信息；对所述多个语音信息进行声纹处理，提取每个用户的声纹特征；将预存的目标声纹特征与所述每个用户的声纹特征进行匹配，获取与所述目标声纹特征匹配成功的目标用户；从所述多个语音信息中筛选出所述目标用户的语音信息，播放给接收用户。

本申请另一实施例提供一种基于多人语音游戏处理装置，包括：第一获取模块，用于在网络游戏过程中，获取多个用户在同一时刻输入的多个语音信息；提取模块，用于对所述多个语音信息进行声纹处理，提取每个用户的声纹特征；第二获取模块，用于将预存的目标声纹特征与所述每个用户的声纹特征进行匹配，获取与所述目标声纹特征匹配成功的目标用户；播放模块，用于从所述多个语音信息中筛选出所述目标用户的语音信息，播放给接收用户。

本申请又一实施例提供一种计算机设备，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时，实现上述实施例所述的基于多人语音游戏处理方法。

本申请还一实施例提供一种非临时性计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如本申请上述实施例所述的基于多人语音游戏处理方法。

本申请实施例提供的技术方案可以包括以下有益效果：

在网络游戏过程中，获取多个用户在同一时刻输入的多个语音信息，对多个语音信息进行声纹处理，提取每个用户的声纹特征，将预存的目标声纹特征与每个用户的声纹特征进行匹配，获取与目标声纹特征匹配成功的目标用户，进而，从多个语音信息中筛选出目标用户的语音信息，播放给接收用户。由此，保证了在多人语音场景下筛选出目标用户的语音信息进行播放，避免了其他用户语音信息的干扰。

本申请附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本申请的实践了解到。

附图说明

本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1是根据本申请一个实施例的基于多人语音游戏处理方法的流程图；

图2是根据本申请另一个实施例的基于多人语音游戏处理方法的流程图；

图3是根据本申请另一个实施例的基于多人语音游戏处理的场景示意图；

图4是根据本申请又一个实施例的基于多人语音游戏处理的场景示意图；

图5是根据本申请一个实施例的基于多人语音游戏处理装置的结构示意图；

图6是根据本申请另一个实施例的基于多人语音游戏处理装置的结构示意图；

图7是是根据本申请一个实施例的计算机设备的结构框图。

具体实施方式

下面详细描述本申请的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本申请，而不能理解为对本申请的限制。

下面参考附图描述本申请实施例的基于多人语音游戏处理方法和装置。

其中，本申请实施例的基于多人语音游戏处理方法的执行主体可以是客户端对应的计算机设备，比如可以是手机、平板电脑、个人数字助理、穿戴式设备等具有游戏运行功能的硬件设备。该穿戴式设备可以是智能手环、智能手表、智能眼镜等，基于多人语音游戏处理方法的执行主体也可以是服务器等。

图1是根据本申请一个实施例的基于多人语音游戏处理方法的流程图，如图1所示，该方法包括：

步骤101，在网络游戏过程中，获取多个用户在同一时刻输入的多个语音信息。

在现有技术中，在多人网络游戏中，多个用户组成一个游戏队进行协同作战，每个用户控制队伍中的一个角色，在多人网络游戏中，为了更好的协同作战，增加游戏参与的真实感，会为每个用户提供语音输入通道，以便于多个用户通过各自的语音通道进行语音的输入，进而实现多人语音交互，然而，当多个用户在同一时刻输入多个语音信息时，多个用户输入的语音信息会互相干扰，反而无法起到协同作战的效果。

其中，根据应用场景的不同，上述接收用户输入语音的语音通道可以通过不同的设备进行实现，比如，可以通过耳挂式耳机的麦克风接收等。

具体地，为了便于对多个互相干扰的语音信息的进一步处理，在网络游戏过程中，获取多个用户在同一时刻输入的多个语音信息。

需要说明的是，在不同的应用场景下，判定当前时刻是否为多个用户输入多个语音的实现方式不同，作为一种可能的实现方式，始终监控采集的语音信息，并获取语音信息的音频特征信息，比如音色信息、音频信息等，如果根据音频特征信息判断包含两种及两种以上的音频特征信息时，则确定当前时刻为多个用户输入多个语音的场景。

作为另一种可能的实现方式，当前时刻每个用户的客户端监控是否获取到输入的语音信息，并根据监控情况生成并发送语音采集标识，比如，如果采集到语音信息则生成并发送“1”，如果没有集到语音信息则生成并发送“0”，从而当接收到两个及两个以上对应于采集到语音信息的语音采集标识，则定当前时刻为多个用户输入多个语音的场景。

步骤102，对多个语音信息进行声纹处理，提取每个用户的声纹特征。

具体地，声纹是用电声学仪器显示的携带言语信息的声波频谱，人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程，人在讲话时使用的发声器官--舌、牙齿、喉头、肺、鼻腔在尺寸和形态方面每个人的差异很大，所以任何两个人的声纹图谱都有差异，因此，本申请的实施例中，通过对多个语音信息进行声纹处理，提取出每个用户的声纹特征，对多个语音信息进行声纹处理并提取每个用户的声纹特征的方式包括但不限于以下方式：

作为一种可能的实现方式：

基于小波包变换进行声纹提取，小波包变换利用人耳的听觉特性将一帧语音信号进行5层分解，提取其中的17处节点的小波包系数，对各节点处的小波包系数分别进行能量求和，取对数，求得的值组成一行向量，DCT变换后，根据DCT变换值进行声纹特征的提取。

作为另一种可能的实现方式，根据大量实验数据构建注册游戏的用户声纹特征模型库和，根据多人语音信息进行声谱图的转换，将多人语音信息进行转换并将转换结果进行CNN声纹特征提取，从CNN参数中读取CNN参数结合转换结果进行声纹特征提取。

步骤103，将预存的目标声纹特征与每个用户的声纹特征进行匹配，获取与目标声纹特征匹配成功的目标用户。

可以理解，预先存储当前网络游戏场景下希望清晰播放的目标用户的目标声纹特征，进而，在获取每个用户的声纹特征后，将预存的目标声纹特征与每个用户的声纹特征进行匹配，将匹配度超过一定值的声纹特征对应的用户作为目标用户。

在实际执行过程中，预存的目标声纹的获取方式不同，下面示例说明：

第一种示例：

如图2所示，预存的目标声纹的获取方式包括：

步骤201，获取用户输入的语音信息。

步骤202，解析语音信息进行语义分析识别目标语音信息。

步骤203，从目标语音信息中提取目标声纹特征并存储。

具体地，预先设置目标用户对应的角色的目标语音信息，该目标语音信息可以是关键词等，比如，当目标用户对游戏队中的队长，则目标语音信息对应的关键词为“我是队长”、“我是leader”、“这场比赛听我的”等，又比如，目标用户是当前A队伍中的多个成员时，目标语音信息对应的关键词为“我是A队的…”等。

进而，在本示例中，可以通过解析用户输入的语音信息，进行语义分析识别目标语音信息，从目标语音信息中提取目标声纹特征并存储完成预存的目标声纹的获取。

在一些可能的示例中，可以解析语音信息进行语义分析，判断是否包含预设的关键词，若判断获知包含关键词，则识别为目标语音信息。

举例而言，当网络游戏场景只需要听清队长的语音号令，则解析用户A输入的语音信息为“我是队长”，根据该语音信息行语义分析识别目标语音信息为用户A的语音信息，进而，提取用户A声纹特征并存储完成预存的目标声纹的获取，以保证在后续游戏中，仅仅播放用户A的语音信息给其他用户。

第二种示例：

在该示例中，在游戏开始时，为相关目标用户提供语音输入提示框，获取用户根据该提示框输入的语音信息的目标声纹特征进行存储，以保证在游戏过程中，仅仅播放目标用户的语音信息给其他用户。

举例而言，当网络游戏场景只需要听清队长的语音号令，则在参与游戏的相关用户选定角色后，为队长角色对应的客户端推送语音输入提示框，获取用户根据该提示框输入的语音信息，提取该用户声纹特征并存储完成预存的目标声纹的获取，以保证在后续游戏中，仅仅播放队长角色对应的语音信息给其他用户。

步骤104，从多个语音信息中筛选出目标用户的语音信息，播放给接收用户。

具体地，在匹配出目标用户后，从多个语音信息中筛选出目标用户的语音信息，播放给接收用户，由此，接收用户可以清晰的听到目标用户的语音信息，提高了游戏体验。

应当理解的是，本申请的实施例中，从多个语音信息中筛选出目标用户的语音信息，播放给接收用户，避免了其他语音信息对目标用户的语音信息的干扰，这种筛选并播放的方式相比较于直接线性放大多个语音信息，不依赖用户人耳进行目标用户的语音分辨，能够为用户提供更加轻松的游戏体验。

其中，应当理解的是，在不同的应用场景下，从多个语音信息中筛选出目标用户的语音信息的实现方式不同，示例说明如下：

第一种方式：

将多个语音信息中其他用户的语音信息过滤掉，保留目标用户的语音信息传输给接收用户。

举例而言，当基于多人语音游戏处理方法的执行主体为服务器时，如图3所示，当用户1-5组队进行网络游戏时，该网络游戏由担任队长角色的用户1指挥，从而只需要获取用户1的语音信息播放给其他用户，因而，在本示例中，将获取的同一时刻的语音信息中的用户2-5的语音信息被服务器过滤掉，服务器仅仅将用户1的语音信息播放给其他用户，提高了用户的游戏体验。

第二种方式：

根据用户标识关闭用于传输多个语音信息中其他用户语音信息的语音通道，开启传输目标用户语音信息语音通道，将语音信息传输给接收用户。

其中，用户标识可以为用户的游戏ID、安装游戏客户端的终端设备ID等能标注游戏用户的唯一性的信息。

举例而言，当基于多人语音游戏处理方法的执行主体为用户游戏的客户端时，如图4所示，用户1-5组队进行网络游戏时，该网络游戏由担任队长角色的用户1指挥，从而只需要获取用户1的语音信息播放给其他用户，因而，在本示例中，根据用户1-5的用户标识关闭多个语音信息中用户2-5的语音通道，不接收用户2-5的语音信息，仅仅开启用户1的语音通道，从而保证了用户的游戏体验。

基于以上描述，还需要强调的是，本申请的基于多人语音游戏处理方法，主要用于解决在同一时刻由于输入多个语音信息时造成目标用户的语音不清晰的技术问题，当同一时刻单人输入语音信息时，可以正常播放，也可以始终正常播放目标用户的语音信息，在此不作限制。

综上所述，本申请实施例的基于多人语音游戏处理方法，在网络游戏过程中，获取多个用户在同一时刻输入的多个语音信息，对多个语音信息进行声纹处理，提取每个用户的声纹特征，将预存的目标声纹特征与每个用户的声纹特征进行匹配，获取与目标声纹特征匹配成功的目标用户，进而，从多个语音信息中筛选出目标用户的语音信息，播放给接收用户。由此，保证了在多人语音场景下筛选出目标用户的语音信息进行播放，避免了其他用户语音信息的干扰。

为了实现上述实施例，本申请还提出了一种基于多人语音游戏处理装置，图5是根据本申请一个实施例的基于多人语音游戏处理装置的结构示意图，如图5所示，该装置包括：第一获取模块100、提取模块200、第二获取模块300和播放模块400。

其中，第一获取模块100，用于在网络游戏过程中，获取多个用户在同一时刻输入的多个语音信息。

提取模块200，用于对多个语音信息进行声纹处理，提取每个用户的声纹特征。

第二获取模块300，用于将预存的目标声纹特征与每个用户的声纹特征进行匹配，获取与目标声纹特征匹配成功的目标用户。

播放模块400，用于从多个语音信息中筛选出目标用户的语音信息，播放给接收用户。

在本申请的一个实施例中，播放模块400将多个语音信息中其他用户的语音信息过滤掉，保留目标用户的语音信息传输给接收用户。

进一步地，在本申请的一个实施例中，如图6所示，该装置还包括第三获取模块500和解析模块600，其中，第三获取模块500，用于获取用户输入的语音信息。

解析模块600，用于解析语音信息进行语义分析识别目标语音信息。

在本实施例中，提取模块200，还用于从所述目标语音信息中提取目标声纹特征并存储。

需要说明的是，前述对方法实施例的描述，也适用于本申请实施例的装置，其实现原理类似，在此不再赘述。

综上所述，本申请实施例的基于多人语音游戏处理装置，在网络游戏过程中，获取多个用户在同一时刻输入的多个语音信息，对多个语音信息进行声纹处理，提取每个用户的声纹特征，将预存的目标声纹特征与每个用户的声纹特征进行匹配，获取与目标声纹特征匹配成功的目标用户，进而，从多个语音信息中筛选出目标用户的语音信息，播放给接收用户。由此，保证了在多人语音场景下筛选出目标用户的语音信息进行播放，避免了其他用户语音信息的干扰。

为了实现上述实施例，本申请还提出了一种计算机设备，图7示出了适于用来实现本申请实施方式的示例性计算机设备的框图。图7显示的计算机设备12仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图7所示，计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于：一个或者多个处理器或者处理单元16，系统存储器28，连接不同系统组件(包括系统存储器28和处理单元16)的总线18。

总线18表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(Industry Standard Architecture；以下简称：ISA)总线，微通道体系结构(Micro Channel Architecture；以下简称：MAC)总线，增强型ISA总线、视频电子标准协会(Video Electronics Standards Association；以下简称：VESA)局域总线以及外围组件互连(Peripheral Component Interconnection；以下简称：PCI)总线。

计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

存储器28可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(Random Access Memory；以下简称：RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，存储系统34可以用于读写不可移动的、非易失性磁介质(图7未显示，通常称为“硬盘驱动器”)。尽管图7中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如：光盘只读存储器(Compact Disc Read Only Memory；以下简称：CD-ROM)、数字多功能只读光盘(Digital Video Disc Read Only Memory；以下简称：DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本申请各实施例的功能。

具有一组(至少一个)程序模块42的程序/实用工具40，可以存储在例如存储器28中，这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本申请所描述的实施例中的功能和/或方法。

计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信，还可与一个或者多个使得用户能与该计算机系统/服务器12交互的设备通信，和/或与使得该计算机系统/服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且，计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(Local Area Network；以下简称：LAN)，广域网(Wide Area Network；以下简称：WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白，尽管图中未示出，可以结合计算机设备12使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

处理单元16通过运行存储在系统存储器28中的程序，从而执行各种功能应用以及数据处理，例如实现前述实施例中提及的方法。

为了实现上述实施例，本申请还提出一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如前述实施例所述的基于多人语音游戏处理方法。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本申请的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本申请的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式光盘只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如，如果用硬件来实现和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本申请各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本申请的限制，本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨宗业
技术所有人：广东欧珀移动通信有限公司
我是此专利的发明人

上一篇：一种XYZ三向自动精密调节机构的制作方法
上一篇：一种钢结构切割装置的制作方法