语音控制方法及系统的制作方法

文档序号:10552659阅读:449来源:国知局
语音控制方法及系统的制作方法
【专利摘要】一种语音控制方法及系统,该方法包括:识别电子设备的当前用户;获取当前用户的个性化语音参数;检测待播放音频的原始语音参数;根据当前用户的个性化语音参数及待播放音频的原始语音参数控制待播放音频的输出语音参数。通过本发明能让用户享受一致并习惯的语音,以及免受瞬间强音量对耳朵的伤害,提高了用户体验。
【专利说明】
语音控制方法及系统
技术领域
[0001] 本发明涉及声音处理技术领域,尤其涉及一种语音控制方法及系统。
【背景技术】
[0002] 目前电子设备都不能根据音频信号自动控制语音参数的改变,例如,调整音量的 大小。用户通常只能设置一个默认的最高音量。在用户使用电子设备时(如看电影或者打电 话时),当突然收听到一个响度比较高的声音进入用户的耳朵时,瞬间的高音可能对用户的 耳朵造成伤害。此外,当前的电子设备不允许用户根据自己的日常习惯设置音量值,降低了 用户体验。

【发明内容】

[0003] 鉴于以上内容,有必要提供一种语音控制方法及系统,能让用户享受一致并习惯 的语音,以及免受瞬间高音对耳朵的伤害,提高了用户体验。
[0004] -种语音控制方法,应用于电子设备,所述方法包括:
[0005] 识别电子设备的当前用户;
[0006] 获取所述当前用户的个性化语音参数;
[0007] 检测待播放音频的原始语音参数;及
[0008] 根据所述当前用户的个性化语音参数及所述待播放音频的原始语音参数控制所 述待播放音频的输出语音参数。
[0009] 根据本发明一优选实施例,所述当前用户的个性化语音参数通过以下方式中的至 少一种获取:
[0010] 读取预先存储于所述电子设备中与所述当前用户对应的个性化语音参数;或 [0011]提示所述当前用户通过所述电子设备的语音调节功能设置语音参数,将所设置的 语音参数确认为所述当前用户的个性化语音参数;或
[0012] 通过播放示例音频来获取所述当前用户的个性化语音参数。
[0013] 根据本发明一优选实施例,所述方法还包括:
[0014] 获取所述当前用户在预设时间段内播放音频时设置的语音参数;及
[0015] 根据所述设置的语音参数更新所述当前用户的个性化语音参数。
[0016] 根据本发明一优选实施例,所述原始语音参数包括原始音量,所述个性化语音参 数包括个性化音量,所述输出语音参数包括输出音量,所述控制所述待播放音频的输出语 音参数包括:
[0017] 当所述待播放音频的原始音量大于所述当前用户的个性化音量时,根据所述当前 用户的个性化音量,降低所述待播放音频的原始音量,将降低后的音量确定为所述待播放 音频的输出音量;
[0018] 当所述待播放音频的原始音量不大于所述当前用户的个性化音量时,根据预先设 置的下限音量及所述当前用户的个性化音量确定所述待播放音频的输出音量。根据本发明 一优选实施例,所述原始语音参数包括原始音量,所述个性化语音参数包括个性化音量,所 述控制所述待播放音频的输出语音参数包括:
[0019] 当所述待播放音频的原始音量大于预先设置的上限音量时,根据所述当前用户的 个性化音量确定所述待播放音频的输出音量;
[0020] 当所述待播放音频的原始音量不大于上限音量,根据预先设置的下限音量及所述 当前用户的个性化音量确定所述待播放音频的输出音量。
[0021 ] -种语音控制系统,所述系统包括:
[0022]识别模块,用于识别电子设备的当前用户;
[0023]获取模块,用于获取所述当前用户的个性化语音参数;
[0024]检测模块,用于检测待播放音频的原始语音参数;及
[0025] 控制模块,用于根据所述当前用户的个性化语音参数及所述待播放音频的原始语 音参数控制所述待播放音频的输出语音参数。
[0026] 根据本发明一优选实施例,所述当前用户的个性化语音参数通过以下方式中的至 少一种获取:
[0027] 读取预先存储于所述电子设备中与所述当前用户对应的个性化语音参数;或
[0028] 提示所述当前用户通过所述电子设备的语音调节功能设置语音参数,将所设置的 语音参数确认为所述当前用户的个性化语音参数;或
[0029] 通过播放示例音频来获取所述当前用户的个性化语音参数。根据本发明一优选实 施例,所述系统还包括:
[0030] 获取所述当前用户在预设时间段内播放音频时设置的语音参数;及
[0031] 根据所述设置的语音参数更新所述当前用户的个性化语音参数。
[0032] 根据本发明一优选实施例,所述原始语音参数包括原始音量,所述个性化语音参 数包括个性化音量,所述输出语音参数包括输出音量,所述控制所述待播放音频的输出语 音参数包括:
[0033]当所述待播放音频的原始音量大于所述当前用户的个性化音量时,根据所述当前 用户的个性化音量,降低所述待播放音频的原始音量,将降低后的音量确定为所述待播放 音频的输出音量;
[0034]当所述待播放音频的原始音量不大于所述当前用户的个性化音量时,根据预先设 置的下限音量及所述当前用户的个性化音量确定所述待播放音频的输出音量。
[0035] 根据本发明一优选实施例,所述原始语音参数包括原始音量,所述个性化语音参 数包括个性化音量,所述控制所述待播放音频的输出语音参数包括:
[0036] 当所述待播放音频的原始音量大于预先设置的上限音量时,根据所述当前用户的 个性化音量确定所述待播放音频的输出音量;
[0037] 当所述待播放音频的原始音量不大于上限音量,根据预先设置的下限音量及所述 当前用户的个性化音量确定所述待播放音频的输出音量。
[0038] 由以上技术方案可以看出,本发明通过设置个性化语音参数,让用户享受一致并 习惯的语音,以及免受瞬间强音量对耳朵的伤害。此外,本发明还能够根据用户收听音频的 音量来自动更新个性化语音参数,提高了用户体验。
【附图说明】
[0039] 图1是本发明一种语音控制系统的结构示意图。
[0040] 图2是本发明一种语音控制方法的较佳实施例的流程图。
[0041] 图3是本发明一种语音控制系统又一结构示意图。
[0042]主要元件符号说明

【具体实施方式】
[0044] 为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对 本发明进行详细描述。如图1所示,是本发明语音控制系统的结构示意图。如该图所示,一个 电子设备1000包括语音控制系统10。该电子设备1000还包括存储器20、处理器30及输出器 40 〇
[0045] 优选地,所述语音控制系统10包含于播放控制插件中。所述播放控制插件可被加 载至各类操作系统、软件、应用(APP)等可独立运行的程序中,以使被加载程序能够控制待 播放音频执行如本发明所述的相应处理。
[0046] 更优选地,可通过将现有的插件与该语音控制系统10相结合来构成所述播放控制 插件,例如,在现有的微信插件中包含该语音控制系统10,以获得该播放控制插件等。
[0047] 优选地,本发明的方法通过包含于电子设备1000中的语音控制系统10来实现。所 述电子设备1〇〇〇包括一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息 处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列 (FPGA)、数字处理器(DSP)、嵌入式设备等。所述电子设备1000还可包括网络设备和/或用户 设备。其中,所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组 或基于云计算(Cloud Computing)的由大量主机或网络服务器构成的云,其中,云计算是分 布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。所述用户设备 包括但不限于任何一种可与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人 机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理PDA、游戏机或交 互式网络电视IPTV等。其中,所述用户设备及网络设备所处的网络包括但不限于互联网、广 域网、城域网、局域网、虚拟专用网络VPN等。
[0048] 所述语音控制系统10用于通过设置用户的个性化语音参数,对收听的音频的语音 参数进行处理,让用户享受一致并习惯的语音,以及免受瞬间强音量对耳朵的伤害,提高了 用户的体验。
[0049] 所述存储器20用于存储所述音量控制系统10中各个程序段的程序代码。该存储器 20可以为智能媒体卡(smart media card)、安全数字卡(secure digital card)、快闪存储 器卡(flash card)等储存设备。所述存储器10中存储着至少一个用户的用户信息及该用户 的个性化语音参数。所述用户信息包括但不限于,用户登录电子设备的账号及密码,用户的 指纹信息,用户的声音信息,用户的图像信息,用户的其他生物特征信息(如人脸特征等)、 电子设备1〇〇〇的信息(如设备型号等)。所述个性化语音参数包括但不限于,个性化音量、个 性化音色等参数。其中,个性化音量可以是用户感觉舒服的音量值,也可以是用户习惯的音 量值。
[0050] 所述处理器30可以是由一个或者多个微处理器、数字处理器(DSP)组成。所述输出 器40可以是扬声器、麦克风、耳机等。
[0051] 如图2所示,是本发明语音控制方法的较佳实施例的流程图。根据不同的需求,该 流程图中步骤的顺序可以改变,某些步骤可以省略。
[0052] S10,识别电子设备的当前用户。
[0053]在本实施例中,根据存储于存储器20中的用户信息确认当前用户的身份。在确认 当前用户的身份时,可以获取该当前用户的指纹,利用指纹识别技术,将获取的指纹特征与 所存储的指纹信息进行比对以确认当前用户。对当前用户的身份的确认也可以通过获取用 户的声音,利用声音识别技术,将获取的声音特征与所存储的声音信息进行比对来实现。进 一步地,对当前用户的身份的确认还可以通过获取用户的图像,利用图像识别技术,将获取 的图像与所存储的图像信息进行比对来实现。当所述电子设备1000设置有密码登录时,对 当前用户的身份的确认也可以根据用户登录所述电子设备1000的账号密码来实现。在其他 实施例中,确认当前用户身份的方法可以是上述方法中的一种或者多种方法的组合。
[0054] 若经过上述比对,确认该当前用户的用户信息并未存储于所述存储器20时,确认 该当前用户为新用户,并将该新用户的用户信息存储至所述存储器20中。
[0055] S11,获取当前用户的个性化语音参数。
[0056] 所述电子设备1000可以有一个或者多个用户,例如,在一个家庭中,一个平板电脑 可以有多个家庭成员使用,每个家庭成员在收听音频时的个性化音量也会根据各个人的习 惯而有所不同。
[0057] 所述个性化语音参数包括但不限于,个性化音量,个性化音色等。
[0058] 在本实施例中,获取当前用户的个性化语音参数的方法包括以下方式中的至少一 种:
[0059] (1)读取预先存储于所述存储器20中的与当前用户对应的个性化语音参数。在收 听音频时,用户可以将自己感觉比较舒适的语音信息保存为个性化语音参数。
[0060] (2)当存储器20中没有当前用户的个性化语音参数时,提示当前用户通过电子设 备1 000的音量调节功能设置语音参数,将所设置的语音参数确认为当前用户的个性化语音 参数。
[0061] 后续用户会利用电子设备1000收听各类音频,每个音频播放时可能会有不同的语 音参数。通过获取当前用户在预设时间段内(如:一周)播放音频时选择的多个语音参数可 以对当前用户的个性化语音参数进行更新。具体为:获取预设时间段内当前用户播放音频 的多个语音参数,根据获取的多个语音参数生成新的语音参数,例如计算所获取的多个音 量值的平均值,将该平均值确认为新的音量值。若当前用户确认该新的语音参数可以作为 其个性化语音参数时,根据该新的语音参数更新该当前用户的个性化语音参数。若当前用 户确认该新的语音参数不能作为其个性化语音参数时,在预设区间范围内自动调节该新的 语音参数,直至当前用户确认所生成的新的语音参数可以作为其更新的个性化语音参数。
[0062] 由于当前用户可能在某一段时间内对自己所习惯的语音参数会有所改变,例如可 能有一段时间喜欢听轻音乐,可能有一段时间喜欢听摇滚,这样当前用户的个性化语音参 数就会改变。因此,当存储器20中存储有当前用户的个性化语音参数时,也需要通过监测当 前用户在预设时间内播放音频时选择的语音参数来更新当前用户的个性化语音参数。
[0063] (3)通过播放示例音频来获取当前用户的个性化语音参数,其中,所述示例音频属 于示例音频集,预先存储于所述存储器20中。所述音频集中包含多个分别属于不同语音参 数区段(如音量区段)的示例音频;获取当前用户对所述示例音频的调节指令(例如,选择与 所播放的示例音频相邻音量区段的音频作为新的示例音频);并根据所述当前用户对所述 示例音频的调节指令,选择新的示例音频。重复上述步骤,直至当前用户确认所播放的示例 音频的语音参数区段为用户所习惯的语音参数区段;获取当前用户选择的所习惯的语音参 数区段中的语音参数作为所述当前用户的个性化语音参数。
[0064] S12,检测待播放音频的原始语音参数。
[0065] 在本实施例中,所述待播放音频包括电子设备1000中需要被播放的音频数据。优 选地,所述待播放音频包括但不限于以下任一种:
[0066] (1)呼叫通话时的语音音频,例如,手机通话时的对方的音频,又例如,呼叫中心所 接收到的呼入电话的音频等;
[0067] (2)经由网络传输的各类音频,如微信中的语音音频,在线影院中的视频等;
[0068] (3)存储于电子设备1000中的各类音频,如mp3等。
[0069] 优选地,所述待播放音频的原始语音参数为所述待播放音频流入输出器40前的语 音参数。利用音频处理技术对待播放音频进行解码处理获取所述待播放音频的原始语音参 数,后续对所述待播放音频的原始语音参数进行处理。所述原始语音参数包括但不限于,原 始音量,原始音色等。
[0070] S13,根据当前用户的个性化语音参数及待播放音频的原始语音参数控制待播放 音频的输出语音参数。
[0071] 所述输出语音参数包括但不限于,输出音量,输出音色等。
[0072] 在本实施例中,以对音量的调节为例进行说明,待播放音频的输出音量可通过以 下方式中的至少一种来控制:
[0073] (1)当待播放音频的原始音量大于当前用户的个性化音量时,根据当前用户的个 性化音量,降低所述待播放音频的原始音量,将降低后的音量确定为待播放音频的输出音 量。
[0074]具体地,可以设置一个个性化音量对应的第一预设浮动区间,只需要将所述待播 放音频的原始音量降低到个性化音量对应的第一预设浮动区间即可。所述第一预设浮动区 间可由用户设置,也可以是默认值。例如个性化音量为30分贝,浮动区间为[25,30],则调节 后的所述待播放音频的原始音量只需要在25分贝在30分贝之间就可满足要求。
[0075]当待播放音频的原始音量不大于当前用户的个性化音量时,根据当前用户的个性 化音量及预先设置的下限音量,调整所述待播放音频的原始音量。所述下限音量可由用户 设定,也可以是一个默认值。
[0076]优选地,判断所述待播放音频的原始音量是否小于下限音量。当所述待播放音频 的原始音量小于一个下限音量时,根据当前用户的个性化音量,将所述待播放音频的原始 音量进行增益,将增益后的音量确定为待播放音频的输出音量。具体地,只需要将所述待播 放音频的原始音量增益到个性化音量对应的第一预设浮动区间即可。
[0077]当待播放音频的原始音量不大于当前用户的个性化音量,且所述待播放音频的原 始音量大于下限音量时,所述待播放音频的原始音量确认为待播放音频的输出音量。
[0078]在其他实施例中,当待播放音频的原始音量不大于当前用户的个性化音量时,根 据当前用户的个性化音量调整所述待播放音频的原始音量。具体地,根据当前用户的个性 化音量,将所述待播放音频的原始音量进行增益,将增益后的音量确定为待播放音频的输 出音量。具体地,只需要将所述待播放音频的原始音量增益到个性化音量对应的第一预设 浮动区间即可。
[0079] (2)设置一个上限音量,所述上限音量可由用户设定,也可以是一个默认值。当待 播放音频的原始音量大于上限音量时,根据当前用户的个性化音量,降低所述待播放音频 的原始音量,将降低后的音量确定为待播放音频的输出音量。
[0080] 具体地,可以根据上限音量及个性化音量设置一个个性化音量对应的第二预设浮 动区间,只需要将所述待播放音频的原始音量降低到个性化音量对应的第二预设浮动区间 即可。所述第二预设浮动区间可由用户设置,也可以是默认值。例如个性化音量为30分贝, 上限音量为45分贝,浮动区间为[25,40],则调节后的所述待播放音频的原始音量只需要在 25分贝在40分贝之间就可满足要求。
[0081] 当待播放音频的原始音量不大于上限音量时,判断所述待播放音频的原始音量是 否小于下限音量,当所述待播放音频的原始音量小于下限音量时,根据当前用户的个性化 音量,将所述待播放音频的原始音量进行增益,将增益后的音量确定为待播放音频的输出 音量。具体地,只需要将所述待播放音频的原始音量增益到个性化音量对应的第二预设浮 动区间即可。
[0082] 当待播放音频的原始音量不大于上限音量,且所述待播放音频的原始音量大于下 限音量时,所述待播放音频的原始音量确认为待播放音频的输出音量。
[0083]优选地,本发明还包括将待播放音频的输出语音参数通过输出器40输出给用户。
[0084]本发明通过设置个性化语音参数,让用户享受一致并习惯的语音,以及免受瞬间 高音对耳朵的伤害。本发明还能够根据用户收听音频的语音参数来自动更新个性化语音参 数,提高了用户的体验。
[0085]例如用户通过手机听歌曲或者看电影,能让用户享受自己习惯的音量。或者在打 电话时,突然有超高响度的音量时,会将超高响度的音量进行降低,并将降低后的音量输出 给用户。
[0086]如图3所示,所述语音控制系统10包括识别模块100、获取模块101、检测模块102、 控制模块103及输出模块104。本发明所称的模块是指一种能够被处理器30所执行并且能够 完成固定功能的一系列计算机程序段,其存储在存储器20中。在本实施例中,关于各模块的 功能将在后续的实施例中详述。
[0087] 识别模块100用于识别电子设备1000的当前用户。
[0088] 在本实施例中,根据存储于存储器20中的用户信息确认当前用户的身份。在确认 当前用户的身份时,可以获取该当前用户的指纹,利用指纹识别技术,将获取的指纹特征与 所存储的指纹信息进行比对以确认当前用户。对当前用户的身份的确认也可以通过获取用 户的声音,利用声音识别技术,将获取的声音特征与所存储的声音信息进行比对来实现。进 一步地,对当前用户的身份的确认还可以通过获取用户的图像,利用图像识别技术,将获取 的图像与所存储的图像信息进行比对来实现。当所述电子设备1〇〇〇设置有密码登录时,对 当前用户的身份的确认也可以根据用户登录所述电子设备1〇〇〇的账号密码来实现。在其他 实施例中,确认当前用户身份的方法可以是上述方法中的一种或者多种方法的组合。
[0089]若经过上述比对,确认该当前用户的用户信息并未存储于所述存储器20时,确认 该当前用户为新用户,并将该新用户的用户信息存储至所述存储器20中。
[0090]获取模块101用于获取当前用户的个性化语音参数。
[0091 ]所述电子设备1000可以有一个或者多个用户,例如,在一个家庭中,一个平板电脑 可以有多个家庭成员使用,每个家庭成员在收听音频时的个性化音量也会根据各个人的习 惯而有所不同。
[0092] 所述个性化语音参数包括但不限于,个性化音量,个性化音色等。
[0093] 在本实施例中,所述获取模块101获取当前用户的个性化语音参数包括以下方式 中的至少一种:
[0094] (1)读取预先存储于所述存储器20中的与当前用户对应的个性化语音参数。在收 听音频时,用户可以将自己感觉比较舒适的语音信息保存为个性化语音参数。
[0095] (2)当存储器20中没有当前用户的个性化语音参数时,提示当前用户通过电子设 备1 000的音量调节功能设置语音参数,将所设置的语音参数确认为当前用户的个性化语音 参数。
[0096] 后续用户会利用电子设备1000收听各类音频,每个音频播放时可能会有不同的语 音参数。通过获取当前用户在预设时间段内(如:一周)播放音频时选择的多个语音参数可 以对当前用户的个性化语音参数进行更新。具体为:获取预设时间段内当前用户播放音频 的多个语音参数,根据获取的多个语音参数生成新的语音参数,例如计算所获取的多个音 量值的平均值,将该平均值确认为新的音量值。若当前用户确认该新的语音参数可以作为 其个性化语音参数时,根据该新的语音参数更新该当前用户的个性化语音参数。若当前用 户确认该新的语音参数不能作为其个性化语音参数时,在预设区间范围内自动调节该新的 语音参数,直至当前用户确认所生成的新的语音参数可以作为其更新的个性化语音参数。 [0097]由于当前用户可能在某一段时间内对自己所习惯的语音参数会有所改变,例如可 能有一段时间喜欢听轻音乐,可能有一段时间喜欢听摇滚,这样当前用户的个性化语音参 数就会改变。因此,当存储器20中存储有当前用户的个性化语音参数时,也需要通过监测当 前用户在预设时间内播放音频时选择的语音参数来更新当前用户的个性化语音参数。 [0098] (3)通过播放示例音频来获取当前用户的个性化语音参数,其中,所述示例音频属 于示例音频集,预先存储于所述存储器20中。所述音频集中包含多个分别属于不同语音参 数区段(如音量区段)的示例音频;获取当前用户对所述示例音频的调节指令(例如,选择与 所播放的示例音频相邻音量区段的音频作为新的示例音频);并根据所述当前用户对所述 示例音频的调节指令,选择新的示例音频。重复上述步骤,直至当前用户确认所播放的示例 音频的语音参数区段为用户所习惯的语音参数区段;获取当前用户选择的所习惯的语音参 数区段中的语音参数作为所述当前用户的个性化语音参数。
[0099] 检测模块102用于检测待播放音频的原始语音参数。
[0100] 在本实施例中,所述待播放音频包括电子设备1000中需要被播放的音频数据。优 选地,所述待播放音频包括但不限于以下任一种:
[0101] (1)呼叫通话时的语音音频,例如,手机通话时的对方的音频,又例如,呼叫中心所 接收到的呼入电话的音频等;
[0102] (2)经由网络传输的各类音频,如微信中的语音音频,在线影院中的视频等;
[0103] (3)存储于电子设备1000中的各类音频,如mp3等。
[0104] 优选地,所述待播放音频的原始语音参数为所述待播放音频流入输出器40前的语 音参数。利用音频处理技术对待播放音频进行解码处理获取所述待播放音频的原始语音参 数,后续对所述待播放音频的原始语音参数进行处理。所述原始语音参数包括但不限于,原 始音量,原始音色等。
[0105] 控制模块103用于根据当前用户的个性化语音参数及待播放音频的原始语音参数 控制待播放音频的输出语音参数。
[0106] 所述输出语音参数包括但不限于,输出音量,输出音色等。
[0107] 在本实施例中,以对音量的调节为例进行说明,所述控制模块103通过以下方式中 的至少一种控制待播放音频的输出音量:
[0108] (1)当待播放音频的原始音量大于当前用户的个性化音量时,根据当前用户的个 性化音量,降低所述待播放音频的原始音量,将降低后的音量确定为待播放音频的输出音 量。
[0109] 具体地,可以设置一个个性化音量对应的第一预设浮动区间,只需要将所述待播 放音频的原始音量降低到个性化音量对应的第一预设浮动区间即可。所述第一预设浮动区 间可由用户设置,也可以是默认值。例如个性化音量为30分贝,浮动区间为[25,30],则调节 后的所述待播放音频的原始音量只需要在25分贝在30分贝之间就可满足要求。
[0110] 当待播放音频的原始音量不大于当前用户的个性化音量时,根据当前用户的个性 化音量及预先设置的下限音量,调整所述待播放音频的原始音量。所述下限音量可由用户 设定,也可以是一个默认值。
[0111] 优选地,判断所述待播放音频的原始音量是否小于下限音量。当所述待播放音频 的原始音量小于一个下限音量时,根据当前用户的个性化音量,将所述待播放音频的原始 音量进行增益,将增益后的音量确定为待播放音频的输出音量。具体地,只需要将所述待播 放音频的原始音量增益到个性化音量对应的第一预设浮动区间即可。
[0112]当待播放音频的原始音量不大于当前用户的个性化音量,且所述待播放音频的原 始音量大于下限音量时,所述待播放音频的原始音量确认为待播放音频的输出音量。
[0113]在其他实施例中,当待播放音频的原始音量不大于当前用户的个性化音量时,根 据当前用户的个性化音量调整所述待播放音频的原始音量。具体地,根据当前用户的个性 化音量,将所述待播放音频的原始音量进行增益,将增益后的音量确定为待播放音频的输 出音量。具体地,只需要将所述待播放音频的原始音量增益到个性化音量对应的第一预设 浮动区间即可。
[0114] (2)设置一个上限音量,所述上限音量可由用户设定,也可以是一个默认值。当待 播放音频的原始音量大于上限音量时,根据当前用户的个性化音量,降低所述待播放音频 的原始音量,将降低后的音量确定为待播放音频的输出音量。
[0115] 具体地,可以根据上限音量及个性化音量设置一个个性化音量对应的第二预设浮 动区间,只需要将所述待播放音频的原始音量降低到个性化音量对应的第二预设浮动区间 即可。所述第二预设浮动区间可由用户设置,也可以是默认值。例如个性化音量为30分贝, 上限音量为45分贝,浮动区间为[25,40],则调节后的所述待播放音频的原始音量只需要在 25分贝在40分贝之间就可满足要求。
[0116] 当待播放音频的原始音量不大于上限音量时,判断所述待播放音频的原始音量是 否小于下限音量,当所述待播放音频的原始音量小于下限音量时,根据当前用户的个性化 音量,将所述待播放音频的原始音量进行增益,将增益后的音量确定为待播放音频的输出 音量。具体地,只需要将所述待播放音频的原始音量增益到个性化音量对应的第二预设浮 动区间即可。
[0117] 当待播放音频的原始音量不大于上限音量,且所述待播放音频的原始音量大于下 限音量时,所述待播放音频的原始音量确认为待播放音频的输出音量。
[0118] 优选地,本发明还包括输出模块104用于将待播放音频的输出语音参数通过输出 器40输出给用户。
[0119] 本发明通过设置个性化语音参数,让用户享受一致并习惯的语音,以及免受瞬间 高音对耳朵的伤害。本发明还能够根据用户收听音频的语音参数来自动更新个性化语音参 数,提高了用户的体验。
[0120]例如用户通过手机听歌曲或者看电影,能让用户享受自己习惯的音量。或者在打 电话时,突然有超高响度的音量时,会将超高响度的音量进行降低,并将降低后的音量输出 给用户。
[0121] 在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以 通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的 划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
[0122] 所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显 示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个 网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目 的。
[0123] 另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以 是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单 元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
[0124] 上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存 储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机 设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个 实施例所述方法的部分步骤。
[0125] 对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在 不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论 从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权 利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有 变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此 外,显然"包括"一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个 单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表 示名称,而并不表示任何特定的顺序。
[0126] 最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照 较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的 技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
【主权项】
1. 一种语音控制方法,应用于电子设备,其特征在于,所述方法包括: 识别电子设备的当前用户; 获取所述当前用户的个性化语音参数; 检测待播放音频的原始语音参数;及 根据所述当前用户的个性化语音参数及所述待播放音频的原始语音参数控制所述待 播放音频的输出语音参数。2. 如权利要求1所述的语音控制方法,其特征在于,所述当前用户的个性化语音参数通 过以下方式中的至少一种获取: 读取预先存储于所述电子设备中与所述当前用户对应的个性化语音参数;或 提示所述当前用户通过所述电子设备的语音调节功能设置语音参数,将所设置的语音 参数确认为所述当前用户的个性化语音参数;或 通过播放示例音频来获取所述当前用户的个性化语音参数。3. 如权利要求1所述的语音控制方法,其特征在于,所述方法还包括: 获取所述当前用户在预设时间段内播放音频时设置的语音参数;及 根据所述设置的语音参数更新所述当前用户的个性化语音参数。4. 如权利要求1所述的语音控制方法,其特征在于,所述原始语音参数包括原始音量, 所述个性化语音参数包括个性化音量,所述输出语音参数包括输出音量,所述控制所述待 播放音频的输出语音参数包括: 当所述待播放音频的原始音量大于所述当前用户的个性化音量时,根据所述当前用户 的个性化音量,降低所述待播放音频的原始音量,将降低后的音量确定为所述待播放音频 的输出音量; 当所述待播放音频的原始音量不大于所述当前用户的个性化音量时,根据预先设置的 下限音量及所述当前用户的个性化音量确定所述待播放音频的输出音量。5. 如权利要求1所述的语音控制方法,其特征在于,所述原始语音参数包括原始音量, 所述个性化语音参数包括个性化音量,所述控制所述待播放音频的输出语音参数包括: 当所述待播放音频的原始音量大于预先设置的上限音量时,根据所述当前用户的个性 化音量确定所述待播放音频的输出音量; 当所述待播放音频的原始音量不大于上限音量,根据预先设置的下限音量及所述当前 用户的个性化音量确定所述待播放音频的输出音量。6. -种语音控制系统,其特征在于,所述系统包括: 识别模块,用于识别电子设备的当前用户; 获取模块,用于获取所述当前用户的个性化语音参数; 检测模块,用于检测待播放音频的原始语音参数;及 控制模块,用于根据所述当前用户的个性化语音参数及所述待播放音频的原始语音参 数控制所述待播放音频的输出语音参数。7. 如权利要求6所述的语音控制系统,其特征在于,所述当前用户的个性化语音参数通 过以下方式中的至少一种获取: 读取预先存储于所述电子设备中与所述当前用户对应的个性化语音参数;或 提示所述当前用户通过所述电子设备的语音调节功能设置语音参数,将所设置的语音 参数确认为所述当前用户的个性化语音参数;或 通过播放示例音频来获取所述当前用户的个性化语音参数。8. 如权利要求6所述的语音控制系统,其特征在于,所述系统还包括: 获取所述当前用户在预设时间段内播放音频时设置的语音参数;及 根据所述设置的语音参数更新所述当前用户的个性化语音参数。9. 如权利要求6所述的语音控制系统,其特征在于,所述原始语音参数包括原始音量, 所述个性化语音参数包括个性化音量,所述输出语音参数包括输出音量,所述控制所述待 播放音频的输出语音参数包括: 当所述待播放音频的原始音量大于所述当前用户的个性化音量时,根据所述当前用户 的个性化音量,降低所述待播放音频的原始音量,将降低后的音量确定为所述待播放音频 的输出音量; 当所述待播放音频的原始音量不大于所述当前用户的个性化音量时,根据预先设置的 下限音量及所述当前用户的个性化音量确定所述待播放音频的输出音量。10. 如权利要求6所述的语音控制系统,其特征在于,所述原始语音参数包括原始音量, 所述个性化语音参数包括个性化音量,所述控制所述待播放音频的输出语音参数包括: 当所述待播放音频的原始音量大于预先设置的上限音量时,根据所述当前用户的个性 化音量确定所述待播放音频的输出音量; 当所述待播放音频的原始音量不大于上限音量,根据预先设置的下限音量及所述当前 用户的个性化音量确定所述待播放音频的输出音量。
【文档编号】G06F3/16GK105912296SQ201610217523
【公开日】2016年8月31日
【申请日】2016年4月8日
【发明人】吴庆龙
【申请人】宇龙计算机通信科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1