通话控制方法、装置及移动终端的制作方法_2

文档序号：9711658阅读：来源：国知局

[0067] 图2是根据一示例性实施例示出的一种通话控制方法的应用场景示意图。
[0068] 图3是根据一示例性实施例示出的一种通话控制方法的应用场景示意图。
[0069] 图4是根据一示例性实施例示出的一种通话控制方法的流程图。
[0070] 图5是根据一示例性实施例示出的一种通话控制方法的流程图。
[0071] 图6是根据一示例性实施例示出的一种通话控制方法的流程图。
[0072] 图7是根据一示例性实施例示出的一种通话控制方法的流程图。
[0073] 图8是根据一示例性实施例示出的一种通话控制方法的流程图。
[0074] 图9是根据一示例性实施例示出的一种通话控制方法的流程图。
[0075] 图10是根据一示例性实施例示出的一种移动终端的屏幕示意图。
[0076] 图11是根据一示例性实施例示出的一种通话控制装置的结构示意图。
[0077] 图12是根据一示例性实施例示出的一种通话控制装置的结构示意图。
[0078] 图13是根据一示例性实施例示出的一种通话控制装置的结构示意图。
[0079] 图14是根据一示例性实施例示出的一种通话控制装置的结构示意图。
[0080] 图15是根据一示例性实施例示出的一种用于终端控制的装置的框图。
【具体实施方式】
[0081] 这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
[0082] 图1是根据一示例性实施例示出的一种通话控制方法的流程图，如图1所示，所述通话控制方法应用于移动终端中，包括以下步骤：
[0083] 在步骤Sll中，当检测到移动终端与用户耳边的距离大于预设阈值时，获取听筒传输的声音信号。
[0084] 其中，移动终端与用户耳边的距离通常利用设置在所述移动终端中的距离传感器获取。当所述距离大于预设阈值时，则认为用户已经将移动终端从耳朵旁移开，此时，对方在说话时，用户有可能无法听到，因此需要获取听筒传输的声音信号，以便后续对所述声音信号进行分析。
[0085] 参见图2和图3所示的场景示意图，其中，图2为用户在接听电话时，用户与移动终端所在的场景示意图，在该场景下，移动终端与用户耳边的距离较近。图3为用户将移动终端从耳边移开，准备对移动终端进行操作（如挂断）时，用户与移动终端所在的场景示意图，在该场景下，移动终端与用户耳边的距离较大。本申请中，预先根据多次实验或经验，预设一个阈值，当移动终端与用户耳边的距离大于该预设阈值时，则说明用户已经将移动终端移开了。
[0086] 当获取所述声音信号后，在步骤S12中，基于对所述声音信号的分析，判断所述声音信号中是否包含语音信号。
[0087] 所述声音信号通常包括噪声信号，并在对方说话时，所述声音信号中会包含对方说话时产生的语音信号。其中，语音通常指的是由人的发音器官发出，负载一定的语言意义的载体。
[0088] 在步骤S13中，当所述声音信号中包含所述语音信号时，执行相应的提示操作。
[0089] 当根据步骤S12的操作，判断得知所述声音信号中包含所述语音信号时，则说明对方在说话，为了避免用户错过信息，所述移动终端执行相应的提示操作，从而能够对用户起到提示作用。
[0090] 本公开示例性实施例提供一种通话控制方法，该通话控制方法应用于移动终端，该方法中，首先当检测到移动终端与用户耳边的距离大于预设阈值时，获取听筒传输的声音信号；然后基于对所述声音信号的分析，判断所述声音信号中是否包含语音信号；当所述声音信号中包含所述语音信号时，执行相应的提示操作。
[0091] 通过上述通话控制方法，能够根据从听筒中获取的声音信号，判断对方是否在说话，并在判断得知对方在说话时，执行相应的提示操作，以便提示用户，从而能够避免用户错过信息。
[0092] 在步骤S12中，公开了基于对所述声音信号的分析，判断所述声音信号中是否包含语音信号的步骤，在本公开一示例性实施例中，参见图4,所述基于对所述声音信号的分析，判断所述声音信号中是否包含语音信号的步骤包括：
[0093] 在步骤S121中，按照预设时间段对所述声音信号进行分割，获取多帧子信号。
[0094] 该步骤指的是对声音信号进行加窗处理。加窗处理的过程中，通过预设时间段，将所述声音信号分割为多帧子信号，每一帧子信号的时长等于所述预设时间段。其中，所述预设时间段的时长由用户根据应用需求，预先设定。例如，所述预设时间段可以为30毫秒，这种情况下，对所述声音信号进行分割，即可获取多帧子信号，且每帧子信号的时长为30毫秒。
[0095] 在获取所述多帧子信号后，在步骤S122中，获取所述多帧子信号的特征参数。
[0096] 在步骤S123中，基于所述多帧子信号的特征参数，判断所述声音信号中是否包含语音信号。
[0097] 在步骤S121至步骤S123中，将声音信号分割为多帧子信号，并通过所述多帧子信号的特征参数，即可确定所述声音信号中是否包含语音信号。
[0098] 其中，所述获取所述多帧子信号的特征参数包括：获取所述多帧子信号的能量、过零率、倒谱和谱熵中的任意一个或多个参数。
[0099] 所述声音信号通常包括噪声信号，并在对方说话时，所述声音信号中会包含对方说话时产生的语音信号。其中，噪声信号的能量通常小于语音信号的能量，每帧子信号的能量指的是该帧子信号对应的时域信号平方的积分。
[0100] 每一帧子信号的过零率表示该帧子信号的波形穿过横轴（即零电平）的次数，过零率能够描述声音信号的频谱特性，用于判断声音信号中是否包含语音信号。
[0101] 另外，还可以采用倒谱这一参数作为特征参数。倒谱指的是功率谱的对数值的逆傅氏变换，也可称为功率倒频谱。每一帧子信号s (t)的倒谱函数（power cepstrum)通常可通过以下公式获得：
[0102] C(q) = I IF(log(s(f))) |~2。
[0103] 其中，s (f)是每一帧子信号s (t)的傅里叶变换，IF为逆傅里叶变换，C (q)为倒谱函数，即倒频谱函数。
[0104] 另外，还可以采用谱熵这一参数作为特征参数。
[0105] 在求取某一帧子信号的谱熵时，首先需要通过快速傅里叶变换得到该帧子信号的频谱，然后计算各频谱分量在该帧子信号的总能量中所占的比例，将所述比例作为该帧子信号的能量集中在相应频谱分量的概率，其中，计算所述比例的公式如下：
[0107] 其中，P1S-帧子信号中，第i个频谱分量在总能量中所占的比例；Wf1)为第i个频谱分量；N为该帧子信号中，频谱分量的总个数；s (fk)为第k个频谱分量。
[0108] 然后，由于语音信号的绝大部分能量集中在200HZ-3500HZ之间，为了区分语音信号和噪声信号，在获取每个频谱分量在该帧子信号的总能量的比例后，我们把 200Hz-3500Hz之外的频率分量置为0,相应的每一帧子信号的谱熵定义如下：
[0110] H为一帧子信号的谱熵；N为该帧子信号中，频谱分量的总个数；Pk为一帧子信号中，第k个频谱分量在总能量中所占的比例。通过上式，即可获取每一帧子信号的谱熵。 [0111] 通过能量、过零率、倒谱和谱熵，通常能够分辨出清音段和浊音段，即分辨出声音信号中是否包含语音信号。因此，在判断声音信号中是否包含语音信号时，可将能量、过零率、倒谱和谱熵中的任意一个或多个参数作为特征参数，并基于所述特征参数对所述声音信号进行分析判断。当然，还可以将其他能够区分语音信号和噪声信号的参数作为特征参数，本申请对此不作限定。
[0112] 步骤S123中所述的基于所述多帧子信号的特征参数，判断所述声音信号中是否包含语音信号，可以以多种实现方式实现，在其中一种实现方式中，参见图5,包括以下步骤：
[0113] 在步骤S1231中，根据前M帧子信号的特征参数，分别获取所述特征参数对应的第一门限值和第二门限值，其中，同一特征参数的第一门限值小于第二门限值，M为大于0的正整数。
[0114] 在示例性实施例中，默认前M帧子信号为噪声信号，其中，M的具体数值可由用户根据经验预先设定。其中，所述特征参数包括：能量、过零率、倒谱和谱熵中的任意一个参数或多个参数。
[0115] 在步骤S1232中，将剩余各帧子信号的特征参数分别与对应的第一门限值、第二门限值相比较，当根据比较结果，确定所述剩余各帧子信号中包含有第一目标子信号时，判定所述声音信号中包含语音信号，其中，所述第一目标子信号的特征参数大于所述特征参数对应的第二门限值，并且，所述第一目标子信号之后预设帧数的子信号的特征参数均大于对应的第一门限值。
[0116] 其中，所述剩余各帧子信号指的是分割得到的多帧子信号中第M帧子信号之后的子信号。
[0117] 在步骤S1231至步骤S1232的操作中，通过对声音信号的特征参数进行分析，判断声音信号中是否包含语音信号。在分析过程中，通常将前M帧子信号假设为噪声信号，然后根据前M帧子信号的特征参数，获取相应的第一门限值和第二门限值。其中，当所述第一门限值小于第二门限值时，可知所述第一门限值对信号的变化较为敏感。
[0118] 在获取所述第一门限值和第二门限值后，将剩余各帧子信号的所述特征参数分别与其对应的所述第一门限值、第二门限值相比较。当剩余各帧子信号在某一时刻之后的特征参数大于对应的第一门限值时，即该时刻的特征参数超过较低的门限值时，有可能是噪声信号引起的，此时无法确定所述声音信号中是否存在语音信号。当剩余的各帧子信号中，某一帧子信号的特征参数均大于对应的第二门限值，并且该帧子信号之后预设帧数的子信号的特征参数均大于对应的第一门限值时，则将该帧子信号作为第一目标子信号，并判定所述声音信号中包含语音信号，所述第一目标子信号开始的时刻即为所述语音信号开始的时刻。
[0119] 通过上述设定双门限值的方法，能够基于所述多帧子信号的特征参数，判断出所述声音信号中是否包含语音信号。
[0120] 在信噪比较大时，通常只采用能量或过零率中的一个参数作为特征参数，并根据步骤SS1231至步骤S1232的操作，基于所述特征参数，判断声音信号中是否包含语音信号。但是，通常周边环境产生的噪声较大，这种情况下，为了提高判断精度，可将能量和过零率两个参数都作为特征参数，通过这两个特征参数判断声音信号中是否包含语音信号。这种情况下，需要第一目标

完整全部详细技术资料下载

当前第2页1 2 3 4 5