通信线路特征提取方法、通信线路识别方法及装置与流程

文档序号:19346893发布日期:2019-12-06 20:57阅读:259来源:国知局
通信线路特征提取方法、通信线路识别方法及装置与流程

本发明涉及通信技术领域,特别是指一种通信线路特征提取方法、通信线路识别方法及装置。



背景技术:

通信是人类生活中最重要的元素之一,打电话、视频聊天、微信语音等都是通信的一种模式。通信线路指的是在通信过程中,将电磁波信号从一个地点传送到另一个地点的传输媒介。通信往往依赖于通信线路作为媒介,而不同的通信线路会有不同的特征,这些特征是区分通信线路的关键。

通信线路的区分,将为运营商、来源地等的区分提供辅助帮助。然而,现有技术通过通信线路中的信令对通信线路进行识别,而信令的完整获取非常困难,且一条信令只包括一段出入节点的信息,导致无法准确且高效的识别通信线路对应的运营商、来源地等,进而导致无法对电话通信的可靠性进行快速判断。



技术实现要素:

有鉴于此,本发明的目的在于提出一种通信线路特征提取方法、通信线路识别方法及装置,能够准确且高效的提取通信线路特征,进而提高通信线路识别的准确性和高效性,提高电话通信的可靠性。

基于上述目的本发明提供的基于通信语音的线路特征提取方法,包括:

通过运营商通信线路建立位于主叫地的主叫终端与位于被叫地的被叫终端之间的通话连接;

在所述主叫终端处播放语音;

在所述被叫终端处获取所述语音对应的音频;

从所述音频中提取音频特征作为通信线路特征,所述通信线路特征为所述主叫地与所述被叫地之间的所述运营商通信线路的特征。

进一步地,所述通过运营商通信线路建立位于主叫地的主叫终端与位于被叫地的被叫终端之间的通话连接,具体包括:

通过运营商通信线路并利用位于主叫地的主叫终端向位于被叫地的被叫终端发送呼叫请求;

利用所述被叫终端接收所述呼叫请求,以建立所述主叫终端与所述被叫终端之间的通话连接。

进一步地,所述在所述主叫终端处播放语音,具体包括:

在通话连接建立第一预设时长后,在所述主叫终端处播放语音;

在所述语音播放完成后,延时第二预设时长,断开所述主叫终端与所述被叫终端之间的通话连接。

进一步地,所述在所述被叫终端处获取所述语音对应的音频,具体包括:

利用所述被叫终端对所述主叫终端播放的语音进行录音,获得录音的音频。

进一步地,所述利用所述被叫终端对所述主叫终端播放的语音进行录音,获得录音的音频,具体包括:

在通话连接建立所述第一预设时长后,开启所述被叫终端的录音功能,以对所述主叫终端播放的语音进行录音;

在所述主叫终端与所述被叫终端之间的通话连接断开时,关闭所述被叫终端的录音功能,获得录音的音频。

进一步地,所述从所述音频中提取通信线路特征之前,还包括:

去除所述音频中所述第二预设时长对应的录音,保留所述音频中的语音段。

进一步地,所述从所述音频中提取音频特征作为通信线路特征,具体包括:

将所述音频划分为多个音频段;

计算每个音频段对应的音频特征;

求取多个音频段的音频特征的平均值作为所述通信线路特征。

进一步地,所述计算每个音频段对应的音频特征,具体包括:

获取多个训练好的评估模型;

计算每个音频段对应的多个基础特征;

利用每个评估模型,对所述多个基础特征进行重要性评估,筛选每个评估模型中重要性排在前20的基础特征;

对多个评估模型筛选的基础特征取交集,获得每个音频段对应的音频特征;所述音频特征包括动态复杂度、整帧过零率、频谱通量、整体能量、频谱带能量、最大能量频率、包络平坦度、带宽平均值、带宽标准差、过零率平均值和过零率标准差。

本发明实施例还提供一种通信线路识别方法,包括:

根据多个主叫地与多个被叫地之间的多个运营商线路的特征,训练预先构建的识别模型;每一主叫地与每一被叫地之间的每一运营商线路的特征是根据上述通信线路特征提取方法获得的;

获取通话音频;

从所述通话音频中提取音频特征作为通信线路特征;

将所述通信线路特征输入训练好的识别模型中,识别所述通话音频对应的通信线路信息;所述通信线路信息包括主叫地和通信运营商。

本发明实施例还提供一种线路特征提取装置,能够实现上述线路特征提取方法,所述装置包括:

通话连接模块,用于通过运营商通信线路建立位于主叫地的主叫终端与位于被叫地的被叫终端之间的通话连接;

语音播放模块,用于在所述主叫终端处播放语音;

音频获取模块,用于在所述被叫终端处获取所述语音对应的音频;以及,

特征提取模块,用于从所述音频中提取音频特征作为通信线路特征,所述通信线路特征为所述主叫地与所述被叫地之间的所述运营商通信线路的特征。

从上面所述可以看出,本发明提供的通信线路特征提取方法、通信线路识别方法及装置,能够在主叫终端和被叫终端之间建立通话连接后,在主叫终端处播放语音,在被叫终端处获取所述语音对应的音频,并从音频中提取音频特征,作为主叫地和被叫地之间的通话运营商通信线路的特征,提高通信线路特征提取的准确性和高效性,以便根据通信线路特征识别主叫端的所在地和所使用的运营商,提高通信线路识别的准确性和高效性,进而提高电话通信的可靠性。

附图说明

图1为本发明实施例提供的通信线路特征提取方法的流程示意图;

图2为本发明实施例提供的通信线路特征提取方法的通话过程中的行为时序图;

图3为本发明实施例提供的通信线路识别方法的流程示意图;

图4为本发明实施例提供的通信线路特征提取装置的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。

参见图1,是本发明实施例提供的通信线路特征提取方法的流程示意图,所述方法包括:

s1、通过运营商通信线路建立位于主叫地的主叫终端与位于被叫地的被叫终端之间的通话连接。

具体地,步骤s1包括:

通过运营商通信线路并利用位于主叫地的主叫终端向位于被叫地的被叫终端发送呼叫请求;

利用所述被叫终端接收所述呼叫请求,以建立所述主叫终端与所述被叫终端之间的通话连接。

本实施例中,主叫用户在主叫地可以通过不同主叫终端和不同运营商呼叫位于被叫地的被叫终端。其中,主叫地和被叫地的地理位置可以具体到区县,以便缩小基站范围,另外,由于地理位置具有普遍性,因此主叫地和被叫地支持任意两个地理位置的组合。运营商可以包括中国移动、中国联通、中国电信等,通过在主叫终端中安装不同运营商提供的电话卡来达到使用不同运营商通信线路的目的,由于不同运营商所使用的基站不同,因此不同运营商的通信线路不同。主叫终端可以包括各种型号的移动终端,如小米mix2手机,华为p20手机等,由于不同移动终端所支持的频段不同,即不同主叫终端在通信过程中所使用的无线频段不同,因此不同移动终端所对应的通信线路不同。

主叫终端呼叫被叫终端,被叫终端确认接收该呼叫后,即可建立主叫终端与被叫终端之间的通话连接,即主叫用户可以通过主叫终端和被叫终端与被叫用户进行通话。

s2、在所述主叫终端处播放语音。

具体地,步骤s2包括:

在通话连接建立第一预设时长后,在所述主叫终端处播放语音;

在所述语音播放完成后,延时第二预设时长,断开所述主叫终端与所述被叫终端之间的通话连接。

本实施例中,在通话开始第一预设时长t(如5秒)后,在主叫终端处播放语音,该语音可以为一段固定长度(如10秒)和内容的录音。主叫终端在通话开始一段时间后才播放语音,以避免通话连接刚开始时由于线路不稳定、延时等造成的响铃等额外声音的出现。语音的长度和内容固定,以达到控制变量的作用,即保证经过通信线路的原始数据相同。语音内容可以为人的说话语音,以模拟实际通信情况,可以理解的,语音也可以为音乐、白噪声等。另外,主叫终端每次播放语音时的播放环境要保持一致,以避免环境噪声等对通信线路特征提取的影响。

在语音播放完成后,等待第二预设时长s(如5秒),主叫终端挂断电话,即断开主叫终端与被叫终端之间的通话连接。由于线路延时导致主叫终端与被叫终端的信息交流并不同步,延时一段时间后再挂断通话,以避免主叫终端播放的语音未收集完,即录音不完全,或者通话断开后将忙音出现在录制的音频中,被错当作通信线路特征。

如图2所示,主叫终端在通话过程中的行为过程包括:在通话开始t秒后,触发事件1,即播放固定的语音;在语音播放完成后触发事件3,即语音播放完成;等待s秒后触发事件4,即挂断电话。

s3、在所述被叫终端处获取所述语音对应的音频。

具体地,步骤s3包括:

利用所述被叫终端对所述主叫终端播放的语音进行录音,获得录音的音频。

本实施例中,被叫终端利用自带通话录音功能来收集主叫终端播放的语音,并将录音的音频保存为wave格式。

进一步地,所述利用所述被叫终端对所述主叫终端播放的语音进行录音,获得录音的音频,具体包括:

在通话连接建立所述第一预设时长后,开启所述被叫终端的录音功能,以对所述主叫终端播放的语音进行录音;

在所述主叫终端与所述被叫终端之间的通话连接断开时,关闭所述被叫终端的录音功能,获得录音的音频。

需要说明的是,被叫终端在通话开始第一预设时长t(如5秒)后开启自带录音功能,收集通话语音,直到呼叫结束,即主叫终端与被叫终端之间的通话连接断开,录音结束。整个通话过程由主叫终端控制,即由主叫终端进行通话的发起和终结,被叫终端仅执行接通和录音操作。

如图2所述,被叫终端在通话过程中的行为过程包括:被叫终端在通话开始t秒后触发事件2,即打开自带录音功能,对通话进行录音,直到通话结束不再进行其他操作。

进一步地,所述从所述音频中提取通信线路特征之前,还包括:

去除所述音频中所述第二预设时长对应的录音,保留所述音频中的语音段。

需要说明的是,在被叫终端获得录音的音频后,还需对该音频进行预处理,即截断音频后s秒的录音。由于主叫终端在指定语音播放完后的s秒保持静默且未挂断电话,而静默部分不在通信线路特征提取的考虑范围,因此在预处理过程中截断静默部分,仅保留语音段。

如图2所示,预处理对音频进行处理的行为过程包括:在录音结束的前s秒触发事件5,即截断录音后s秒的音频。

s4、从所述音频中提取音频特征作为通信线路特征,所述通信线路特征为所述主叫地与所述被叫地之间的所述运营商通信线路的特征。

具体地,步骤s4包括:

将所述音频划分为多个音频段;

计算每个音频段对应的音频特征;

求取多个音频段的音频特征的平均值作为为所述通信线路特征。

需要说明的是,将预处理后的音频取101帧,约10秒作为一个音频段。在采样率为22050hz的情况下,设置音频中单个片段长度为512采样,约0.9秒,也可设置连续段间的单步长度。随后遍历截取段,利用python库librosa、essentia、pyaudioanalysis提供的函数得到相应的音频特征。

进一步地,所述计算每个音频段对应的特征值,具体包括:

获取多个训练好的评估模型;

计算每个音频段对应的多个基础特征;

利用每个评估模型,对所述多个基础特征进行重要性评估,筛选每个评估模型中重要性排在前20的基础特征;

对多个评估模型筛选的基础特征取交集,获得每个音频段对应的音频特征;所述音频特征包括动态复杂度、整帧过零率、频谱通量、整体能量、频谱带能量、最大能量频率、包络平坦度、带宽平均值、带宽标准差、过零率平均值和过零率标准差。

本实施例中,音频中提取的音频特征为通过大量实验挑选的典型音频特征,以达到作为线路特征区分不同通信线路的目的。实验的主要内容分为三个部分,基本特征获取、特征打分、典型特征筛选。基本特征获取部分利用python丰富的语音处理库如librosa等,结合与音频相关的基本知识得到如短时平均能量、包络平坦度、巴克带能量等一系列音频特征,并通过计算获取这些特征的统计特征,如平均值、方差等,将这共一百余个特征作为基础特征。特征打分部分利用已有标签数据结合随机森林、gbdt等评估模型进行训练,对基础特征的重要性进行评估,计算每个基础特征的重要性,获取基础特征排名,筛选在各个模型中排名在前20的基础特征。典型特征筛选部分将在各个评估模型中排名前20的特征取交集,获取其中最具代表性的基础特征作为音频特征,即通信线路特征。

通信线路特征包括1个描述响度的特征,即动态复杂度;2个描述频谱的特征,即整帧过零率、频谱通量;4个描述能量的特征,即整体能量、频谱带能量、最大能量频率、包络平坦度;4个与能量、频率、响度相关的统计学特征,即带宽平均值、带宽标准差、过零率平均值、过零率标准差。

例如,获取频谱通量的代码如下:

spectral_flux=audiofeatureextraction.stspectralflux(signal,signal_prev)

同时,利用上述的三个python库得到带宽和过零率,并计算其平均值和标准差。例如,获取过零率的代码如下:

zcr=librosa.feature.zero_crossing_rate(signal)

利用numpy库得到过零率的标准差和平均值,代码如下:

np.mean(zcr)

np.std(zcr)

其中,动态复杂度:定义为分贝标度上与全局响度级别估计的平均绝对偏差,与动态范围和录音中响度的波动量有关。

整帧过零率:即信号过零点的次数,从时域的角度描述信号频率,一般来说声母的过零率会高一些,韵母要低一些,辅音频率较高,可以通过短时平均过零率进行区分。

频谱通量:频谱通量描述相邻帧频谱的变化情况。

整体能量:求一段音频整体的能量大小,体现音频能量的整体特性。

频谱带能量:音频在不同频带包括[20hz,150hz]、[150hz,800hz]、[800hz,4khz]和[4khz,20khz]上的频谱能量和。

最大能量频率:指频谱中最大能量点对应的频率值。

包络平坦度:统计包络特征向量的平坦程度,为包络特征几何平均值与算术平均值之间的比率。

带宽平均值:每一帧频率带宽在音频信号中是逐帧提取的,通过求每一帧频率带宽的平均值,可以反映信号频谱覆盖的频率范围。

带宽标准差:标准差反映了频率带宽在每一帧信号中的波动情况,体现出频率范围在不同信号帧中的波动强烈程度。

过零率平均值:每一帧过零率在音频信号中是逐帧提取的,通过求每一帧的过零率平均值,可以反映音频信号的短时过零率情况。

过零率标准差:标准差反映了过零率在每一帧信号中的波动情况,体现出过零率变化的周期性特征。

采用上述方式获取每个音频端的动态复杂度、整帧过零率、频谱通量、整体能量、频谱带能量、最大能量频率、包络平坦度,并将这些特征按序组合,可利用append()函数,形成11维的实数向量,该11维的实数向量即可作为相应音频段的音频特征,将所有音频段的音频特征求平均,即可将平均值作为通信线路特征。

本发明提供的通信线路特征提取方法,能够在主叫终端和被叫终端之间建立通话连接后,在主叫终端处播放语音,在被叫终端处获取所述语音对应的音频,并从音频中提取音频特征,作为主叫地和被叫地之间的通话运营商通信线路的特征,提高通信线路特征提取的准确性和高效性,以便根据通信线路特征识别主叫端的所在地和所使用的运营商,提高通信线路识别的准确性和高效性,进而提高电话通信的可靠性。

相应地,本发明还提供一种通信线路识别方法,如图3所示,所述方法包括:

s301、根据多个主叫地与多个被叫地之间的多个运营商线路的特征,训练预先构建的识别模型。

需要说明的是,每一主叫地与每一被叫地之间的每一运营商线路的特征是根据上述通信线路特征提取方法获得的,在此不再详细赘述。

本实施例中,收集来自多个地点和多个运营商的多条语音,并获取相应的音频特征,即后文提到的11维特征,作为通信线路特征,同时保存训练音频的地点和运营商标签作为分类结果标签。可以利用自编码器对特征进行二次处理挖掘更多隐含特征,或是直接利用特征结合svm、随机森林、lightgbm等机器学习模型、或结合cnn、rnn、lstm等深度学习模型进行模型的训练。

s302、获取通话音频。

本实施例中,通话音频为任意一主叫终端与任意一被叫终端之间的正常通话音频,该通话音频为未知地理未知的音频。

s303、从所述通话音频中提取音频特征作为通信线路特征。

本实施例中,提取的通信线路特征包括动态复杂度、整帧过零率、频谱通量、整体能量、频谱带能量、最大能量频率、包络平坦度、带宽平均值、带宽标准差、过零率平均值和过零率标准差。

s304、将所述通信线路特征输入训练好的识别模型中,识别所述通话音频对应的通信线路信息;所述通信线路信息包括主叫地和运营商。

本实施例中,识别模型输出的是来自于各个来源地和各个运营商的置信度,选择置信度最高的地点和运营商标签作为主叫地的识别结果,将识别出的主叫地在被叫端进行显示,并与主叫端的电话号码归属地、运营商进行对比,以辅助判断电话是否可靠。同样,对于未能通过电话号码确定归属地、运营商的电话,也可通过本实施例确定归属地和运营商。

本实施例能够提高通信线路识别的准确性和高效性,进而提高电话通信的可靠性。

相应地,本发明还提供一种通信线路特征提取装置,能够实现上述通信线路特征提取方法的所有流程。

参见图4,是本发明实施例提供的通信线路特征提取装置的结构示意图,该装置包括:

通话连接模块31,用于通过运营商通信线路建立位于主叫地的主叫终端与位于被叫地的被叫终端之间的通话连接;

语音播放模块32,用于在所述主叫终端处播放语音;

音频获取模块33,用于在所述被叫终端处获取所述语音对应的音频;以及,

特征提取模块34,用于从所述音频中提取通信线路特征,所述通信线路特征为所述主叫地与所述被叫地之间的所述运营商通信线路的特征。

本发明提供的通信线路特征提取装置,能够在主叫终端和被叫终端之间建立通话连接后,在主叫终端处播放语音,在被叫终端处获取所述语音对应的音频,并从音频中提取音频特征,作为主叫地和被叫地之间的通话运营商通信线路的特征,提高通信线路特征提取的准确性和高效性,以便根据通信线路特征识别主叫端的所在地和所使用的运营商,提高通信线路识别的准确性和高效性,进而提高电话通信的可靠性。

所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。

另外,为简化说明和讨论,并且为了不会使本发明难以理解,在所提供的附图中可以示出或可以不示出与集成电路(ic)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本发明难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本发明的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本发明的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本发明。因此,这些描述应被认为是说明性的而不是限制性的。

尽管已经结合了本发明的具体实施例对本发明进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态ram(dram))可以使用所讨论的实施例。

本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1