不须计算取样频率误差的盲源分离方法以及音频处理系统与流程

文档序号:31369196发布日期:2022-09-02 18:43阅读:来源:国知局

技术特征:
1.一种盲源分离方法,适用于一音频处理系统,该音频处理系统包括多个装置,每一所述装置包括多个麦克风,其特征在于,该盲源分离方法包括:取得每一所述装置的每一所述麦克风所感测的一声音信号,将每一所述声音信号分为多个讯框,并对每一所述讯框执行一时间至频率域转换以产生在一时间频率域的向量x
d
[τ,k;f
d
],其中d表示所述多个装置中的第d个装置,f
d
表示该第d个装置的取样频率,τ表示所述多个讯框中的第τ个讯框,k表示第k个频率系数索引;设定一混和矩阵a[k]=[a1[k,f1]
t
,...,a
d
[k;f
d
]
t
]
t
,其中d表示所述多个装置的个数,矩阵a
d
[k;f1]对应至该第d个装置,该混和矩阵a
d
的大小为c
d
×
n,c
d
为该第d个装置的所述多个麦克风的个数,n为多个信号源的个数;对于每一所述信号源、每一所述装置及每一所述讯框,计算该向量x
d
[τ,k;f
d
]与一向量a
n,d
[k;f
d
]之间的一差异,其中该向量a
n,d
[k;f
d
]表示该矩阵a
d
[k;f1]中的第n个行,n为小于等于n的正整数;根据所述差异建立一目标函数,并根据该目标函数执行一最佳化演算法以计算该混和矩阵;以及根据该混和矩阵与所述多个装置所对应的所述向量x
d
[τ,k;f
d
]计算所述多个信号源所对应的多个原始信号,而不计算所述多个装置之间的取样频率误差。2.根据权利要求1所述的盲源分离方法,其特征在于,其中该差异为该向量x
d
[τ,k;f
d
]与该向量a
n,d
[k;f
d
]之间的余弦相似度。3.根据权利要求2所述的盲源分离方法,其特征在于,还包括:根据该差异计算一判别项,该判别项如以下数学式所示,其中r为一实数,为该向量a
n,d
[k;f
d
]的共轭转置。4.根据权利要求3所述的盲源分离方法,其特征在于,其中该目标函数表示为以下数学式,其中t为所述多个讯框的个数。5.根据权利要求4所述的盲源分离方法,其特征在于,其中执行该最佳化演算法的步骤包括:根据以下数学式计算该目标函数的一次导数,学式计算该目标函数的一次导数,
以及将该混和矩阵减去该次导数与一学习率的乘积再加上一选择性的动量项以更新该混和矩阵,或者将该混和矩阵减去该次导数与一黑赛矩阵(hessian matrix)的近似值的乘积以更新该混和矩阵。6.根据权利要求3所述的盲源分离方法,其特征在于,其中该目标函数表示为以下数学式,其中t为所述多个讯框的个数。7.根据权利要求6所述的盲源分离方法,其特征在于,其中执行该最佳化演算法的步骤包括:根据以下数学式计算该目标函数的一次导数,根据以下数学式计算该目标函数的一次导数,根据以下数学式计算该目标函数的一次导数,根据以下数学式计算该目标函数的一次导数,
以及将该混和矩阵减去该次导数与一学习率的乘积再加上一选择性的动量项以更新该混和矩阵,或者将该混和矩阵减去该次导数与一黑赛矩阵(hessian matrix)的近似值的乘积以更新该混和矩阵。8.根据权利要求1所述的盲源分离方法,其特征在于,其中根据该混和矩阵与所述多个装置所对应的所述向量x
d
[τ,k;f
d
]计算所述多个信号源所对应的所述多个原始信号的步骤包括:组成一向量其中c=∑c
d
,d为所述多个装置的个数;以及将该混和矩阵的反矩阵乘上该向量x[τ,k]以得到所述多个原始信号,或者根据该混和矩阵与该向量x[τ,k]取得一频率域遮罩,将该频率域遮罩乘上该向量x[τ,k]以得到所述多个原始信号。9.一种音频处理系统,其特征在于,包括:多个装置,每一所述装置包括多个麦克风,其中每一所述装置的每一所述麦克风用以感测一声音信号;以及一服务器,其中所述多个装置与该服务器用以执行多个步骤:(a)将每一所述声音信号分为多个讯框,并对每一所述讯框执行一时间至频率域转换以产生在一时间频率域的向量x
d
[τ,k;f
d
],其中d表示所述多个装置中的第d个装置,f
d
表示该第d个装置的取样频率,τ表示所述多个讯框中的第τ个讯框,k表示第k个频率系数索引;(b)设定一混和矩阵a[k]=[a1[k;f1]
t
,...,a
d
[k;f
d
]
t
]
t
,其中d表示所述多个装置的个数,矩阵a
d
[k;f1]对应至该第d个装置,该矩阵a
d
的大小为c
d
×
n,c
d
为该第d个装置的所述多个麦克风的个数,n为多个信号源的个数;(c)对于每一所述信号源、每一所述装置及每一所述讯框,计算该向量x
d
[τ,k;f
d
]与一向量a
n,d
[k;f
d
]之间的一差异,其中该向量a
n,d
[k;f
d
]表示该矩阵a
d
[k;f1]中的第n个行,n为小于等于n的正整数;(d)根据所述差异建立一目标函数,并根据该目标函数执行一最佳化演算法以计算该混和矩阵;以及(e)根据该混和矩阵与所述多个装置所对应的所述向量x
d
[τ,k;f
d
]计算所述多个信号源所对应的多个原始信号,而不计算所述多个装置之间的取样频率误差。10.根据权利要求9所述的音频处理系统,其特征在于,其中所述多个装置将所述声音信号传送至该服务器,由该服务器执行所述步骤(a)~(e)。11.根据权利要求9所述的音频处理系统,其特征在于,其中所述多个装置执行所述步
骤(a)~(c)以计算出多个判别项,并且将所述多个判别项传送至该服务器,其中该服务器根据所述多个判别项计算至少一讯框索引,并将该至少一讯框索引传送至所述多个装置以更新该混和矩阵。12.根据权利要求9所述的音频处理系统,其特征在于,其中该差异为该向量x
d
[τ,k;f
d
]与该向量a
n,d
[k;f
d
]之间的余弦相似度。13.根据权利要求12所述的音频处理系统,其特征在于,其中所述多个步骤还包括:根据该差异计算一判别项,该判别项如以下数学式所示,其中r为一实数,为该向量a
n,d
[k;f
d
]的共轭转置。14.根据权利要求13所述的音频处理系统,其特征在于,其中该目标函数表示为以下数学式,其中t为所述多个讯框的个数。15.根据权利要求14所述的音频处理系统,其特征在于,其中执行该最佳化演算法的步骤包括:根据以下数学式计算该目标函数的一次导数,根据以下数学式计算该目标函数的一次导数,根据以下数学式计算该目标函数的一次导数,根据以下数学式计算该目标函数的一次导数,
以及将该混和矩阵减去该次导数与一学习率的乘积再加上一选择性的动量项以更新该混和矩阵,或者将该混和矩阵减去该次导数与一黑赛矩阵(hessian matrix)的近似值的乘积以更新该混和矩阵。16.根据权利要求13所述的音频处理系统,其特征在于,其中该目标函数表示为以下数学式,其中t为所述多个讯框的个数。17.根据权利要求16所述的音频处理系统,其特征在于,其中执行该最佳化演算法的步骤包括:根据以下数学式计算该目标函数的一次导数,根据以下数学式计算该目标函数的一次导数,根据以下数学式计算该目标函数的一次导数,根据以下数学式计算该目标函数的一次导数,根据以下数学式计算该目标函数的一次导数,以及
将该混和矩阵减去该次导数与一学习率的乘积再加上一选择性的动量项以更新该混和矩阵,或者将该混和矩阵减去该次导数与一黑赛矩阵(hessian matrix)的近似值的乘积以更新该混和矩阵。18.根据权利要求9所述的音频处理系统,其特征在于,其中根据该混和矩阵与所述多个装置所对应的所述向量x
d
[τ,k;f
d
]计算所述多个信号源所对应的所述多个原始信号的步骤包括:组成一向量其中c=∑c
d
,d为所述多个装置的个数;以及将该混和矩阵的反矩阵乘上该向量x[τ,k]以得到所述多个原始信号,或者根据该混和矩阵与该向量x[τ,k]取得一频率域遮罩,将该频率域遮罩乘上该向量x[τ,k]以得到所述多个原始信号。

技术总结
本揭露提出一种不须计算取样频率误差的盲源分离方法以及音频处理系统,盲源分离方法适用于一音频处理系统,此音频处理系统包括多个装置,每一个装置包括多个麦克风。先计算每个装置感测的信号向量与混和矩阵的一行之间的差异,此差异用来建立一目标函数,接着执行一最佳化演算法来计算混和矩阵。根据混和矩阵与信号向量可以计算出原始信号而不用计算装置之间的取样频率误差。如此一来,便不需要补偿取样频率误差。偿取样频率误差。偿取样频率误差。


技术研发人员:阮海潮英 邝伟雄 甘
受保护的技术使用者:台达电子国际(新加坡)私人有限公司
技术研发日:2021.06.15
技术公布日:2022/9/1
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1