用于隔离麦克风音频的方法、装置和系统的制作方法_4

文档序号：9621057阅读：来源：国知局

自除了所校准的麦克风（即目标麦克风）之外的阵列中的所有其它麦克风的声音的延迟因子。方法400进入步骤408。
[0062] 在步骤408,实现所确定的衰减因子和延迟因子，以用于从目标麦克风所捕获的音频信号移除源自麦克风阵列中的其它麦克风的各个位置的来自目标麦克风所捕获的音频信号的音频，以例如在本发明的一个实施例通过使用波束成形处理/技术来隔离目标麦克风所捕获的音频信号。方法400进入步骤410。
[0063] 在步骤410,处理目标麦克风的隔离的音频信号，以确定目标麦克风的隔离的音频信号的音频属性。例如并且如上所述，在本发明的一个实施例中，可以通过对隔离的音频信号执行傅里叶变换来确定话音的音频属性（例如目标麦克风的所隔离的话音中的频率、平均幅度、最大幅度、第一幅度峰值的时间、幅度峰值的数量）。方法400然后进入步骤412。
[0064] 在步骤412,使用音频属性来确定目标麦克风的隔离的音频信号中的各个音频源。如上所述，在本发明的一个实施例中，通过将标准机器学习技术应用于隔离的音频信号并且应用所确定的话音属性来确定目标麦克风的隔离的音频信号中的话音源。方法400可以然后进入可选步骤414或416,或可以退出。
[0065] 在可选步骤414,标准机器学习技术应用于音频的各个源中的至少一个的隔离的音频信号（例如话音），以确定话音的所述至少一个各个源的人口统计学信息（例如性别、年龄、种族背景等）。
[0066] 在可选步骤416,目标广告导向到所确定的各个音频源中的至少一个。例如，如上所述，在本发明的一个实施例中，目标广告发放和广告可以经由例如目标显示器呈现给所识别/确定的消费者。
[0067] 已经描述了用于隔离麦克风音频的方法、装置和系统的各个实施例（其目的是说明，而不是限制），应注意，根据上述教导，本领域技术人员可以进行修改和变化。因此，应理解，可以在处于本发明的范围和精神内的所公开的本发明特定实施例中进行改变。虽然前面针对本发明的各个实施例，但可以在不脱离本发明的基本范围的情况下设计本发明的其它和另外实施例。
【主权项】
1. 一种方法，包括：使用包括麦克风阵列的至少两个麦克风来记录音频；使用所述麦克风阵列中的目标麦克风，确定用于源自所述麦克风阵列中的其它麦克风的各个位置的音频的衰减因子；使用所述麦克风阵列中的目标麦克风，确定用于源自所述麦克风阵列中的其它麦克风的各个位置的音频的延迟因子；实现所述确定的衰减因子和所述延迟因子，以用于从所述目标麦克风所捕获的音频信号移除源自所述麦克风阵列中的所述其它麦克风的各个位置的音频，以隔离所述目标麦克风所捕获的所述音频信号；处理所述目标麦克风的所述隔离的音频信号，以确定所述目标麦克风的所述隔离的音频信号的音频属性；以及使用所述音频属性来确定所述目标麦克风的所述隔离的音频信号中的各个音频源。2. 如权利要求1所述的方法，其中，所述音频属性包括话音属性，所述目标麦克风的所述隔离的音频信号中的各个话音源得以确定。3. 如权利要求2所述的方法，其中，所述处理包括：将傅里叶变换应用于所述目标麦克风的所述隔离的音频信号，以确定所述音频信号中的话音的属性。4. 如权利要求3所述的方法，其中，所述话音的属性包括频率、平均幅度、最大幅度、第一幅度峰值的时间以及幅度峰值的数量中的至少一个。5. 如权利要求2所述的方法，其中，确定所述隔离的音频信号中的各个话音源包括：将机器学习技术应用于所述隔离的音频信号，并且应用所确定的话音属性。6. 如权利要求5所述的方法，其中，所述机器学习技术包括k均值聚类。7. 如权利要求2所述的方法，包括：将标准机器学习技术应用于所述各个话音源中的至少一个的隔离的音频信号，以确定所述至少一个各个话音源的人口统计学信息。8. 如权利要求7所述的方法，其中，所述标准机器学习技术包括线性回归、判决树、 AdaBoost?以及支持矢量机器或算法中的至少一个。9. 如权利要求7所述的方法，其中，所述人口统计学信息包括话音源的性别、年龄以及种族背景中的至少一个。10. 如权利要求2所述的方法，包括：使用话音属性来确定用于所述各个话音源的语音纹。11. 如权利要求1所述的方法，其中，所述音频特性包括与产品的购买关联的可听声调的音频特性，并且从可听声调确定所购买的产品的数量。12. 如权利要求1所述的方法，包括：使用零售商所收集的信息以识别所述目标麦克风的所述隔离的音频信号中的所述各个音频源。13. 如权利要求1所述的方法，包括：对于所确定的各个音频源提供目标广告发放。14.一种装置，包括：存储器，用于存储程序例程和数据；以及处理器，用于执行所述程序例程；所述装置被配置为：使用包括麦克风阵列的至少两个麦克风来记录音频；使用所述麦克风阵列中的目标麦克风以确定用于源自所述麦克风阵列中的其它麦克风的各个位置的音频的衰减因子；使用所述麦克风阵列中的目标麦克风以确定用于源自所述麦克风阵列中的其它麦克风的各个位置的音频的延迟因子；实现所述确定的衰减因子和所述延迟因子，以用于从所述目标麦克风所捕获的音频信号移除源自所述麦克风阵列中的所述其它麦克风的各个位置的音频，以隔离所述目标麦克风所捕获的所述音频信号；处理所述目标麦克风的所述隔离的音频信号，以确定所述目标麦克风的所述隔离的音频信号的音频属性；以及使用所述音频属性来确定所述目标麦克风的所述隔离的音频信号中的各个音频源。15. 如权利要求14所述的装置，其中，所述装置包括服务器和机顶盒中的至少一个的集成音频电路。16. -种系统，包括：至少两个麦克风，包括麦克风阵列；至少一个音频源；装置，包括：存储器，用于存储程序例程和数据；以及处理器，用于执行所述程序例程，所述装置被配置为：使用包括麦克风阵列的至少两个麦克风来记录音频；使用所述麦克风阵列中的目标麦克风以确定用于源自所述麦克风阵列中的其它麦克风的各个位置的音频的衰减因子；使用所述麦克风阵列中的目标麦克风以确定用于源自所述麦克风阵列中的其它麦克风的各个位置的音频的延迟因子；实现所述确定的衰减因子和所述延迟因子，以用于从所述目标麦克风所捕获的音频信号移除源自所述麦克风阵列中的所述其它麦克风的各个位置的音频，以隔离所述目标麦克风所捕获的所述音频信号；处理所述目标麦克风的所述隔离的音频信号，以确定所述目标麦克风的所述隔离的音频信号的音频属性；以及使用所述音频属性来确定所述目标麦克风的所述隔离的音频信号中的各个音频源。17. 如权利要求16所述的系统，其中，所述至少两个麦克风包括至少一个网络音频处理器的麦克风。18. 如权利要求16所述的系统，其中，所述至少两个麦克风包括零售环境的收银通道中的麦克风。19. 如权利要求16所述的系统，其中，所述至少一个音频源包括扫描器。20. 如权利要求16所述的系统，其中，所述至少一个音频源包括出纳员和消费者。
【专利摘要】一种用于隔离麦克风音频的方法、装置和系统，包括：使用采用麦克风阵列中的目标麦克风的至少两个麦克风来记录音频；使用所述麦克风阵列中的目标麦克风来确定用于源自其它麦克风的各个位置的音频的衰减因子；确定用于源自所述麦克风阵列中的其它麦克风的各个位置的音频的延迟因子；以及实现所述所确定的衰减因子和所述延迟因子，以用于从所述目标麦克风所捕获的音频信号移除源自所述其它麦克风的各个位置的音频，以隔离所述目标麦克风所捕获的所述音频信号。所述方法、装置和系统还包括：处理所述目标麦克风的所述隔离的音频信号，以确定所述目标麦克风的所述隔离的音频信号的音频属性；以及使用所述音频属性来确定所述隔离的音频信号中的各个音频源。
【IPC分类】G10L25/48
【公开号】CN105378838
【申请号】CN201380075966
【发明人】E.约安尼迪斯, G.C.赫莱因, C.迪奥特
【申请人】汤姆逊许可公司
【公开日】2016年3月2日
【申请日】2013年5月13日
【公告号】EP2997574A1, US20160049163, WO2014185883A1

完整全部详细技术资料下载

当前第4页1 2 3 4