用于具有减少的信息损失的电子通信的系统、方法和设备与流程

文档序号:11161910阅读:397来源:国知局
用于具有减少的信息损失的电子通信的系统、方法和设备与制造工艺

本申请主张于2014年4月17日提交的申请号为61/981,010的美国临时专利申请的优先权。其涉及于2014年2月10日提交的申请号为61/938,072的美国临时专利申请以及于2015年2月9日提交的申请号为14/617,527的美国临时专利申请。这些文档中的每个的公开内容通过引用全部合并于此。

技术领域

本发明总体涉及电子通信,并且更具体地涉及具有减少的信息损失的通信系统、方法和设备。



背景技术:

在当今世界,我们广泛依赖于现代通信系统,诸如移动电话/设备、无线电、电视等。这些设备的普及性以及它们在我们日常生活中的重要性快速地增加。



技术实现要素:

公开了具有减少的信息损失的通信系统、方法和设备。在一个实施例中,该系统、方法和设备可以通过将(多个)信号或(多个)信号元素编码成传输的若干分段或部分(例如,时间窗)(例如,(多个)信号或(多个)信号元素的多个实例在多个传输时间期间被提供)向一个或多个信号、信号元素等提供冗余,以便补偿遍历具有由于例如失真、通信丢失、遮蔽等导致的信息丢失的潜在周期的传输路径。接收设备(如果被使能(enabled))可以解码被编码的(多个)信号或(多个)信号元素并执行附加处理。此类处理可以重现(多个)信号或(多个)信号元素的感知上相同的近似值。这在由于信息损失而未被接收的损失信号信息的重现中是有利的,因此减少了沿着传输路径经受的信息损失,诸如丢失、失真、遮蔽等。接收设备(如果未被使能)可以在与原始信号的未编码版本没有感知差异的情况下重现遭受潜在信息损失的原始信号。

本发明的目的是提供如下系统、方法和设备:在该系统、方法和设备中,信号(诸如音频信号)可以在传输到一个或多个接收器之前被处理。信号处理可以减少信号(例如,包含语音的信号)在传输路径中的信息损失。

本发明的进一步目标是提供如下系统、方法和设备:在该系统、方法和设备中,被处理的信号(包括附加信息)可以与未处理的信号在感知上不易区别,由此在感知上不影响不能被使能以解码处理信号的接收设备的用户的信号质量的情况下,提高传输信号的完整性。能够解码信号的设备可以被称为“使能设备(enabled device)”。

在一个实施例中,一个分段或时间窗的代理候选可以被编码在另一分段或时间窗中的频率元素内,或者可以代替另一分段或时间窗中的频率元素。在一个实施例中,该频率元素可以被相邻的频率元素遮蔽。

在一个实施例中,使用一组窄带滤波器可以比使用时间频率变换在计算上不那么密集,并且还可以降低或消除窗边界不连续的问题。

在一个实施例中,信号可以被延迟一次或多次,并且每个延迟版本可以被一组窄带滤波器进行滤波,并且延迟信号的频谱表示可以通过在每个滤波器组处消除低电平窄带滤波器的输出来生成。

在一个实施例中,具有延迟i+1的信号的频谱表示可以被存储在存储器中并被嵌入作为具有延迟i的音频信号的频谱表示中的代理。具有延迟i+2的音频信号的频谱表示可以被存储作为具有延迟i+1的音频信号的频谱表示中的代理,并且还可以被存储作为具有延迟i的音频信号的稀疏频谱表示中的代理,对于延迟i+3以此类推。

在一个实施例中,存储的代理可以被解码并用于替代遭受信息损失(例如,失真、丢失等)的延迟信号。在一个实施例中,传输的延迟可以与应用到输入音频信号的最大延迟相等。

在一个实施例中,如果没有信息损失,则存储代理中的一些或全部可以被解码并被平均化以便降低在传输信号中获得的任意噪声。

在一个实施例中,为了传输具有比传输信道的带宽更大的带宽的信号,信号中超出信道带宽的高频元素可以被编码为传输信道的频率范围内的频率下的代理。编码可以在同一个部分(延迟)内或跨多个部分(延迟)。

在一个实施例中,代理候选可以在不同的信号中被编码。例如,两个信号可以被并行传输,具有轻微延迟等,并且来自一个信号的代理候选可以在另一个中被编码。

公开了用于通过通信网络传输的处理信号的方法。在一个实施例中,该方法可以包括(1)至少一个信号处理器识别信号的第一分段;(2)该至少一个信号处理器生成信号的第一分段的表示;(3)至少一个信号处理器识别该信号的第一分段的表示的第一多个代理候选;(4)该至少一个信号处理器生成信号的第二分段的表示;以及(5)该至少一个信号处理器将第一多个代理候选编码为信号的第二分段的表示中的第一多个代理。

在一个实施例中,第二分段可以在第一分段之前。在另一个实施例中,第二分段可以在第一分段之后。

在一个实施例中,至少一个信号处理器识别信号的第一分段的步骤可以包括该至少一个信号处理器将信号划分为多个分段,每一分段具有相同的持续时间。

在一个实施例中,第一分段和第二分段可以具有不同的持续时间。

在一个实施例中,第一分段和第二分段中至少一个的持续时间可以被动态确定。

在一个实施例中,生成信号的第一分段的表示的步骤可以包括多个窄带滤波器对信号的第一分段进行滤波;以及衰减具有低于预定阈值的电平的多个滤波器的输出。

在一个实施例中,第一分段的表示和第二分段的表示可以使用时间频率变换被生成为频谱表示。

在一个实施例中,该方法可以进一步包含通过通信网络传输信号的第一分段和包括第一多个代理的信号的第二分段。信号的传输可以在检测、生成以及编码步骤中的至少一个期间被延迟。

在一个实施例中,信号的第一分段和包括第一多个代理的信号的第二分段可以在传输之前被组合。在另一个实施例中,信号的第一分段和包括第一多个代理的信号的第二分段可以被并行传输。在另一个实施例中,包括第一多个代理的信号的第二分段可以通过通信网络传输。

在一个实施例中,该信号可以包括音频信号。

在一个实施例中,该方法还可以包括至少一个信号处理器生成信号的第三分段的表示;该至少一个信号处理器识别该信号的第二分段的表示中的第二多个代理候选;以及该至少一个信号处理器将第一多个代理候选编码为信号的第三分段的表示中的第一多个代理,并将第二多个代理候选编码为信号的第三分段的表示中的第二多个代理。

公开了用于处理通过通信网络传输的信号的方法。在一个实施例中,该方法可以包括(1)至少一个信号处理器将信号划分为多个时间窗;(2)该至少一个信号处理器生成第一时间窗的表示;(3)该至少一个信号处理器识别该第一时间窗的表示中的第一多个代理候选;(4)该至少一个信号处理器生成第二时间窗的表示;以及(5)该至少一个信号处理器将第一多个代理候选编码为第二时间窗的表示中的第一多个代理。

在一个实施例中,该方法可以进一步包括该至少一个信号处理器生成第三时间窗的表示;该至少一个信号处理器识别第二时间窗的频谱表示中的第二多个代理候选;以及该至少一个信号处理器将第一多个代理候选编码为第三时间窗的表示中的第一多个代理,并将第二多个代理候选编码为第三时间窗的表示中的第二多个代理。

在一个实施例中,第一时间窗的表示、第二时间窗的表示以及第三时间窗的表示可以是频谱表示。

在一个实施例中,该方法可以进一步包括通过通信网络传输第一时间窗、包含被编码的第一多个代理的第二时间窗、以及包含被编码的第一多个代理和被编码的第二多个代理的第三时间窗。

在一个实施例中,用于处理通过通信网络传输的信号的方法可以包括(1)至少一个信号处理器识别信号的分段i;(2)该至少一个信号处理器识别要被编码为信号的分段i中的代理的分段i之后的N个分段中的多个代理候选;(3)该至少一个信号处理器生成信号的N个分段的表示;以及(4)该至少一个信号处理器将信号的N个分段的表示编码为在信号的分段i的频谱表示中被编码的多个代理。

公开了用于处理通过通信网络被接收的信号的方法,在一个实施例中,方法包括:(1)电子设备上的至少一个信号处理器接收包括多个分段的信号;(2)该至少一个信号处理器检测第一分段中的信息损失;(3)该至少一个信号处理器检索被嵌入在第二分段中的表示第一分段的第一多个代理;以及(4)该至少一个信号处理器从被检索的第一多个代理中生成第一分段的估计。

在一个实施例中,第二分段可以在第一分段之前被接收。在另一个实施例中,第二分段可以在第一分段被接收之后被接收。

在一个实施例中,至少一个信号处理器检索被嵌入在第二分段的频谱表示中的表示第一分段的第一多个代理的步骤可以包括:该至少一个信号处理器生成第二分段的表示;以及该至少一个信号处理器识别第二分段的表示中的第一多个代理。

在一个实施例中,该方法可以进一步包括该至少一个信号处理器从第三分段中检索表示第一分段的第二多个代理;并且该至少一个信号处理器从第一多个代理和第二多个代理中生成第一分段的估计。

在一个实施例中,该至少一个信号处理器从第三分段中检索表示第一分段的第二多个代理的步骤包括该至少一个信号处理器生成第三分段的表示;以及该至少一个信号处理器识别第三分段的表示中的第二多个代理。第一时间窗的表示、第二时间窗的表示以及第三时间窗的表示可以是频谱表示。

在一个实施例中,当第一分段丢失时,可以出现第一分段中的传输误差。在另一个实施例中,当第一分段失真时,可以出现第一分段中的传输误差。

在一个实施例中,在检测、检索以及生成步骤中的至少一个期间,至少一个分段的再现可以被延迟。

公开了用于在通信系统中传输信号的通信设备。在一个实施例中,通信设备可以包含:存储器;以及至少一个信号处理器,其执行如下操作:接收信号;生成信号的第一分段的表示;识别第一分段的表示中的第一多个代理候选;生成第二分段的表示;以及将第一多个代理候选编码为第二分段的表示中的第一多个代理。

在一个实施例中,信号可以从诸如扬声器和摄影机的输入设备接收。在另一个实施例中,信号可以从存储器接收。在又一个实施例中,信号可以从通信网络接收。

在一个实施例中,该至少一个信号处理器可以进一步执行如下操作:生成第三分段的表示;识别第二分段的表示中的第二多个代理候选;以及将第一多个代理候选编码为第三分段的表示中的第一多个代理,并且将第二多个代理候选编码为第三分段的表示中的第二多个代理。

在一个实施例中,该至少一个信号处理器可以使用多个滤波器来对信号的分段进行滤波以生成第一分段、第二分段和第三分段的表示,并可以衰减具有低于预定阈值的电平的多个滤波器的输出。

在一个实施例中,第一分段的表示、第二分段和/或第三分段的表示可以被至少一个信号处理器使用时间频率变换生成为频谱表示。

公开了用于处理通信系统中的接收信号的通信设备。根据一个实施例,通信设备可以包含:存储器;以及至少一个信号处理器,其执行如下操作:接收包含多个分段的信号;检测第一分段的信号中的传输误差;检索被嵌入在第二分段中的表示第一分段的第一多个代理;以及从检索的第一多个代理中生成第一分段的估计。

在一个实施例中,该至少一个信号处理器可以进一步执行如下操作:检索被编码在第三分段中的第一分段的第二多个代理;以及从第一多个代理和第二多个代理中生成第一分段的估计。

在一个实施例中,该通信设备可以进一步包含用于重现第一分段的估计的输出。

在一个实施例中,设备可以将感观信号(例如,音频、视频、触感等)编码到第二感官信号中使得第二感官信号被第一感官信号在感知上遮蔽,从而使得第二感官信号不可感知。

附图说明

为了更完整的理解本发明及其目标和优势,现在结合附图参考下列描述,在附图中:

图1描绘根据一个实施例的用于具有减少的信息损失的电子通信的示例性系统;

图2描绘根据一个实施例的用于使能传输和/或接收设备的框图;

图3描绘根据一个实施例的用于具有减少的信息损失的电子通信的方法;

图4描绘根据一个实施例的用于具有减少的信息损失的电子通信的方法;

图5是描绘根据一个实施例的在连续时间窗的序列内的内容和信号处理的表格;以及

图6描绘根据一个实施例的用于具有减少的信息损失的电子通信的方法。

具体实施方式

本发明的若干实施例及其优势可以通过参考图1-图6来理解,其中相同的参考数字指代相同的元件。

图1描绘根据一个实施例的用于减少信息损失的系统。系统100可以包括,例如,发射设备110、通信网络120以及接收设备130和140。

在一个实施例中,发射设备110和接收设备130/140可以是可以发射和/或接收信号(诸如音频、视频、文本、数据以及其他)(包括模拟信号和数字信号)的任何合适的设备。示例包括移动电话/设备、固定电话、助听器、个人放大设备、辅助听力器、视频和音频会议系统、基于IP的语音设备、流广播设备、双向无线电设备、平板计算机、台式计算机和笔记本计算机、工作站、电子阅读设备等。为了本公开的目的,尽管发射设备110和接收设备130/140都可以发射和接收音频或音频/视频信号,然而每一个将基于其在会话或传输的一部分中的作用而参考。

通信网络120可以允许发射设备110和一个或多个接收设备130/140之间通信。示例包括普通老式电话系统(POTS)、蜂窝网络、蓝牙网络及其任意组合。必要时和/或根据需要,可以使用任意合适的通信网络。

在一个实施例中,发射设备110可以在将信号传输到一个或多个接收设备130/140之前被使能以执行信号处理。在另一个实施例中,处理可以发生在沿发送设备和接收设备之间的传输路径上定位的设备/系统中,诸如蜂窝塔、网络、中继器等。该处理可以附加于或替换发生在发射设备110和/或接收设备130/140处的处理。

在一个实施例中,接收设备130可以被使能以处理/解码接收信号,从而减少信息损失,而接收设备140可以不包括这种处理能力。

尽管处理在被公开中可以被描述为发生在发射和接收设备处,然而应当认识到,处理可以涉及可能与这些设备分离的附加或替换的硬件(未示出)。此外,必要时和/或根据需要,传输路径中的附加的或替换的硬件(例如,中继器、放大器、计算机服务器、中央办公系统、蜂窝塔、电话交换机等)可以进一步或替换性地处理通信信号。例如,中继器可以处理进入的信号以减少信息损失。类似地,沿着传输路径的发射器可以生成并发射例如信号的“稀疏频谱表示”,并且可以将该稀疏频谱表示传达到随后的接收器,该接收器可以执行相反的操作。

在一个实施例中,“稀疏频谱表示”可以使用频率元素的子集近似未处理信号的全部频谱。如果在语音的稀疏频谱表示中使用16个或更多个频率元素,则产生的音频信号可以与未处理的音频信号在感知上不易区分。稀疏频谱表示的重要性能是对于数字存储、变换、处理和/或传输需要比信号的未处理的表示更少的比特。这在存储先前发射信号的数据压缩版本以及经由具有受限的信道容量(例如,低带宽、受限的比特速率)的通信路径的信号传输中是尤其有利的。在不损失信号可理解性或声音质量的情况下传输较少的比特还可以提供与通信网络的性能度量相关联的附加改善。可以被实现的改善的性能的示例包括但不限于更好的网络利用、增强的网络吞吐量等。

图2描绘用于使能的(enabled)发射和/或接收设备的框图。根据一个实施例,发射和/或接收设备200可以以软件、固件、硬件或其组合实施。在一个实施例中,系统的一部分可以在软件中被实施为可执行程序,并且可以由专用或通用计算机(诸如个人计算机、微型计算机、数字信号处理器、个人数据助理、智能电话、工作站、小型计算机或大型计算机)执行。例如,在一个实施例中,发射和/或接收设备200可以包括经由接口235通信地耦合的控制器205、存储器210、接收器/发射器215、一个或多个输入/输出(I/O)设备230、信号分析组件225以及信号处理组件220。本地接口235可以是例如不局限于一个或多个总线,或在本领域中已知的其他有线或无线连接。

在一个实施例中,信号处理220和信号分析225可以由相同的模块、硬件和/或软件执行。在另一个实施例中,非使能设备可能不需要包括信号处理220和信号分析225中的一个或多个。

在一个实施例中,本文公开的“代理(surrogate)”可以被编码使得不解码或不能解码处理信号中的代理的接收设备的用户将不会察觉处理信号的声音质量和/或可理解性的变化。如本文中使用的,“代理”指代一个或多个信号元素,诸如语音声音元素、时间元素或频率元素,其被编码以提供冗余,使得如果信号的分量例如由于失真、丢失等损失,则损失的分量的代理可以用于代替该信号以减轻或消除信息损失。有可能被损失或劣化的信号分量的代理可以被编码到同一个信号或另一个信号的表示中(例如,以信号表示的频率、时间或相位坐标(phase co-ordinate))。

参考图3,提供用于根据一个实施例的减少信息损失的方法。在步骤305中,信号可以被接收。该信号可以是音频信号、视频信号、组合等。该信号可以被直接地(例如,由人说出)或间接地(通过扬声器或通过有线或无线磁或电磁链接输送)接收等。

在步骤310中,可以识别信号的第一分段或部分(例如,时间窗)。在一个实施例中,信号可以以预定的速率被采样,可以被划分为多个分段,可以连续被识别等。在另一个实施例中,信号的第一分段可以被动态的。如果必须和/或需要,则可以使用识别信号的第一分段的其他方式。

在步骤315中,可以生成第一分段中信号的表示。在一个实施例中,该表示可以是频谱表示。如将在下文更加详细讨论的,该表示可以是频谱表示。在一个实施例中,该频谱表示可以通过将信号的该分段从时域变换到频域来获得。在另一个实施例中,可以使用一组窄带滤波器,并且具有低输出电平的窄带滤波器的输出可以被衰减或消除以使用时域处理产生音频信号的稀疏频谱表示。

在步骤320中,可以识别在信号的第一分段的表示中的至少一个代理候选(surrogate candidate)。如将在下文要更加详细讨论的,代理指代信号或信号元素(“代理候选”)的编码版本,其可以被嵌入到信号的任何位置使得如果代理候选由于丢失或失真而劣化或损失,则其可以通过解码代理来代替。

在步骤325中,可以生成第二分段中信号的表示。这可以以与上述方式相同的方式进行。

在步骤330中,第一分段中的(多个)代理候选可以被编码并被嵌入作为第二分段信号中的代理。在另一个实施例中,代理候选可以被编码并被嵌入到第二分段信号。

在步骤335中,可以发射信号的第一分段和第二分段信号。在一个实施例中,第二分段信号可以在传输之前与信号的第一分段组合。在另一个实施例中,第二分段信号可以代替信号的第一分段被发射。在又一个实施例中,第二分段信号可以与信号的第一分段并行发射。

在一个实施例中,包含第一分段的代理的第二分段可以在发射信号的第一分段之前被发射。因此如果信号的第一分段有信息损失,那么第二分段中第一分段的代理可以用于重现第一分段。

在另一个实施例中,包含第一分段的代理的第二分段可以在第一分段之后发射,并且如果第一分段由信息损失,那么第二分段中第一分段的代理可以用于重现第一分段。这可以包含延迟信号的重现。

图4描绘根据一个实施例的用于减少信息损失的方法。为了方便,该方法使用包含信号的分段或部分的时间窗来描述;应该意识到该方法不局限于使用时间窗,而是其可以与信号分段、信号部分等一起使用。

在步骤405中,输入信号fin(t)可以被输送到发射设备。在一个实施例中,音频信号可以被输送到发射和/或接收设备,例如,移动电话/设备、固定电话、助听器、个人放大设备、辅助听力设备、视频和音频会议系统、基于IP的语音设备、流无线电设备、双向无线电设备、平板计算机、台式或笔记本型计算机电脑、工作站等。在一个实施例中,音频信号可以被直接地(例如,由人说出)或间接地(通过扬声器或通过有线或无线磁或电磁链接输送)输送等。

在一个实施例中,发射设备可以执行可选的信号预处理。例如,在信号预处理期间可以应用用于改善各种音频信号性能特性(诸如信噪比、信号强度、声音质量、可理解性等)的预处理技术。这可以包括信号预白化、信号增强、信号放大、频率滤波、频率变换、噪声衰减等。必要时和/或根据需要,可以采用上述常规预处理技术或其他技术中的一种或任意组合。

在一个实施例中,信号可以作为在时域中表示的信号被输送。例如,输入时间函数fin(t)可以表示被输送到发射设备的信号。

在步骤410中,输入信号fin(t)可以被划分为连续的时间窗的序列W1、W2、W3……Wi,其中时间窗Wi内的时间函数由fini(t)表示。时间窗可以包含信号的多个离散元素。例如,信号可以被划分为时间窗的序列,每一个时间窗具有有限的持续时间,诸如20毫秒(ms)。每20ms的时间窗可以包含信号的200个数字样本。这相当于每秒10,000个样本的采样率。根据奈奎斯特香农(Nyquist-Shannon)采样定理,具有该采样率的数字系统可以发射高达10,000/2Hz=5kHz的频率而不混叠。奈奎斯特香农采样定理及其发展的描述被提供在H,Nyquist,“Certain Topics In Telegraph Transmission Theory”,Trans AIEE,vol.47,pp.617-44Apr.1928(再版为Proc.IEEE,Vol.90,No.2,Feb.2002中的经典论文)和C.E.Shannon,“Communication In The Presence Of Noise”,Proc.Institute of Radio Engineers,vol.37,no.1,pp.10-21,Jan.1949(再版为Proc.IEEE,Vol.86,No.2,(Feb 1998)中的经典论文)。这些文档的每一个的公开通过引用被全文合并于此。

在一个实施例中,给定持续时间的信号可以使用包含在时间窗中的信号元素的精简集合来近似地重建。给定持续时间的信号还可以使用包含在相邻时间窗中的信号元素的精简集合来近似地重建。序列中的时间窗可以在持续时间上相等,或者它们可以具有不同的持续时间。窗可以重叠或不重叠。

在一个实施例中,与时间信号相关联的某些参数(诸如窗的数量、窗的持续时间、每个窗内的变量的参数等)可以被预先确定。例如,时间窗可以具有在接收信号之前被确定的参数,诸如序列中的16个窗每一个均具有20毫秒(ms)的长度。在另一个实施例中,时间窗参数可以被动态确定,诸如基于信号的采样率确定(例如,信号变换为在时间周期内获得的离散样本的序列)。在另一个实施例中,时间窗参数可以基于识别的信号的时间长度来动态确定。在另一个实施例中,时间窗参数可以基于之前的、当前的和/或预计的发射信号的丢失频率来动态确定。在另一个实施例中,时间窗参数可以基于设备限制(例如,发射/接收设备的处理能力或存储器能力)或由传输信道的信息容量(例如带宽约束、比特率等)来动态确定。必要时和/或根据需要,可以使用将信号划分为时间窗的序列的其他方式。

必要时和/或根据需要,可以改变和选择时间窗的持续时间和样本的数量。

在步骤415中,可以对窗Wi中的输入音频信号fini(t)执行信号分析,以便将时间函数变换为可以在频域中表征的表示(诸如频谱表示)。例如,可以通过获得例如fini(t)的离散傅里叶变换来完成该变换,从而获得该时间信号的对应的离散频谱表示Fini(f)。

可以用于获得频谱表示的合适的变换可以包括,例如,连续傅里叶变换、离散傅里叶变换、快速傅里叶变换、连续小波变换、离散小波变换、快速小波变换以及相关变换的连续、离散、短期和快速版本,诸如Laplace、Stieltjes、Z变换、Hilbert、Gabor、Wigner、Mellin和Borel变换等。必要时和/或根据需要,可以使用任意其他合适的变换或数学运算。这些变换的短期版本适合于具有有限的持续时间(例如,20ms)的时间信号。

在一个实施例中,时间频率变换还可以借助时域内的滤波来实施。类似于离散傅里叶变换的一种此类变换使用一组连续窄带频率滤波器对时间信号进行过滤,该组连续窄带频率滤波器的中心频率与离散傅里叶变换中的离散频率相等。每个窄带滤波器的脉冲响应等于用于倍增离散傅里叶变换中的时间信号的正交正弦信号的集合中对应的频率元素的时间波形。然后,在与离散傅里叶变换中的时间窗的持续时间相等的时间间隔上对每个窄带滤波器的输出进行积分。

在一个实施例中,每个窄带滤波器可以具有与听觉的平均时间相等的平均时间。窄带滤波器的带宽可以以与听力的临界频带随频率增加相同的方式随频率增加。每个窄带滤波器的平均时间可以以与听觉的平均时间随频率变化相同的方式根据其中心频率变化。每个窄带滤波器的相移可以以与听觉的相位特征随频率变化相同的方式随频率变化。在该实施例中,由滤波器组提供的音频信号的频率表示近似于由人耳中的音频信号的外围滤波提供的音频信号的频率表示。

具有高输出电平的窄带滤波器将遮蔽具有低输出电平的邻近滤波器的输出。在一个实施例中,具有被具有高输出电平的滤波器遮蔽的低输出电平的滤波器的输出可以被衰减使得在滤波器组的输出处的音频信号的频谱表示类似于使用离散傅里叶变换或其他时间频率变换的音频信号的频域分析中的频谱的稀疏频谱表示。

在一个实施例中,具有被具有高输出电平的滤波器遮蔽的低输出电平的滤波器的输出可以被衰减使得具有高电平输出的滤波器的输出的总和在感知上与未滤波信号不易区分,尽管滤波器组中仅有一小部分的窄带滤波器可以是有效的。

在另一个实施例中,在上述实施例中为无效的窄带滤波器可以由具有有限数量的有效滤波器的其他滤波器组的代理来替代。

在一个实施例中,具有高电平输出的滤波器可以被衰减并且具有低电平输出的滤波器可以被放大以恢复稀疏频谱代理。

在一个实施例中,每个窄带滤波器的输出电平可以在时间上以定期间隔采样,以确定音频信号的频率表示如何随时间变化。

在一个实施例中,每个窄带滤波器的输出电平以与听觉的平均时间相等的时间间隔采样,以确定人耳可感知的音频信号的频谱表示中的时变变化。

在一个表示中,音频信号可以被输送到一个滤波器组i并且然后被延迟并被输送到滤波器组i+1,并且然后被延迟并被输送到滤波器i+2,以此类推直到滤波器组i+j。然后滤波器组i的输出被延迟直到到达滤波器组i+j。在每个滤波器组的输出处的稀疏频谱表示被嵌入作为滤波器组i的输出频谱表示中的代理。然后滤波器组i中所有的滤波器的输出被求和以生成包含滤波器组i+1到i+j的代理的时间信号,然后该时间信号被发射到接收设备。

该发射信号与未嵌入代理的滤波器组i的总和输出将在感知上不易区分。

在一个实施例中,接收设备可以使用时间频率变换(诸如离散傅里叶变换)或借助使用一组窄带滤波器的时域分析来解码接收的时间信号,该组窄带滤波器具有与用于生成发射信号的滤波器相同的滤波特性。

在另一个实施例中,离散傅里叶变换或相关变换可以与在处理的不同阶段实施更有利的变换的时域变换模拟结合使用。

在一个实施例中,两个过程可以并行进行。例如,在步骤415中生成的频谱表示可以继续步骤435和步骤440两者。

在步骤420中,可以创建若干时间窗(Wi到Wi+j)中的信号的一个或多个“代理”。为了说明的目的,在大多数示例中使用j=3。代理指代信号或信号元素(“代理候选”)的编码版本,该代理可以被嵌入到信号中的其他位置,使得如果代理候选由于丢失或失真而劣化或损失,其可以通过解码代理来替代。在信号的各种时间和/或频率位置中编码和嵌入代理提供冗余,该冗余可用于减少由于失真或丢失导致的信息损失。代理可以被编码以便在相同的窗或在不同窗中的信号的表示内提供冗余。代理可以是以频率和/或时间表征的变换。

在一个实施例中,稀疏频谱表示用于从若干时间窗中重现信号。稀疏频谱表示使用比全频谱表示更少的频谱元素。由于稀疏频谱表示可能需要明显较少的比特以便存储,来自若干先前的时间窗的信号可以被编码并存储在当前的时间窗中而不超出窗的可用信息容量(例如,带宽或比特数)。

代理可以被编码以便被隐写地嵌入到发射信号中。通过隐写嵌入意味着接收设备的用户不可感知的嵌入,其中该接收设备未被使能以解码嵌入的代理。用于音频信号的隐写嵌入的一种形式是在被信号中的较强频率元素(例如频谱峰)遮蔽的并且人耳听不到但是可以被电子设备检测并解码的频率元素中编码代理。用于音频信号的隐写嵌入的另一种形式是在被信号中的较强时间元素(例如,加压的语音声音)遮蔽并且人耳听不到但是可以被电子设备检测并解码的时间元素中编码代理。隐写的第三种形式可以将代理嵌入到发射信号的频谱的相位矢量中。因为耳朵对耳内相位差异不敏感,所以发射信号中嵌入代理不能被非使能接收器的用户听到。

在另一个实施例中,每一个代理可以在输入音频信号的强频率元素的遮蔽扩展范围内被编码。例如,代理可以在输入信号中的对应的强频率元素的预定频率范围(例如,50Hz以上,百分之一以上等)内被嵌入以便遮蔽代理,使得其不能被人耳听到但是可以被电子设备检测并解码。相对于对应的强频率元素,代理可以处于预定的或动态确定的强度(例如,低50%的强度、低3dB的强度等)。在对应的强频率元素的遮蔽范围内优化或最大化代理的强度、能量和/或幅度可以改进在即使在发射信号中存在噪声的情况下代理在接收后可电子检测的可能性。

在另一个实施例中,可以通过将代理嵌入在强声音的时间遮蔽扩展范围内将(多个)代理编码在时间函数内。代理还可以被嵌入到具有强频谱和时间特征的组合的声音的时间和频谱遮蔽扩展范围两者内。

在一个实施例中,(多个)代理可以被编码在输入信号的频谱表示的相位矢量中。特别地,代理的每个分量的幅度和频率可以被存储为输入信号的频谱表示中的一个或多个频谱分量的相位。由于人类听觉系统对耳内相位差异不敏感,因此该实施例可以具有对接收的音频信号的感知的最小影响。

在另一个实施例中,隐写(steganography)可以用于编码关于(多个)代理的数据(例如,原始频率、幅度、强度、相位等)。这些数据可以用于在解码期间重现或调整代理。

在又一个实施例中,可以使用到不可听范围(例如,+20kHz)的固定偏移。

可以使用上述技术中一个或多个的组合。此外,必要时和/或根据需要,可以使用编码代理的任意其他合适的方法。

隐写嵌入的类似形式可以与视频信号一起使用,诸如在被视频图像中的更强的邻近像素遮蔽的像素中嵌入视频代理。在数字化信号(音频或视频)的情况下,代理可以被嵌入到数字音频或视频样本的最低有效位中。必要时和/或者根据需要,可以采用隐写嵌入的上述形式或其他隐写技术中的一种或任意组合。

对于音频信号,选择用于代理编码的信号元素(代理候选)可以基于频率或时间变换的参数选择。例如,稀疏频谱代理可以包含基于强度选择的频率元素。可以使用用于确定(多个)代理的其它参数(诸如幅度、功率等)。

在一个实施例中,稀疏频谱代理中的频率元素的数量可以被预先确定(例如,对于语言信号16个频谱分量)。对于音乐可以使用更多数量的频谱分量。在另一个实施例中,元素的数量可以被动态确定并可以通过例如时间窗变化。

例如,窗Wi中的信号Fini(f)的窗Wi+1中的代理Fsi(t)可以包含16个或更多Fini(f)的最强频谱分量,以便提供Fini(f)的近似表示,该近似表示可以与未处理信号在感知上不易区分并且当丢失或其他信息损失影响窗Wi时可以用于替代未处理信号。当前窗或当前窗之前的一个或多个窗中的信号的代理具有减少信息损失的值,因为这些代理可以替代当前窗之后的损失窗中的信号。

在步骤425中,(多个)代理Fsi(f)可以被存储在存储器中。在一个实施例中,(多个)代理可以被存储在存储设备中,例如,发射设备的存储器。必要时和/或根据需要,可以使用任意合适的存储器(例如,远程的或本地的)。

在步骤430中,对应于当前窗之后的相邻时间窗的(多个)代理可以从存储器中检索。为了完成该检索,将发射信号延迟一个或多个窗,从而编码来自当前窗之后的窗中的代理。

例如,相邻时间窗可以看作序列中的连续时间窗或通过确定短时间范围分开的时间窗。

在一个实施例中,(多个)代理可以从存储设备中检索,例如,发射设备的存储器。例如,实施例可以检索代理Fsi+1(f)、Fsi+2(f)和Fsi+3(f),其对应于三个随后的相邻时间窗。必要时和/或根据需要,可以选择可以被检索的代理的数量。

在步骤435中,来自相邻时间窗的信号的代理可以被嵌入到当前时间窗Wi中的输入信号Fini(f)的频谱表示内。窗Wi的传输可以被延迟直到窗Wi-1、Wi-2和Wi-3中的输入信号Fini-1(f)、Fini-2(f)和Fini-3(f)的代理Fsi-1(f)、Fsi-2(f)和Fsi-3(f)分别被创建、编码并嵌入在窗Wi的输入信号Fini(f)中。作为结果,在传输之前,邻近时间窗的信号元素可以被冗余地生成并被嵌入到先前的时间窗中。类似地,表示当前时间窗Wi中的输入信号Fini(f)的(多个)代理可以被嵌入到先前的时间窗中。例如,在一个实施例中,代理Fsi+1(f)、Fsi+2(f)和Fsi+3(f)可以被嵌入在时间窗Wi+4中的输入信号的频谱表示Fini+4(f)中。因此,产生的表示Fouti+4(f)可以包含被嵌入在Fini+4(f)中的若干时间窗中的信号的(多个)代理。Fouti+4(f)中的代理信息随后可以在接收设备中被提取并解码,从而补偿信息损失,诸如窗Wi+1和/或窗Wi+2和/或窗Wi+3的丢失。

在一个实施例中,代理的编码可以使得使用未被使能以解码(多个)代理的设备的人员下将不会察觉信号的可理解性和/或声音质量的变化。

包含在当前时间窗中的信号元素的传输可以被延迟以便完成与(多个)代理相关联的创建、存储以及检索。如果已知丢失是不太可能的并且在丢失开始发生之前不需要代理的编码,则延迟可以是可选的。

在步骤440中,被编码的频谱表示Fouti(f)可以被变换到时域。在一个实施例中,可以利用逆傅里叶变换进行变换。作为结果,编码有嵌入的代理的频谱表示由时间函数fouti(t)来表示。编码信号fouti(t)可以与初始输入信号fini(t)在感知上不易区分。

在一个实施例中,逆变换可以被应用以完成到时域的变换。逆变换的示例包括但不限于逆连续傅里叶变换、逆离散傅里叶变换、逆快速傅里叶变换、逆连续小波变换、逆离散小波变换、逆快速小波变换以及相关变换的连续、离散、短期、快速逆版本,诸如Laplace、Stieltjes、Z变换、Hilbert、Gabor、Wigner、Mellin和Borel变换等。可以进行可选检查以确定接收设备是否有能力接收发射信号的频谱表示或其他代码而不是时域信号。这些变换的短期版本可以适用于具有有限的持续时间(例如,20ms的持续时间)的时间信号。

在离散傅里叶变换的时域模拟中,上述连续窄带滤波器组的总和输出提供模拟的频率时间变换。

在一个实施例中,在应用逆频率时间变换之前,还可以放大代理。这可以使发射设备能够将其能够传输的最好质量的信号发射到使能和/或非使能接收设备。

在步骤445中,连续时间窗fouti(t)、fouti+1(t)、fouti+2(t)和fouti+3(t)等中的时间信号可以被连接在一起以形成连续输出时间函数fout(t),该时间函数可以通过音频信号传输的常规方法被发射到一个或多个接收设备。

在一个实施例中,fouti(t)、fouti+1(t)和fouti+2(t)可以在fouti+3(t)被处理前被存储在存储器中。如果预期失真或丢失涉及多达j个连续窗,那么可以使用j个窗的延迟。设备的存储器能力可以能够存储并处理多达j个窗。例如,j个窗的延迟之后,fouti(t)和fouti+1(t)可以被连接,fouti+1(t)和fouti+2(t)可以被连接,fouti+2(t)和fouti+3(t)可以被连接等,以形成随后被发射的连续的时间函数fout(t)。

当fouti(t)、fouti+1(t)、fouti+2(t)和fouti+3(t)被连接在一起时,相邻时间窗间之间的边界处的不连续性可能造成可听到的咔哒声。被称为重叠相加的平滑操作通常被用于信号处理中以消除相邻时间窗之间的边界处的不连续性。该方法需要在两个平行的信道中分析信号,其中信道1中的窗的起始点出现在信道2中的并行窗的中间,使得窗重叠。在一个实施例中,例如,具有25%重叠的重叠相加程序可以用于信道1中的窗Wi+1的第一个四分之一与信道2中的窗Wi+2的最后一个四分之一重叠,并且信道2中的窗Wi+1的最后一个四分之一与信道1中的窗Wi的第一个四分之一重叠。两个信道的输出的加权总和提供从信道1中的窗Wi到信道2中的窗Wi+1的平滑过渡并提供从信道1中的窗Wi+1到信道2中的窗Wi+2的平滑过渡。尽管重叠相加程序可以减少或消除窗边界处的可感知的不连续性,但是被嵌入到窗的重叠区域中的代理可能失真。25%的重叠的情况下,每个时间窗的一半不被重叠相加程序改变。

如果在重叠相加程序中使用小于25%的重叠,那么每个时间窗的对应地更大的部分不被重叠相加程序改变,但是窗边界处的不连续性可能是可感知的。重叠相加的常规方法使用每半个窗的50%的重叠。对于这种情况,所有被嵌入的代理可能失真。

在一个实施例中,可以使用常规离散傅里叶变换的修改以便从重叠相加程序后依然完整的半个窗中的时间信号中解码代理。如果常规离散傅里叶变换被用于获得该半个窗中的信号的频谱,则推导出的离散频率谱中的频率元素之间的间隔可以是来自整个窗的时间信号的离散频谱的两倍。因此,当代理最初被嵌入到整个窗的离散频率谱中时,具有频率元素的更宽间隔的离散频率谱中的包含代理的频率元素还将包含遮蔽包含代理的弱频率元素的邻近强频率元素中的部分信号。

在一个实施例中,来自完整的半个窗的时间信号的部分可以被重复以获得持续时间与整个窗的持续时间相等的时间信号。该时间信号的频谱将具有间隔与其中被嵌入代理的离散频率谱的间隔相同的频率元素。修改的离散傅里叶变换可以被用于推导该离散频率谱以便提取完整的代理。离散傅里叶变换将时间信号乘以一组正交正弦函数,并且然后获得每个频率下乘积的总和。修改的离散傅里叶变换中的该组正交正弦函数具有与被分析的时间信号相同的结构,因为该组正弦函数组的第二半是第一半的重复。为了保持该组重复的正弦函数的正交性,对于该组的第二半,该组中是最低频率的奇数倍的每个频率元素的符号被反转。该修改利用正弦函数的奇偶对称性。

通过重复半个窗产生整个尺寸的窗,在重叠相加平滑操作之前包含在原始的整个窗中的一半信息可能损失。当通过使用修改的离散傅里叶变换推导来自完整的半个窗的重复时间信号的频谱时,具有是最低频率的奇数倍的频率的那些离散频率元素将统一为零。

在重叠相加程序中使用25%重叠以消除窗边界处的可察觉的不连续性的实施例中,代理可以被编码在是窗中的最低频率的偶数倍的频率元素中。

在一个实施例中,应用逆频率时间变换之后,识别窗的起始的代理可以被插入到变换的时间信号中。例如,这可以使用遮蔽的时间扩展来完成。

在平滑化以消除窗边界处的可感知的不连续性之后并且在发射fout(t)之前,识别在先前分析中使用的窗的起始样本的代理可以被编码在fout(t)中。代理以平均相当于窗的持续时间的间隔被编码,其中具有一些余地以允许代理以标称编码时间的一个窗持续时间内的fout(t)的最强时间代理被编码。

必要时和/或根据需要,可以使用各种技术来提供各个组件(例如,处理器、存储器等)之间的通信以及允许组件与任意其他组件通信(例如,使得组件可以获得进一步的指令,可以访问并使用远程存储器存储等)。例如,用于提供这种通信的技术可以包括网络、互联网、内联网、外联网、局域网(LAN)、以太网、经由蜂窝塔或卫星的无线通信、或提供通信的任意客户端服务器系统。例如,该通信技术可以使用任意合适的协议,诸如TCP/IP、UDP或OSI。因此,可以预期各种不同的配置。

在一个实施例中,关于接收和发射设备的信息可以在通信的任意部分被交换,包括,例如在初始设置期间、在周期性测试、反馈评估期间等。

图5说明根据一个实施例的在连续时间窗的序列中的内容和信号处理,其中四个连续时间窗中的信号的代理被嵌入到待传输的信号中。尽管该示例说明用于三个分段或三个时间窗的三个代理的使用,然而应该认识到在必要时和/或根据需要,可以选择分段/时间窗和/或所使用的代理的数量。此外,在一个实施例中,在必要时和/或根据需要,还可以使用不连续的时间窗/分段、其他信号中的时间窗/分段等。

在第一行515中,识别五个连续的时间窗Wi、Wi+1、Wi+2、Wi+3和Wi+4。Wi+1是紧接在当前时间窗Wi之后的时间窗。时间窗Wi+2在时间窗Wi+1之后,时间窗Wi+3在时间窗Wi+2之后,并且时间窗Wi+4在时间窗Wi+3之后。

在第二行520中,每个输入音频信号被输送到信号处理器(例如,发射器),在每个对应的时间窗中,可以分别识别fini(t)、fini+1(t)、fini+2(t)、fini+3(t)和fini+4(t)。

在第三行525中,可以分别识别输入时间函数的频谱表示Fini(f)到Fini+4(f)。

在第四行530中,可以识别紧接在时间窗之前的信号的代理。例如,窗Wi+1可以包含在之前的窗中的信号Fini(f)的代理Fsi(f);窗Wi+2可以包含在之前的窗中的信号Fini+1(f)的代理Fsi+1(f);窗Wi+3可以包含在之前的窗中的信号Fini+2(f)的代理Fsi+2(f);以及窗Wi+4可以包含在之前的窗中的信号Fini+3(f)的代理Fsi+3(f)。由于大部分信号处理在频域中,因此信号及其代理可以在其频率表示方面来列举。因为若干代理需要被嵌入到每个窗中的待发射信号中,所以对于代理使用稀疏频谱表示。对于稀疏频谱表示可以需要明显更少的比特,由此允许若干代理被有效地嵌入到发射信号中。

在第五行535中,可以识别在感兴趣的时间窗之后的后续2个时间窗的时间窗中的信号的代理。例如,窗Wi+1可以包含信号Fini-1(f)的代理Fsi-1(f),其是Wi+1之后的2个窗。窗Wi+2可以包含信号Fini(f)的代理Fsi(f),其是Wi+2之后的2个窗。窗Wi+3可以包含信号Fini+1(f)的代理Fsi+1(f),其是Wi+3之后的2个窗。窗Wi+4可以包含信号Fini+2(f)的代理Fsi+2(f),其是Wi+4之后的2个窗。

在第六行540中,可以识别感兴趣的时间窗之后的后续3个时间窗的时间窗中的信号的代理。例如,窗Wi+1可以包含信号Fini-2(f)的代理Fsi-2(f),其是Wi+1之后的3个窗。窗Wi+2可以包含信号Fini-1(f)的代理Fsi-1(f),其是Wi+2之后的3个窗。窗Wi+3可以包含信号Fini(f)的代理Fsi(f),其是Wi+3之后的3个窗。窗Wi+4可以包含信号Fini+1(f)的代理Fsi+1(f),其分别是Wi+4之后的3个窗。

在第七行550中,可以分别识别545的输出信号的频谱Fouti+1(f)到Fouti+4(f)。例如,Fouti+4(f)可以包括输入信号Fini+4(f)的频谱,在窗Wi+4中隐写地嵌入有三个代理Fsi+1(f)、Fsi+2(f)和Fsi+3(f)。

在第八行550中,可以分别识别列举为时间的函数的输出信号fouti+1(t)到fouti+4(t)。然后这些信号可以被发射。

在此说明性实施例中,时间窗Wi+4中的发射输出信号fouti+4(t)包含分别在时间窗Wi+1、Wi+2和Wi+3中的输入信号Fini+1(f)、Fini+2(f)和Fini+3(f)的代理Fsi+1(f)、Fsi+2(f)和Fsi+3(f)。如果这些时间窗中的任意时间窗中的信息损失(例如,由于通信丢失、若干信号失真、或任意其他形式的信息损失),对应于损失窗的代理可以被用于替代损失的信息。

由于例如多个通信丢失造成的较长周期的信息损失可以潜在地影响传输路径中多于一个的时间窗。然而,在一个实施例中,编码多个相邻时间窗的多个代理可以减少长周期的信息损失的信息损失。

在第八行550中,识别表征音频信号的信号表示的传输。根据一个实施例,待发射的音频信号可以包含一个或多个代理,该一个或多个代理可以近似多个相邻时间窗中的输入信号。每个时间窗可以包括表征在时间窗中识别的信号元素的离散信号元素。特别地,例如,多个信号表示可以在某一持续时间内被发射,其可以包括序列中的连续时间窗Wi+1、Wi+2、Wi+3和Wi+4中每一个的信息。在一个实施例中,窗Wi+4中的信号表示fouti+4(t)在时域中包括信号元素,该信号元素包含在时间窗Wi+1、Wi+2和Wi+3中,例如,被嵌入的代理Fsi+1(f)、Fsi+2(f)和Fsi+3(f)被编码在fini+4(t)的频谱表示中。

例如,编码函数C[Fini(f)]可以将(多个)代理编码到Fini(f)的相位矢量中以便创建Fouti(f)。这可以通过将每个对应的代理(频率和幅度)的坐标编码到Fini(f)的相位矢量中来完成。因此,可以创建被编码的合成频谱表示Fouti(f)。在该示例中,由于耳朵对耳内相位差异不敏感,因此操纵相位矢量对Fouti(f)的感知可以具有很小的影响或没有影响。

在发射设备处,或在传输之前,串联的时间窗W1、W2……Wi中的时间信号可以被接合在一起以形成用于向另一个设备传输的连续时间信号fout(t)。合成的编码信号的时间表示fout(t)(包括编码在fout(t)的频谱中的多个代理)可以稍后被发射到接收设备或其他信号处理器。因此,接收设备/信号处理器可以接收frcvd(t),其中frcvd(t)=fout(t)加fN(t),其中frcvd(t)由接收器接收的信号;fout(t)是由发射器发送的信号,并且fN(t)是在传输路径中获得的噪声。同样,因为frcvd(t)包含fout(t)加一些噪声fN(t);并且fout(t)包含具有编码在fin(t)的频谱表示中的代理的fin(t),或一些编码代理的其他隐写方法,因此被编码的代理可能也具有一些噪声。这些代理包含冗余信号信息,该冗余信号信息在之前的时间窗中的任意或全部时间窗经历信息损失(诸如通信丢失)时可以被用于从接收的时间窗Wi-1、Wi-2……Wi-j中近似重建信号元素。

在另一个实施例中,代理可以以时间窗Wi+1、Wi+2……Wi+j的相反序列被接收。

在一个实施例中,发射传输冗余可以通过发射跨多个时间窗的代理的多个实例来完成。发射信号的多个代理中实现的冗余可以进一步补偿信息损失。增加时间窗的数量可能以附加代理的形式需要附加的冗余,该附加代理可能需要附加的存储器并且可能在提取和解码代理时需要的更长时间的延迟。例如,可能经历通信丢失达跨越J个时间窗的持续时间。为了补偿涉及J个窗的任意组合的通信丢失(包括所有J个窗的通信丢失),可能需要J个代理的存储和编码,以及可能等于J个窗的持续时间的延迟。在另一个实施例中,该延迟可以比J个窗更短或更长。

使用较少的比特来编码每个代理,大量的代理可以被嵌入到发射信号中。减少用于编码代理的比特的数量允许较长的持续时间的丢失被覆盖,但代价是降低恢复信号的质量。在一个实施例中,代理可以使用自适应策略来编码,借此对于短持续时间的丢失,被恢复信号的质量与无失真的不间断发射信号在感知上不易区分。对于长持续时间的丢失,代理的自适应编码可以被实施使得被恢复信号可识别而没有中断,但是具有降低的信号质量。

在一个实施例中,必要时和/或根据需要,可以提供可能以其他方式受到传输路径中的信息损失影响的信号的附加编码。

在一个实施例中,如果由接收设备接收的至少一个窗包含(多个)丢下的时间窗的(多个)代理,则可以提供对可能在跨越多个连续时间窗的丢失期间损失的信号信息的补偿。在一个实施例中,在多个代理被接收时,接收设备可以将其组合以提供损失信号信息的更好的近似。

代理Fsi+1(f)的三个独立版本可在三个连续窗Wi+2、Wi+3和Wi+4的群组中得到。当处理窗Wi+4时,可以解决来自窗Wi+1的通信丢失的信息损失。当处理窗Wi+4时补偿窗Wi+1的丢失可以引入与三个时间窗的持续时间相等的时间延迟。

在较少窗中采用信号的代理的实施例可以降低补偿信息损失的时间延迟,但在降低可能的丢失和其他形式的信息损失中具有降低的效果,尤其是在多于一个的相邻时间窗遭受丢失或信息损失的情况下。

使用来自更大数量的时间窗的代理不仅改善减少涉及多于一个的相邻时间窗的信息损失中的效果,并且其还可以改善接收信号的信噪比,因为在传输路径中获得的噪声降低接收信号中的信噪比,并且伴随着降低对应的代理中的信噪比。平均化来自不同时间窗中的共同的代理是改善信噪比的有效方式,必要时和/或根据需要,可以使用组合共同的代理的附加方法。

图6描绘根据一个实施例的用于在接收设备处减少信息损失的方法。如图4中,并且为了方便,该方法使用信号时间窗描述;应该认识到该方法不限于使用时间窗,并且其可以与信号分段、信号部分等一起使用。

如上所述,到该接收设备的输入可以是被编码和被发射的信号。为了说明的目的,该信号包括用于三个相邻窗的编码代理。图6中描绘的接收设备接收并解码嵌入有编码在信号的其他部分中的信号分段的代理的信号。

在步骤605中,信号可以被接收设备接收并检测。在一个实施例中,接收的音频信号作为时间函数frcvd(t)被接收,其中frcvd(t)等于发射信号fout(t)加噪声fN(t),该噪声fN(t)可以在传输路径中获得。在另一个实施例中,信号可以作为再生信号、稀疏频谱表示、或适合接收设备的能力的其他编码被接收。

在步骤610中,可以进行确定以确定接收设备是否被使能或以其他方式能够解码编码代理。

在一个实施例中,如果接收设备被确定为是非使能的,则在步骤660中信号在不处理或解码代理的情况下输出。

在另一个实施例中,可以假设该设备是使能设备或非使能设备。这可以基于例如通信网络、设备类型等。在另一个实施例中,可以使用接收设备的默认类型。

在一个实施例中,如果接收设备被确定为是使能接收设备,则在步骤615中,接收设备确定在一个或多个时间窗期间是否检测到信息损失。例如,经历信息损失的连续时间窗的数量,或基于先前的传输可能经历信息损失的连续时间窗的预期数量可以用于确定多少个随后的时间窗需要代理以最小化信息损失。该确定可以动态完成以减少编码和发射代理中的时间延迟。必要时和/或根据需要可以使用用于确定时间窗的数量的其他方法和技术。

在一个实施例中,信息损失可以基于感测的通信中断、信息的部分损失、在特定时间周期期间无信息被接收、从发射器中接收的指示等来确定。必要时和/或根据需要,可以采用上述常规信息损失检测技术或其他技术中的一个或任意组合。

在一个实施例中,如果信息损失(例如,通信丢失)没有被接收设备感测到(例如,没有信息丢失的指示),则然后在步骤660中,接收设备可以在不处理以解码代理的情况下向倾听者输出信号。必要时和/或根据需要,可以应用任意其他信号处理以改善信号质量。

在一个实施例中,如果信号作为频谱表示被接收,则然后在步骤660中向用户输出时域信号之前,逆变换可以与在必要和/或根据需要用来改善信号质量的任意其他信号处理一起被应用。

在步骤620中,接收信号frcvd(t)可以被划分为连续时间窗的序列。输入信号frcvd(t)可以被划分为连续时间窗W1、W2、W3……Wi的序列,其中时间窗Wi内的时间函数由frcvd(t)表示。因此,被识别的窗与发射设备中的时间窗同步。窗Wi+4中的时间信号frcvdi+4(t)包含fouti+4(t)加一些噪声fNi+4(t),并且fouti+4(t)包含fini+4(t)与具有被编码在fini+4(t)的频谱表示中的代理Fsi+1(f)、Fsi+2(f)和Fsi+3(f),或编码代理的一些其他隐写方法。代理包含冗余信号信息,至少在经历信息损失(诸如通信丢失、失真等)的情况下,该冗余信号信息可以潜在地用于从接收的时间窗Wi+1、Wi+2和Wi+3中近似重建在任意或全部之前的时间窗中的信号元素。

在一个实施例中,以frcvd(t)的强时间分段被编码的至少一个代理可以被识别并被解码以识别由发射设备使用的时间窗的初始样本。该信息可以用于将frcvd(t)划分为连续时间窗的序列W1、W2、W3……Wi,这些时间窗与发射设备使用的对应的时间窗同步,并且其中Wi中的时间信号由frcvdi(t)表示。由于每个时间窗中的样本的数量是已知的,因此在解码窗的起始样本中的误差可以根据相邻窗的初始样本上的数据修正。

在步骤625中,可以对接收信号frcvdi(t)执行信号分析以便将时间函数变换为可以在频域中表征的频谱表示。变换可以利用frcvdi(t)的时间频率变换来完成。如上所述,在编码代理中使用的相同变换可以被使用以便生成信号的频谱表示Frcvdi(f)。随后,Frcvdi(f)可以被用于采用为了信号和相关联的(多个)代理的进一步分析。

在步骤630中,识别起始样本的时间函数中的至少一个代理也可以识别包含代理的频率元素,该代理进而包含何处去寻找被嵌入在频率元素中的其他代理的信息。

在步骤635中,一个或多个代理可以从频谱表示Frcvdi(f)中提取。提取并解码代理可以通过识别强频率元素的遮蔽范围或相位矢量中的任一者中或者频带偏移等中的(多个)代理来完成。

在一个实施例中,来自多个相邻时间窗的代理Fsi+1(f)、Fsi+2(f)和Fsi+3(f)的代理可以从表示Frcvdi+4(f)中提取。在提取之后剩余的频谱分量(即,没有代理的信号)可以包含频谱Ftempi+4(f),其中Ftempi+4(f)等于Fini+4(f)加上传输路径中获得的噪声FNi+4(f)。

在一个实施例中,可以采用存储器以存储与多个相邻时间窗相关联的临时频谱。例如,临时频谱Ftempi+1(f)、Ftempi+2(f)和Ftempi+3(f)可以被存储在接收设备的存储器中。必要时和/或根据需要,可以使用任意合适的存储器(即,远程的或本地的)。在一个实施例中,可以使用堆栈式存储器(例如,先进先出)以便当保存新的临时频谱时,可以丢弃较旧的临时频谱。

在步骤640中,被提取或解码的代理Fsi+1(f)、Fsi+2(f)和Fsi+3(f)可以被存储在存储器中。在一个实施例中,(多个)代理可以被存储在存储设备中,诸如发射设备的存储器。必要时和/或根据需要,可以使用任意合适的存储器(即,远程的或本地的)。在一个实施例中,可以使用堆栈式存储器(例如,先进先出)以便当保存新的代理时,可以丢弃较旧的代理。

在一个实施例中,可以采用存储器来存储从多个相邻时间窗中提取的代理。例如,代理Fsi+1(f)、Fsi+2(f)和Fsi+3(f)可以如图5中所示地分别从窗Wi+2、Wi+3和Wi+4中提取,并被存储在存储器640中。

在存储器中,代理Fsi-1(f)、Fsi(f)和Fsi+1(f)也可以被存储。例如,如图5所示,这些代理与窗Wi+2相关联。与窗Wi+3相关联的代理Fsi(f)、Fsi+1(f)和Fsi+2(f)可以被存储,并且通过图5中的窗Wi+4识别的代理Fsi+1(f)、Fsi+2(f)和Fsi+3(f)可以被存储。因此,可以在单独的窗中被接收的代理Fsi+1(f)的多个版本(即,时间窗Wi+2、Wi+3和Wi+4中的信号的代理)可以被解码,并且随后信号元素信息被组合,由此在必要时补偿窗Wi+1中的信息的损失。来自单独的时间窗中的代理Fsi+1(f)的版本将由于在传输路径中获得噪声而略有不同。可以组合Fsi+1(f)的单独的版本以降低传输过程中获得的噪声。

在步骤645中,临时频谱Ftempi+1(f)从存储器650中检索,并且代理Fsi+1(f)的对应的可用版本从存储器中检索(即,Fsi+1(f)的单独版本从窗Wi+2、Wi+3和Wi+4中获得并存储在存储器中)。

在步骤655中,如果窗Wi+1遭受通信丢失或其他形式的信息损失,则多个代理可以被用于替代任意损失的信息。即使在若干相邻窗遭受通信丢失时三个Fsi+1(f)代理中的两个也丢失的情况下,损失的信息也能够被检索。在另一个实施例中,如果Fsi+1(f)的多于一个的版本可用,则可以组合Fsi+1(f)的单独的版本以降低在传输过程中获得的噪声。如上所述,代理也可以具有在传输过程中获得的一些噪声。可以采用组合的(多个)Fsi+1(f)代理以再生更精确的近似来替代由于信息损失而遗漏的输入信号(例如,语音)的信号元素。

在一个实施例中,如果没有信息损失,但是接收信号在传输过程中获得一些噪声,则估计的信号Fini+1(f)及其代理Fsi+1(f)的三个版本(其也是Fini+1(f)的估计)可以被平均化以获得具有改善的信噪比的Fini+1(f)。

接收信号frcvd(t)包含与发射的时间窗同步的一系列时间窗。如果没有信息损失,诸如丢失,则窗Wi中的接收信号frcvdi(t)包含发射信号fouti(t)和在传输过程期间获得的噪声fNi(t)。在当前示例中,采用三个代理的组以提供对丢失和其他形式的信息损失的抗扰性。

接收信号可以包括一系列时间窗,并且每个时间窗可以包含编码的(多个)代理。对于本示例中考虑到具体案例,如果代理Fsi+1(f)是感兴趣的,那么该代理可以被编码在窗Wi+2、Wi+3和Wi+4中接收的信号表示中。对上述窗采用的编码函数可以生成接收信号。

代理可以从接收信号中提取并被恢复为其原始形式。然而,在传输路径中获得的噪声将导致具有一些背景噪声的恢复信号。如果窗Wi+1由于丢失被损失,那么窗Wi+1中的信号Fini+1(f)可以被其代理Fsi+1-(f)替代。在存储器中有Fsi+1(f)的3个单独的版本,每个具有在传输中获得的一些噪声。Fsi+1(f)的三个版本的平均将是Fini+1(f)的具有较高信噪比的改善的估计。如果窗Wi+1和Wi+2由于丢失而损失,则存在Fsi+1(f)的两个剩余版本允许具有较低信噪比的信号Fini+1(f)的恢复。如果窗Wi+1、Wi+2和Wi+3由于丢失而损失,则仅有Fsi+1(f)的一个版本剩余允许具有更差的信噪比的信号Fini+1(f)的恢复。因此,在丢失的持续时间和用于在具有丢失的噪声信道中传输的恢复信号的信噪比之间具有可预测的权衡。

在一个实施例中,通过来自相邻时间窗的输入信号的代理平均化从接收信号中提取的输入信号可以在噪声传输路径中传输之后改善信噪比。如果时间窗中的信息由于丢失或其他形式的信息损失而损失,相邻时间窗中的损失信号的一个或多个代理可以用于减少信息损失。

如果传输路径有噪声,则遗失信息的替换也将受噪声影响。如果多于一个的代理可用,则通过平均化来自单独的时间窗中的代理有可能改善遗失的信息的估计。如果不存在由于丢失或其他形式的信息损失而导致的损失信号,则该技术也可以用于改善通过有噪声的传输路径传输的信号的信噪比。在该实施方式中,从接收信号frcvdi(t)中提取的噪声输入信号fini(t)+fNi(t)通过来自相邻的窗中的fini(t)的代理被平均化以改善信噪比。

在一个实施例中,对信号的近似进行再生可以通过将代理变换回到其频率和时间中的原始值来完成。例如,频率时间变换(诸如逆傅里叶变换)可以应用于代理,从而将信号恢复到时域。必要时和/或根据需要可以使用上述其他逆操作。可以进一步采用再生的近似来替代由于信息损失而导致的输入信号(例如,语音)的遗漏的信号元素,或替代遭受严重失真的信号。

可选地,信号在完成处理以便减少信息损失之后可以向人员输出。

在下文中,将描述本发明的系统、设备和方法的实施例的一般方面。

例如,本发明的系统或本发明的系统的部分可以是“处理组件”的形式,诸如通用计算机。如在此使用的,术语“处理组件”将被理解为包括使用至少一个存储器的至少一个处理器。该至少一个存储器存储一组指令。指令可以永久性地或临时地存储在处理机器的存储器或多个存储器中。处理器执行存储在存储器或多个存储器中的指令以处理数据。该组指令可以包括执行特定任务或多个任务(诸如上述那些任务)的各种指令。用于执行特定任务的该组指令可以被表征为程序、软件程序或简单软件。

如上所述,处理机器执行存储在存储器或多个存储器中的指令以处理数据。例如,数据的处理可以响应于处理机器的用户或多个用户的命令、响应于先前处理、响应于另一个处理机器和/或任意其他输入的请求。

如上所述,用于实施本发明的处理机器可以是通用计算机。然而,上文所描述的处理机器还可以使用任意广泛的各种其他技术,包括专用计算机、包括例如微型计算机、迷你计算机或大型机的计算机系统、程序化微处理器、微控制器、外部集成电路元件、CSIC(客户专用集成电路)或ASIC(专用集成电路)、精简指令集计算机(RISC)或其他集成电路、逻辑电路、数字信号处理器、可编程逻辑器件(诸如FPGA、PLD、PLA或PAL)、或能够实施本发明的过程的步骤的任意其他设备或设备的布置。这些处理机器中任意或全部可以在各种设备(诸如,移动电话/设备、固定电话、助听器、个人放大设备、辅助听力设备、视频和音频会议系统、基于IP的语音设备、流广播设备、双向无线电设备、平板计算机、台式计算机和笔记本计算机、工作站、电子阅读设备等)中实施。

被用来实施本发明的处理机器可以使用合适的操作系统。因此,本发明的实施例可以包括运行在下列系统中的处理机器:iOS操作系统、OSX操作系统、安卓操作系统、Microsoft WindowsTM 8操作系统、Microsoft WindowsTM 7操作系统、Microsoft WindowsTMVistaTM操作系统、Microsoft WindowsTM XpTM操作系统、Microsoft WindowsTM NTTM操作系统、WindowsTM 2000操作系统、Unix操作系统、Linux操作系统、Xenix操作系统、IBM AIXTM操作系统、Hewlett-Packard UXTM操作系统、Novell NetwareTM操作系统、Sun Microsystems SolarisTM操作系统、OS/2TM操作系统、BeOSTM操作系统、Macintosh操作系统、Apache操作系统、OpenStepTM操作系统或另一操作系统或平台。

应认识到,为了实施如上所述的本发明的方法,处理器和/或处理机器的存储器不一定物理地位于相同的物理或地理位置。即,处理器和由处理机器使用的存储器中的每一个可以在地理上位于不同位置并被连接以按照任意合适的方式通信。此外,应认识到,处理器和/或存储器中的每一个可以包含不同的物理设备件。因此,处理器不一定是在一个位置中的单个设备件并且存储器是在另一个位置中的另一个单个设备件。即,预期处理器可以是在两个不同物理位置中的两个设备件。设备的两个不同件可以以任何合适的方式连接。此外,存储器可以包括在两个或更多物理位置中的存储器的两个或更多部分。

为了进一步说明,如上所述的处理通过各种组件和各种存储器执行。然而,应认识到,根据本发明进一步的实施例,由如上所述的两个不同组件执行的处理可以由单个组件执行。进一步,由一个如上所述的不同组件执行的处理可以由两个不同组件执行。以类似的方式,根据本发明的进一步实施例,由两个如上所述的不同存储器部分执行的存储器存储可以由单个存储器部分执行。进一步,由一个如上所述的不同存储器执行的存储器存储可以由两个存储器部分执行。

进一步,各种技术可以用于提供各种处理器和/或存储器之间的通信,并允许本发明的处理器和/或存储器与任意其他实体通信,即,例如以便获得进一步指令或接入并使用远程存储器存储。例如,用于提供该通信的该技术可以包括网络、互联网、内联网、外联网、局域网、以太网、经由蜂窝塔或卫星的无线通信、或提供通信的任意客户端服务系统。例如,该通信技术可以使用任意合适的协议,诸如TCP/IP、UDP或OSI。

如上所述,一组指令可用于本发明的处理。该组指令可以是程序或软件的形式。例如,软件可以是系统软件或应用软件的形式。例如,软件还可以是单独程序的集合、大型程序中的程序模块或程序模块中的一部分。使用的软件还可以包括面向对象程序设计形式的模块程序。软件通知处理机器通过被处理的数据做什么。

进一步,应认识到,用在本发明的实施方式或操作中的指令或一组指令可以是使得处理机器可以读取指令的合适的形式。例如,形成程序的指令可以是合适的编程语言的形式,该编程语言可以转换为机器语言或目标代码以允许处理器或多个处理器读取指令。即,在特定的编程语言中,编程代码或源代码的写入线使用编辑器、汇编器或解释器转换为机器语言。例如,机器语言是针对特定类型的处理机器(即,针对特定类型的计算机)的二进制编码机器指令。计算机理解机器语言。

根据本发明的各种实施例,可以使用合适的编程语言。说明性地,例如,使用的编程语言可以包括汇编语言、Ada、APL、Basic、C、C++、COBOL、dBase、Forth、Fortran、Java、Modula-2、Pascal、Prolog、REXX、Visual Basic、和/或JavaScript。进一步,单个类型的指令或单种编程语言不一定与本发明的系统和方法的操作结合使用。当然,必要时和/或根据需要,可以使用任意数量的不同编程语言。

并且,如果需要,用于本发明的实施中的指令和/或数据可以使用任意压缩或加密技术或算法。加密模块可以用于加密数据。进一步,例如文件或其他数据可以使用合适的解密模块来解密。

如上所述,本发明可以说明性地以处理机器的形式来体现,包括例如包括至少一个存储器的计算机或计算机系统。应认识到,根据需要,能够使计算机操作系统执行如上所述的操作的一组指令(即,例如软件)可以包含在任意广泛的各种介质或多种介质上。进一步,由该组指令处理的数据也可以包含在任意广泛的各种介质或多种介质上。也就是说,例如用于保持该组列指令和/或用于本发明的数据的特定介质(即,处理机器中的存储器)可以采用任意各种形式的物理形式或传输。说明性地,介质可以是纸、透明纸、磁盘、DVD、集成电路、硬盘、软盘、光盘、磁带、RAM、ROM、PROM、EPROM、电线、电缆、光纤、通信信道、卫星传输、存储卡、SIM卡、或其他远程传输,以及任意其他可由本发明的处理器读取的介质或数据源。

进一步,如果需要,用于实施本发明的处理机器的存储器或多个存储器可以是允许存储器保持指令、数据或其他信息的任意各种形式。因此,存储器可能是保持数据的数据库的形式。例如,数据库可以使用文件的任意需要的布置,诸如平面文件布置或相关的数据库布置。

在本发明的系统或方法中,可以使用各种“用户接口”以允许用户与处理机或用于实施本发明的机器或多个机器接合。如本文所使用的,用户接口包括处理机器所使用的允许用户与处理机器接合任意硬件、软件或硬件和软件的组合。例如,用户接口可以是对话屏的形式。如果用户接口处理一组指令和/或为处理机提供指令,用户接口还可以包括任意鼠标、触摸屏、键盘、按键、声音朗读器、声音识别器、对话屏、菜单框、列表、复选框、扳钮开关、按钮或允许用户接收关于处理机器的操作的信息的任意其他设备。因此,用户接口是提供用户和处理机器之间通信的任意设备。例如,由用户通过用户接口向处理机提供的信息可以是命令、数据选择或一些其他输入的形式。

如上所述,用户接口利用执行一组指令的处理机器使得处理机器为用户处理数据。用户接口通常由处理机器用于与用户相互作用以传达信息或接收来自用户的信息。然而,应认识到,根据本发明的系统和方法的一些实施例,人类用户不一定实际与本发明的处理机器所使用的用户接口交互。当然,还可以预期本发明的用户接口可以与另一个处理机器(即传达或接收)而不是人类用户交互。因此,另一个处理机器可以表征为用户。进一步,可以预期用于本发明的系统和方法中的用户接口可以与另一个处理机器或其他处理机器部分交互,同时还可以与人类用户部分交互。

本领域技术人员将容易理解本发明易受广泛的实用性或应用影响。本文描述的那些实施例之外的本发明的许多实施例和改编以及许多变化、修改和等同布置将根据本发明及其之前的描述变得明显,或根据本发明及其之前的描述的合理建议将变得明显,但不脱离本发明的实质或范围。

因此,尽管本发明在此关于其实施例详细描述,但应当理解该发明仅仅是本发明的说明和示例并且进行该描述以提供本发明的有效发明。因此前述发明不旨在诠释或限制本发明或以其他方式排除任意其他此类实施例、改编、变化、修改或等同布置。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1