在呼叫方侧替换电话待机音乐的方法和装置的制造方法

文档序号:9380570阅读:459来源:国知局
在呼叫方侧替换电话待机音乐的方法和装置的制造方法
【技术领域】
[0001]本发明涉及通信领域,尤其涉及在被置于待机状态的电话呼叫中对音频内容进行操控。
【背景技术】
[0002]常见的电话功能是将用户置于“保持”或者“待机(on-hold)”状态。当第一用户将第二用户置于待机状态时,在连接被保持的同时,第一用户的手持设备从该连接断开。这使得第一用户能够进行另一呼叫或者离开手持设备。当保持功能或状态被使能时,第二用户可以被连接至接收信号路径的另一信号源(例如,广播新闻或者预先记录的消息)。用于待机连接的非常常见的信号源是被称为“待机音乐”的预先记录或者广播的音乐,其中当连接处于待机状态时,音乐选择被传送至接收端。音乐选择在第二用户的手持设备接收端被播放,直到待机状态终止为止。
[0003]第二用户一般无法对待机音乐进行控制。一些类型的待机音乐可能是令人反感或讨厌的。因此,一般需要用由第二用户选择并在连接的第二用户侧提供的其他内容来替换待机音乐。这一需求导致允许在电话连接中替换待机音乐的各种方法和装置的开发。
[0004]例如,W02009/073035公开了一种无线电话手持设备,其中,当处于待机状态时,该手持设备允许用户选择用于手持设备接收端的媒体播放、以及随后在待机状态终止时被用信号通知的一个或多个源。待机状态的检测是通过检测待机音乐或接收待机信令实现的。媒体源位于用户的手持设备中或者通过在手持设备和网络之间建立的单独连接被访问。
[0005]类似地,US7, 136,479公开了在电话接收端用来自本地源的音频内容来替换待机音乐。在待机音乐被检测到时,本地音频内容被播放给用户。
[0006]更一般地,US8, 412,164公开了当用户在电话连接中被置于待机状态时再现各种用户可选择的数据。

【发明内容】

[0007]待机音乐的检测花费了显著时间。当待机音乐因为待机条件被取消而被终止时,这尤其是不期望的。例如,当呼叫方在被置于待机状态的同时播放他或她自身的内容时,在呼叫方自身内容的播放可以被停止并且正常的双向语音通信被建立之前,待机条件的取消必须被察觉或确定。因此,之前被置于待机状态并聆听他或她自身的音乐的呼叫方可能会错过另一方所说的前面一部分单词。
[0008]本方法缓解或移除了上面所讨论的不期望的状况。
[0009]在本方法的第一方面,在电话连接中由第二方向第一方提供的电话待机音乐被检测到。待机音乐的检测可以在作为被置于待机状态的一方的第一方侧的电话设备中、或者在位于第一和第二方之间的网络中的检测器中执行,其中,该网络具有到连接的入口并且具有对于该连接的某些方面的控制权。待机音乐在被检测到时,在第一方的控制下被修改或提升,或者被替换为由第一方选择的内容。对待机音乐的修改包括减弱或静音。提升包括向待机音乐添加非音频内容(待机音乐在再现时被减弱,即,被以更低的音量再现或者被完全静首)。
[0010]例如,用户可以在被置于待机状态时观看展示图片的幻灯片。在幻灯片展示期间,待机音乐被以较低的音量回放,并且散布于待机音乐中的所有或所选择的通告可以被以较高的音量甚至原来的音量回放。一般,音量改变之间的渐变避免了点击噪音(click-noise)。
[0011]替换包括利用包括静音或静电噪音在内的任何音频或音视频内容替换。非音频内容包括幻灯片展示、照片展示、文本、网络摄像头视频等。用于提升或替换的内容取决于第一方的装备的能力。替换或提升待机音乐的内容由独立于第二方的源提供。
[0012]对待机音乐的检测被连续执行。来源于第二方的一段最近接收的音频信息被连续存储。即,大约数秒的输入音频信息-指向第一方-被以浮动窗口的方式存储(始终包括当前输入的音频信息和来自预定的在先时段的音频信息)。所存储的输入音频的长度(即,浮动窗口的长度)取决于检测待机音乐所需的时间。如之前提到的,待机音乐的检测将花费一些时间(例如,当使用音频信号分析时),因为音频信号必须在依赖于算法的某段时间内被分析。当在检测到待机音乐的在先时间段之后没有再检测到待机音乐时,仅从所存储的一段最近接收的音频信息中取回语音信息(即,还可能存在于所存储的时间窗口中的任何待机音乐被忽略并且不被取回)。用于待机音乐检测的音频信号分析可以使用传统算法,例如,由Schreiner和Slaney在加利福尼亚州帕罗奥图的Interval ResearchCor.中发表的 “Construct1n and evaluat1n of a robust multifeature Speech/Music discriminator (健壮多功能语音/音乐鉴别器的构造和评估)”、以及由奥地利林茨大学(Kepler University)的 Seyerlehner, Pohle, Schedl 和 Widmer 在 2007 年发表的“Automatic Music Detect1n in Televis1n Product1ns (电视生产中的自动音乐检测)”中提到的用于音乐/语音辨认的已知算法。
[0013]一般,待机音乐的检测可以被以不同方式执行。之前已经提到了使用音频信号分析的一种方式。另一种方式包括向待机音乐(可选地还向语音通告)添加水印。又一种方式包括以类似于FM无线电中使用的RDS (Rad1 Data System,无线电数据系统)流量通告的带内方式,或者在专用的控制信道上传送信号(例如,标记)。在每种情形中,检测器被设置在第一方的设备处,或者被设置在网络中并且与第一方的设备通信。检测所需的时间可以在这些不同方式之间变动。
[0014]应用于连接的待机音乐检测的类型(即,音频信号分析、水印、或者被传送的标记)可以根据所拨打的电话号码被预先设置。该信息可以被存储于在拨号时访问的数据库中。该数据库可以被自动更新(例如,在网络上或者通过学习算法)。例如,一旦电话号码被拨打并且待机音乐被接收到,用户就可以手动触发尝试每种检测类型的辨认处理(优选地从水印和标记开始)。一旦特定类型被检测到,信息即被存储于数据库中供以后参考。当然,可以用使音频信号分析长期运行并且尝试检测待机音乐来替换用户交互。一旦通过音频信号分析检测到待机音乐,则可以尝试其他方法进行改进,并且可以基于该分析更新数据库。在改进中,数据库存储与电话号码相关联的典型的音乐类型(例如,使用少数音符或“真实的”音乐录音以电子化的方式生成的音乐)。该信息可以用于通过相应地预先设置检测器来实现更快的辨认。
[0015]当待机音乐不再被检测到时,对待机音乐的修改和提升、或者替换被停止,并且所取回的语音信息被再现给第一方。应当注意,取回语音信息、停止修改和提升、或者替换的顺序是可交换的。由于检测待机音乐或者其缺失所需的时间,会在第一和第二方之间的通信中引入时间偏移。
[0016]在本方法的实施例中,在待机音乐不再被检测到之后,由检测导致的时间偏移被消除。在第一追赶模式中,从所存储的一段最近接收的音频信息中取回的语音信息被以比原来的速度更快的速度回放,直到来源于第二方的所存储的一段最近接收的音频信息中被回放的语音信息对应于当前从第二方接收的音频信息为止。此时,由检测待机音乐的缺失所需的时间引入的偏移被取消,并且第一和第二方之间的通信被同步。在这点,可以停止记录从第二方接收的信息。
[0017]在第一追赶模式的改进中,通过相应的音频信号处理,由以比原来的速度更快的速度回放从所存储的一段最近接收的音频信息取回的语音信息引入的更高的音高被调低。
[0018]在第二追赶模式中,在从所存储的一段最近接收的音频信息中取回的语音信息中检测静默期。静默期在再现期间被缩短甚至被跳过,直到再现的所取回的语音信息和当前从第二方接收的音频信息彼此对应为止。此时,由检测待机音乐的缺失所需的时间引入的偏移被取消,并且第一和第二方之间的通信被同步。在这点,可以停止记录从第二方接收的?目息O
[0019]第一和第二追赶模式可以被组合在一起,以实现第一和第二方之间的通信的更快的同步。
[0020]很常见的是,在待机音乐中散布有语音通告(S卩,中断音乐)。这会妨碍待机音乐检测并导致被提升或者被替换的内容的再现中的不期望的中断(尤其是在散布的通告没有对待机方提供额外信息或价值的情形下)。这样的通告包括诸如“请保持在线”、“服务代理将很快响应,感谢你的耐心”、或“所有线路忙,请等待”之类的通用或标准语音通告。这种类型的通告可以被分配给第一类型语音通告的群组,在本方法的环境下这种类型的通告可以被忽略。在一个实施例中,本方法进一步包括识别散布于待机音乐中的语音通告并忽略选自第一类型语音通告的列表中的语音通告。即,第一类型的语音通告将不会导致停止被提升的内容的再现或者内容的替换
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1