音频处理设备和提供信息的方法与流程

文档序号：12515017阅读：210来源：国知局

本发明涉及一种用于处理音频信号的技术。

背景技术：

以自动声音的形式为用户提供关于公共交通服务的指导信息的服务被广泛使用。例如，在巴士中使用的播报系统通过语音指导的方式为乘客提供关于例如巴士站、巴士车费等的指导信息，基于操作员的操作在合适的时刻(例如在各个巴士站)播放指导语音，针对每条公交线路预先准备这种语音指导。专利文献1公开了这样一种构造，其中基于诸如向安装在巴士车厢中的装置的输入操作之类的操作通过产生对应于语音数据的语音信号向乘客通告诸如巴士站名的信息。专利文献2公开了一种用于产生对应于指导语音的语音数据的构造，通过所述构造，假设语音指导的内容是诸如“下一站是[巴士站名]。”的语句，通过利用低压缩编码生成巴士站名，而通过利用高压缩编码生成诸如“下一”、“是”等的通用词。

现有技术文献

专利文献

专利文献1：日本实用新型注册申请实开No.S61-116400

专利文献2：日本专利申请特开No.H08-008855

技术实现要素：

技术问题

本领域中实践了利用声波的传输将信息分布至终端设备的技术(下文中，称为“音频通信”)。在音频通信中，在发出表示在听不见的高频范围(例如，18kHz至20kHz)中包含用于分布的信息的音频信号的声音时，将信息分布至终端设备并由终端设备接收。在该示例中，假设将音频通信应用于在专利文献1和专利文献2中例示的语音指导系统。诸如引擎噪声和振动噪声的外部环境噪声常侵入巴士内部。为了使乘客能够清楚地理解语音指导，音频信号中的听得见的低频范围(例如，等于或小于大约16kHz)内的音频分量可通过，而较高范围内的音频分量可被省略。因此，在应用专利文献1和专利文献2中公开的音频通信时，防止输出(发出)在高频带中包含的分布信息。虽然以上解释涉及用于公共交通的巴士，但是在诸如其它公共交通服务的向用户提供多种信息的任何环境中或者在公共设施内和其它情况下容易发生相同的问题。鉴于上述问题，本发明的一个目的是在抑制了特定频带的环境中提供合适的音频通信。

技术方案

为了解决上述问题，根据本发明的第一方面的音频处理设备包括：信息提取装置，其从处于第一频带中的第一音频信号中提取识别信息，在所述第一音频信号中包括用于再现的声音的音频分量和包括用于再现的声音的识别信息的音频分量；以及第二音频信号产生装置，其产生包括由信息提取装置提取的识别信息并处于第二频带中的第二音频信号，第二频带是高于第一频带的频带，其中通过发声装置发出由第二音频信号表示的声音。根据以上构造，用于再现的声音的音频分量(例如，提供给用户的指导语音)和包括用于再现的声音的识别信息的音频分量各自被包括在处于第一频带中的第一音频信号中，同时从第一音频信号中提取的识别信息被包括在处于第二频带中的第二音频信号中。根据以上实施例，即使在第一音频信号中第二频带受到抑制的环境中，也可利用第二频带经由音频通信统一且合适地将识别信息发送(广播)至邻近设备。第二频带是例如16kHz与20kHz之间(更优选地，18kHz与20kHz之间的范围内)的高范围。“用于再现的声音”的示例包括向公共设施或公共交通服务的用户提供的指导信息的声音，分别例如关于开放时间和关闭时间的设施信息或者关于换乘位置、车费的信息等。

在本发明的优选实施例中，音频处理设备包括：声音接收装置，其接收由包括用于再现的声音的音频分量和包括用于再现的声音的识别信息的音频分量的再现信号表示的声音，用以产生第一音频信号；以及发声装置，其发出由第二音频信号产生装置产生的第二音频信号表示的声音。根据该实施例，可经音频通信合适地发送识别信息，而不需要改变发出由第二频带受到抑制的再现信号指示的声音的现有系统。发出由第二音频信号表示的声音包括发出通过将第二音频信号与例如再现信号的音频分量的另一不同信号合成而获得的信号所表示的声音。

在本发明的另一优选实施例中，通过发声装置发出由第二音频信号表示的声音持续的时长比发出包括再现信号中用于再现的声音的识别信息的音频分量持续的时长更长。这样，可确保接收方的终端设备具有足够的机会接收在第二音频信号中包含的识别信息。例如，第一频带设为在听得见的范围内，而第二频带设为在高于第一频带的范围内，也就是说，用户几乎听不见的频带。然而，在这种情况下，如果以在延长的时长发出包含了识别信息的音频分量，则用户会察觉到突兀或不适。然而，根据以上实施例，由处于第二频带中的第二音频信号表示的声音的发出所持续的时长被设为比包括第一频带的再现信号中的识别信息的音频分量的发出所持续的时长更长。简而言之，经其中利用了处于第二频带中并且用户几乎听不见的声音的音频通信发出的识别信息在相对较长的时间段内被发送。这样，可减小由于包括用于再现的声音的识别信息的第一频带中的音频分量以延长的时间段发送而会导致的用户察觉到突兀或不适的可能性。还可向各个终端设备通知识别信息而不导致用户察觉到突兀或不适，并且允许各个终端设备在识别信息的初始接收不成功的情况下再获取识别信息。

优选地，通过发声装置发出由第二音频信号表示的声音的时段和再现信号中的用于再现的声音的音频分量的时段可重叠。根据该实施例，由于与对应的用于再现的声音的发出平行地发出包括识别信息的音频分量，因此与例如在完成用于再现的声音的播放之后通知识别信息的构造相比，用户的终端设备可近乎实时地获取对应于通知的识别信息的信息。

在本发明的又一优选实施例中，再现信号作为第一音频信号经信号线从再现处理设备供应至信息提取装置，再现处理设备产生包括用于再现的声音的音频分量和包括用于再现的声音的识别信息的音频分量的再现信号。根据该实施例，由于音频处理设备产生包括从第二频带受到抑制的第一音频信号中提取的识别信息的第二音频信号，因此可合适地发送识别信息而不需要改变现有系统。此外，因为再现信号作为音频信号经信号线被供应至信息提取装置，所以不必在音频处理设备中安装声音接收装置。因此，与提供了声音接收装置的机构相比，实现了可简化装置的构造的优点。

根据本发明的第二方面的音频处理设备包括：信息提取装置，其从第一音频信号中提取识别信息，该第一音频信号包括用于再现的声音的音频分量和包括用于再现的声音的识别信息的音频分量；发送信号产生装置，其产生包括由信息提取装置提取的识别信息的发送信号；以及发送装置，其发送表示由发送信号产生装置产生的发送信号的电磁波。利用电磁波的通信的示例包括Wi-Fi(注册商标)、蓝牙(注册商标)和红外通信。根据以上实施例，可利用多种不同的传输介质来分布信息，因此即使在抑制了特定频带的环境中也可合适地发送识别信息。

根据第二方面的音频处理设备可包括声音接收装置，其接收由包括用于再现的声音的音频分量和包括用于再现的声音的识别信息的音频分量的再现信号表示的声音，用以产生第一音频信号。可替换地，再现信号可作为第一音频信号经信号线从产生再现信号的再现处理设备供应至信息提取装置。

根据上述实施例，由于音频处理设备产生包括从第二频带受到抑制的第一音频信号中提取的识别信息的发送信号，因此可利用电磁波合适地发送识别信息而不需要改变现有系统。此外，在第一音频信号经信号线被供应至信息提取装置的构造中，不必在音频处理设备中安装声音接收装置，因此，与安装了声音接收装置的机构相比，可简化设备的构造。

对于根据第一方面或第二方面的音频处理设备，声音接收装置优选地设为靠近发出由再现信号表示的声音的发声设备。根据该构造，由于声音接收装置设为靠近发出由再现信号表示的声音的发声设备，因此可避免由噪声导致的干扰。

本发明还可被特征化为使得计算机执行根据上述实施例中的每一个的音频处理设备包括的不同功能性元件的程序以及安装有所述程序的计算机可读记录介质。换句话说，本发明的程序的第一方面使得计算机执行：信息提取处理，其用于从处于第一频带中的第一音频信号中提取识别信息，第一音频信号中包括用于再现的声音的音频分量和包括用于再现的声音的识别信息的音频分量；以及第二音频信号产生处理，其产生包括在信息提取处理中提取的识别信息并处于第二频带中的第二音频信号，第二频带是高于第一频带的频带，其中通过发声装置发出由第二音频信号表示的声音。本发明的程序的第二方面使得计算机执行：信息提取处理，其用于从包括用于再现的声音的音频分量和包括用于再现的声音的识别信息的音频分量的第一音频信号中提取识别信息；发送信号产生处理，其产生包括在信息提取处理中提取的识别信息的发送信号；以及发送处理，其发送表示在发送信号产生处理中产生的发送信号的电磁波。

此外，本发明还可被特征化为利用了根据上述实施例中的每一个的音频处理设备的信息提供方法。换句话说，根据本发明的第一方面的信息提供方法从处于第一频带中的第一音频信号中提取识别信息，第一音频信号中包括用于再现的声音的音频分量和包括用于再现的声音的识别信息的音频分量；产生包括识别信息并处于第二频带中的第二音频信号，第二频带是高于第一频带的频带；以及发出由第二音频信号表示的声音。根据本发明的第二方面的信息提供方法从包括用于再现的声音的音频分量和包括用于再现的声音的识别信息的音频分量的第一音频信号中提取识别信息；产生包括识别信息的发送信号；以及发送表示发送信号的电磁波。

均可根据以上优选实施例之一或其它来实现的信息提供方法、程序和其中安装有程序的计算机可读记录介质实现了与通过根据上述实施例的信息管理系统实现的效果基本相同的效果。

根据本发明的第一方面的信息提供方法在发出包括用于再现的声音的识别信息的音频分量之后发出用于再现的声音的音频分量，并且发出由第二音频信号表示的声音的时段与发出用于再现的声音的音频分量的时段重叠。根据该实施例，可通过音频通信例如与用于再现的声音的播放平行地发送识别信息，这是因为在完成发射包括用于再现的声音的识别信息的音频分量之后发出用于再现的声音的音频分量。

附图说明

图1是示出第一实施例的语音指导系统1的构造的图。

图2是示出第一实施例的再现系统100的框图。

图3是示出第一实施例的信号合成器104的框图。

图4是说明第一实施例的滤波器108的特征图。

图5是说明调制信号A_D、目标信号A_G和第二音频信号S₂的时长的图。

图6是示出再现系统100中执行的操作的流程的流程图。

图7是示出第一实施例的音频处理设备200的框图。

图8是示出在音频处理设备200中执行的操作的流程的流程图。

图9是示出第一实施例的终端设备300的框图。

图10是说明指导信息表TB₁的数据结构的图。

图11是示出在呈现器308中呈现的指导信息的显示示例的图。

图12是示出第二实施例的再现系统100的框图。

图13是示出根据第二实施例的修改例的再现系统100和音频处理设备200的框图。

图14是示出第三实施例的音频处理设备200的框图。

图15是示出根据另一修改例的再现系统100的框图。

具体实施方式

第一实施例

现在将提供对第一实施例的语音指导系统1的概况的描述。在下文中，描述了如下的示例构造：第一实施例的语音指导系统1用于针对公共交通服务的车载音频播报。语音指导系统1通过代表指导信息(例如，关于巴士站、车费的指导或者关于旅游景点或周边区域的指导等)的指导语音(用于再现的声音)向公共巴士的乘客提供语音指导。

图1是示出第一实施例的语音指导系统1的构造的图。语音指导系统1包括再现系统100、音频处理设备200和终端设备300。再现系统100和音频处理设备200安装在公共巴士服务的车厢C内。

再现系统100在车厢C内伴随着指导语音发出包括对应于多种指导语音(它们中的每一个不同)之一的识别信息的处于频带B₁中的声音。车厢C的乘客(下文中，用户)听到指导语音。同时，音频处理设备200从再现系统100发出的声音中提取识别信息，以发出包括识别信息的处于频带B₂中的声音。频带B₁和频带B₂彼此不同。换句话说，音频处理设备200是将包括识别信息的音频的频带转换为包括相同识别信息的另一频带的信号处理设备。

终端设备300是车厢C中的用户随身携带的便携式通信终端(例如，移动电话/智能电话)，并且终端设备300从由音频处理设备200发出的声音中提取指导语音的识别信息，并且经通信网络400(例如，移动通信网络或互联网)从指导信息服务器500接收对应于识别信息的指导信息。指导信息与由指导语音提供的指导相关。例如，可将下面中的任一个作为用于再现、待发出或显示的指导信息提供至终端设备300：表示关于用户指引(诸如设施、车费等)的信息、交通指引(诸如车站、换乘位置等)和靠近指引的位置的局部地区的旅游信息(诸如旅游设施、住宿、诸如针对历史名胜等的区域指引)的文字和/或静图或动图；代表指导语音的文字，例如，听力受损的人可参照以通过视觉检查指导信息的文字；和/或将通过指导语音提供的指导信息翻译为外语而获得的声音和/或文字。现在将在下面描述语音指导系统1的不同元件的细节。

再现系统100

如图1所示，再现系统100包括操作器110、再现处理设备120和发声装置130。操作器110是从公共交通巴士的驾驶员O_P接收指令的输入装置。每当车厢C快到给定车站时，驾驶员O_P通过操作操作器110触发关于该车站的指导语音的播放。再现处理设备120产生音频信号(下文中，称为“再现信号”)A₂，其代表通过将多种不同指导语音中的驾驶员O_P通过操作操作器110触发其播放的指导语音与包括指导语音的识别信息的声音合成而获得的声音。发声装置130(例如，扬声器)发出表示由再现处理设备120产生的再现信号A₂的声音。在图1中，示出了单个发声装置130，但在现实中，在车厢C中安装了多个发声装置130，并且从再现处理设备120向它们平行地供应再现信号A₂。

图2是示出再现系统100的构造的框图。第一实施例的再现处理设备120包括控制器102、信号合成器104、存储装置106和滤波器108，如图2所示。存储装置106包括公知的记录介质(诸如半导体记录介质或磁记录介质)，并且针对车厢C停靠的每个位置(车站)存储表示关于一个这种位置的指导语音的音频信号(下文中称作“目标信号”)A_G(A_G1、A_G2、……)以及关于该位置的指导信息的识别信息D(D₁、D₂、……)。目标信号A_G和识别信息D不一定存储在再现处理设备120的存储装置106中。例如，作为替代，再现处理设备120可通过与外部设备通信来从外部设备(服务器设备)接收目标信号A_G和识别信息D。

车站不仅包括沿着公共巴士的路线存在的车站，而且包括用作换乘位置的地方(例如，公共交通站台、机场或任何公路上的给定位置)。识别信息D是用于识别指导信息的唯一代码，并且针对巴士车厢C停靠的每个位置(巴士站)设置识别信息D。例如，通过公知的方法产生的随机数序列设为针对所有指导信息的识别信息D，从而识别信息D不重复。

图2的控制器102根据在车厢C快到车站时操作器110从驾驶员O_P接受的播放指令从存储装置106读取对应于车站的目标信号A_G和识别信息D并且向信号合成器104供应目标信号A_G和识别信息D。信号合成器104通过将识别信息D与目标信号A_G合成来产生再现信号A₁。可使用任何公知的方法来将识别信息D与目标信号A_G合成，但是在WO 2010/016589中公开了一个优选方法。

图3是示出信号合成器104的构造的框图。如图3所示，信号合成器104包括调制处理器1042和合成处理器1044。调制处理器1042通过按次序执行利用扩频码的识别信息D的扩频调制和利用预定频率的载波的频率转换来产生包括识别信息D的音频信号(下文中，称为“调制信号”)A_D作为处于特定频带中的音频分量。调制处理器1042将通知声与调制信号A_D合成。包括在调制信号A_D中的通知声是吸引车厢C中的乘客的注意的自然声(例如，诸如“叮咚”的指导声)。调制信号A_D的频带是可通过发声装置130发出声音并且可通过音频处理设备200接收声音的频带，并且该频带被包括于在普通环境中用户所接触到的语音或音乐的声音的频带范围(例如，等于或小于大约16kHz)中，该频带在听得见的范围内。合成处理器1044通过将从控制器102供应的目标信号A_G与通过调制处理器1042产生的调制信号A_D合成(通常相加)产生再现信号A₁。调制处理器1042产生调制信号A_D的方法不限于以上示例(扩频调制)。例如，作为替代，可通过基于识别信息D对载波(诸如预定频率内的正弦波)进行频率调制来产生特定频带内的调制信号A_D。

图2的滤波器108是通过抑制再现信号A₁的较高端中的频率分量产生再现信号A₂的低通滤波器(LPF)。图4是第一实施例的滤波器108的特征图。为了使指导语音被受到诸如引擎噪声和振动噪声的外部噪声的侵扰的车厢C中的乘客清楚地察觉，如图4所示的滤波器108抑制再现信号A₁的较高端频带(例如，18kHz与20kHz之间)中的分量，同时保持在听得见的范围内且对应于指导语音的较低端频带B₁(例如，等于或小于大约16kHz)中的分量。频带B₁是可通过发声装置130发出声音和可通过音频处理设备200接收声音的频带，并且该频带被包括于在普通环境中用户所接触到的语音或音乐的声音的频带范围(例如，等于或小于大约16kHz，其在听得见的范围内)中。包括识别信息D的调制信号A_D的频带b被包括于滤波器108的通带(频带B₁)内。根据以上解释可以理解，目标信号A_G和调制信号A_D的频带B₁设为能通过滤波器108的频带。频带B₁不限于以上示例，并且可为等于或小于4kHz或6kHz的低频带。

图5中的部分(a)是说明发出再现信号A₂的声音的时长与在再现信号A₂中包含的由调制信号A_D指示的声音(下文中称为“通知声”)和目标信号A_G的声音(指导语音)的时长之间的关系的图。再现信号A₂的声音的发出时长为T₁。如部分(a)所示，包括识别信息D的调制信号A_D从再现信号A₂开始延续时长T_D，并且被包含在发出再现信号A₂的声音的时长T₁中。目标信号A_G所表示的指导语音在从调制信号A_D的发出结束之后立即开始的时长T_G内发出。换句话说，在再现信号A₂中，由调制信号A_D指示的声音的发出的持续时间(时长T_D)和由目标信号A_G指示的声音的发射的持续时间(时长T_G)不重合。与指导语音的时长T_G相比，将播放调制信号A_D的时长T_D设为足够短的时间，例如，一秒至两秒。

图6是示出当前实施例的再现处理设备120的整体操作的流程的流程图。例如，当车厢C快到车站时接受了驾驶员O_P通过操作器110触发的播放指令时(SA1)，控制器102从存储装置106中读取对应于所述位置并且相应地对应于播放指令的指导语音的目标信号A_G以及识别信息D，并且将目标信号A_G和识别信息D供应至信号合成器104(SA2)。信号合成器104通过将从控制器102供应的指导语音的目标信号A_G(指导语音的音频分量)与从控制器102供应的包括识别信息D的调制信号A_D(包括指导语音的识别信息D的音频分量)合成来产生再现信号A₁(SA3)。滤波器108通过从信号合成器104所产生的再现信号A₁中提取频带B₁来产生再现信号A₂(SA4)。发声装置130发出由经历了滤波器108所执行的处理的再现信号A₂指示的声音(SA5)。

音频处理设备200

图7是示出音频处理设备200的构造的框图。第一实施例的音频处理设备200是靠近再现系统100的发声装置130安装(例如，安装在扬声器网的表面上)的音频设备，此外，如图7所示，音频处理设备200包括声音接收装置202、信息提取器206、存储装置208、信号处理器210和发声装置214。声音接收装置202通过接收从再现系统100的发声装置130发射的再现信号A₂的声音来产生第一音频信号S₁。第一音频信号S₁在频带B₁中包含包括识别信息D的调制信号A_D的音频分量(通知声)和指导语音的音频分量。在第一实施例中，由于音频处理设备200设为靠近发声装置130，因此再现信号A₂不大可能受噪声影响。换句话说，音频处理设备200设置在当声音接收装置202接收再现信号A₂的声音时使噪声最小化的位置。

图7的信息提取器206和信号处理器210由执行存储在存储装置208中的程序的计算机处理单元(中央处理单元：CPU)实现。信息提取器206通过对声音接收装置202所产生的第一音频信号S₁进行解调来提取识别信息D。更具体地说，信息提取器206通过经例如带通滤波器选择包括第一音频信号S₁中的识别信息D的频带b的带分量并且允许所选择的带分量通过匹配的滤波器来提取识别信息D，该匹配的滤波器具有在识别信息D的扩频调制中使用的扩频码作为系数。在第一实施例中，由于音频处理设备200设为靠近发声装置130，因此即使与指导语音的时长T_G相比将通知声的时长T_D设为短得多，也可高精度地提取识别信息D。由信息提取器206提取的识别信息D存储在存储装置(存储器)208中。根据以上解释应该理解，通过再现系统100以使用声音(即，以振动的形式通过空气传播的声波)作为传输介质的音频通信的形式向音频处理设备200通知识别信息D。也可通过利用特定电路来实现信息提取器206和信号处理器的功能的全部或一部分。

信号处理器(第二音频信号产生器)210通过从存储装置208中读取由信息提取器206提取的识别信息D以及按次序执行利用扩频码的识别信息D的扩频调制和利用特定频率的载波的频率转换，来产生包括作为较高端频带B₂的音频分量的识别信息D的第二音频信号(调制信号)S₂。发声装置214发出由信号处理器210产生的第二音频信号S₂指示的声音。在图7中，为了便于解释，未示出将再现信号A₂从模拟格式转换为数字格式的A/D转换器和将第二音频信号S₂从数字格式转换为模拟格式的D/A转换器。

如图4所示，第二音频信号S₂的频带B₂与第一音频信号S₁的频带B₁不同。换句话说，第二音频信号S₂的频带B₂高于第一音频信号S₁的频带B₁。更具体地说，频带B₂是可通过发声装置214发出声音和可通过终端设备300接收声音的频率，并且该频带被包括于例如18kHz与20kHz之间的频带(高于在普通环境中用户所接触到的语音或音乐声音的频带(诸如处于听得见的范围内的等于或小于大约16kHz的频带))中。结果，终端设备300的用户几乎不可察觉到包括识别信息D的第二音频信号S₂的再现的声音。换句话说，可通过音频通信将识别信息D发送至终端设备300而不干扰用户对指导语音的聆听。根据以上解释将理解的是，在第一实施例中，由于产生了包括识别信息D的第二音频信号S₂作为与再现信号A₂的频带B₁不同的频带B₂的音频分量，因此即使在再现系统100(滤波器108)被构造为抑制频带B₂以强调指导语音的频带B₁的情况下，也仍可通过利用频带B₂的音频通信向不同终端设备300通知识别信息D。换句话说，音频处理设备200可经音频通信合适地发送识别信息D而不需要改变再现系统100，所述再现系统100是发出由抑制了频带B₂的再现信号A₂指示的声音的常规系统。

图5的部分(b)是说明第二音频信号S₂的图。如部分(b)中例示，第一实施例的信号处理器210产生沿着时间轴在不同部分按照重复方式添加了识别信息D的第二音频信号S₂。在自信息提取器206从发声装置130所发出的声音中提取识别信息D的时间开始的时长T₂内连续发出第二音频信号S₂所代表的声音。换句话说，经音频通信在时长T₂内按照重复方式向各个终端设备300通知识别信息D。

从图5的部分(a)与部分(b)之间的比较中可看出，音频处理设备200的发声装置214发出由第二音频信号S₂指示的声音的时长T₂比再现系统100的发声装置130发出调制的信号A_D的通知声的时长T_D更长。如果在延长的时间段内发出包括识别信息D的处于听得见的范围内的通知声，则存在用户将察觉到突兀或不适的可能性。然而，在第一实施例中，由于发出频带B₁的通知声的时长限于时长T_D，因此可使由于在延长的时间段内发出通知声而导致用户将察觉到突兀或不适的任何可能性最小化。相反，由于音频处理设备200的信号处理器210通过使用用户几乎不可察觉的频带B₂中的声音经音频通信发送识别信息D，因此可向各个终端设备300通知识别信息D而不使用户察觉到突兀或不适。此外，由于音频处理设备200在超过时长T_D的时长T₂内按照重复方式发送(发出)识别信息D，因此即使例如由于混合的噪声分量的干扰而不可提取第二音频信号S₂的识别信息D中的一些，终端设备300也可再获取其它部分的识别信息D。

可与发出目标信号A_G的声音(指导语音)的时长T_G相关地自由地设置第二音频信号S₂的时长T₂。可采用以下构造中的任一个：第二音频信号S₂的时长T₂比目标信号A_G的时长T_G更长(T₂＞T_G)的构造；第二音频信号S₂的时长T₂比目标信号A_G的时长T_G更短(T₂＜T_G)的构造；以及第二音频信号S₂的时长T₂等于目标信号A_G的时长T_G(T₂＝T_G)的构造。由于第二音频信号S₂的声音不影响用户聆听指导语音，如图5所示，可能的构造可为发出第二音频信号S₂的声音的时段(时长T₂)和发出目标信号A_G的声音(指导语音)的时段(时长T_G)彼此重叠的构造。换句话说，可构造至少部分地彼此重叠的两个时段。在这种构造中，由于与指导语音的发出并行地发出包括对应于指导语音的识别信息的音频信号，因此与例如在指导语音的播放结束之后通知识别信息D的构造相比，终端设备300可更加实时地获取对应于通知的识别信息D的指导信息。这尤其在指导的目标位置不断改变的公共交通服务(诸如公共巴士)中是极为有利的。还存在以下有利之处：用户可更容易地识别他/她的当前位置与指导信息之间的关系。

图8是示出音频处理设备200的整体操作的流程的流程图。通过发声装置130发出包含包括识别信息D的调制信号A_D和目标信号A_G的再现信号A₂的再现的声音的触发，开始图8的处理。声音接收装置202通过接收从发声装置130发出的再现的声音产生第一音频信号S₁(SB1)。信息提取器206从第一音频信号S₁中提取识别信息D(SB2)。信号处理器210产生第二音频信号S₂，即包括识别信息D并且处于高于频带B₁的频带B₂中的信号(SB3)。发声装置214发出由第二音频信号S₂指示的声音(声波)(SB4)。

终端设备300

图9是示出终端设备300的构造的框图。如图9所示，终端设备300包括声音接收装置302、识别器304、获取器306和呈现器308。声音接收装置302是接收周围声音的音频装置(麦克风)，并且其接收从音频处理设备200的发声装置214发出的声音并产生指示声音的时间波形的音频信号(下文中，称为“接收的信号”)X。接收的信号X包括识别信息D的音频分量。为了便于解释，图中省略了将声音接收装置302所产生的接收的信号X从模拟格式转换为数字格式的A/D转换器。

识别器304通过对声音接收装置302所产生的接收的信号X进行解调来提取指导语音的识别信息D。更具体地说，识别器304通过例如使用高通滤波器强调接收的信号X内的包括识别信息D的频带B₂的带分量以及使所述带分量通过将识别信息D的扩频调制中所使用的扩频码用作系数的匹配的滤波器，来提取识别信息D。

获取器306是经通信网络400(参照图1)与指导信息服务器500通信的通信装置。可自由地选择用于在终端设备300与指导信息服务器500之间部署的通信方案，但是通常采用与音频处理设备200向终端设备300通知识别信息D的音频通信不同的无线电通信(例如，使用无线电波和红外射线作为传输介质的信息通信)。获取器306向指导信息服务器500发送包括通过识别器304从接收的信号X中提取的识别信息D的信息请求R。获取器306响应于信息请求R接收从指导信息服务器500发送的指导信息G。

指导信息服务器500具有图10所示的指导信息表TB₁。指导信息表TB₁将识别信息D(D₁、D₂……)与指导信息G(G₁、G₂……)相关联。当指导信息服务器500从终端设备300接收包括识别信息D的信息请求R时，其读取指导信息表TB₁中的对应于信息请求R中的识别信息D的指导信息G，并且将指导信息G发送至作为信息请求R的发送器的终端设备300。图9的呈现器308例如通过在显示装置上显示指导信息G来向用户呈现由获取器306获取的指导信息G。

图11是解释通过呈现器308对指导信息G的示例显示的图。在图11中，示出了在终端设备300的呈现器308上将指导信息G呈现为指示指导语音的口语内容的文字的示例。如图11中的例示，用户可通过视觉识别在呈现器308上呈现的指导信息G(图中所示的示例中的关于下一站的提示)。根据以上解释将清楚的是，用户可听见从再现系统100的发声装置130发出的指导语音，并且还可阅读(即，通过观看识别)在呈现器308上呈现的指导信息G。根据以上构造，可按照在听力上和视觉上均清楚的方式向用户提供指导信息G。另外，听力受损的人(听觉障碍的人)可辨识指导语音的内容。

在第一实施例中，音频处理设备200包括声音接收装置202和发声装置214。在音频处理设备200利用声音接收装置202接收从再现系统100的发声装置130发出的再现信号A₂的同时，其利用发声装置214发出包括从第一音频信号S₁中提取的识别信息D的第二音频信号S₂。根据以上构造，可通过将音频处理设备200设置为靠近再现处理设备120经使用频带B2的音频通信向终端设备300通知识别信息D，而不用将再现系统100改变为包括将包括再现信号A₂中的识别信息D的音频分量从频带B₁转换为频带B₂的模块(信号处理器210)。

在以上解释中，提供了再现系统100的滤波器108抑制较高范围中的频带B₂的示例。在从发声装置130发出的声音中抑制频带B₂的方式不限于通过滤波器108的这种处理。例如，在例如发声装置130的声学特征在于其难以发出包括频带B₂的高频声音范围内的声音的情况下，即使在没有滤波器108的构造中，仍可在频带B₂中抑制从发声装置130发出的声音。而且，还可使用能够发出频带B₂的发声装置，尽管实际上，并非公共巴士服务等的车厢C上的所有现有装置可容易地升级。在目标信号A_G的采样频率过低以包括作为再现的目标的频带B₂的情况下也可抑制频带B₂。无论怎样抑制频带B₂，采用第一实施例的音频处理设备仍会能够利用频带B₂经音频通信传输识别信息D。

由第二音频信号S₂表示的声音播放的时长T₂比调制的信号A_D的声音发出的时长T_D更长。如果包括识别信息D的通知声与例如指导语音相比而言过长，则用户可能将察觉听觉突兀或不适。在第一实施例中，发出包括识别信息D的通知声的时长T_D被构造为比发出第二音频信号S₂的时长T₂更短，因此，可减少用户将察觉听觉突兀或不适的情况的数量。

第二实施例

下面将提供本发明的第二实施例的描述。对于下面例示的实施例中的效果和功能与第一实施例中的元件相同的元件由与在解释第一实施例时使用的相同标号指代，并且适当地省略对其的详细解释。

图12是指示第二实施例的再现系统100的构造的框图。在第一实施例中，提供了音频处理设备200布置为靠近再现系统100的发声装置130的示例。如图12中的例示，在第二实施例中，音频处理设备200布置在再现系统100中的再现处理设备120与发声装置130之间的信号线上。从产生包括目标信号A_G(指导语音的音频分量)和调制信号A_D(包括指导语音的识别信息D的音频分量)的再现信号A₂的再现处理设备120经信号线供应作为第一音频信号S₁的再现信号A₂。

根据图12将理解的是，在省略了第一实施例的声音接收装置202和发声装置214的情况下构造第二实施例的音频处理设备200。同时，第二实施例的音频处理设备200包括信号合成器212，其通过将从再现处理设备120发出的再现信号A₂和第二音频信号S₂合成(例如，相加)来产生再现信号A₃。根据第二实施例，将其频带B₂被再现处理设备120的滤波器108抑制的第一音频信号S₁供应至音频处理设备200的信息提取器206。音频处理设备200的信息提取器206按照与第一实施例基本相同的方式从第一音频信号S₁(对应于第一实施例的再现信号A₂)中提取识别信息D。信号处理器210按照与第一实施例基本相同的方式产生包括由信息提取器206提取的识别信息D作为较高范围的频带B₂中的音频分量的第二音频信号S₂。由信号处理器210产生的频带B₂中的第二音频信号S₂通过信号合成器212与再现信号A₂合成，并且随后从发声装置130发出。换句话说，可将发声装置130理解为用于发出由通过将再现信号A₂与第二音频信号S₂合成获得的再现信号A₃表示的声音的发声装置。终端设备300通过从由发声装置130播放的声音中提取识别信息D来获得指导信息G。

以上构造优于第一实施例之处在于其能够简化装置的构造，这是由于音频处理设备200不必包括声音接收装置202和发声装置214。此外，鉴于在第一实施例中有必要确保调制的信号A_D的音量足够高以使得从再现系统100发出的通知声被音频处理设备200准确地接收，在第二实施例中，由于再现处理设备120和音频处理设备200通过导线连接，因此与第一实施例相比可使调制的信号A_D的音量最小化。而且，与其中由调制的信号A_D表示的通知声需要是声学自然声(因为其被实际发出)的第一实施例不同，在第二实施例中，调制的信号A_D的音量的所需水平如上述降低，因此，通知声不需要是声学自然声。应该注意，以上构造也可被构造为包括音频处理设备的发声装置214而非再现系统100的发声装置130。

作为再现系统100和音频处理设备200共同使用发声装置130的替代，如图13所示，在该实施例中，再现系统100可使用发声装置130、音频处理设备200和发声装置214。换句话说，再现系统100使从再现处理设备120发出的再现信号A₂从发声装置130发出。同时，音频处理设备200利用信息提取器206从通过导线从再现处理设备120供应的再现信号A₂中提取识别信息D，并且从发声装置214中输出由信号处理器210产生并且包括识别信息D的第二音频信号S₂。根据该构造，可获得与图12所示的构造基本相同的效果。还获得简化了装置构造的优点，由于不必通过信号合成器212执行处理(将第二音频信号S₂和再现信号A₂合成)。

第三实施例

第一实施例的音频处理设备200通过使用声音作为传输介质的音频通信向终端设备300发送识别信息D。然而，向终端设备300通知识别信息D的通信方案不限于此。第三实施例的音频处理设备200通过利用诸如红外射线或者无线电波的电磁波通过无线电通信(例如，近场通信)向终端设备300通知识别信息D。

图14是示出第三实施例的音频处理设备200的构造的框图。在图14中，第一实施例的发声装置214由发送器216代替。信号处理器(发送信号产生器)210产生包括由信息提取器206提取的识别信息D的发送信号。发送器216是发送指示由信号处理器210产生的发送信号的电磁波的通信装置。终端设备300的识别器304提取包括在从音频处理设备200接收的接收信号中的识别信息D，并且向指导信息服务器500发送包括识别信息D的信息请求R，随后接收作为回复的指导信息G。通过以上构造可获得与第一实施例的效果基本相同的效果。

还可按照与如第二实施例的图13所示的基本相同的方式来构造第三实施例。换句话说，可采用以下构造：第三实施例的音频处理设备200不包括声音接收装置202并且来自再现处理设备120的再现信号A₂作为第一音频信号S₁经信号线被供应至音频处理设备200。根据该实施例，与通过声音接收装置202获取再现信号A₂(并且最终获得第一音频信号S₁)的以上实施例相比，可使调制的信号A_D的音量大小最小化，这是因为再现处理设备120和音频处理设备200通过导线连接。另外，根据该实施例，调制的信号A_D的所需音量水平降低，因此调制的信号A_D不需要是声学自然声。

根据第三实施例的构造，终端设备300需要设有接收从发送器216发送的无线电波或红外射线的接收装置。相反，第一实施例和第二实施例的优点在于，因为经音频通信向终端设备300通知识别信息D，所以用于语音呼叫和视频记录的声音接收装置302也可用于接收识别信息D，因此，不需要专门的接收设备来适用于发送器216的通信方案。

修改例

上面例示的不同实施例可按照各种方式修改。下面描述特定修改例作为示例。从下面的示例中自由选择的两个或更多个实施例在它们彼此不矛盾的情况下可合适地组合。

(1)针对上述实施例中的每一个的再现系统100，描述了信号合成器104利用预先存储在存储装置106中的目标信号A_G和识别信息D产生再现信号A₁的示例构造。然而，还可预先准备再现信号A₁。

图15是示出根据一个修改例的再现系统100的构造的框图。在图15的再现系统100中，省略了在上述实施例中的每一个中例示的信号合成器104，并且再现信号A₁(A_1-1、A_1-2、A_1-3、……)(它们中的每一个指示目标信号A_G(指导信息)和识别信息D的通知声的合成声)针对各个巴士站的不同位置被预先存储在存储装置106中。预先按照与在上述实施例中的每一个中通过信号合成器104的处理中执行的方式基本相同的方式来产生存储在存储装置106中的各个再现信号A₁。控制器102响应于来自驾驶员O_P的指令从存储装置106获得再现信号A₁，并且随后将再现信号A₁供应至滤波器108。根据以上构造，由于不必在再现系统100中安装信号合成器104，可简化再现系统100的构造，或者采用没有信号合成器104的现有系统。

(2)在第一实施例中，描述了调制信号A_D(通知声)和目标信号A_G(指导语音)沿着时间轴不重叠的示例构造(图5的部分(a))。然而，调制的信号A_D和目标信号A_G也可沿着时间轴重叠。例如，可选择调制的信号A_D被包括在目标信号A_G的起始部分的构造。然而，应该注意，调制的信号A_D作为频带B₁中的通知声的发出可抑制对应于目标信号A_G的指导语音的能听度。鉴于此，优选的构造应为不使用用户听得见的通知声并且调制的信号A_D(包括识别信息D的音频分量)与目标信号A_G按照聆听者几乎察觉不到的方式来合成的构造。例如，可采用诸如加音频水印或指纹的技术来合成或提取对应于目标信号A_G的识别信息D。

(3)在上述实施例中的每一个中，音频处理设备200应用于公共巴士服务的语音指导系统1，但是可应用音频处理设备200的环境不限于该示例。例如，可选择音频处理设备200应用于诸如火车的其它公共交通服务上的车载音频通告系统或应用于展示设施中的再现系统的构造。例如，在展览设施中的再现系统中可产生通过将识别信息D与提供关于展览的解说的指导语音的目标信号A_G合成而获得的再现的声音，并且该再现的声音可通过音频处理设备200进行接收。当携带终端设备300的用户接近特定工件时，合成了识别信息D的第二音频信号S2伴随着指导语音发出。用户随身携带的终端设备300响应于包括识别信息D的信息请求R，显示(或发出)从指导信息服务器500提供的指导信息G，随后便可识别指导信息。

(4)在上述实施例中的每一个中，例示了向用户提供代表指导语音的文字作为指导信息G，但是指导信息G的内容不限于该示例。例如，可将下面的任一个作为指导信息G提供至终端设备300：表示以下信息的文字和/或静态或动态图像：关于诸如用户指引、设施指引、车费等的公共交通服务和设施的信息；诸如车站、换乘位置等的交通指示；以及指引的位置附近的局部地区的旅游信息，诸如旅游设施、住宿、诸如用于历史名胜等的地区指南等；代表指导语音的文字，例如，听力受损的人可参考的文字以通过视觉检查指导信息；和/或将通过指导语音提供的指导信息翻译为外语获得的声音和/或文字。在向用户提供旅游信息作为指导信息G的构造中，可具有在呈现器308中伴随着指导信息G呈现可在旅游和住宿设施中使用的优惠券等的构造。

(5)在实施例中，描述了终端设备300的获取器306经通信网络400与指导信息服务器500通信以向指导信息服务器500发送包括识别信息D的信息请求R，以接收响应于信息请求R而从指导信息服务器500发送的指导信息G的示例构造。然而，终端设备300获得指导信息G的方法不限于该示例。例如，指导信息表TB₁可存储在终端设备300的存储装置中，并且获取器306可从存储装置获取对应于识别信息D的指导信息G。

(6)在实施例中，通过示例的方式将语音指导系统1示为包括以下各自作为分离单元的装置：再现系统100；音频处理设备200；终端设备300；和指导信息服务器500。然而，语音指导系统1中包含的装置的构造不限于该示例。例如，可选择诸如修改例(5)中的终端设备300包括指导信息服务器500的功能的构造或者诸如第二实施例中的再现系统100和音频处理设备200被包括在单个装置中的构造。

(7)在上述实施例中的每一个中，描述了播放针对公共巴士的用户的代表关于巴士站的信息的指导语音的示例，但是通过再现系统100的发声装置130发出的声音的类型不限于指导语音。例如，在播放诸如音乐的不同声音的情况下可选择上述实施例中的任一个。根据以上说明将清楚的是，关于上述实施例中的每一个的第一声音音频信号S₁和再现信号A₂被综合表达为指示待再现的声音(用于再现的声音)的信号。

根据第一实施例，发声装置214发出由第二音频信号S₂表示的声音，并且根据第二实施例，发声装置130或者发声装置214发出由通过将再现信号A₂与第二音频信号S₂合成而获得的信号表示的声音。因此，发声装置130和发声装置214综合表达为本发明的发声装置。因此，本发明的发声装置最好被理解为发出由至少包括第二音频信号S₂的信号表示的声音(即，由第二音频信号S₂表示的声音)的装置。

(8)可按照存储在计算机可读记录介质中的格式提供根据上述实施例的程序，并且该程序可安装在计算机中。记录介质是例如非临时记录介质，并且其优选示例可为诸如CD-ROM的光学记录介质(光盘)，但是也可包括公知的自由选择的格式的记录介质，诸如半导体记录介质或磁记录介质。本发明的程序可按照例如经通信网络分布并安装在计算机中的格式来提供。

100……再现系统

102……控制器

104……信号合成器

106……存储装置

108……滤波器

110……操作器

130……发声装置

1042……调制处理器

1044……合成处理器

200……音频处理设备

202……声音接收装置

206……信息提取器

208……存储装置

210……信号处理器

212……信号合成器

214……发声装置

300……终端设备

302……声音接收装置

304……识别器

308……呈现器

500……指导信息服务器。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：森口翔太;濑户优树
技术所有人：雅马哈株式会社
我是此专利的发明人

上一篇：一种自动控制的电动汽车电池组冷却系统的制作方法与工艺
上一篇：纸袋机上的袋体折叠成型装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。