增进语音即时输出的方法及助听器的制作方法

文档序号：7858626阅读：134来源：国知局

专利名称：增进语音即时输出的方法及助听器的制作方法
技术领域：
本发明涉及一种用于听障者的助听器。
背景技术：
助听器的发展由来已久，主要概念为将声音放大，以帮助听障者听见原本听不到的声音，将声音放大的处理几乎不会产生延迟。另外助听器若针对频率进行处理，通常是将声音频率降低，譬如现有技术美国专利第6，577，739号”Apparatus and methods for proportional audio compression and frequency shifting，，嘗声音信号以某 I匕{列压缩后，提供给对某特定范围有听力损失的听障者，然此技术是对全体声音做压缩，虽然可即时输出，但会使得声音失真严重。
若只针对部分高频声音进行降频，则失真就会降低，然而这牵涉大量运算，因此会造成延迟的问题，常常不适用于即时语音的处理，例如申请人于专利申请第099141772号 (美国专利申请第13/064，645号)虽可减少失真，但会有输出延迟的问题产生。
因此如何减少声音输出的失真的状况下，也能减少声音输出延迟的问题是有需要被解决的。发明内容
语音在处理变频的过程中，有时会产生延迟的现象，造成输出的语音不能同步输出，本发明的主要目的在于增进语音即时输出的方法。
为达成上述的目的，本发明包括下列步骤
将该输入声音切割为多个声音段。
由多个声音段中寻找至少二种不同属性的声音段
静音声音段,静音声音段的声音能量小于一声音能量门滥值；
非静音声音段，非静音声音段的声音能量大于一声音能量门滥值,在实施例中，非静音声音段被区分为高频及低频两种属性。
输出部分的多个声音段，其中
针对全部或部分非静音声音段进行变频处理后全部输出。在实施例中，当非静音声音段的属性为高频时，则要进行变频处理；当非静音声音段的属性为低频时，则不进行变频处理。
以及
针对全部或部分该静音声音段消除而不输出。
利用上述的步骤，全部或部分非静音声音段进行变频处理而产生时间延迟，可通过消除全部或部分该静音声音段，以降低或消除播放非静音声音段的延迟。
以下结合附图和具体实施例对本发明进行详细描述，但不作为对本发明的限定。

图1本发明的助听器的整体架构图2本发明的声音处理模块的步骤流程图3解释本发明处理声音的示意图4解释本发明处理声音的示意图。
其中，附图标记
助听器10收音器11
声音处理模块12声音输出模块13
输入声音20改造输入声音21
声源80听障者8具体实施方式
为让本发明的上述和其他目的、特征和优点能更明显易懂，下文特举出本发明的具体实施例，并配合所附附图，作详细说明如下。
本发明的助听器10包括收音器11、声音处理模块12及声音输出模块13。收音器11用于接收声源80发出的输入声音20,交由声音处理模块12处理后，由声音输出模块13 输出。收音器11可为麦克风等任何可收音的器材，声音输出模块13可包括扬声器，耳机等任何可播音的器材，但本发明不以上述列举的装置为限。声音处理模块12 —般为音效处理芯片搭配控制电路、放大电路所组成；也可为处理器、记忆体搭配控制电路、放大电路所组成的解决技术。声音处理模块12的重点为声音信号的放大处理、滤除噪音、改变声音频率组成以及为了达成本发明目的而需要的处理，由于声音处理模块12可用现有的硬件搭配新的固件或软件，因此声音处理模块12的硬件架构不再赘述。本发明的助听器10基本上可以为将硬件特制化的专用机，也可为小型计算机如PDA、PDA手机，或智能型手机以及个人计算机。譬如以手机而言，处理器执行记忆体内的软件程序后，配合声音芯片、麦克风及喇叭(外接式或耳机)即形成如图1声音处理模块12的主要架构，现在手机处理器执行速度加快，手机配合适当软件即可成为助听器。
接着请参考图2，关于本发明声音处理模块的步骤流程图。另请一并参考图3及图4，关于本发明的相关实施例的示意图，图3及图4以每一阶段接着每一阶段(step by step)的方式(阶段O 阶段11)呈现示意图，以方便了解本发明的重点。
步骤2Ol:
接收一输入声音20。
此步骤由收音器11完成，接收自声源80发出的输入声音20。
步骤202
将输入声音20切割为多个声音段。
请参考图3的“阶段0”，为方便说明起见被切割的输入声音20依照时间顺序被标注为SI，S2，S3....声音段，而每一声音段(SfSll)的属性被标注为” L”，“H”，或“Q”。譬如声音段SI被标注为”L”的意义代表声音段SI的声音偏向低频声音；如声音段S3被标注为” H”的意义代表声音段S3的声音偏向高频声音；而如声音段S8被标注为” Q”的意义代表声音段S8的声音为静音(譬如分贝数低于15以下)。
每一声音段的时间长度建议为O. 000Γ0.1秒之间，以1-Phone4做为助听器的实验中(根据本发明所制作的软件于1-Phone4中执行)，声音段的时间长度约在O. ΟΟΟΓΟΟ.1 秒之间效果不错。
步骤203
由多个声音段中寻找至少二种不同属性的声音段
静音声音段,该静音声音段的声音能量小于一声音能量门滥值；
非静音声音段，该非静音声音段的声音能量大于一声音能量门滥值。
声音处理模块12除了将输入声音20切割为多个声音段之外,并且要判断每一声音段的属性” L”，“H”，或“Q”。声音段是否为静音(”Q”)非常容易判断，基本上只要给一声音能量门槛值(如15分贝)，只要低于设定的门槛值则被判断为静音。声音能量只要高于门槛值都是非静音声音段，在本实施例中，非静音声音段分为至少两种属性，被标注为” L” (低频声音)或“H”(高频声音)。
至于声音段的声音是偏向高频声音或低频声音，主要判断的方式是根据听障者的状况而定。一般而言，人类语言沟通的频率为20赫兹 16000赫兹，而一般听障者难以听到 3000赫兹或4000赫兹以上的频率，听障程度越重度，则所能听到的高频范围越少。因此每一声音段的属性为”L”或“H”即以听障者做为判断。关于如何判断哪一声音段是属于”L” 或“H”的判断方式很多，譬如分析每一声音段有无出现高于某一赫兹(如3000赫兹)的声音，然而此种简单方式判断上较不精准。申请人于专利申请第099141772号(美国专利申请第13/064，645号)也揭露以高频或低频能量来判断，譬如以下是几种可行的判断方式
若1000赫兹(Hz)以下频率的声音能量是最多占30%，且2500赫兹(Hz)以上频率的声音能量至少占70%则为高频” H”属性，反之属于低频” L”属性。
若1000赫兹(Hz)以下频率的声音能量是至少占30%则为低频” L”属性，反之属于高频” H”属性。
若1000赫兹(Hz)以下频率的声音能量最多占30%则为高频” H”属性，反之属于低频” L”属性。
若2500赫兹(Hz)以上频率的声音能量至少占70%则为高频” H”属性，反之属于低频” L”属性。
声音处理模块12基本上可以一切割出声音段，马上判断其属性，也可每切割出如 5个声音段，再一次判断各声音段的属性的批次方式进行。
步骤204
输出部分的多个声音段，其中
针对全部或部分非静音声音段进行变频处理后全部输出；以及
针对全部或部分该静音声音段消除而不输出。
于本实施例中，仅针对非静音声音段但属性为“H”(高频声音)进行变频处理，对于非静音声音段但属性为“L”(低频声音)不进行变频处理。这是因为听障者难以听到高频声音，因此属性为“H”的声音段为“需处理声音段”，而属性为“L”的声音段为“不需处理声音段”。为了听障者听到高频声音，因此变频处理基本上为降低声音频率的处理，譬如以压频或移频方式处理。关于压频或移频的技术为已知技术，在此不再赘述。需注意的是，为了使听障者听到高频声音，传统技术是将整段声音进行降低声音频率的处理，因此处理过的声音失真很严重。专利申请第099141772号(美国专利申请第13/064,645号)即是改善此问题，然而采用先判断是否为高频或低频，再决定仅针对高频声音段进行处理则会有延迟的问题，因此采用专利申请第099141772号(美国专利申请第13/064，645号)的技术对于即时性声音输出会有较明显延迟的问题产生，因此本发明即针对此问题进行改善。
以下请参考图3及图4关于实施例的叙述。
阶段O :—开始的状态，关于标注请见步骤202的说明。
阶段1:第一个声音段SI属性为低频”L”，因此不进行变频处理然后输出。需注意的是，为使听障者听到声音，输出的声音段一般要经过放大处理(增加声音能量)。
阶段2 :第二个声音段S2属性为低频” L”，因此不进行变频处理然后输出。
阶段3 :第三个声音段S3属性为高频”H”，因此需要进行变频处理，由于进行变频处理需要一时间，此时开始产生延迟输出，声音段S3此时无法即时输出。为方便解说起见，在阶段3以声音段SX做为一个虚拟输出，声音段SX事实上无声音也代表延迟的时段。
阶段4 :第四个声音段S4属性为高频”H”，因此需要进行变频处理，在本实施例假设处理变频所需时间等于两个声音段时间，因此声音段S3仍无法输出，当然S4也还在处理变频因此也无法输出，同样的另一个声音段SX加入阶段4。
阶段5 :由于声音段S3已经处理好了，因此输出声音段S3。由图可知，若完全无延迟，在阶段5时，声音段S5应该要输出，但因为有两个延迟SX，因此在阶段5时声音段S3才输出。
阶段6 :由于声音段S4已经处理好了，因此输出声音段S4。
阶段7 :第五个声音段S5属性为低频” L”，因此不进行变频处理然后输出。
阶段8 :第六个声音段S6属性为低频” L”，因此不进行变频处理然后输出。
阶段9 :第七个声音段S7属性为低频”L”，因此不进行变频处理然后输出。由图可知，阶段3的延迟为一个声音段时间(一个SX)，而从阶段4 阶段9的延迟为两个声音段时间(两个SX)。
阶段10 :接下来声音段S8，声音段S9及声音段SlO都是静音。本发明针对全部或部分静音声音段消除而不输出。以此实施例而言，因为延迟了两个声音段时间，因此声音段 S8及声音段S9都不输出，只输出声音段S10。
因此之前有延迟时，本发明即以不输出全部或部分静音声音，以达成减少或消除延迟。假设目前累积有6个声音段的延迟,而若后面有4个静音声音段,则4个静音声音段都不输出；当后面有8个静音声音段，则有6个静音声音段不输出，但会输出2个静音声音段。
一般而言，语音沟通高频声音段占得最少(常常10%以下)，而低频声音段占得最多，静音声音段比高频声音段多了许多。因此当声音处理模块12够快时，去除一些静音声音段可以弥补高频声音段进行变频所延迟的时间。
阶段11 :第十一个声音段Sll属性为低频”L”，因此不进行变频处理然后输出。在阶段11输出声音段Sii显示没有延迟发生了。`
需注意的是，一般助听器中声音处理模块12基本上会包括放大声音以及噪声消除处理，上述由于放大声音以及噪声消除的处理并非本发明的重点，因此不再此赘述。
当然，本发明还可有其它多种实施例，在不背离本发明精神及其实质的情况下，熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形，但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。
权利要求
1.一种增进语音即时输出的方法，用于一助听器，其特征在于，该方法包括接收一输入声音；将该输入声音切割为多个声音段；由多个声音段中寻找至少二种不同属性的声音段静音声音段，该静音声音段的声音能量小于一声音能量门滥值；非静音声音段，该非静音声音段的声音能量大于一声音能量门滥值；输出部分的多个声音段，其中针对全部或部分非静音声音段进行变频处理后全部输出；以及针对全部或部分该静音声音段消除而不输出；利用上述的步骤，全部或部分非静音声音段进行变频处理而产生时间延迟，可通过消除全部或部分该静音声音段，以降低或消除播放非静音声音段的延迟。
2.根据权利要求1所述的增进语音即时输出的方法，其特征在于，非静音声音段包括不需处理声音段及需处理声音段两种，其中于输出部分的多个声音段时当声音段为需处理声音段时，将需处理声音段进行变频处理后输出；以及当声音段为不需处理声音段时，将不需处理声音段以不进行变频处理输出。
3.根据权利要求2所述的增进语音即时输出的方法，其特征在于，变频处理为降低声音频率的处理。
4.根据权利要求3所述的增进语音即时输出的方法，其特征在于，降低声音频率的处理以压频或移频方式处理。
5.根据权利要求3所述的增进语音即时输出的方法，其特征在于，不需处理声音段是合乎下列条件1000赫兹以下频率的声音能量至少占30%。
6.根据权利要求3所述的增进语音即时输出的方法，其特征在于，需处理声音段是合乎下列其中至少一条件1000赫兹以下频率的声音能量最多占30%且2500赫兹以上频率的声音能量至少占70% ；2500赫兹以上频率的声音能量至少占70% ；1000赫兹以下频率的声音能量最多占30% ;或 2500赫兹以上频率的声音能量至少占70%。
7.根据权利要求1至6任意一项所述的增进语音即时输出的方法，其特征在于，，每一声音段的时间长度为O. 000Γ0.1秒之间。
8.一种助听器，其特征在于，包括一收音器，用以接收一输入声音；一声音处理模块，与该收音器电性连接，用以将该输入声音切割为多个声音段；由多个声音段中寻找至少二种不同属性的声音段静音声音段，该静音声音段的声音能量小于一声音能量门滥值；非静音声音段，该非静音声音段的声音能量大于一声音能量门滥值；针对全部或部分非静音声音段进行变频处理；针对全部或部分该静音声音段消除；以及一声音输出模块，与该声音处理模块电性连接，用以输出该声音处理模块处理后的全部或部分的多个声音段；利用上述的构造，全部或部分非静音声音段进行变频处理而产生时间延迟，可通过消除全部或部分该静音声音段，以降低或消除播放非静音声音段的延迟。
9.根据权利要求8所述的助听器，其特征在于，非静音声音段包括不需处理声音段及需处理声音段两种，其中于输出部分的多个声音段时当声音段为需处理声音段时，将需处理声音段进行变频处理后输出；以及当声音段为不需处理声音段时，将不需处理声音段以不进行变频处理输出。
10.根据权利要求9所述的助听器，其特征在于，变频处理为降低声音频率的处理。
11.根据权利要求11所述的助听器，其特征在于，降低声音频率的处理以压频或移频方式处理。
12.根据权利要求10所述的助听器，其特征在于，不需处理声音段是合乎下列条件 1000赫兹以下频率的声音能量至少占30%。
13.根据权利要求10所述的助听器，其特征在于，需处理声音段是合乎下列其中至少一条件1000赫兹以下频率的声音能量最多占30%且2500赫兹以上频率的声音能量至少占70% ；2500赫兹以上频率的声音能量至少占70% ；1000赫兹以下频率的声音能量最多占30% ;或 2500赫兹以上频率的声音能量至少占70%。
14.根据权利要求8至13任意一项所述的助听器，其特征在于，每一声音段的时间长度为O. 000Γ0.1秒之间。
全文摘要
一种增进语音即时输出的方法及助听器，增进语音即时输出的方法用于一助听器。首先将输入声音切割为多个声音段，再判断各声音段的属性，分别为高频、低频、静音。在输出语音时，低频声音段不进行变频处理，高频声音段则进行变频处理才输出，而全部或部分该静音声音段消除而不输出，以降低或消除播放非静音声音段的延迟。
文档编号H04R25/00GK103067840SQ201210301908
公开日2013年4月24日申请日期2012年8月22日优先权日2011年10月20日
发明者赵冠力, 杨治勇, 李京蔚, 杨国屏申请人:杨国屏

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：赵冠力;杨治勇;李京蔚;杨国屏
技术所有人：杨国屏
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。