增进语音即时输出的方法及助听器的制作方法

文档序号:7858626阅读:134来源:国知局
专利名称:增进语音即时输出的方法及助听器的制作方法
技术领域
本发明涉及一种用于听障者的助听器。
背景技术
助听器的发展由来已久,主要概念为将声音放大,以帮助听障者听见原本听不到的声音,将声音放大的处理几乎不会产生延迟。另外助听器若针对频率进行处理,通常是将声音频率降低,譬如现有技术美国专利第6,577,739号”Apparatus and methods for proportional audio compression and frequency shifting,,嘗声音信号以某 I匕{列压缩后,提供给对某特定范围有听力损失的听障者,然此技术是对全体声音做压缩,虽然可即时输出,但会使得声音失真严重。
若只针对部分高频声音进行降频,则失真就会降低,然而这牵涉大量运算,因此会造成延迟的问题,常常不适用于即时语音的处理,例如申请人于专利申请第099141772号 (美国专利申请第13/064,645号)虽可减少失真,但会有输出延迟的问题产生。
因此如何减少声音输出的失真的状况下,也能减少声音输出延迟的问题是有需要被解决的。发明内容
语音在处理变频的过程中,有时会产生延迟的现象,造成输出的语音不能同步输出,本发明的主要目的在于增进语音即时输出的方法。
为达成上述的目的,本发明包括下列步骤
将该输入声音切割为多个声音段。
由多个声音段中寻找至少二种不同属性的声音段
静音声音段,静音声音段的声音能量小于一声音能量门滥值;
非静音声音段,非静音声音段的声音能量大于一声音能量门滥值,在实施例中,非静音声音段被区分为高频及低频两种属性。
输出部分的多个声音段,其中
针对全部或部分非静音声音段进行变频处理后全部输出。在实施例中,当非静音声音段的属性为高频时,则要进行变频处理;当非静音声音段的属性为低频时,则不进行变频处理。
以及
针对全部或部分该静音声音段消除而不输出。
利用上述的步骤,全部或部分非静音声音段进行变频处理而产生时间延迟,可通过消除全部或部分该静音声音段,以降低或消除播放非静音声音段的延迟。
以下结合附图和具体实施例对本发明进行详细描述,但不作为对本发明的限定。


图1本发明的助听器的整体架构图2本发明的声音处理模块的步骤流程图3解释本发明处理声音的示意图4解释本发明处理声音的示意图。
其中,附图标记
助听器10收音器11
声音处理模块12声音输出模块13
输入声音20改造输入声音21
声源80听障者8具体实施方式
为让本发明的上述和其他目的、特征和优点能更明显易懂,下文特举出本发明的具体实施例,并配合所附附图,作详细说明如下。
本发明的助听器10包括收音器11、声音处理模块12及声音输出模块13。收音器11用于接收声源80发出的输入声音20,交由声音处理模块12处理后,由声音输出模块13 输出。收音器11可为麦克风等任何可收音的器材,声音输出模块13可包括扬声器,耳机等任何可播音的器材,但本发明不以上述列举的装置为限。声音处理模块12 —般为音效处理芯片搭配控制电路、放大电路所组成;也可为处理器、记忆体搭配控制电路、放大电路所组成的解决技术。声音处理模块12的重点为声音信号的放大处理、滤除噪音、改变声音频率组成以及为了达成本发明目的而需要的处理,由于声音处理模块12可用现有的硬件搭配新的固件或软件,因此声音处理模块12的硬件架构不再赘述。本发明的助听器10基本上可以为将硬件特制化的专用机,也可为小型计算机如PDA、PDA手机,或智能型手机以及个人计算机。譬如以手机而言,处理器执行记忆体内的软件程序后,配合声音芯片、麦克风及喇叭(外接式或耳机)即形成如图1声音处理模块12的主要架构,现在手机处理器执行速度加快,手机配合适当软件即可成为助听器。
接着请参考图2,关于本发明声音处理模块的步骤流程图。另请一并参考图3及图4,关于本发明的相关实施例的示意图,图3及图4以每一阶段接着每一阶段(step by step)的方式(阶段O 阶段11)呈现示意图,以方便了解本发明的重点。
步骤2Ol:
接收一输入声音20。
此步骤由收音器11完成,接收自声源80发出的输入声音20。
步骤202
将输入声音20切割为多个声音段。
请参考图3的“阶段0”,为方便说明起见被切割的输入声音20依照时间顺序被标注为SI,S2,S3....声音段,而每一声音段(SfSll)的属性被标注为” L”,“H”,或“Q”。 譬如声音段SI被标注为”L”的意义代表声音段SI的声音偏向低频声音;如声音段S3被标注为” H”的意义代表声音段S3的声音偏向高频声音;而如声音段S8被标注为” Q”的意义代表声音段S8的声音为静音(譬如分贝数低于15以下)。
每一声音段的时间长度建议为O. 000Γ0.1秒之间,以1-Phone4做为助听器的实验中(根据本发明所制作的软件于1-Phone4中执行),声音段的时间长度约在O. ΟΟΟΓΟΟ.1 秒之间效果不错。
步骤203
由多个声音段中寻找至少二种不同属性的声音段
静音声音段,该静音声音段的声音能量小于一声音能量门滥值;
非静音声音段,该非静音声音段的声音能量大于一声音能量门滥值。
声音处理模块12除了将输入声音20切割为多个声音段之外,并且要判断每一声音段的属性” L”,“H”,或“Q”。声音段是否为静音(”Q”)非常容易判断,基本上只要给一声音能量门槛值(如15分贝),只要低于设定的门槛值则被判断为静音。声音能量只要高于门槛值都是非静音声音段,在本实施例中,非静音声音段分为至少两种属性,被标注为” L” (低频声音)或“H”(高频声音)。
至于声音段的声音是偏向高频声音或低频声音,主要判断的方式是根据听障者的状况而定。一般而言,人类语言沟通的频率为20赫兹 16000赫兹,而一般听障者难以听到 3000赫兹或4000赫兹以上的频率,听障程度越重度,则所能听到的高频范围越少。因此每一声音段的属性为”L”或“H”即以听障者做为判断。关于如何判断哪一声音段是属于”L” 或“H”的判断方式很多,譬如分析每一声音段有无出现高于某一赫兹(如3000赫兹)的声音,然而此种简单方式判断上较不精准。申请人于专利申请第099141772号(美国专利申请第13/064,645号)也揭露以高频或低频能量来判断,譬如以下是几种可行的判断方式
若1000赫兹(Hz)以下频率的声音能量是最多占30%,且2500赫兹(Hz)以上频率的声音能量至少占70%则为高频” H”属性,反之属于低频” L”属性。
若1000赫兹(Hz)以下频率的声音能量是至少占30%则为低频” L”属性,反之属于高频” H”属性。
若1000赫兹(Hz)以下频率的声音能量最多占30%则为高频” H”属性,反之属于低频” L”属性。
若2500赫兹(Hz)以上频率的声音能量至少占70%则为高频” H”属性,反之属于低频” L”属性。
声音处理模块12基本上可以一切割出声音段,马上判断其属性,也可每切割出如 5个声音段,再一次判断各声音段的属性的批次方式进行。
步骤204
输出部分的多个声音段,其中
针对全部或部分非静音声音段进行变频处理后全部输出;以及
针对全部或部分该静音声音段消除而不输出。
于本实施例中,仅针对非静音声音段但属性为“H”(高频声音)进行变频处理,对于非静音声音段但属性为“L”(低频声音)不进行变频处理。这是因为听障者难以听到高频声音,因此属性为“H”的声音段为“需处理声音段”,而属性为“L”的声音段为“不需处理声音段”。为了听障者听到高频声音,因此变频处理基本上为降低声音频率的处理,譬如以压频或移频方式处理。关于压频或移频的技术为已知技术,在此不再赘述。需注意的是,为了使听障者听到高频声音,传统技术是将整段声音进行降低声音频率的处理,因此处理过的声音失真很严重。专利申请第099141772号(美国专利申请第13/064,645号)即是改善此问题,然而采用先判断是否为高频或低频,再决定仅针对高频声音段进行处理则会有延迟的问题,因此采用专利申请第099141772号(美国专利申请第13/064,645号)的技术对于即时性声音输出会有较明显延迟的问题产生,因此本发明即针对此问题进行改善。
以下请参考图3及图4关于实施例的叙述。
阶段O :—开始的状态,关于标注请见步骤202的说明。
阶段1:第一个声音段SI属性为低频”L”,因此不进行变频处理然后输出。需注意的是,为使听障者听到声音,输出的声音段一般要经过放大处理(增加声音能量)。
阶段2 :第二个声音段S2属性为低频” L”,因此不进行变频处理然后输出。
阶段3 :第三个声音段S3属性为高频”H”,因此需要进行变频处理,由于进行变频处理需要一时间,此时开始产生延迟输出,声音段S3此时无法即时输出。为方便解说起见, 在阶段3以声音段SX做为一个虚拟输出,声音段SX事实上无声音也代表延迟的时段。
阶段4 :第四个声音段S4属性为高频”H”,因此需要进行变频处理,在本实施例假设处理变频所需时间等于两个声音段时间,因此声音段S3仍无法输出,当然S4也还在处理变频因此也无法输出,同样的另一个声音段SX加入阶段4。
阶段5 :由于声音段S3已经处理好了,因此输出声音段S3。由图可知,若完全无延迟,在阶段5时,声音段S5应该要输出,但因为有两个延迟SX,因此在阶段5时声音段S3才输出。
阶段6 :由于声音段S4已经处理好了,因此输出声音段S4。
阶段7 :第五个声音段S5属性为低频” L”,因此不进行变频处理然后输出。
阶段8 :第六个声音段S6属性为低频” L”,因此不进行变频处理然后输出。
阶段9 :第七个声音段S7属性为低频”L”,因此不进行变频处理然后输出。由图可知,阶段3的延迟为一个声音段时间(一个SX),而从阶段4 阶段9的延迟为两个声音段时间(两个SX)。
阶段10 :接下来声音段S8,声音段S9及声音段SlO都是静音。本发明针对全部或部分静音声音段消除而不输出。以此实施例而言,因为延迟了两个声音段时间,因此声音段 S8及声音段S9都不输出,只输出声音段S10。
因此之前有延迟时,本发明即以不输出全部或部分静音声音,以达成减少或消除延迟。假设目前累积有6个声音段的延迟,而若后面有4个静音声音段,则4个静音声音段都不输出;当后面有8个静音声音段,则有6个静音声音段不输出,但会输出2个静音声音段。
一般而言,语音沟通高频声音段占得最少(常常10%以下),而低频声音段占得最多,静音声音段比高频声音段多了许多。因此当声音处理模块12够快时,去除一些静音声音段可以弥补高频声音段进行变频所延迟的时间。
阶段11 :第十一个声音段Sll属性为低频”L”,因此不进行变频处理然后输出。在阶段11输出声音段Sii显示没有延迟发生了。`
需注意的是,一般助听器中声音处理模块12基本上会包括放大声音以及噪声消除处理,上述由于放大声音以及噪声消除的处理并非本发明的重点,因此不再此赘述。
当然,本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附 的权利要求的保护范围。
权利要求
1.一种增进语音即时输出的方法,用于一助听器,其特征在于,该方法包括接收一输入声音;将该输入声音切割为多个声音段;由多个声音段中寻找至少二种不同属性的声音段静音声音段,该静音声音段的声音能量小于一声音能量门滥值;非静音声音段,该非静音声音段的声音能量大于一声音能量门滥值;输出部分的多个声音段,其中针对全部或部分非静音声音段进行变频处理后全部输出;以及针对全部或部分该静音声音段消除而不输出;利用上述的步骤,全部或部分非静音声音段进行变频处理而产生时间延迟,可通过消除全部或部分该静音声音段,以降低或消除播放非静音声音段的延迟。
2.根据权利要求1所述的增进语音即时输出的方法,其特征在于,非静音声音段包括不需处理声音段及需处理声音段两种,其中于输出部分的多个声音段时当声音段为需处理声音段时,将需处理声音段进行变频处理后输出;以及当声音段为不需处理声音段时,将不需处理声音段以不进行变频处理输出。
3.根据权利要求2所述的增进语音即时输出的方法,其特征在于,变频处理为降低声音频率的处理。
4.根据权利要求3所述的增进语音即时输出的方法,其特征在于,降低声音频率的处理以压频或移频方式处理。
5.根据权利要求3所述的增进语音即时输出的方法,其特征在于,不需处理声音段是合乎下列条件1000赫兹以下频率的声音能量至少占30%。
6.根据权利要求3所述的增进语音即时输出的方法,其特征在于,需处理声音段是合乎下列其中至少一条件1000赫兹以下频率的声音能量最多占30%且2500赫兹以上频率的声音能量至少占70% ;2500赫兹以上频率的声音能量至少占70% ;1000赫兹以下频率的声音能量最多占30% ;或 2500赫兹以上频率的声音能量至少占70%。
7.根据权利要求1至6任意一项所述的增进语音即时输出的方法,其特征在于,,每一声音段的时间长度为O. 000Γ0.1秒之间。
8.一种助听器,其特征在于,包括一收音器,用以接收一输入声音;一声音处理模块,与该收音器电性连接,用以将该输入声音切割为多个声音段;由多个声音段中寻找至少二种不同属性的声音段静音声音段,该静音声音段的声音能量小于一声音能量门滥值;非静音声音段,该非静音声音段的声音能量大于一声音能量门滥值;针对全部或部分非静音声音段进行变频处理;针对全部或部分该静音声音段消除;以及一声音输出模块,与该声音处理模块电性连接,用以输出该声音处理模块处理后的全部或部分的多个声音段;利用上述的构造,全部或部分非静音声音段进行变频处理而产生时间延迟,可通过消除全部或部分该静音声音段,以降低或消除播放非静音声音段的延迟。
9.根据权利要求8所述的助听器,其特征在于,非静音声音段包括不需处理声音段及需处理声音段两种,其中于输出部分的多个声音段时当声音段为需处理声音段时,将需处理声音段进行变频处理后输出;以及当声音段为不需处理声音段时,将不需处理声音段以不进行变频处理输出。
10.根据权利要求9所述的助听器,其特征在于,变频处理为降低声音频率的处理。
11.根据权利要求11所述的助听器,其特征在于,降低声音频率的处理以压频或移频方式处理。
12.根据权利要求10所述的助听器,其特征在于,不需处理声音段是合乎下列条件 1000赫兹以下频率的声音能量至少占30%。
13.根据权利要求10所述的助听器,其特征在于,需处理声音段是合乎下列其中至少一条件1000赫兹以下频率的声音能量最多占30%且2500赫兹以上频率的声音能量至少占70% ;2500赫兹以上频率的声音能量至少占70% ;1000赫兹以下频率的声音能量最多占30% ;或 2500赫兹以上频率的声音能量至少占70%。
14.根据权利要求8至13任意一项所述的助听器,其特征在于,每一声音段的时间长度为O. 000Γ0.1秒之间。
全文摘要
一种增进语音即时输出的方法及助听器,增进语音即时输出的方法用于一助听器。首先将输入声音切割为多个声音段,再判断各声音段的属性,分别为高频、低频、静音。在输出语音时,低频声音段不进行变频处理,高频声音段则进行变频处理才输出,而全部或部分该静音声音段消除而不输出,以降低或消除播放非静音声音段的延迟。
文档编号H04R25/00GK103067840SQ201210301908
公开日2013年4月24日 申请日期2012年8月22日 优先权日2011年10月20日
发明者赵冠力, 杨治勇, 李京蔚, 杨国屏 申请人:杨国屏
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1