物联网用超低功率柔性压电语音识别传感器的制作方法

文档序号:11635841阅读:282来源:国知局
物联网用超低功率柔性压电语音识别传感器的制造方法与工艺

本发明涉及一种用于物联网(iot:internetofthing)应用的超低功率柔性压电语音识别传感器,具体而言,涉及一种如下的基于柔性压电的超低功率语音识别传感器:为了代替现有的基于麦克风、adc、dsp电路的高功率语音识别传感器,利用柔性压电薄膜,通过多个频率分离信道而将语音根据频率通过多个信道进行分离,同时使分离的所述语音信号由机械振动信号转换成电信号,从而通过语音识别电路的简化而减小功率消耗。



背景技术:

语音识别传感器表示从包含在人类的语音中的声音学信息中提取语言信息,并感测该语音信息而做出反应的传感器。在需要能够简单而方便地使用的naturalui(userinterface)的当今,通过语音进行的对话被认为是未来iot时代的诸多的人类与机器之间的信息交换媒介中的最自热且简便的方法。然而,为了通过机器和语音进行沟通,需要将人类的语音转换为机器可处理的形式,而此过程即为语音识别。

以苹果的siri作为代表的语音识别由麦克风、模数转换器(adc:analogtodigitalconverter)、数字信号处理(dsp:digitalsignalprocessing)的组合构成,而且以移动设备用长期(ordinarytimes)待机使用时消耗功率较高,因而用户以按压开始键和结束键的方式进行操作。这是真正意义上的基于语音识别的物联网(iot:internetofthing)的体现所面对的最大的难关之一,如果开发超低功率长期驱动语音识别系统,则预计能够开启无尽的iot应用之处。

无需专门的学习或训练也能够容易使用的语音识别系统是在针对用于创新的下一代it产品的ui开发及创建的要求变高的iot时代能够引导未来产业的有前途的技术,其具有如下优点:在双手不自由的情况下或者在移动时也能够输入信息,而且由于输入速度比打字速度快,所以能够高速或实时地进行信息处理。

最近,通过基于智能手机终端的性能的进化、人工智能及知识搜索技术的发展、云技术的语音识别系统的大容量数据处理作为智能代理(intelligentagent)而能够准确并迅速地找到用户期望得到的答案,但是即使有这种有点和可能性,语音识别技术还是存在如下的局限性。

首先,从硬件角度来看,利用麦克风、adc、dsp的组合的现有的语音识别技术的功率消耗极高,因此如果没有另外的充电器,则现实中无法在长期待机状态下识别语音,更何况,针对移动设备用语音识别传感器的应用由于能量问题而非常有限。此外,需要进行按压语音识别开始按键等的预备操作,而且其准确性、可靠度、速度等方面较差。即,为了应用到基于iot的智能手机、tv、汽车、其他可穿戴设备,必须具备高灵敏度,而且需要在睡眠(sleep)状态下也能够不消耗大的功率而保持长期待机状态,并以超低功率识别用户的语音。

接着,从声音学和语言学角度来看,由于当前的麦克风、adc、dsp组合的语音识别是基于复杂的算法的语言识别,所以自然的对话风格的识别会受限。

与此相反,人类的耳蜗在对复杂的语言进行频率分离之后通过简单的算法而进行有效的信号处理。尽管有利用这种耳蜗的原理的多种装置,还存在模仿此而应用于人工耳蜗的先例,但是目前尚未存在使用为用于iot的超低功率用语音识别传感器的实例。

柔性压电薄膜人工耳蜗应用案例可以参照h.leeet.al的advancedfunctionalmaterials杂质中的论文vol.24,no.44,pg6914,2014。在梯形的薄的硅胶膜上贴附三个压电元件而根据频率来分离了可听频带的语音信号。在上述文献中,在硅胶膜上贴附三个独立的压电元件而分离频率,由此采用到了人工耳蜗,但是没有将其作为iot用超低功率语音传感器而考虑了其算法和电路设计。

此外,作为揭示利用多个谐振频率而输出触觉反馈效果的压电装置的现有文献,可以参照韩国公开专利第10-2012-0099036号(2012.09.06)。另外,在上述文献中,提供了基于触觉、力、运动感等的触觉反馈技术,但是尚未公开将识别的语音分离为多个频率的状态下进行识别的方案。

(论文)h.leeet.al,advancedfunctionalmaterials,24(44),6914,2014

(专利文献1)kr10-2012-0099036a



技术实现要素:

技术问题

本发明用于解决上述的现有的问题,其目的在于提供一种如下的iot用超低功率压电语音识别传感器:利用由单一元件实现的柔性压电薄膜,将通过构成为梯形形状的多个频率分离信道感测的语音根据频率通过所述多个信道进行分离,同时将所述分离的语音信号通过柔性压电元件而由机械振动信号转换成电信号,从而通过语音识别电路的简化而减小功率消耗。

即,本发明的目的在于提供一种如下的压电语音识别传感器:在对人类语音的频谱进行数字采样及声音信号处理之前,以按频率分离的形态感测并检测语音信号,从而相比于现有的基于麦克风、adc、dsp电路的高功率语音识别传感器,通过语音识别电路的简化而大幅度减小消耗的功率。

此外,本发明提供一种能够利用柔性无机压电元件来代替由麦克风、adc、dsp的组合构成的现有的语音传感器的下一代超低功率语音识别传感器。

技术手段

为解决上述的课题,根据本发明的一观点的物联网用超低功率柔性压电语音识别传感器包括:柔性薄膜600;压电物质层300,层叠于所述柔性薄膜600上;以及电极500,层叠于所述压电物质层300上,所述电极500包括布置成一列的多个频率分离信道,所述多个频率分离信道为长度彼此不同的状态。

所述多个频率分离信道布置成各个单位信道的长度逐渐增加或减小。

所述多个频率分离信道的整体的布置形态为梯形形状。

所述压电语音识别传感器还包括:以将所述电极500整体覆盖的形态层叠的保护层(passivationlayer)。

根据本发明的另一观点的物联网用超低功率柔性压电语音识别传感器的制造方法包括如下步骤:提供牺牲衬底100;在所述牺牲衬底100上层叠缓冲层200;在所述缓冲层200上沉积作为压电物质层的pzt薄膜300;在所述pzt薄膜300上层叠镍金属层400;在所述pzt薄膜300上分离所述缓冲层200;在上述pzt薄膜300上,以一列布置而形成由多个频率分离信道构成的电极500,所述分离步骤包括通过镍剥离工艺或者激光剥离(laserliftoff)工艺而从pzt薄膜300上分离所述缓冲层200的步骤,所述多个频率分离信道为长度彼此不同的状态。

所述方法在形成所述电极500的步骤之后包括在所述电极500上沉积保护层(passivationlayer)的步骤。

所述缓冲层200是硅氧化物。

本发明提供一种移动用超小型语音传感器系统,应用基于语音识别的物联网(iot),其中,包括上述的压电语音识别传感器。

本发明提供一种泛在装置,包括所述移动用超小型语音传感器系统。

本发明提供一种可穿戴电子元件,包括所述移动用超小型语音传感器系统。

技术效果

根据本发明的物联网用超低功率柔性压电语音识别传感器可以将利用构成为梯形形状的多个频率分离信道而感测的语音根据频率通过所述多个信道而进行分离,同时将分离的所述语音信号通过压电元件而由机械振动信号转换为电信号,由此进行识别。

本发明在人类的身体中采用耳蜗的声音传递机制,并制造能够实现频率分离的柔性压电语音识别传感器以及兼容于此的传感器模块,从而实现用于实现可长期驱动的物联网的超低功率语音ui。

此外,可以实现如下的内置式(embedded)语音识别传感器以及模块:利用柔性压电元件,不通过麦克风、adc、dsp的组合,以超低功率分离声波的频率并进行语音识别,从而如果利用此,则机器能够在最大限度地减小功率的消耗量的待机状态下识别语音以及说话人,且能够实现双向沟通和对应。

本发明借助按频率进行语音频谱的分离及数字采样而实现更快更准确的声音信号处理以及高灵敏度的识别,且能够简化声音分析模块而减少费用。据此,尽管有周围噪声等的变异(variability),也能够实现说话人的识别。

此外,本发明在睡眠(sleep)状态下也几乎没有功率消耗,从而能够长期待机并实现语音识别。

本发明能够不进行对语音识别开始键及终止键等进行操作的预备动作而容易、方便地识别说话人以及基本指令。

附图说明

图1是示出现有的语音识别系统和本发明之间的区别点的比较图。

图2至图10是用于说明根据本发明的一实施例的压电语音识别传感器的制造方法的按各个步骤示出的剖面图。

图11是根据本发明的一实施例的压电语音识别传感器的示意图。

图12是根据本发明的一实施例的压电语音识别传感器的实际产品的照片。

图13是示出构成压电语音识别传感器的多个电极信道的构成的图。

图14是示出根据本发明而从语音波长按各个频率进行分离的过程的示意图。

具体实施方式

以下,参照附图对本发明的实施例进行更为详细的说明。然而,本发明并非局限于以下公开的实施例,其可以实现为彼此不同的多样的形态,只不过,本实施例为了使本发明充分被公开,且对具有基本知识的人完整地说明本发明的范围而被提供。在附图中,相同的符号表示相同的要素。

图1是示出现有的语音识别系统和本发明之间的区别点的比较图。在图1中,现有的语音识别系统通过麦克风接收模拟形式的语音信号之后将其通过模数转换器(adc:analogtodigitalconverter)而转换为数字信号,然后通过数字信号处理(dsp:digitalsignalprocessing)而处理数字信号,从而分离频率,但这时具有功耗较高的缺点。

相反,本发明中的超低功率语音识别传感器作为压电传感器能够直接识别语音,从而具有能够实现超低功率驱动的优点。其将经过现有的麦克风、adc、dsp而进行频率分离的过程由一个压电语音识别传感器整合而实现。即,首先将语音信号根据频率而在多个电极信道(channel)进行分离,与此同时,在由压电元件构成的薄膜,机械运动变换为电信号,从而在各个频带下检测出电信号。

即,对现有的麦克风的情况而言,由于使用频带滤波器、adc、dsp,所以消耗功率较高,但是本发明使用按频率分离而生成电流的多个压电元件,所以能够减小频带滤波器、adc、dsp所需的功率。此外,能够降低频率提取所需的功率。

图2至图10是用于说明根据本发明的一实施例的压电语音识别传感器的制造方法的按各个步骤示出的剖面图。

参照图2,公开作为牺牲衬底的硅衬底100。在本发明中,所述牺牲衬底100提供与随后层叠的金属层之间的应力偏差,但是并不与纳米发电机(nanogenerator)元件直接接合。在本发明的一实施例中,所述硅衬底100的压缩应力与接合于元件上部的金属层的拉伸应力失配,而由于随后施加的外部能量,接合于硅衬底100上的独立的缓冲层(本发明的一实施例中的硅氧化物层)发生裂纹,而在下文中将会对缓冲层的水平方向裂纹进行更为详细的说明。本发明尤其能够根据所述金属层和牺牲衬底之间的应力差而调节、控制发生所述裂纹的部位。

在所述硅衬底100上层叠硅氧化物等缓冲层200。在本发明中,所述缓冲层200以能够借助根据应力差而发生的物理力而脱离的水平,与纳米发电机元件接合。在本发明的一实施例中,将硅氧化物层使用为所述缓冲层200,而且硅氧化物层与纳米发电机之间的接合力为,纳米发电机元件能够根据所述下部衬底和金属层之间的应力差而有效地分离的水平。

参照图3,在缓冲层200上通过作为公知技术的溶胶-凝胶(sol-gel)工艺而沉积作为压电物质层的pzt薄膜300。为了从溶胶-凝胶溶液薄膜中去除有机成分,0.4m的pzt溶胶-凝胶溶液(超过10mol%的pbo的52:48摩尔比的zr:ti)在450℃的空气氛围下进行10分钟的热分解过程,同时在2500rpm的转速下被旋转涂布(spincast)于晶片(wafer)上。

所述沉积及热分解步骤为了形成2μm厚度的pzt薄膜而反复执行数次。pzt薄膜的结晶化在空气中650℃下进行45分钟。为了热分解及结晶化工艺而利用到快速热处理(rta)。

参照图4,在pzt薄膜300的上部面层叠作为金属层的镍层400。根据本发明的一实施例,所述镍层400的层叠可以通过溅射或pvd工艺等一般的半导体工艺而执行,除此之外,还可以通过金属涂覆方式而层叠。通过所述层叠,形成接合于pzt薄膜300上的镍400。

参照图5,对上述作为具有残留拉伸应力的金属层的镍层400施加机械能(例如,物理冲击)或热能。结果,发生镍的残留拉伸应力,且发生通过所述缓冲层而与纳米发电机元件间接接合的硅衬底的残留压缩应力与所述残留拉伸应力之间的失配(mismatch)或者非对称效应,据此,在作为硅氧化物的缓冲层200和pzt薄膜300之间的界面发生两层之间的接合被脱离的现象。如此,本发明利用具有与硅衬底的残留压缩应力不同的拉伸应力的金属层,在层叠所需要的元件和衬底之后,从外部施加能量,从而在较弱的接合面上分离元件。尤其,将这样的使元件发生分离的分离面设定为与pzt薄膜300以最弱的力接合的缓冲层的界面,因此具有能够将在硅衬底上制造的元件按原样分离并转印的优点。此外,所述元件分离位置可以根据金属层和牺牲衬底之间的应力差而得到控制。

参照图6,从硅氧化物缓冲层200分离pzt薄膜300,所述pzt薄膜300的接合由于与所述硅衬底接触的金属层的残留拉伸应力的失配而脱离(参照图7)。

另外,将pzt薄膜300从硅氧化物缓冲层200分离的过程还可以通过激光剥离(llo:laserliftoff)工艺而实现。即,对为了将pzt薄膜300从缓冲层200分离而进行的通过xecl-脉冲准分子激光(xecl-pulseexcimerlaser)针对硅氧化物缓冲层200后表面进行的照射而言,例如,xecl激光的光子能量(4.03ev)小于缓冲层200的带隙能量(band-gapenergy),且大于pzt薄膜300的带隙能量,因此能够实现pzt薄膜向柔性塑料基材的转换。结果,激光束贯通硅氧化物缓冲层,之后发生局部熔融以及在与缓冲层之间的界面上发生pzt的解离。

如上所述,发生用于将pzt薄膜转换为塑料衬底的激光剥离(llo:laserliftoff)工艺。

参照图8,使所述分离的pzt薄膜300-镍400层物理移动至柔性塑料衬底600并接合。据此,完成转印到柔性塑料衬底600上的柔性纳米发电机。

参照图9,所述镍层400通过作为一般的化学蚀刻工艺的蚀刻术(etching)而被去除。例如,可以将接合于所述塑料衬底600的元件的上部浸渍到用于蚀刻所述镍层400的特定的蚀刻液,从而去除镍层400。然而,除此之外还可以根据通常的多样的金属层去除方式而选择性去除所述镍层400,而且这也属于本发明的范围内。

接着,参照图10,电极500层叠于pzt薄膜300上,据此,从下部开始以作为柔性薄膜的塑料衬底600、pzt薄膜300以及电极500的形态层叠。在此,所述电极500构成多个频率分离信道。

另外,参照图11,本发明的压电语音识别传感器可以以整体覆盖电极500的形态选择性增设保护层(passivationlayer)。

图12是根据本发明的一实施例的压电语音识别传感器的实际产品的照片,图13是示出构成压电语音识别传感器的多个电极信道的构成的图。

参照图12,在四边形形状的透明的塑料衬底600上布置有圆形的pzt薄膜300以及用于接合所述塑料衬底600和pzt薄膜300的pu粘接剂,而且在pzt薄膜300的上端通过cr/au电极500来收集由pzt薄膜300产生的电能。而且,通过追加地沉积用于保护此的保护层(passivationlayer)而执行保护元件的功能。

另外,塑料衬底600、uv敏感性pu粘接剂、pzt薄膜300、保护层可以由透明的材质构成。由于cr/au电极500是在cr上布置有au的形态,因此电极的颜色用肉眼看到的是金色。

参照图13,cr/au电极500层的整体形状可以是形成为梯形的人工耳蜗的形状,具体而言,可以具有以预定间距分离的六个信道。所述分离的六个电极信道随着形状与木琴(xylophone)相似的人工耳蜗的宽度变宽,高频声音和低频声音的共鸣位置变得不同,因此能够通过物理方式分离人的声音。通过各个分离的六个电极信道而感测的声音按频率而通过模拟电路放大,且经过滤波之后转换成数字信号并得到处理。

本发明的意义除了频率分离以外还在于测量电信号,其中,有意义的频率为0.9hz至2.7hz频带的频率。此外,如果增加信道的数量,则能够实现更为精确的频率分离。

图14是示出根据本发明而从语音波长按频率进行分离的过程的示意图。

如图14所示,可以看出,在与感测的语音波长对应地排列成一列的多个电极信道上,分别提取按各自频率分离的波长信号。

本发明着眼于模仿作为人类的听觉器官的耳蜗而实现语音识别,其可以不使用用于分离频率的现有的麦克风、adc、dsp组合方式,而是使用基于柔性压电语音传感器的简单的电路,从而能够大幅度减小功率消费。此外,如果实现兼容于此的有效的识别算法,则可以以高选择性、灵敏度、感测速度以及稳定性而识别出人类的自然的语言。

本技术可以应用于现实生活,例如,在驾驶过程中,通过语音而安全地使用车辆信息系统,并且能够在长期待机状态下仅通过语音而实现家电控制系统的使用,据此,可以仅通过人的声音而以超低功率远程控制tv、扫地器、洗衣机、空调等。尤其,可以通过注册手脚不方便的残疾人以及患者的关怀(caring)或者语音,从而更为方便地使用电梯等设施。

本技术作为涵盖it-nt-bt-材料整体的主题,其灵感来源于自然,是一种能够丰富人类的生活的融合技术。通过说话人的语音而以较低的功率在长期待机状态下掌握身份、心理、健康状态、语言能力等,因此能够提供个性化的服务的提供,且能够应用于安全、金融、医疗、教育等领域包括在内的传感器的全部领域。

尤其,能够应用于移动健康护理,如在大数据中检测语音模式之后将其分析并存储,从而分析情绪状态,并通过反馈系统而引导心理稳定。而且,通过语音认证以及说话人的识别而强化安全系统,从而期待有助于个人信息及隐私的保护。

本发明可以通过上述的特征而实现基于语音识别的物联网(iot:internetofthings)以及移动用超小型语音传感器系统。

本发明中,在柔性衬底上由高效率无机压电素材制作而成的语音识别传感器在对人类的语音频谱进行数字采样以及声音信号处理之前,利用压电元件将由语音引起的机械振动能按频率而分别分离到不同的位置之后将其转换成电信号,从而按各个频率平行处理语音信号。

本发明中,将多个频率分离信道构成为与木琴形状相似的人工耳蜗的形状,而且随着所述多个频率分离信道的大小变得不同,高频的声音和低频的声音所共鸣的位置变得不同,从而能够以物理方式分离人的语音。在此,所分离的各个声音按频率而通过模拟电路被放大,且经过滤波之后被转换成数字信号而得到处理。该过程相比于现有的利用麦克风、adc、dsp组合的方式而言能够大幅度减小功率消耗。

本发明提供一种结合于柔性薄膜上的压电语音识别传感器,其还可以在贴附于衣服等的状态下得到使用。即,可以应用为如下的技术:在贴附于衣服上的状态下收获在周围容易发生的声波、超声波区域的物理能,并将其转换为电能。

通常,为了实现“无处不在”的泛在网络(ubiquitousnetwork),“无处不在而操作的”泛在电源的存在是必不可少的。另外,到处存在的泛在网络的构成要素的电源需要是一种无需充电的自给自足的形态。即,需要共同配备发电能力和蓄电能力。

如上所述,根据本发明的压电语音识别传感器将利用构成为梯形形状的多个频率分离信道而感测的语音根据频率通过所述多个信道进行分离,同时将分离的所述语音信号通过压电元件而由机械振动信号转换为电信号,从而进行识别。

以上,对本发明的优选实施例进行了说明,但是本发明并不局限于上述的特定实施例。即,在本发明所属的技术领域上具有基本知识的人皆可在不脱离所附权利要求书的思想及范围的前提下对本发明进行多种变更及修订,而且这些所有合适的变更及修订的等同物也将理解为属于本发明的范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1