语音识别装置及其操作方法

文档序号:2831962阅读:182来源:国知局
专利名称:语音识别装置及其操作方法
技术领域
本发明是有关于一种语音识别装置及其操作方法,且特别是有关于一种具可移植 性、个人化与智能型的语音识别装置及其操作方法。
背景技术
近年来,语音识别系统由于具有使用方便,提高效率及节省成本的几项优势,因此 广泛地被应用在各行各业。例如,使用者对着麦克风输入指令语音,例如是“复制”,然后经 语音软件比对出对应的装置码,例如是代表复制功能的装置码。因此,在识别过程中,用口 述方式就能取代键盘的操作,相当便利。一般而言,在进行语音识别前须先安装语音软件至主机内并进行语音训练。语音 软件在计算出训练语音的训练特征值后,将训练特征值储存在主机内。当使用者进行语音 识别时,对着麦克风输入指令语音,然后由主机内的语音软件计算出指令语音的指令特征 值后,将指令特征值与主机内的多个训练特征值进行比对,以比对出对应的语音特征值。然 后,再输出与语音特征值对应的装置码。然而,由于语音软件必须安装在主机内且训练特征值也储存于主机内,若主机损 坏或使用者更换到另一台主机使用,则必须重新安装语音软件且必须重新进行语音训练。 此外,每次用来输入指令语音的麦克风不一定是同一支,由于每支麦克风对声音的音频撷 取都有些差异,若使用到与进行语音训练时用的麦克风差异过大的麦克风来进行语音识别 操作,为达到高识别率的语音识别,则须重新进行语音训练,相当地不便。

发明内容
本发明是有关于一种语音识别装置及其操作方法,是将运算出的训练特征值储存 于一语音识别装置内。如此,使用者可随身携带语音识别装置,就算是更换不同的主机,亦 不须重新进行语音训练。如此,不但省时且相当便利。根据本发明的第一方面,提出一种语音识别装置。语音识别装置包括人机界面 (HID Interface)、语音输入界面、语音转码单元、语音数据库及装置处理单元。人机界面用 以向主机列举语音识别装置为操作装置。语音输入界面用以撷取模拟指令语音。语音转码 单元用以转换模拟指令语音为数字指令语音。语音数据库包括数个模型特征值及数个模型 装置码,模型特征值对应于模型装置码。以及,装置处理单元用以比对数字指令语音的指令 特征值与模型特征值,并输出对应的模型装置码至主机。根据本发明的第二方面,提出一种语音识别装置的操作方法。操作方法包括以下 步骤。向主机列举语音识别装置为操作装置。其中,语音识别装置储存有语音数据库,语音 数据库包括数个模型特征值及数个模型装置码,模型特征值对应至模型装置码;撷取模拟 指令语音;转换模拟指令语音为数字指令语音;比对数字指令语音的指令特征值与模型特 征值;以及,输出对应的模型装置码至主机。根据本发明的第三方面,提出一种语音识别装置。语音识别装置包括大量储存界面、语音输入界面、语音转码单元、语音数据库及装置处理单元。大量储存界面用以与主机电性连接并向主机将语音识别装置列举为大量储存装置(Mass Storage Device) 0语音输 入界面用以撷取模拟指令语音。语音转码单元用以转换模拟指令语音为数字指令语音。语 音数据库包括数个模型特征值及数个模型装置码,模型特征值对应于模型装置码。以及,装 置处理单元用以传送语音数据库及应用程序至主机。其中,主机用以加载应用程序并比对 数字指令语音的指令特征值与模型特征值,以传送对应的模型装置码。根据本发明的第四方面,提出一种语音识别装置的操作方法。操作方法包括以下步骤。向主机列举语音识别装置为大量储存装置。其中,语音撷取装置储存有应用程序、数 个模型特征值及数个模型装置码,模型特征值对应至模型装置码;传送语音数据库与应用 程序至主机;主机加载应用程序;撷取模拟指令语音;转换模拟指令语音为数字指令语音; 主机比对数字指令语音的指令特征值与此些模型特征值;以及,主机传送对应的模型装置 码。为让本发明的上述内容能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下


图1绘示依照本发明第一实施例的语音识别装置的功能方块图。图2绘示依照本发明第一实施例的语音识别装置的操作流程图。图3绘示依照本发明第二实施例的语音识别装置的功能方块图。图4绘示依照本发明第二实施例的语音识别装置的操作流程图。图5绘示第二实施例的语音训练窗口的示意图。图6绘示依照本发明第三实施例的语音识别装置的功能方块图。图7绘示依照本发明第三实施例的语音识别装置的操作流程图。图8绘示依照本发明第四实施例的语音识别装置的功能方块图。图9绘示依照本发明第四实施例的语音识别装置的操作流程图。图10绘示本发明另一实施例的语音识别装置的功能方块图。[主要元件标号说明]100、300、600、800、900 语音识别装置102、902 人机界面104,616 语音输入界面106,606 语音转码单元108,608 储存单元110、610 装置处理单元112、612 语音数据库114、614:主机302、602、802 应用程序304,604 大量储存界面308、904 复合式装置Kl 训练装置码Sl 模拟指令语音
S2 数字指令语音Tl 模拟训练语音T2 数字训练语音W:语音训练窗口W11、W12、W13 语音字段W21、W22、W23 装置码字段
具体实施例方式依照本发明的语音识别装置及其操作方法,是将计算出的训练特征值储存于语音 数据库内,而语音数据库储存于语音识别装置内。如此,使用者可随身携带语音识别装置, 就算是更换不同的主机,亦不须重新进行语音训练。如此,不但省时且相当便利。底下以多 组应用实例来作说明。然此些实施例仅为本发明的发明精神下的几种实施方式,其说明的 文字与图标并不会对本发明的欲保护范围进行限缩。请参照图1,其绘示依照本发明第一实施例的语音识别装置的功能方块图。语音识 别装置100,例如是麦克风,其包括人机界面102、语音输入界面104、语音转码单元106、储 存单元108及装置处理单元110。人机界面102用以向主机114列举语音识别装置为操作装置,操作装置例如是键 盘或鼠标。其中,人机界面102可为通用串行总线标准界面(Universal Serial Bus,USB) 或PS/2界面,而第一实施例的人机界面102以通用串行总线标准界面为例作说明。语音输 入界面104用以撷取模拟指令语音Si。语音转码单元106用以转换模拟指令语音Sl为数 字指令语音S2。储存单元108用以储存语音数据库112,语音数据库112包括数个模型特征值(未 绘示)及数个模型装置码(未绘示),而模型特征值对应于模型装置码,模型装置码为键盘 码(未绘示)或鼠标码(未绘示)。举例来说,模型特征值包括语音“复制”的特征值及语 音“删除”的特征值,而模型装置码包括对应于“复制”的模型特征值的模型装置码及对应 于“删除”的模型特征值的模型装置码。装置处理单元110用以运算出数字指令语音S2的指令特征值(未绘示)并比对 指令特征值与模型特征值,并从模型特征值中比对出与指令特征值相似的模型特征值。当 比对出与指令特征值相似的模型特征值后,装置处理单元110输出对应于相似的模型特征 值的模型装置码至主机114。如上所述的装置处理单元110,其比对功能与传送模型装置码的功能是可以固件 (firmware)形式实现。因此,第一实施例的语音识别装置100在执行语音识别操作时,并不 需要另外安装任何应用程序。如此,只要携带着语音识别装置100,到哪里都能进行语音识 别操作,不用担心主机是否有安装语音识别软件,相当方便。由于语音识别装置100具有可移植性,使用者可随身携带语音识别装置100。也就 是说,可随身携带语音数据库112。如此,不管换到哪一台主机,都能通过储存于语音识别装 置100的语音数据库112内的模型特征值来进行语音识别操作,而无需重新再进行语音训练。并且,由于语音识别装置100本身就包括语音输入界面104及语音转码单元106,所以不需通过其它的语音撷取装置,例如是其它的麦克风来输入模拟指令语音。如此,便排 除了不同的语音撷取装置的差异性所造成的语音识别率下降的问题。请参照图2,其绘示依照本发明的第一实施例的语音识别装置的操作流程图。操作 方法包括以下步骤。首先,于步骤S202中,电性连接语音识别装置100与主机114,人机界 面102并向主机114列举语音识别装置100为操作装置。接着,于步骤S204中,语音输入 界面104撷取模拟指令语音Si,例如是使用者对着语音输入界面104讲出“复制”。再来,于步骤S206中,语音转码单元106转换模拟指令语音Sl为数字指令语音 S20接着,于步骤S208中,装置处理单元110运算出数字指令语音S2的指令特征值。然后,于步骤S210中,装置处理单元110比对指令特征值与模型特征值,并从模型 特征值中比对出与指令特征值相似的模型特征值。例如,装置处理单元110将指令特征值 与语音数据库112中“复制”的模型特征值与“删除”的模型特征值进行比对后,发现“复制” 的模型特征值与指令特征值相似。然后,于步骤S212中,装置处理单元110通过人机界面102,输出语音数据库112 的多个模型装置码中与“复制”的模型特征值相对应的模型装置码至主机114。请参照图3,其绘示依照本发明第二实施例的语音识别装置的功能方块图。第二实 施例与第一实施例不同之处在于,第二实施例的语音识别装置300的储存单元108还储存 有应用程序302,而应用程序302用以进行语音训练。此外,语音识别装置300还包括大量 储存界面(Mass Storage Interface) 304,应用程序302即通过大量储存界面304被传送至 主机114,以让主机114加载以进行语音训练操作。其余相同之处沿用相同标号,在此就不 再赘述。大量储存界面304,例如是通用串行总线标准界面,用以与主机114电性连接并向 主机114将语音识别装置300列举为大量储存装置。大量储存装置例如是含应用程序光盘 片的光驱或随身碟,第二实施例的大量储存装置是以列举成光驱为例作说明。此外,语音输入界面104于第二实施例的语音识别装置300还用以撷取模拟训练 语音Tl,而语音转码单元106还用以转换模拟训练语音Tl为数字训练语音T2。此外,装置 处理单元110通过大量储存界面传送应用程序302至主机114,且用以运算出数字训练语音 T2的训练特征值(未绘示)。较佳地,运算出训练特征值所采用的语音算法与运算出指令 特征值所采用的语音算法是相同的。当装置处理单元110传送应用程序302至主机后,主机114的处理单元(未绘示) 加载应用程序302。之后,主机114还用以撷取训练装置码K1,训练装置码Kl为键盘码或 鼠标码。其中,训练装置码Kl对应于训练特征值。通过第二实施例的应用程序,可进行语音训练及装置码的输入。并由装置处理单 元110运算出数字训练语音T2的训练特征值后,将训练特征值储存进语音识别装置300内 的语音数据库112,使训练特征值成为数个模型特征值之一。并且,装置处理单元110将对 应的装置码,即对应于训练特征值的训练装置码Kl储存进语音识别装置300内的语音数据 库112,使训练装置码Kl成为数个模型装置码之一。此外,由于语音识别装置300包含人机界面102与大量储存界面304,所以语音识 别装置300向主机114列举为一包含操作装置与大量储存装置的复合式装置308。因此,语音识别装置300除了可与主机114配合以进行语音训练操作外,语音识别装置300的装置 处理单元110还可进行语音识别的操作并通过人机界面102输出模型装置码至主机114。 也就是说,语音识别装置300为同时具有语音训练功能及语音识别功能的装置。 请参照图4,其绘示依照本发明第二实施例的语音识别装置的操作流程图。操作方 法包括以下步骤。首先,于步骤S402中,电性连接语音识别装置300与主机114,大量储存 界面304并向主机114列举语音识别装置300为大量储存装置,而人机界面102向主机114 列举语音识别装置300为操作装置,使语音识别装置300成为包含操作装置与大量储存装 置的复合式装置308。接着,于步骤S404中,语音识别装置300传送应用程序302至主机114,以让主 机114加载。由于语音识别装置300被列举成光驱,所以语音识别装置300的储存单元 108可储存有自动执行设定文件,例如是文件名为“autorim. inf ”的文件。文件“autorun. inf”记录有执行应用程序302的路径及指令。当主机114发现语音识别装置300内有文件 "autorun. inf ”时,便自动执行此文件所指向的应用程序302。也就是说,在应用程序302 被主机114加载的过程中,是自动完成的,并不需使用者手动设定或点取。此外,当语音识别装置300被列举为随身碟时也可以执行语音训练操作。举例来 说,当语音识别装置300被列举为随身碟时,使用者可以自行点选储存单元108内的应用程 序302,在连续双击或按下键盘的确认键(Enter)后,主机114就加载应用程序302。如此, 一样可以完成启动应用程序302的操作。再来,请参照图5,其绘示第二实施例的语音训练窗口的示意图。于步骤S406中, 主机114加载装置处理单元110所传来的应用程序302,并开启语音训练窗口 W,语音训练 窗口 W包括数个语音字段,例如是语音字段Wl 1、W12及W13及数个装置码字段,例如是装置 码字段W21、W22及W23。语音字段用以记录数字训练语音T2,装置码字段用以记录训练装 置码K1。然后,于步骤S408中,语音输入界面104撷取模拟训练语音Tl,例如是使用者对着 语音识别装置300讲出“复制”。然后,于步骤S410中,语音转码单元106转换模拟训练语音Tl为数字训练语音 T2。转换完成之后,主机114可将代表数字训练语音T2已转换完成的消息记录于语音字段 的一者,例如是记录于语音字段W11。记录形式例如是文件名形式或符号形式。然后,于步骤S412中,装置处理单元110运算出数字训练语音T2的训练特征值。 或者,运算出数字训练语音T2的训练特征值的操作也可以由主机114来完成。更进一步地 说,若运算出训练特征值的操作系由主机114来完成的话,应用程序302还包含了语音的特 征值的运算功能。较佳地,不管运算特征值的操作是由主机114或装置处理单元110执行, 所使用的语音算法是相同的。然后,于步骤S414中,主机114撷取训练装置码Kl,训练装置码Kl对应于训练特 征值。训练装置码Kl例如是使用者触发与主机114相连接的键盘(未绘示)的按键后,由 主机114撷取而得。主机114在撷取完训练装置码Kl后,将其记录于装置码字段的一者, 例如是记录于装置码字段W21。记录形式例如是符号形式或训练装置码Kl的码号。使用者在触发与主机114相连接的键盘上的按键之前,可点击语音训练窗口 W上 的装置码字段W21,以提醒主机114 一使用者已经开始要输入对应数字训练语音T2的训练装置码K1。较佳地,语音训练窗口 W还提供确认按键(未绘示)。当步骤S414完成后且经 使用者触发此确认按键后,方进入步骤S416。或者,也可在输入完模拟训练语音Tl及训练 装置码Kl后,随即进入步骤S416,不需使用者执行任何的确认操作。
然后,于步骤S416中,主机114可传送代表训练完成的信号(未绘示)给语音识 别装置300。在语音识别装置300收到此信号后,语音识别装置300储存训练特征值至语音 数据库112,以使训练特征值成为数个模型特征值的一者,且将训练装置码Kl通过人机界 面102或大量储存界面304储存进语音数据库112,以使训练装置码Kl成为数个模型装置 码的一者。由于语音识别装置300为同时包含操作装置的复合式装置308。故于结束语音训 练的操作后,可随时使用语音识别装置300执行语音识别功能,例如可采用图2的第一实施 例的操作方法,来进行语音识别操作。请参照图6,其绘示依照本发明第三实施例的语音识别装置的功能方块图。第三 实施例与第一实施例不同之处在于,第三实施例的语音识别装置600的储存单元608储存 有应用程序602,应用程序602用以让主机614加载,以进行语音识别功能,且语音识别装 置600并无人机界面102,而改以大量储存界面604取代,应用程序602即通过此大量储存 界面604被传送至主机614,以让主机614加载。其余相同之处沿用相同标号,在此不再赘 述。语音识别装置600,例如是麦克风包括大量储存界面604、语音输入界面616、语音 转码单元606、储存单元608及装置处理单元610。大量储存界面604,例如为通用串行总线标准界面,用以向主机614列举语音识别 装置600为大量储存装置。大量储存装置例如是含应用程序光盘片的光驱或随身碟,第三 实施例的大量储存装置是以光驱为例作说明。语音输入界面616用以撷取模拟指令语音Sl。语音转码单元606用以转换模拟指 令语音Sl为数字指令语音S2。储存单元608储存有应用程序602及语音数据库612,语音 数据库612包括数个模型特征值(未绘示)及数个模型装置码(未绘示)。模型特征值对 应于模型装置码,模型装置码为键盘码(未绘示)或鼠标码(未绘示)。举例来说,模型特 征值包括语音“复制”的特征值及语音“删除”的特征值,而模型装置码包括对应于“复制” 的模型特征值的模型装置码及对应于“删除”的模型特征值的模型装置码。装置处理单元610用以传送语音数据库612及应用程序602至主机614,以让主机 614加载。于语音数据库612及应用程序602被传送完成后,主机614加载应用程序602。 之后,主机614用以运算出数字指令语音S2的指令特征值并还用以从多个模型特征值中比 对出与指令特征值相似的模型特征值并用以传送多个模型装置码中与相似的模型特征值 对应的模型装置码。更进一步地说,第一实施例的语音识别装置100及第二实施例的语音识别装置 300是以写入装置处理单元110的固件来执行语音识别操作,而第三实施例的语音识别装 置600则由主机614加载应用程序602来执行语音识别的操作。由此可知,本发明的语音识 别装置的语音识别操作可以多种方式来进行,并不受限于本发明的实施例所描述的内容。此外,第三实施例是由主机来执行语音识别操作,当主机的处理单元(未绘示)的 数据处理速度快于装置处理单元610时,可选择第三实施例的语音识别装置600,以节省执行语音识别操作所需要的时间。请参照图7,其绘示依照本发明第三实施例的语音识别装置的操作流程图。操作方法包括以下步骤。首先,于步骤S702中,电性连接语音识别装置600与主机614,大量储存界面604 并向主机614列举语音识别装置600为大量储存装置。接着,于步骤S704中,装置处理单元610传送语音数据库612与应用程序602至 主机614。再来,于步骤S706中,主机614加载装置处理单元610所传来的应用程序602。然后,于步骤S708中,语音输入界面616撷取模拟指令语音Si,例如是使用者对着 语音输入界面104讲出“复制”。然后,于步骤S710中,语音转码单元606转换模拟指令语音Sl为数字指令语音 S2。然后,于步骤S712中,运算出数字指令语音S2的指令特征值。然后,于步骤S714中,主机614从模型特征值中比对出与指令特征值相似的模型 特征值。例如,主机614将指令特征值与语音数据库612中“复制”的模型特征值与“删除” 的模型特征值进行比对,发现“复制”的模型特征值与指令特征值较接近。然后,于步骤S716中,主机614传送模型装置码中与相似的模型特征值对应的模 型装置码,即传送对应于“复制”的模型特征值的模型装置码。传送目标例如是主机614所 开启的应用程序,如WORD文书处理系统,以对文字进行复制操作。此外,请参照图8,其绘示依照本发明第四实施例的语音识别装置的功能方块图。 第四实施例与第三实施例不同之处在于,第四实施例的语音识别装置800的应用程序802 除了包含应用程序602的语音识别功能外,还包括了语音训练的功能。更进一步地说,主机 614加载应用程序后,除了可进行语音识别操作外,还可进行语音训练操作。亦即,语音识别 装置800为同时具有语音训练功能及语音识别功能的装置。其余相同之处沿用相同标号, 在此不再赘述。请参照图9,其绘示依照本发明第四实施例的语音识别装置的操作流程图。操作方 法包括以下步骤。首先,于步骤S902中,电性连接语音识别装置800与主机614,大量储存 界面604并向主机614列举语音识别装置800为大量储存装置。接着,于步骤S904中,语 音识别装置800传送应用程序802至主机614,以让主机614加载。由于语音识别装置800 被列举成光驱,所以语音识别装置800的储存单元608可储存有自动执行设定文件,例如是 文件名为“autorim. inf"的文件,其执行方式如第二实施例的步骤S404所揭露,在此不再 赘述。再来,如图5所示,于步骤S906中,主机614加载装置处理单元610所传来的应用 程序802,并开启语音训练窗口 W。语音训练过程如第二实施例的步骤S406所揭露,在此不 再赘述。然后,于步骤S908中,语音输入界面616撷取模拟训练语音Tl,例如是使用者对着 语音识别装置300讲出“复制”。然后,于步骤S910中,语音转码单元606转换模拟训练语 音Tl为数字训练语音T2。然后,于步骤S912中,装置处理单元610运算出数字训练语音T2的训练特征值。 或者,运算出数字训练语音T2的训练特征值的操作也可以由主机614来完成。更进一步地 说,若运算出训练特征值的操作是由主机614来完成的话,应用程序802还包含了语音的特征值的运算功能。较佳地,不管运算特征值的操作是由主机614或装置处理单元610执行,所使用的语音算法是相同的。然后,于步骤S914中,主机614撷取训练装置码K1,训练装置码Kl对应于训练特 征值。训练装置码Kl例如是使用者触发与主机114相连接的键盘(未绘示)的按键后,由 主机614撷取而得。然后,于步骤S916中,主机614可传送代表训练完成的信号(未绘示)给语音识 别装置800。语音识别装置800收到此信号后,语音识别装置800储存训练特征值至语音数 据库612,以使训练特征值成为数个模型特征值的一者,且将训练装置码Kl通过大量储存 界面604储存进语音数据库612,以使训练装置码Kl成为数个模型装置码的一者。虽然,第四实施例的语音识别装置800在执行语音训练操作时,训练装置码Kl通 过大量储存界面604储存至语音识别装置800的语音数据库612内。然于其它实施态样中, 训练装置码Kl也可以通过人机界面储存至语音识别装置800的语音数据库612内。请参 照图10,其绘示本发明另一实施例的语音识别装置的功能方块图。语音识别装置900与语 音识别装置800不同之处为,语音识别装置900可列举为包含人机界面902及大量储存界 面604的复合式装置904。在图10中与图8的相同之处沿用相同标号,在此不再赘述。如 此,训练装置码Kl也可通过人机界面902储存至语音识别装置800的语音数据库612内。此外,虽然本发明上述实施例的语音识别装置是以麦克风为例作说明,然于其它 实施例中,语音识别装置也可以是键盘、鼠标或手机等,其应用范围并不受本发明的实施例 所限制。本发明上述实施例所揭露的语音识别装置及其操作方法,具有多项优点,以下仅 列举部分优点说明如下(1).语音数据库与应用程序是储存于语音识别装置内。使用者可随身携带语音识 别装置,就算是更换不同的主机,亦不须重新进行语音训练。如此,不但省时且相当便利。(2).语音识别装置100的装置处理单元110具有语音识别功能的固件,使得主机 不需加载任何软件就能进行语音识别操作。也就是说,语音识别装置100不需储存应用程 序就能进行语音识别操作。(3).语音识别装置600及语音识别装置800的语音识别功能可由主机加载其应用 程序602或802来执行。如此,当主机的数据处理速度较快时,可节省语音识别的时间。因 此,本发明的语音识别装置具有多种实施态样,可配合不同的环境使语音识别的过程更有 效率。(4).语音识别装置300、语音识别装置800及语音识别装置900为同时具有语音 识别及语音训练的功能。(5).上述实施例的语音识别装置可被列举成光驱,如此,使得应用程序可被自动 地传送至主机且主机自动地加载应用程序。如此,节省使用者手动执行应用程序的时间。综上所述,虽然本发明已以数组较佳实施例揭露如上,然其并非用以限定本发明。 本发明所属技术领域中具有通常知识者,在不脱离本发明的精神和范围内,当可作各种的 更动与润饰。因此,本发明的保护范围当视所附的权利要求范围所界定者为准。
权利要求
一种语音识别装置,包括人机界面,用以向主机列举该语音识别装置为操作装置;语音输入界面,用以撷取模拟指令语音;语音转码单元,用以转换该模拟指令语音为数字指令语音;语音数据库,包括多个模型特征值及多个模型装置码,该多个模型特征值对应于该多个模型装置码;以及装置处理单元,用以比对该数字指令语音的指令特征值与该多个模型特征值,并输出对应的该模型装置码至该主机。
2.根据权利要求1所述的语音识别装置,其中该装置处理单元从该多个模型特征值中 比对出与该指令特征值相似的模型特征值,并且该装置处理单元还用以输出该多个模型装 置码中与该相似的模型特征值对应的该模型装置码至该主机。
3.根据权利要求1所述的语音识别装置,还包括大量储存界面,用以向该主机列举该语音识别装置为大量储存装置; 其中,该语音输入界面还用以撷取模拟训练语音,该语音转码单元用以转换该模拟训 练语音为数字训练语音,该语音识别装置储存有应用程序,该装置处理单元还用以通过该 大量储存界面传送该应用程序至该主机,该主机还用以加载该应用程序及撷取训练装置 码,该训练装置码对应于该数字训练语音的训练特征值;其中,该装置处理单元还用以将该训练特征值储存进该语音数据库,以使该训练特征 值成为该多个模型特征值的一者并将该训练装置码储存进该语音数据库,以使该训练装置 码成为该多个模型装置码的一者。
4.一种语音识别装置的操作方法,包括向主机列举语音识别装置为操作装置,其中该语音识别装置包括多个模型特征值及多 个模型装置码,该多个模型特征值对应至该多个模型装置码; 撷取模拟指令语音; 转换该模拟指令语音为数字指令语音; 比对该数字指令语音的指令特征值与该多个模型特征值;以及 输出对应的该模型装置码至该主机。
5.根据权利要求4所述的操作方法,还包括 列举该语音识别装置为大量储存装置;传送该语音识别装置所储存的应用程序至该主机; 该主机加载该应用程序; 撷取模拟训练语音; 转换该模拟训练语音为数字训练语音;该主机撷取训练装置码,该训练装置码对应于该数字训练语音的训练特征值;以及 储存该训练特征值,以使该训练特征值成为该多个模型特征值的一者,及储存该训练 装置码,以使该训练装置码成为该多个模型装置码的一者。
6.一种语音识别装置,包括大量储存界面,用以向主机列举该语音识别装置为大量储存装置; 语音输入界面,用以撷取模拟指令语音;语音转码单元,用以转换该模拟指令语音为数字指令语音;语音数据库,包括多个模型特征值及多个模型装置码,该多个模型特征值对应于该多 个模型装置码;以及装置处理单元,用以传送该语音数据库及应用程序至该主机; 其中,该主机用以加载该应用程序且比对该数字指令语音的指令特征值与该多个模型 特征值,并传送对应的该模型装置码。
7.根据权利要求6所述的语音识别装置,其中该主机用以从该多个模型特征值中比对 出与该指令特征值相似的模型特征值,并传送该多个模型装置码中与该相似的模型特征值 对应的模型装置码。
8.根据权利要求6所述的语音识别装置,其中该语音输入界面还用以撷取模拟训练语 音,该语音转码单元用以转换该模拟训练语音为数字训练语音,该主机还用以撷取训练装 置码,而该训练装置码对应于该数字训练语音的训练特征值;其中,该装置处理单元还用以将该训练特征值储存进该语音数据库,以使该训练特征 值成为该多个模型特征值的一者,且将该训练装置码储存进该语音数据库,以使该训练装 置码成为该多个模型装置码的一者。
9.一种语音识别装置的操作方法,包括向主机列举语音识别装置为大量储存装置,其中该语音撷取装置储存有应用程序、多 个模型特征值及多个模型装置码,该多个模型特征值对应至该多个模型装置码; 传送该多个模型特征值、该多个模型装置码与该应用程序至该主机; 该主机加载该应用程序; 撷取模拟指令语音; 转换该模拟指令语音为数字指令语音;该主机比对该数字指令语音的指令特征值与该多个模型特征值;以及 该主机传送对应的该模型装置码。
10.根据权利要求9所述的操作方法,还包括 撷取模拟训练语音;转换模拟训练语音为数字训练语音;该主机撷取训练装置码,该训练装置码对应于该数字训练语音的训练特征值;以及 储存该训练特征值,以使该训练特征值成为该多个模型特征值的一者,及储存该训练 装置码,以使该训练装置码成为该多个模型装置码的一者。
全文摘要
一种语音识别装置包括人机界面、语音输入界面、语音转码单元、语音数据库及装置处理单元。人机界面用以向主机列举语音识别装置为操作装置。语音输入界面用以撷取模拟指令语音。语音转码单元用以转换模拟指令语音为数字指令语音。语音数据库包括数个模型特征值及数个模型装置码,模型特征值是对应于模型装置码。以及,装置处理单元用以比对数字指令语音的指令特征值与模型特征值,并输出对应的模型装置码至主机。
文档编号G10L15/26GK101807398SQ20091000637
公开日2010年8月18日 申请日期2009年2月16日 优先权日2009年2月16日
发明者沈欣懋 申请人:宏正自动科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1