具语音辨识的交互式语言学习方法

文档序号：6375745阅读：164来源：国知局

专利名称：具语音辨识的交互式语言学习方法
技术领域：
本发明是一种具语音辨识的交互式语言学习方法，特别是关于一种交互式的语言学习方法，利用语音辨识技术分析比对练习者所练习的语言是否正确的方式。
背景技术：
当前，英文是一种世界流行最广的语言，为了面对迈向国际化的今天，以及加入W.T.O.后的国际冲击，要能生存于国际上就必须加强提升英文能力，因此如何激励人们自动自发学习英文，以提升国际竞争力，是相当重要的。但是学习语言最重要的关键就是词汇，然而除非有语言老师在旁协助对话，以及纠正练习者的发音，否则大部分的人仅能从书本、录音带或计算机软件学习到听、读、写，而无法练习到说。
目前民间语言教学媒体各种各样，多不胜数，单就英文教材及许多的速成教学方式，大都着重在语言的听、读、写记忆练习，而无法着重于说的练习，主要的原因既是在于练习者无法自行判断是否说的正确，也无相关的软硬件辅助练习者来判断是否说的正确。
在专利文献方面，如台湾专利公告号第470904号，是一种交互式教学系统与方法，其是披露一种利用计算机的网络学习系统及交互式的计算机学习方法，可由复数客户端与一个服务器联机，透过该服务器的学习系统数据库，进行网络上的语言学习。
又如台湾专利公告号第472222号，是一种计算机辅助语言学习方法与系统，同样揭露一种利用计算机来辅助使用者进行词汇、文法、句型等语言练习，其中更包括有语音数据库，可发出正确的语音供使用者练习。
然而上述的两件专利同样地具有无法辅助练习者判断其说出的语言是否正确的缺点，因此本案发明人为解决上述现有语言教学辅助媒体无法辅助说部分的缺陷，乃特地潜心研究并配合学理的运用，提出一种具语音辨识的交互式语言学习方法，是利用目前极为热门的语音辨识技术，结合在语言学习辅助软件或硬件中，可借由语音辨识辅助语言学习者练习说的部分，是一种设计合理且有效改善上述缺陷的发明。

发明内容
本发明是提供以下的技术手段来达成交互式语言学习的目的本发明的主要技术特征是在于提供一种具语音辨识的交互式语言学习方法，以分析比对练习者的语言是否正确，本发明包括有一个跟说模式或一个交互方式，其方法首先撷取并播放任一该语言声音数据，等待一个时间值，让练习者输入一个练习声音信号后，进行语音辨识产生该语音辨识数据，接着比对该语音辨识数据与该语言声音数据产生一个近似度值，最后比较该近似度值与该预设调整值，储存该练习者练习该语言声音数据的正确或错误信息，以便统计该练习者所有练习的正确或错误信息记录，达成交互式语言学习的功效。

图1是本发明使用于一个单机系统的架构示意图。
图2是本发明使用于一个网络系统的架构示意图。
图3是本发明第一实施例跟说模式的流程示意图。
图4是本发明第二实施例交互方式的流程示意图。
符号说明1单机系统2计算机装置3语言学习主机10 中央处理器
11语音辨识器12语言储存媒体13语音播放装置14声音撷取装置15显示器具体实施方式
为了使贵审查员能进一步了解本发明为达成预定目的所采取的技术、手段及功效，请参阅以下有关本发明的详细说明与附图，相信本发明的目的、特征与特点，当可由此得到一个深入且具体的了解，然而所附图式仅提供参考与说明用，并非用来对本发明加以限制。
请参阅图1所示，是本发明使用于一个单机系统的架构示意图，图2是本发明使用于一个网络系统的架构示意图。本发明的具语音辨识的交互式语言学习方法可使用以一个单机系统1上，如一台个人计算机(PC)或一台随身语言学习机，让一个练习者可借由该单机系统1学习语言。本发明也可使用在一个主从式架构的网络系统中，利用一台计算机装置2联机至一台语言学习主机3上，以便让复数该练习者进行语言学习。
本发明若使用于单机系统1时，该语言学习机中至少包括一个中央处理器10、一个语音辨识器11、一个语言储存媒体12、一个语音播放装置13及一个声音撷取装置14，本发明若使用在网络系统时，该语言学习机3中至少包括一个中央处理器10、一个语音辨识器11、一个语言储存媒体12，而该远程计算机装置2至少包括一个语音播放装置13及一个声音撷取装置14。
其中该语言储存媒体12是可以为一个语言数据库或一个语言档案，其中储存了复数语言学习用的单字、词组、语句或问答对话等文字及语音数据，而该语音播放装置13是用以播放该语言储存媒体12中的语音数据，可以为一个声卡或一个喇叭，该声卡的输出端可连接该喇叭，而该声音撷取装置14是用以撷取该练习者的练习声音，可以为一个声卡或一个麦克风，该声卡的输入端连接至该麦克风。
其中该中央处理器10是用以执行一个语言学习程序，可由该程控或记录该练习者的学习进度或者统计学习成绩等，而该语音辨识器11是用以辨识该练习者所输入的练习声音，以便与储存于该语言储存媒体12中的语音数据进行比对，以决定出该练习者所输入的练习声音是否正确。
本发明所执行的语言学习程序，主要包括有两种学习模式，第一为跟说模式，第二为交互方式，而每一模式都可以包括有两种语言型态，例如以中文学习英文的跟说或对话型态，或者以英文学习英文的跟说或对话型态，如图3所示是本发明第一实施例跟说模式的流程示意图，因此在本发明执行该语言学习程序前，需先设定该语言学习模式为跟说模式或交互方式100。
在该实施例中，首先撷取储存于该语言储存媒体12中的任一该语言声音数据，如英文单字或语句，并由该喇叭播放出该语言声音数据101，且可依学习的课程进度来逐一撷取所需学习的该语言声音数据，以中文学习英文为例，该语言声音数据中就可能包含有一个英文语音及一个中文语音，且该中文语音是对应于该英文语音的翻译语音，当播放该语言声音数据时，可先播放该中文语音，再播放该英文语音，然后让练习者借由该麦克风输入一个练习声音信号，也即跟说该英文语音。
接着本发明等待一个时间值102，例如五秒钟，若在该五秒钟内该练习者未跟说该英文语音，也即在该五秒钟内为未输入该练习声音信号，或许表示该练习者尚未听清楚，则重复再播放该语言声音数据一次，使该练习者重复聆听。当该练习者借由该麦克风输入该练习声音信号103后，本发明即进行语音辨识该练习声音信号，产生一语音辨识数据104。
在语音辨识技术方面，目前已有很大的进步，最典型的语音辨识包括有宜接相异度比较法、LPC特征参数撷取法及语音音包分析比较法…等等，有不下上千篇的相关论文及众多的学者专家已研究出高达90％辨识率的技术，由于本发明并非申请语音辨识技术，而是应用该语音辨识技术，故而不再详述其技术内容。本发明以LPC特征参数撷取法为例，先将该练习者的练习声音信号转换为一语音波形，接着将该语音波形区分成一系列的音框，然后替每个音框求出一组线形预测系数，最后撷取出其中高音波能量的特征参数值，以产生出该语音辨识数据。
当本发明求出该语音辨识数据之后，接着比对该语音辨识数据与该语言声音数据产生一个近似度值105，借由该近似度值决定该练习者练习该语言声音数据的正确性。而比对的方法也与语音辨识的方法相同，将该练习声音信号与该语言声音数据都转换为语音波形，由该语音波形中撷取至少一个特征参数值，再逐一比对该特征参数值是否相近，而产生该近似度值。
最后比较该近似度值与一个预设调整值106，若该近似度值高于该预设调整值，即表示练习者跟说的练习声音信号与所播放的该语音声音数据近似，完成此一个单字或语句的语言学习，但若该近似度值低于该预设调整值，则会发出一个错误讯息的语音，要求练习者重新再跟说一次，而该预设调整值可事先调整其与该近似度值的比较比例，本发明将其区分成高/中/低三种比对正确率，初学者用低正确率的预设调整值，而进阶者可用中/高的正确率预设调整值。
本发明在每一次完成语句练习后不论正确与否都会储存该练习者练习该语言声音数据的正确或错误信息107，并记录所练习的该语言声音数据的编号、练习次数或练习时间。若完成一次课程或一个学习阶段后，可统计该练习者所有练习的正确或错误信息记录108，并加以评分后以一个显示器15显示该评分结果。而所记录的该语言声音数据的编号、练习次数或练习时间可作为往后重复练习的参考数据，并以错误较多次的该语言声音数据编号为优先撷取及播放参考，也可以练习时间隔离较久的该语言声音数据编号为优先撷取及播放参考。
请参阅图4所示，是本发明第二实施例交互方式的流程示意图，本发明交互方式的流程大致与跟说模式相同，其不同处在于该语言声音数据中包括有一个问句语音及一个答句语音，而该问句语音是作为播放之用，该答句语音是作为比较该练习者的练习声音信号之用。
在该实施例中，同样地先撷取储存于该语言储存媒体12中的任一该语言声音数据，并由该喇叭播放出该语言声音数据201，以中文学习英文为例，该语言声音数据中包含有一个英文问句语音、一个中文问句语音及一个英文答句语音，且先播放该中文问句语音，再播放该英文问句语音，然后让练习者借由该麦克风输入回答出该英文答句语音。
接着本发明等待一个时间值202，当该练习者借由该麦克风输入该练习声音信号203后，本发明即进行语音辨识该练习声音信号，产生该语音辨识数据204，接着比对该语音辨识数据与英文答句的该语言声音数据产生一个近似度值205，最后比较该近似度值与该预设调整值206，储存该练习者练习该语言声音数据的正确或错误信息207，以便统计该练习者所有练习的正确或错误信息记录208。
于是，本发明确能借上述所披露的技术，提供一种迥然不同于习知者的设计，堪能提高整体的使用价值，又其申请前未见于刊物或公开使用，诚已符合发明专利的要求，故依法提出发明专利的申请。
以上所披露的图式、说明，仅为本发明的实施例而已，凡精于此项技艺者当可依据上述的说明作其它种种的改良，而这些改变仍属于本发明的发明精神及以下所界定的专利范围中。
权利要求
1.一种具语音辨识的交互式语言学习方法，其特征在于该方法至少包括下列步骤撷取并播放一语言声音数据；输入一个练习者的练习声音信号；语音辨识该练习声音信号，产生一语音辨识数据；以及比对该语音辨识数据与该语言声音数据，产生一个近似度值，借由该近似度值决定该练习者练习该语言声音数据的正确性。
2.如权利要求1所述的具语音辨识的交互式语言学习方法，其特征在于，其中撷取该语言声音数据的步骤前更包括设定一个语言学习模式为一个跟说模式或一个交互方式。
3.如权利要求1所述的具语音辨识的交互式语言学习方法，其特征在于，其中撷取该语言声音数据是由一个资料储存媒体中撷取任一该语言声音数据。
4.如权利要求3所述的具语音辨识的交互式语言学习方法，其特征在于，其中撷取该语言声音数据是由该资料储存媒体中依课程进度逐一撷取其中某一该语言声音数据。
5.如权利要求1所述的具语音辨识的交互式语言学习方法，其特征在于，其中该语言声音数据包含有第一语音及第二语音，且该第二语音是对应于该第一语音的翻译语音。
6.如权利要求4所述的具语音辨识的交互式语言学习方法，其特征在于，其中该第一语言是英文语音，而该第二语言是中文语音。
7.如权利要求1所述的具语音辨识的交互式语言学习方法，其特征在于，其中播放该语言声音数据是由该喇叭播放该语言声音数据。
8.如权利要求1所述的具语音辨识的交互式语言学习方法，其特征在于，其中播放该语言声音数据的步骤中，若该语言声音数据中包含一个第一语音及一个第二语音时，先播放该第二语音，再播放该第一语音。
9.如权利要求8所述的具语音辨识的交互式语言学习方法，其特征在于，其中该第一语音是英文语音，而该第二语音是中文语音。
10.如权利要求1所述的具语音辨识的交互式语言学习方法，其特征在于，其中输入该练习者的该练习声音信号的步骤前更包括下列步骤等待一个时间值；及在该时间值内，若该练习者未输入该练习声音信号，则重复播放该语言声音数据。
11.如权利要求10所述的具语音辨识的交互式语言学习方法，其特征在于，其中该时间值可以为五秒钟。
12.如权利要求1所述的具语音辨识的交互式语言学习方法，其特征在于，其中输入该练习者该练习声音信号是使用一个麦克风。
13.如权利要求1所述的具语音辨识的交互式语言学习方法，其特征在于，其中该语言声音数据可以为一个问句语音及一个答句语音，且该问句语音作为播放之用，而该答句语音是作为比较该练习者的练习声音信号之用。
14.如权利要求13所述的具语音辨识的交互式语言学习方法，其特征在于，其中该问句语音是可作为一个英文语音问句或一个中文语音问句。
15.如权利要求13所述的具语音辨识的交互式语言学习方法，其特征在于，其中该答句语音是可作为一个英文语音答句或一个中文语音答句。
16.如权利要求1所述的具语音辨识的交互式语言学习方法，其特征在于，其中语音辨识该练习声音信号的步骤中更包括下列步骤转换该练习声音信号为一个语音波形；及撷取该语音波形中的至少一个特征参数值，产生该语音辨识数据。
17.如权利要求1所述的具语音辨识的交互式语言学习方法，其特征在于，其中比对该语音辨识数据与该语言声音数据的步骤中，该比对方式更包括下列步骤将该练习声音信号与该语言声音数据都转换为语音波形；由该语音波形中撷取至少一个特征参数值，再逐一比对该特征参数值是否相近，而产生该近似度值。
18.如权利要求1所述的具语音辨识的交互式语言学习方法，其特征在于，其中比对该语音辨识数据与该语言声音数据的步骤后更包括下列步骤比较该近似度与一个预设调整值；若该近似度值高于该预设调整值，则完成此次语言学习；及若该近似度值低于该预设调整值，则发出一个错误语音，要求重新输入该练习声音信号。
19.如权利要求18所述的具语音辨识的交互式语言学习方法，其特征在于，其中该预设调整值可事先调整比较该近似度值的比例，并区分成高/中/低三种比对正确率。
20.如权利要求1所述的具语音辨识的交互式语言学习方法，其特征在于，其中比对该语音辨识数据与该语言声音数据的步骤后更包括储存该练习者练习该语言声音数据的正确或错误信息，并记录该语言声音数据的编号、练习次数或练习时间。
21.如权利要求20所述的具语音辨识的交互式语言学习方法，其特征在于，其储存比对记录的步骤后更包括统计该练习者所有练习该语言声音数据的正确或错误信息记录，加以评分后，以一个显示器显示该评分结果。
22.如权利要求21所述的具语音辨识的交互式语言学习方法，其特征在于，其中记录该语言声音数据的编号、练习次数或练习时间的步骤，可作为往后重复练习的参考数据。
23.如权利要求22所述的具语音辨识的交互式语言学习方法，其特征在于，其中该重复练习的参考数据是以错误较多次的该语言声音数据编号为优先撷取及播放。
24.如权利要求22所述的具语音辨识的交互式语言学习方法，其特征在于，其中该重复练习的参考数据是以练习时间隔离较久的该语言声音数据编号为优先撷取及播放。
全文摘要
一种具语音辨识的交互式语言学习方法，特别是关于一种利用语音辨识技术作为交互式的语言学习的方法，以分析比对练习者所练习的语言是否正确，本发明包括有一个跟说模式或一个交互方式，其方法首先撷取并播放任一该语言声音数据，等待一个时间值，让练习者输入一个练习声音信号后，进行语音辨识产生该语音辨识数据，接着比对该语音辨识数据与该语言声音数据产生一个近似度值，最后比较该近似度值与该预设调整值，储存该练习者练习该语言声音数据的正确或错误信息，以便统计该练习者所有练习的正确或错误信息记录，达成交互式语言学习的目的。
文档编号G06F15/18GK1581130SQ0315353
公开日2005年2月16日申请日期2003年8月15日优先权日2003年8月15日
发明者彭文富申请人:彭文富

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：彭文富
技术所有人：彭文富
我是此专利的发明人

上一篇：用以将资料同步化的资料同步系统及方法
上一篇：Mp3播放应用装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。