声控文件查询系统以及声控文件查询方法

文档序号:2823470阅读:526来源:国知局
专利名称:声控文件查询系统以及声控文件查询方法
技术领域
本发明涉及一种文件查询系统和文件查询方法,尤其涉及一种可以通过声控方式查询存储器中的文件和/或文件夹的声控文件查询系统和声控文件查询方法。
背景技术
随着数码技术的不断发展,人们在日常生活中越来越多地使用了便携式电子产品。例如,PDA(个人数字助理)、手机、U盘、移动硬盘、MP3播放器等。人们可以利用这些便携式电子产品存储各种文件,以便随时查看或其它操作。但是随着便携式电子产品中存储器容量的不断增大,其内存储的文件也日益增多,因而查询起来极不方便。在现有的计算机等系统中(例如在装有Windows操作系统的计算机中),可以通过手动输入文字信息在计算机硬盘上查询文件名或文件夹名相匹配的文件或文件夹。但是这种输入都是通过手动完成的,用户使用起来极不方便。而对于那些没有文字输入设备的便携式电子产品中,更是无法使用这种方法进行文件查询。

发明内容为了解决现有技术的电子产品无法进行文件查询或者文件查询条件需要语音输入而不便用户使用的技术问题,本发明提供了一种利用声控方式对电子产品存储器内的文件和/或进行查询的声控文件查询系统和声控文件查询方法。
本发明解决现有技术的电子产品无法进行文件查询或者文件查询条件需要语音输入而不便用户使用的技术问题所采用的技术方案是提供一种声控文件查询系统,该查询系统包括处理器以及存储多媒体文件的存储器,该查询系统还包括语音识别模块以及与语音识别模块相连接的语音输入模块,语音输入模块输入语音识别信息并由语音识别模块进行识别,处理器从存储器内选择识别信息与语音识别信息相匹配的文件夹或文件。
根据本发明声控文件查询系统一优选实施例,识别信息是文件夹名或文件名。
根据本发明声控文件查询系统一优选实施例,声控文件查询系统为便携式电子设备。
根据本发明声控文件查询系统一优选实施例,语音识别模块是针对非特定用户的语音识别模块。
根据本发明声控文件查询系统一优选实施例,声控文件查询系统还包括与处理器相连接的用于显示选择的文件夹或文件的显示单元。
本发明解决现有技术的电子产品无法进行文件查询或者文件查询条件需要语音输入而不便用户使用的技术问题所采用的另一技术方案是提供一种声控文件查询方法,该方法包括以下步骤利用语音输入模块输入语音识别信息,并由语音识别模块进行识别;利用处理器从存储器内选择识别信息与语音识别信息相匹配的文件夹或文件。
根据本发明声控文件查询系统一优选实施例,识别信息是文件夹或文件名。
根据本发明声控文件查询系统一优选实施例,在步骤a中,语音识别模块利用针对非特定用户的语音识别方法识别语音识别信息。
根据本发明声控文件查询系统一优选实施例,存储器是便携式电子产品的存储器。
根据本发明声控文件查询系统一优选实施例,该方法还进一步包括步骤c通过与处理器相连接的显示单元显示选择的文件夹或文件。。
上述结构的有益效果是通过语音识别输入模块输入查询条件并由语音识别模块进行识别查询条件,可以方便用户对存储器内存储的文件进行查询以及下一步操作。在本实用新型中,查询条件优选采用文件名或文件夹名。

图1是本发明的声控文件查询系统的示意框图;图2是使用本发明声控文件查询系统的声控MP4播放器一实施例的结构示意图;图3是图2所示的声控MP4播放器的示意框图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
参见图1,本发明的声控文件查询系统包括处理器111、存储器113、语音识别模块115以及与语音识别模块115相连接的语音输入模块117。其中,存储器113分成指令存储模块和数据存储模块。语音输入模块117接收用户输入的语音识别信息,该语音识别信息经语音识别模块117进行A/D转换、特征量提取等数据处理过程。处理器111将经语音识别模块115的语音识别信息同存储器113的数据存储模块中存储文件的识别信息进行比较,并根据二者的相似度选择识别信息相匹配的文件或文件夹。其中,识别信息可以采用多种识别信息,例如视频文件和/或音频文件的ID3标签内的信息以及文件名或文件夹名称等。在本实施例中,由于ID3标签内的信息不易修改,因而优选采用文件名或文件夹名作为识别信息,以方便用户根据自己的需要修改识别信息。
本发明声控文件查询系统的语音识别系统可以采用针对特定人的语音识别系统或针对非特定人的语音识别系统。在针对特定人的语音识别系统中,用户需要事先对每一个语音识别信息进行训练。这种语音识别系统的识别性能随着语音指令数目的增加会有明显的下降,并且对于不同用户、在不同的噪声环境中,以及不同的时间相同用户的不同生理、心理状态下,系统的性能都会受到明显的影响。而针对非特定人的语音识别系统采用基于统计模型的算法,系统开发者事先采集大量的语音数据进行训练,得到声学模型并存储在存储器中。在识别阶段,语音识别模块将用户的输入语音识别信息的特征量与通过声学模型构建的识别网络进行匹配解码。处理器可根据语音识别模块输出的识别结果对存储器内的文件进行选择。非特定人语音识别系统对于用户而言,不需要引入繁琐的训练过程,方便了用户的使用;同时它可以供不同的人使用,因此大大拓宽了应用范围。另一方面,由于采用了基于统计模型的算法,其稳健性和识别性能都比特定人识别系统大大的提高,识别性能不会随着识别词条数目的增加有明显的下降,并且具有一定的抗噪能力。
参见图2和图3,其中,图2是应用本发明的声控文件查询系统的MP4播放器的结构示意图,图3是图2所示MP4播放器的示意框图。在本实施例中,声控MP4播放器2包括设置在播放器主机21上的用户控制界面221、液晶显示屏223、扬声器225和受话器227(麦克风)。播放器主机21内部的电路板上设置有处理器211、存储器213、语音识别模块215等功能模块以及USB接口、耳机插孔等外部接口。其中,处理器211负责MP4文件的视频、音频解码、USB接口传入数据的处理、写入/读取存储器213内的数据以及液晶显示屏221的显示,以便连接播放器主机21内的所有主要部件,协调各部件工作状态。MP4播放器除了能够播放MP3、MP4等格式的音频或视频压缩文件外,还可以查看各种格式的图片或电子书籍。
使用时(例如,利用MP4播放器阅读电子书籍时),用户利用切换键从工作模式切换到声控查询模式。当处于声控查询模式时,用户通过受话器227输入自己想要阅读书籍的文件名或文件夹名,该语音识别信息输入到语音识别模块215,语音识别模块215对语音识别信息进行A/D转换以及特征量提取等处理,主控模块211根据处理结果从存储器213选择文件名或文件夹名相同或相似的文件或文件夹,随后显示选择的文件或文件夹下的所有文件。主控模块111可以根据用户控制界面221的输入指令对所选择的文件或文件夹下的文件进行操作,例如删除、显示内容以及跳转到相邻页等操作。
由于采用了本发明的声控文件查询系统,用户可以通过声控方式便捷地查询到自己想要的文件或文件夹,以便对其进行直接播放、显示内容或进行下一步操作。
在上述实施例中,针对MP4播放器对本发明的声控文件查询系统进行了示范性描述,但本发明的范围同样适用于MP3播放器、数码相机、DVD机、PDA、计算机等任何需要对文件进行查询的电子产品。例如,通过利用输入文件创建日期,在数码相机内查询当日拍摄的照片,以便对这些照片进行管理。而且本发明的语音输入模块采用任意公知的以无线或有线方式连接到语音识别模块的语音输入系统。例如,在上述的MP4播放器中将采用将麦克风设置在有线耳机的耳机线上。这样用户不需要直接对着MP3播放器主机输入语音信息,方便用户使用。
上述的详细描述仅是示范性描述,本领域技术人员在不脱离本发明所保护的范围和精神的情况下,可根据不同的实际需要设计出各种实施方式。
权利要求
1.一种声控文件查询系统,所述查询系统包括处理器以及存储多媒体文件的存储器,其特征在于所述查询系统还包括语音识别模块以及与所述语音识别模块相连接的语音输入模块,所述语音输入模块输入语音识别信息并由所述语音识别模块进行识别,所述处理器从所述存储器内选择识别信息与所述语音识别信息相匹配的文件夹或文件。
2.根据权利要求1所述的声控文件查询系统,其特征在于所述识别信息是文件夹名或文件名。
3.根据权利要求2所述的声控文件查询系统,其特征在于所述声控文件查询系统为便携式电子设备。
4.根据权利要求2所述的声控文件查询系统,其特征在于所述语音识别模块是针对非特定用户的语音识别模块。
5.根据权利要求2所述的声控文件查询系统,其特征在于所述声控文件查询系统还包括与所述处理器相连接的用于显示所述选择的文件夹或文件的显示单元。
6.一种声控文件查询方法,所述方法包括以下步骤a.利用语音输入模块输入语音识别信息,并由语音识别模块进行识别;b.利用处理器从存储器内选择识别信息与所述语音识别信息相匹配的文件夹或文件。
7.根据权利要求6所述的声控文件查询方法,其特征在于所述识别信息是文件夹或文件名。
8.根据权利要求6所述的声控文件查询方法,其特征在于在所述步骤a中,所述语音识别模块利用针对非特定用户的语音识别方法识别所述语音识别信息。
9.根据权利要求6所述的声控文件查询方法,其特征在于所述存储器是便携式电子产品的存储器。
10.根据权利要求6所述的声控文件查询方法,其特征在于所述方法还进一步包括步骤c通过与所述处理器相连接的显示单元显示所述选择的文件夹或文件。
全文摘要
本发明涉及一种声控文件查询系统,该查询系统包括处理器以及存储文件的存储器,该查询系统还包括语音识别模块以及与语音识别模块相连接的语音输入模块,语音输入模块输入语音识别信息并由语音识别模块进行识别,处理器从存储器内选择识别信息与语音识别信息相匹配的文件夹或文件。当采用上述结构时,用户可以通过语音输入模块便捷地输入查询条件,不需要使用键盘等输入设备手动输入,方便用户进行对查询存储器存储的文件进行查询和管理。
文档编号G10L15/00GK1979468SQ20051010160
公开日2007年6月13日 申请日期2005年11月29日 优先权日2005年11月29日
发明者陈修志 申请人:陈修志
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1