声控多媒体文件播放器的制作方法

文档序号：6774339阅读：602来源：国知局

专利名称：声控多媒体文件播放器的制作方法
技术领域：
本实用新型涉及一种多媒体文件播放器，尤其涉及一种声控多媒体文件播放器。
背景技术：
随着数码技术的不断发展，能够播放多媒体数据的便携式多媒体播放器(例如，MP3、MP4播放器)已经在人们的日常生活中得到普及。例如，其中MP3技术利用音频数据编码技术在不降低现有数据音质的情况对音频数据进行压缩。而MP3播放器由于其结构小巧、操作便捷逐渐取代随身听(Walkman)成为人们的新宠。而随着科技的不断进步，MP3播放器的功能也在日益增多。目前已经出现一种声控MP3播放器，用户可以利用语音指令对MP3播放器点播。但是，这种声控MP3播放器仅能够识别其内所存储的特定人的语音，若特定人之外的人通过语音指令操作这种声控MP3播放器，则MP3播放器会出现辨别信息错误甚至无法辨别的情况，须将使用者的个人语音信息存储于MP3播放器内，且MP3播放器需要辨认特定人语音数次后才可准确无误的执行语音指令。这种操作繁琐的声控MP3播放器给使用者带来极大的不便，特别是对于不熟悉电子数码产品手动操作的中老年人来说，不能直接运用语音指令准确、有效的操作声控MP3播放器，某种意义上说，他们无法享受数码产品所带来的便利。

实用新型内容为了解决现有技术的声控多媒体文件播放器无法准确的对非特定人的语音进行识别，且操作复杂的技术问题，本实用新型提供一种可以准确的对非特定人的语音进行识别的声控多媒体文件播放器。本实用新型还进一步提供与声控多媒体文件播放器相连的耳机。
本实用新型解决现有技术的声控多媒体文件播放器无法准确的对非特定人的语音进行识别，操作复杂的技术问题所采用的技术方案是提供一种声控多媒体文件播放器，该播放器包括一播放器主机，播放器主机内设置有主控模块、语音识别模块以及存储歌曲的存储器，语音识别模块能够识别非特定用户的语音信息。
根据本实用新型的声控多媒体文件播放器一优选结构，语音识别信息包括多媒体文件的文件名或存储多媒体文件的目录的目录名。
根据本实用新型的声控多媒体文件播放器一优选结构，进一步包括与播放主机相连的耳机。
根据本实用新型的声控多媒体文件播放器一优选结构，耳机上设置有用于输入语音识别信息的受话器。
根据本实用新型的声控多媒体文件播放器一优选结构，耳机上还设置有用于从听歌模式切换到点播模式点播键。
根据本实用新型的声控多媒体文件播放器一优选结构，耳机为有线耳机，受话器和点播键设置在有线耳机的耳机线上。
根据本实用新型的声控多媒体文件播放器一优选结构，耳机是无线耳机。
根据本实用新型的声控多媒体文件播放器一优选结构，耳机是蓝牙耳机。
上述结构的有益效果是不同使用者首次使用这种声控多媒体文件播放器时，直接进行语音指令操作便可以得到准确快速的歌曲选择或其它功能控制，不需要事先把语音信息存储于声控多媒体文件播放器内，简化操作程序。

图1是本实用新型的声控MP3播放器一实施例的结构示意图；图2是图1所示的声控MP3播放器的示意框图。
具体实施方式
以下结合附图和实施例以声控MP3播放器为例对本实用新型进一步说明。
参见图1，图1是本实用新型的声控MP3播放器一实施例的结构示意图。在本实施例中，声控MP3播放器1包括用于播放MP3格式音频数据的播放器主机11和通过耳机插孔120与播放器主机11连接的有线耳机13。参见图2，图2是图1所示的声控MP3播放器的示意框图。播放器主机11内部的电路板上设置有主控模块111、存储器113、语音D/A转换模块115、语音识别模块117等功能模块以及USB接口119、耳机插孔120等外部接口。其中，主控模块111负责MP3文件的解码、USB接口119传入数据的处理、写入/读取存储器113内的数据以及控制语音D/A模块115发声等的工作，以便连接播放器主机11内的所有主要部件，协调各部件工作状态。存储器113内包括指令存储器和数据存储器。语音D/A转换模块115由主控模块111控制，将数字形式的MP3文件转换成模拟数据。有线耳机13包括插头131、耳机线133和耳塞135，其中插头131插入耳机插孔120，语音D/A转换模块115产生的模拟信号经耳机线133传输并由耳塞135产生声音。此外，在本实施例中，有线耳机13的耳机线133上还设置有受话器137和点播键139。
当采用上述结构时，可以通过设置在耳机上的受话器137和点播键139进入声控模式，利用语音识别信息选择多个备选歌曲。本实用新型声控MP3播放器的语音识别模块117是能够针对非特定人的语音识别模块。当设计语音识别模块117时，基于统计模型的算法，系统开发者事先采集大量的语音数据进行训练，得到声学模型并存储在存储器中。在识别阶段，语音识别模块117将用户的输入语音指令的特征量与通过声学模型构建的识别网络进行匹配解码，输出该语音指令或与该语音指令相对应的控制指令。主控模块111可根据语音识别模块输出的识别结果对MP3播放器进行控制。
使用时，用户按一下耳机线133上的点播键139从听歌模式切换到点播模式。当处于点播模式时，用户通过受话器137输入歌名、歌星名等语音识别信息，语音识别信息输入到语音识别模块117，语音识别模块117提取语音指令的特征量，主控模块111根据特征量从存储器113选择识别信息相同或相似的歌曲或某位歌星的歌曲作为备选播放文件；该识别信息可以是MP3文件ID3标签内的标题、艺术家、专辑或其它信息。但这样信息一般无法简单的修改，因而在本实用新型中，优选采用MP3的文件名作为识别信息。用户可以事先根据自己爱好编辑文件名。MP3播放器处于点播状态时，只要将文件名通过受话器137传递至语音识别模块117，经过分析辨认，便可将相关文件选出，主控模块111播放相应的备选MP3文件。随着MP3播放器的容量越来越大，存储的歌曲数量越来越多，用户会忘记所存储的文件名，也可将存储器113内的内容的目录名称通过受话器137传递至语音识别模块117，此时可以选择播放目录内的所有MP3文件或者继续通过语音或手动操作选择自己想要的文件。
当播放多个MP3文件时，用户还可以通过长时间按下点播键139，从正在播放的备选MP3文件跳转到下一个备选的MP3文件，以便对选MP3文件进行选择性播放。歌曲识别信息的相似性可以预先设定，例如设定歌曲识别信息的若干字节与识别出的语音识别信息相匹配，即可认为二者相似。
本实用新型的声控MP3播放器包括针对非特定人语音识别系统的语音识别模块，对于用户而言，不需要引入繁琐的训练过程，方便了用户的使用；同时它可以供不同的人使用，尤其对于不熟悉数码电子产品手动操作的中老年人，更是操作简便，因此大大拓宽了应用范围；另一方面，由于采用了基于统计模型的算法，其稳健性和识别性能都比特定人识别系统大大的提高，识别性能不会随着识别词条数目的增加有明显的下降，并且具有一定的抗噪能力。
在上述实施例中，点播键和备选键设置为同一按键，通过按键时间的长短来进行不同控制，但本领域技术人员可以知道，点播键和备选键还可分开设置在耳机上。而且本实用新型的范围并不局限与此。例如，有线耳机可以由无线耳机(例如，蓝牙耳机)代替。另外，本实用新型同样适用于MP4播放器、DVD播放器以及卡拉OK点歌机等多媒体文件播放器。
上述的详细描述仅是示范性描述，本领域技术人员在不脱离本实用新型所保护的范围和精神的情况下，可根据不同的实际需要设计出各种实施方式。
权利要求1.一种声控多媒体文件播放器，所述播放器包括一播放器主机，所述播放器主机内设置有主控模块、语音识别模块以及存储多媒体文件的存储器，其特征在于所述语音识别模块能够识别非特定用户的语音信息。
2.根据权利要求1所述的声控多媒体文件播放器，其特征在于所述语音识别模块包括一对预先采集大量的语音数据进行训练而得到的声学模型。
3.根据权利要求2所述的声控多媒体文件播放器，其特征在于所述语音识别模块根据所述声学模型构建的识别网络识别非特定用户的语音信息。
4.根据权利要求1所述的声控多媒体文件播放器，其特征在于进一步包括与播放器主机相连的耳机。
5.根据权利要求4所述的声控多媒体文件播放器，其特征在于所述耳机上设置有用于输入所述语音识别信息的受话器。
6.根据权利要求5所述的声控多媒体文件播放器，其特征在于所述耳机上还设置有用于从听歌模式切换到点播模式的点播键。
7.根据权利要求4所述的声控多媒体文件播放器，其特征在于所述耳机为有线耳机，所述受话器和点播键设置在所述有线耳机的耳机线上。
8.根据权利要求4所述的声控多媒体文件播放器，其特征在于所述耳机是无线耳机。
9.根据权利要求8所述的声控多媒体文件播放器，其特征在于所述耳机是蓝牙耳机。
10.根据权利要求1所述的声控多媒体文件播放器，其特征在于所述语音识别信息包括所述多媒体文件文件名或存储所述多媒体文件的目录的目录名。
专利摘要本实用新型涉及一种声控多媒体文件播放器，该声控多媒体文件播放器包括一播放器主机，该播放器主机内设置有主控模块、语音识别模块以及存储多媒体文件的存储器，该语音识别模块能够识别非特定用户的语音信息。通过采用上述结构，多媒体文件播放器可以识别非特定输入的语音信息并进行相应功能控制，方便用户使用。
文档编号G11C7/00GK2845024SQ200520068018
公开日2006年12月6日申请日期2005年11月29日优先权日2005年11月29日
发明者陈修志申请人:陈修志

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈修志
技术所有人：陈修志
我是此专利的发明人

上一篇：吸入式盘加载装置的光拾取器驱动部件的安装组件的制作方法
上一篇：机械式自动仓门的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、毕老师：机构动力学与控制
2、袁老师：1.计算机视觉 2.无线网络及物联网
3、王老师：1.计算机网络安全 2.计算机仿真技术
4、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
5、张老师：1.机械设计的应力分析、强度校核的计算机仿真 2.生物反应器研制 3.生物力学
如您是高校老师，可以点此联系我们加入专家库。