具有声控翻译功能的便携式数字媒体播放器的制作方法

文档序号:6776076阅读:159来源:国知局
专利名称:具有声控翻译功能的便携式数字媒体播放器的制作方法
技术领域
本实用新型涉及一种便携式数字媒体播放器,尤其涉及一种具有声控翻译功能的便携式数字媒体播放器。
背景技术
随着科技和经济的不断发展,在日常生活和工作中人们需要与越来越多的不同国籍的人进行交流。然而由于语言的不通,不可避免地会造成交流困难的问题,不仅信息无法得到沟通,而且很可能会产生误解,给双方都带来了极大的不便。目前,MP3、MP4等便携式数字媒体播放器由于其结构小巧、操作便捷而得到了广泛普及。

实用新型内容为了解决人们在日常生活和工作中与不同国籍人交流的语言障碍问题,本实用新型提出了一种具有声控翻译功能的便携式数字媒体播放器。
本实用新型解决解决人们在日常生活和工作中与不同国籍人交流的语言障碍问题所采用的技术方案是提供一种具有声控翻译功能的便携式数字媒体播放器,该数字媒体播放器包括存储数字媒体数据的存储单元;用于对数字媒体数据进行处理的数据处理单元;用于显示或语音播放数据处理单元输出的信号的输出单元;进行功能控制和信息处理的中央处理单元,该数字媒体播放器还进一步包括用于接收用户语音信息的麦克风;对用户语音信息进行识别的语音识别单元,中央处理单元根据语音识别单元所识别的语音信息从存储单元中的文本信息选出相似度大于预定阈值的文本信息并根据存储单元中存储的词库翻译成目标文本信息,然后由输出单元进行显示或语音播放。
根据本实用新型一优选实施例,输出单元包括显示屏和扬声器。
根据本实用新型一优选实施例,数据处理单元包括音频解码模块和音频处理模块,音频处理模块与扬声器相连接。
根据本实用新型一优选实施例,数据处理单元包括视频解码模块、接收视频解码模块输出的数字视频信号的显示模块以及接收视频解码模块输出的数字音频信号的音频处理模块,显示模块与显示屏相连接,音频处理模块与扬声器相连接。
根据本实用新型一优选实施例,中央处理单元根据语音识别单元所识别的语音信息从存储单元中选出至少两个相似度大于预定阈值的文本信息并在显示屏上进行显示。
根据本实用新型一优选实施例,中央处理单元还根据用户确定指令从至少两个相关文本信息中选择用户确认的文本信息。
根据本实用新型一优选实施例,中央处理单元根据存储器内存储的词库将用户确认的文本信息翻译成目标文本信息并在显示屏上进行显示。
根据本实用新型一优选实施例,数字媒体播放器进一步包括将目标文本信息转换成语音信息的语音转换单元。
根据本实用新型一优选实施例,存储器中存储有多个备选词库。
根据本实用新型一优选实施例,语音识别单元为针对非特定人的语音识别单元。
上述技术方案的有益效果是在现有MP3、MP4等广泛使用的便携式数字媒体播放器中增加了声控翻译功能并合理利用数字媒体播放器中现有元器件,便于用户克服在日常生活和工作中与不同国籍的人交流的语言障碍问题。

图1是本实用新型的数字媒体播放器一实施例的示意框图;图2是本实用新型的数字媒体播放器另一实施例的示意框图。
具体实施方式
以下结合附图和实施例对本实用新型进一步说明。
参见图1,图1是本实用新型的数字媒体播放器一实施例的示意框图。在本实施例中以MP3播放器为例对本实用新型进行示范性描述,MP3播放器1包括存储MP3文件的存储单元101;进行功能控制和信息处理的中央处理单元102;对MP3文件进行解码的音频解码模块103;与音频解码模块103相连接的音频处理单元104;与音频处理单元104相连的扬声器105以及经显示模块106与中央处理单元102和音频解码模块103相连接的显示屏107。使用时,音频解码模块103对MP3文件进行解码,并将数字音频信号传输到音频处理单元104,由音频处理单元104进行D/A转换形成模拟信号并由扬声器105进行语音播放。显示屏107用于显示中央处理单元102的控制状态以及MP3文件信息。
此外,MP3播放器1还进一步包括用于接收用户语音信息的麦克风108;对用户语音信息进行识别的语音识别单元109。中央处理单元102根据语音识别单元109所识别的语音信息从存储单元101中的文本信息选出相似度大于预定阈值的文本信息并根据存储单元101中存储的词库翻译成目标文本信息,然后由显示屏107进行显示或者经语音转换单元110将目标文本信息转换成语音信息经扬声器105进行播放。
中央处理单元102优选根据语音识别单元109所识别的语音信息从存储单元101中选出至少两个相似度大于预定阈值的文本信息,在显示屏107上进行显示并等待用户进行确认。用户通过语音指令或控制界面的按键指令选择出适当的文本信息。中央处理单元102根据存储单元101内的词库将所选择的文本信息翻译成相应的目标文本信息。在MP3播放器1的存储单元101内可以存储多种翻译映射词库,例如旅游用语词库、商务用语词库、工程用语词库等,用户可以根据具体的语言环境通过选择适当的旅游用语词库来进行最恰当的翻译。
使用时,用户对着MP3播放器1所出自己想要表达的短句,对选择出的备选文本信息进行确认,并由MP3播放器1翻译成相应的语音,将其拼写显示在显示屏上或进行语音播报。而其他用户通过语音播报或查看显示屏的显示内容理解用户想要表达的意思,并通过反向的翻译过程回答提问,进而实现互动翻译。在翻译过程中,由于出现备选内容,避免了由于同音不同意的字或词条所带来的翻译错误,保证了翻译的准确率。
参见图2,图2是本实用新型的数字媒体播放器另一实施例的示意框图。在本实施例中,在本实施例中以MP4播放器为例对本实用新型进行示范性描述,MP4播放器2包括存储MP4文件的存储单元201;进行功能控制和信息处理的中央处理单元202;对MP4文件进行解码的视频解码模块204;与视频解码模块203相连接的并接收数字音频数据的音频处理单元204;与音频处理单元204相连的扬声器205以及经显示模块206与中央处理单元202和视频解码模块203相连接的显示屏207。使用时,视频解码模块203首先对MP4文件进行视频解码,并将解码后的数字音频信号传输到音频处理单元204,由音频处理单元204进行D/A转换形成模拟信号并由扬声器205进行语音播放,解码后的数字视频信号经显示模块206在显示屏107进行显示。MP4播放器2还进一步包括用于接收用户语音信息的麦克风208;对用户语音信息进行识别的语音识别单元209。中央处理单元202根据语音识别单元209所识别的语音信息从存储单元201中的文本信息选出相似度大于预定阈值的文本信息并根据存储单元201中存储的词库翻译成目标文本信息,然后由显示屏207进行显示或者经语音转换单元110将目标文本信息转换成语音信息经扬声器205进行播放。
此外,MP4播放器2还进一步设置数据收发单元211。利用数据收发单元211可以通过各种传输协议与其他同类数字媒体播放器建立无线或有线连接,例如通过互联网、红外或蓝牙信号。采用这种联机方式进行翻译无需将频繁地将数字媒体播放器递交到其他用户手中,可以使用户更方便地进行“对话”。
本实用新型数字媒体播放器的语音识别单元可以包括针对特定人的语音识别系统或针对非特定人的语音识别系统。在针对特定人的语音识别系统中,用户需要事先对每一个词条进行训练。在训练阶段,用户每个词条依次说数遍,数字媒体播放器的语音识别单元提取词条的特征量,并将特征量按序列存入存储单元中。在识别阶段,语音识别单元将输入词条的特征量依次与存储单元中存储的每一个特征量进行相似度比较,将相似度大于预定阈值的词条作为识别结果输出。针对特定人的识别系统识别的词条数目一般在100条以下,识别性能随着词条数目的增加会有明显的下降,并且对于不同用户、在不同的噪声环境中,以及不同的时间相同用户的不同生理、心理状态下,系统的性能都会受到明显的影响。当采用针对非特定人的语音识别系统中,采用基于统计模型的算法,系统开发者事先采集大量的语音数据进行训练,得到声学模型并存储在存储单元中。在识别阶段,语音识别单元将用户的输入词条的特征量与通过声学模型构建的识别网络进行匹配解码,输出该词条。中央处理单元可根据语音识别单元输出的识别结果进行相应显示。非特定人语音识别系统对于用户而言,不需要引入繁琐的训练过程,方便了用户的使用;同时它可以供不同的人使用,因此大大拓宽了应用范围。另一方面,由于采用了基于统计模型的算法,其稳健性和识别性能都比特定人识别系统大大的提高。非特定人识别系统识别的词条数目可以达到1000条,识别性能不会随着识别词条数目的增加有明显的下降,并且具有一定的抗噪能力。
通过上述实施例,可以在现有MP3、MP4等广泛使用的便携式数字媒体播放器中增加了声控翻译功能并合理利用数字媒体播放器中现有元器件,便于用户克服在日常生活和工作中与不同国籍的人交流的语言障碍问题。
上述的详细描述仅是示范性描述,本领域技术人员在不脱离本实用新型所保护的范围和精神的情况下,可根据不同的实际需要设计出各种实施方式。
权利要求1.一种具有声控翻译功能的便携式数字媒体播放器,所述数字媒体播放器包括存储数字媒体数据的存储单元;用于对所述数字媒体数据进行处理的数据处理单元;用于显示或语音播放所述数据处理单元输出的信号的输出单元;进行功能控制和信息处理的中央处理单元,其特征在于所述数字媒体播放器还进一步包括用于接收用户语音信息的麦克风;对所述用户语音信息进行识别的语音识别单元,所述中央处理单元根据所述语音识别单元所识别的语音信息从所述存储单元中的文本信息选出相似度大于预定阈值的文本信息并根据所述存储单元中存储的词库翻译成目标文本信息,然后由所述输出单元进行显示或语音播放。
2.根据权利要求1所述的数字媒体播放器,其特征在于所述输出单元包括显示屏和扬声器。
3.根据权利要求2所述的数字媒体播放器,其特征在于所述数据处理单元包括音频解码模块和音频处理模块,所述音频处理模块与所述扬声器相连接。
4.根据权利要求2所述的数字媒体播放器,其特征在于所述数据处理单元包括视频解码模块、接收所述视频解码模块输出的数字视频信号的显示模块以及接收所述视频解码模块输出的数字音频信号的音频处理模块,所述显示模块与所述显示屏相连接,所述音频处理模块与所述扬声器相连接。
5.根据权利要求2所述的数字媒体播放器,其特征在于所述中央处理单元根据所述语音识别单元所识别的语音信息从所述存储单元中选出至少两个相似度大于预定阈值的文本信息并在所述显示屏上进行显示。
6.根据权利要求5所述的数字媒体播放器,其特征在于所述中央处理单元还根据用户确定指令从所述至少两个相关文本信息中选择用户确认的文本信息。
7.根据权利要求6所述的数字媒体播放器,其特征在于所述中央处理单元根据所述存储器内存储的词库将所述用户确认的文本信息翻译成目标文本信息并在所述显示屏上进行显示。
8.根据权利要求7所述的数字媒体播放器,其特征在于所述数字媒体播放器进一步包括将所述目标文本信息转换成语音信息的语音转换单元。
9.根据权利要求1所述的数字媒体播放器,其特征在于所述存储器中存储有多个备选词库。
10.根据上述权利要求任意一项所述的数字媒体播放器,其特征在于所述语音识别单元为针对非特定人的语音识别单元。
专利摘要本实用新型涉及一种具有声控翻译功能的便携式数字媒体播放器,包括存储数字媒体数据的存储单元;用于对数字媒体数据进行处理的数据处理单元;用于显示或播放数据处理单元输出的信号的输出单元;进行功能控制和信息处理的中央处理单元;用于接收用户语音信息的麦克风;对用户语音信息进行识别的语音识别单元,中央处理单元根据语音识别单元所识别的语音信息从存储单元中的文本信息选出相似度大于预定阈值的文本信息并根据存储单元中存储的词库翻译成目标文本信息,然后由输出单元进行显示或播放。通过上述结构,在MP3、MP4等现有便携式数字媒体播放器中增加了声控翻译功能。
文档编号G11B20/00GK2904207SQ200620013828
公开日2007年5月23日 申请日期2006年5月12日 优先权日2006年5月12日
发明者陈修志 申请人:陈修志
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1