从互联网处获取音乐文件的搜索平台的制作方法与工艺

文档序号:13109578阅读:130来源:国知局
本发明是申请号为201510309287.0、申请日为2015年6月6日、发明名称为“从互联网处获取音乐文件的搜索平台”的专利的分案申请。技术领域本发明涉及网络通信领域,尤其涉及一种从互联网处获取音乐文件的搜索平台。

背景技术:
现有技术中,机动车驾驶员通常忙于驾驶,而无暇为了自身的听觉享受进行音乐文件的繁琐的选择操作,驾驶员的不同情绪下喜好的音乐类型不同,而且,现有技术中缺少根据驾驶员语音自动下载音乐文件的操作模式。为此,本发明提出了一种新的音乐文件的搜索方案,应用于机动车上,一方面,能够按照驾驶员的语音实现对预定音乐演奏者的音乐作品的自动下载、播放,另一方面,能够基于驾驶员的情绪选择下载、播放不同类型的音乐文件。

技术实现要素:
为了解决现有技术存在的技术问题,本发明提供了一种从互联网处获取音乐文件的搜索平台,首先通过语音识别技术按照预定的文字格式解析出驾驶员语音中的音乐演奏者名称,随后通过图像识别技术识别出驾驶员的当前情绪,最后,基于音乐演奏者名称的当前情绪,从互联网上下载、播放合适的音乐文件,随时满足机动车驾驶员的听觉需求。根据本发明的一方面,提供了一种从互联网处获取音乐文件的搜索平台,设置在机动车内,所述搜索平台包括语音识别器、网络搜索器和音乐播放器,所述语音识别器用于识别机动车驾驶员的当前语音以获得当前语音中的音乐演奏者姓名,所述网络搜索器用于根据所述音乐演奏者姓名在网络中搜索并下载对应的音乐文件,所述音乐播放器用于接收并播放所述对应的音乐文件。更具体地,在所述从互联网处获取音乐文件的搜索平台中,还包括:SDRAM存储设备,设置在机动车的仪表盘内,用于存储面部上限灰度阈值、面部下限灰度阈值和各个面部情绪基准图案,所述面部上限灰度阈值和所述面部下限灰度阈值用于从图像中将面部和背景分离,各个面部情绪基准图案分别对应人们的各种情绪,每一个面部情绪基准图案为预先对具有对应情绪的人脸进行拍摄所获得的图案,人们的各种情绪包括悲伤、欢乐、平静和愤怒;CMOS视觉传感器,设置在机动车驾驶员座位的前方,用于对机动车驾驶员的面部进行图像采集,以获得面部图像;驾驶员情绪检测设备,设置在机动车的仪表盘内,与所述CMOS视觉传感器连接,接收所述面部图像,对所述面部图像进行识别以获得驾驶员的当前情绪;所述驾驶员情绪检测设备包括对比度增强单元、小波滤波单元、灰度化处理单元、面部图案提取单元和情绪分析单元,所述对比度增强单元与所述CMOS视觉传感器连接以对所述面部图像进行对比度增强处理,获得增强面部图像,所述小波滤波单元与所述对比度增强单元连接以对所述增强面部图像进行基于哈尔小波滤波器的滤波处理,获得滤波面部图像,所述灰度化处理单元与所述小波滤波单元连接,用于对所述滤波面部图像执行灰度化处理,以获得灰度化面部图像,所述面部图案提取单元与所述灰度化处理单元和所述SDRAM存储设备分别连接,将所述灰度化图像中灰度值在所述面部上限灰度阈值和所述面部下限灰度阈值之间的像素识别并组成驾驶员面部图案,所述情绪分析单元与所述面部图案提取单元和所述SDRAM存储设备分别连接,将所述驾驶员面部图案与各个面部情绪基准图案进行匹配,将匹配成功的面部情绪基准图案对应的面部情绪作为当前情绪输出;所述语音识别器包括语音识别芯片、文字转换设备、内置存储设备和RS232串口,所述语音设备芯片接收机动车驾驶员的当前语音并将机动车驾驶员的当前语音转换为数字音频文件,所述内置存储设备预先存储字符串识别格式,所述文字转换设备与所述语音识别芯片和所述内置存储设备分别连接,将所述数字音频文件转换为字符串,并基于所述字符串识别格式识别出所述字符串中的音乐演奏者姓名,所述RS232串口与所述文字转换设备连接,用于接收并输出所述音乐演奏者姓名;数字信号处理器,与所述驾驶员情绪检测设备、所述SDRAM存储设备、所述语音识别器和所述网络搜索器分别连接,设置所述网络搜索器的搜索规则如下:当接收到的当前情绪为悲伤时,控制所述网络搜索器在互联网上搜索从所述语音识别器处接收到音乐演奏者姓名的所有作品中演奏风格为安宁的音乐文件并下载到所述音乐播放器的播放缓冲区中,当接收到的当前情绪为欢乐时,控制所述网络搜索器在互联网上搜索从所述语音识别器处接收到音乐演奏者姓名的所有作品中演奏风格为劲爆的音乐文件并下载到所述音乐播放器的播放缓冲区中,当接收到的当前情绪为平静时,控制所述网络搜索器在互联网上搜索从所述语音识别器处接收到音乐演奏者姓名的所有作品中演奏风格为抒情的音乐文件并下载到所述音乐播放器的播放缓冲区中,当接收到的当前情绪为愤怒时,控制所述网络搜索器在互联网上搜索从所述语音识别器处接收到音乐演奏者姓名的所有作品中演奏风格为说理的音乐文件并下载到所述音乐播放器的播放缓冲区中;所述网络搜索器,包括网络通信接口和搜索规则设置器件,所述网络通信接口为3G移动通信接口或4G移动通信接口中的一种,所述搜索规则设置器件与所述网络通信接口和所述数字信号处理器分别连接,用于接收所述数字信号处理器设置的搜索规则以控制所述网络通信接口按照所述搜索规则在互联网上搜索并下载对应的音乐文件,当对应的音乐文件为多个时,选择互联网上人气最旺的音乐文件下载,所述网络通信接口还与所述音乐播放器连接,用于将下载的音乐文件转发到所述音乐播放器的播放缓冲区中;其中,所述对比度增强单元、所述小波滤波单元、所述灰度化处理单元、所述面部图案提取单元和所述情绪分析单元分别采用不同的FPGA芯片来实现,并集成在一块集成电路板上;所述字符串识别格式为在字符串中,最后两个字符为音乐,最后两个字符前的所有字符为音乐演奏者姓名。更具体地,在所述从互联网处获取音乐文件的搜索平台中,还包括:供电设备,为所述搜索平台中的各个用电部件提供电力供应。更具体地,在所述从互联网处获取音乐文件的搜索平台中,还包括:USB接口,与所述SDRAM存储设备连接,用于插入外部U盘,以将外部U盘中的面部上限灰度阈值、面部下限灰度阈值和各个面部情绪基准图案存入所述SDRAM存储设备。更具体地,在所述从互联网处获取音乐文件的搜索平台中:所述音乐播放器为索尼NWZ-S736F播放器。更具体地,在所述从互联网处获取音乐文件的搜索平台中,还包括:用户输入设备,用于在机动车驾驶员的操作下确定是否开启搜索平台的搜索功能。附图说明以下将结合附图对本发明的实施方案进行描述,其中:图1为根据本发明实施方案示出的从互联网处获取音乐文件的搜索平台的结构方框图。具体实施方式下面将参照附图对本发明的从互联网处获取音乐文件的搜索平台的实施方案进行详细说明。当前,缺少替换机动车驾驶员手工操作的音乐选择方案,也缺少满足不同驾驶员情绪的音乐文件的选择、下载、播放模式。为了克服上述不足,本发明搭建了一种从互联网处获取音乐文件的搜索平台,基于语音识别、图像识别和互联网通信技术的结合,有效解决上述技术问题。图1为根据本发明实施方案示出的从互联网处获取音乐文件的搜索平台的结构方框图,所述搜索平台设置在机动车内,包括语音识别器1、网络搜索器2和音乐播放器3,所述语音识别器1用于识别机动车驾驶员的当前语音以获得当前语音中的音乐演奏者姓名,所述网络搜索器2用于根据所述音乐演奏者姓名在网络中搜索并下载对应的音乐文件,所述音乐播放器3用于接收并播放所述对应的音乐文件。接着,继续对本发明的从互联网处获取音乐文件的搜索平台的具体结构进行进一步的说明。所述搜索平台还包括:SDRAM存储设备,设置在机动车的仪表盘内,用于存储面部上限灰度阈值、面部下限灰度阈值和各个面部情绪基准图案,所述面部上限灰度阈值和所述面部下限灰度阈值用于从图像中将面部和背景分离,各个面部情绪基准图案分别对应人们的各种情绪,每一个面部情绪基准图案为预先对具有对应情绪的人脸进行拍摄所获得的图案,人们的各种情绪包括悲伤、欢乐、平静和愤怒。所述搜索平台还包括:CMOS视觉传感器,设置在机动车驾驶员座位的前方,用于对机动车驾驶员的面部进行图像采集,以获得面部图像。所述搜索平台还包括:驾驶员情绪检测设备,设置在机动车的仪表盘内,与所述CMOS视觉传感器连接,接收所述面部图像,对所述面部图像进行识别以获得驾驶员的当前情绪;所述驾驶员情绪检测设备包括对比度增强单元、小波滤波单元、灰度化处理单元、面部图案提取单元和情绪分析单元,所述对比度增强单元与所述CMOS视觉传感器连接以对所述面部图像进行对比度增强处理,获得增强面部图像,所述小波滤波单元与所述对比度增强单元连接以对所述增强面部图像进行基于哈尔小波滤波器的滤波处理,获得滤波面部图像,所述灰度化处理单元与所述小波滤波单元连接,用于对所述滤波面部图像执行灰度化处理,以获得灰度化面部图像,所述面部图案提取单元与所述灰度化处理单元和所述SDRAM存储设备分别连接,将所述灰度化图像中灰度值在所述面部上限灰度阈值和所述面部下限灰度阈值之间的像素识别并组成驾驶员面部图案,所述情绪分析单元与所述面部图案提取单元和所述SDRAM存储设备分别连接,将所述驾驶员面部图案与各个面部情绪基准图案进行匹配,将匹配成功的面部情绪基准图案对应的面部情绪作为当前情绪输出。所述语音识别器1包括语音识别芯片、文字转换设备、内置存储设备和RS232串口,所述语音设备芯片接收机动车驾驶员的当前语音并将机动车驾驶员的当前语音转换为数字音频文件,所述内置存储设备预先存储字符串识别格式,所述文字转换设备与所述语音识别芯片和所述内置存储设备分别连接,将所述数字音频文件转换为字符串,并基于所述字符串识别格式识别出所述字符串中的音乐演奏者姓名,所述RS232串口与所述文字转换设备连接,用于接收并输出所述音乐演奏者姓名。所述搜索平台还包括:数字信号处理器,与所述驾驶员情绪检测设备、所述SDRAM存储设备、所述语音识别器1和所述网络搜索器2分别连接,设置所述网络搜索器2的搜索规则如下:当接收到的当前情绪为悲伤时,控制所述网络搜索器2在互联网上搜索从所述语音识别器1处接收到音乐演奏者姓名的所有作品中演奏风格为安宁的音乐文件并下载到所述音乐播放器3的播放缓冲区中,当接收到的当前情绪为欢乐时,控制所述网络搜索器2在互联网上搜索从所述语音识别器1处接收到音乐演奏者姓名的所有作品中演奏风格为劲爆的音乐文件并下载到所述音乐播放器3的播放缓冲区中,当接收到的当前情绪为平静时,控制所述网络搜索器2在互联网上搜索从所述语音识别器1处接收到音乐演奏者姓名的所有作品中演奏风格为抒情的音乐文件并下载到所述音乐播放器3的播放缓冲区中,当接收到的当前情绪为愤怒时,控制所述网络搜索器2在互联网上搜索从所述语音识别器1处接收到音乐演奏者姓名的所有作品中演奏风格为说理的音乐文件并下载到所述音乐播放器3的播放缓冲区中。所述网络搜索器2包括网络通信接口和搜索规则设置器件,所述网络通信接口为3G移动通信接口或4G移动通信接口中的一种,所述搜索规则设置器件与所述网络通信接口和所述数字信号处理器分别连接,用于接收所述数字信号处理器设置的搜索规则以控制所述网络通信接口按照所述搜索规则在互联网上搜索并下载对应的音乐文件,当对应的音乐文件为多个时,选择互联网上人气最旺的音乐文件下载,所述网络通信接口还与所述音乐播放器3连接,用于将下载的音乐文件转发到所述音乐播放器的播放缓冲区中。其中,所述对比度增强单元、所述小波滤波单元、所述灰度化处理单元、所述面部图案提取单元和所述情绪分析单元分别采用不同的FPGA芯片来实现,并集成在一块集成电路板上;所述字符串识别格式为在字符串中,最后两个字符为音乐,最后两个字符前的所有字符为音乐演奏者姓名。可选地,所述搜索平台还包括:供电设备,为所述搜索平台中的各个用电部件提供电力供应;所述搜索平台还包括:USB接口,与所述SDRAM存储设备连接,用于插入外部U盘,以将外部U盘中的面部上限灰度阈值、面部下限灰度阈值和各个面部情绪基准图案存入所述SDRAM存储设备;所述音乐播放器3为索尼NWZ-S736F播放器;所述搜索平台还包括:用户输入设备,用于在机动车驾驶员的操作下确定是否开启搜索平台的搜索功能。另外,FPGA(Field-ProgrammableGateArray),即现场可编程门阵列,他是在PAL、GAL、CPLD等可编程器件的基础上进一步发展的产物。他是作为专用集成电路(ASIC)领域中的一种半定制电路而出现的,既解决了定制电路的不足,又克服了原有可编程器件门电路数有限的缺点。以硬件描述语言(Verilog或VHDL)所完成的电路设计,可以经过简单的综合与布局,快速的烧录至FPGA上进行测试,是现代IC设计验证的技术主流。这些可编辑元件可以被用来实现一些基本的逻辑门电路(比如AND、OR、XOR、NOT)或者更复杂一些的组合功能比如解码器或数学方程式。在大多数的FPGA里面,这些可编辑的元件里也包含记忆元件例如触发器(Flip-flop)或者其他更加完整的记忆块。系统设计师可以根据需要通过可编辑的连接把FPGA内部的逻辑块连接起来,就好像一个电路试验板被放在了一个芯片里。一个出厂后的成品FPGA的逻辑块和连接可以按照设计者而改变,所以FPGA可以完成所需要的逻辑功能。FPGA一般来说比ASIC(专用集成电路)的速度要慢,实现同样的功能比ASIC电路面积要大。但是他们也有很多的优点比如可以快速成品,可以被修改来改正程序中的错误和更便宜的造价。厂商也可能会提供便宜的但是编辑能力差的FPGA。因为这些芯片有比较差的可编辑能力,所以这些设计的开发是在普通的FPGA上完成的,然后将设计转移到一个类似于ASIC的芯片上。另外一种方法是用CPLD(ComplexProgrammableLogicDevice,复杂可编程逻辑器件)。FPGA的开发相对于传统PC、单片机的开发有很大不同。FPGA以并行运算为主,以硬件描述语言来实现;相比于PC或单片机(无论是冯诺依曼结构还是哈佛结构)的顺序操作有很大区别。早在1980年代中期,FPGA已经在PLD设备中扎根。CPLD和FPGA包括了一些相对大数量的可编辑逻辑单元。CPLD逻辑门的密度在几千到几万个逻辑单元之间,而FPGA通常是在几万到几百万。CPLD和FPGA的主要区别是他们的系统结构。CPLD是一个有点限制性的结构。这个结构由一个或者多个可编辑的结果之和的逻辑组列和一些相对少量的锁定的寄存器组成。这样的结果是缺乏编辑灵活性,但是却有可以预计的延迟时间和逻辑单元对连接单元高比率的优点。而FPGA却是有很多的连接单元,这样虽然让他可以更加灵活的编辑,但是结构却复杂的多。采用本发明的从互联网处获取音乐文件的搜索平台,针对现有技术中无法根据机动车驾驶员当前情绪和语音自动下载播放音乐文件的技术问题,采用语音识别、图像识别和互联网通信技术分别实现对驾驶员语音解析、情绪检测和音乐文件下载功能,并能够自动播放下载的音乐文件,为机动车驾驶员提供方便、丰富的听觉享受。可以理解的是,虽然本发明已以较佳实施例披露如上,然而上述实施例并非用以限定本发明。对于任何熟悉本领域的技术人员而言,在不脱离本发明技术方案范围情况下,都可利用上述揭示的技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1