一种基于网络通信的视频文件检索方法_2

文档序号：9914814阅读：来源：国知局

016]为了克服上述不足，本发明搭建了一种基于网络通信的视频文件检索系统，基于语音识别、图像识别和互联网通信技术的结合，有效解决上述技术问题。
[0017]图1为根据本发明实施方案示出的基于网络通信的视频文件检索系统的结构方框图，所述检索系统设置在机动车内，包括AT89C51单片机1、语音识别设备2、图像检测设备3和网络检索设备4，所述语音识别设备2用于识别机动车驾驶员的当前语音以获得当前语音中的视频演奏者姓名，所述图像检测设备3用于检测机动车驾驶员的当前情绪，所述AT89C51单片机I与所述语音识别设备2、所述图像检测设备3和所述网络检索设备4分别连接，基于所述视频演奏者姓名和所述当前情绪控制所述网络检索设备4在互联网中的视频文件检索操作。
[0018]接着，继续对本发明的基于网络通信的视频文件检索系统的具体结构进行进一步的说明。
[0019]所述检索系统还包括:视频播放设备，包括显示器和用户输入设备，用于接收并播放视频文件，所述显示器为液晶显示屏，所述用户输入设备为与所述显示器集成在一起的触摸屏。
[0020]所述检索系统还包括:供电设备，包括太阳能供电器件、机动车蓄电池、切换开关和电压转换器，所述切换开关与所述太阳能供电器件和所述机动车蓄电池分别连接，根据机动车蓄电池的剩余电量决定是否切换到所述太阳能供电器件以由所述太阳能供电器件供电，所述电压转换器与所述切换开关连接，以将通过切换开关输入的5V电压转换为3.3V电压。
[0021]所述检索系统还包括:移动硬盘，设置在机动车的仪表盘内，用于存储面部上限灰度阈值、面部下限灰度阈值和各个面部情绪基准图案，所述面部上限灰度阈值和所述面部下限灰度阈值用于从图像中将面部和背景分离，各个面部情绪基准图案分别对应人们的各种情绪，每一个面部情绪基准图案为预先对具有对应情绪的人脸进行拍摄所获得的图案，人们的各种情绪包括悲伤、欢乐、平静和愤怒。
[0022]所述检索系统还包括:CCD摄像头，设置在机动车驾驶员座位的前方，用于对机动车驾驶员的面部进行图像采集，以获得面部图像。
[0023]所述图像检测设备3设置在机动车的仪表盘内，与所述CCD摄像头连接，接收所述面部图像，对所述面部图像进行识别以获得驾驶员的当前情绪；
[0024]所述图像检测设备3包括对比度增强单元、小波滤波单元、灰度化处理单元、面部图案提取单元和情绪分析单元，所述对比度增强单元与所述CCD摄像头连接以对所述面部图像进行对比度增强处理，获得增强面部图像，所述小波滤波单元与所述对比度增强单元连接以对所述增强面部图像进行基于哈尔小波滤波器的滤波处理，获得滤波面部图像，所述灰度化处理单元与所述小波滤波单元连接，用于对所述滤波面部图像执行灰度化处理，以获得灰度化面部图像，所述面部图案提取单元与所述灰度化处理单元和所述移动硬盘分别连接，将所述灰度化图像中灰度值在所述面部上限灰度阈值和所述面部下限灰度阈值之间的像素识别并组成驾驶员面部图案，所述情绪分析单元与所述面部图案提取单元和所述移动硬盘分别连接，将所述驾驶员面部图案与各个面部情绪基准图案进行匹配，将匹配成功的面部情绪基准图案对应的面部情绪作为当前情绪输出。
[0025]所述语音识别设备2包括语音识别芯片、文字转换器、FLASH存储器和RS232串口，所述语音设备芯片接收机动车驾驶员的当前语音并将机动车驾驶员的当前语音转换为数字音频文件，所述FLASH存储器预先存储字符串识别格式，所述文字转换器与所述语音识别芯片和所述FLASH存储器分别连接，将所述数字音频文件转换为字符串，并基于所述字符串识别格式识别出所述字符串中的视频演奏者姓名，所述RS232串口与所述文字转换器连接，用于接收并输出所述视频演奏者姓名。
[0026]所述AT89C51单片机I与所述图像检测设备3、所述移动硬盘、所述语音识别设备2和所述网络检索设备4分别连接，设置所述网络检索设备4的搜索规则如下:
[0027]当接收到的当前情绪为悲伤时，控制所述网络检索设备4在互联网上搜索从所述语音识别设备2处接收到视频演奏者姓名的所有作品中演奏风格为安宁的视频文件并下载到所述视频播放设备的播放缓冲区中；
[0028]当接收到的当前情绪为欢乐时，控制所述网络检索设备4在互联网上搜索从所述语音识别设备2处接收到视频演奏者姓名的所有作品中演奏风格为劲爆的视频文件并下载到所述视频播放设备的播放缓冲区中；
[0029]当接收到的当前情绪为平静时，控制所述网络检索设备4在互联网上搜索从所述语音识别设备2处接收到视频演奏者姓名的所有作品中演奏风格为抒情的视频文件并下载到所述视频播放设备的播放缓冲区中；
[0030]当接收到的当前情绪为愤怒时，控制所述网络检索设备4在互联网上搜索从所述语音识别设备2处接收到视频演奏者姓名的所有作品中演奏风格为说理的视频文件并下载到所述视频播放设备的播放缓冲区中。
[0031]所述网络检索设备4包括网络通信接口和搜索规则设置器件，所述网络通信接口为4G移动通信接口，所述搜索规则设置器件与所述网络通信接口和所述AT89C51单片机分别连接，用于接收所述AT89C51单片机设置的搜索规则以控制所述网络通信接口按照所述搜索规则在互联网上搜索并下载对应的视频文件，当对应的视频文件为多个时，选择互联网上人气最旺的视频文件下载，所述网络通信接口还与所述视频播放设备连接，用于将下载的视频文件转发到所述视频播放设备的播放缓冲区中。
[0032]其中，所述对比度增强单元、所述小波滤波单元、所述灰度化处理单元、所述面部图案提取单元和所述情绪分析单元分别采用不同的FPGA芯片来实现，并集成在一块集成电路板上;所述字符串识别格式为在字符串中，最后两个字符为视频，最后两个字符前的所有字符为视频演奏者姓名。
[0033]可选地，所述检索系统还包括:供电设备，为所述检索系统中的各个用电部件提供电力供应;所述检索系统还包括:串行通信接口，与所述移动硬盘连接，用于将外部串口设备中存储的面部上限灰度阈值、面部下限灰度阈值和各个面部情绪基准图案存入所述移动硬盘;所述用户输入设备用于在机动车驾驶员的操作下确定是否开启检索系统的搜索功能；以及替换地，将所述对比度增强单元、所述小波滤波单元、所述灰度化处理单元、所述面部图案提取单元和所述情绪分析单元集成在一块FPGA芯片中。
[0034]另外，FPGA(Field —Programmable Gate Array)，即现场可编程门阵列，他是在PAL、GAL、CPLD等可编程器件的基础上进一步发展的产物。他是作为专用集成电路(ASIC)领域中的一种半定制电路而出现的，既解决了定制电路的不足，又克服了原有可编程器件门电路数有限的缺点。
[0035]以硬件描述语言(Verilog或VHDL)所完成的电路设计，可以经过简单的综合与布局，快速的烧录至FPGA上进行测试，是现代IC设计验证的技术主流。这些可编辑元件可以被用来实现一些基本的逻辑门电路(比如AND、0R、X0R、N0T)或者更复杂一些的组合功能比如解码器或数学方程式。在大多数的FPGA里面，这些可编辑的元件里也包含记忆元件例如触发器(Flip — flop)或者其他更加完整的记忆块。系统设计师可以根据需要通过可编辑的连接把FPGA内部的逻辑块连接起来，就好像一个电路试验板被放在了一个芯片里。一个出厂后的成品FPGA的逻辑块和连接可以按照设计者而改变，所以FPGA可以完成所需要的逻辑功會K。
[0036]FPGA—般来说比ASIC(专用集成电路)的速度要慢，实现同样的功能比ASIC电路面积要大。但是他们也有很多的优点比如可以快速成品，可以被修改来改正程序中的错误和更便宜的造价。厂商也可能会提供便宜的但是编辑能力差的FPGA。因为这些芯片有比较差的可编辑能力，所以这些设计的开发是在普通的FPGA上完成的，然后将设计转移到一个类似于ASIC的芯片上。另外一种方法是用CPLD(Complex Programmable Logic Device，复杂可编程逻辑器件)JPGA的开发相对于传统PC、单片机的开发有很大不同。FPGA以并行运

完整全部详细技术资料下载

当前第2页1 2 3