一种具有图像处理功能的智能存储设备的制造方法_2

文档序号:9667466阅读:来源:国知局
对加速模块使用集成电路中的数据处理模块(诸如DSP)对目标向量和图片特征进行欧式距离计算,以获得图片相似度的高低。后续将结合图6进行具体描述。
[0034]由上述可知,相比于现有技术,本发明将诸如FPGA芯片的集成电路实现CNN硬件加速功能和向量比对功能,并透过与固态硬盘的数据通信来实现图片存取过程中的高速分类存储以及图片读取时的快速检索功能。由于本发明采用集成电路的深度流水设计,在性能上完全能够满足高速存取的应用场景,并且集成电路和固态硬盘的功耗较低,因此可有效提高单位设备的运算能效比。此外,诸如服务器的主机CPU只需要负责通信和存储的控制调度,不必具备强大的计算性能;服务器允许的硬盘接入数目高于PCIe插槽的配置数目,在数据存储方面具有更好的扩展性。
[0035]图3示出图2的集成电路中的CNN加速模块的结构示意图。图4示出图2的集成电路中,CNN加速模块与其它功能模块的数据交互示意图。
[0036]参照图3和图4,在一示意性实施例中,CNN加速模块包括多个处理单元(ProcessElement,PE)、片上缓存器(On-chip Memory)、片外存储器(Off-chip Memory)和片内 / 片外交互单元。其中,片外存储器用于存储待处理的图片数据。片内/片外交互单元用于处理单元与片外存储器之间的数据通信。片上缓存器用于在处理单元进行卷积运算之前对待处理的图片数据进行高速缓存。此外,CNN加速模块内还包括片内互连单元,专门用于各个处理单元与片内缓存器之间的数据通信。
[0037]在图4中,CNN加速模块还电性親接至中断控制器和控制总线(control bus)。其中,CNN加速模块通过控制总线向处理器(如,数据处理模块)发送交互指令。处理器根据交互指令并通过数据总线(data bus)、DDR控制器与片外存储器(如,DDR存储器)进行数据通信。例如,数据处理模块的工作频率为100MHz,片外存储器的数据带宽为400MB/S。
[0038]图5示出采用图1的智能存储设备进行图片分类的示意图。参照图5,当主机通过其自身内存将图片传入SATA接口,并通过FPGA芯片内部集成的CNN加速模块对图片进行分类判断。根据得到的分类结果,图片会存入初始化过程中根据模型的信息预先建立的图片目录文件中。例如,CNN加速模块进行分类时,其分类结果包括分类标识码(分类id)和索引节点地址(inode地址)。分类标识码分别对应分类1、分类2、分类3、…分类n,从而生成输出结果中的图片目录文件。索引节点地址用于生成索引节点地址列表(inode列表)Ο
[0039]此外,图片分类操作对应于主机一集成电路一固态硬盘的数据通路,且集成电路利用主机控制器一侧的SATA接口以及设备控制器一侧的SATA接口分别同主机和固态硬盘进行数据通信。相应地,其SATA数据通信的图片分类操作流程为:首先从FIS命令数据中解码数据总大小,创建并发送DMA FIS数据到主机端,准备传输;然后等待主机端返回数据;接着用户指定LBA地址将转发数据到固态硬盘;在重复上述步骤以完成数据传输之后,等待固态硬盘返回FIS状态数据信息,并由FPGA芯片将FIS状态数据信息发送回主机端。
[0040]图6示出采用图1的智能存储设备进行图片检索的示意图。参照图6,当主机输入目标检测对象(可支持以模型ID的形式输入)时,FPGA芯片通过设备控制器一侧的SATA接口遍历分类后模型ID对应的目录文件,对目录文件中的图片文件进行特征提取及向量比对。根据计算欧式距离的结果,将检索目标文件进行相似度从高到低的排序,并存入检索目录文件内,然后将该检索目录文件发送返回主机端。
[0041]类似地,图片检索操作对应于固态硬盘一集成电路一主机的数据通路,且集成电路利用主机控制器一侧的SATA接口以及设备控制器一侧的SATA接口分别同主机和固态硬盘进行数据通信。其SATA数据通信的图片检索操作流程为:首先从FIS命令数据中解码数据总大小,并转发FIS命令数据到固态硬盘;然后等待来自固态硬盘发送的数据,若数据较多,数据处理模块可将FIS数据通过DDR缓存后再发送;在重复上述步骤后,等待固态硬盘返回FIS状态数据信息,并由FPGA芯片将FIS状态数据信息发回主机端。
[0042]采用本发明的具有图像处理功能的智能存储设备,其包括集成电路、主机和固态硬盘。该集成电路包括主机控制器、设备控制器、第一逻辑单元和第二逻辑单元。该主机电性耦接至上述主机控制器,主机通过主机控制器与集成电路进行双向数据传输。固态硬盘电性耦接至设备控制器,并通过设备控制器与集成电路进行双向数据传输。本发明的智能存储设备藉由第一逻辑单元和第二逻辑单元对应地实现图像分类和图像检索。相比于现有技术,本发明将诸如FPGA芯片的集成电路实现CNN硬件加速功能、向量比对功能,并透过与固态硬盘的数据通信来实现图片存取过程中的高速分类存储以及图片读取时的快速检索功能。如此一来,本发明通过集成电路的深度流水设计,在性能上完全能够满足高速存取的应用场景,并且集成电路和固态硬盘的功耗较低,因此可有效提高单位设备的运算能效比。此外,诸如服务器的主机CPU只需要负责通信和存储的控制调度,不必具备强大的计算性能;服务器允许的硬盘接入数目高于PCIe插槽的配置数目,在数据存储方面具有更好的扩展性。
[0043]上文中,参照附图描述了本发明的【具体实施方式】。但是,本领域中的普通技术人员能够理解,在不偏离本发明的精神和范围的情况下,还可以对本发明的【具体实施方式】作各种变更和替换。这些变更和替换都落在本发明权利要求书所限定的范围内。
【主权项】
1.一种具有图像处理功能的智能存储设备,其特征在于,该智能存储设备包括: 一集成电路,包括一主机控制器、一设备控制器、一第一逻辑单元和一第二逻辑单元,其中所述第一逻辑单元与所述第二逻辑单元相互独立; 一主机,电性耦接至所述主机控制器,所述主机通过所述主机控制器与所述集成电路进行双向数据传输;以及 一固态硬盘,电性耦接至所述设备控制器,所述固态硬盘通过所述设备控制器与所述集成电路进行双向数据传输, 其中,所述智能存储设备藉由所述第一逻辑单元和所述第二逻辑单元对应地实现图像分类和图像检索。2.根据权利要求1所述的智能存储设备,其特征在于,所述集成电路为一现场可编程门阵列。3.根据权利要求1所述的智能存储设备,其特征在于,所述主机控制器和所述设备控制器均为SATA接口电路。4.根据权利要求1所述的智能存储设备,其特征在于,所述第一逻辑单元为CNN加速模块,用于接收来自所述主机的图片,对所述图片进行分类,并将分类结果存储于所述固态硬盘。5.根据权利要求4所述的智能存储设备,其特征在于,所述CNN加速模块的分类结果包括分类标识码和索引节点地址,所述分类标识码用于生成图片目录文件,所述索引节点地址用于生成索引节点地址列表。6.根据权利要求1所述的智能存储设备,其特征在于,所述第二逻辑单元为向量比对加速模块,用于根据来自所述主机的图片检索信息,对所述固态硬盘中的图片文件进行特征提取和向量比对,并依据相似度的高低生成检索目录文件。7.根据权利要求6所述的智能存储设备,其特征在于,所述向量比对加速模块使用所述集成电路中的数据处理模块对目标向量和图片特征进行欧式距离计算,以获得图片相似度的高低。8.根据权利要求1所述的智能存储设备,其特征在于,所述CNN加速模块包括多个处理单元、片上缓存器、片外存储器和片内/片外交互单元, 其中,所述片外存储器用于存储待处理的图片数据,所述片内/片外交互单元用于处理单元与片外存储器之间的数据通信,所述片上缓存器用于在所述处理单元进行卷积运算之前对所述待处理的图片数据进行高速缓存。9.根据权利要求1所述的智能存储设备,其特征在于,所述CNN加速模块电性耦接至中断控制器和控制总线, 其中,所述CNN加速模块通过所述控制总线向数据处理模块发送交互指令,所述数据处理模块根据所述交互指令并通过数据总线与片外存储器进行数据通信。
【专利摘要】本发明提供一种具有图像处理功能的智能存储设备,包括:集成电路,其具有主机控制器、设备控制器、第一逻辑单元和第二逻辑单元;主机,电性耦接至主机控制器,并通过主机控制器与集成电路进行双向数据传输;以及固态硬盘,电性耦接至设备控制器,并通过设备控制器与集成电路进行双向数据传输,其中,智能存储设备藉由第一和第二逻辑单元对应地实现图像分类和图像检索。相比于现有技术,本发明利用集成电路实现CNN硬件加速功能和向量比对功能,其透过与固态硬盘的通信来实现图片存取过程的高速分类存储以及图片读取时的快速检索功能,以便在性能上完全满足高速存取的应用场景,并且集成电路和固态硬盘的功耗较低,因此可有效提高单位设备的运算能效比。
【IPC分类】G06F17/30
【公开号】CN105426517
【申请号】CN201510872516
【发明人】杨贤, 黄峰
【申请人】上海越峰信息科技有限公司
【公开日】2016年3月23日
【申请日】2015年12月2日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1