一种嵌入式深度学习处理器的制造方法

文档序号:10656251阅读:269来源:国知局
一种嵌入式深度学习处理器的制造方法
【专利摘要】本发明属于集成电路技术领域,具体为一种嵌入式深度学习处理器。该深度学习处理器包括:中央处理器(CPU),完成处理器学习和运行过程中必要的逻辑运算、控制及存储工作;深度学习单元,深度学习算法的硬件实现单元,是进行深度学习处理的核心部件。该深度学习处理器结合传统CPU与深度学习组合单元,其中深度学习组合单元可由多个深度学习单元任意组合,具有可扩展性,可针对不同的计算规模,作为人工智能应用的核心处理器。
【专利说明】
一种嵌入式深度学习处理器
技术领域
[0001 ]本发明属于集成电路技术领域,具体涉及一种嵌入式深度学习处理器。
【背景技术】
[0002]深度学习处理器,就是给电脑创造出模仿人类大脑多层大规模人工神经网络的芯片。经过近60年的发展,人工智能已经取得了巨大的进步,但总体上还处于发展初期。当前,面向特定领域的专用人工智能技术已取得突破性进展,甚至可以在单点突破、局部智能水平的单项测试中超越人类智能,比如工业机器人、人脸识别、虹膜识别等。随着计算机、互联网技术的发展,谷歌、百度等公司陆续推出“AlphaGo” “百度大脑”等深度学习程序,推动着人工智能的不断进步。
[0003]深度学习的提出使得人工神经网络重新成为机器学习最重要的算法之一,在传统的人工神经网络训练中增加了一个预训练阶段,即用无监督学习对每一层网络进行一次专门的训练,然后才用有监督学习对整个网络进行总体训练,也就是说计算机通过深度神经网络,模拟人脑的机制来学习、判断、决策。通过深度学习方法,人工神经网络的效果一举赶上甚至显著超过了支持向量机等其他机器学习方法。近年来,这种方法已被应用于许多领域,在IBM、谷歌、微软、科大讯飞、百度等公司很多工业级图像和语音处理应用上取得了非常好的效果,在近期和未来都将是人工智能领域的一个热点研究方向。
[0004]当今的深度学习处理多由大量的CPU及GPU堆积成大型运算工作站,在软件层面实现深度学习算法,直至2016年中国科学院计算机所发布了寒武纪神经网络处理器,真正在硬件层面上实现了深度学习,其采用特有的深度学习处理器指令集,从运算速度到硬件架构上都有了质的飞跃。但是寒武纪的缺点在于它无法扩展,一款芯片只能针对一种特定的计算规模,甚至针对一种应用,这对于人工智能在生活方方面面的推广带来了阻碍,将耗费大量的时间及人力成本。

【发明内容】

[0005]本发明的目的在于提供一种能够克服上述现有技术的缺点嵌入式深度学习处理器。
[0006]本发明提供的嵌入式深度学习处理器,其包括:
中央处理器,用于完成处理器学习和运行过程中必要的逻辑运算、控制及存储工作; 深度学习组合单元,用于实现深度学习算法的硬件单元,进行深度学习处理的核心部件。
[0007]具体地,所述深度学习组合单元可由多个深度学习单元以各种形式组成。
[0008]所述深度学习单元为深度学习算法的硬件实现,包括卷积神经网络(CNN)单元或GRU单元等。
[0009]所述深度学习处理器具有可扩展性,即通过增加所述深度学习组合单元的数量或级联所述中央处理器,扩大计算规模。
[0010]本发明的技术效果是,通过结合传统CPU与深度学习组合单元,其中深度学习组合单元可由多个深度学习单元任意组合,具有可扩展性,可针对不同的计算规模,作为人工智能应用的核心处理器。
【附图说明】
[0011]图1是本发明的嵌入式深度学习处理器的硬件结构示意图。
[0012]图2至图4是深度学习组合单元的组合结构示例图。
【具体实施方式】
[0013]在下文中结合图示在参考实施例中更完全地描述本发明,本发明提供优选实施例,但不应该被认为仅限于在此阐述的实施例。
[0014]图1所示为本发明嵌入式深度学习处理器的硬件结构示意图,由CPU11和若干深度学习组合单元12组成,两者协同处理,实现深度学习。深度学习组合单元可以仅为单个深度学习单元,如CNN(Convolut1nal Neural Network)单元或GRU(Gated Recurrent Unit)单元;也可以为多个深度学习单元组合而成,如图2至图4的示例图,单元互相级联或并联,达到所需的运算和学习效果。
[0015]正是由于深度学习组合单元的自由度,在本发明的硬件结构上,可以添加、删减或任意组合深度学习单元,也可以将CPU级联,具有可扩展性,从而达到对不同运算规模的适应性,可广泛应用于深度学习人工智能的各个领域。
[0016]以上通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的【具体实施方式】加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。
【主权项】
1.一种嵌入式深度学习处理器,其特征在于,包括: 中央处理器,完成处理器学习和运行过程中必要的逻辑运算、控制及存储工作; 深度学习组合单元,实现深度学习算法的硬件单元,是进行深度学习处理的核心部件。2.如权利要求1所述的嵌入式深度学习处理器,其特征在于,所述深度学习组合单元由多个深度学习单元以各种形式组成。3.如权利要求2所述的嵌入式深度学习处理器,其特征在于,所述深度学习单元包括卷积神经网络单元或GRU单元。4.如权利要求1所述的嵌入式深度学习处理器,其特征在于,通过增加所述深度学习组合单元的数量或级联所述中央处理器,扩大计算规模。
【文档编号】G06N3/063GK106022472SQ201610342944
【公开日】2016年10月12日
【申请日】2016年5月23日
【发明人】史传进, 陈迟晓, 张怡云, 马睿, 丁宏伟
【申请人】复旦大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1