图形处理单元和包括其的装置的制造方法

文档序号:9889013阅读:243来源:国知局
图形处理单元和包括其的装置的制造方法
【专利说明】
[0001]相关申请的交叉引用
[0002] 本申请要求在2014年11月27日提交的韩国专利申请号10-2014-0167153的优先 权,其公开内容通过引用全部并入本文。
技术领域
[0003] 本发明构思的实施例涉及图形处理,并且更具体地,涉及一种用于读取具有不同 复杂度的预定模型之一,并响应于对读出模型的复杂度和参考复杂度的比较确定是否对该 已读出的模型执行细分操作的图形处理单元(GPU)。
【背景技术】
[0004] 在计算机图形学中,细节的等级(L0D)涉及基于诸如控制点的深度值或由控制点 所限定的曲率的几何信息调整细节。换句话说,L0D涉及降低远离观看者时的三维(3D)对象 的表示的复杂度。L0D技术通过降低在图形管线级(例如,顶点变换)的工作量提高渲染的效 率。
[0005] 在图形管线的细分级,预期曲面细分器(tessellator)对对象执行细分操作。因 此,由于计算需求,曲面细分的开销增加了。

【发明内容】

[0006] 本发明构思的一些实施例提供了一种图形处理单元(GPU)以及包括其的装置,其 用于根据计算装置的属性或特征,从在渲染操作之前准备好的具有不同复杂度的模型中选 择模型,以及确定是否对所选模型执行细分,从而减少图形管线(例如,曲面细分)的开销。
[0007] 根据本发明构思的一些实施例,提供了一种用于根据中央处理单元(CPU)的控制 确定是否对多个准备好的模型之中的第一模型执行细分操作的GPU,包括:被配置为从存储 器中读取第一模型的存取电路,存储多个准备好的具有不同复杂度的模型的存储器,存取 电路还配置为计算第一模型的复杂度、将所计算的复杂度与参考复杂度进行比较、并根据 比较结果确定是否对第一模型执行细分操作。
[0008] 所述GPU被配置为接收由CPU从与存储模型的存储器的存储区域对应的地址中选 择的第一地址,使用第一地址从存储区域中的第一存储区域读取第一模型,使用第一模型 的几何信息计算第一模型的复杂度,并根据将参考复杂度与所计算的复杂度进行比较的结 果确定是否要对第一模型执行细分操作。GPU被配置为以对象、图元(primitive)、块 (patch)、边、顶点、或控制点为单元计算第一模型的复杂度。
[0009] 所述GPU被配置为基于包括在图元中的顶点的深度值或者由顶点定义的曲率计算 第一模型的复杂度。所述GPU被配置为基于包括在块中的控制点的深度值或由控制点所限 定的曲率计算第一模型的复杂度。
[0010] 所述GPU被配置为从CPU接收与存储模型的存储器的存储区域相应的一个或多个 地址,估计GPU和存储器之间的带宽、GPU的计算功率、GPU的最大功耗、根据动态电压频率调 节(DVFS)确定的GPU的电压和频率以及GPU的温度中的至少一个,基于估计结果从地址中选 择第一地址;使用所选的第一地址从存储区域当中的第一存储区域中读取第一模型,使用 第一模型的几何信息计算第一模型的复杂度,并根据将参考复杂度与所计算的复杂度进行 比较的结果,确定是否对第一模型执行细分操作。
[0011]根据本发明构思的其他实施例,提供一种包括了包括多个细分级的GPU、CPU、由 GPU存取的存储器、以及由CPU控制的存储器控制器的片上系统(SoC)。所述GPU被配置为通 过存储器控制器从存储器读取第一模型,其中存储多个准备好的具有不同复杂度的模型; 计算第一模型的复杂度;将参考复杂度与所计算的复杂度进行比较;以及根据CHJ的控制根 据比较结果确定是否对第一模型执行细分。
[0012]所述CPU被配置为估计GPU与存储器之间的频带、GPU的计算功率、GPU的最大功耗、 根据GPU的DVFS确定的电压和频率、以及GPU的温度中的至少一个;以及基于估计结果发送 与存储模型的存储器的存储区域相应的地址之中的第一地址到GPU。所述GPU被配置为使用 第一地址从存储区域中的第一存储区域中读取第一模型。
[0013] 所述GPU被配置为使用包括在第一模型中的每个块的控制点的几何信息计算复杂 度。所述几何信息可以是控制点的深度值或由控制点所限定的曲率。存储渲染操作之前的 模型的存储器可以在SoC内部或外部实现。
[0014] 可替代地,所述CPU被配置为发送与存储模型的存储器的存储区域对应的地址到 GPU。所述GPU被配置为估计GPU和存储器之间的频带、GPU的计算功率、GPU的最大功耗、根据 GPU的动态电压频率调节(DVFS)确定的电压和频率以及GPU的温度中的至少一个;基于估计 结果选择地址中的第一地址;以及使用第一地址从存储区域中的第一存储区域读取第一模 型。
[0015] 所述GPU被配置为使用包括在第一模型中的每一个块的每一个控制点的深度值或 由控制点所限定的曲率计算第一模型的复杂度。
[0016] 所述GPU被配置为当第一模型的复杂度小于参考复杂度时对第一模型执行细分操 作。
[0017] 所述细分级被配置为包括外壳着色器(hull shader)、曲面细分器、以及域着色 器。所述计算和比较可以由外壳着色器执行。确定可以由曲面细分器执行。曲面细分器被配 置为基于确定的结果传递第一模型到域着色器或使用由曲面细分器发送的细分因子对第 一模型执行细分操作。
[0018] 根据本发明构思的其它实施例,提供了一种计算装置,包括被配置为存储多个准 备好的具有不同复杂度的模型的存储器、显示器、以及被配置为控制存储器和显示器的 SoC。该SoC包括包括了细分级的GPU、CPU、被配置为根据CPU的控制控制显示的显示控制器, 以及被配置为根据CHJ的控制控制存储器的存储器控制器。所述GPU被配置为通过存储器控 制器从存储模型的存储器读取第一模型,计算第一模型的复杂度,将所计算的复杂度与参 考复杂度进行比较,并根据CPU的控制根据比较结果确定是否要对第一模型执行细分操作。 [00 19 ]所述CPU被配置为估计GPU和存储器之间的频带、GPU的计算功率、GPU的最大功耗、 根据GHJ的动态电压频率调节(DVFS)确定的电压和频率、以及GPU的温度中的至少一个;以 及基于估计结果发送与存储模型的存储器的存储区域对应的地址之中的第一地址到GPU。 GHJ被配置为使用第一地址从存储区域中的第一存储区域中读取第一模型。
[0020] 所述GPU被配置为以对象、图元(primitive)、块(patch)、边、顶点、或控制点为单 元计算第一模型的复杂度。
[0021] 所述GPU被配置为当第一模型的复杂度小于参考复杂度时,对第一模型执行细分 操作。
[0022] 可替代地,所述CPU被配置为发送与存储模型的存储器的存储区域相应的地址到 GPU。所述GPU被配置为估计GPU和存储器之间的频带、GPU的计算功率、GPU的最大功耗、根据 GPU的动态电压频率调节(DVFS)确定的电压和频率、以及GPU的温度中的至少一个;基于估 计结果选择地址中的第一地址;以及使用第一地址从存储区域中的第一存储区域读取第一 模型。GPU被配置为当第一模型的复杂度小于参考复杂度时,对第一模型执行细分操作。
[0023] 根据本发明构思的进一步的实施例,提供了一种应用处理器,包括包括了细分级 的GPU、CPU、以及由CPU控制的存储器控制器。所述GPU被配置为通过存储器控制器从存储准 备好的具有不同复杂度的模型的存储器中读取第一模型;计算第一模型的复杂度;将参考 复杂度和所计算的复杂度进行比较;以及按照CPU的控制根据比较结果确定是否要对第一 模型执行细分。
[0024]所述CPU被配置为估计GPU和存储器之间的频带、GPU的计算功率、GPU的最大功耗、 根据GHJ的动态电压频率调节(DVFS)确定的电压和频率、以及GPU的温度中的至少一个;并 可以基于估计结果发送与存储模型的存储器的存储区域对应的地址之中的第一地址到 GPU。所述GPU被配置为使用第一地址从存储区域中的第一存储区域中读取第一模型。
[0025]可替代地,所述CPU被配置为发送与存储模型的存储器的存储区域对应的一个或 多个地址到GPU。所述GPU被配置为估计GPU和存储器之间的频带、GPU的计算功率、GPU的最 大功耗、依赖于动态电压频率调节(DVFS)确定的GPU的电压和频率、以及GPU的温度中的至 少一个;基于估计结果选择地址中的第一地址;以及使用第一地址从存储区域中的第一存 储区域读取第一模型。
[0026]根据本发明构思的进一步的实施例,提供了一种图形处理单元(GPU)系统,包括: 被配置为存储多个准备好的具有不同复杂度的模型的存储器;以及被配置为从存储器读取 多个准备好的模型的模型、计算模型的复杂度、将参考复杂度和所计算的复杂度进行比较、 并确定是否要响应于比较对模型执行细分操作的图形处理器。
[0027]所述GPU系统被配置为还包括中央处理单元(CPU),其被配置为选择包括在存储多 个准备好的模型的存储器中的存储区域的地址,并发送所选择的地址到图形处理器,其使 用该地址从存储器读取模型。
[0028] 所述图形处理器被配置为包括命令解码器,其被配置为根据由CPU或从存储器接 收到的命令来控制GPU系统。
[0029] 所述图形处理器可以包括存取电路,其被配置为使用所选择的地址,从存储区域 读取模型,使用模型的几何信息计算模型的复杂度,将参考复杂度和所计算的复杂度进行 比较,并响应于该比较确定是否对模型执行细分操作。
[0030] 所述图形处理器可以包括用于执行光栅操作的一个或多个处理单元。
【附图说明】
[0031] 本发明构思的上述的和其它的特征和优点将通过参照附图详细描述其示例性实 施例变得更加明显,其中:
[0032]图1是根据本发明构思的一些实施例的计算装置的框图;
[0033]图2是图1中示出的中央处理单元(CPU)和图形处理单元(GPU)的框图;
[0034] 图3是根据本发明构思的一些实施例用于说明图1中所示的GPU的图形管线的概念 图;
[0035] 图4是图1所示的第一存储器的结构图;
[0036]图5是具有不同复杂度的模型的概念图;
[0037] 图6是根据本发明构思的一些实施例的、计算所选择的模型的复杂度的方法的图;
[0038] 图7是根据本发明构思的其它实施例的、计算所选择的模型的复杂度的方法的图; [0039]图8A至图8D是具有不同复杂度的模型的概念图;
[0040]图9A和图9B是示出对具有不同复杂度的模型执行细分操作的结果;
[0041]图10是图1中示出的计算装置的操作的流程图;
[0042]图11是根据本发明构思的一些实施例的、从具有不同复杂度的模型中选择模型的 方法的图;
[0043]图12是根据本发明构思的其它实施例的、从具有不同复杂度的模型之中选择模型 的方法的图;以及
[0044] 图13是根据本发明构思的一些实施例的包括图形卡的计算装置的框图。
【具体实施方式】
[0045] 现在将参考示出了本发明的实施例的附图,在下文更全面地描述本发明的构思。 但是本发明可以体现为许多不同形式,而不应被解释为限于在此阐述的实施例。而是,提供 这些实施例使得本公开将是彻底的和完整的,并且将充分地向本领域技术人员传达本发明 的范围。在附图中,为清楚可以放大层和区域的尺寸和相对尺寸。相同的数字指代相似的元 件。
[0046]应该理解的是,当元件被称为"连接"或"耦合"到另一元件时,它可以直接连接或 耦合到另一元件或者可以存在中间元件。相反地,当元件被称为"直接连接"或"直接耦合" 到另一元件时,不存在中间元件。如本文所使用的,术语"和/或"包括一个或多个相关所列 的项目的任意和所有组合,并且可以缩写为7"。
[0047] 应该理解的是,尽管术语第一、第二等在这里可以用于描述各种元件,但是这些元 件不应该受这些术语的限制。这些术语仅用于彼此区分元件。例如,第一信号可被称为第二 信
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1