图形处理单元和包括其的装置的制造方法_5

文档序号：9889013阅读：来源：国知局

中，根据估计（即计算或测量)结果，CPU 210分别发送与分别存储模型MOD 1到M0D5的存储区域MEM1到MEM5对应的地址ADD 1至ADD5之间的地址(例如，ADDi，其中1 < i < 5)到GPU 260。
[0136] GPU 260在操作S240中从CPU 210接收地址ADDi并使用地址ADDi从存储区域MEM1 到MEM5中的一个读取模型M0DLGPU 260使用与模型MODi相关的几何信息计算模型MODi的复杂度，并在操作S250中比较参考复杂度和所计算的复杂度。
[0137] GPU 260可以在操作S260中根据比较结果确定是否对模型MODi执行细分操作。换句话说，曲面细分器261-4在操作S260中根据比较信息INF可以或可以不对模型Modi执行细分操作。
[0138] 图12是根据本发明构思的其它实施例从具有不同复杂度的模型之中选择模型的方法的图。在图12所示的实施例中，GPU 260估计计算装置100的属性或特征。参照图1至图7 和图12,在渲染操作之前，在操作S310中，CPU 210、GPU 260或建模器生成具有不同复杂度的多个模型MODI到M0D5并在可以由GPU 260存取的第一存储器310-1中存储模型MODI到 M0D5。
[0139] CPU 210可以在操作S320中发送与存储模型MODI到M0D5的存储区域MEM1到MEM5对应的多个地址ADD1到ADD5到GPU 260ΑΡυ 260在操作S330中从CPU 210接收地址ADD1到 ADD5并估计（即，计算或测量)计算装置100的属性或特征中的至少一个。
[0140] GPU 260在操作S340中根据估计（即，计算或测量）的结果在地址ADD1到ADD5中选择地址（例如，ADDj，其中1 < j < 5)，并在操作S350中使用所选择的地址ADDj从存储区域 MEM1到MEM5读取模型MODjAPU 260在操作S360中使用与模型MODj相关的几何信息计算模型MOD j的复杂度并比较参考复杂度和所计算的复杂度。
[0141] GPU 260可以在操作S370中根据比较结果确定是否对模型MODj执行细分操作。换句话说，曲面细分器261-4在操作S370根据比较信息INF可以或可以不对模型MODj执行细分操作。
[0142] 图13是根据本发明构思的一些实施例的包括图形卡500的计算装置100A的框图。参考图13,计算装置100A可包括CPU 210、图形卡500和显示器400。计算装置100A可以是TV (例如，数字TV或智能TV)、PC、台式计算机、膝上型计算机、计算机工作站或使用图形卡500 的计算装置。
[0143] 图形卡500包括GPU 260、接口510、图形存储器520、数字-模拟转换器(DAC)530、输出端口540和卡连接器550。接口510可以从CPU 210发送命令和/或数据到图形存储器520，或者可以发送关于图形卡500的信息到CPU 210。图形存储器520可以存储由GPU 26生成的数据，并且可以从CPU 210发送命令到GPU 260。
[0144] 结合CPU 210，GHJ 260执行参考图1至图12所描述的操作的一个或多个。在GPU 260中生成的数据发送到图形存储器520。
[0145] DAC 530将数字信号转换成模拟信号。输出端口 540从DAC 530发送模拟信号，也艮P，图像信号，到显示器400。卡连接器550插入到包括CPU 210的主板的槽。
[0146] 根据本发明构思的一些实施例，GPU判断是否对从准备好的模型中选择的模型执行细分，由此减少图形管线的开销（即，细分）。此外，在渲染操作之前，GPU在存储器中存储具有不同复杂度的模型，根据计算装置的特性，选择模型中的一个，并确定是否要对选择的模型执行细分，从而减少了图形管线（即，细分)开销。
[0147]虽然参考其示例实施例已具体示出并描述了本发明构思，但是本领域的普通技术人员应理解，可以做出形式和细节上的各种变化，而不脱离如以下权利要求所限定的本发明构思的精神和范围。
【主权项】
1. 一种图形处理单元(GPU)，用于根据中央处理单元(CPU)的控制，确定是否对多个准备好的模型之中的第一模型执行细分操作，该GHJ包括：存取电路，被配置为从存储器中读取第一模型，存储器中存储多个准备好的具有不同复杂度的模型，计算所述第一模型的复杂度，将参考复杂度和所计算的复杂度进行比较，并根据比较结果确定是否对第一模型执行细分操作。2. 如权利要求1所述的GPU，其中所述GPU被配置为接收由CPU从与存储模型的存储器的存储区域对应的地址中选择的第一地址，使用第一地址从存储区域中的第一存储区域读取第一模型，使用第一模型的几何信息计算第一模型的复杂度，并根据将参考复杂度和所计算的复杂度进行比较的结果确定是否对第一模型执行细分操作。3. 如权利要求2所述的GPU，其中所述GPU被配置为以对象、图元、块、边、顶点和控制点中的一个为单位计算第一模型的复杂度。4. 如权利要求3所述的GPU，其中所述GPU被配置为基于包括在图元中的顶点的深度值或由顶点限定的曲率计算所述第一模型的复杂度。5. 如权利要求3所述的GPU，其中所述GPU被配置为基于包括在块中的控制点的深度值或由控制点所限定的曲率计算第一模型的复杂度。6. 如权利要求1所述的GPU，其中所述GPU被配置为从CPU接收与存储模型的存储器中的存储区域对应的一个或多个地址，估计GPU和存储器之间的带宽、GPU的计算功率、GPU的最大功耗、根据GPU的动态电压频率调节(DVFS)确定的电压和频率、以及GPU的温度中的至少一个，基于估计结果从地址中选择第一地址，使用所选第一地址从存储区域之中的第一存储区域中读取第一模型，使用第一模型的几何信息计算第一模型的复杂度，并根据将参考复杂度和所计算的复杂度进行比较的结果，确定是否对第一模型执行细分操作。7. -种片上系统(SoC)，包括：图形处理单元(GRJ)，其包括多个细分级；中央处理单元(CPU); 由GRJ存取的存储器；以及由CRJ控制的存储器控制器，其中，所述GPU被配置为根据CPU的控制，通过存储器控制器，从存储器读取第一模型，所述存储器中存储多个准备好的具有不同复杂度的模型，计算所述第一模型的复杂度，将参考复杂度和所计算的复杂度进行比较，并根据比较结果确定是否对所述第一模型执行细分。8. 如权利要求7所述的SoC，其中所述CPU被配置为估计GPU和存储器之间的频带、GPU的计算功率、GPU的最大功耗、根据GPU的动态电压频率调节(DVFS)确定的电压和频率、以及 GPU的温度中的至少一个;并基于估计结果发送与存储模型的存储器的存储区域对应的地址之中的第一地址到GPU，并且所述GPU被配置为使用第一地址从存储区域中的第一存储区域中读取第一模型。9. 如权利要求8所述的SoC，其中所述GPU被配置为使用包括在第一模型中的每一个块的控制点的几何信息计算复杂度。10. 如权利要求9所述的SoC，其中，所述几何信息是控制点的深度值或由控制点所限定的曲率。11. 如权利要求7所述的SOC，其中在渲染操作之前存储所述模型的存储器在SoC外部实现。12. 如权利要求7所述的SoC，其中所述CPU被配置为发送与存储模型的存储器的存储区域对应的一个或多个地址到GPU，以及所述GPU被配置为估计GPU和存储器之间的频带、GPU的计算功率、GPU的最大功耗、根据 GPU的动态电压频率调节(DVFS)确定的电压和频率、以及GPU的温度中的至少一个，基于估计结果选择地址中的第一地址，以及使用第一地址从存储区域中的第一存储区域读取第一模型。13. 如权利要求12所述的SoC，其中所述GHJ被配置为使用包括在第一模型中的每一个块的每一个控制点的深度值或由控制点所限定的曲率计算第一模型的复杂度。14. 如权利要求13所述的方法，其中所述SoC被配置为当第一模型的复杂度小于参考复杂度时，对第一模型执行细分操作。15. 如权利要求7所述的SoC，其中所述细分级包括：外壳着色器；曲面细分器；以及域着色器，其中，所述计算和比较由所述外壳着色器执行，所述确定由所述曲面细分器执行，以及其中所述曲面细分器被配置为基于确定的结果传递第一模型到域着色器或使用由曲面细分器发送的细分因子对第一模型执行细分。16. -种计算装置，包括：被配置为存储多个准备好的具有不同复杂度的模型的存储器；显示器；以及被配置为控制所述存储器和所述显示器的片上系统(SoC)，其中SoC包括：图形处理单元(GRJ)，其包括细分级；中央处理单元(CPU); 被配置为根据CPU的控制来控制显示器的显示控制器；以及被配置为根据CHJ的控制来控制存储器的存储器控制器，其中，所述GPU被配置为通过存储器控制器从存储模型的存储器读取第一模型，计算第一模型的复杂度，将所计算的复杂度和参考复杂度进行比较，并根据CPU的控制根据比较结果确定是否要对第一模型执行细分操作。17. 如权利要求16所述的计算装置，其中所述CPU被配置为估计GHJ和存储器之间的频带、GPU的计算功率、GPU的最大功耗、根据GPU的动态电压频率调节(DVFS)确定的电压和频率、以及GPU的温度中的至少一个，并基于估计结果发送与存储模型的存储器的存储区域对应的地址之中的第一地址到GPU，并且所述GPU被配置为使用第一地址从存储区域中的第一存储区域中读取第一模型。18. 如权利要求17所述的计算装置，其中所述GPU被配置为以对象、图元、块、边、顶点、或控制点中的一个为单元计算第一模型的复杂度。19. 如权利要求17所述的计算装置，其中所述GPU被配置为当第一模型的复杂度小于参考复杂度时，对第一模型执行细分操作。20. 如权利要求16所述的计算装置，其中所述CPU被配置为发送与存储模型的存储器的存储区域对应的地址到GPU，以及所述GPU被配置为估计GPU和存储器之间的频带、GPU的计算功率、GPU的最大功耗、根据 GPU的动态电压频率调节(DVFS)确定的电压和频率、以及GPU的温度中的至少一个，基于估计结果选择地址中的第一地址，以及使用第一地址从存储区域中的第一存储区域读取第一模型。21. -种图形处理单元(GRJ)系统，包括：存储器，被配置为存储多个准备好的具有不同复杂度的模型；图形处理器，被配置为从存储器读取多个准备好的模型的模型、计算模型的复杂度、将参考复杂度和所计算的复杂度进行比较、并确定是否要响应于比较对模型执行细分操作。22. 如权利要求21所述的GPU系统，还包括中央处理单元(CPU)，其被配置为选择包括在存储所述多个准备好的模型的存储器中的存储区域的地址，以及发送所选择的地址到图形处理器，以从存储器读取模型。23. 如权利要求22所述的GPU系统，其中，所述图形处理器包括，根据从CHJ或从存储器接收到的命令控制所述GHJ系统的命令解码器。24. 如权利要求22所述的GHJ系统，其中所述图形处理器包括存取电路，其被配置为使用所选择的地址，从存储区域读取模型，使用模型的几何信息计算模型的复杂度，将参考复杂度和所计算的复杂度进行比较，并响应于比较结果确定是否对模型执行细分操作。25. 如权利要求22所述的GPU系统，其中所述图形处理器包括用于执行光栅操作的一个或多个处理单元。
【专利摘要】提供了用于根据中央处理单元(CPU)的控制确定是否对第一模型执行细分的图形处理单元(GPU)。GPU从存储准备好的具有不同复杂度的模型的存储器中读取第一模型；计算第一模型的复杂度；将所计算的复杂度与参考复杂度进行比较；并根据比较结果确定是否对第一模型执行细分操作。
【IPC分类】G06T1/20, G06T19/20
【公开号】CN105654418
【申请号】
【发明人】金锡勋, 刘昌孝
【申请人】三星电子株式会社
【公开日】2016年6月8日
【申请日】2015年11月26日

完整全部详细技术资料下载

当前第5页1 2 3 4 5