一种利用dvi接口发送图形处理器通用计算数据的装置的制作方法

文档序号:2651409阅读:184来源:国知局
专利名称:一种利用dvi接口发送图形处理器通用计算数据的装置的制作方法
技术领域
本实用新型涉及数据传输领域,特别是关于利用DVI接口发送图形处理器通用计 算数据的装置。
背景技术
随着现代图形处理器(GPU Graphic Processing Unit)可编程能力及性能的提 高,GPU已经可以集成有数百个简单计算引擎——着色器,这些着色器使GPU不仅可以用作 绘制引擎,而且可以作为个人电脑的计算引擎,即利用GPU执行通用并行计算。已有的用于 支持GPU进行通用并行计算的应用程序接口有CUDA、0penCL和DirectCompute。在这些应 用程序接口的支持下,GPU可以实现通用并行计算,并且未来计算机的计算模型将向异构计 算模型发展,即同时使用CPU和GPU对应用程序进行处理应用程序的顺序部分在CPU上运 行,计算密集型部分在GPU上运行。使用GPU进行计算会比使用CPU计算快2至10倍,用 户将明显感受到程序运行速度的加快,并且降低系统的能耗。当GPU用于通用并行计算中时,需要将GPU处理后的数据传送给工业设备或仪器 以用于控制或进行进一步的处理。目前传输处理后的结果数据的方法是如图1所示,首先 GPU从显存中读取原始数据并对原始数据进行计算,然后GPU将计算结果数据存入显存中, CPU再将显存中的计算记过数据拷贝至系统的主存,系统主存通过PCI-E总线将结果数据 发送给外围设备。这种数据传输方式的缺陷在于由于系统以主存作为中转将结果数据传送给外 围设备,因此当计算结果的数据量非常大时,将导致传输延迟,且浪费计算机的内存资源和 CPU资源;此外,由于常用的PCI-E总线的带宽有限,因此无法满足一些具有较大带宽的应 用设备的需求(例如视频流处理应用、数字调制、软件无线电、雷达系统、计算机断层扫描 和超声波成像等),同时,由于PCI-E总线的延迟不固定,使显存中数据的输入和输出不能 同步,直接影响GPU对通用并行计算的处理速度。因此有必要对现有的GPU计算结果数据的传输方式进行改进,使输入原始数据与 输出结果数据之间的延迟减小,并节省计算机的存储空间,使数据传输的效率得到提高。
发明内容在发明内容部分中引入了一系列简化形式的概念,这将在具体实施方式
部分中进 一步详细说明。本实用新型的发明内容部分并不意味着要试图限定出所要求保护的技术方 案的关键特征和必要技术特征,更不意味着试图确定所要求保护的技术方案的保护范围。本发明提供了一种利用DVI接口发送图形处理器通用计算数据的装置,其特征在 于包括图形卡,所述图形卡包括纹理建立模块,建立一个纹理,并保存与所述纹理对应 的纹理指针;内核程序计算模块,对原始数据进行计算得到结果数据;纹理绑定模块,接收 从所述内核程序计算模块发送的结果数据,以及从所述纹理建立模块发送的所述纹理指针,将所述结果数据与所述纹理指针绑定;DVI接口,接收从所述纹理绑定模块发送的绑定 后的所述结果数据;垂直同步信号监测模块,接收从所述DVI接口发送的所述绑定后的结 果数据,并发送启动信号到所述内核程序计算模块;所述装置还包括,虚拟显示器模块,将所述DVI接口发送所述绑定后的结果数据 进行数据格式转换。根据本发明的一个方面,其特征在于,所述虚拟显示器模块包括数据格式转换模 块,将所述绑定后的结果数据转换为并行的适合外围设备接口格式的数据后发送到外围设 备。 根据本发明的一个方面,其特征在于,所述虚拟显示器模块还包括扩展显示标识 数据只读存储器,所述扩展显示标识数据只读存储器发送图像的分辨率和刷新率的数值到 所述图形卡。根据本发明的一个方面,其特征在于,所述数据格式转换模块采用可编程逻辑门 阵列实现。根据本发明的一个方面,其特征在于,所述虚拟显示器模块采用可编程逻辑门阵 列实现,所述可编程逻辑门阵列存储图像的分辨率和刷新率。根据本发明的一个方面,其特征在于,所述能够将数据转换为并行格式的芯片为 SiI163B 芯片。根据本发明的一个方面,其特征在于,所述垂直同步信号监测模块对所述绑定后 的结果数据进行垂直同步信号监测,若监测到所述垂直同步信号,则发送启动信号到所述 内核程序计算模块。根据本发明的一个方面,其特征在于,可以根据分辨率的增加而增加开启所述DVI 接口的数目,并将所述数据格式转换模块设计为连接全部DVI接口。根据本发明的一个方面,其特征在于,所述扩展显示标识数据只读存储器与所述 数据格式转换模块彼此独立设置。本实用新型利用图形卡上的DVI接口发送GPU计算结果数据,然后将结果数据转 换为适合外围设备接口格式的数据,因此无须通过系统主存作为中转,提高了 GPU通用计 算运行速度,同时节省了计算机的内存资源。此外,利用DVI接口发送数据的带宽较宽,可 以满足大带宽外围设备的需求。

本实用新型的下列附图在此作为本实用新型的一部分用于理解本实用新型。附图 中示出了本实用新型的实施例及其描述,用来解释本实用新型的原理。在附图中,图1是现有技术中的图形处理器计算结果数据输出原理示意图;图2是本实用新型的结构示意图。
具体实施方式
在下文的描述中,给出了大量具体的细节以便提供对本发明更为彻底的理解。然 而,对于本领域技术人员来说显而易见的是,本实用新型可以无需一个或多个这些细节而 得以实施。在其他的例子中,为了避免与本实用新型发生混淆,对于本领域公知的一些技术特征未进行描述。显然,本实用新型的施行并不限定于本领域的技术人员所熟习的特殊细节。本实 用新型的较佳实施例详细描述如下,然而除了这些详细描述外,本实用新型还可以具有其 他实施方式。本实用新型以带有DVI (Digital Visual Interface数字视频接口)接口的图形 卡为平台来实现。所述图形卡意指基本上包含GPU、显示缓存(简称显存)、BIOS (Basic Input Output System基本输入输出系统)、数字模拟转换器(RAMDAC Random Access Memory Digital-to-Analog Converter)、图形卡的接口以及电容、电阻等的计算机配件。如图2所示,根据本实用新型的发送图形处理器通用计算数据的装置包括图形卡 201和虚拟显示器模块202。其中图形卡201包括一纹理建立模块201a、一纹理绑定模块 201b、一垂直同步信号监测模块201c、一DVI接口 201d和一内核程序计算模块201e。其中, 纹理建立模块201a的输出端分别连接纹理绑定模块201b的输入端和显存201f,纹理建立 模块201a在显存201f中建立一个纹理,并将纹理指针信号传送给纹理绑定模块201b。内 核程序计算模块201e的输入端连接显存201f的输出端,内核程序计算模块201e读取所述 显存201f中的原始数据。内核程序计算模块201e的输出端连接纹理绑定模块201b的输 入端,将内核程序计算模块201e计算得到的结果数据传送给纹理绑定模块201b。纹理绑 定模块201b的输出端连接DVI接口 201d的输入端,纹理绑定模块201b将绑定后的结果数 据传送给DVI接口 201d。DVI接口 201d的输出端连接垂直同步信号监测模块201c的输入 端,将绑定后的结果数据从DVI接口 201d传送给垂直同步信号监测模块201c。垂直同步信 号监测模块201c的输出端连接内核程序计算模块201e的输入端,将启动信号发送给内核 程序计算模块201e。图形卡201的作用是将结果数据与纹理绑定。“纹理”是一种存储表 面材料颜色的位图,最终绘制的场景可以显示在输出设备上。再将绑定后的结果数据以纹 理的形式通过DVI接口 201d传送出图形卡201。虚拟显示器模块202包括一数据格式转换模块202a和一 EDID ROM (Extended Display Identification Data Read Only Memory 扩展显示标识数据只读存储器)202b。 数据格式转换模块202a和EDID R0M202b彼此独立设置。DVI接口 201d连接数据格式转换 模块202a的输入端,结果数据通过DVI接口 201d发送到数据格式转换模块202a,数据格式 转换模块202a的输出端连接外围设备203的输入端,将转换格式后的结果数据信号传送给 外围设备203。虚拟显示器模块202的作用是作为虚拟“显示器”,因为DVI接口 201d是传输显示 信号的接口,因此只有当接收装置为显示设备时,DVI接口 201d才能够将数据传送给接收 装置,即虚拟显示器模块202。然后再将接收到的结果数据的数据格式转换为适合外部设 备203接口格式。本实用新型在使用前,须将虚拟“显示器”的分辨率和刷新率存入EDID R0M202b中,然后GPU读取一次EDID R0M202b中的数据,图形卡201即认为虚拟显示器模块 202是一个“显示器”。本实用新型的工作原理为(1)纹理建立模块 201a 禾Ij 用 OpenGL (Open Graphics Library)或 Direct3D (Direct 3D是基于微软的通用对象模式(COM Common ObjectMode)的3D图形应 用编程接口)在显存201f中建立一个纹理,纹理的尺寸小于或等于输出分辨率(即纹理的 大小为可容纳一帧数据),然后将纹理指针传送给纹理绑定模块201b ;[0029](2)内核程序计算模块201e对从显存201f中读取的原始数据进行计算,并将计算 得到的结果数据传送给纹理绑定模块201b ;(3)纹理绑定模块201b将结果数据放在纹理指针所指向的纹理中,并将与纹理绑 定后的结果数据传送给DVI接口 201d ;(4)DVI接口 201d将结果数据发送到数据格式转换模块202a,垂直同步信号判断 模块201c判断从DVI接口 201d发出的结果数据是否包含垂直同步信号(VSYNC Vertical Synchronization),若包含,则发送启动信号到内核程序计算模块201e,然后重复执行 (2),若不包含,则继续对DVI接口 201d中的结果数据进行监测;(5)数据格式转换模块202a将结果数据转换为并行格式,再将并行格式的结果数 据转换为适合外围设备203接口的数据格式,最后将结果数据通过外围设备203的局部总 线传送给外围设备203。上述虚拟显示器模块202可采用FPGA (Field Programmable Gate Array可编程 逻辑门阵列)实现,即在一块FPGA上集成EDID ROM 202b和数据格式转换模块202a,数据 格式转换模块202a将结果数据转换为并行的外围设备接口格式。虚拟显示器模块202还 可以采用能够将数据转换为并行格式的芯片(例如SiI163B芯片)和FPGA的结合来实现。 其中,可以将数据转换为并行格式的芯片用于将结果数据转换为并行格式,FPGA用于将并 行格式的结果数据转换为适合外围设备203接口的数据格式。此时,EDID ROM 202b独立于 FPGA设置;或者FPGA内存储“显示器”的分辨率和刷新率的数值,从而无须设置EDID ROM 202b。上述实施例中,DVI接口 201d为单链结的DVI接口 (Single-link DVI)。事实上, 可随着分辨率的增加而开启多个上述DVI接口 201d,如开启双链结DVI (Dual-link DVI)接 口或者两个双链结DVI (Two Dual-link DVI)接口,相应地,可以将数据格式转换模块202a 设计为连接多个DVI接口 201d。本实用新型利用垂直同步信号监测模块201c对DVI接口 201d中的结果数据所包 含的VSYNC信号进行实时监测,每监测到一个VSYNC信号,则说明DVI接口 201d发送完一 帧结果数据,这样做的目的在于由于内核程序计算模块201e的计算速度远远快于DVI接 口 201d发送数据的速度,这将导致上一帧结果数据未发送完,下一帧的计算结果数据将会 覆盖显存(即纹理)中的上一帧结果数据。为了避免结果数据的丢失,在监测到一个VSYNC 信号后再启动内核程序计算模块201e进行下一帧的计算,这样就可以避免结果数据的丢 失。本实用新型实现了利用图形卡上的DVI接口 201d发送GPU通用计算结果数据,无 须通过系统的主存作为中转,节约了计算机的存储空间,同时减小了 GPU的通用计算过程 的延迟。此外,利用DVI接口 201d发送数据的带宽较宽,可以满足大带宽外围设备的需求。本实用新型已经通过上述实施例进行了说明,但应当理解的是,上述实施例只是 用于举例和说明的目的,而非意在将本实用新型限制于所描述的实施例范围内。此外本领 域技术人员可以理解的是,本实用新型并不局限于上述实施例,根据本实用新型的教导还 可以做出更多种的变型和修改,这些变型和修改均落在本实用新型所要求保护的范围以 内。本实用新型的保护范围由附属的权利要求书及其等效范围所界定。
权利要求一种利用DVI接口发送图形处理器通用计算数据的装置,其特征在于包括 图形卡,所述图形卡包括 纹理建立模块,建立一个纹理,并保存与所述纹理对应的纹理指针; 内核程序计算模块,对原始数据进行计算得到结果数据; 纹理绑定模块,接收从所述内核程序计算模块发送的结果数据,以及从所述纹理建立模块发送的所述纹理指针,将所述结果数据与所述纹理指针绑定; DVI接口,接收从所述纹理绑定模块发送的绑定后的所述结果数据; 垂直同步信号监测模块,接收从所述DVI接口发送的所述绑定后的结果数据,并发送启动信号到所述内核程序计算模块;所述装置还包括, 虚拟显示器模块,将所述DVI接口发送所述绑定后的结果数据进行数据格式转换。
2.如权利要求1所述的一种利用DVI接口发送图形处理器通用计算数据的装置,其特 征在于,所述虚拟显示器模块包括_数据格式转换模块,将所述绑定后的结果数据转换为并行的适合外围设备接口格式 的数据后发送到外围设备。
3.如权利要求1所述的一种利用DVI接口发送图形处理器通用计算数据的装置,其特 征在于所述虚拟显示器模块还包括扩展显示标识数据只读存储器,所述扩展显示标识数 据只读存储器发送图像的分辨率和刷新率的数值到所述图形卡。
4.如权利要求2所述的一种利用DVI接口发送图形处理器通用计算数据的装置,其特 征在于所述数据格式转换模块采用可编程逻辑门阵列实现。
5.如权利要求2所述的一种利用DVI接口发送图形处理器通用计算数据的装置,其特 征在于所述数据格式转换模块采用能够将数据转换为并行格式的芯片和可编程逻辑门阵 列实现。
6.如权利要求1所述的一种利用DVI接口发送图形处理器通用计算数据的装置,其特 征在于所述虚拟显示器模块采用可编程逻辑门阵列实现,所述可编程逻辑门阵列存储图 像的分辨率和刷新率。
7.如权利要求5所述的一种利用DVI接口发送图形处理器通用计算数据的装置,其特 征在于所述能够将数据转换为并行格式的芯片为SiI163B芯片。
8.如权利要求1所述的一种利用DVI接口发送图形处理器通用计算数据的装置,其 特征在于所述垂直同步信号监测模块用于对所述绑定后的结果数据进行垂直同步信号监 测,若监测到所述垂直同步信号,则发送启动信号到所述内核程序计算模块。
9.如权利要求2所述的一种利用DVI接口发送图形处理器通用计算数据的装置,其特 征在于可以根据分辨率的增加而增加开启所述DVI接口的数目,并将所述数据格式转换 模块设计为连接全部DVI接口。
10.如权利要求2或3所述的一种利用DVI接口发送图形处理器通用计算数据的装置, 其特征在于所述扩展显示标识数据只读存储器与所述数据格式转换模块彼此独立设置。
专利摘要本实用新型涉及一种利用DVI接口发送图形处理器通用计算数据的装置,包括一图形卡和虚拟显示器模块,图形卡包括一纹理建立模块、一纹理绑定模块、一垂直同步信号监测模块、一DVI接口和一内核程序计算模块;内核程序计算模块计算原始数据,纹理绑定模块将计算结果数据与纹理绑定,通过DVI接口传输到虚拟显示器模块,利用垂直同步信号监测模块对结果数据所包含的VSYNC信号进行监测,每监测到一个VSYNC信号,则启动内核程序计算模块进行下一帧的计算。虚拟显示器模块将结果数据转换为并行的外围设备接口格式。本实用新型利用DVI接口发送GPU通用计算结果数据,无须通过系统的主存作为中转,节约了计算机存储空间,同时减小了GPU的通用计算过程的延迟。
文档编号G09G5/00GK201765584SQ20102015306
公开日2011年3月16日 申请日期2010年4月8日 优先权日2010年4月8日
发明者张舒, 邱俊 申请人:辉达公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1