您的位置：首页 > 新闻 > 高新技术 > 新闻详情

全新架构来袭：Radeon HD 6970/6950详尽评测

时间：2010-12-15 19:45:36

来源：驱动之家
作者：batyeah
编辑：ChunTian

Radeon HD 6900全新内核架构之4D图形与计算

无论开发什么新产品，设计人员总要首先设定一些预期目标，然后通过技术上的努力去实现，从而满足市场和用户的需要。可以说，只有合理的目标与顺利的执行有机结合才能诞生一款优秀的产品。

在Cayman Radeon HD 6900系列身上，AMD就提出了四大目标：高效的图形与计算架构、强大的几何性能、新的画质技术、新的能效与功耗管理。下边我们就从这四个方面着手，细细品位Radeon HD 6900的内核架构与技术精髓。

为了实现高效的图形与计算架构，AMD该用了重新定义的VLIW4架构，同时还引入了双图形引擎、更多SIMD引擎与纹理单元、升级的渲染后端、更高的显存带宽、新的GPU计算技术。

VLIW全称为Very Long Instruction Word，意思是超常指令字架构，是一种非常长的指令组合，通过把许多条指令连在一起来增加运算的速度。从第一代DX10 R600内核开始，AMD就一直使用VLIW5方式，又称5D式，也就是五个流处理器编为一组，但并非所有流处理器都是相同的，其中四个较小、较简单，另一个较大、较复杂做为特殊单元。这种架构设计在硬件方面看有着很高的效率和很深的潜力，但是结构比较复杂，对应的软件编程就很困难，始终难以真正发挥全部实力。

如今AMD终于在内核层面翻新为VLIW4方式(4D式)，每个编组由四个流处理器、一个分支单元、一个通用目的寄存器组成，其中四个流处理器的整数、浮点执行功能完全相同(不再有T-Unit)，可以执行四路并行发射，但是特殊功能占据四个发射位中的三个。

AMD宣称，VLIW4架构有着更好的利用率，能将性能与核心面积比提高10％，简化调度与寄存器管理，逻辑核心也可以很好地重复使用。

除了前端，渲染器后端也进行了升级，支持写入操作合并，16位整数操作提速两倍，32位浮点操作也快了两到四倍。

GPU并行计算方面，新内核最大的亮点就是增加了一个全局异步寄存器，从而支持异步分配，可以同时执行多个计算内核，每个内核都有自己的命令队列与受保护虚拟寻址域。此外还有两个双向DMA引擎(更快的系统内存读写速度)、着色器读取操作合并、LDS(本地数据存储)直接预取、流控制改进、更快双精度操作(单精度的1/5提高到1/4)。