- 优化过的纹理单元和纹理寄存器
每个SIMD矩阵对应有一个纹理单元,RV770的纹理单元比上一代作过优化,具体细节还不太清楚,在每个纹理单元均内含8个Texture Address Unit、4个Texture Filter Unit,因此10个纹理单元一共有80个TAU和40个TFU,比起RV670的32/16个均有大幅提高,对游戏的执行效率将会有显著帮助。
RV770的纹理单元及纹理寄存器 |
另外我们发现,在RV770中,每个SIMD矩阵还对应有一个“Local Data Share”,在以往的RV670架构图中并没有发现类似功能部分。这样的话,每个SIMD矩阵内,流处理器与流处理器间能共享信息,省下了从外部缓存系统中读取信息的时间,这种设计大大加快了处理器的运算速度,同时提高了各种算法的效率,这与NVIDIA GeForce GTX200内部的TPC加入缓存的思想相类似。
- 优化过的后端渲染 (render back-ends)
RV770的后端渲染单元 (Render Back-Ends) |
参考:RV670的后端渲染单元 |
RV770的Render Back-Ends单元虽然还是4组16个,但AMD称对它也做了优化,Z/模板采样从原来的每组8个增加到每组16个,翻了一倍,这样MSAA速度也成倍提高,而且抗锯齿(AA)算法的最后处理还是交给流处理器来完成的,流处理器大幅度的增加到800个,对AA性能的提高不言而喻。
关于这一点非常值得关注,不论是NV还是ATI显卡,AA性能情况一直都是备受用户关注。