GTX 275

Admin in 百科 2024-04-14 12:50:00

  GTX 275
  综述
  同时公版gtx275的核心/shader/和显存频率分别为633/1404/2268MHz,显卡显存容量为896MB,显存位宽为448bit,在供电接口方面采用双6pin接口设计。
  公版GTX275参数
  制造工艺55 nm
  核心频率633 MHz
  流处理器频率1404 MHz
  显存频率1134 MHz / 2268 MHz
  显存容量896 MB
  显存接口448-bit
  显存带宽127 GB/s
  流处理器数目240
  光栅单元28
  纹理单元80
  纹理渲染带宽50.6 GigaTexels/sec
  接口2 x Dual-Link DVI-I
  插槽Dual Slot
  电源接口2 x 6-pin
  TDP功耗219 watts
  GPU温度极限105° C
  参数解说
  关于GTX275的具体规格,从架构来看,GTX260拥有216个流处理器,即9组TPC(Texture Processing Cluster),而GTX275则拥有与gtx285一样同为240个SP,显然为了保证GTX275在性能上的较大优势。当然,除了保证原有240流处理器数来提升性能外,提高显卡运行频率也是行之有效的方法。我们可看做GTX275是GTX260的高频版本,GTX275的核心频率达到633MHz,显存频率1134MHz(即2268MHz),总体性能上会比GTX260有大幅度升幅。但值得一提的是,NVIDIA将不会推出公版的GTX275显卡,而是会把设计的权限交给各AIC厂商,届时各厂商将会自行设计合适的方案来打造这款GTX275。并且,公版的GeForce GTX275将继续延用GTX260的P897 PCB设计方案,制作成本比较低,有利于市场竞争。因此GTX275继续采用了这一设计方案,毕竟在显存位宽上与GTX260一样,基本上不需要改动什么就可以直接使用原来的PCB了。
  在GTX275显卡上下毗邻的两款产品上,GTX275似乎更像是将两者结合起来的产物,它拥有GTX285的240个流处理器数量,同时也拥有了GTX260+的448bit显存位宽,这样做即区分开了三者之间的性能差距,保证不会出现超频后达到某款产品的性能,同时也更加合理的控制了显卡的整体成本。当然,NVIDIA自然也为GTX275显卡使用了55nm工艺,这一点与GTX285、GTX260+相同。
  完整240个流处理器 核心架构回顾
  因为NVIDIA目前的产品线横跨两代架构,所以我们有必要回顾一下GTX200系列产品的核心架构,也就是G200图形核心的架构。从DirectX10发布统一架构以来,NVIDIA一共推出过三代产品。最早的当属G80,也就是第一代统一架构核心,随后的G92主要是工艺上的改变,在架构上基本延续了G80的设计。而G200图形核心才是DirectX10后NVIDIA推出的第二代统一架构的新核心。
  读者可能都有印象,在DX10发布时提出了一个全新概念,将Pixel Shader与Vertex Shader单元统一起来不再做区分,也就是说一个Shader单元既能够处理Pixel运算也能够处理Vertex运算,此外,在统一架构当中还加入了Geometry Shader单元这个概念,同样规Shader统一分配。在G200的第二代统一架构当中依然遵循着这样的原则,只是NVIDIA再次强化了这个架构。
  GTX275保留了GTX285上拥有的240个流处理器和40个纹理单元,这240个流处理器以及40个纹理单元被平均得分为了10个阵列,每个阵列当中包含24个流处理器(被划分为3组)以及8个纹理单元,共享L1缓存。NVIDIA在大幅度增强浮点运算能力的同时,也不忘继续对纹理填充率的增加,相比较GTX285和GTX280,因为前者频率更高,所以纹理填充率的数字也更高,达到了518亿次/秒,而GTX280的数字为482亿次/秒。
  GTX275的设计模式可以进行整数运算以及浮点运算,存储操作,和逻辑算符,每一个流处理器都是一个多线程硬件处理器,这样的处理器将内建级流水线,每一条线程可以执行一条指令。GTX275的渲染流程包括顶点shaders、像素shaders、几何shaders以及compute shaders,对于显卡的流处理器,为了获得更多的效能,线程在执行一个shader程序时,其他很多相应的线程经常也会同时执行相同的shader程序。
  此外NVIDIA的统一架构可以采用两种不同的处理模式。对于TPC的执行,架构是MIMD(多重指令,多重数据)模式;而对于SM执行,架构就成了SIMT(单一指令,多重线程)模式。SIMT对SIMD(单一指令,多重数据)从性能和每一条可编程序两方面加以改进。作为标量,SIMT并没有设置矢量宽度,所以可以全速执行运算,而不用估计矢量大小。正好相反,如果输入数据小于MIMD或者SIMD 的宽度的话,SIMD会以低速运算。SIMT可以确保处理器核心一直处于完全被利用状态。
  从编程人员的角度看,SIMT模式允许每一条线程占据各自的路径。由于分支过程由硬件操控,所以没有必要在矢量宽度中管理分支。两种模式分别对应两种运算类型,TPC模式更适合3D渲染,也就是3D游戏需求;而SM模式则是大规模并行计算适合的模式,也就是基于CUDA技术的各种GPU加速运算,比如视频编码、比如图形处理、比如科学计算等等。

免责声明:本站文字信息和图片素材来源于互联网,仅用于学习参考,如内容侵权与违规,请联系我们进行删除,我们将在三个工作日内处理。联系邮箱:chuangshanghai#qq.com(把#换成@)

-- End --