电脑硬件基础篇gpu(gpu工作原理及作用 特性参数及型号和位置)
图形处理器(英语:GraphicsProcessingUnit,缩写:GPU),又称显示核心、视觉处理器、显示芯片,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上图像运算工作的微处理器。将计算机系统所需要的显示信息进行转换驱动,并向显示器提供行扫描信号,控制显示器的正确显示,是连接显示器和个人电脑主板的重要元件,也是“人机对话”的重要设备之一。显卡作为电脑主机里的一个重要组成部分,承担输出显示图形的任务。
图1显卡与GPU
GPU工作原理
GPU就是能够从硬件上支持T&L(TransformandLighTIng,多边形转换和光源处理)的显示芯片,由于T&L是3D渲染中的一个重要部分,其作用是计算多边形的3D位置与处理动态光线效果,也能称为“几何处理”。一个好的T&L单元,能提供细致的3D物体和高级的光线特效;只不过大多数PC中,T&L的大部分运算是交由CPU处理的(这就也就是所谓软件T&L),因为CPU的任务繁多,除了T&L之外,还要做内存管理和输入响应等非3D图形处理工作,所以在实际运算的时候性能会大打折扣,一般出现显卡等待CPU数据的情况,CPU运算速度远跟不上时下复杂三维游戏的要求。即使CPU的工作频率超出1GHz或更高,对它的帮助也不大,因为这是PC本身设计造成的问题,与CPU的速度无太大关系。
GPU基本功能
1.检测显卡GPU型号、步进、制造工艺、核心面积,晶体管数量及生产厂商。
2.检测光栅和着色器处理单元数量及DirectX支持版本。
3.检测GPU核心、着色器和显存运行频率,显存类型、大小及带宽。
4.检测像素填充率和材质填充率速度。
5.实时检测GPU温度、GPU使用率、显存使用率及风扇转速等相关信息。
计算公式
GPU-Z中像素填充率、纹理填充率、显存带宽的计算公式:
(1)像素填充率是指显卡在每个单位时间内所能渲染的像素数量,单位是GPixel/s(每秒十亿像素)
像素填充率(PixelFillrate)=核心频率(GPUClock)&TImes;光栅单元数目/1000
费米框架得显卡像素填充率(PixelFillrate)=SM阵列&TImes;2&TImes;核心频率
(2)纹理填充率是指显卡在每个单位时间内所能处理的纹理贴图数量,单位是GTexel/s(每秒十亿纹理)
纹理填充率(TextureFillrate)=核心频率(GPUClock)×纹理单元数目/1000
(3)显存位宽是指显存在一个时钟周期内所能传送数据的字节数,单位是GB/s(每秒十亿字节)
显存带宽(Bandwidth)=显存位宽(BusWidth)×显存等效频率/8
以如图GeforceGTX670为例,核心频率1059MHz,显存频率1502MHz,光栅单元32个,纹理单元112个,
像素填充率(PixelFillrate)=16×2×0.608=19.456GPixel/S
纹理填充率(TextureFillrate)=608×64/1000=38.912GTexel/s
显存带宽(Bandwidth)=384×(854×4)/8=163.968GB/s
注意:计算显存带宽时要留意显存类型(MemoryType),对于GDDR1/2/3/4显存,其数据总线都是采用的DDR技术(通过差分时钟在上升沿和下降沿都进行数据传输,其一个周期传输两次数据,相当于SDRAM频率的2倍),故其显存等效频率=显存频率×2;而GDDR5则不同,它有两条数据总线,相当于Rambus的QDR技术,传输能力相当于SDRAM频率的4倍,所以显存等效频率=显存频率×4。
特性参数
CPU一般由逻辑运算单元最新cpu、控制单元和存储单元组成。在逻辑运算和控制单元中包括一些寄存器,这些寄存器用于CPU在处理数据过程中数据的暂时保存。一般在市面上购买CPU时所看到的参数一般是以(主频\前端总线\二级缓存)为格式的。例如IntelP6670的就是(2.16GHz\800MHz\2MB)。大家需要重点了解的CPU主要指标/参数有:
主频
主频,也就是CPU的时钟频率,简单地说也就是CPU的工作频率,例如我们常说的P4(奔四)1.8GHz,这个1.8GHz(1800MHz)就是CPU的主频。一般说来,一个时钟周期完成的指令数是固定的,所以主频越高,CPU的速度也就越快。主频=外频X倍频。
此外,需要说明的是AMD的AthlonXP系列处理器其主频为PR(PerformanceRating)值标称,例如AthlonXP1700+和1800+。举例来说,实际运行频率为1.53GHz的AthlonXP标称为1800+,而且在系统开机的自检画面、Windows系统的系统属性以及WCPUID等检测软件中也都是这样显示的。
外频
外频即CPU的外部时钟频率,主板及CPU标准外频主要有66MHz、100MHz、133MHz几种。此外主板可调的外频越多、越高越好,特别是对于超频者比较有用。
我们所说的外频指的是CPU与主板连接的速度,这个概念是建立在数字脉冲信号震荡速度基础之上的。
倍频
倍频则是指CPU外频与主频相差的倍数。例如AthlonXP2000+的CPU,其外频为133MHz,所以其倍频为12.5倍。
接口
接口指CPU和主板连接的接口。主要有两类,一类是卡式接口,称为SLOT,卡式接口的CPU像我们经常用的各种扩展卡,例如显卡、声卡等一样是竖立插到主板上的,当然主板上必须有对应SLOT插槽,这种接口的CPU已被淘汰。另一类是主流的针脚式接口,称为Socket,Socket接口的CPU有数百个针脚,因为针脚数目不同而称为Socket370、Socket478、Socket462、Socket423等。
缓存
缓存就是指可以进行高速数据交换的存储器,它优先于内存与CPU交换数据,因此速度极快,所以又被称为高速缓存。与处理器相关的缓存一般分为两种——L1缓存,也称内部缓存;和L2缓存,也称外部缓存。例如Pentium4“Willamette”内核产品采用了423的针脚架构,具备400MHz的前端总线,拥有256KB全速二级缓存,8KB一级追踪缓存,SSE2指令集。
内部缓存(L1Cache)
也就是我们经常说的一级高速缓存。在CPU里面内置了高速缓存可以提高CPU的运行效率,内置的L1高速缓存的容量和结构对CPU的性能影响较大,L1缓存越大,CPU工作时与存取速度较慢的L2缓存和内存间交换数据的次数越少,相对电脑的运算速度可以提高。不过高速缓冲存储器均由静态RAM组成,结构较复杂,在CPU管芯面积不能太大的情况下,L1级高速缓存的容量不可能做得太大,L1缓存的容量单位一般为KB。
外部缓存(L2Cache)
CPU外部的高速缓存,外部缓存成本昂贵,所以Pentium4Willamette核心为外部缓存256K,但同样核心的赛扬4代只有128K。
多媒体指令集
为了提高计算机在多媒体、3D图形方面的应用能力,许多处理器指令集应运而生,其中最著名的三种便是Intel的MMX、SSE/SSE2和AMD的3DNOW!指令集。理论上这些指令对流行的图像处理、浮点运算、3D运算、视频处理、音频处理等诸多多媒体应用起到全面强化的作用。
制造工艺
早期的处理器都是使用0.5微米工艺制造出来的,随着CPU频率的增加,原有的工艺已无法满足产品的要求,这样便出现了0.35微米以及0.25微米工艺。制作工艺越精细意味着单位体积内集成的电子元件越多,采用0.18微米和0.13微米制造的处理器产品是市场上的主流,例如Northwood核心P4采用了0.13微米生产工艺。而在2003年,Intel和AMD的CPU的制造工艺会达到0.09微米。
电压(Vcore)
CPU的工作电压指的也就是CPU正常工作所需的电压,与制作工艺及集成的晶体管数相关。正常工作的电压越低,功耗越低,发热减少。CPU的发展方向,也是在保证性能的基础上,不断降低正常工作所需要的电压。例如老核心AthlonXP的工作电压为1.75v,而新核心的AthlonXP其电压为1.65v。
封装形式
所谓CPU封装是CPU生产过程中的最后一道工序,封装是采用特定的材料将CPU芯片或CPU模块固化在其中以防损坏的保护措施,一般必须在封装后CPU才能交付用户使用。CPU的封装方式取决于CPU安装形式和器件集成设计,从大的分类来看通常采用Socket插座进行安装的CPU使用PGA(栅格阵列)方式封装,而采用Slotx槽安装的CPU则全部采用SEC(单边接插盒)的形式封装。还有PLGA(PlasticLandGridArray)、OLGA(OrganicLandGridArray)等封装技术。由于市场竞争日益激烈,前CPU封装技术的发展方向以节约成本为主。
单元
ALU—运算逻辑单元,这就是我们所说的“整数”单元。数学运算如加减乘除以及逻辑运算如“OR、AND、ASL、ROL”等指令都在逻辑运算单元中执行。在多数的软件程序中,这些运算占了程序代码的绝大多数。
而浮点运算单元FPU(FloatingPointUnit)主要负责浮点运算和高精度整数运算。有些FPU还具有向量运算的功能,另外一些则有专门的向量处理单元。
整数处理能力是CPU运算速度最重要的体现,但浮点运算能力是关系到CPU的多媒体、3D图形处理的一个重要指标,所以对于现代CPU而言浮点单元运算能力的强弱更能显示CPU的性能。