电脑硬件基础篇gpu（gpu工作原理及作用特性参数及型号和位置）

科普小知识2021-08-26 06:36:45

...

图形处理器（英语：GraphicsProcessingUnit，缩写：GPU），又称显示核心、视觉处理器、显示芯片，是一种专门在个人电脑、工作站、游戏机和一些移动设备（如平板电脑、智能手机等）上图像运算工作的微处理器。将计算机系统所需要的显示信息进行转换驱动，并向显示器提供行扫描信号，控制显示器的正确显示，是连接显示器和个人电脑主板的重要元件，也是“人机对话”的重要设备之一。显卡作为电脑主机里的一个重要组成部分，承担输出显示图形的任务。

图1显卡与GPU

GPU工作原理

GPU就是能够从硬件上支持T&L（TransformandLighTIng，多边形转换和光源处理）的显示芯片，由于T&L是3D渲染中的一个重要部分，其作用是计算多边形的3D位置与处理动态光线效果，也能称为“几何处理”。一个好的T&L单元，能提供细致的3D物体和高级的光线特效；只不过大多数PC中，T&L的大部分运算是交由CPU处理的（这就也就是所谓软件T&L），因为CPU的任务繁多，除了T&L之外，还要做内存管理和输入响应等非3D图形处理工作，所以在实际运算的时候性能会大打折扣，一般出现显卡等待CPU数据的情况，CPU运算速度远跟不上时下复杂三维游戏的要求。即使CPU的工作频率超出1GHz或更高，对它的帮助也不大，因为这是PC本身设计造成的问题，与CPU的速度无太大关系。

GPU基本功能

1.检测显卡GPU型号、步进、制造工艺、核心面积，晶体管数量及生产厂商。

2.检测光栅和着色器处理单元数量及DirectX支持版本。

3.检测GPU核心、着色器和显存运行频率，显存类型、大小及带宽。

4.检测像素填充率和材质填充率速度。

5.实时检测GPU温度、GPU使用率、显存使用率及风扇转速等相关信息。

电脑硬件基础篇gpu（gpu工作原理及作用特性参数及型号和位置）

计算公式

GPU-Z中像素填充率、纹理填充率、显存带宽的计算公式：

（1）像素填充率是指显卡在每个单位时间内所能渲染的像素数量，单位是GPixel/s（每秒十亿像素）

像素填充率（PixelFillrate）=核心频率（GPUClock）&TImes;光栅单元数目/1000

费米框架得显卡像素填充率（PixelFillrate）=SM阵列&TImes;2&TImes;核心频率

（2）纹理填充率是指显卡在每个单位时间内所能处理的纹理贴图数量，单位是GTexel/s（每秒十亿纹理）

纹理填充率（TextureFillrate）=核心频率（GPUClock）×纹理单元数目/1000

（3）显存位宽是指显存在一个时钟周期内所能传送数据的字节数，单位是GB/s（每秒十亿字节）

显存带宽（Bandwidth）=显存位宽（BusWidth）×显存等效频率/8

以如图GeforceGTX670为例，核心频率1059MHz，显存频率1502MHz，光栅单元32个，纹理单元112个，

像素填充率（PixelFillrate）=16×2×0.608=19.456GPixel/S

纹理填充率（TextureFillrate）=608×64/1000=38.912GTexel/s

显存带宽（Bandwidth）=384×（854×4）/8=163.968GB/s

注意：计算显存带宽时要留意显存类型（MemoryType），对于GDDR1/2/3/4显存，其数据总线都是采用的DDR技术（通过差分时钟在上升沿和下降沿都进行数据传输，其一个周期传输两次数据，相当于SDRAM频率的2倍），故其显存等效频率=显存频率×2；而GDDR5则不同，它有两条数据总线，相当于Rambus的QDR技术，传输能力相当于SDRAM频率的4倍，所以显存等效频率=显存频率×4。

特性参数

CPU一般由逻辑运算单元最新cpu、控制单元和存储单元组成。在逻辑运算和控制单元中包括一些寄存器，这些寄存器用于CPU在处理数据过程中数据的暂时保存。一般在市面上购买CPU时所看到的参数一般是以（主频\前端总线\二级缓存）为格式的。例如IntelP6670的就是（2.16GHz\800MHz\2MB）。大家需要重点了解的CPU主要指标/参数有：

主频

主频，也就是CPU的时钟频率，简单地说也就是CPU的工作频率，例如我们常说的P4（奔四）1.8GHz，这个1.8GHz（1800MHz）就是CPU的主频。一般说来，一个时钟周期完成的指令数是固定的，所以主频越高，CPU的速度也就越快。主频=外频X倍频。

电脑硬件基础篇gpu（gpu工作原理及作用特性参数及型号和位置）

此外，需要说明的是AMD的AthlonXP系列处理器其主频为PR（PerformanceRating）值标称，例如AthlonXP1700+和1800+。举例来说，实际运行频率为1.53GHz的AthlonXP标称为1800+，而且在系统开机的自检画面、Windows系统的系统属性以及WCPUID等检测软件中也都是这样显示的。

外频

外频即CPU的外部时钟频率，主板及CPU标准外频主要有66MHz、100MHz、133MHz几种。此外主板可调的外频越多、越高越好，特别是对于超频者比较有用。

我们所说的外频指的是CPU与主板连接的速度，这个概念是建立在数字脉冲信号震荡速度基础之上的。

倍频

倍频则是指CPU外频与主频相差的倍数。例如AthlonXP2000+的CPU，其外频为133MHz，所以其倍频为12.5倍。

接口

接口指CPU和主板连接的接口。主要有两类，一类是卡式接口，称为SLOT，卡式接口的CPU像我们经常用的各种扩展卡，例如显卡、声卡等一样是竖立插到主板上的，当然主板上必须有对应SLOT插槽，这种接口的CPU已被淘汰。另一类是主流的针脚式接口，称为Socket，Socket接口的CPU有数百个针脚，因为针脚数目不同而称为Socket370、Socket478、Socket462、Socket423等。

缓存

缓存就是指可以进行高速数据交换的存储器，它优先于内存与CPU交换数据，因此速度极快，所以又被称为高速缓存。与处理器相关的缓存一般分为两种——L1缓存，也称内部缓存；和L2缓存，也称外部缓存。例如Pentium4“Willamette”内核产品采用了423的针脚架构，具备400MHz的前端总线，拥有256KB全速二级缓存，8KB一级追踪缓存，SSE2指令集。

内部缓存（L1Cache）

也就是我们经常说的一级高速缓存。在CPU里面内置了高速缓存可以提高CPU的运行效率，内置的L1高速缓存的容量和结构对CPU的性能影响较大，L1缓存越大，CPU工作时与存取速度较慢的L2缓存和内存间交换数据的次数越少，相对电脑的运算速度可以提高。不过高速缓冲存储器均由静态RAM组成，结构较复杂，在CPU管芯面积不能太大的情况下，L1级高速缓存的容量不可能做得太大，L1缓存的容量单位一般为KB。

外部缓存（L2Cache）

CPU外部的高速缓存，外部缓存成本昂贵，所以Pentium4Willamette核心为外部缓存256K，但同样核心的赛扬4代只有128K。

多媒体指令集

为了提高计算机在多媒体、3D图形方面的应用能力，许多处理器指令集应运而生，其中最著名的三种便是Intel的MMX、SSE/SSE2和AMD的3DNOW！指令集。理论上这些指令对流行的图像处理、浮点运算、3D运算、视频处理、音频处理等诸多多媒体应用起到全面强化的作用。

制造工艺

早期的处理器都是使用0.5微米工艺制造出来的，随着CPU频率的增加，原有的工艺已无法满足产品的要求，这样便出现了0.35微米以及0.25微米工艺。制作工艺越精细意味着单位体积内集成的电子元件越多，采用0.18微米和0.13微米制造的处理器产品是市场上的主流，例如Northwood核心P4采用了0.13微米生产工艺。而在2003年，Intel和AMD的CPU的制造工艺会达到0.09微米。

电压（Vcore）

CPU的工作电压指的也就是CPU正常工作所需的电压，与制作工艺及集成的晶体管数相关。正常工作的电压越低，功耗越低，发热减少。CPU的发展方向，也是在保证性能的基础上，不断降低正常工作所需要的电压。例如老核心AthlonXP的工作电压为1.75v，而新核心的AthlonXP其电压为1.65v。

封装形式

所谓CPU封装是CPU生产过程中的最后一道工序，封装是采用特定的材料将CPU芯片或CPU模块固化在其中以防损坏的保护措施，一般必须在封装后CPU才能交付用户使用。CPU的封装方式取决于CPU安装形式和器件集成设计，从大的分类来看通常采用Socket插座进行安装的CPU使用PGA（栅格阵列）方式封装，而采用Slotx槽安装的CPU则全部采用SEC（单边接插盒）的形式封装。还有PLGA（PlasticLandGridArray）、OLGA（OrganicLandGridArray）等封装技术。由于市场竞争日益激烈，前CPU封装技术的发展方向以节约成本为主。

单元

ALU—运算逻辑单元，这就是我们所说的“整数”单元。数学运算如加减乘除以及逻辑运算如“OR、AND、ASL、ROL”等指令都在逻辑运算单元中执行。在多数的软件程序中，这些运算占了程序代码的绝大多数。

而浮点运算单元FPU（FloatingPointUnit）主要负责浮点运算和高精度整数运算。有些FPU还具有向量运算的功能，另外一些则有专门的向量处理单元。

整数处理能力是CPU运算速度最重要的体现，但浮点运算能力是关系到CPU的多媒体、3D图形处理的一个重要指标，所以对于现代CPU而言浮点单元运算能力的强弱更能显示CPU的性能。