微处理器
微处理器由一片或少数几片大规模集成电路组成的*处理器。这些电路执行控制部件和算术逻辑部件的功能。微处理器能完成取指令、执行指令,以及与外界存储器和逻辑部件交换信息等操作,是微型计算机的运算控制部分。它可与存储器和外围电路芯片组成微型计算机。
中文名:微处理器
外文名:Microprocessor
含义:计算机的运算核心和控制核心
别名:*处理器
领域:计算机
1、综述
微处理器与传统的*处理器相比,具有体积小、重量轻和容易模块化等优点。微处理器的基本组成部分有:寄存器堆、运算器、时序控制电路,以及数据和地址总线。
自从人类1947年发明晶体管以来,50多年间半导体技术经历了硅晶体管、集成电路、超大规模集成电路、甚大规模集成电路等几代,发展速度之快是其他产业所没有的。半导体技术对整个社会产生了广泛的影响,因此被称为“产业的种子”。*处理器是指计算机内部对数据进行处理并对处理过程进行控制的部件,伴随着大规模集成电路技术的迅速发展,芯片集成密度越来越高,CPU可以集成在一个半导体芯片上,这种具有*处理器功能的大规模集成电路器件,被统称为“微处理器”。需要注意的是:微处理器本身并不等于微型计算机,仅仅是微型计算机的*处理器。
微处理器已经无处不在,无论是录像机、智能洗衣机、移动电话等家电产品,还是汽车引擎控制,以及数控机床、导弹精确制导等都要嵌入各类不同的微处理器。微处理器不仅是微型计算机的核心部件,也是各种数字化智能设备的关键部件。国际上的超高速巨型计算机、大型计算机等高端计算系统也都采用大量的通用高性能微处理器建造。
2、内部结构
微处理器
3、微处理器的分类
根据微处理器的应用领域,微处理器大致可以分为三类:通用高性能微处理器、嵌入式微处理器和数字信号处理器、微控制器。一般而言,通用处理器追求高性能,它们用于运行通用软件,配备完备、复杂的操作系统;嵌入式微处理器强调处理特定应用问题的高性能,主要用于运行面向特定领域的专用程序,配备轻量级操作系统,主要用于蜂窝电话、CD播放机等消费类家电;微控制器价位相对较低,在微处理器市场上需求量最大,主要用于汽车、空调、自动机械等领域的自控设备。CPU是CentralProcessingUnit(*微处理器)的缩写,它是计算机中最重要的一个部分,由运算器和控制器组成。如果把计算机比作人,那么CPU就是人的大脑。CPU的发展非常迅速,个人电脑从8088(XT)发展到Pentium4时代,只经过了二十一年的时间。
4、发展历程
CPU从最初发展至今已经有二十多年的历史了,这期间,按照其处理信息的字长,CPU可以分为:4位微处理器、8位微处理器、16位微处理器、32位微处理器以及最新的64位微处理器,可以说个人电脑的发展是随着CPU的发展而前进的。微机是指以大规模、超大规模集成电路为主要部件,以集成了计算机主要部件——控制器和运算器的微处理器MP(MicroProcessor)为核心,所构造出的计算系经过30多年的发展,微处理器的发展大致可分为:
微处理器
第一代
第一阶段
(1971—1973年)通常以字长是4位或8位微处理器,典型的是美国Intel4004和Intel8008微处理器。Intel4004是一种4位微处理器,可进行4位二进制的并行运算,它有45条指令,速度0.05MIPs(MillionInstructionPerSecond,每秒百万条指令)。Intel4004的功能有限,主要用于计算器、电动打字机、照相机、台秤、电视机等家用电器上,使这些电器设备具有智能化,从而提高它们的性能。Intel8008是世界上第一种8位的微处理器。存储器采用PMOS工艺。该阶段计算机工作速度较慢,微处理器的指令系统不完整,存储器容量很小,只有几百字节,没有操作系统,只有汇编语言。主要用于工业仪表、过程控制。
第二代
(1974—1977年)典型的微处理器有Intel8080/8085,Zilog公司的Z80和Motorola公司的M6800。与第一代微处理器相比,集成度提高了1~4倍,运算速度提高了10~15倍,指令系统相对比较完善,已具备典型的计算机体系结构及中断、直接存储器存取等功能。
由于微处理器可用来完成很多以前需要用较大设备完成的计算任务,价格又便宜,于是各半导体公司开始竞相生产微处理器芯片。Zilog公司生产了8080的增强型Z80,摩托罗拉公司生产了6800,英特尔公司于1976年又生产了增强型8085,但这些芯片基本没有改变8080的基本特点,都属于第二代微处理器。它们均采用NMOS工艺,集成度约9000只晶体管,平均指令执行时间为1μS~2μS,采用汇编语言、BASIC、Fortran编程,使用单用户操作系统。
第三代
第三阶段(1978—1984年)即16位微处理器。1978年,Intel公司率先推出16位微处理器8086,同时,为了方便原来的8位机用户,Intel公司又提出了一种准16位微处理器8088。
8086微处理器最高主频速度为8MHz,具有16位数据通道,内存寻址能力为1MB。同时英特尔还生产出与之相配合的数学协处理器i8087,这两种芯片使用相互兼容的指令集,但i8087指令集中增加了一些专门用于对数、指数和三角函数等数学计算的指令。人们将这些指令集统一称之为x86指令集。虽然以后英特尔又陆续生产出第二代、第三代等更先进和更快的新型CPU,但都仍然兼容原来的x86指令,而且英特尔在后续CPU的命名上沿用了原先的x86序列,直到后来因商标注册问题,才放弃了继续用阿拉伯数字命名。
1979年,英特尔公司又开发出了8088。8086和8088在芯片内部均采用16位数据传输,所以都称为16位微处理器,但8086每周期能传送或接收16位数据,而8088每周期只采用8位。因为最初的大部分设备和芯片是8位的,而8088的外部8位数据传送、接收能与这些设备相兼容。8088采用40针的DIP封装,工作频率为6.66MHz、7.16MHz或8MHz,微处理器集成了大约29000个晶体管。
在Intel公司推出8086、8088CPU之后,各公司也相继推出了同类的产品,有Zilog公司Z8000和Motorola公司的M68000等。16位微处理器比8位微处理器有更大的寻址空间、更强的运算能力、更快的处理速度和更完善的指令系统。所以,16位微处理器已能够替代部分小型机的功能,特别在单任务、单用户的系统中,8086等16位微处理器更是得到了广泛的应用。
1981年,美国IBM公司将8088芯片用于其研制的IBM-PC机中,从而开创了全新的微机时代。也正是从8088开始,个人电脑(PC)的概念开始在全世界范围内发展起来。从8088应用到IBMPC机上开始,个人电脑真正走进了人们的工作和生活之中,它也标志着一个新时代的开始。
1982年,英特尔公司在8086的基础上,研制出了80286微处理器,该微处理器的最大主频为20MHz,内、外部数据传输均为16位,使用24位内存储器的寻址,内存寻址能力为16MB。80286可工作于两种方式,一种叫实模式,另一种叫保护方式。
在实模式下,微处理器可以访问的内存总量限制在1兆字节;而在保护方式之下,80286可直接访问16兆字节的内存。此外,80286工作在保护方式之下,可以保护操作系统,使之不像实模式或8086等不受保护的微处理器那样,在遇到异常应用时会使系统停机。
IBM公司将80286微处理器用在先进技术微机即AT机中,引起了极大的轰动。80286在以下四个方面比它的前辈有显著的改进:支持更大的内存;能够模拟内存空间;能同时运行多个任务;提高了处理速度。
最早PC机的速度是4MHz,第一台基于80286的AT机运行速度为6MHz至8MHz,一些制造商还自行提高速度,使80286达到了20MHz,这意味着性能上有了重大的进步。
80286的封装是一种被称为PGA的正方形包装。PGA是源于PLCC的便宜封装,它有一块内部和外部固体插脚,在这个封装中,80286集成了大约130000个晶体管。
IBMPC/AT微机的总线保持了XT的三层总线结构,并增加了高低位字节总线驱动器转换逻辑和高位字节总线。与XT机一样,CPU也是焊接在主板上的。
第四代
第四阶段(1985—1992年)即32位微处理器。1985年10月17日,英特尔划时代的产品——80386DX正式发布了,其内部包含27.5万个晶体管,时钟频率为12.5MHz,后逐步提高到20MHz、25MHz、33MHz,最后还有少量的40MHz产品。
80386DX的内部和外部数据总线是32位,地址总线也是32位,可以寻址到4GB内存,并可以管理64TB的虚拟存储空间。它的运算模式除了具有实模式和保护模式以外,还增加了一种“虚拟86”的工作方式,可以通过同时模拟多个8086微处理器来提供多任务能力。
80386DX有比80286更多的指令,频率为12.5MHz的80386每秒钟可执行6百万条指令,比频率为16MHz的80286快2.2倍。80386最经典的产品为80386DX-33MHz,一般我们说的80386就是指它。
由于32位微处理器的强大运算能力,PC的应用扩展到很多的领域,如商业办公和计算、工程设计和计算、数据中心、个人娱乐。80386使32位CPU成为了PC工业的标准。
1989年英特尔公司又推出准32位微处理器芯片80386SX。这是Intel为了扩大市场份额而推出的一种较便宜的普及型CPU,它的内部数据总线为32位,外部数据总线为16位,它可以接受为80286开发的16位输入/输出接口芯片,降低整机成本。80386SX推出后,受到市场的广泛的欢迎,因为80386SX的性能大大优于80286,而价格只是80386的三分之一。
1989年,我们大家耳熟能详的80486芯片由英特尔推出。这款经过四年开发和3亿美元资金投入的芯片的伟大之处在于它首次实破了100万个晶体管的界限,集成了120万个晶体管,使用1微米的制造工艺。80486的时钟频率从25MHz逐步提高到33MHz、40MHz、50MHz。
80486是将80386和数学协微处理器80387以及一个8KB的高速缓存集成在一个芯片内。80486中集成的80487的数字运算速度是以前80387的两倍,内部缓存缩短了微处理器与慢速DRAM的等待时间。并且,在80x86系列中首次采用了RISC(精简指令集)技术,可以在一个时钟周期内执行一条指令。它还采用了突发总线方式,大大提高了与内存的数据交换速度。由于这些改进,80486的性能比带有80387数学协微处理器的80386DX性能提高了4倍。
第五代
第5阶段(1993-2005年)是奔腾(pentium)系列微处理器时代,通常称为第5代。典型产品是Intel公司的奔腾系列芯片及与之兼容的AMD的K6系列微处理器芯片。内部采用了超标量指令流水线结构,并具有相互独立的指令和数据高速缓存。随着MMX(MultiMediaeXtended)微处理器的出现,使微机的发展在网络化、多媒体化和智能化等方面跨上了更高的台阶。
早期的奔腾75MHz~120MHz使用0.5微米的制造工艺,后期120MHz频率以上的奔腾则改用0.35微米工艺。经典奔腾的性能相当平均,整数运算和浮点运算都不错。 为了提高电脑在多媒体、3D图形方面的应用能力,许多新指令集应运而生,其中最著名的三种便是英特尔的MMX、SSE和AMD的3DNOW!。MMX(MultiMediaExtensions,多媒体扩展指令集)是英特尔于1996年发明的一项多媒体指令增强技术,包括57条多媒体指令,这些指令可以一次处理多个数据,MMX技术在软件的配合下,就可以得到更好的性能。
多能奔腾(PentiumMMX)的正式名称就是“带有MMX技术的Pentium”,是在1996年底发布的。从多能奔腾开始,英特尔就对其生产的CPU开始锁倍频了,但是MMX的CPU超外频能力特别强,而且还可以通过提高核心电压来超倍频,所以那个时候超频是一个很时髦的行动。超频这个词语也是从那个时候开始流行的。
多能奔腾是继Pentium后英特尔又一个成功的产品,其生命力也相当顽强。多能奔腾在原Pentium的基础上进行了重大的改进,增加了片内16KB数据缓存和16KB指令缓存,4路写缓存以及分支预测单元和返回堆栈技术。特别是新增加的57条MMX多媒体指令,使得多能奔腾即使在运行非MMX优化的程序时,也比同主频的PentiumCPU要快得多。
1997年推出的PentiumII处理器结合了IntelMMX技术,能以极高的效率处理影片、音效、以及绘图资料,首次采用SingleEdgeContact(S.E.C)匣型封装,内建了高速快取记忆体。这款晶片让电脑使用者撷取、编辑、以及透过网际网络和亲友分享数位相片、编辑与新增文字、音乐或制作家庭电影的转场效果、使用视讯电话以及透过标准电话线与网际网络传送影片,IntelPentiumII处理器晶体管数目为750万颗。
PentiumIII处理器加入70个新指令,加入网际网络串流SIMD延伸集称为MMX,能大幅提升先进影像、3D、串流音乐、影片、语音辨识等应用的性能,它能大幅提升网际网络的使用经验,让使用者能浏览逼真的线上博物馆与商店,以及下载高品质影片,Intel首次导入0.25微米技术,IntelPentiumIII晶体管数目约为950万颗。
与此同年,英特尔还发布了PentiumIIIXeon处理器。作为PentiumIIXeon的后继者,除了在内核架构上采纳全新设计以外,也继承了PentiumIII处理器新增的70条指令集,以更好执行多媒体、流媒体应用软件。除了面对企业级的市场以外,PentiumIIIXeon加强了电子商务应用与高阶商务计算的能力。在缓存速度与系统总线结构上,也有很多进步,很大程度提升了性能,并为更好的多处理器协同工作进行了设计。
2000年推出的Pentium4处理器内建了4200万个晶体管,以及采用0.18微米的电路,Pentium4初期推出版本的速度就高达1.5GHz,晶体管数目约为4200万颗,翌年8月,Pentium4处理理达到2GHz的里程碑。2002年英特尔推出新款IntelPentium4处理器内含创新的Hyper-Threading(HT)超线程技术。超线程技术打造出新等级的高性能桌上型电脑,能同时快速执行多项运算应用,或针对支持多重线程的软件带来更高的性能。超线程技术让电脑性能增加25%。除了为桌上型电脑使用者提供超线程技术外,英特尔也达成另一项电脑里程碑,就是推出运作频率达3.06GHz的Pentium4处理器,是首款每秒执行30亿个运算周期的商业微处理器,如此优异的性能要归功于当时业界最先进的0.13微米制程技术,翌年,内建超线程技术的IntelPentium4处理器频率达到3.2GHz。
PentiumM:由以色列小组专门设计的新型移动CPU,PentiumM是英特尔公司的x86架构微处理器,供笔记簿型个人电脑使用,亦被作为Centrino的一部分,于2003年3月推出。公布有以下主频:标准1.6GHz,1.5GHz,1.4GHz,1.3GHz,低电压1.1GHz,超低电压900MHz。为了在低主频得到高效能,Banias作出了优化,使每个时钟所能执行的指令数目更多,并通过高级分支预测来降低错误预测率。另外最突出的改进就L2高速缓存增至1MB(P3-M和P4-M都只有512KB),估计Banias数目高达7700万的晶体管大部分就用在这上。
此外还有一系列与减少功耗有关的设计:增强型Speedstep技术是必不可少的了,拥有多个供电电压和计算频率,从而使性能可以更好地满足应用需求。
智能供电分布可将系统电量集中分布到处理器需要的地方,并关闭空闲的应用;移动电压定位(MVPIV)技术可根据处理器活动动态降低电压,从而支持更低的散热设计功率和更小巧的外形设计;经优化功率的400MHz系统总线;Micro-opsfusion微操作指令融合技术,在存在多个可同时执行的指令的情况下,将这些指令合成为一个指令,以提高性能与电力使用效率。专用的堆栈管理器,使用记录内部运行情况的专用硬件,处理器可无中断执行程序。
Banias所对应的芯片组为855系列,855芯片组由北桥芯片855和南桥芯片ICH4-M组成,北桥芯片分为不带内置显卡的855PM(代号Odem)和带内置显卡的855GM(代号Montara-GM),支持高达2GB的DDR266/200内存,AGP4X,USB2.0,两组ATA-100、AC97音效及Modem。其中855GM为三维及显示引擎优化InternalClockGating,它可以在需要时才进行三维显示引擎供电,从而降低芯片组的功率。
2005年Intel推出的双核心处理器有PentiumD和PentiumExtremeEdition,同时推出945/955/965/975芯片组来支持新推出的双核心处理器,采用90nm工艺生产的这两款新推出的双核心处理器使用是没有针脚的LGA775接口,但处理器底部的贴片电容数目有所增加,排列方式也有所不同。
桌面平台的核心代号Smithfield的处理器,正式命名为PentiumD处理器,除了摆脱阿拉伯数字改用英文字母来表示这次双核心处理器的世代交替外,D的字母也更容易让人联想起Dual-Core双核心的涵义。
Intel的双核心构架更像是一个双CPU平台,PentiumD处理器继续沿用Prescott架构及90nm生产技术生产。PentiumD内核实际上由于两个独立的2独立的Prescott核心组成,每个核心拥有独立的1MBL2缓存及执行单元,两个核心加起来一共拥有2MB,但由于处理器中的两个核心都拥有独立的缓存,因此必须保正每个二级缓存当中的信息完全一致,否则就会出现运算错误。
为了解决这一问题,Intel将两个核心之间的协调工作交给了外部的MCH(北桥)芯片,虽然缓存之间的数据传输与存储并不巨大,但由于需要通过外部的MCH芯片进行协调处理,毫无疑问的会对整个的处理速度带来一定的延迟,从而影响到处理器整体性能的发挥。
由于采用Prescott内核,因此PentiumD也支持EM64T技术、XDbit安全技术。值得一提的是,PentiumD处理器将不支持Hyper-Threading技术。原因很明显:在多个物理处理器及多个逻辑处理器之间正确分配数据流、平衡运算任务并非易事。比如,如果应用程序需要两个运算线程,很明显每个线程对应一个物理内核,但如果有3个运算线程呢?因此为了减少双核心PentiumD架构复杂性,英特尔决定在针对主流市场的PentiumD中取消对Hyper-Threading技术的支持。
同出自Intel之手,而且PentiumD和PentiumExtremeEdition两款双核心处理器名字上的差别也预示着这两款处理器在规格上也不尽相同。其中它们之间最大的不同就是对于超线程(Hyper-Threading)技术的支持。PentiumD不支持超线程技术,而PentiumExtremeEdition则没有这方面的限制。在打开超线程技术的情况下,双核心PentiumExtremeEdition处理器能够模拟出另外两个逻辑处理器,可以被系统认成四核心系统。
PentiumEE系列都采用三位数字的方式来标注,形式是PentiumEE8xx或9xx,例如PentiumEE840等等,数字越大就表示规格越高或支持的特性越多。
PentiumEE8x0:表示这是Smithfield核心、每核心1MB二级缓存、800MHzFSB的产品,其与PentiumD8x0系列的唯一区别仅仅只是增加了对超线程技术的支持,除此之外其它的技术特性和参数都完全相同。
PentiumEE9x5:表示这是Presler核心、每核心2MB二级缓存、1066MHzFSB的产品,其与PentiumD9x0系列的区别只是增加了对超线程技术的支持以及将前端总线提高到1066MHzFSB,除此之外其它的技术特性和参数都完全相同。
单核心的Pentium4、Pentium4EE、CeleronD以及双核心的PentiumD和PentiumEE等CPU采用LGA775封装。与以前的Socket478接口CPU不同,LGA775接口CPU的底部没有传统的针脚,而代之以775个触点,即并非针脚式而是触点式,通过与对应的LGA775插槽内的775根触针接触来传输信号。LGA775接口不仅能够有效提升处理器的信号强度、提升处理器频率,同时也可以提高处理器生产的良品率、降低生产成本。
第六代
第6阶段(2005年至今)是酷睿(core)系列微处理器时代,通常称为第6代。“酷睿”是一款领先节能的新型微架构,设计的出发点是提供卓然出众的性能和能效,提高每瓦特性能,也就是所谓的能效比。早期的酷睿是基于笔记本处理器的。酷睿2:英文名称为Core2Duo,是英特尔在2006年推出的新一代基于Core微架构的产品体系统称。于2006年7月27日发布。酷睿2是一个跨平台的构架体系,包括服务器版、桌面版、移动版三大领域。其中,服务器版的开发代号为Woodcrest,桌面版的开发代号为Conroe,移动版的开发代号为Merom。
酷睿2处理器的Core微架构是Intel的以色列设计团队在Yonah微架构基础之上改进而来的新一代英特尔架构。最显著的变化在于在各个关键部分进行强化。为了提高两个核心的内部数据交换效率采取共享式二级缓存设计,2个核心共享高达4MB的二级缓存。
继LGA775接口之后,Intel首先推出了LGA1366平台,定位高端旗舰系列。首颗采用LGA1366接口的处理器代号为Bloomfield,采用经改良的Nehalem核心,基于45纳米制程及原生四核心设计,内建8-12MB三级缓存。LGA1366平台再次引入了Intel超线程技术,同时QPI总线技术取代了由Pentium4时代沿用至今的前端总线设计。最重要的是LGA1366平台是支持三通道内存设计的平台,在实际的效能方面有了更大的提升,这也是LGA1366旗舰平台与其他平台定位上的一个主要区别。
作为高端旗舰的代表,早期LGA1366接口的处理器主要包括45nmBloomfield核心酷睿i7四核处理器。随着Intel在2010年买入32nm工艺制程,高端旗舰的代表被酷睿i7-980X处理器取代,全新的32nm工艺解决六核心技术,拥有最强大的性能表现。对于准备组建高端平台的用户而言,LGA1366依然占据着高端市场,酷睿i7-980X以及酷睿i7-950依旧是不错的选择。
IntelCorei7是一款45nm原生四核处理器,处理器拥有8MB三级缓存,支持三通道DDR3内存。处理器采用LGA1366针脚设计,支持第二代超线程技术,也就是处理器能以八线程运行。根据网上流传的测试,同频Corei7比Core2Quad性能要高出很多。
综合之前的资料来看,英特尔首先会发布三款IntelCorei7处理器,频率分别为3.2GHz、2.93GHz和2.66GHz,主频为3.2GHz的属于IntelCorei7Extreme,处理器售价为999美元,当然这款*处理器面向的是发烧级用户。而频率较低的2.66GHz的定价为284美元,约合1940元人民币,面向的是普通消费者。全新一代Corei7处理器将于2013年第四季度推出。
而从英特尔技术峰会2008(IDF2008)上英特尔展示的情况来看,corei7的能力在core2extremeqx9770(3.2GHz)的三倍左右。IDF上,intel工作人员使用一颗corei73.2GHz处理器演示了CineBenchR10多线程渲染,结果很惊人。渲染开始后,四颗核心的八个线程同时开始工作,仅仅19秒钟后完整的画面就呈现在了屏幕上,得分超过45800。相比之下,core2extremeqx97703.2GHz只能得到一万两千分左右,超频到4.0GHz才勉强超过15000分,不到corei7的3分之一。corei7的超强实力由此可窥见一斑。
Corei5是一款基于Nehalem架构的四核处理器,采用整合内存控制器,三级缓存模式,L3达到8MB,支持TurboBoost等技术的新处理器电脑配置。它和Corei7(Bloomfield)的主要区别在于总线不采用QPI,采用的是成熟的DMI(DirectMediaInterface),并且只支持双通道的DDR3内存。结构上它用的是LGA1156接口,Corei7用的是LGA1366。i5有睿频技术,可以在一定情况下超频。
Corei3可看作是Corei5的进一步精简版(或阉割版),将有32nm工艺版本(研发代号为Clarkdale,基于Westmere架构)这种版本。Corei3最大的特点是整合GPU(图形处理器),也就是说Corei3将由CPU+GPU两个核心封装而成。由于整合的GPU性能有限,用户想获得更好的3D性能,可以外加显卡。值得注意的是,即使是Clarkdale,显示核心部分的制作工艺仍会是45nm。i3i5区别最大之处是i3没有睿频技术。
2010年6月,Intel再次发布革命性的处理器——第二代Corei3/i5/i7。第二代Corei3/i5/i7隶属于第二代智能酷睿家族,全部基于全新的SandyBridge微架构,相比第一代产品主要带来五点重要革新:1、采用全新32nm的SandyBridge微架构,更低功耗、更强性能。2、内置高性能GPU(核芯显卡),视频编码、图形性能更强。3、睿频加速技术2.0,更智能、更高效能。4、引入全新环形架构,带来更高带宽与更低延迟。5、全新的AVX、AES指令集,加强浮点运算与加密解密运算。
SNB(SandyBridge)是英特尔在2011年初发布的新一代处理器微架构,这一构架的最大意义莫过于重新定义了“整合平台”的概念,与处理器“无缝融合”的“核芯显卡”终结了“集成显卡”的时代。这一创举得益于全新的32nm制造工艺。由于SandyBridge构架下的处理器采用了比之前的45nm工艺更加先进的32nm制造工艺,理论上实现了CPU功耗的进一步降低,及其电路尺寸和性能的显著优化,这就为将整合图形核心(核芯显卡)与CPU封装在同一块基板上创造了有利条件。此外,第二代酷睿还加入了全新的高清视频处理单元。视频转解码速度的高与低跟处理器是有直接关系的,由于高清视频处理单元的加入,新一代酷睿处理器的视频处理时间比老款处理器至少提升了30%。新一代SandyBridge处理器采用全新LGA1155接口设计,并且无法无LGA1156接口兼容。SandyBridge是将取代Nehalem的一种新的微架构,不过仍将采用32nm工艺制程。比较吸引人的一点是这次Intel不再是将CPU核心与GPU核心用“胶水”粘在一起,而是将两者真正做到了一个核心里。
在2012年4月24日下午北京天文馆,intel正式发布了ivybridge(IVB)处理器。22nmIvyBridge会将执行单元的数量翻一番,达到最多24个,自然会带来性能上的进一步跃进。IvyBridge会加入对DX11的支持的集成显卡。另外新加入的XHCIUSB3.0控制器则共享其中四条通道,从而提供最多四个USB3.0,从而支持原生USB3.0。cpu的制作采用3D晶体管技术的CPU耗电量会减少一半。
5、组成
微处理器由算术逻辑单元(ALU,ArithmeticLogicalUnit);累加器和通用寄存器组;程序计数器(也叫指令指标器);时序和控制逻辑部件;数据与地址锁存器/缓冲器;内部总线组成。其中运算器和控制器是其主要组成部分。
算术逻辑单元算术逻辑单元ALU主要完成算术运算(+,-、×、÷、比较)和各种逻辑运算(与、或、非、异或、移位)等操作。ALU是组合电路,本身无寄存操作数的功能,因而必须有保存操作数的两个寄存器:暂存器TMP和累加器AC,累加器既向ALU提供操作数,又接收ALU的运算结果。
微处理器
寄存器阵列实际上相当于微处理器内部的RAM,它包括通用寄存器组和专用寄存器组两部分,通用寄存器(A,B,C,D)用来存放参加运算的数据、中间结果或地址。它们一般均可作为两个8位的寄存器来使用。处理器内部有了这些寄存器之后,就可避免频繁地访问存储器,可缩短指令长度和指令执行时间,提高机器的运行速度,也给编程带来方便。专用寄存器包括程序计数器PC、堆栈指示器SP和标志寄存器FR,它们的作用是固定的,用来存放地址或地址基值。其中:
A)程序计数器PC用来存放下一条要执行的指令地址,因而它控制着程序的执行顺序。在顺序执行指令的条件下,每取出指令的一个字节,PC的内容自动加1。当程序发生转移时,就必须把新的指令地址(目标地址)装入PC,这通常由转移指令来实现。
B)堆栈指示器SP用来存放栈顶地址。堆栈是存储器中的一个特定区域。它按“后进先出”方式工作,当新的数据压入堆栈时,栈中原存信息不变,只改变栈顶位置,当数据从栈弹出时,弹出的是栈顶位置的数据,弹出后自动调正栈顶位置。也就是说,数据在进行压栈、出栈操作时,总是在栈顶进行。堆栈一旦初始化(即确定了栈底在内存中的位置)后,SP的内容(即栈顶位置)使由CPU自动管理。
AMDAthlon
C)标志寄存器也称程序状态字(PSW)寄存器,用来存放算术、逻辑运算指令执行后的结果特征,如结果为0时,产生进位或溢出标志等。
定时与控制逻辑是微处理器的核心控制部件,负责对整个计算机进行控制、包括从存储器中取指令,分析指令(即指令译码)确定指令操作和操作数地址,取操作数,执行指令规定的操作,送运算结果到存储器或I/O端口等。它还向微机的其它各部件发出相应的控制信号,使CPU内、外各部件间协调工作。
内部总线用来连接微处理器的各功能部件并传送微处理器内部的数据和控制信号。
必须指出,微处理器本身并不能单独构成一个独立的工作系统,也不能独立地执行程序,必须配上存储器、输入输出设备构成一个完整的微型计算机后才能独立工作。
存储器
微型计算机的存储器用来存放当前正在使用的或经常使用的程序和数据。存储器按读、写方式分为随机存储器RAM(RandomAccessMemory)和只读存储器ROM(ReadonlyMemory)。RAM也称为读/写存储器,工作过程中CPU可根据需要随时对其内容进行读或写操作。RAM是易失性存储器,即其内容在断电后会全部丢失,因而只能存放暂时性的程序和数据。ROM的内容只能读出不能写入,断电后其所存信息仍保留不变,是非易失性存储器。所以ROM常用来存放永久件的程序和数据。如初始导引程序、监控程序、操作系统中的基本输入、输出管理程序BIOS等。
I/O接口
输入/输出接口电路是微型计算机的重要组成部件。他是微型计算机连接外部输入、输出设备及各种控制对象并与外界进行信息交换的逻辑控制电路。由于外设的结构、工作速度、信号形式和数据格式等各不相同,因此它们不能直接挂接到系统总线上,必须用输入/输出接口电路来做中间转换,才能实现与CPU间的信息交换。I/O接口也称I/O适配器,不同的外设必须配备不同的I/O适配器。I/O接口电路是微机应用系统必不可少的重要组成部分。任何一个微机应用系统的研制和设计,实际上主要是I/O接口的研制和设计。因此I/O接口技术是本课程讨论的重要内容之一,我们将在第八章中详细介绍。
总线
总线是计算机系统中各部件之间传送信息的公共通道,是微型计算机的重要组成部件。它由若干条通信线和起驱动,隔离作用的各种三态门器件组成。微型计算机在结构形式上总是采用总线结构,即构成微机的各功能部件(微处理器、存储器、I/O接口电路等)之间通过总线相连接,这是微型计算机系统结构上的独特之处。采用总线结构之后,使系统中各功能部件间的相互关系转变为各部件面向总线的单一关系,一个部件(功能板/卡)只要符合总线标准,就可以连接到采用这种总线标准的系统中,从而使系统功能扩充或更新容易、结构简单、可靠性大大提高。在微型计算机中,根据他们所处位置和应用场合,总线可被分为以下四级,如图1.4所示。
(1)片内总线:它位于微处理器芯片内部,故称为芯片内部总线。用于微处理器内部ALU和各种寄存器等部件间的互连及信息传送(如图1.3中的内部总线就是片内总线)。由于受芯片面积及对外引脚数的限制,片内总线大多采用单总线结构,这有利于芯片集成度和成品率的提高,如果要求加快内部数据传送速度,也可采用双总线或三总线结构。
(2)片总线:片总线又称元件级(芯片级)总线或局部总线。微机主板、单扳机以及其它一些插件板、卡(如各种I/O接口板/卡),它们本身就是一个完整的子系统,板/卡上包含有CPU,RAM,ROM,I/O接口等各种芯片,这些芯片间也是通过总线来连接的,因为这有利于简化结构,减少连线,提高可靠性,方便信息的传送与控制。通常把各种板、卡上实现芯片间相互连接的总线称为片总线或元件级总线。
相对于一台完整的微型计算机来说,各种板/卡只是一个子系统,是一个局部,故又把片总线称为局部总线,而把用于连接微机各功能部件插卡的总线称为系统总线。局部总线是一个重要的概念,我们将在第七章中讨论。
(3)内总线:内总线又称系统总线或板级总线。因为该总线是用来连接微机各功能部件而构成一个完整微机系统的,如图1.2中所示,所以称之为系统总线。系统总线是微机系统中最重要的总线,人们平常所说的微机总线就是指系统总线,如PC总线、AT总线(ISA总线)、PCI总线等。系统总线是我们要讨论的重点内容之一。
系统总线上传送的信息包括数据信息、地址信息、控制信息,因此,系统总线包含有三种不同功能的总线,即数据总线DB(DataBus)、地址总线AB(AddressBus)和控制总线CB(ControlBus),如图1.2中所示。
数据总线DB用于传送数据信息。数据总线是双向三态形式的总线,即他既可以把CPU的数据传送到存储器或I/O接口等其它部件,也可以将其它部件的数据传送到CPU。数据总线的位数是微型计算机的一个重要指标,通常与微处理的字长相一致。例如Intel8086微处理器字长16位,其数据总线宽度也是16位。需要指出的是,数据的含义是广义的,它可以是真正的数据,也可以指令代码或状态信息,有时甚至是一个控制信息,因此,在实际工作中,数据总线上传送的并不一定仅仅是真正意义上的数据。
地址总线AB是专门用来传送地址的,由于地址只能从CPU传向外部存储器或I/O端口,所以地址总线总是单向三态的,这与数据总线不同。地址总线的位数决定了CPU可直接寻址的内存空间大小,比如8位微机的地址总线为16位,则其最大可寻址空间为2^16=64KB,16位微型机的地址总线为20位,其可寻址空间为2^20=1MB。一般来说,若地址总线为n位,则可寻址空间为2^n字节。
控制总线CB用来传送控制信号和时序信号。控制信号中,有的是微处理器送往存储器和I/O接口电路的,如读/写信号,片选信号、中断响应信号等;也有是其它部件反馈给CPU的,比如:中断申请信号、复位信号、总线请求信号、限备就绪信号等。因此,控制总线的传送方向由具体控制信号而定,一般是双向的,控制总线的位数要根据系统的实际控制需要而定。实际上控制总线的具体情况主要取决于CPU。
(4)外总线:也称通信总线。用于两个系统之间的连接与通信,如两台微机系统之间、微机系统与其他电子仪器或电子设备之间的通信。常用的通信总线有IEEE-488总线,VXI总线和RS-232串行总线等。外总线不是微机系统本身固有的,只有微型机应用系统中才有。
6、AMDCPU
K5
K5是AMD公司第一个独立生产的x86级CPU,发布时间在1996年。由于K5在开发上遇到了问题,其上市时间比英特尔的Pentium晚了许多,再加上性能不好,这个不成功的产品一度使得AMD的市场份额大量丧失。K5的性能非常一般,整数运算能力不如Cyrix的6x86,但是仍比Pentium略强,浮点运算能力远远比不上Pentium,但稍强于Cyrix。综合来看,K5属于实力比较平均的那一种产品。K5低廉的价格显然比其性能更能吸引消费者,低价是这款CPU最大的卖点。 AMD自然不甘心Pentium在CPU市场上呼风唤雨,因此它们在1997年又推出了K6。K6这款CPU的设计指标是相当高的,它拥有全新的MMX指令以及64KBL1Cache(比奔腾MMX多了一倍),整体性能要优于奔腾MMX,接近同主频PⅡ的水平。K6与K5相比,可以平行地处理更多的指令,并运行在更高的时钟频率上。AMD在整数运算方面做得非常成功,K6稍微落后的地方是在运行需要使用到MMX或浮点运算的应用程序方面,比起同样频率的Pentium要差许多。
K6
K6拥有32KB数据L1Cache,32KB指令L1Cache,集成了880万个晶体管,采用0.35微米技术,五层CMOS,C4工艺反装晶片,内核面积168平方毫米(新产品为68平方毫米),使用Socket7架构。 Cyrix也算是一家老资格的CPU开发商了,早在x86时代,它和英特尔,AMD就形成了三雄并立的局面。
K6-2
AMD于1998年4月正式推出了K6-2微处理器。它采用0.25微米工艺制造,芯片面积减小到了68平方毫米,晶体管数目也增加到930万个。另外,K6-2具有64KBL1Cache,二级缓存集成在主板上,容量从512KB到2MB之间,速度与系统总线频率同步,工作电压为2.2V,支持Socket7架构。
K6-2是一个K6芯片加上100MHz总线频率和支持3DNow!浮点指令的“结合物”。3DNow!技术是对x86体系的重大突破,它大大加强了处理3D图形和多媒体所需要的密集浮点运算性能。此外,K6-2支持超标量MMX技术,支持100MHz总线频率,这意味着系统与L2缓存和内存的传输率提高近50%,从而大大提高了整个系统的表现。 作为Cyrix公司独自研发的最后一款微处理器,CyrixMⅡ是于1998年3月开始生产的。除了具有6x86本身的特性外,该微处理器还支持MMX指令,其核心电压为2.9V,具有256字节指令;3.5X倍频;核心内集成650万个晶体管,功耗20.6瓦;64KB一级缓存。
K6-Ⅲ
AMD于1999年2月推出了代号为“Sharptooth”(利齿)的K6-Ⅲ,它是该公司最后一款支持Super7架构和CPGA封装形式的CPU,采用0.25微米制造工艺、内核面积是135平方毫米,集成了2130万个晶体管,工作电压为2.2V/2.4V。
Athlon(K7)
相对于K6-2而言,K6-Ⅲ最大的变化就是内部集成了256KB二级缓存(新赛扬只有128KB),并以CPU的主频速度运行。K6-Ⅲ的这一变化将能够更大限度发挥高主频的优势。此外,该微处理器还带有64KB一级缓存(32KB用于指令,另32KB用于数据),而且在主板上还集成了以系统总线频率同步运行的三级缓存,其容量大小从512KB到2MB之间。 1999年6月23日,AMD公司推出了具有重大战略意义的K7微处理器,并将其正式命名为Athlon。K7有两种规格的产品:第一种采用0.25微米工艺制造,使用K7核心,工作电压为1.6V(其缓存以主频速度的一半运行);第二种采用0.18微米工艺制造,使用K75核心;工作电压有1.7V和1.8V两种。上述两种类型的K7微处理器内部都集成了2130万个晶体管,外频均为200MHz。
Athlon包含128KB的L1Cache(PⅡ/PⅢ只有32KB);512KB~1MBL2Cache的片外缓存。同时,它还采用了全新的宏处理结构,拥有三个并行的x86指令译码器,可以动态推测时序,乱序执行;K7拥有一个强劲的浮点处理单元,在3DNOW!指令的帮助下会有更进一步的3D和多媒体处理能力,这个先进的FPU使K7拥有超越其他x86微处理器2倍的性能!另外,K7采用了一种类似于Slot1的全新的SlotA架构,从物理结构上两者可以互换,但后者的电器性能和前者完全不兼容。在总线方面,使用的是Digital公司的Alpha系统总线协议EV6,外频达200MHz;Athlon是AMD第一个具有SMP(对称多微处理器技术)能力的桌面CPU,即使用者可以用Athlon构建双微处理器甚至4微处理器系统! AMD公司在2000年6月份连续推出了新款的Thunderbird(雷鸟)、Duron(毒龙)微处理器,再次向英特尔Coppermine(铜矿)核心的微处理器发出了强有力的挑战。
Thunderbird(雷鸟)
Thunderbird是AMD面向高端的Athlon系列延续产品,采用0.18微米的制造工艺,共有SlotA和SocketA两种不同的架构,但它们在设计上大致相同:均内置128KB的一级缓存和256KB的二级缓存,其二级缓存与CPU主频速度同步运行;工作电压为1.70V~1.75V,相应的功耗也比老的Athlon要小;集成3700万个晶体管,核心面积达到120平方毫米。
另外,Thunderbird微处理器支持200MHz系统总线频率,提供巨大的带宽,且支持AlphaEV6总线协议,具有多重并行x86指令解码器。
Duron(毒龙)
Duron微处理器是AMD首款基于Athlon核心改进的低端微处理器,它原来的研发代号称为“Spitfire”。Duron外频也是200MHz,内置128KB的一级缓存和64KB的全速二级缓存,它的工作电压为1.5V,因而功耗要较Thunderbird小。而且它核心面积是100平方毫米,内部集成的晶体管数量为2500万个,比K7核心的Athlon多300万个。这些特点符合了AMD面对低端市场的策略,即低成本低功耗而又高性能。在浮点性能上,基于K7体系的Duron明显优于采用P6核心设计的Intel系列微处理器,它具有三个全流水乱序执行单元,一个用于加/减运算,一个用于复合指令还有一个是浮点存储单元。
7、其他微处理器发展
1975年,IBM公司生产了几款基于RISC设计的处理器。其中801就是RISC之父JohnCocke的杰作。最终15年后设计出Power架构系列产品,若干年后更出出现一个影响深远的RISC结构的芯片系列ARM
这是八十年代后,RISC架构被工业界认可后发展起的一种,HP的HPPA-RISC
1975年,摩托罗拉推出6800,该款处理器拥有78条指令集。摩托罗拉很多款单片装处理器和微处理器的设计思想都来源于6800,即使曾经很流行功能强大的6809也是继承了6800血统。1985年,摩托罗拉推出MC68010和已经命名为88000的32位RISC处理器系列。但1990年由于要全力研制PowerPC而*停产。
Z-80是由从Intel离走的FredericoFaggin设计的8位微处理器,被认为是8080的增强版,------是也是当年很牛的一款单片机,比后来风光无限的51系列更早进入中国,八十年代初学校都是以Z80为基础教学,那种需要用电视作显示器的单板电脑就是用的这种芯片。
不过最先推出的单芯片16位处理器当数TITMS9900。虽然出道后势头强劲,但TI为了发展DSP业务,不得不在1982年缩小9900的产量
半导体行业另一巨头,美国国家半导体公司,就是后来收购了设计X86系列处理器的Cyrix公司的,这是1983年由国家半导体(NationalSemiconductor)推出NS32032,也是一款RISC处理器,但是可惜的是RISC架构的处理器在个人电脑应用中只有POWERPC芯片的市场还算比较成功,其它的都可以说很失败,不过在另一领域:嵌入式应用中,RISC架构的处理器确是风光无限。
1981年,由斯坦福大学和部分研究者研制出MIPS。处理器利用了深度流水线技术。它通过简化指令的操作周期,解决了流水线的瓶颈-联锁问题,促成RISC思想的重要转变。
1982年,由美国伯克利大学研制的RISC-I,只有32条指令,并且具有流水线操作和使用寄存器窗口,性能比同时代单芯片设计都优越
ARM是一家芯片设计公司,自己不生产芯片,而是通过授权生产来发展ARM系列处理器。ARM公司在1990年11月英国剑桥的一个谷仓里成立,最初只有12人,经过11年多的发展,今日的ARM公司已经拥有700多名员工,其中60%以上都从事研发工作,ARM公司是一家既不生产芯片(fabless)也不销售芯片(chipless)的公司,它通过出售芯片技术授权,建立起新型的微处理器设计、生产和销售商业模式。更重要的是,这种商业模式取得极大的成功,采用ARM技术IP核的微处理器遍及各类电子产品:汽车、消费电子、成像、工业控制、海量存储、网络、安保和无线等市场,ARM技术几乎无处不在。ARM将其技术授权给世界上许多著名的半导体、软件和OEM厂商,每个厂商得到的都是一套独一无二的ARM相关技术及服务。利用这种合伙关系,ARM很快成为许多全球性RISC标准的缔造者。总共有30家半导体公司与ARM签订了硬件技术使用许可协议,其中包括Intel、IBM、LG半导体、NEC、SONY、菲利浦和国民半导体这样的大公司。至于软件系统的合伙人,则包括微软、升阳和MRI等一系列知名公司。
8、中国研发
2004年2月18日,由清华大学自主研发的32位微处理器THUMP芯片终于领到了由国家教育部颁发的“身份证”:典型工作频率400MHz,功耗1.17mW/MHz,芯片颗粒40片,最高工作频率可达500MHz,是目前国内工作频率最高的微处理器。“这标志着我国在自主研发CPU芯片领域迈开了实质性的一大步。”教育部对THUMP的诞生给予了较高评价。
在龙芯1号、龙芯2号的基础上,中国正在自主研发新一代的龙芯3号。
龙芯3A的工作频率为900MHz~1GHz,功耗约15W,频率为1GHz时双精度浮点运算速度峰值达到每秒160亿次,单精度浮点运算速度峰值每秒320亿次。龙芯3A采用意法半导体公司(STMicro)65纳米CMOS工艺生产,晶体管数目达4.25亿个,芯片采用BGA封装,引脚的数目为1121个,功耗小于15瓦。龙芯3A集成了四个64位超标量处理器核、4MB的二级Cache、两个DDR2/3内存控制器、两个高性能HyperTransport控制器、一个PCI/PCIX控制器以及LPC、SPI、UART、GPIO等低速I/O控制器。龙芯3A的指令系统与MIPS64兼容并通过指令扩展支持X86二进制翻译。龙芯3号在包括服务器、高性能计算机、低能耗数据中心、个人高性能计算机、高端桌面应用、高吞吐计算应用、工业控制、数字信号处理、高端嵌入式应用等产品中具有广阔的市场应用前景。