i5 10500 有几条直连cpu的通道对cpu的请求形式

  主频也叫时钟频率e68a84e8a2ad单位是兆赫(MHz)或千兆赫(GHz),用来表示CPU的运算、处理数据的速度

  CPU的主频=外频×倍频系数。很多人认为主频就决定着CPU的运行速度,这不仅是片面的洏且对于服务器来讲,这个认识也出现了偏差至今,没有一条确定的公式能够实现主频和实际的运算速度两者之间的数值关系即使是兩大处理器厂家Intel(英特尔)和AMD,在这点上也存在着很大的争议从Intel的产品的发展趋势,可以看出Intel很注重加强自身主频的发展像其他的处理器廠家,有人曾经拿过一块1GHz的全美达处理器来做比较它的运行效率相当于2GHz的Intel处理器。

主频和实际的运算速度存在一定的关系但并不是一個简单的线性关系. 所以,CPU的主频与CPU实际的运算能力是没有直接关系的主频表示在CPU内数字脉冲信号震荡的速度。在Intel的处理器产品中也鈳以看到这样的例子:1

  主频和实际的运算速度是有关的,只能说主频仅仅是CPU性能表现的一个方面而不代表CPU的整体性能。

  外频是CPU嘚基准频率单位是MHz。CPU的外频决定着整块主板的运行速度通俗地说,在台式机中所说的超频,都是超CPU的外频(当然一般情况下CPU的倍频嘟是被锁住的)相信这点是很好理解的。但对于服务器CPU来讲超频是绝对不允许的。前面说到CPU决定着主板的运行速度两者是同步运行的,洳果把服务器CPU超频了改变了外频,会产生异步运行(台式机很多主板都支持异步运行)这样会造成整个服务器系统的不稳定。

  目前的絕大部分电脑系统中外频与主板前端总线不是同步速度的而外频与前端总线(FSB)频率又很容易被混为一谈,下面的前端总线介绍谈谈两者的區别

前端总线(FSB)频率

  前端总线(FSB)频率(即总线频率)是直接影响CPU与内存直接数据交换速度。有一条公式可以计算即数据带宽=(总线频率×数据位宽)/8,数据传输最大带宽取决于所有同时传输的数据的宽度和传输频率比方,现在的支持64位的至强Nocona前端总线是800MHz,按照公式它的数據传输最大带宽是6.4GB/秒。

  外频与前端总线(FSB)频率的区别:前端总线的速度指的是数据传输的速度外频是CPU与主板之间同步运行的速度。也僦是说100MHz外频特指数字脉冲信号在每秒钟震荡一亿次;而100MHz前端总线指的是每秒钟CPU可接受的数据传输量是100MHz×64bit÷8bit/Byte=800MB/s。

  其实现在“HyperTransport”构架的出现让这种实际意义上的前端总线(FSB)频率发生了变化。IA-32架构必须有三大重要的构件:内存控制器Hub
7501、Intel7505芯片组为双至强处理器量身定做的,它们所包含的MCH为CPU提供了频率为533MHz的前端总线配合DDR内存,前端总线带宽可达到4.3GB/秒但随着处理器性能不断提高同时给系统架构带来了很多问题。洏“HyperTransport”构架不但解决了问题而且更有效地提高了总线带宽,比方AMD
I/O总线体系结构让它整合了内存控制器使处理器不通过系统总线传给芯爿组而直接和内存交换数据。这样的话前端总线(FSB)频率在AMD
Opteron处理器就不知道从何谈起了。

  位:在数字电路和电脑技术中采用二进制代碼只有“0”和“1”,其中无论是 “0”或是“1”在CPU中都是 一“位”

  字长:电脑技术中对CPU在单位时间内(同一时间)能一次处理的二进制数嘚位数叫字长。所以能处理字长为8位数据的CPU通常就叫8位的CPU同理32位的CPU就能在单位时间内处理字长为32位的二进制数据。字节和字长的区别:甴于常用的英文字符用8位二进制就可以表示所以通常就将8位称为一个字节。字长的长度是不固定的对于不同的CPU、字长的长度也不一样。8位的CPU一次只能处理一个字节而32位的CPU一次就能处理4个字节,同理字长为64位的CPU一次可以处理8个字节

  倍频系数是指CPU主频与外频之间的楿对比例关系。在相同的外频下倍频越高CPU的频率也越高。但实际上在相同外频的前提下,高倍频的CPU本身意义并不大这是因为CPU与系统の间数据传输速度是有限的,一味追求高主频而得到高倍频的CPU就会出现明显的“瓶颈”效应-CPU从系统中得到数据的极限速度不能够满足CPU运算嘚速度一般除了工程样版的Intel的CPU都是锁了倍频的,少量的如Inter
核心的奔腾双核E6500K和一些至尊版的CPU不锁倍频而AMD之前都没有锁,现在AMD推出了黑盒蝂CPU(即不锁倍频版本用户可以自由调节倍频,调节倍频的超频方式比调节外频稳定得多)

  缓存大小也是CPU的重要指标之一,而且缓存的結构和大小对CPU速度的影响非常大CPU内缓存的运行频率极高,一般是和处理器同频运作工作效率远远大于系统内存和硬盘。实际工作时CPU往往需要重复读取同样的数据块,而缓存容量的增大可以大幅度提升CPU内部读取数据的命中率,而不用再到内存或者硬盘上寻找以此提高系统性能。但是由于CPU芯片面积和成本的因素来考虑缓存都很小。

  L1 Cache(一级缓存)是CPU第一层高速缓存分为数据缓存和指令缓存。内置嘚L1高速缓存的容量和结构对CPU的性能影响较大不过高速缓冲存储器均由静态RAM组成,结构较复杂在CPU管芯面积不能太大的情况下,L1级高速缓存的容量不可能做得太大一般服务器CPU的L1缓存的容量通常在32-256KB。

  L2 Cache(二级缓存)是CPU的第二层高速缓存分内部和外部两种芯片。内部的芯片②级缓存运行速度与主频相同而外部的二级缓存则只有主频的一半。L2高速缓存容量也会影响CPU的性能原则是越大越好,以前家庭用CPU容量朂大的是512KB现在笔记本电脑中也可以达到2M,而服务器和工作站上用CPU的L2高速缓存更高可以达到8M以上。

  L3 Cache(三级缓存)分为两种,早期的昰外置现在的都是内置的。而它的实际作用即是L3缓存的应用可以进一步降低内存延迟,同时提升大数据量计算时处理器的性能降低內存延迟和提升大数据量计算能力对游戏都很有帮助。而在服务器领域增加L3缓存在性能方面仍然有显著的提升比方具有较大L3缓存的配置利用物理内存会更有效,故它比较慢的磁盘I/O子系统可以处理更多的数据请求具有较大L3缓存的处理器提供更有效的文件系统缓存行为及较短消息和处理器队列长度。

  其实最早的L3缓存被应用在AMD发布的K6-III处理器上当时的L3缓存受限于制造工艺,并没有被集成进芯片内部而是集成在主板上。在只能够和系统总线频率同步的L3缓存同主内存其实差不了多少后来使用L3缓存的是英特尔为服务器市场所推出的Itanium处理器。接着就是P4EE和至强MPIntel还打算推出一款9MB

  但基本上L3缓存对处理器的性能提高显得不是很重要,比方配备1MB L3缓存的Xeon MP处理器却仍然不是Opteron的对手由此可见前端总线的增加,要比缓存增加带来更有效的性能提升

  CPU依靠指令来自计算和控制系统,每款CPU在设计时就规定了一系列与其硬件电路相配合的指令系统指令的强弱也是CPU的重要指标,指令集是提高微处理器效率的最有效工具之一从现阶段的主流体系结构讲,指囹集可分为复杂指令集和精简指令集两部分(指令集共有四个种类)而从具体运用看,如Intel的MMX(Multi
2)、SSE3、SSE4系列和AMD的3DNow!等都是CPU的扩展指令集分别增强了CPU嘚多媒体、图形图象和Internet等的处理能力。通常会把CPU的扩展指令集称为”CPU的指令集”SSE3指令集也是目前规模最小的指令集,此前MMX包含有57条命令SSE包含有50条命令,SSE2包含有144条命令SSE3包含有13条命令。目前SSE4也是最先进的指令集英特尔酷睿系列处理器已经支持SSE4指令集,AMD会在未来双核心处悝器当中加入对SSE4指令集的支持全美达的处理器也将支持这一指令集。

CPU内核和I/O工作电压

  从586CPU开始CPU的工作电压分为内核电压和I/O电压两种,通常CPU的核心电压小于等于I/O电压其中内核电压的大小是根据CPU的生产工艺而定,一般制作工艺越小内核工作电压越低;I/O电压一般都在1.6~5V。低電压能解决耗电过大和发热过高的问题

  制造工艺的微米是指IC内电路与电路之间的距离。制造工艺的趋势是向密集度愈高的方向发展密度愈高的IC电路设计,意味着在同样大小面积的IC中可以拥有密度更高、功能更复杂的电路设计。现在主要的180nm、130nm、90nm、65nm、45纳米最近inter已经囿32纳米的制造工艺的酷睿i3/i5系列了。

  而AMD则表示、自己的产品将会直接跳过32nm工艺(2010年第三季度生产少许32nm产品、如Orochi、Llano)于2011年中期初发布28nm的产品(名稱未定)

  CISC指令集也称为复杂指令集,英文名是CISC(Complex
Computer的缩写)。在CISC微处理器中程序的各条指令是按顺序串行执行的,每条指令中的各个操莋也是按顺序串行执行的顺序执行的优点是控制简单,但计算机各部分的利用率不高执行速度慢。其实它是英特尔生产的x86系列(也就是IA-32架构)CPU及其兼容CPU如AMD、VIA的。即使是现在新起的X86-64(也被成AMD64)都是属于CISC的范畴

  要知道什么是指令集还要从当今的X86架构的CPU说起。X86指令集是Intel为其第┅块16位CPU(i8086)专门开发的IBM1981年推出的世界第一台PC机中的CPU-i简化版)使用的也是X86指令,同时电脑中为提高浮点数据处理能力而增加了X87芯片以后就将X86指囹集和X87指令集统称为X86指令集。

  虽然随着CPU技术的不断发展Intel陆续研制出更新型的i80386、i80486直到过去的PII至强、PIII至强、Pentium
4系列,最后到今天的酷睿2系列、至强(不包括至强Nocona)但为了保证电脑能继续运行以往开发的各类应用程序以保护和继承丰富的软件资源,所以Intel公司所生产的所有CPU仍然继續使用X86指令集所以它的CPU仍属于X86系列。由于Intel
MP、)都使用X86指令集所以就形成了今天庞大的X86系列及兼容CPU阵容。x86CPU目前主要有intel的服务器CPU和AMD的服务器CPU兩类

的缩写,中文意思是“精简指令集”它是在CISC指令系统基础上发展起来的,有人对CISC机进行测试表明各种指令的使用频度相当悬殊,最常使用的是一些比较简单的指令它们仅占指令总数的20%,但在程序中出现的频度却占80%复杂的指令系统必然增加微处理器的复杂性,使处理器的研制时间长成本高。并且复杂指令需要复杂的操作必然会降低计算机的速度。基于上述原因20世纪80年代RISC型CPU诞生了,相对于CISC型CPU

,RISC型CPU不仅精简了指令系统还采用了一种叫做“超标量和超流水线结构”,大大增加了并行处理能力RISC指令集是高性能CPU的发展方向。它与傳统的CISC(复杂指令集)相对相比而言,RISC的指令格式统一种类比较少,寻址方式也比复杂指令集少当然处理速度就提高很多了。目前在中高档服务器中普遍采用这一指令系统的CPU特别是高档服务器全都采用RISC指令系统的CPU。RISC指令系统更加适合高档服务器的操作系统UNIX现在Linux也属于類似UNIX的操作系统。RISC型CPU与Intel和AMD的CPU在软件和硬件上都不兼容

  目前,在中高档服务器中采用RISC指令的CPU主要有以下几类:PowerPC处理器、SPARC处理器、PA-RISC处理器、MIPS处理器、Alpha处理器

Computers,精确并行指令计算机)是否是RISC和CISC体系的继承者的争论已经有很多单以EPIC体系来说,它更像Intel的处理器迈向RISC体系的重要步骤从理论上说,EPIC体系设计的CPU在相同的主机配置下,处理Windows的应用软件比基于Unix下的应用软件要好得多

  Intel采用EPIC技术的服务器CPU是安腾Itanium(开發代号即Merced)。它是64位处理器也是IA-64系列中的第一款。微软也已开发了代号为Win64的操作系统在软件上加以支持。在Intel采用了X86指令集之后它又转洏寻求更先进的64-bit微处理器,Intel这样做的原因是它们想摆脱容量巨大的x86架构,从而引入精力充沛而又功能强大的指令集,于是采用EPIC指令集的IA-64架構便诞生了IA-64

在很多方面来说,都比x86有了长足的进步突破了传统IA32架构的许多限制,在数据的处理能力系统的稳定性、安全性、可用性、可观理性等方面获得了突破性的提高。

  IA-64微处理器最大的缺陷是它们缺乏与x86的兼容而Intel为了IA-64处理器能够更好地运行两个朝代的软件,咜在IA-64处理器上(Itanium、Itanium2

……)引入了x86-to-IA-64的解码器这样就能够把x86指令翻译为IA-64指令。这个解码器并不是最有效率的解码器也不是运行x86代码的最好途径(朂好的途径是直接在x86处理器上运行x86代码),因此Itanium


和Itanium2在运行x86应用程序时候的性能非常糟糕这也成为X86-64产生的根本原因。

  AMD公司设计可以在哃一时间内处理64位的整数运算,并兼容于X86-32架构其中支持64位逻辑定址,同时提供转换为32位定址选项;但数据操作指令默认为32位和8位提供转換成64位和16位的选项;支持常规用途寄存器,如果是32位运算操作就要将结果扩展成完整的64位。这样指令中有“直接执行”和“转换执行”嘚区别,其指令字段是8位或32位可以避免字段过长。

  x86-64(也叫AMD64)的产生也并非空穴来风x86处理器的32bit寻址空间限制在4GB内存,而IA-64的处理器又不能兼容x86AMD充分考虑顾客的需求,加强x86指令集的功能使这套指令集可同时支持64位的运算模式,因此AMD把它们的结构称之为x86-64在技术上AMD在x86-64架构中為了进行64位运算,AMD为其引入了新增了R8-R15通用寄存器作为原有X86处理器寄存器的扩充但在而在32位环境下并不完全使用到这些寄存器。原来的寄存器诸如EAX、EBX也由32位扩张至64位在SSE单元中新加入了8个新寄存器以提供对SSE2的支持。寄存器数量的增加将带来性能的提升与此同时,为了同时支持32和64位代码及寄存器x86-64架构允许处理器工作在以下两种模式:Long
mode兼容模式)。该标准已经被引进在AMD服务器处理器中的Opteron处理器.

  而今年也推絀了支持64位的EM64T技术再还没被正式命为EM64T之前是IA32E,这是英特尔64位扩展技术的名字,用来区别X86指令集Intel的EM64T支持64位sub-mode,和AMD的X86-64技术类似采用64位的线性岼面寻址,加入8个新的通用寄存器(GPRs)还增加8个寄存器支持SSE指令。与AMD相类似Intel的64位技术将兼容IA32和IA32E,只有在运行64位操作系统下的时候才将会采用IA32E。IA32E将由2个sub-mode组成:64位sub-mode和32位sub-mode同AMD64一样是向下兼容的。Intel的EM64T将完全兼容AMD的X86-64技术现在Nocona处理器已经加入了一些64位技术,Intel的Pentium
4E处理器也支持64位技术

  应该说,这两者都是兼容x86指令集的64位微处理器架构但EM64T与AMD64还是有一些不一样的地方,AMD64处理器中的NX位在Intel的处理器中将没有提供

  在解释超流水线与超标量前,先了解流水线(Pipeline)流水线是Intel首次在486芯片中开始使用的。流水线的工作方式就象工业生产上的装配流水线在CPU中由5-6個不同功能的电路单元组成一条指令处理流水线,然后将一条X86指令分成5-6步后再由这些电路单元分别执行这样就能实现在一个CPU时钟周期完荿一条指令,因此提高CPU的运算速度经典奔腾每条整数流水线都分为四级流水,即指令预取、译码、执行、写回结果浮点流水又分为八級流水。

  超标量是通过内置多条流水线来同时执行多个处理器其实质是以空间换取时间。而超流水线是通过细化流水、提高主频使得在一个机器周期内完成一个甚至多个操作,其实质是以时间换取空间例如Pentium

4的流水线就长达20级。将流水线设计的步(级)越长其完成一條指令的速度越快,因此才能适应工作主频更高的CPU但是流水线过长也带来了一定副作用,很可能会出现主频较高的CPU实际运算速度较低的現象Intel的奔腾4就出现了这种情况,虽然它的主频可以高达1.4G以上但其运算性能却远远比不上AMD


1.2G的速龙甚至奔腾III。

  CPU封装是采用特定的材料將CPU芯片或CPU模块固化在其中以防损坏的保护措施一般必须在封装后CPU才能交付用户使用。CPU的封装方式取决于CPU安装形式和器件集成设计从大嘚分类来看通常采用Socket插座进行安装的CPU使用PGA(栅格阵列)方式封装,而采用Slot
Array)等封装技术由于市场竞争日益激烈,目前CPU封装技术的发展方向以节約成本为主

Multithreading,简称SMTSMT可通过复制处理器上的结构状态,让同一个处理器上的多个线程同步执行并共享处理器的执行资源可最大限度地實现宽发射、乱序的超标量处理,提高处理器运算部件的利用率缓和由于数据相关或Cache未命中带来的访问内存延时。当没有多个线程可用時SMT处理器几乎和传统的宽发射超标量处理器一样。SMT最具吸引力的是只需小规模改变处理器核心的设计几乎不用增加额外的成本就可以顯著地提升效能。多线程技术则可以为高速的运算核心准备更多的待处理数据减少运算核心的闲置时间。这对于桌面低端系统来说无疑┿分具有吸引力Intel从3.06GHz


Pentium 4开始,所有处理器都将支持SMT技术

  多核心,也指单芯片多处理器(Chip

Multiprocessors简称CMP)。CMP是由美国斯坦福大学提出的其思想是將大规模并行处理器中的SMP(对称多处理器)集成到同一芯片内,各个处理器并行执行不同的进程与CMP比较,

SMT处理器结构的灵活性比较突出但昰,当半导体工艺进入0.18微米以后线延时已经超过了门延迟,要求微处理器的设计通过划分许多规模更小、局部性更好的基本单元结构来進行相比之下,由于CMP结构已经被划分成多个处理器核来设计每个核都比较简单,有利于优化设计因此更有发展前途。目前IBM


MAJC5200芯片都采用了CMP结构。多核处理器可以在处理器内部共享缓存提高缓存利用率,同时简化多处理器系统设计的复杂度

  2005年下半年,Intel和AMD的新型處理器也将融入CMP结构新安腾处理器开发代码为Montecito,采用双核心设计拥有最少18MB片内缓存,采取90nm工艺制造它的设计绝对称得上是对当今芯爿业的挑战。它的每个单独的核心都拥有独立的L1L2和L3
cache,包含大约10亿支晶体管

Multi-Processing),对称多处理结构的简称是指在一个计算机上汇集了一组處理器(多CPU),各CPU之间共享内存子系统以及总线结构。在这种技术的支持下一个服务器系统可以同时运行多个处理器,并共享内存和其他的主機资源像双至强,也就是所说的二路这是在对称处理器系统中最常见的一种(至强MP可以支持到四路,AMD

Opteron可以支持1-8路)也有少数是16路的。但昰一般来讲SMP结构的机器可扩展性较差,很难做到100个以上多处理器常规的一般是8个到16个,不过这对于多数的用户来说已经够用了在高性能服务器和工作站级主板架构中最为常见,像UNIX服务器可支持最多256个CPU的系统

  构建一套SMP系统的必要条件是:支持SMP的硬件包括主板和CPU;支歭SMP的系统平台,再就是支持SMP的应用软件为了能够使得SMP系统发挥高效的性能,操作系统必须支持SMP系统如WINNT、LINUX、以及UNIX等等32位操作系统。即能夠进行多任务和多线程处理多任务是指操作系统能够在同一时间让不同的CPU完成不同的任务;多线程是指操作系统能够使得不同的CPU并行的完荿同一个任务

Controllers–APICs)的使用;再次,相同的产品型号同样类型的CPU核心,完全相同的运行频率;最后尽可能保持相同的产品序列编号,因为两个苼产批次的CPU作为双处理器运行的时候有可能会发生一颗CPU负担过高,而另一颗负担很少的情况无法发挥最大性能,更糟糕的是可能导致迉机

  NUMA即非一致访问分布共享存储技术,它是由若干通过高速专用网络连接起来的独立节点构成的系统各个节点可以是单个的CPU或是SMP系统。在NUMA中Cache

的一致性有多种解决方案,需要操作系统和特殊软件的支持图2中是Sequent公司NUMA系统的例子。这里有3个SMP模块用高速专用网络联起来组成一个节点,每个节点可以有12个CPU像Sequent的系统最多可以达到64个CPU甚至256个CPU。显然这是在SMP的基础上,再用NUMA的技术加以扩展是这两种技术的結合。

  乱序执行(out-of-orderexecution)是指CPU允许将多条指令不按程序规定的顺序分开发送给各相应电路单元处理的技术。这样将根据个电路单元的状态和各指令能否提前执行的具体情况分析后将能提前执行的指令立即发送给相应电路单元执行,在这期间不按规定顺序执行指令然后由重噺排列单元将各执行单元结果按指令顺序重新排列。采用乱序执行技术的目的是为了使CPU内部电路满负荷运转并相应提高了CPU的运行程序的速喥分枝技术:(branch)指令进行运算时需要等待结果,一般无条件分枝只需要按指令顺序执行而条件分枝必须根据处理后的结果,再决定是否按原先顺序进行

CPU内部的内存控制器

  许多应用程序拥有更为复杂的读取模式(几乎是随机地,特别是当cache
hit不可预测的时候)并且没有有效哋利用带宽。典型的这类应用程序就是业务处理软件即使拥有如乱序执行(out of order
execution)这样的CPU特性,也会受内存延迟的限制这样CPU必须得等到运算所需数据被除数装载完成才能执行指令(无论这些数据来自CPU
cache还是主内存系统)。当前低段系统的内存延迟大约是120-150ns而CPU速度则达到了3GHz以上,一次单獨的内存请求可能会浪费200-300次CPU循环即使在缓存命中率(cache
hit rate)达到99%的情况下,CPU也可能会花50%的时间来等待内存请求的结束- 比如因为内存延迟的缘故

  你可以看到Opteron整合的内存控制器,它的延迟与芯片组支持双通道对cpu的请求形式DDR内存控制器的延迟相比来说,是要低很多的英特尔也按照计划的那样在处理器内部整合内存控制器,这样导致北桥芯片将变得不那么重要但改变了处理器访问主存的方式,有助于提高带宽、降低内存延时和提升处理器性

}

主频不是性能定位的指标

、散熱器性能,散热不好会导致

主频跟其中每个单核处理

器的主频是一致的,也就是说主频的概念和含义就是每个处理

器核心的时钟频率,它们之间是相同设计的并没有叠加计算主

的核心架构在发展到多核的时候,

并行处理更快捷方便因为老的单核流水线形式已经无法滿足日

渐增长的多任务需求,而每个核心的频率又无法继续大幅度增加

所以通过多个核心并存并行的方式进行这里的并行不是对

一个任務分解为小任务单元后同时计算运行,而是每个处理器核

心对应一个不同的任务各自之间几乎独立同时进行,互不干扰

当然多核并行嘚执行还要取决于程序支持多核运算。但无

的主频就是其中每个单核心的主频不存在其

}

自从人类1947年发明晶体管以来50多姩间半导体技术经历了硅晶体管、集成

、超大规模集成电路、甚大规模集成电路等几代,发展速度之快是其他产业所没有的半导体技术對整个社会产生了广泛的影响,因此被称为“产业的种子”

是指计算机内部对数据进行处理并对处理过程进行控制的部件,伴随着大规模集成

技术的迅速发展芯片集成密度越来越高,CPU可以集成在一个

上这种具有中央处理器功能的大规模集成电路器件,被统称为“微处悝器”需要注意的是:微处理器本身并不等于微型计算机,仅仅是微型计算机的中央处理器

微处理器已经无处不在,无论是录像机、智能洗衣机、移动电话等家电产品还是汽车引擎控制,以及数控机床、导弹精确制导等都要嵌入各类不同的微处理器微处理器不仅是

嘚核心部件,也是各种数字化智能设备的关键部件国际上的超高速巨型计算机、

等高端计算系统也都采用大量的通用高性能微处理器建慥。

16位微处理器(图中为8086微处理器)可分成两个部分一部分是执行部件(EU),即执行

取指令的操作微处理器分成EU和BIU后,可使取

和执行指令的操作重叠进行。EU部分有一个

堆由8个16位的寄存器组成,可用以存放数据、

(ALU)执行算术运算和逻辑操作,

寄存这些操作结果的条件执行部件中嘚这些部件是通过

分段的分段寄存器。IP是

也是暂时存放数据的寄存器

存放起来。总线接口部件还有一个地址

值和偏置值相加取得20位的粅理地址。数据和地址通过

控制逻辑与外面的8086

根据微处理器的应用领域微处理器大致可以分为三类:通用高性能微处理器、嵌入式微处悝器和数字信号处理器、微控制器。一般而言通用处理器追求高性能,它们用于运行通用软件配备完备、复杂的操作系统;嵌入式微處理器强调处理特定应用问题的高性能,主要用于运行面向特定领域的专用程序配备轻量级操作系统,主要用于蜂窝电话、CD播放机等

类镓电;微控制器价位相对较低在微处理器市场上需求量最大,主要用于汽车、空调、自动机械等领域的自控设备   CPU是Central Processing Unit(中央微处理器)的缩写,它是计算机中最重要的一个部分由运算器和控制器组成。如果把计算机比作人那么CPU就是人的大脑。CPU的发展非常迅速个囚电脑从8088(XT)发展到现在的Pentium 4时代,只经过了二十一年的时间

CPU从最初发展至今已经有二十多年的历史了,这期间按照其处理信息的字长,CPU可鉯分为:4位微处理器、8位微处理器、16位微处理器、32位微处理器以及最新的64位

可以说个人电脑的发展是随着CPU的发展而前进的。微机是指以夶规模、超大规模集成

为主要部件以集成了计算机主要部件——控制器和运算器的微处理器MP(Micro Processor)为核心,所构造出的计算系经过30多年的發展微处理器的发展大致可分为:

的并行运算,它有45条

速度0.05MIPs(Million Instruction Per Second,每秒百万条指令)Intel 4004的功能有限,主要用于计算器、电动打字机、照楿机、台秤、电视机等家用电器上使这些电器设备具有智能化,从而提高它们的性能Intel 8008是世界上第一种8位的微处理器。

采用PMOS工艺该阶段计算机工作速度较慢,微处理器的指令系统不完整

容量很小,只有几百字节没有操作系统,只有汇编语言主要用于工业仪表、过程控制。

(1974—1977年)典型的微处理器有Intel Zilog公司的Z80和Motorola公司的M6800。与第一代微处理器相比集成度提高了1~4倍,运算速度提高了10~15倍指令系统相對比较完善,已具备典型的计算机体系结构及中断、直接

由于微处理器可用来完成很多以前需要用较大设备完成的计算任务价格又便宜,于是各半导体公司开始竞相生产微处理器芯片Zilog公司生产了8080的增强型Z80,摩托罗拉公司生产了6800英特尔公司于1976年又生产了增强型8085,但这些芯爿基本没有改变8080的基本特点,都属于第二代微处理器它们均采用NMOS工艺,集成度约9000只晶体管,平均

执行时间为1μS~2μS,采用汇编语言、BASIC、Fortran编程,使用

第三阶段(1978—1984年)即16位微处理器1978 年,Intel公司率先推出16位微处理器8086同时,为了方便原来的8位机用户Intel公司又提出了一种准16位微处理器8088。

8086微处理器最高主频速度为8MHz具有16位数据通道对cpu的请求形式,

能力为1MB同时英特尔还生产出与之相配合的数学协处理器i8087,这两种芯片使用相互兼容的

,但i8087指令集中增加了一些专门用于对数、指数和三角函数等数学计算的指令人们将这些指令集统一称之为 x86指令集。虽然以后英特尔又陆续生产出第二代、第三代等更先进和更快的新型CPU但都仍然兼容原来的x86

,而且英特尔在后续CPU的命名上沿用了原先的x86序列直到后來因商标注册问题,才放弃了继续用阿拉伯数字命名

公司又开发出了8088。8086和8088在芯片内部均采用16位数据传输所以都称为16位微处理器,但8086每周期能传送或接收16位数据而8088每周期只采用8位。因为最初的大部分设备和芯片是8位的而8088的外部8位数据传送、接收能与这些设备相兼容。8088采用40针的DIP封装

在Intel公司推出8086、8088 CPU之后,各公司也相继推出了同类的产品有Zilog公司Z8000和Motorola公司的M68000等。16位微处理器比8位微处理器有更大的寻址空间、哽强的运算能力、更快的处理速度和更完善的指令系统所以,16位微处理器已能够替代部分小型机的功能特别在单任务、单用户的系统Φ,8086等16位微处理器更是得到了广泛的应用

1981年,美国IBM公司将8088芯片用于其研制的IBM-PC机中从而开创了全新的微机时代。也正是从8088开始个人电腦(PC)的概念开始在全世界范围内发展起来。从8088应用到IBM PC机上开始,个人电脑真正走进了人们的工作和生活之中它也标志着一个新时代的开始。

1982姩英特尔公司在8086的基础上,研制出了80286微处理器该微处理器的最大

为20MHz,内、外部数据传输均为16位使用24位

能力为16MB。80286可工作于两种方式┅种叫实模式,另一种叫保护方式

在实模式下,微处理器可以访问的内存总量限制在1兆字节;而在保护方式之下80286可直接访问16兆字节的內存。此外80286工作在保护方式之下,可以保护操作系统使之不像实模式或8086等不受保护的微处理器那样,在遇到异常应用时会使系统停机

IBM公司将80286微处理器用在先进技术微机即AT机中,引起了极大的轰动80286在以下四个方面比它的前辈有显著的改进:支持更大的内存;能够模拟內存空间;能同时运行多个任务;提高了处理速度。

最早PC机的速度是4MHz第一台基于80286的AT机运行速度为6MHz至8MHz,一些制造商还自行提高速度使80286达箌了20MHz,这意味着性能上有了重大的进步

80286的封装是一种被称为PGA的正方形包装。PGA是源于PLCC的便宜封装它有一块内部和外部固体插脚,在这个葑装中80286集成了大约130000个晶体管。

转换逻辑和高位字节总线与XT机一样,CPU也是焊接在

第四阶段(1985—1992年)即32位微处理器1985年10月17日,英特尔划时玳的产品——80386DX正式发布了其内部包含27.5万个晶体管,

到4GB内存并可以管理64TB的

。它的运算模式除了具有实模式和保护模式以外还增加了一種“虚拟86”的工作方式,可以通过同时模拟多个8086微处理器来提供多任务能力

由于32位微处理器的强大运算能力,PC的应用扩展到很多的领域如商业办公和计算、工程设计和计算、

、个人娱乐。80386使32位CPU成为了PC工业的标准

1989年英特尔公司又推出准32位微处理器芯片80386SX。这是Intel为了扩大市場份额而推出的一种较便宜的普及型CPU它的内部数据总线为32位,外部数据总线为16位它可以接受为80286开发的16位输入/输出接口芯片,降低整机荿本80386SX推出后,受到市场的

的欢迎因为80386SX的性能大大优于80286,而价格只是80386的三分之一

1989年,我们大家耳熟能详的80486芯片由英特尔推出这款经過四年开发和3亿美元资金投入的芯片的伟大之处在于它首次实破了100万个晶体管的界限,集成了120万个晶体管使用1微米的制造工艺。80486的时钟頻率从25MHz逐步提高到33MHz、40MHz、50MHz

80486是将80386和数学协微处理器80387以及一个8KB的高速缓存集成在一个芯片内。80486中集成的80487的数字

是以前80387的两倍内部

缩短了微处悝器与慢速DRAM的等待时间。并且在80x86系列中首次采用了RISC(

内执行一条指令。它还采用了突发

方式大大提高了与内存的数据交换速度。由于這些改进80486的性能比带有80387数学协微处理器的80386 DX性能提高了4倍。

第5阶段(年)是奔腾(pentium)系列微处理器时代通常称为第5代。典型产品是Intel公司嘚奔腾系列芯片及与之兼容的AMD的K6系列微处理器芯片内部采用了超标量指令流水线结构,并具有相互独立的指令和数据高速缓存随着MMX(MultiMediaeXtended)微处理器的出现,使微机的发展在网络化、多媒体化和智能化等方面跨上了更高的台阶

早期的奔腾75MHz~120MHz使用0.5微米的制造工艺,后期120MHz频率鉯上的奔腾则改用0.35微米工艺经典奔腾的性能相当平均,整数运算和浮点运算都不错 为了提高电脑在

、3D图形方面的应用能力,许多新指令集应运而生其中最著名的三种便是英特尔的MMX、SSE和AMD的3D NOW!。 MMX(MultiMedia Extensions多媒体

)是英特尔于1996年发明的一项多媒体指令增强技术,包括57条多媒体指囹这些指令可以一次处理多个数据,MMX技术在软件的配合下就可以得到更好的性能。

多能奔腾(Pentium MMX)的正式名称就是“带有MMX技术的Pentium”是在1996年底发布的。从多能奔腾开始英特尔就对其生产的CPU开始锁倍频了,但是MMX的CPU超外频能力特别强而且还可以通过提高核心电压来超倍频,所鉯那个时候超频是一个很时髦的行动超频这个词语也是从那个时候开始流行的。

多能奔腾是继Pentium后英特尔又一个成功的产品其生命力也楿当顽强。多能奔腾在原Pentium的基础上进行了重大的改进增加了片内16KB

单元和返回堆栈技术。特别是新增加的57条MMX多媒体指令使得多能奔腾即使在运行非MMX优化的程序时,也比同主频的Pentium CPU要快得多

结合了Intel MMX技术,能以极高的效率处理影片、音效、以及绘图资料首次采用Single Edge Contact (S.E.C) 匣型封装,內建了高速快取

这款晶片让电脑使用者撷取、编辑、以及透过

和亲友分享数位相片、编辑与新增文字、音乐或制作家庭电影的转场效果、使用视讯

以及透过标准电话线与网际网络传送影片,Intel Pentium II处理器晶体管数目为750万颗

Pentium III 处理器加入70个新指令,加入网际网络串流SIMD延伸集称为MMX能大幅提升先进影像、3D、串流音乐、影片、语音辨识等应用的性能,它能大幅提升网际网络的使用经验让使用者能浏览逼真的线上博物館与商店,以及下载高品质影片Intel首次导入0.25微米技术,Intel Pentium III

与此同年英特尔还发布了PentiumIII Xeon处理器。作为PentiumII Xeon的后继者除了在内核架构上采纳全新设計以外,也继承了Pentium III处理器新增的70条指令集以更好执行多媒体、流媒体应用软件。除了面对企业级的市场以外Pentium III Xeon加强了电子商务应用与高階商务计算的能力。在缓存速度与系统总线结构上也有很多进步,很大程度提升了性能并为更好的多处理器协同工作进行了设计。

2000年嶊出的Pentium 4处理器内建了4200万个晶体管以及采用0.18微米的

。超线程技术打造出新等级的高性能桌上型电脑能同时快速执行多项运算应用,或针對支持多重线程的软件带来更高的性能超线程技术让电脑性能增加25%。除了为桌上型电脑使用者提供超线程技术外英特尔也达成另一项電脑里程碑,就是推出运作频率达3.06 GHz的Pentium 4处理器是首款每秒执行30亿个运算周期的商业

,如此优异的性能要归功于当时业界最先进的0.13微米制程技术

小组专门设计的新型移动CPU,Pentium M是

供笔记簿型个人电脑使用,亦被作为Centrino的一部分于2003年3月推出。公布有以下

得到高效能Banias作出了优化,使每个时钟所能执行的指令数目更多并通过高级

来降低错误预测率。另外最突出的改进就L2高速

增至1MB(P3-M和P4-M都只有512KB)估计Banias数目高达7700万的晶体管大部分就用在这上。

此外还有一系列与减少功耗有关的设计:增强型Speedstep技术是必不可少的了拥有多个供电电压和计算频率,从而使性能可以更好地满足应用需求

智能供电分布可将系统电量集中分布到

需要的地方,并关闭空闲的应用;移动电压定位(MVPIV)技术可根据处悝器活动动态降低电压从而支持更低的散热设计功率和更小巧的外形设计;经优化功率的400MHz系统总线;Micro-opsfusion微操作指令融合技术,在存在多個可同时执行的指令的情况下将这些指令合成为一个指令,以提高性能与电力使用效率专用的堆栈管理器,使用记录内部运行情况的專用硬件

为855系列,855芯片组由北桥芯片855和

ICH4-M组成北桥芯片分为不带内置

2005年Intel推出的双核心处理器有Pentium D和Pentium Extreme Edition,同时推出945/955/965/975芯片组来支持新推出的双核惢处理器采用90nm工艺生产的这两款新推出的双核心处理器使用是没有针脚的LGA 775接口,但处理器底部的贴片电容数目有所增加排列方式也有所不同。

桌面平台的核心代号Smithfield的处理器正式命名为Pentium D处理器,除了摆脱阿拉伯数字改用英文字母来表示这次双核心处理器的世代交替外D嘚字母也更容易让人联想起Dual-Core双核心的涵义。

Intel的双核心构架更像是一个双CPU平台Pentium D处理器继续沿用Prescott架构及90nm生产技术生产。Pentium D内核实际上由于两个獨立的2独立的Prescott核心组成每个核心拥有独立的1MB L2缓存及执行单元,两个核心加起来一共拥有2MB但由于处理器中的两个核心都拥有独立的缓存,因此必须保正每个二级缓存当中的信息完全一致否则就会出现运算错误。

为了解决这一问题Intel将两个核心之间的协调工作交给了外部嘚MCH(北桥)芯片,虽然缓存之间的数据传输与存储并不巨大但由于需要通过外部的MCH芯片进行协调处理,毫无疑问的会对整个的处理速度帶来一定的延迟从而影响到处理器整体性能的发挥。

由于采用Prescott内核因此Pentium D也支持EM64T技术、XD bit安全技术。值得一提的是Pentium D处理器将不支持Hyper-Threading技术。原因很明显:在多个物理处理器及多个逻辑处理器之间正确分配数据流、平衡运算任务并非易事比如,如果应用程序需要两个运算线程很明显每个线程对应一个物理内核,但如果有3个运算线程呢因此为了减少双核心Pentium D架构复杂性,英特尔决定在针对主流市场的Pentium D中取消對Hyper-Threading技术的支持

同出自Intel之手,而且Pentium D和Pentium Extreme Edition两款双核心处理器名字上的差别也预示着这两款处理器在规格上也不尽相同其中它们之间最大的不哃就是对于超线程(Hyper-Threading)技术的支持。Pentium D不支持超线程技术而Pentium Extreme Edition则没有这方面的限制。在打开超线程技术的情况下双核心Pentium Extreme Edition处理器能够模拟出叧外两个逻辑处理器,可以被系统认成四核心系统

Pentium EE系列都采用三位数字的方式来

,形式是Pentium EE8xx或9xx例如Pentium EE840等等,数字越大就表示规格越高或支歭的特性越多

、800MHzFSB的产品,其与PentiumD8x0系列的唯一区别仅仅只是增加了对

的支持除此之外其它的技术特性和参数都完全相同。

提高到1066MHzFSB除此之外其它的技术特性和参数都完全相同。

775接口不仅能够有效提升处理器的信号强度、提升处理器频率同时也可以提高处理器生产的良品率、降低生产成本。

第6阶段(2005年至今)是酷睿(core)系列微处理器时代通常称为第6代。“酷睿”是一款领先节能的新型微架构设计的出发點是提供卓然出众的性能和能效,提高每瓦特性能也就是所谓的能效比。早期的酷睿是基于笔记本处理器的 酷睿2:英文名称为Core 2 Duo,是英特尔在2006年推出的新一代基于Core微架构的产品体系统称于2006年7月27日发布。酷睿2是一个跨平台的构架体系包括服务器版、桌面版、移动版三大領域。其中服务器版的开发代号为Woodcrest,桌面版的开发代号为Conroe移动版的开发代号为Merom。

酷睿2处理器的Core微架构是Intel的以色列设计团队在Yonah微架构基礎之上改进而来的新一代英特尔架构最显著的变化在于在各个关键部分进行强化。为了提高两个核心的内部数据交换效率采取共享式二級缓存设计2个核心共享高达4MB的二级缓存。

继LGA775接口之后Intel首先推出了LGA1366平台,定位高端旗舰系列首颗采用LGA 1366接口的处理器代号为Bloomfield,采用经改良的Nehalem核心基于45纳米制程及原生四核心设计,内建8-12MB三级缓存LGA1366平台再次引入了Intel超线程技术,同时QPI总线技术取代了由Pentium 4时代沿用至今的前端总線设计最重要的是LGA1366平台是支持三通道对cpu的请求形式内存设计的平台,在实际的效能方面有了更大的提升这也是LGA1366旗舰平台与其他平台定位上的一个主要区别。

作为高端旗舰的代表早期LGA1366接口的处理器主要包括45nm Bloomfield核心酷睿i7四核处理器。随着Intel在2010年买入32nm工艺制程高端旗舰的代表被酷睿i7-980X处理器取代,全新的32nm工艺解决六核心技术拥有最强大的性能表现。对于准备组建高端平台的用户而言LGA1366依然占据着高端市场,酷睿i7-980X以及酷睿i7-950依旧是不错的选择

,也就是处理器能以八线程运行根据网上流传的测试,同频Core i7比Core 2 Quad性能要高出很多

为3.2GHz的属于Intel Core i7 Extreme,处理器售价為999美元当然这款顶级处理器面向的是发烧级用户。而频率较低的2.66GHz的定价为284美元约合1940元人民币,面向的是普通消费者全新一代Core i7处理器將于2013年第四季度推出。

渲染结果很惊人。渲染开始后四颗核心的八个

同时开始工作,仅仅19秒钟后完整的画面就呈现在了屏幕上得分超过45800。相比之下core2 extreme qx GHz只能得到一万两千分左右,

到4.0GHz才勉强超过15000分不到core i7的3分之一。core i7的超强实力由此可窥见一斑

Core i5是一款基于Nehalem架构的四核处理器,采用整合内存控制器三级缓存模式,L3达到8MB支持Turbo Boost等技术的新处理器电脑配置。它和Core i7(Bloomfield)的主要区别在于总线不采用QPI采用的是成熟嘚DMI(Direct Media Interface),并且只支持双通道对cpu的请求形式的DDR3内存结构上它用的是LGA1156 接口,Core i7用的是LGA1366i5有睿频技术,可以在一定情况下超频

Core i3可看作是Core i5的进一步精简版(或阉割版),将有32nm工艺版本(研发代号为Clarkdale基于Westmere架构)这种版本。Core i3最大的特点是整合GPU(图形处理器)也就是说Core i3将由CPU+GPU两个核心葑装而成。由于整合的GPU性能有限用户想获得更好的3D性能,可以外加显卡值得注意的是,即使是Clarkdale显示核心部分的制作工艺仍会是45nm。i3 i5 区別最大之处是 i3没有睿频技术

2010年6月,Intel再次发布革命性的处理器——第二代Core i3/i5/i7第二代Core i3/i5/i7隶属于第二代智能酷睿家族,全部基于全新的Sandy Bridge微架构楿比第一代产品主要带来五点重要革新:1、采用全新32nm的Sandy Bridge微架构,更低功耗、更强性能2、内置高性能GPU(核芯显卡),视频编码、图形性能哽强 3、睿频加速技术2.0,更智能、更高效能4、引入全新环形架构,带来更高带宽与更低延迟5、全新的AVX、AES指令集,加强浮点运算与加密解密运算

)是英特尔在2011年初发布的新一代

微架构,这一构架的最大意义莫过于重新定义了“

”的概念与处理器“无缝融合”的“

”的時代。这一创举得益于全新的32nm制造工艺由于Sandy Bridge 构架下的处理器采用了比之前的45nm工艺更加先进的32nm制造工艺,理论上实现了CPU功耗的进一步降低及其

尺寸和性能的显著优化,这就为将整合图形核心(核芯显卡)与CPU封装在同一块基板上创造了有利条件此外,第二代酷睿还加入了铨新的

视频处理单元视频转解码速度的高与低跟处理器是有直接关系的,由于高清视频处理单元的加入新一代

的视频处理时间比老款處理器至少提升了30%。新一代Sandy Bridge处理器采用全新LGA1155接口设计并且无法无LGA1156接口兼容。Sandy Bridge是将取代Nehalem的一种新的微架构不过仍将采用32nm工艺制程。比较吸引人的一点是这次Intel不再是将CPU核心与GPU核心用“胶水”粘在一起而是将两者真正做到了一个核心里。

在2012年4月24日下午北京天文馆intel正式发布叻

(IVB)处理器。22nm Ivy Bridge会将执行单元的数量翻一番达到最多24个,自然会带来性能上的进一步跃进Ivy Bridge会加入对DX11的支持的

。另外新加入的XHCI USB 3.0控制器则囲享其中四条通道对cpu的请求形式从而提供最多四个USB 3.0,从而支持原生USB3.0cpu的制作采用3D晶体管技术的CPU耗电量会减少一半。

算术逻辑单元ALU主要完荿算术运算(+-、×、÷、比较)和各种逻

辑运算(与、或、非、异或、移位)等操作。ALU是组合

的功能因而必须有保存操作数的两个

AC,累加器既向ALU提供操作数又接收ALU的运算结果。

阵列实际上相当于微处理器内部的RAM它包括

组和专用寄存器组两部分,通用寄存器(AB,CD)用来存放参加运算的数据、中间结果或地址。它们一般均可作为两个8位的

来使用处理器内部有了这些

之后,就可避免频繁地访问

执行時间提高机器的运行速度,也给编程带来方便专用

PC、堆栈指示器SP和

FR,它们的作用是固定的用来存放地址或地址基值。其中:

PC用来存放下一条要执行的

地址因而它控制着程序的执行顺序。在

指令的条件下每取出指令的一个字节,PC的内容自动加1当程序发生转移时,僦必须把新的

地址(目标地址)装入PC这通常由转移指令来实现。

B)堆栈指示器SP用来存放栈顶地址

。它按“后进先出”方式工作当新嘚数据压入

时,栈中原存信息不变只改变栈顶位置,当数据从栈弹出时弹出的是栈顶位置的数据,弹出后自动调正栈顶位置也就是說,数据在进行压栈、

操作时总是在栈顶进行。

一旦初始化(即确定了栈底在内存中的位置)后SP的内容(即栈顶位置)使由CPU自动管理。

定时与控制逻辑是微处理器的核心控制部件负责对整个计算机进行控制、包括从

,分析指令(即指令译码)确定指令操作和

地址取操作数,执行指令规定的操作送运算结果到存储器或I/O端口等。它还向微机的其它各部件发出相应的

使CPU内、外各部件间协调工作。

必须指出微处理器本身并不能单独构成一个独立的工作系统,也不能独立地执行程序必须配上存 储器、输入输出设备构成一个完整的

用来存放当前正在使用的或经常使用的程序和数据。

工作过程中CPU可根据需要随时对其内容进行读或写操作。RAM是

即其内容在断电后会全部丢夨,因而只能存放暂时性的程序和数据ROM的内容只能读出不能写入,断电后其所存信息仍保留不变是非易失性存储器。所以ROM常用来存放詠久件的程序和

、操作系统中的基本输入、输出管理程序BIOS等

及各种控制对象并与外界进行信息交换的逻辑控制

。由于外设的结构、工作速度、信号形式和数据格式等各不相同因此它们不能直接挂接到

上,必须用输入/输出接口

来做中间转换才能实现与CPU间的信息交换。I/O接ロ也称I/O适配器不同的外设必须配备不同的I/O适配器。I/O接口

是微机应用系统必不可少的重要组成部分任何一个微机应用系统的研制和设计,实际上主要是I/O接口的研制和设计因此I/O

是本课程讨论的重要内容之一,我们将在第八章中详细介绍

中各部件之间传送信息的公共通道對cpu的请求形式,是

的重要组成部件它由若干条通信线和起驱动,隔离作用的各种三态门器件组成

,即构成微机的各功能部件(微处理器、

等)之间通过总线相连接这是微型计算机系统结构上的独特之处。采用

之后使系统中各功能部件间的相互关系转变为各部件面向總线的单一关系,一个部件(功能板/卡)只要符合

就可以连接到采用这种总线标准的系统中,从而使系统功能扩充或更新容易、结构简單、可靠性大大提高在

中,根据他们所处位置和应用场合

可被分为以下四级,如图1.4所示

:它位于微处理器芯片内部,故称为芯片

鼡于微处理器内部ALU和各种寄存器等部件间的互连及信息传送(如图1.3中的

)。由于受芯片面积及对外引脚数的限制片

,这有利于芯片集成喥和成品率的提高如果要求加快内部数据

,也可采用双总线或三总线结构

(2)片总线:片总线又称元件级(芯片级)总线或

。微机主板、单扳机以及其它一些插件板、卡(如各种I/O接口板/卡)它们本身就是一个完整的子系统,板/卡上包含有CPURAM,ROMI/O接口等各种芯片,这些芯片间也是通过

来连接的因为这有利于简化结构,减少连线提高可靠性,方便信息的传送与控制通常把各种板、卡上实现芯片间相互连接的总线称为片总线或元件级总线。

来说各种板/卡只是一个子系统,是一个局部故又把片总线称为

,而把用于连接微机各功能部件插卡的总线称为

是一个重要的概念我们将在第七章中讨论。

或板级总线因为该总线是用来连接微机各功能部件而构成一个完整

的,洳图1.2中所示所以称之为

中最重要的总线,人们平常所说的微机总线就是指系统总线如PC总线、AT总线(ISA总线)、PCI总线等。

是我们要讨论的偅点内容之一

上传送的信息包括数据信息、地址信息、控制信息,因此系统总线包含有三种不同功能的总线,即

DB用于传送数据信息

昰双向三态形式的总线,即他既可以把CPU的

或I/O接口等其它部件也可以将其它部件的数据传送到CPU。

的一个重要指标通常与微处理的字长相┅致。例如Intel 8086微处理器

也是16位需要指出的是,数据的含义是广义的它可以是真正的数据,也可以

代码或状态信息有时甚至是一个控制信息,因此在实际工作中,

上传送的并不一定仅仅是真正意义上的数据

AB是专门用来传送地址的,由于地址只能从CPU传向外部

或I/O端口所鉯地址总线总是单向三态的,这与

的内存空间大小比如8位微机的地址总线为16位,则其最大可

为2^16=64KB16位微型机的地址总线为20位,其可寻址空間为2^20=1MB一般来说,若

(4)外总线:也称通信总线用于两个系统之间的连接与通信,如两台

之间、微机系统与其他电子仪器或

之间的通信常用的通信总线有

,VXI总线和RS-232串行总线等外总线不是

本身固有的,只有微型机应用系统中才有

)的缩写,它是计算机中最重要的一个蔀分由

和控制器组成。如果把计算机比作人那么CPU就是人的大脑。CPU的发展非常迅速个人电脑从8088(XT)发展到Pentium 4时代,只经过了不到二十年的时間

K5是AMD公司第一个独立生产的x86级

,发布时间在1996年由于K5在开发上遇到了问题,其上市时间比

的Pentium晚了许多再加上性能不好,这个不成功的產品一度使得AMD的市场份额大量丧失K5的性能非常一般,整数运算能力不如

能力远远比不上Pentium但稍强于Cyrix。综合来看K5属于实力比较平均的那┅种产品。K5低廉的价格显然比其性能更能吸引消费者低价是这款CPU最大的卖点。 AMD 自然不甘心Pentium在CPU市场上呼风唤雨因此它们在1997年又推出了K6。K6这款CPU的设计指标是相当高的它拥有全新的MMX

MMX多了一倍),整体性能要优于奔腾MMX接近同

PⅡ的水平。K6与K5相比可以平行地处理更多的

上。AMD茬整数运算方面做得非常成功K6稍微落后的地方是在运行需要使用到MMX或

的应用程序方面,比起同样频率的Pentium 要差许多

面积168平方毫米(新产品為68平方毫米),使用Socket7架构。 Cyrix 也算是一家老资格的CPU开发商了早在x86时代,它和英特尔AMD就形成了三雄并立的局面。

AMD于1998年4月正式推出了K6-2微处理器它采用0.25微米工艺制造,芯片面积减小到了68平方毫米晶体管数目也增加到930万个。另外K6-2具有64KB L1 Cache,二级缓存集成在

上容量从512KB到2MB之间,速度与

同步工作电压为2.2V,支持Socket 7架构

的“结合物”。3D Now!技术是对x86体系的重大突破它大大加强了处理3D图形和多媒体所需要的密集

性能。此外K6-2支持

,这意味着系统与L2缓存和内存的传输率提高近50%从而大大提高了整个系统的表现。 作为Cyrix公司独自研发的最后一款微处理器Cyrix MⅡ是于1998年3月开始生产的。除了具有6x86本身的特性外,该微处理器还支持MMX

其核心电压为2.9V,具有256

;核心内集成650万个晶体管,功耗20.6瓦;64KB

AMD于1999年2月推出了玳号为“Sharptooth”(利齿)的K6-Ⅲ它是该公司最后一款支持Super 7架构和CPGA封装形式的CPU,采用0.25微米

、内核面积是135平方毫米集成了2130万个晶体管,工作电压为2.2V/2.4V

相对于K6-2而言,K6-Ⅲ最大的变化就是内部集成了256KB二级缓存(新赛扬只有128KB)并以CPU的

速度运行。K6-Ⅲ的这一变化将能够更大限度发挥高

的優势此外,该微处理器还带有64KB

另32KB用于数据),而且在

其容量大小从512KB到2MB之间。 1999年6月23日AMD公司推出了具有重大战略意义的K7微处理器,並将其正式命名为AthlonK7有两种规格的产品:第一种采用0.25微米工艺制造,使用K7核心工作电压为1.6V(其

速度的一半运行);第二种采用0.18微米工艺制造,使用K75核心;工作电压有1.7V和1.8V两种上述两种类型的K7微处理器内部都集成了2130万个晶体管,

同时,它还采用了全新的宏处理结构拥有三个並行的x86

;K7拥有一个强劲的浮点处理单元,在3DNOW!指令的帮助下会有更进一步的3D和多媒体处理能力这个先进的FPU使K7拥有超越其他x86微处理器2倍的性能!另外,K7采用了一种类似于Slot 1的全新的Slot A架构从

上两者可以互换,但后者的电器性能和前者完全不兼容在

达200MHz;Athlon是AMD第一个具有SMP(对称多微处理器技术)能力的桌面CPU,即使用者可以用Athlon构建双微处理器甚至4微处理器系统! AMD公司在2000年6月份连续推出了新款的Thunderbird(雷鸟)、Duron(

)微处悝器再次向英特尔Coppermine(铜矿)核心的微处理器发出了强有力的挑战。

Thunderbird是AMD面向高端的Athlon系列延续产品采用0.18微米的制造工艺,共有Slot A和Socket A两种不同嘚架构但它们在设计上大致相同:均内置128KB的

和256KB的二级缓存,其二级缓存与CPU

速度同步运行;工作电压为1.70V~1.75V相应的功耗也比老的Athlon要小;集成3700萬个晶体管,核心面积达到120平方毫米

,提供巨大的带宽且支持Alpha EV6总线协议,具有多重并行x86

Duron微处理器是AMD首款基于Athlon核心改进的低端微处理器它原来的研发代号称为“Spitfire”。Duron

和64KB的全速二级缓存它的工作电压为1.5V,因而功耗要较Thunderbird小而且它核心面积是100平方毫米,内部集成的晶体管數量为2500万个比K7核心的Athlon多300万个。这些特点符合了AMD面对低端市场的策略即低成本低功耗而又高性能。在浮点性能上基于K7体系的Duron明显优于采用P6核心设计的Intel系列微处理器,它具有三个全流水

单元一个用于加/减运算,一个用于复合

1975年IBM公司生产了几款基于RISC 设计的处理器。其中801僦是RISC之父John Cocke的杰作最终15年后设计出Power 架构系列产品,若干年后更出出现一个影响深远的RISC结构的芯片系列ARM

架构被工业界认可后发展起的一种,HP的HPPA-RISC

1975姩摩托罗拉推出 6800 ,该款处理器拥有78条指令集摩托罗拉很多款单片装处理器和微处理器的设计思想都来源于6800 ,即使曾经很流行功能强大嘚6809 也是继承了6800 血统1985年,摩托罗拉推出MC68010和已经命名为88000的32位RISC处理器系列但1990年由于要全力研制PowerPC而被迫停产。

Z-80是由从Intel离走的Frederico Faggin设计的8位微处理器被认为是8080的增强版,------是也是当年很牛的一款单片机比后来风光无限的51系列更早进入中国,八十年代初学校都是以Z80为基础教学那种需偠用电视作显示器的单板电脑就是用的这种芯片。

不过最先推出的单芯片16位处理器当数TI TMS 9900虽然出道后势头强劲,但TI为了发展DSP业务不得不茬1982年缩小9900的产量

半导体行业另一巨头,美国国家半导体公司就是后来收购了设计X86系列处理器的Cyrix公司的,这是1983年由国家半导体(National Semiconductor)推出NS32032吔是一款

架构的处理器在个人电脑应用中只有POWERPC芯片的市场还算比较成功,其它的都可以说很失败不过在另一领域:嵌入式应用中,RISC架构嘚处理器确是风光无限

1981年,由斯坦福大学和部分研究者研制出

它通过简化指令的操作周期,解决了流水线的瓶颈-联锁问题促成

1982年,由美国伯克利大学研制的RISC-I只有32条指令,并且具有流水线操作和使用寄存器窗口性能比同时代单芯片设计都优越

是一家芯片设计公司,自己不生产芯片而是通过授权生产来发展

系列处理器 。ARM公司在1990年11月英国剑桥的一个谷仓里成立最初只有12人,经过11年多的发展今日嘚ARM公司已经拥有700多名员工,其中60%以上都从事研发工作

是一家既不生产芯片(fabless)也不销售芯片(chipless)的公司,它通过出售芯片技术授权建竝起新型的微处理器设计、生产和销售商业模式。更重要的是这种商业模式取得极大的成功,采用ARM技术IP核的微处理器遍及各类电子产品:汽车、消费电子、成像、工业控制、海量存储、网络、安保和无线等市场ARM技术几乎无处不在。ARM将其技术授权给世界上许多著名的半导體、软件和OEM厂商每个厂商得到的都是一套独一无二的ARM相关技术及服务。利用这种合伙关系ARM很快成为许多全球性RISC标准的缔造者。目前總共有30家半导体公司与ARM签订了硬件技术使用许可协议,其中包括Intel、IBM、LG半导体、NEC、SONY、菲利浦和国民半导体这样的大公司至于软件系统的合夥人,则包括微软、升阳和MRI等一系列知名公司

2004年2月18日,由清华大学自主研发的32位微处理器THUMP芯片终于领到了由国家教育部颁发的“身份证”:典型

400MHz功耗1.17mW/MHz,芯片颗粒40片最高工作频率可达500MHz,是目前国内工作频率最高的微处理器 “这标志着我国在自主研发CPU芯片领域迈开了实質性的一大步。”教育部对THUMP的诞生给予了较高评价

1号、龙芯2号的基础上,中国正在自主研发新一代的龙芯3号

为900MHz~1GHz,功耗约15W频率为1GHz时雙精度浮点运算速度峰值达到每秒160亿次,单精度浮点运算速度峰值每秒320亿次龙芯3A采用意法半导体公司(STMicro)65纳米CMOS工艺生产,晶体管数目达4.25億个芯片采用BGA封装,引脚的数目为1121个功耗小于15瓦。 龙芯3A集成了四个64位

与MIPS64兼容并通过指令扩展支持X86

3号在包括服务器、高性能计算机、低能耗

、个人高性能计算机、高端

应用、高吞吐计算应用、工业控制、

、高端嵌入式应用等产品中具有广阔的市场应用前景

}

我要回帖

更多关于 cpu通道 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信