VLIW架构处理器编译器中兴
1. 服务器选型的按处理器指令集架构
按照处理器指令集架构划分,可以将服务器分为CISC架构服务器、RISC架构服务器和VLIW架构服务器三种。其中CISC即复杂指令系统计算机,该类型处理器主要以IA-32架构为主。RISC即精简指令集计算机,该类型代表性产品为HP公司的PA-RISC、IBM公司的Power系列以及Sun公司的UltraSPARC系列。VLIW即超长指令集架构,其代表性产品为Intel IA-64和AMD X86-64系列。 主域控制器是网络、用户和计算机的皮消管理中心,负责提供安全的网络工作环境。主域控制器不但响应用户的登录需求,而且在服务器间同步和备份用户帐号、WINS和DHCP数据库等,另外,主域控制器还做DNS服务。系统瓶颈脊笑是网络燃野知子系统、内存。
内容比较多,自己网络去吧:“e-works服务器选型”
2. 硬科技:回顾消失在历史洪流的Intel旗舰处理器Itanium(中)
前情提要:“硬科技:回顾消失在历史洪流的Intel旗舰处理器Itanium(上)”。俗语说的好:过犹不及,物极必反。为了摆脱昔日x86包袱而过度反动的IA-64,早在Intel公布指令集架构之际,就不乏来自外界的质疑,尤其同时拥有CISC大型主机(S/360体系,zSeries, System Z)和RISC效能王者(Power体系,pSeries, System P)的蓝色巨人IBM,对IA-64的专业批评,事隔多年,通通一语成谶。
2000年的Microprocessor Forum,就上演了IBM与宣称“非循序执行超纯量处理器已经过时”的Intel/HP阵营,针锋相对的强碰戏码。IBM提出了2个重点,细节就在此不赘述了。
首先,程式码体积过大:根据IBM内部的评估,VLIW的IA-64因编译器不见得可以指令塞好塞满、先天较长的指令编码(3个指令128位元,一般RISC都固定为32位元)、引述执行、预测载入、缺乏基底偏移载入寻址模式([base + disp],少了会增加多余的位址计算,蛮蠢的),以及整数乘除法无法直接使用通用暂存器作运算元(这非常的愚蠢,后面会提)等诸多因素,IA-64的程式码体积将是x86的4.8倍,经过最佳化后也高达3.7倍,笔者当年还听过“8倍”的版本。
程式码过肥的直接影响就是:IA-64指令集相容处理器需要更充裕的记忆体频宽和更租粗大型化的快取记忆体,导致Itanium发展历程屡创快取容量的世界纪录。当然,这奠定了Intel日后在快取记忆体领域的技术优势,但这也是事后诸葛的马后炮了。
其次,为了追求最高指令平行化而生的大型化资料暂存器群,与伴随而来的庞大执行运算单元,也不利于提升处理器时脉。也许科科会反问:时下超纯量动态指令排程处理器的实体暂存器数量也没比较少啊?近代GPU更是成千上万,但“结构上可见”让软体雹型薯直接存取的资料暂存器,和用来“默默垫档”的实体暂存器,复杂度完全是两码子事。
即使IBM也许基于身为潜在竞争对手的立场“酸”个几句,但这也证明了蓝色巨人对于指令集设计和高阶处理器的认知,远非当时的Intel和HP所能望其项背。最近因荣获计算机工业最高荣誉图灵奖(Turing Award)2位创源者造RISC一词的计算机结构大师,在资讯科班学生尔孰能详非读不可的教科书中,就毫不留情的做出和IBM同样的批判:Itanium只是时脉上不去的平庸整数运算处理器。
接着就是Intel自己那令人感到匪夷所思的蠢事了。按照常识,由大到小,“指令集架构(电脑的语言)”是战略,“处理器微架构(执行语言的载具)”是作战,“设计实作与制造”则是战术,但Intel却反过来,往往以“利于制造”作为思考的出发点,套句普鲁士名将老毛奇的名言:“只要战术成功,战略可以让步”,这也许就是Intel设计指令集的信念,所以x86指令集会如此的毫无道理可循,事后想想,好像也不会让人感到惊讶。
Intel设计IA-64指令集干下的蠢事,保证让各位科科看到瞠目结舌,事后有没有亡羊补牢就不重要了。
IA-64的整数除法指令,竟然无法直接使用通用暂存器,而是必须先把数值传递到浮点暂存器,才能执行。谁能告诉我这是想干嘛? IA-64的浮点除法指令,是透过乘积和指令(Multiply-Add,如A x B + C)进行倒数运算,为维持和x87 80位元浮点相同的精确度,浮点暂存器宽度增加到82位元。有没有听过因小失大这个成语? IA-64没有自动加长资料长度的Sign-Extended载入指令,无法直接将32位元值载入至64位元的通用暂存器。但在x86的世界,早从“8086”就有这样的指令了,拜托,相隔30年耶。 最后,就是前面提到的,IA-64欠缺基底偏移寻址模式([base + disp]),进行资料载入与回存,需额外执行位址计算的指令,相对于寻址模式太多太乱的x86,IA-64却是极度精简到连最该有的东西都不见,蛮纳闷Intel研发团队的决策动机是什么,难道是用研究案的心态去做事吗?回过头来,就算IA-64存在这些让人满脸黑直线的低级缺陷,烂到爆炸的x86指令集都可以存活下来了,那整体来说只会更好不会更坏的IA-64为何就不行?ㄨ
提醒各位科科,天底下任何史诗级的惨剧,都是天时地利人和交互核子反应的总和,而“人和”:Intel自身的内部管理和行销策略,更是“功不可没”,值得大书特书,成为计算机工业史上被撕掉的一页。
看不过瘾?还想继续看说书的说下去?接着看下集吧!“硬科技:回顾消失在历史洪流的Intel旗舰处理器Itanium(下)”
3. 微码详细资料大全
微码 (英语:microcode),又称 微指令 ,是在CISC结构下,运行一些功能复杂的指令时,所分解一系列相对简单的指令。相关的概念最早在1947年开始出现。
基本介绍
- 中文名 :微码
- 外文名 :Microcode
- 别称 :微程式
简介
微指令 (英语:microcode),又称 微码 ,是在CISC结构下,运行一些功能复杂的指令时,所分解一系列相对简单的指令。相关的概念最早在1947年开始出现。 微指令的作用是将机器指令与相关的电路实现分离,这样一来机器指令可以更自由的进行设计与修改,而不用考虑到实际的电路架构。与其他方式比较起来,使用微指令架构可以在降低电路复杂度的同时,建构出复杂的多步骤机器指令。撰写微指令一般称为微程式设计(microprogramming),而特定架构下的处理器实做中微指令有时会称为微程式(microprogram)。 现代的微指令通常由CPU工程师在设计阶段编写,并且存储在唯读记忆体(ROM, read-only-memory)或可程式逻辑数组(PLA, programmable logic array)中。然而有些机器会将微指令存储在静态随机存取记忆体(SRAM)或是快闪记忆体(flash memory)中。它通常对普通程式设计师甚至是汇编语言程式设计师来说是不可见的,也是无法修改的。与机器指令不同的是,机器指令必须在一系列不同的处理器之间维持兼容性,而微指令只设计成在特定的电路架构下运行,成为特定处理器设计的一部分。微程扰物晌式设计技术
微程式设计技术,指的是用软体技术来实现硬体设计的一种技术。指令集架构
指令集架构 (英语:Instruction Set Architecture,缩写为ISA),又称 指令集 或 指令集体系 ,是计算机体系结构中与程式设计有关的部分,包含了基本数据类型,指令集,暂存器,寻址模式,存储体系,中断,异常处理以及外部I/O。指令集架构包含一系列的opcode即操作码(机器语言),以及由特定处理器执行的基本命令。 指令集体系与微架构(一套用于执行指令集的微处理器设计方法)不同。使用不同微架构的电脑可以共享一种指令集。例如,Intel的Pentium和AMD的AMD Athlon,两者几乎采用相同版本的x86指令集体系,但是两者在内部设计上有本质的区别。 一些虚拟机器支持基于Smalltalk,Java虚拟机,微软的公共语言运行时虚拟机所生成的位元组码,他们的指令集体系将bytecode(位元组码)从作为一般手段的代码路径翻译成本地的机器语言,并通过解译执行并不常用的代码路径,全美达以相同的方式开发了基于x86指令体系的VLIW处理器。指令集的分类
复杂指令集计算机包含许多应用程式中很少使用的特定指令,由此产生的缺陷是指令长度不固定。精简指令集计算机通过只执行在程式中经常使用的指令来简化处理器的结构,而特殊操作则以子程式的方式实现,它们的特殊使用通过处理器额外的执行时间缓锋来弥补。理论上的重要类型还包括最小指令集计算机与单指令集计算机,但都未用作商业处理器。另外一种衍生类型是超长指令字,处理器接受许多经过编码的指令并通过检索提取出一个蚂哪指令字并执行。机器语言
机器语言是由声明和指令所组成的。在处理结构上,一个特定指令指明了以下几个部分:- 用于算术运算,寻址或者控制功能的特定暂存器;
- 特定存储空间的地址或偏移量;
- 用于解译操作码的特定寻址模式。
复杂指令集
复杂指令集 (英文: Complex Instruction Set Computing ;缩写: CISC )是一种微处理器指令集架构,每个指令可执行若干低阶操作,诸如从记忆体读取、储存、和计算操作,全部集于单一指令之中。与之相对的是精简指令集。 复杂指令集的特点是指令数目多而复杂,每条指令字长并不相等,电脑必须加以判读,并为此付出了性能的代价。 在精简指令集处理器发迹以前,许多电脑架构尝试跨越“语义鸿沟”──设计出借由提供“高阶”指令支援高阶程式语言的指令集,诸如程式调用和返回,循环指令诸如“若非零则减量和分支”和复杂寻址模式以允许数据结构和阵列存取以结合至单一指令。与复杂指令集相比,精简指令集实现更容易,指令并行执行程度更好,编译器的效率更高。 属于复杂指令集的处理器有CDC 6600、System/360、VAX、PDP-11、Motorola 68000家族、x86等。参见
- 微架构
- 计算机系统结构
4. 新HD8750M独显游戏本 宏碁E1-451G首测
【IT168 评测】在桌面台式机和DIY平台上,新一代GCN架构的AMD HD7000系列显卡可以说风光无限,尤其是采用了28nm工艺后,产品的功耗大幅下降同时性能也有很大提升。当时很多网友都寄希望于能够尽早拿到新架构的独显笔记本产品,但是一直没有现身。今天我们IT168终于抢先一步拿弊缺到了这款产品,这是一款搭载了AMD最新架构移动版图形核心HD8750M的产品,宏碁Aspire E1-451G。
▲新架构新性能 宏碁Aspire E1-451G评测
全新的显示核心虽然AMD官方并未确认该产品是否支持双显卡交火,但编辑升级最新13.1版本的催化剂驱动后,发现依然可以通过双显卡交火技术与APU内置的融核单显共同工作,从而进一步提升性能。下面我们在测试这款产品之前,首先了解一下全新的HD8000M系列独显核心的命名规则与参数。
▲新一代AMD Radeon HD 8000M系列独显
正如上图所示,在移动端,AMD Radeon HD 8000M系列独显核芯今年的产品线更为丰富,总共7个型号(根据显存会划分11个小型号),GCN架构将全面覆盖各级用户群。最高型号是HD 8870M进一步扩展主流与高端市场,其单精度峰值运算能力突破992 GFLOPS,内置640个流处理器,图形核心主频高达725~775MHz,128位GDDR5显存,将支持PCI-E3.0 x16的通道,实际显存位宽高达72GB/s。
我们今天测试的这款HD8750M属于主流性能级别的产品,它相比高端HD88xx系列将流处理的数量削减为了384个,相应的纹理单元,着色器都有所减小,但主频还是很高的,620~775GHz,并且通过Boost技术可以到670~725MHz,配置了GDDR5显存后,单精度浮点峰值运算能力可以到537-633 GFLOPS。从参数上来看,这款显卡很有可能与Geforce GT640M同属一个级别,将用于取代上代HD7690M XT,而且这个数据在后面我们也有验证。
▲全新的HD 8750M独显核心
2012年的独显笔记本市场,AMD主流独显产品比较少,面对对手的28nm开普勒架构的GT640M、GT650M比较吃紧,即使后来我们看到有HD 7730M、HD7750M等主流产品出现,但可选的笔记本产品还是比较少。因此2013年全新的HD 8000M系列显示核心就显得意义非凡了,编辑比较看好GCN架构的产品,因为它工艺先进,功耗更低,更适合在移动平台使用,28nm良品率上来,也会使得成本得以更好控制。
小贴士:
▲AMD独显三大技术特点
GCN架构(AMD Graphics Core Next):全新架构建立了统一的虚拟缓存,将编译器的吞吐性能进一步提升,而且该架构更具灵活性与可编程性,在硬件效率上更胜缓卜纯一筹,全新的HD8800M与HD8700M系扰咐列GPU核心将提供对Windows8,DirectX11.1的支持,这代核心全部采用28nm工艺制造,进一步平衡了续航时间与性能。
Enro技术:AMD的智能管理技术,可以根据系统负载情况自动开启关闭GPU模块,保证系统有足够性能的同时获得更好的续航时间。
APP Acceleration:这项技术可以使GPU资源用于加速应用,可以实现一些诸如视频防抖,画质提升,去噪点等功能。同时HD8000M系列独显核心还可以用作网络流媒体,3D蓝光,网页浏览等应用的加速。
HD8750M 与HD 7750M是马甲么?
实际上二者同属于GCN架构,但并非马甲。
全新的HD8000M系列图形核心是GCN2.0架构?
目前我们拿到的产品并不是GCN2.0。
AMD最新GCN架构带来新改变
一致性缓存,提升数据调用与共享的速率,提升性能降低功耗
过去,GPU内部核心通信需要程序员或者编译着插入明确的同步指令,来将共享数据送回内存,这种设计虽然简单,但是增加了共享数据和应用程序的开销,效率不高。而GCN架构将打通核心之间的算法沟通,将L2缓存数据格式统一,GPU各核心直接调用其中数据,比显存共享数据更快。
▲缓存一致性架构
另外,GCN架构还在CPU与GPU之间引入了虚拟内存,简化了CPU与独显之间的数据移动,CPU与GPU无缝共享一个单一地址空间,共享数据,而不用复制转移。这对于提高效率,降低功耗起到了至关重要的作用。
高度并行的SIMD,GCN精简架构,提高性能
早起的VLIW受限于编译器的性能,寄存器端口冲突,硬件资源没法充分利用,GCN架构中,采用了性能更高,更简单的矢量寄存器,寄存器文件可以分成独立的四个分区,矢量寄存器(vGPRs)含有64个通道,32bits位宽,相邻组合起来,每个SIMD有vGPRs 64KB分区,这样保证了带宽,消除了端口冲突,这也使得硬件运算资源更加趋于饱和。
▲GCN计算单元
两个新的指令:4x1 SAD和Quad SAD,提升GPU相关应用程序性能(比如视频稳定技术SteadyVideo2.0)
兼具灵活性与可编程性,为加速异构应用带来无限可能
全新架构不仅带来了更强大的运算效率,同时在底层异构运算上也做了巨大的优化,相比过去,GPU已经不仅仅是一个简单的图形中心,GCN架构将使得其具有高度的可编程性,使用更加灵活。AMD积累的CPU与GPU设计经验,将二者优势进一步融合。新产品可以通过DirectCompute、OpenCL、C ++ AMP等关键行业标准访问GPU,进而加速了主流应用程序,最终将实现无缝异构计算。
整体来讲,GCN架构在统一指令流、标量管线调度等功能上,以及真正的工作中提高了GPU利用率,实现更高性能。基于28nm工艺第一代GCN架构GPU,其每瓦性能和每平方毫米性能均比前代产品提升50%!
AMD最新HD8750M独显笔记本理论性能
当然,光看理论的参数和介绍还不足以证明新显卡的实际效果,下面我们就来实际测试下搭载HD8750M这款主流独显的笔记本,宏碁Aspire E1-451G。机器就不多讲了,3499元的E1-471G可是入门娱乐首选(也是销量冠军),只是这是一款搭载APU A8处理器的产品,外观上稍有不同而已。
宏碁Aspire E1-451G
参数名称参数规格
处理器
AMD四核 A8-4500M APU(1.9~2.8GHz)
芯片组
AMD Hudson-3L
内存
2×4GB DDR3-1600MHz
显卡
AMD Radeon HD(7640G+8750M)双显卡交火
硬盘
500GB 5400转
显示屏
14英寸镜面(分辨率1366x768)
电池
规格
11V 48Wh
无线网卡
Atheros AR9485 Wireless Network Adapter
有线网卡
Realtek RTL8168/8111 PCI-E Gigabit Ethernet Adapter
笔记本
尺寸/重量
342x245mm / 裸重2.25Kg
价格
3699元
总体上看,这款机器的配置属于主流水平,E1的定位本身就不高,3699元比竞品要便宜!HD 8750M应该会逐步取代了宏碁这一级别笔记本中服役数年之久的Geforce GT630M。实际上这次升级无论是对于AMD还是OEM厂商都是一次重新夺取市场的新机会。
▲新一代AMD A系列APU型号
A8-4500M拥有4个物理核心,TDP为35W,采用32nm制造工艺,拥有4MB 2级缓存,主频1.9GHz,融合HD7640G显卡
,具备256个Radeon核心,是AMD目前在笔记本里的中坚力量,我们今天的测试也是基于这款APU双卡交火的成绩。
▲Aspire E1-451G
京东已经开始全面铺货,看来这次没有让玩家等太久,开学季3500~4500元游戏本市场又有一场好戏看了。
▲Radeon HD 8750M GPU-Z截图
最新版的GPU-Z已经可以正确识别这颗GPU,从上图看,左侧是HD 8750M,其内置了384个处理器单元,搭载的是GDDR3的2GB显存,显存位宽128Bit,核心频率高达825MHz,位宽28.8GB/s,支持DirectX11.1/SM5.0。目前这款独显要想开启双显卡交火需要安装最新的催化剂13.1。
▲安装最新催化剂 两步开启双卡交火
双显卡对于性能的提升还是很有帮助的,我们进行了很多测试,在理论性能上3DMarkVantage与3DMark11成绩都可以获得一定幅度的提升。而在游戏中的提升则更为明显。我们用单独GPU进行Windows7的评分,默认图形分数(Windows Aero桌面性能)只有5.6分,而进行双显卡交火后,该项目分数提升至6.8!
▲交火前后Windows7系统默认评分
▲3Dmark Vantage评分
3DMarkVantage用以反映GPU的图形性能,这里我们启用的Entry模式,从测试的成绩可以看出双卡交火后AMD Radeon HD(7640G+8750M)的性能达到了30601,这个成绩已经介乎于Geforce GT650M与GT640M之间,通过进一步的优化,还有性能提升的余地(后续GDDR5显存版充满期待)。
▲3DMark 11评分P2474
在DX11的测试中明显AMD Radeon HD(7640G+8750M)的优势被凸显了出来,由于二者都已经支持DX11.1因此交火后的理论性能甚至超过了主流级别的GT650M。下面我们来看看具体的游戏性能。
AMD最新HD8750M独显笔记本游戏测试
前面我们已经看到了宏碁E1-451G的真正实力,编辑印象深刻的是AMD Radeon HD(7640G+8750M)双显卡交火的情况下3Dmark11的成绩略微超过了GT650M(大约5%的领先)。它的游戏实力又如何呢,下面我们来具体看下实测:
▲战地3游戏测试
战地3是去年我们经常测试的一款游戏,它采用了寒霜2引擎,是支持DX11特效的,因此更适合反应最新显卡的性能。另外战地3的多核优化比较好,也是个大厂商都喜欢测的标杆测试项目之一。我们针对AMD Radeon HD(7640G+8750M)双显卡交火平台进行了四档画质下的测试,发现1366x768分辨率下宏碁E1-451G表现十分流畅,尤其我们开到高画质后依然可以运行在35fps左右!AMD对于这款游戏的优化还是很到位的。
▲使命召唤8 现代战争3 游戏测试
使命召唤8是一款老游戏,但是经典的使命召唤系列还是很有代表性的,我们同样在1366x768下进行了测试,并且与上代AMD主流产品HD 7690M XT进行了对比,应该说性能提升十分明显,提升幅度甚至达到了20fps!您可以在任何画质下流畅运行这款游戏。
▲上古卷轴5:天际 游戏测试
上古卷轴5天际,去年销量最好的游戏之一,我们用多款配置产品进行对比,遗憾的是在这款游戏上AMD的性能表现不佳,这可能与驱动优化有关系,往往新产品在上市后还需要一定时间更新驱动。目前我们测试使用的版本是9.012,催化剂13.1(只有在13.1以后才能开启双显卡交火)。
▲心灵杀手游戏测试
心灵杀手这款游戏对于GPU性能的要求比较高,AMD Radeon HD(7640G+8750M)双显卡交火后性能与i3+GT650M的性能差不多,性能正好介于GT640M与GT650M之间。喜欢玩这款游戏的朋友可以在中画质下微调设置,已达到流畅运行的目的(1366x768)。
▲鬼泣5游戏测试
最新的大作,鬼泣5刚刚上市,作为最后一个项目,我们进行了视频测试,实测游戏画面非常流畅,1366x768分辨率下最高画质平均46fps左右,可完整体验游戏带来的快感。下面是游戏中激烈的游戏画面,录制环境是在1366x768分辨率下,最高画质。
▲体验鬼泣5游戏视频
AMD最新HD 8750M独显评测总结:实惠给力!
从笔记本的角度讲,在谈论一个笔记本的性能的时候一定会涉及到产品的价格,过去很多想买游戏本的朋友4K以下很难拿到称心如意的产品。而今则完全不一样了。就像我们今天测试的这款产品,宏碁Aspire E1-451G京东价仅3699元,而AMD Radeon HD(7640G+8750M)双显卡交火的性能正如您前面所看到的一样,性能直击目前主流市场的Geforce GT640M与GT650M独显产品。而价格有恰恰卡在3500~4500元这个黄金价位。
▲点击购买:宏碁(acer)E1-451G-84504G50Mnkk
从测试方面来看,前面的HD8750M不仅在游戏性能上有看点,功耗和散热上都表现不错,这一定程度上得益于28nm工艺。另外我们通过AMD的催化剂面板可以实现开启,关闭,双显卡的操作。我们可以让系统智能的适应负载,自动切换独显,也可以关掉双显卡,关掉独显,甚至只用APU内置的HD 7640G。这样多种使用方式,更加智能。编辑单拿独显玩了一晚上的魔兽世界,整机温度不高,画质也不错。
今年AMD还将推出融合GCN架构独显核心的全新APU
▲2013年AMD处理器路线图
今年除了新显卡端发力外,AMD在今年的处理器端也有新品,前不久CES上AMD还公布了今年移动端新一代APU的相关讯息,包括Richland与Kaveri在内,新一代APU也会将制程升级到28nm,并且APU内部融合的独显核心也将升级为GCN架构,不难想象到那时主流游戏本的性能又会有一个大提升!
5. VLIW架构服务器的服务器解析
服神嫌务器作为网络的节点,存储、处理网络上80%的数据、信息,因此也被称为网络的灵魂。做一个形象的比喻:服务器就游咐手像是邮局的交换机,而微机、笔记本、PDA、手机等固定或移动的网络终端,就如散落在家庭、各种办公场所、公共场所等处的电话机。我们与外界日常的生活、工作中的电话交流、沟通,必须经过交换机,才能到达目标电话;同样如此,网络终端设备如家庭、企业中的微机上网,获取资讯,与外界沟通、娱乐等,也必须经过服务器,因此也可以说是服务器在“组织”和“领导”这些设备。
它是网络上一种为客户端计算机提供各种服务的高可用性计算机,它在网络操作系统的控制下,将与其相连的硬盘、磁带、打印机、Modem及各种专用通讯设备提供给网络上的客户站点共享,也能为网络用户提供集中计算、信息发表及数据管理等服务。它的高性能主要体现在高速度的运算能力、长时间的可靠运行、强大的外部数据吞吐能力等方面。
服务器
服务器的构成与微机基本相似,有处理器、硬盘、内存、系统总线等,它们是针对具体的网络应用特别制定的,因而服务器与微机在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面存在差异很大。尤其是随着信息技术的进步,网络的作用越来越明显,对自己信息系统的数据处理能力、安全性等的要求也越来越高,如果您在进行电子商务的过程中被黑客窃走密码、损失关键商业数据;如果您在自动取款机上不能正常的存取,简或您应该考虑在这些设备系统的幕后指挥者————服务器,而不是埋怨工作人员的素质和其他客观条件的限制。