编程我是超算
㈠ 超级计算机和普通的个人电脑有什么区别
1、高速运算能力不同
超级计算机能够执行一般个人电脑无法处理的大资料量与高速运算的电脑。个人计算机由硬件系统和软件系统组成,是一种能独立运行,完成特定功能的设备。
2、规格与性能不同
超级计算机其基本组成组件与个人电脑的概念无太大差异,但规格与性能则强大许多,是一种超大型电子计算机。
4、运算速度不同
现有的超级计算机运算速度大都可以达到每秒一太(Trillion,万亿)次以上。个人计算机不需要共享其他计算机的处理、磁盘和打印机等资源也可以独立工作。从台式机(或称台式计算机、桌面电脑)、笔记本电脑到上网本和平板电脑以及超级本等都属于个人计算机的范畴。
把普通计算机的运算速度比做成人的走路速度,那么超级计算机就达到了火箭的速度。在这样的运算速度前提下,人们可以通过数值模拟来预测和解释以前无法实验的自然现象。
5、作用不同
个人计算机,随着智能手机和平板的普及,绝大多数人可能已经更青睐那种触动手指即可完成的办公娱乐方式。最近无论是在国内还是在国外,都有不少“专家”认为在不久的某一天里传统PC会被更为便携的手机和平板所替代。
超级计算机是计算机中功能最强、运算速度最快、存储容量最大的一类计算机,多用于国家高科技领域和尖端技术研究,是一个国家科研实力的体现,它对国家安全,经济和社会发展具有举足轻重的意义。是国家科技发展水平和综合国力的重要标志。
㈡ 最近在做一个CFD的模型计算,如果打算申请用超算的话,还要会编程吗
我听说用超算得先编程,但是不能把我要用的软件直接交给超算让它用这个软件进行计算吗?
㈢ 如何制作一个小型超算
需要硬件支持,并行机,进行相应的编程优化。理论上来说,并行计算(parallel computing)
是指在并行机上,把一个应用分解成多个子任务,分配给不同的处理器,各个处理器之间协同,
并行执行子任务,目的是加快计算速度。
超级计算机是指信息处理能力比个人计算机快一到两个数量级以上的计算机,它在密集计算、
海量数据处理等领域发挥着举足轻重的作用。
作为高性能计算技术产品的超级计算机,又称巨型机,是与高性能计算机或高端计算机相对应
的概念。
超级计算机具有很强的计算和处理数据的能力,主要特点表现为高速度和大容量,配有多种外
部和外围设备及丰富的、高功能的软件系统。
超级计算机采用涡轮式设计,每个刀片就是一个服务器,能实现协同工作,并可根据应用需要
随时增减。根据处理器的不同,可以把超级计算机分为两类,采用专用处理器或者采用标准兼
容处理器。
前者可以高效地处理同一类型问题,而后者则可一机多用,使用范围比较灵活、广泛。专一用
途计算机多见于天体物理学、密码破译等领域。
㈣ 近年来,异构超算已经是大势所趋,什么是异构超算
1.先谈谈同构计算和异构计算。同构计算是使用相同类型指令集和体系架构的计算单元组成系统的计算方式。同构超算只单纯使用一种处理器,日本超算“京”只采用的处理器是富士通制造的SPARC64 VIIIfx,神威蓝光只采用了8704片申威1600,Mira和Sequoia(Sequoia采用了约160万个A2处理核心),就只采用了PowerPC A2处理器,这些都没有采用GPU或众核芯片等加速器。日本的京,IBM 的Mira和Sequoia和中国的神威蓝光都是同构超算的代表。
异构计算主要是指使用不同类型指令集和体系架构的计算单元组成系统的计算方式。常见的计算单元类别包括CPU、GPU等协处理器、DSP、ASIC、FPGA等。异构计算是一种并行和分布式计算,它或是用能同时支持simd方式和mimd方式的单个独立计算机,或是用由高速网络互连的一组独立计算机来完成计算任务。具体来说,异构计算是在运算中既使用处理器,又使用GPU或众核芯片等加速器。以美国泰坦和中国天河2号为例,泰坦有18688个运算节点,每个运算节点由1个16核心AMD Opteron 6274处理器和1个NVIDIA Tesla K20加速器组成,共计299008个运算核心;
天河2号有16000个计算节点,每个节点由2片Intel的E5 2692和3片Xeon PHI组成,共使用了32000片Intel的E5 2692和48000片Xeon PHI;天河1A使用了14336片Intel Xeon X5670处理器和7168片NVIDIA Tesla M2050高性能计算卡。除了泰坦和天河2号和天河1A之外,曙光6000也是采用了异构计算架构。
(曙光6000)
2.超算的用途
要说异构计算的优势,那就要从超算的用途说起了。
PC在日常使用中,除玩游戏、3D渲染等之外,大多是程序都倚重整数运算性能。
但超算则不同,超算大多应用于科研和军事领域。例如弹道计算、核物理研究、气候气象、海洋环境、数值风洞、碰撞仿真、蛋白质折叠、基因研究、新药研发、分子动力学模拟、量子化学计算、材料科学、动漫设计、工业设计等方面,在运算中更加倚重双精浮点性能,对整数运算性能要求相对较低。这就产生了用加速器提升浮点运算性能的需求。
3.同构超算的高效率
同构超算虽然理论双精浮点性能不如异构超算,但可以获得较高的运行效率。异构超算虽然理论双精浮点性能非常强悍,但运行效率不如同构超算。
(Sequoia,采用PowerPC A2处理器)
举例来说,IBM Mira和Sequoia使用PowerPC A2处理器,效率达85.3%和85.6%。日本的京效率更是高达92.9%。
而异构超算效率普遍不高,采用E5和XeonPHI的天河2号和Stampede效率为61.7%、60.7%。采用AMD Opteron 6274和NVIDIA Tesla K20的Titan效率为64.9%。
天河2号和Stampede效率不高的一个重要因素就是Xeon PHI的浮点运算效率较低。在谈这个问题前,先释下linpack测试。
(Stampede)
衡量芯片性能的一个重要指标就是计算峰值,例如浮点计算峰值,它是指计算机每秒钟能完成的浮点计算最大次数。包括理论浮点峰值和实测浮点峰值:
理论浮点峰值是该计算机理论上能达到的每秒钟能完成浮点计算最大次数。
理论浮点峰值=CPU主频×CPU每个时钟周期执行浮点运算的次数×系统中CPU核心数目。
实测浮点峰值是指Linpack测试值,也就是说在这台机器上运行Linpack测试程序,通过各种调优方法得到的最优的测试结果。
在实际程序运行过程中,几乎不可能长时间维持在实测浮点峰值,理论浮点峰值更是仅仅存在于纸面上的数据。理论浮点峰值和实测浮点峰值只是作为衡量机器性能的一个指标,用来表明机器处理能力的一个标尺和潜能的度量。
回归正题,Xeon PHI在运行linpack测试时,实际性能仅仅相当于理论最大运算性能的百分之六十几,相比之下,申威1600的linpack测试效率远高于Xeon PHI。
但因Xeon PHI的理论浮点性能较高达1T Flop,大大超过申威1600的双精浮点运算的理论峰值,因此即使仅仅只有百分之六十几的效率,实测双精浮点运算性能还是大幅超越申威1600。因而使Xeon PHI得到了国防科大等单位或公司的青睐。
因此,同构超算的效率相对高于异构超算,而天河2号效率偏低的原因更多的是Xeon PHI本身效率较低,不是国防科大的技术问题。
4.同构超算编程更方便
cpu适合做串行,逻辑复杂度高的任务,gpu适合做简单,并行度高的任务,cpu和gpu的编程模型是不一致的;所以异构超算在编程方面就不太容易,比如使用amd的apu和nvidia的cpu+gpgpu在编程上就不如同构超算方便。另外,gpgpu作为加速卡和cpu是不共享内存的,需要程序员显式拷贝而导致性能损失。
另外,因软件方面的原因,异构超算的通用性相对于同构超算有所不如,举例来说,GPGPU只能跑OPEN CL、OPEN ACC代码,不能跑OPENMP代码。
5.异构计算的优势
以天河2号的一个计算节点为例:
Xeon E5的满载功耗达145W,双精浮点为0.21T Flops,而Xeon PHI功耗300W,双精浮点达1T Flops。
天河2号一个计算节点由2片Xeon E5和3片Xeon PHI,理论双精浮点性能为3.2T Flops,功耗为1190W,理论双精浮点性能与功耗的比值为2.87GFlops/W。相同功耗下使用8片Xeon E5只能获得1696Gflops的理论双精浮点性能,理论双精浮点性能与功耗的比值为1.42GFlops/W。从数据可以看出,在同等功耗下,在使用Xeon PHI加速后,理论双精浮点性能与是只使用Xeon E5的2倍。
因此,相同功耗的情况下,异构超算能获得非常高的理论双精浮点性能。
综上所述,同构超算的编程方便,效率高,通用性强。异构超算编程麻烦,效率不如同构超算,通用性差,性能功耗比高。异构超算虽然在通用性和效率方面相比同构超算处于劣势,但更加好的性能功耗比使其成为更受偏爱的原因。
㈤ 超级计算机都用在什么地方
军工,大量模拟计算(如流体,热学,气动之类),出了国家用得起之外,高端的只有一些财大气粗的超级公司,如波音等这些需要大量模拟实验的公司也会配备。低端一点的国外很多大学也有,比如加州理工大学用100太PS3组建了一套超级计算机(对,我没打错,你也没看错,就是sony的PS3,只不过去了外壳)。