泰坦 (超级电脑)

美国超级计算机

泰坦(英语:Titan,实验室代号“OCLF-3”)是一台由克雷公司承建的超级电脑,置放于美国能源部下属的橡树岭国家实验室中,供各项科学研究专案使用。泰坦是由原来也置放于橡树岭国家实验室的美洲虎英文Jaguar)经过多次升级改装而成。泰坦也是世界上第一台以通用图形处理器GPGPU)为主要资料处理单元的超级电脑,2012年11月至2013年6月是世界上最快的超级电脑。美洲虎在2011年10月被宣布开始进行大幅升级,2012年10月,升级作业基本完工后这台超级电脑被更名为泰坦,并开始进行稳定性和效能测试,2013年中期方可供科学研究者们使用。[4][5]升级的预算开始时是6千万美元,其中绝大部分由美国能源部提供。而后来根据克雷公司的公开资讯,整台泰坦超级电脑的费用最终是9千7百万美元[4]为填补资金空缺,美国国家海洋和大气管理局也出了一小部分资金参与建造,以从主要出资方美国能源部的手上获得一定的使用权。[6]

泰坦
启用时间2012年10月29日开始运作
2019年8月2日退役
承建商出资:美国能源部、美国国家海洋和大气管理局(<10%)
承建:克雷公司
作业管理者美国能源部美国国家海洋和大气管理局、克雷公司
置放地点橡树岭国家实验室
架构18,688颗AMD Opteron 6274 16核心中央处理器
18,688颗NVIDIA Tesla K20X 通用图形处理器(运算加速卡)
Cray Linux Environment英语Cray Linux Environment
最大消耗功率8.2百万瓦
容积、占地面积404平方米(4352平方英尺
内部存储器710TB(598TB供中央处理器使用、112TB显示记忆体[1]
外部存储器10PB,240GB/s的输出输入频宽[2]
运算速率17.59 petaFLOPS(LINPACK基准效能测试)[3]
27 petaFLOPS(理论峰值) [3]
造价9千7百万美元
排名TOP500: 第2名, 2013年6月17日[3]
用途科学研究
成就基本完工时大部分机组的LINPACK基准测试效能在TOP500排名第一
全球首台以图形处理器为主运算单元并在基准效能测试中突破10petaFLOPS的超级电脑
官方网站www.olcf.ornl.gov/titan/

泰坦使用由超微半导体提供的皓龙Opteron)处理器连结辉达提供的Tesla运算用图形处理器以进行协同运算,来在提供比美洲虎更高的运算效能之同时保持能源利用效率。整台泰坦共计18,688颗中央处理器和相同数量的图形处理器,理论峰值效能是27petaFLOPS(每秒27×1015次浮点运算),然而,在2012年11月的LINPACK基准效能测试中却仅取得17.59petaFLOPS的成绩(每秒17.59×1015次浮点运算)[3][7],直到2013年6月在Top500位列第一的排名被中国天河二号取代。尽管如此,无论从效能上抑或是能效比上来说,仍然要比同时期的其它超级电脑更胜一筹。

泰坦可用于任何目的的资料处理。然而,资料处理任务的优先级,需要基于三个方面的考量:任务计划的重要度、任务计划对异构运算的利用潜力以及任务计划的运算程式源码与其它超级电脑的相容性。经过筛选排程后,选中六个运算计划,这六个“前锋”计划在泰坦开放使用后由泰坦依排程执行处理,这些处理任务多为关于奈米科技气候模型。不过其它没被选为首先处理的任务计划,仍会进行优先级排程,进入等候贮列,以待泰坦的运行处理。由于以图形处理器来处理资料,基于图形处理器拥有比中央处理器多得多的执行绪的理由,不少程式需要进行源码变动处理以适应新的混合架构,这些处理常常需要有更高阶的运算平行度,而这些变更甚至也可以在以中央处理器为主的超级电脑上获得效能的提升。

泰坦于2019年6月30日截止受理运算任务,并于同年的8月2日正式退役[8],而日后泰坦的计算任务将会由高峰接手。[9]泰坦拆除后留下的空间将进行扩展并安装同样采用AMD处理器的前沿(英文:Frontier)超级电脑,而前沿预计于2021年完工,届时将成为继Summit之后的第二代AI系统。[10][11]

历史介绍

泰坦是橡树岭实验室美洲虎超级电脑的升级版。美洲虎初期纯粹使用中央处理器,而后期也以图形处理器辅助中央处理器运算。[12][13]

原美洲虎升级计划

为了在保持效能功耗比的情况下提升资料处理效能,原来的美洲虎超级电脑在2005年落成后不久时已经制定了多种升级方案,当时美洲虎仍使用Cray XT3英语Cray XT3主机平台,峰值运算效能为25teraFLOPS。[14]2008年美洲虎的Cray XT3主机平台升级Cray XT4英语Cray XT4主机平台,峰值效能也提升至263teraFLOPS;2009年继续升级至Cray XT5英语Cray XT5主机平台,峰值效能为1.4petaFLOPS。[14]在升级为泰坦前,未来的升级计划原定的峰值效能为1.76petaFLOPS。[15]

泰坦建造计划

2005年当美洲虎落成时,橡树岭国家实验室已计划打造一台达到20petaFLOPS效能级别的超级电脑,而以传统的中央处理器架构来实作在当时来说有不低的难度和成本,因此选择以中央处理器+图形处理器的混合架构方案,尽管这个方案直到2010年才得以实作,2011年以后计划将升级后的美洲虎更名为泰坦。[16]2010年11月16日在ACM/IEEE超级运算研讨会英语ACM/IEEE Supercomputing Conference非正式私人会议上公布了美洲虎的大升级计划(亦即泰坦的建造),在会议的前一年(2009年)还和NVIDIA签署通用图形处理器的供应协议。[17][18]2011年10月11日对外宣布开始第一阶段的升级。[19]最初的计划是将新建一个占地15,000平方米(160,000平方英尺)的新机房,来置放升级后的美洲虎,但最后限于预算而取消,改为沿用美洲虎现有的基础设施。[20] 2011年10月9日,美洲虎的主机开始了为期一年的汰换升级,完全升级后的超级电脑会重命名为“泰坦”。[21]

第一阶段

第一阶段的升级主要是更换新的中央处理器。

2011年10月至12月期间,美洲虎200个机柜中的96个机柜中装备的Cray XT5平台主机(刀锋伺服器,配置为每节点两颗6核心的AMD Opteron处理器)升级为Cray XK6英语Cray XK6平台主机(刀锋伺服器,配置为每节点一颗16核心的Opteron 6274处理器),其它剩馀的机柜仍照常运作。同年12月,所有运算任务转移至96个已更换Cray XK6主机平台的机柜中,剩馀的104个机柜中的主机均升级Cray XK6。[22] 系统内部连线(允许各节点的处理单元相互沟通的网路)也被升级,橡树岭国家实验室ESnet网路连线的频宽也升级为100Gb/s,以便更快地从其它实验室大学和研究机构进行资料交换。[23]系统记忆体容量也随著Cray XK6主机平台的升级而翻倍扩增至600TB,其中有960台Cray XK6主机(占用10个机柜)还装有以NVIDIA Fermi架构显示核心(即用于NVIDIA GeForce 400/500系列显示卡的图形处理器)为基础的NVIDIA Tesla运算加速卡。这960个节点作为泰坦日后硬体配置的参考,并用来为日后泰坦的完全升级测试程式源码。美洲虎至泰坦的第一阶段的升级使得这台超级电脑的峰值效能从2.3petaFLOPS提升至3.3petaFLOPS,这个阶段下这台超级电脑仍称为美洲虎。[21]


第二阶段

第二阶段的升级主要是更换安装新的用作通用资料处理的图形处理器。

2012年中期,辉达推出NVIDIA Kepler架构的图形处理器,也在不久推出基于这个架构的NVIDIA Tesla运算处理器。2012年9月13日开始,按照实验室和克雷、辉达签订的合约,辉达提供超过一万八千块NVIDIA Tesla K20X运算加速卡(基于开普勒架构的GK110顶级显示核心,用作通用图形处理器[24][25])装进美洲虎超级电脑的Cray XK6平台主机中,每节点一块,更换图形处理器后Cray XK6平台更名为Cray XK7英语Cray XK7平台。中央处理器维持不变,仍为16核心的Opteron 6274处理器。[4][26]同年10月底基本完工并且将这台超级电脑更名为泰坦。[27]

测试验收

“泰坦”在2013年初接受验收测试,但只完成了92%的测试项目,低于原来通过95%的测试项目的要求。[22][28]后来检查发现,导致测试出现问题的是主机板的PCI-E插槽内的金手指连接器虚焊或焊接部位出现裂缝。[29]对于这个问题,克雷公司按照合同要求承担修复所需费用,并且以每星期12到16个机柜的速度修复这个缺陷。[29]修复过程中其它能正常运作的机柜照常运算以供研究者们继续进行他们的运算任务,[29]而且到2013年3月11日,共8,972颗通用图形处理器通过测试后,正式投入运作[30]2013年4月8日,橡树岭国家实验室宣布修复工作已完成,预计2013年5月完成最后的验收测试项目。[31]6月12日,橡树岭实验室宣布泰坦已经完成了测试。[32]

资金和建造

泰坦的升级建造仍由美洲虎的承建商克雷公司来负责进行,其主要资金来源是美国能源部下属的橡树岭国家实验室。当时实验室的资金用来升级中央处理器的话是十分充足的,但剩下的资金就不足够用来购置18,688块通用图形处理器(运算加速卡),因此美国国家海洋和大气管理局也同意出资填补资金缺口,但需要以一定的使用权和使用时限作为回报。[33][34]橡树岭实验室的科学计算负责人杰夫·尼科尔斯(Jeff Nichols)表示“泰坦花了实验室大约6千万美元,后来国家海洋和大气管理局的出资不足1千万美元,但是具体数字则因为保密协议就不便公开了。”[33][12]与克雷公司的全部合约共计约9千7百万美元,不包括泰坦落成以后的可能的升级。[12]

商业化

在美洲虎超级电脑升级完成后,克雷将用于泰坦超级电脑的Cray XK7主机平台作商业化推广,还表示日后仍会有很大的硬体升级空间与效能提升空间。[35]

2013年3月份,辉达发布了消费级市场最强单晶片显示卡——GeForce GTX Titan,使用和泰坦超级电脑上使用的Tesla K20X运算卡相同的“GK110”图形处理器。[36]与超级电脑共用一个型号的显示核心、保留完整的通用运算能力,是这款显示卡的最大卖点之一,主要针对民间对游戏图形和科学运算都有需要的发烧级玩家[37],随后还陆续发布了GeForce GTX TITAN Black Edition[38]以及单卡双GPU的GeForce GTX TITAN Z[39]。还有玩家用其来进行位元币挖矿操作。[40][41][42]

未来

原计划泰坦将在2018年被新建造的超级电脑高峰(Summit)取代,或由泰坦改造升级,不过最终高峰因需要另建基础设施而于另外的机房中建造,使得泰坦得以保留继续服役。这台新的超级电脑由IBM承建,使用更少的运算节点,每个节点配备更强力的通用图形处理器提供更强的运算能力;而且还配备固态非易失性存储装置,作为来自分散式档案系统的档案资料快取[43]

硬体配置

机架、电源供应

泰坦超级电脑使用和美洲虎超级电脑相同的200个机柜的设计,占地404平方米,基本上只是更换了机柜和布线。[5][44]沿用改进自美洲虎超级电脑的电力供应系统和冷却系统,节省了能源部/实验室约两千万美元的经费。[6]泰坦的总耗电功率最大8.2兆瓦,[45]比美洲虎高出了1.2兆瓦,但是泰坦提供比美洲虎快了几乎10倍的运算效能,特别是浮点运算方面。[2][5]电力供应系统的交流电输入电压高达480,供每个机柜使用,由于使用更高的电压,因此可以使用比美国标准的208伏(线电压电缆更细的输入电缆,由更小直径的电缆芯上节省出来的资金就有一百万美元。[2]为应付电力供应突然中断的事件,碳纤维飞轮能量存储器可以维持网路系统和存储系统16的电力供应,[46]如果两秒内电力供应没有恢复,柴油发电机就会在大约7秒的时间内启动,并一直驱动飞轮,[46]但是飞轮和发电机被设计成只为网络系统和存储系统维持电力供应,以便能快速重新开启整台机器,发电机也不会为运算处理单元基础设施提供后备电力供应,因此外接电力供应中断时(即使发电机已启动)是不会进行运算处理作业的,这个特性和笔记型电脑的“睡眠”功能类似。[46]

冷却系统

泰坦的机柜使用主动式风冷散热器,但是外界空气进入机柜前则要事先经过冷却处理,[47]所用的空气冷却器,可制冷质量为6,600(相当于23.2兆瓦的热功率),以5.5摄氏度(约42华氏度)的低温冷却水作为空气冷却器的散热介质,从机柜中带走热量的热空气会流到至空气冷却器冷却,再回流进入机柜,如此往复循环[47]另外,“泰坦”的散热系统设计时并没有考虑噪音问题,因此这台超级电脑运作时的噪音非常巨大,以至于机房需要更好的隔音措施,进入机房并且逗留超过15分钟的人员必须采取像是佩戴隔音耳塞或耳机等的听力保护措施。[48]

运算主机

完整的泰坦超级电脑上有18,688个运算节点,每部刀锋伺服器拥有四个运算节点,24部刀锋主机为一个机柜。[49]

  • 整台超级电脑共299,008个处理器核心和超过710TB的记忆体容量(包括显示记忆体,全部记忆体开启ECC功能后共693.6TB可用);[2]
  • 存储器使用硬碟阵列存储,原来容量是10PB(由13,400块,每块7,200转每分1TB容量的硬碟组成[53]),其有效传送速率为240GB/s。[2][44]在2013年4月,进行了一次存储器的升级,升级后的存储器容量增至40PB,其有效传送速率达到1.4TB/s。[2][54][55]
你根本不能从传统的基于CPU的架构上获得这个级别的效能、能源效率和成本效率。加速运算是未来十年使exascale效能级别得以达成的最好而且最现实的方式。

英伟达首席架构设计师史蒂夫·斯科特英语Steve Scott (computer architect)[44]

为了更大幅度地提升平行运算效能,建造方选择用通用图形处理器实作,因为图形处理器平行运算效率相比传统的中央处理器的有更为巨大的优势所在。[50]尽管图形处理器/通用图形处理器的时钟频率要比中央处理器低不少,但每颗NVIDIA GK110显示核心拥有2,688个时脉为732MHz的流处理器(CUDA核心),全部流处理器联合进行运算处理,从而使得整个系统效能更高。[1][44]因此,在泰坦超级电脑上,中央处理器核心主要用以分配运算任务给通用图形处理器,资料处理主要由通用图形处理器来实作。而此前的超级电脑,则是由中央处理器直接处理资料,即使有通用图形处理器的加入也就是辅助运算的角色。[50]

主机管理

在运算主机以外,为方便管理并监视泰坦的运作状况,还另外设定了登入管理节点。每个登入节点的配置为一颗八核心的AMD Opteron 6140中央处理器和256GB的记忆体。在授权使用者透过网路连线至登入管理节点并登入后,预设是在登入管理节点上进行任务排程、监视运算节点运作状况等作业。[51]

显示设施

为了让科研人员能够更好地明白泰坦的资料处理结果,泰坦也设有显示输出,通过连结名为“EVEREST”的显示装置来实作。EVEREST,全名“Exploratory Visualisation Environment for Research and Technology”,意即“技术和研究的探索可视化环境”,是一个装有一块10米×3米(30英尺×10英尺)的主荧幕和一块尺寸要小上一些的副荧幕的房间,荧幕的解析度均为3千7百万画素×3千3百万画素,还附带3D显示能力(需要配合3D眼镜使用)。[56]

效能、能效比表现

泰坦的理论峰值效能为每秒27×1015次浮点运算(27petaFLOPS),或者是每秒2.7千万亿次运算作业。[57]2012年11月12日,泰坦通过LINPACK基准效能测试,最终成绩为每秒17.59×1015次浮点运算,TOP500最后宣布了新的第一名由泰坦超级电脑夺得,取代前任第一IBM红杉。尽管目前的实际峰值效能和理论峰值效能相比有较大落差,但能效比仍然要比众多超级电脑优胜。[3]

泰坦超级电脑也是Green500中排名第三的超级电脑(截至2012年11月),每消耗一瓦特的电功率获得2142.77megaFLOPS(21.4277亿次浮点运算每秒)的运算效能。[58]Green500也是全球500强超级电脑的排名,但不同于TOP500的是Green500是根据效能功耗比来进行排名。[59]不过在2013年6月Top500和Green500在天河二号登入效能成绩更新排名以后,泰坦的排名降至Top500的第二名,在Green500上的排名也降至29名,而泰坦并没有进行第二次成绩测试,直至现在,在Top500上的排名并没有变化。[60][61]

软体支援

作业系统、档案系统

泰坦超级电脑使用克雷公司基于Linux核心开发的Cray Linux Environment英语Cray Linux Environment分布式作业系统。Cary Linux Environment作业系统由以下两部分组成:登入管理节点为全功能Linux核心的作业系统,运算节点则是为提升效能和效率而特别优化精简的基于轻量级Linux核心CNL(Compute Node Linux)的作业系统。[51]档案系统使用Lustre分散式档案系统,代号“Spider”。[62]

程式编写与编译器

不同于以往以中央处理器作主要资料处理单元或以图形处理器辅助处理资料的超级电脑,泰坦超级电脑以图形处理器为主要的资料处理单元。在初期,不少专案的程式源码一般重新编写或编译以方便泰坦的通用图形处理器运行,而且还要求这些源码能相容于以中央处理器为主的系统,以便专案可以不仅可以由泰坦进行处理,还能供其它仍使用传统中央处理器架构的超级电脑运行。[63]Oak Ridge Leadership Computing Facility(OLCF)还成立了Center for Accelerated Application Readiness(加速申请中心,CAAR)来帮助科学研究者们重写或重新编译他们所写的程式码以供泰坦运作之,并且在辉达总部举办开发者研习会,让研究人员和程式员学习并使用泰坦和其它类似的超级电脑的架构、编译器应用程式[64][65]

CAAR目前已和辉达以及其它程式码提供者合作开发新版编译器,将指令整合到供通用图形处理器使用的程式语言当中,[64]以使研究者们可以和以前一样,以FortranCC++来编写他们的程式码而无须学习新的程式语言,并且编译器可以将这些程式码编译为通用图形处理器可以高效运作的程式。[64]

目前泰坦的程式开发工具中,“图形处理器加速库”包括MAGMA、CULA、cuBLAS/cuSPARSE;“加速编译器指令”包括OpenACC、PGI Accelerator、CAPS HMPP Workbench;“低阶图形处理器程式语言”有NVIDIA C for CUDA、PGI CUDA Fortran、OpenCL。这些工具中有部分甚至允许开发者在不了解关于NVIDIA CUDA的知识的情况下使用。[66]在泰坦上适用的编译器有PGI(Portland Group Compiler Suite,预设使用这个)、GCC、CCE(Cray Compiling Environment)以及英特尔提供的编译器。[67]

目前来说,对现有科学研究专案中的代码重写的部分主要是多线程化、增进并行性的部分,即所谓的多核多线程优化,只是更深入、更适合通用图形处理器的架构特性(通用图形处理器拥有比中央处理器多得多的执行绪和更好的运算并行性)。不过这样的程式源码优化也适用于传统以中央处理器为基础的机器上,这些机器也可以从中获得效能提升。天体物理学家程式员Bronson Messer,表示“一个应用程式要将泰坦的效能发挥至极限,必须寻求方法来使通用图形处理器满负载运作,需要明确的是通用图形处理器尽管处理速度很快,但灵活度显然不如中央处理器。”[64]作业管理者也发现,一些计划专案的程式码在重写后,在那些不是基于图形处理器的机器上的效率也变得大有提升,“Denovo”专案的程式在基于中央处理器的机器上甚至还比原先获得双倍的效能提升表现。[63]

要求调用图形处理器的进行运算作业的程式码变更量因不同专案而变。根据负责NRDF专案的梅瑟博士(Dr. Messer)的意见,他们的程式码中调用图形处理器的算法源码只占整个程式码中很小的百分比,因为这些程式算法的运算都相对简单,但处理进程重复而且具有平行性。[68]NRDF的程式用CUDA Fortran写成,CUDA Fortran是Fortran语言连结CUDA指令扩充库(NVIDIA CUDA库)给予图形处理器使用的Fortran改进版本。[68]

研究计划

由于泰坦超级电脑的研发依靠美国能源部和美国国家海洋和大气管理局的资金资助,因此来自美国联邦政府部门的科学研究不少,有能源(包括可再生能源核能)、气候变化、高效率引擎、新型燃料、新型材料等一系列科学研究专案。[69][70]

在泰坦正式启用的当天,时任美国能源部长朱棣文发表声明,表示“高效能计算领先之国家,在国防科学医学能源等一系列领域均将拥有比其它不具备超级电脑的国家更为巨大的优势,泰坦将和能源部下属的其它超级电脑一起,成为确保美利坚合众国之创新优势的有力工具。”[71]

使用计划安排

尽管泰坦可以用于几乎任何类型的科学研究专案,但使用请求往往超出了许可时间,因此制定出专案优先级选择标准,其标准是:根据专案计划的重要度来决定执行时间的选择,这里面若有能力充分发挥混合架构运算能力,并且还能够在其它超级电脑上运作的,则优先考虑(即不可只让泰坦单独处理)。2009年,OLCF收到了50个首先使用它们的超级电脑的专案,经筛选后剩下六个成功进入候选,这六个专案中不仅是重要的科学研究专案,还赋予它们完全使用并发挥混合运算的运算能力。[44][63]这六个首先使用泰坦的专案中,大部分是关于新型纳米材料气候变化模型的研究。不过,其它未入选的专案,仍然会进入泰坦的任务排程队列,等待泰坦的执行处理。

科学研究专案

在泰坦上首先处理的六个专案分别是“S3D”、“WL-LSMS”、“Denovo”、“LAMMPS”、“CAM-SE”和“NRDF”:

  • “S3D”是一个研究燃烧模型的分子物理学专案,研究细颗粒周围的燃烧的情形,以提升柴油生物燃料发动机的燃烧效率。2009年,泰坦的前身美洲虎,获得了一个与类自燃火焰和直接燃油喷射柴油发动机燃烧效率提升相关的一个已完全解决的模拟过程;[63]
  • “WL-LSMS”专案,模拟除绝对零度以外的各个温度下,电子原子磁性物质中的相互作用,早前的一个处理程式源码版本在美洲虎上首次获得超过1petaFLOPS的运算效能;[63]
  • “Denovo”专案,模拟核反应炉的运作情况,旨在提升核反应炉的能量转换效率、降低能量损失。[44]Denovo专案的运算程式在为泰坦进行源码优化后,在传统的以中央处理器为主的超级电脑上获得比优化前快两倍的效能,在泰坦上获得比美洲虎快3.5倍的效能表现;[63][72]
  • “LAMMPS”专案,全称“Large-scale Atomic/Molecular Massively Parallel Simulator”(大尺寸原子/分子大规模平行模拟器),是一个关于分子动力学的研究计划,模拟微粒从原子的尺度跨越至相对论的尺度的情形,以提高材料科学的水平以及其在半导体原生质/生物材料、聚合物等方面的应用;[73]
  • “CAM-SE”是两个专案合并组成,分别是“Community Atmosphere Model”(群落大气模型)和“High Order Method Modeling Environment”(高阶方法建模环境),前者是一个全球大气模型,后者则是求解流体热力学方程。这两个专案共同协作可以以更高的精确度模拟气候变化
  • “NRDF”专案,全称“Non-Equilibrium Radiation Diffusion”(非均匀放射性分布)通过模拟并描绘超新星产生的非带电粒子,来研究其在镭射核融合流体动力学医学成像核子反应炉、能量存储以及燃烧过程的研究等方面的潜在应用价值。[63]

负责“NRDF”专案的梅瑟博士的研究需要数以百计的偏微分方程来追踪能量角度散射角以及在一颗恒星进入超新星阶段时每种不同类型的中微子模拟,得出数百万个单独的方程。另外,一个名为“Chimera”(奇美拉/凯米拉)的程式码,以神话中的生物奇美拉来命名之,乃它有三个“头”:一个是仿真恒星物质(主要是其化学组成)的流体力学;第二个是模拟辐射转移;第三个是模拟核燃烧(即热核反应/核融合)。第三个“头”首先由图形处理器群运行处理,由于热核反应的过程模拟最容易由图形处理器的架构来处理,尽管其它方面的源码也将及时进行适应性修改及优化目前,专案模拟了14或15种核素,但如果图形处理器提供良好的加速,梅瑟博士预计,与经验观察相比,将有多达200种核素可以在更高的精度上被模拟出来。[74]

“VERA”专案是一个轻水反应炉的仿真,在美洲虎超级电脑上的CASL(Consortium for Advanced Simulation of Light Water Reactors,联合轻水反应炉进阶仿真)编写并运作。VERA允许工程师监视反应炉使用寿命里反应炉核心任何部分的效能表现和状态,以辨别找出有研究价值或改进反应炉设计等他们感兴趣的研究点。[75]尽管不是六个先锋计划中的一员,但VERA将会在CAAR的协助下进行充分优化并由泰坦的管理团队进行测试后在泰坦上继续运作。电脑科学家汤姆·埃文斯(Tom Evans)发现,相比于以往在传统中央处理器为主的超级电脑之间进行程式码适应性修改以及优化作业,为泰坦的混合架构修改及优化VERA的程式码难度十分大。尽管如此,他们的目标是要将仿真整个反应炉燃料循环的时间,从以往需要18~36个月,在泰坦上缩短至只需一个星期。[75]

2013年已经有三分之一的程式码已计划编译并在泰坦上运行,典型情况下在一个时间段中会有多达四到五个专案间断使用。[48][76]

注释

  1. ^ 完整规格的“GK110”显示核心/通用图形处理器拥有2,880个流处理器(CUDA核心,以192个为一组SMX单元,共15组),因核心过于庞大(71亿电晶体),台积电的28纳米的“GK110”显示核心的晶圆良品率不足而使NVIDIA决定先最少屏蔽192个流处理器(一组SMX单元)以减低复杂度,以提高晶圆良品率。详见NVIDIA官方GK110的技术文件:[1]页面存档备份,存于互联网档案馆),新闻报导[2]页面存档备份,存于互联网档案馆)。而使用完整版本的显示卡、运算卡则分别为GeForce GTX TITAN Black Edition、Quadro K6000以及Tesla K40X,详见GeForce 700系列

参考来源

  1. ^ 1.0 1.1 Feldman, Michael. Titan Sets High Water Mark for GPU Supercomputing. HPC Wire. 2012-10-29 [2012-10-30]. (原始内容存档于2012-11-05). 
  2. ^ 2.0 2.1 2.2 2.3 2.4 2.5 Lal Shimpi, Anand. Inside the Titan Supercomputer. Anandtech: 1. 2012-10-31 [2012-11-02]. (原始内容存档于2013-01-25). 
  3. ^ 3.0 3.1 3.2 3.3 3.4 Oak Ridge Claims No. 1 Position on Latest TOP500 List with Titan. TOP500. 2012-11-12 [2012-11-15]. (原始内容存档于2013-01-21). 
  4. ^ 4.0 4.1 4.2 Poeter, Damon. Cray's Titan Supercomputer for ORNL Could Be World's Fastest. PC Magazine. 2011-10-11 [2012-10-29]. (原始内容存档于2019-01-20). 
  5. ^ 5.0 5.1 5.2 Tibken, Shara. Titan supercomputer debuts for open scientific research. CNET. 2012-10-29 [2012-10-29]. (原始内容存档于2012-12-15). 
  6. ^ 6.0 6.1 Munger, Frank. Titan's ready to roll; ORNL supercomputer may become world's No. 1. Knox News. 2012-10-29 [2012-10-29]. (原始内容存档于2013-03-26). 
  7. ^ 推土机+开普勒超级计算机成功拿下世界第一页面存档备份,存于互联网档案馆) - 驱动之家,2012年11月13日
  8. ^ TITAN - Advancing the Era of Accelerated Computing. 橡树岭国家实验室. [2019-09-25]. (原始内容存档于2019-09-26). 
  9. ^ AMD技术的泰坦超算退役 推土机CPU最后的遗产再见了. 快科技. 2019-07-02 [2019-09-25]. (原始内容存档于2019-09-25). 
  10. ^ The Titan supercomputer is being decommissioned: a costly, time-consuming project. Network World. 2019-07-10 [2019-10-16]. (原始内容存档于2019-12-23). 
  11. ^ 美國能源部斥資打造第二款Exascale等級的超級電腦. iThome. 2019-05-08 [2020-03-05]. (原始内容存档于2020-05-09). 
  12. ^ 12.0 12.1 12.2 Feldman, Michael. GPUs Will Morph ORNL's Jaguar Into 20-Petaflop Titan. HPC Wire. 2011-10-11 [2012-10-29]. (原始内容存档于2012-07-27). 
  13. ^ Oak Ridge changes Jaguar's spots from CPUs to GPUs by Timothy Prickett Morgan, The Register Oct 11, 2011 [3]页面存档备份,存于互联网档案馆
  14. ^ 14.0 14.1 Jaguar: Oak ridge National Laboratory. TOP500. [2012-12-18]. (原始内容存档于2013-03-17). 
  15. ^ TOP500 List November 2011. TOP500. [2012-12-18]. (原始内容存档于2013-01-21). 
  16. ^ Discussing the ORNL Titan Supercomputer with ORNL’s Jack Wells.. The Exascale Report. November 2012 [2012-12-19]. (原始内容存档于2013-03-26). 
  17. ^ Bland, Buddy. Where do we go from here? (PDF). 2010-11-16 [2012-12-18]. (原始内容 (PDF)存档于2012-03-03). 
  18. ^ Morgan, Timothy Prickett. Oak Ridge goes gaga for Nvidia GPUs. 2009-10-01 [2012-12-19]. (原始内容存档于2012-11-09). 
  19. ^ Levy, Dawn. ORNL awards contract to Cray for Titan supercomputer. 橡树岭国家实验室. 2011-10-11 [2012-12-19]. (原始内容存档于2013-02-26). 
  20. ^ Munger, Frank. Oak Ridge lab to add titanic supercomputer. Knox News. 2011-03-07 [2012-12-19]. (原始内容存档于2012-07-04). 
  21. ^ 21.0 21.1 Brouner, Jennifer; McCorkle, Morgan; Pearce, Jim; Williams, Leo. ORNL Review Vol. 45 (PDF). 橡树岭国家实验室. 2012 [2012-11-02]. (原始内容 (PDF)存档于2013-03-04). 
  22. ^ 22.0 22.1 Titan: ORNL’s Next Step in Leadership Computing (PDF). Oak Ridge Computing Leadership Facility. [2013-06-21]. (原始内容存档 (PDF)于2013-02-24). 
  23. ^ Superfast Titan, Superfast Network. 橡树岭国家实验室. 2012-12-17 [2012-12-18]. (原始内容存档于2013-03-26). 
  24. ^ 搭载GK110 Kepler晶片NVIDIA TESLA K20平行运算卡发表页面存档备份,存于互联网档案馆) - Mobile01,2012年11月14日
  25. ^ NVIDIA Launches Tesla K20 & K20X: GK110 Arrives At Last页面存档备份,存于互联网档案馆) - anandtech.com,2012年11月12日(美国东部时间
  26. ^ Jones, Gregory Scott. Final Upgrade Underway. Oak Ridge Leadership Computing Facility. 2012-09-17 [2012-11-16]. (原始内容存档于2013-03-26). 
  27. ^ Alexis Santos. Cray's Jaguar supercomputer upgraded with NVIDIA Tesla GPUs, renamed Titan. engadget. 2012-10-29 [2013-06-21]. (原始内容存档于2013-07-10). 
  28. ^ Munger, Frank. No. 1 Titan not yet living up to potential. Knox News. 2013-02-20 [2013-03-26]. (原始内容存档于2013-03-26). 
  29. ^ 29.0 29.1 29.2 Huotari, John. Cray re-soldering Titan’s connectors, supercomputer testing could be done in April. Oak Ridge Today. 2013-03-13 [2013-03-26]. (原始内容存档于2013-03-26). 
  30. ^ Jones, Scott. Titan Users Now Have Access to GPUs. Oak Ridge Leadership Computing Facility. 2013-03-26 [2013-03-26]. (原始内容存档于2013-03-26). 
  31. ^ Huotari, John. Titan repairs complete, ORNL preparing for second round of supercomputer testing. Oak Ridge Today. 2013-04-08 [2013-04-08]. (原始内容存档于2013-04-08). 
  32. ^ Leo, Williams. Titan Completes Acceptance Testing. OLCF. 2013-06-12 [2013-06-26]. (原始内容存档于2013-06-26). 
  33. ^ 33.0 33.1 Munger, Frank. The ORNL and NOAA relationship. Knox News. 2012-11-26 [2012-12-20]. (原始内容存档于2013-03-26). 
  34. ^ Munger, Frank. The cost of Titan. Knox News. 2012-11-18 [2012-12-20]. (原始内容存档于2013-03-26). 
  35. ^ 推土机、开普勒联手打造最强超级计算机页面存档备份,存于互联网档案馆) - 驱动之家,2012年10月29日
  36. ^ Smith, Ryan. Nvidia's GeForce GTX Titan Review, Part 2: Titan's Performance Unveiled. Anandtech. 2013-02-21 [2013-03-26]. (原始内容存档于2013-02-23). 
  37. ^ GeForce GTX Titan. Nvidia. [2013-03-26]. (原始内容存档于2013-03-26). 
  38. ^ GeForce GTX TITAN Black. [2015-11-02]. (原始内容存档于2015-09-24). 
  39. ^ E-Zone. NVIDIA Titan Z首测:双芯卡皇 惨不忍睹. E-Zone. [2014-05-13]. (原始内容存档于2014-05-15). 
  40. ^ 狂拽 新Titan矿机挖矿能力是290X的117倍. pcgames.com.cn. [2015-11-02]. (原始内容存档于2016-10-06). 
  41. ^ 这就是吊丝的春天?看各款显卡挖矿测试. pconline.com.cn. [2015-11-02]. (原始内容存档于2016-03-04). 
  42. ^ 6块GTX 750 Ti群殴GTX Titan:性能、价格完胜. expreview.com. [2015-11-02]. (原始内容存档于2016-03-04). 
  43. ^ Summit FAQs. ornl.gov. Oak Ridge National Laboratory. 2014-11-14 [2014-11-15]. (原始内容存档于2014-11-29). 
  44. ^ 44.0 44.1 44.2 44.3 44.4 44.5 Introducing Titan. Oak Ridge Leadership Computing Facility. [2012-10-29]. (原始内容存档于2013-02-22). 
  45. ^ Heterogeneous Systems Re-Claim Green500 List Dominance. Green500. 2012-11-14 [2012-11-15]. (原始内容存档于2013-02-05). 
  46. ^ 46.0 46.1 46.2 Bland, Buddy; Lal Shimpi, Anand. Oak Ridge National Laboratory Tour - Backup Power (Youtube). Anandtech. 2012-10-30 [2012-11-02]. (原始内容存档于2013-06-06). 
  47. ^ 47.0 47.1 Bland, Buddy; Lal Shimpi, Anand. Oak Ridge National Laboratory Tour - Cooling Requirements (Youtube). Anandtech. 2012-10-30 [2012-11-02]. (原始内容存档于2013-06-06). 
  48. ^ 48.0 48.1 Pavlus, John. Building Titan: The ‘world’s fastest’ supercomputer. BBC. 2012-10-29 [2013-01-08]. (原始内容存档于2013-01-30). 
  49. ^ Morgan, Timothy Prickett. Oak Ridge changes Jaguar's spots from CPUs to GPUs. The Register. 2011-10-11 [2013-06-20]. (原始内容存档于2012-10-15). 
  50. ^ 50.0 50.1 50.2 ORNL Debuts Titan Supercomputer (PDF). Oak Ridge Leadership Computing Facility. [2012-10-29]. (原始内容存档 (PDF)于2013-02-26). 
  51. ^ 51.0 51.1 51.2 Titan System Overview. Oak Ridge Leadership Computing Facility. [2012-12-21]. (原始内容存档于2013-03-26). 
  52. ^ GK110强势到来!Tesla K20X/K20正式发布页面存档备份,存于互联网档案馆) - 驱动之家
  53. ^ Lal Shimpi, Anand. Titan's storage array. Anandtech. 2012-10-31 [2012-12-18]. (原始内容存档于2013-06-01). 
  54. ^ TITAN OVERVIEW. Oak Ridge Leadership Computing Facility. [2012-12-18]. (原始内容存档于2013-02-18). 
  55. ^ Santos, Alexis. Titan supercomputer to be loaded with 'world's fastest' storage system. Engadget. 2013-04-16 [2013-04-16]. (原始内容存档于2013-04-16). 
  56. ^ Munger, Frank (January 1, 2013). "ORNL visualization lab gets $2.5M makeover, adds 3D"页面存档备份,存于互联网档案馆). Knox News. Retrieved January ,2013.
  57. ^ Jones, Gregory Scott. ORNL Supercomputer Named World’s Most Powerful. 橡树岭国家实验室. 2012-11-12 [2012-12-14]. (原始内容存档于2013-02-22). 
  58. ^ 采用NVIDIA Tesla芯片的泰坦超级计算机运算能力全球称霸页面存档备份,存于互联网档案馆) - cnBeta.com,2012年11月12日
  59. ^ Williams, Leo. Titan is Also a Green Powerhouse. Oak Ridge Leadership Computing Facility. 2012-11-14 [2012-11-15]. (原始内容存档于2013-02-16). 
  60. ^ June 2013. TOP500. [2013-07-02]. (原始内容存档于2013-07-02). 
  61. ^ The Green500 List - June 2013. Green500. 2013-06-28 [2013-07-02]. (原始内容存档于2013-07-02). 
  62. ^ 推土机+开普勒的威力:海图尽览超级计算机“泰坦”页面存档备份,存于互联网档案馆) - 驱动之家,2012年11月1日
  63. ^ 63.0 63.1 63.2 63.3 63.4 63.5 63.6 TITAN: Built for Science (PDF). Oak Ridge Leadership Computing Facility. [2012-10-29]. (原始内容存档 (PDF)于2013-02-26). 
  64. ^ 64.0 64.1 64.2 64.3 Williams, Leo. Preparing users for Titan. 橡树岭国家实验室. [2012-11-19]. (原始内容存档于2013年3月1日). 
  65. ^ Rumsey, Jeremy. Titan Trainers Take Road Trip. Oak Ridge Computing Leadership Facility. 2012-12-17 [2012-12-18]. (原始内容存档于2013-03-26). 
  66. ^ 10.Development Tools页面存档备份,存于互联网档案馆) - Oak Ridge Leadership Computing Facility
  67. ^ Compiling On Titan页面存档备份,存于互联网档案馆) - Oak Ridge Leadership Computing Facility
  68. ^ 68.0 68.1 Lal Shimpi, Anand. Inside the Titan Supercomputer. Anandtech: 3. 2012-10-31 [2012-11-15]. (原始内容存档于2013-04-05). 
  69. ^ 世界最快超级计算机泰坦每秒运算17千万亿次页面存档备份,存于互联网档案馆) - 新浪科技,2012年11月14日
  70. ^ NVIDIA 藉 CUDA 平行运算协助 Titan 夺下地表最快 HPC页面存档备份,存于互联网档案馆) - cool3c.com,2012年11月14日
  71. ^ 美国重夺超级计算机首位 中国“天河”降为第八页面存档备份,存于互联网档案馆) - 凤凰军事,2012年11月14日
  72. ^ Nuclear Energy – Supercomputer speeds path forward. Consortium for Advanced Simulation of LWRs. [2012-12-14]. (原始内容存档于2013-02-14). 
  73. ^ Zybin, Sergey. LAMMPS Molecular Dynamics Simulator. Sandia National Laboratories. [2012-10-29]. (原始内容存档于2006-09-22). 
  74. ^ Messer, Bronson. Using Titan to Model Supernovae (Youtube). Anandtech. 2012-10-30 [2012-11-15]. (原始内容存档于2013-07-26). 
  75. ^ 75.0 75.1 Pearce, Jim. VERA analyzes nuclear reactor designs in unprecedented detail. 橡树岭国家实验室. [2012-12-18]. (原始内容存档于2013年2月15日). 
  76. ^ 2013 INCITE Awards (PDF). 美国能源部. [2013-01-17]. (原始内容 (PDF)存档于2013-03-26). 

外部链接

纪录
前任者:
IBM红杉
16.325 petaflops
全球最快的超级电脑
2012年11月 – 2013年6月
继任者:
天河二号