超级核算,对一般民众而言,是一个“巨大上”的名词,代表着全国际最强壮的核算机,以及依据强壮硬件之上的杂乱科学核算软件;而关于各范畴的科学家和工程师而言,它又是在数字国际里延展咱们探究不知道国际才干的重要东西。
最近的10年是我国超级核算(简称超算)蓬勃开展的10年。在2018年的两院院士大会上,超级核算成为习讲话中,战略高技能开展的一个重要效果表现:“超级核算机接连10次连任国际之冠,选用国产芯片的‘威风·太湖之光’取得高功用核算运用最高奖‘戈登·贝尔奖’”。
电子核算机诞生之初,因为造价贵重,只要大型的科研机构或商业公司才有运用条件。一般意义上的第一台电子核算机ENIAC[1],便是由美国军方的弹道研讨实验室赞助规划的一台依据真空管的核算体系,它能够主动进行乘法和累加。尽管ENIAC的原本意图是为了核算火炮体系的弹道表,但冯·诺依曼(J. von Neumann)等其时就运用这台体系进行了氢弹研制以及数值气候模仿等开创性的科学核算作业。
跟着1950—1960年代集成电路技能的逐渐开展,处理器的规划和制作逐渐成为或许。超级核算机也在这个时期迎来重要开展。因为彼时处理器硬件以及核算软件的研制都处于萌发时期,并没有太多规矩和兼容性的捆绑,享有“超级核算机之父”之称的克雷(S. Cray)在前期提出了许多天才的设想,比方超级核算机CDC6600体系[2]中中央处理器(CPU)和辅佐处理器(PPU)的协同规划,以及Cray-1核算机[3]中专门针对科学核算的大规划数组操作的向量处理器规划。这些规划理念直到现在仍在不同的核算体系中沿袭、集成和从头开展。
从CDC6600诞生的1964年,到简直整个1970年代,超级核算机都沿袭了相似的结构,即整个体系仅靠一个或许几个微弱的处理器来支撑,每个处理器内部都有杂乱的单元规划和功用。
直到1980年代,超级核算机开展的另一条途径才开端逐渐闪现。在超级核算机的杂乱向量处理器开展的一同,集成电路技能催生下的微处理器[如英特尔(Intel)前期的4004和8008]和个人电脑也在迎来一日千里的改变。相较于本钱昂扬、通用性低的向量处理器,尽管微处理器单个的功用无法与之比较,但经过网络来集成很多价格低廉、标准化出产的微处理器却能够完结更高的核算功用。1981年,加州理工学院的研讨者选用64个Intel 8086处理器,经过六维超立方的互联,建成了Cosmic Cube体系[4]。尔后,英特尔的iPSC体系、麻省理工学院研制的CM(Connection Machine)体系、日本富士通研制的风洞模仿器等集成了成百上千个处理器的大规划并行处理机开端不断涌现,并供给了比本来的向量处理器更高的核算功用。
“威风·太湖之光”核算体系架构 在一个节点内部,单个威风芯片聚合了4个核组,多达260个不同的核算中心;在一个威风的超节点中,经过定制网络版集成了256个芯片,并完结恣意两个芯片彼此间的点对点高速直连;在体系层面,经过“威风”自主研制的高速网络体系,将4万个芯片逾越1000万个核算中心会聚成一个全体。
在此进程傍边,科学核算范畴仍对是否能够驾御如此大规划的并行机器存在深深的疑虑。依据阿姆达尔定律的剖析,假如一个程序中有10%的部分无法并行,那么即便选用1000个处理器,最多也便是把剩余90%的时刻优化到能够忽略不计,所取得功用加速比(加速比指同一个使命在单处理器体系和并行处理器体系中运转耗费的时刻的比率)最多是10倍。那么几百个乃至几千个处理器是否能够取得相应的功用收益,这是有疑问的。1985年末,卡普(A. Karp)在邮件中建议应战,假如任何人能在并行机上取得一个科学核算软件200倍以上的加速,他将私家付出100美元的奖金。1987年,核算机范畴的闻名研讨者戈登·贝尔(Gordon Bell)正式建立了“戈登·贝尔奖”来奖赏和盯梢超级核算机上最顶尖的运用效果,当年的获奖者就在由1024个节点组成的nCube体系[5]上取得了400到600倍的功用提高。
尔后近30多年里20多届“戈登·贝尔奖”的鉴定和颁布,见证了超级核算机和依托于超级核算机的高功用核算运用的飞速开展,也成为了国际超算运用范畴的最高奖项。从头几年每秒十亿次浮点运算左右的运用功用,到2021年量子电路模仿逾越每秒400亿亿次浮点运算的运用功用,无论是超级核算机硬件所能供给的核算才干,仍是高功用核算软件的相关技能,都取得了长足的前进。
依据超算的超大规区分子对接药物挑选效果示例 (a)类药小分子(五颜六色部分)与新式冠状病毒相关受体(PDB 7K0F,绿色部分)在对接盒子(立方体)中的结合状况;(b)对接盒子中蛋白质受体和类药小分子彼此效果暗示。
业界都说超级核算机是科技范畴皇冠上的明珠,因为它的建造需求电子芯片、核算机体系、内存、存储、电源和冷却体系,以及根底软件、运用软件等方面的技能堆集和集成。需求在方方面面都做到高水准,才干集成出一台国际抢先的超级核算机。
作为超级核算机,首要它的“超级”表现在与众不同的核算速度上。因为简直一切的科学核算软件都选用浮点数作为根本的数据格式,浮点运算操作(浮点数的加减乘除)就成为衡量核算杂乱度和核算量的根本单位。每秒能进行的浮点运算次数则成为衡量一台核算机核算速度的通用方针。能够说,现阶段超算体系的速度比科幻作家大开“脑洞”能想到的速度还要快。闻名科幻作家刘慈欣在《三体》中是这样描绘国际最强壮核算机的:每秒能够进行500万亿次浮点运算。其实,在2008年,其时国际排名第一的超级核算机——美国“走鹃”[6],就现已到达每秒1000万亿次浮点运算的速度。无锡的“威风·太湖之光”[7]超级核算机继续功用到达每秒9.3亿亿次,是三体国际的整整186倍。实际现已逾越了科幻!
第二个“超级”就表现在它超级大的并行规划上。现在干流的技能道路是经过精妙的体系规划和高速的网络互连把很多核算资源集聚成一个全体,然后取得超级快的核算速度。与初期几千个或几万个中心组成的体系比较较,“威风·太湖之光”集聚了上千万个核算中心。假如把一个核算中心比作一个人的话,这台核算机就相当于一个具有千万人口的超级大都市。能够幻想,要让这1000万人齐心协力,拧成一股绳,来处理一个科学或工程的问题,每个人不只要担任自己的核算,还要跟其他人交流数据,不能“堵车”、不能“宕机”,还要考虑散热、供电、稳定性等方面的问题,这将是一个巨大的应战,需求方方面面的技能立异才干到达。
第三个“超级”表现在处理的“超级”问题上。超级核算机的中心功用便是经过数值模仿或许是数据剖析,在数字国际中拓宽人类探究不知道国际的才干。大到很多的国际,小到分子、原子的模仿,在国际的来源和演化、全球气候改变、药物和资料的研制、飞机发动机的仿真等科学或工程的前沿范畴,超级核算机以及它所支撑起的数字才干,都发挥着不可或缺的效果。特别是关于全球最顶尖的超算体系,核算才干每往前走一步,就意味着在这些范畴里能够核算更大或更杂乱的问题:测验一个更杂乱的规划或场景,或是把不或许变为或许。
另一个不容忽视的特色,便是超级核算机在处理 “超级”问题时,日益表现出来的激烈的穿插性。人类社会当时面对的科学技能和工程问题大多触及多个学科,需求不同布景的科学家一同处理。单是全球气候改变和应对的研讨,就触及了大气、海洋、生态、遥感、大气化学、全球改变经济学等不同学科。而依据超算的核算软件,因为其具有灵活性,能够将不同范畴的新发现和新知道集成到一个东西中,构成了一个多学科常识穿插和沉积的渠道。而这样的特性,对超算软件的研制人员提出了很高的要求。
近10年我国超算快速开展的背面是慈云桂、金怡濂先生等一批老一辈超算作业者熬更夙夜、接续斗争打下的坚实根底。
严厉来讲,我国的核算机起步并不算晚,经过学习苏联的技能,1958年就出产出第一台数字电子核算机——103机[8]。但之后因为国内外局势的改变,直到1978年3月在全国科学技能大会上,同志提出 “我国要搞四个现代化,不能没有巨型机”,我国超级核算机工作才又从头启动起来,但彼时与西方发达国家比较,距离现已拉大。
手握超级核算机抢先技能的西方国家,对包含我国在内的开展我国家实行了长时刻的严厉控制,禁止出口相关的高端技能和产品。此外,因为超算渠道能够支撑很多与国家安全等战略密切相关的核算使命,1980—1990年代,在国内的石油及气候职业中,研讨人员运用置办的美国超算体系时,需求放在玻璃房内,由美方人员监管运用状况。这样的玻璃房深深刺痛着我国超算范畴的研制人员,他们立志要造出自己的超级核算机。直到“银河”“曙光”等国产超级核算机研制成功后,西刚才免除对我国高功用核算机的出口约束。
40年间,从初代的“银河”“曙光”到近10年中接连5年占有国际第一的“银河”和“威风”,我国在超级核算机方面开展迅速,从空白走向与美日比美,成为继美国、日本之后第三个能独立规划和研制国际顶尖超级核算机的国家。2021年国际超级核算机500强榜单中,我国共有186台上榜,数量排行第一。这是2017年11月以来,我国超级核算机上榜数量接连8次位居第一。
在超算硬件渠道迅速开展的根底上,我国的超算软件也在地球科学、生物信息、工业仿真、资料科学、人工智能等多个范畴有了长足前进。在“戈登·贝尔奖”颁布的前29年里,该奖项一向被美国和日本科学家所独占。直到2016年,我国科学院软件所、清华大学、北京师范大学、国家并行中心等单位的联合团队,总算填补了空白,以千万核可扩展的大气动力方程求解器[9]取得这一奖项。
2021年,清华超算团队作为中心成员第三次斩获“戈登·贝尔奖”,一举打破了美国谷歌公司此前声称的“量子霸权”神话。
“量子霸权”是一个术语,表明量子核算设备在某些运用场景中,能够表现出传统核算机无法企及的功用优势。谷歌公司2019年研制的“悬铃木”体系在200秒内完结的百万量子采样(保线%),美国最快的极点超级核算机需求一万年才干模仿完结。时刻上的差异高达10亿倍。我国超算团队凭仗研制的超大规划量子随机电路模仿器[10],完结了近实时的量子模仿,提出的近似最优的张量网络并行切分和缩短办法及混合精度算法,可高效扩展至数千万核并行规划,并供给每秒4.4百亿亿次的继续核算功用,是现在已知的超算范畴最高混合精度浮点核算功用,也证明了谷歌2019年演示的随机量子线路采样使命并不能真实完结“量子霸权”。这又是一项多学科穿插的效果,它集聚了核算机、数学、量子物理等多个范畴研讨者的共同努力,促进了传统超算和量子核算的共同开展。关于传统超算而言,新式量子核算机所构成的“量子霸权”是“参考之资”。在传统超算上完结这样一个杂乱度极高的问题,触发了算法、并行办法、优化办法等各个方面的立异。而近实时的量子电路模仿,则真实建立了最先进的量子核算机和最先进的超算之间的桥梁,让它们能够彼此促进,乃至彼此交融。
取得超算范畴最高奖,关于我国超算的开展而言,是一个重要的里程碑,更是一个新的开端。
依据功用区分,超级核算可分为顶级超算、通用超算、事务超算以及人工智能超算等几大类。在国家扶持和运用场景扩展下,2021年,我国超级核算服务规划现已到达196.6亿元,估计2026年将增加至500亿元。
尽管我国超算现已取得了必定的成果,超级核算机数量位居全球第一,但近年来美国、日本等国也在不断提高自身实力。本年5月底,国际组织“TOP500”发布了2022年上半年全球超级核算机500强榜单,美国超级核算机“前沿”初次上榜并位列第一,日本超级核算机“富岳”降至第2位,“威风·太湖之光”和“银河二号”别离位居第6位和第9位。“前沿”的运算才干逾越“威风·太湖之光”12倍,到达每秒100亿亿次,是全球首台每秒能履行百亿亿次浮点运算的超级核算机。
为了在超算范畴中坚持竞赛力,自2016年开端,我国连续发布了一系列方针支撑超算的开展,把超算列入《国民经济和社会开展十四个五年规划和2035年前景方针大纲》《十四五数字经济开展规划》等国家严重规划傍边,着重要聚集高端芯片、操作体系、人工智能要害算法、传感器等要害范畴,加速推进根底理论、根底算法、配备资料等研制打破和迭代运用;清晰表明要加速构建全国一体化大数据中心体系,建造E级和10E级超级核算中心(E级超级核算指每秒可进行百亿亿次运算的超级核算机,是国际上高端信息技能立异和竞赛的制高点,被公认为“超级核算机界的下一顶皇冠”);提出加速施行“东数西算”工程等行动。仅是“东数西算”工程,其历史意义和战略价值将与西气东输、南水北调等世纪工程比较美。这些行动的意图便是从国家战略、技能开展、动力方针等多方面动身,构建一个全方位的超算开展体系。
针对国产高端芯片,国家现已提出2025年芯片冲刺70%自给率的方针。在方针上,除了对集成电路范畴企业给予“10年免税”优惠方针外,还建立专项扶持基金、放宽所得税极限、借款贴息等扶持方针,给国产芯片企业留存了加速开展的空间。或许这是我国超算加速开展的新关键。
超算编织出的数字国际,是实际国际中人类无法直接用双手去接触的微观或微观问题的投影。这个数字国际中包含了很多的或许性,当然也有很多的应战在等待着咱们。多年来,超算硬件和软件体系继续不断开展,其背面便是人类关于科学、工程问题和不知道国际永无止境的探究,多学科多范畴的深度交融与开展。超算的开展也是如此,从很多学科中罗致开展的动力,一同以超算的开展反推,为各学科范畴供给新鲜动力。
以地球体系数值模仿近年来的开展为例,除了时空分辩率的继续提高(美国、欧洲及日本团队均已提出了依据E级超算的全球1千米分辩率大气形式方针),还出现多进程、多时空标准相耦合的杂乱特性,对模仿软件的研制提出了新的应战。数据剖析方面,气候改变、地球物理等范畴堆集了海量的多类型数据,也有研讨开端测验以深度学习办法增强和替代原有的数据剖析功用。与互联网的语音及图画数据比较,科学范畴的数据及模型往往触及更大的维度和数据规划,并且对标示有更高的专业要求,对练习和运用都提出了更多问题。在这种布景下,探究超算与人工智能办法结合的计划推进上述问题开展的一同,还将进一步开宣布两条途径之间互补性的巨大潜力。例如,米级分辩、多时刻点观测的遥感卫星数据相较于百公里级的气候形式,有巨大的潜力供给更多的信息和猜测才干。超级核算与人工智能的相遇和深度交融也将为很多范畴科学问题的探究供给更多或许。
中流击水,奋楫者先。咱们无法断语未来的超算国际会是怎样,但跟着核算技能和办法的不断演进,超算自身与其他学科范畴的深度交融,将会在数字国际中供给越来越多的立异或许。