编者按:走近领航者,致敬耕耘者。搜狐科技高端访谈栏目《1号位》与知名企业家、行业顶级专家展开深度对话。担一级责任,做一等决策,创一流技术,是为一号人物。本期搜狐科技邀请到了计算机科学家钱德沛。
嘉宾介绍:钱德沛,中国科学院院士,中国计算机学会会士,北京航空航天大学计算机学院教授,长期从事计算机体系结构和高性能计算系统研究。
钱德沛解决了基于分散、异构、动态资源构建网络计算环境的关键技术问题,主持研发了国家高性能计算环境CNGrid;提出了改善众核并行编程的系统性方法,促进了高性能计算的普及应用;长期任高性能计算方向国家重大项目总体组长,主持制定了战略目标和实施方案,确立了高性能计算机的体系结构和技术方案,实现了高性能计算机的跨越发展。
“中国超算从业者不光要认识到短板,更要有危机感。”钱德沛接受搜狐科技专访时谈及国内外超算技术发展差距,语气温和,却掷地有声。
超算,是大国科技竞争的战略高地,在模拟核试验、气象预报、石油勘探、生命科学等诸多领域发挥着重要作用。
当前风云变幻的国际关系,也影响到了超算的发展。钱德沛坦言,芯片制造、芯片设计受到限制,会给超级计算的发展带来很大困难。“人家不让你往前走,我们要想办法能够自己往前走。”
回顾历史,中国超算走出了一条超常规的发展之路。从跟随者到进入世界超算的第一梯队,中国只用了二十多年时间。
1996年,钱德沛与中科院院士李未参加世界超算大会时,基本碰不到中国大陆来的人。“李老师当时还说,美国人造万亿次的机器,我们能不能砸锅卖铁,造个5000亿次的?”
2010年,速度高达4700万亿次的“天河一号”首次拿下世界超算500强榜首。次年,钱德沛在世界超算大会上受邀作特邀报告,这也是中国人首次被邀请在该大会上做报告。再后来,中国登顶超算500强榜单成为常态。
今年,美国橡树岭国家实验室打造的超级计算机Frontier首次打破E级(Exascale,百亿亿次级)计算瓶颈,标志着超算正式进入E时代。
即使外部环境面临很大不确定性,钱德沛透露,我国也已实现“十三五”E级计算的研究目标。
每秒百亿亿次计算速度,是象棋大战中击败人类的“深蓝”的一亿倍,相当于约100万台个人的笔记本电脑同时计算。凭借如此强大的性能,E级计算机试图将人类智慧延伸至更加广阔的天地里。
比如,钱德沛认为E级计算机对生命健康领域有重大意义,可以帮助寻找出癌症发生的原因、规律。
计算是一个连续发展的过程,E级计算机并不是终点,只是中间的一个里程碑。E级计算机之后,相当于前者计算速度1000倍的Z级计算机成为科学家们奋斗的目标。
不过Z级计算机出现的速度可能不会特别早,这是因为单个芯片性能、系统并行规模不能无止境地提高、扩大。钱德沛表示,E级计算实现时间已经延后了,2035年以前不可能实现Z级计算。
“任何一种技术都有快速发展期、成熟期以及平台期。”2013年以前,超算领域保持着“十年千倍”的发展速度,但近年超级计算机性能进步速度已经趋缓。
以下是对话实录(经编辑):
一、高性能计算进入E时代
“一台E级计算机造价约6亿美元,重量几百吨,每小时耗电约四五万度,相当于100万个笔记本电脑同时计算。”
搜狐科技:今年,Frontier成为世界上第一台打破百亿亿级计算瓶颈的超级计算机,表明当前高性能计算正式进入E时代,E级计算机运算能力有多强?
钱德沛:一台E级计算机,相当于现在约100万台个人的笔记本电脑同时计算。这还只是纯加起来的计算,让这些电脑同时工作是件更难的事情。
搜狐科技:体积、重量以及造价大概是?
钱德沛:每一代超级计算机体积都差不多, 加上存储、网络,E级计算机大概有200个机柜,每个机柜大概一两吨。能耗是每小时几十兆瓦,相当于四五万度电。
国际上E级计算机造价大概是6亿美元,我们的在30亿元人民币左右,比上一代的P级计算机(PetaFLOPS,每秒一千万亿次浮点运算)成本略高一点,但不是数量级的增加,我国P级计算机耗资约3亿美元。
搜狐科技:E级计算机能力这么强,对解决实际问题有什么作用?能解决哪些P级计算机不能解决的问题?
钱德沛:其实计算是一个连续发展的过程,原来传统应用领域需要提高精度、分辨率,对计算的需要也会更大。比如说天气预报的分辨率,其实是依据网格的划分大小,每细分1倍计算能力就需要提高8倍,这是个水涨船高的过程。
现在也出现了一些新的应用领域,大家对生命健康这件事情越来越关注,我觉得E级计算机可以帮助找出癌症发生的原因、规律。比如,为什么会产生癌症?它跟人的基因有什么关系?
搜狐科技:E级计算机什么时候能实现成熟应用?
钱德沛:从历史来看,P级计算机是2008年左右出现,能够比较好地用到P级计算机能力,大概在两三年之后。E级计算机和E级计算机应用在同步发展,但应用会相对滞后。现在E级计算机全规模应用的有几十个,如果用到更多领域还需要两三年时间。
搜狐科技:中国“十三五”规划中指出要突破E级计算机核心技术、“十四五”要实现10E级超算,美国、欧洲、日本也争相布局E级超算,为什么E级超算成为大国科技竞争的重中之重?
钱德沛:每一个阶段有阶段性的口号,计算技术的发展总是要往前走。十几年以前,P级是重大的目标,P级完了是E级,E级完了是Z级。
E级计算在这个阶段为什么重要?第一,刚刚提到的挑战性问题解决需要E级计算能力;第二,国家安全方面需要强大的计算能力;第三,计算技术需要往前推进,E级计算技术影响了整个计算机产业的水平。
搜狐科技:您曾撰文指出,如果没有颠覆性的突破,2035年前不能实现Zetta级计算机。Z级计算机实现的技术挑战主要集中在哪些方面?
钱德沛:过去高性能计算技术进步有两条路,包括单个芯片性能的提高,以及系统包含的处理器数量的提高,即并行规模的扩大。但这两条路我们都碰到了天花板,芯片工艺逐渐接近极限,并行规模也不能再无限扩展,因为机器的功耗太大。
我们目前性能和能效的提升速度之间有大概十多倍的差距,如果性能提升1000倍,能效可能只能提高不到100倍。按此推算,现在E级计算机能耗大概50兆瓦,Z级机器能耗大约在500兆瓦至1000兆瓦之间。就算造出来,也没人敢运行系统,因为能源的密度太高、电网的压力太大。
从经济角度来说,P级计算机一年运营经费大概要几千万,E级大概几个亿,如果Z级一年几十个亿的运营经费,是不被接受的。
二、中国用20多年时间进入世界超算第一梯队
“1996年,我与李未老师参加世界超算大会时,基本碰不到中国大陆的人。经过20多年发展,现在中国超算已进入世界第一梯队,实现排名和美国、日本交替领先。”
搜狐科技:我们现在在超算领域的国际地位如何?
钱德沛:中国在超算领域的发展和国家实力的提高分不开。1996年我跟随李未老师赴美参加世界超算大会,基本上碰不到中国大陆去的人,这说明我们在这个领域没有发言权。
我们当时参观了美国的超算中心,人家的机房里几十台IBM SP2在运行,我们当时一台机器、一个机柜摆在那里还费了九牛二虎之力。李老师当时说,美国人造万亿次的机器,我们能不能砸锅卖铁、造个5000亿次的?
经过20多年发展,我们进入世界超算的第一梯队,排名和美国、日本交替领先。机器计算速度从96年的每秒25亿次,发展到现在的百亿亿次。应用模式也变了,之前要到机房里提交作业、得到结果,现在想用国家高性能计算可以直接从网上来使用。
中国从跟随者到进入到第一梯队,引起其他国家的关注。人家制裁你了,说明你的地位提高了。
搜狐科技:我国高性能计算领域的短板何在?新形势下会遇到什么样的挑战?
钱德沛:我觉得不光要认识到短板,更要有危机感,并且超算从业者的危机感要比外面更明确、更具体。
当下芯片制造、芯片设计受到限制,会给超级计算发展带来很大困难。我们要想各种其他的办法,比方说从体系结构、实现技术等方面克服。
另外我们应用的水平比最先进的国家有差距,一方面应用中使用的软件大多数是进口的,存在一定风险。另一方面,应用的普及性和参与的人少,比如做飞机、汽车优化,只有少数企业能干。
搜狐科技:现在自主可控是最重要的事情吗?
钱德沛:人家一定要卡住你,不让你往前走,我们一定要有办法能够自己往前走,不依靠别人。但自主可控和吸收人类文明的最先进成果,不应该对立。
三、超级计算机会向类脑方向演进吗?
“与人脑相比,超级计算机擅长重复执行被定义清楚的操作,不擅长理解、顿悟。并且,人脑功耗大概是20瓦,如果超级计算机像人脑一样高效,能耗会大大减少。”
搜狐科技:类脑计算、光子计算、量子计算等新型计算技术,会成为解决超级计算机性能进步速度趋缓的方法吗?
钱德沛:量子计算、光子计算、类脑计算更多是作为现在计算机的补充,从短时间来看不能够解决主流计算机性能提升的问题。
量子计算机每年都有进步,但与通用、成熟的计算系统距离还远。光子计算机能达到的速度和能耗的水平还不足以威胁电子计算机的地位。而如果要真正理解人脑,利用人脑工作的原理来造计算机,就更远了。
搜狐科技:人脑可以看作经过上亿年进化所形成的“计算机”。与人脑相比,超级计算机擅长什么?不擅长什么?
钱德沛:我觉得简单说人脑是计算机,并不准确,现在的计算机,计算问题最终映射到二进制位所能够操作的结构上去,但人脑并不完全是计算。
与人脑相比,超级计算机擅长重复执行被定义清楚的操作,不出错、不知疲倦,但不擅长理解、直觉、顿悟。比如一个人看到一个人,马上知道他是谁,能大概猜到对方心里想的事情,这里面是什么道理还说不清楚。
另外人脑功耗大概只有20瓦,如果超级计算机像人脑一样高效,能耗会大大减少。
搜狐科技:超级计算机会朝着“类脑”的方向发展吗?
钱德沛:我觉得超级计算机发展的目标并不是说真要像人脑,因为人脑计算能力还比不过计算机,所以本质上是要吸取人脑优点来使得高性能计算机表现更好,比如提高能效,提高学习、推理、进化能力。
搜狐科技:在即将到来的CNCC2022上,您即将发表《从网格到东数西算,构建国家计算基础设施》为主题的演讲。对于超算行业来说,“东数西算”工程的意义何在?
“东数西算”对于我国超算发展会有很好的促进作用,它代表着一个算力被大众所认可的时代。
我所接触到的国家20多年来科技发展计划的项目,刚开始高性能计算应用领域比较窄。到“十三五”期间,我们支持了有将近20个比较大的应用软件,覆盖了汽车、高铁、飞机等重要行业,以及科学研究中的天文、生命科学等。
新形势下,“东数西算”计划可以解决能源分布不均匀和应用需求不均匀的问题,通过建成算力基础设施牵引经济发展。