漫谈科学家的“计算焦虑”
2021-06-01 10:02:44
文章来源
中国科学报

  5月30日是第5个“全国科技工作者日”。在这个向科学家致敬的日子,钱学森、邓稼先、吴文俊、袁隆平、黄旭华等许多老一辈科学家在这天成为人们“追星”的对象。

  人们总是要问:在那个一穷二白的年代,他们是怎样做到的?

  尤其是,那个没有电子计算机的年代,他们是怎么运算、模拟、设计的?用算盘吗?

  还真是。

  从算盘到超算

  “中国核潜艇之父”、中国工程院院士黄旭华至今仍珍藏着的一把“前进”牌算盘。许多人可能想象不到,中国的第一代核潜艇,是用算盘和计算尺一点点算出来的。

  中国核潜艇的另外一位“拓荒牛”、近日被中宣部追授“时代楷模”称号的彭士禄院士,也曾回忆说:“那时没有电脑,仅有一台手摇计算机,大家就拉计算尺、打算盘,那么多的数据都是靠这些工具没日没夜地算出来的。”

  那时的中国,一穷二白。尽管如此,仅靠算盘、计算尺,加上一台手摇计算机,彭士禄、黄旭华和科研人员计算了十余万组数据,成功确定了100多个参数。

  有时为了保证数据准确,常常是算盘、计算尺两组一起算,直到结果一致。最终,他们完成了潜艇核动力装置的基本设计方案。

  那把算盘,曾陪伴黄旭华度过无数个日日夜夜。

  一代艇如此,“两弹一星”研制早期也如此。在“两弹一星”精神主题展上,就曾展出过一把“两弹一星”元勋邓稼先使用过的飞鱼牌手摇计算机。

  据说,当年苏联专家撤离时,给我国科学家们留下了一个原子弹研发的关键数据,但这个数据却与我国科学家计算的结果不一致。“两弹一星”元勋邓稼先和同事们就靠着这一台台手摇计算机,花了一年多的时间算出了正确的数据,最终成功研发出我国第一颗原子弹。

  说起计算机,我国著名流体力学家、中科院院士童秉纲曾有一段难忘的回忆。

  他记得,1972年他被派去沈阳一个航空工厂的设计科,从事空气动力学方面的研究。当时,沈阳工厂引进了一台计算机,但这台计算机运行非常不稳定,经常一不小心几个小时的运算数据就全毁了。

  童秉纲只能安排在后半夜上机,出于对运算的担心,他常常后半夜不能睡觉。长期超负荷工作损耗着他的身体,以至于走起路来头重脚轻。

  后来,随着我国计算机事业的起步、发展和腾飞,科技工作者逐步用上了国产的计算机和超级计算机。从“功勋机”109丙机到100系列,从银河-I巨型机到“曙光一号”,再从“曙光1000”到“神威·太湖之光”,我国逐渐治好了“计算机焦虑症”。

  "僧多粥少"的计算焦虑

  但科技工作者们的“计算焦虑”还没有治好。

  很多人没有接触过超算,误以为使用超算和个人电脑一样,这显然不对。

  以最常见的材料计算为例,研究人员为了获得某特性的合金材料(比如要满足某航空器要求),首先需要对材料建模,然后将模型(比如使用Fortran和vasp)写成代码、程序发给超算。得到计算结果后,如果材料特性不合格,就要调整模型、改代码重新计算,如此往复,直至得到满足要求的材料模型。整个过程难免需要多次计算,而拿到成功模型却在试制样品时得不到合格材料也是常有的事儿,这样一来,还要再去重复上述步骤。

  虽然过程曲折艰辛,但如果没有超算直接制样试验,找到合格配方的合金材料没个几十年是难以成功的——超算模拟计算已极大加速了这一过程。

  材料计算还只是应用超算的一种,汽车工业、高端制造、生物信息、药物研发、气候模拟、海洋环境、能源勘探、航空航天……这些领域向前进的每一步,都离不开超算。再加上近几年大数据分析和机器学习等人工智能应用逐渐成为超级计算机的主要负载,“全球的算力需求每三个半月翻一倍”虽稍显夸张,但也反映了问题。

  需要科学计算的人数也在不断增加。2019年7月,国家统计局发布的《新中国成立70周年经济社会发展成就报告》显示,2018年,我国按折合全时工作量计算的全国研发人员总量为419万人年,是1991年的6.2倍。

  在计算机仿真和大数据计算越来越取代实验成为主流科学研究范式的今天,“僧多粥少”的超算必须以更高效的方式传递到用超算的人手中。

  自建中小型超算用起来既方便也不方便:方便在没人争抢资源,不方便在凡事都要亲力亲为——从超算的开关机及日常维护这些繁琐事项,到计算底层开发和优化这些需要高度专业的技术活儿,科学家们独力难支。

  超算云时代的到来,顺理成章。

  进入超算云服务时代

  “超算云”与“云计算”概念略有不同,它是超算拥有者或第三方组织者将超算资源以云服务的形式提供给用户,解决的是用户“无超算可用”“无好超算用”“因缺乏技术支持而超算难用”等问题。

  “并行科技”是国内最早开展超算云服务的机构之一。基于国家网格与云计算技术,并行科技结合其高性能计算研发经验,推出“并行超算云”。据并行科技董事长陈健介绍,迄今他们已综合300多个高性能计算集群,向20多个行业的5万多用户提供超算云服务。

  自然资源部第一海洋研究所一位要求匿名的研究员告诉记者,他自2013年开始接触高性能计算起,先后经历了尝试自建高性能服务器、2016年后开始采购并行超算云服务的过程,两阶段两相对比,孰优孰劣,一目了然。

  “我们课题组的海洋天气预报、厄尔尼诺现象预测等业务需求以及无固定周期的科研型任务,均通过超算云服务得到很好的满足。”该研究员说,使用超算云服务,大大降低了一次性资本开支,还解决了招标采购、运维管理、系统维护等痛点。

  企业研发也看到了超算云服务的优势。国内风电龙头金风科技在2017年成为并行科技的用户,每年的高性能计算预算超过500万元。在金风科技看来,相比自建超算,超算云服务意味着“多快好省”:资源充足且稳定,有充分的研发支持和及时高效的客户服务,在保证业务持续性的同时,具有较高性价比,可大大降低公司资本开支。

  以超算云服务提供计算资源的形式正在国内流行起来:一方面,国家超算广州中心、中科院超算中心、国家超算长沙中心、国家超算无锡中心、北京超级云计算中心等众多大型超算中心构成的海量资源池的超算“电力网”,正通过超算云将这个算力网接入千万科研工作者的电脑;另一方面,一些云计算企业如阿里云、华为云、浪潮云、腾讯云等也逐步开始推广超算云的服务形态。

  用好超算并不容易,背后需要大量的计算技术支撑——这也正是超算云服务商的生存空间,他们除了日常响应用户在用超算过程中发生的意外情况,还要主动解决共性难题。例如,并行科技在处理某团队超算应用软件“PyCDT”安装问题的同时,还把PyCDT软件的安装及优化部署到超算公共环境,以避免类似问题发生。

  “这不是某一天要做的事情,而是每一天都要做的事情。”并行科技一位技术负责人说:“科技无止境,对科技的臂助同样如此。”

  在第5个全国科技工作者日到来之际,并行科技推出第二届“530并行日”,拿出计算资源免费给科技工作者试用,让他们体验省心的科学计算服务,用这样的方式致敬科技工作者。连续两年,并行计算已经拿出价值500万元的核时数助力这一行动。

  今天,科学计算“底座”引擎作用正愈发凸显,所幸,科学家们的“计算焦虑”也正随着超算云服务的流行逐渐成为历史。

  “美好的生活是因为有科学家在奋斗”。向所有的科技工作者致意!


责任编辑:曹晖

科学家

计算焦虑

免责声明

发现网登载此文出于传递更多信息之目的,并不意味赞同其观点或证实其描述。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。违法、不良信息举报和纠错请联系本网。

  • 版权所有 发现杂志社