“最强大脑”藏在你身边
拥有强劲计算能力的超级计算机(简称:超算)被称为“神算子”、“最强大脑”,它是国家科技发展水平和综合国力的重要标志,是世界各国争夺的一个战略制高点。随着我国超算领域的发展与成熟,全国已成立了六大超算中心,这颗“最强大脑”亦不再神秘,与普罗大众的生活越来越密切——精准天气预报、基因测序、寻找暗物质、研究引力波,甚至在动画电影特效制作、汽车设计等行业都能见到它的身影。
位于广州大学城中山大学东校区的国家超级计算广州中心,“天河二号”超级计算机就“藏身”于此。作为我国超算领域标志性系统之一,“天河二号”诞生之初,其运算速度就打破了世界纪录,至今仍在全球超算两大权威榜单中长期占据前两位。落户广州4年多时间,“天河二号”去年正式完成升级,采用国产自主研发的加速器代替了原有国外的加速器。“天河二号”更是当前国内唯一支持业务运营的超算系统。
尽管当前在超算全球竞赛中我国处于领先地位,但是美国、日本和欧洲等是超算传统强国,拥有雄厚的软硬件实力。因此,我国超级计算机在完成自主化进程同时,亦加快了下一代E级系统的研制步伐。专家预期,在2020年将是全球超算竞争的窗口期,我国与美国、日本等将争夺E级系统研制的主导地位。
初见“最强大脑”
每12分钟一次预报广州未来2~6小时天气
进入位于广州大学城中山大学东校区的超级计算机广州中心二楼的主机房,一共9排计算系统正在“呼呼呼呼……”地高速运转中,每排计算系统的机身高度近两米、漆黑的面板上有无数束蓝色灯光在跳动着,在主机的面板上的浮雕——“天河二号”赫然映入眼帘,让人宛如置身于科幻电影中的场景。“超算并不神秘,它与广大市民生活息息相关,比如广州天气的精准预报,背后就是‘天河二号’”,国家超级计算机广州中心总工程师杜云飞打开了“话匣子”。
如今,不少市民都习惯每天接收一条来自广州市气象台发布的天气短信,在强对流天气多发的季节,更会接收到暴雨黄色预警、暴雨橙色预警等即时信息。相信很多广州市民都有类似的感受:“现在天气预报越来越精准,有时下班前收到‘未来1小时将会降雨’的信息,下班时就会带上雨具。”杜云飞表示,“自从‘天河二号’落户广州后,就开始与广州热带所、广州气象局进行合作优化业务。”从去年开始,广州市气象局利用“天河二号”发展区域精细数值天气预报模式,从过去“3公里”分辨率提升到“1公里”,在天气预报中,分辨率的提升对精准度有着重要的影响。如今广州地区的“1公里”模式,就是能每12分钟滚动预报未来6小时天气,实现“分钟级”快速更新。正是由于这颗“最强大脑”的支持,广州市精细化预报水平已达到国内领先。去年6月,台风“苗柏”来袭,通过“1公里”模式,在下午1点就准确预报了半夜登陆的苗柏台风登陆点、移动路径及台风登陆前后的降雨,为防灾防汛做好充分准备。杜云飞表示,“天河二号”是国内唯一支持业务化运营的超算。
“天河二号”的“成绩单”远远不止于此,除了精准天气预报外,还支持广州地铁的运营;帮助科学家们寻找暗物质、研究引力波;为广州东塔、西塔做防震计算;4小时完成人类基因组测序原本需要8个月的工作量……随着技术的推进,这台超级计算机除了完成传统的高性能计算,还包括云计算、数据处理、深度学习等运作。
科研与多领域应用
考验“超算”能力,未来与人工智能结合
超级计算机是指由数千甚至更多处理器组成、能计算普通计算机和服务器不能完成的大型复杂课题的计算机。“天河二号”一共有32000颗主CPU和48000个协处理器,其系统理论峰值为54.9PFlops(5.49亿亿次浮点运算每秒),持续计算速度3.39亿亿次/秒。“天河二号”整个系统,包括计算和通讯都集中在广州中心的主机房,9排计算系统,共16000个计算节点。当中上万个节点利用光纤连接,因此这个“最强大脑”中就拥有50000多根光纤。
在美国、日本、欧洲等国家和地区,“超算”主要用于解决科学工程计算,对国家研究课题组开放。我国的超级计算机则有些不同,它还是一个公共应用的平台,不仅被用来解决科学科研问题,还应用在政务、大众生活以及多个行业领域。目前,“天河二号”已经部署了700多个应用软件和工具软件,用户总数已突破2000家,是全世界用户数量最多、利用率最高的超级计算系统之一,其中80%的用户是来自高校和科研院校,另外20%是企业。飞机设计、汽车设计、高铁设计、传播设计等,越来越多的行业都借助“天河二号”来完成设计过程。
近年,我国动漫与电影产业高速发展,在动画渲染、电影特效制作方式,要达到国际级水准,就必须依赖拥有强大运算能力的计算机。超算除了能提供复杂、高分辨率真实感的渲染任务,最重要的是可缩短制作周期,从而大幅减少渲染成本。让人意想不到的是,目前“天河二号”已参与过百部动画的渲染与特效制作,其中包括大家所熟知的《熊出没》。此外,广州本地一家3D家装设计也在“天河二号”上完成其渲染、设计等项目。
正因为支持业务化运营,对超算系统有着更高的可靠性、系统保障要求。团队如何保障整套系统有序、安全地运行?记者在广州中心看到,团队工作人员正通过系统对机房的水、电、消防、空调等密切监控。众多周知,计算机属于电子产品,其最大的“天敌”就是水,在广州雨季时,外部环境湿度较高,基础设施团队必须对机房的湿度进行控制,“运维团队是7×24小时,第一时间发现任何问题都能处理”。同时,广州中心亦有专门团队负责“天河二号”的网络安全,使用硬件+软件的方法来保障整个系统的安全运行。
“天河二号”从2014年初正式对外运营至今已有4年,目前平均使用率超过70%。因此研发团队在广州中心架设了新的机房,在即将投入使用的新设备中会加入更多大数据处理与人工智能。
“与人工智能的结合,是未来超算的发展方向。”杜云飞如此说道。随着信息化时代的演进,计算能力在人类生活中占据越来越重要作用,过去超级计算机主要关注科学工程应用,随着技术发展,它与人工智能和数据处理的结合日益密切。在未来E级系统中,高级计算与人工智能的融合将是必然。比如美国最近发布的E级计划,其重要的方向就是人工智能,系统预计在2021年建成。随着人工智能的加入,超级计算机在芯片设计和结构设计上亦会有所改变。
想象一下:未来的城市中,就有一个超级计算机支撑无人驾驶整个信息系统的运用,这些信息运用的背后就是依托超级计算机进行复杂的计算和处理。还有城市安防,通过超级计算机对摄像头的实时处理, 任何人或车辆出现的轨迹都能轻松地找出。
“超算”硬件:已采用国产加速器
未来全球“超算”可达每秒百亿亿次
追溯我国超级计算机历史:1983年,我国成功研制出第一台超级计算机银河一号,使我国成为继美国、日本之后第三个能独立设计和研制超级计算机的国家。超级计算机肩负着解决国家经济建设、社会发展、国防建设等领域重大挑战性问题的重要任务,因此它是世界各国争夺的一个战略制高点。
截至2017年,我国共建六个国家超级计算中心,分别为天津中心、长沙中心、济南中心、广州中心、深圳中心、无锡中心。其中,“天河二号”落户在广州超算中心。
作为我国超级计算机研发标志性的系统之一,2013年研制成功的“天河二号”,当时就以5.46亿亿次/秒运算速度刷新了超算领域的世界纪录。它的纪录直到2016年6月,才被我国的“神威·太湖之光”打破。目前,我国的“神威·太湖之光”的运算速度已达到每秒12.55亿亿次,是世界上最快的超级计算机。根据2017年11月发布的最新全球超级计算机500强榜单中,我国的“神威·太湖之光”和“天河二号”位居全球第一与第二位。
完全国产化是我国每一位超级计算机科研人员的信念。杜云飞信心满满地告诉记者,去年团队正式完成“天河二号”的升级。虽然主芯片仍是采用英特尔,但是加速器已是我国自主研发的,代替了过去的国外品牌加速器,部分节点也是使用国产芯片作为主CPU。未来,我国超级计算机一定会走国产自主芯片的道路,并且形成符合国产芯片技术的软件生态。
目前,在业界专家看来,超级计算机的竞争窗口期将在2020年。根据我国超级计算机的发展规划,已将E级系统列入十三五规划,预计到2020年,将推出E级系统,其运算能力将达到百亿亿次。尽管我国的“神威·太湖之光”与“天河二号”依然位居全球前两位,但是美国与日本有赶超的趋势,美国今年夏天将在橡树岭和劳伦斯两大国家实验室分别建设200P和130P的超算,位于阿贡国家实验室的美国E级“超算”,计划2021年建成。