近日

  “天河”E级原型机

  在图计算领域摘得两项世界第一

  这对于提升我国

  人工智能和大数据处理能力

  有着重要作用

  从国家超级计算天津中心获悉,由国防科技大学研制,部署在国家超级计算天津中心的“天河”E级计算机关键技术验证系统,在2021年7月1日最新发布的国际高性能计算Graph500排名中,获得SSSP Graph500(单源最短路径)榜单世界第一、BIG Data Green Graph500(大数据图计算能效)榜单世界第一的好成绩。

“天河”E级计算机关键技术验证系统(资料照片)“天河”E级计算机关键技术验证系统(资料照片)

  坐落在天津滨海新区的国家超级计算天津中心,是我国首个千万亿次超算“天河一号”部署所在地,同时部署有“天河”E级验证系统。

  国家超级计算天津中心主任杨灿群表示,“天河”团队以“天河一号”首夺世界第一为起点,历经十余年的不懈努力、自主创新,使“天河”超算系统在硬件和软件全自主化的同时,应用领域从传统科学工程计算向大数据处理和智能计算拓展。“天河”E级验证系统能在强调实用好用、高效节能的关键评测中排名两项世界第一,具有十分重要的意义。

  Graph500排行榜

  不同于国际超算领域另一知名排行榜Top500侧重计算性能,Graph500排行榜于2010年首次发布,是国际上评价超级计算机图计算性能的最权威榜单,主要针对当前热门的数据密集型应用(如人工智能、大数据处理等)实施评测,可充分体现超级计算机的访存和通信性能,直接反映超级计算机的数据处理能力。

  图计算是将数据按照图的方式建模开展运算,在大数据和人工智能领域应用广泛。

  根据最新榜单,天河E级原型机升级系统以每秒遍历边数2054、能效比4385.24MTEPS/W分别夺得SSSP Graph500和Green Graph500两项世界第一。

  此成果标志着“天河”超级计算机在数据密集型应用方面取得了国际领先突破,这对于提升我国人工智能和大数据处理能力有着重要支撑作用。

  天津超算中心推动高性能计算历史跨越

位于滨海新区的国家超级计算天津中心位于滨海新区的国家超级计算天津中心

  01

  “天河一号”让中国超算实现弯道超车

  超级计算机是一个国家科技水平和战略能力的重要标志。位于滨海新区的国家超级计算天津中心机房里,140个黑色计算机柜整齐排列,发出低沉的“嗡嗡”声,密密麻麻的指示灯不间断闪烁,这就是我国自主研制的千万亿次超级计算机“天河一号”,也是在国际TOP500最快超级计算机榜单中运行时间最长的超级计算机。其每秒4700万亿次的峰值计算能力,运算1小时相当于全国13亿人同时计算340年以上,为我国科学研究、信息服务、装备制造等领域发展提供强大支撑,产生了重要的应用效益。

  上世纪70年代,高性能计算成为推动科技创新和经济社会发展的战略高技术。然而,由于没有自己的巨型计算机,中国常常受制于人。1978年,我国启动巨型计算机研制工程。1983年,“银河-Ⅰ”巨型计算机研制成功,这使中国成为世界上少数几个能研制亿次巨型机的国家。

  进入新世纪后,我国各项事业进入高速发展时期,对高性能计算机的运算速度和容量都有了更迫切的需求。2008年,国防科技大学和天津正式启动“国家超级计算天津中心”建设,联合承担“千万亿次高效能计算系统”的研制。

  经过长达半年的封闭攻关,历经8万多次软件程序改进优化,最终科研人员采用混合语言编程等技术,实现了计算核心异构协同,一举将GPU的计算效率提高到70%以上,达到世界最高水平。

  2009年,博士毕业的孟祥飞作为技术骨干,加入了刚成立的天津超算中心。2009年10月,新中国六十华诞,我国首台千万亿次超级计算机宣告诞生,命名为“天河”。我国自主研制超级计算机实现了从百万亿次到千万亿次的跨越,成为继美国之后世界上第二个能够研制千万亿次超级计算机系统的国家。

  2010年初夏,“天河一号”超级计算机开始在滨海新区安装部署。在科研人员的争分夺秒下,“天河一号”比原计划提前近一年时间成功入驻天津超算中心。与此同时,“天河一号”也在大洋彼岸掀起了波澜。

  2010年11月16日,在美国路易斯安那州新奥尔良市举办的世界超级计算大会上,“天河一号”以计算峰值4700万亿次,高出第二名1倍多的绝对优势,勇夺国际T0P500排名第一。中国超算实现了弯道超车!

  从“银河”的历史性突破,到“天河”等一系列超级计算机不断刷新世界速度,中国超级计算机的跨越只用了短短40年。今天,在国际TOP500名单里,中国超级计算机部署量位居世界第一。

  如今,“天河一号”已经服役超过10年,每天运行计算任务超过1400个,1000多个科研团队借助“天河一号”开展科研工作,构建形成了石油勘探、生物医药、动漫与影视特效渲染、高端装备制造、地理信息等五大高性能计算应用平台。

  02

  天河E级原型机引领智能科技

天河E级原型机开放应用以来,中科院、北京临近空间飞行器系统工程研究所等数十家合作单位完成了大规模并行应用测试。天河E级原型机开放应用以来,中科院、北京临近空间飞行器系统工程研究所等数十家合作单位完成了大规模并行应用测试。

  当前,我国已经启动百亿亿次超级计算机系统研制工作,全面进入E级超级计算时代。在国防科技大学和天津超算中心等团队合作下,天河E级原型机历经两年多的持续研发和关键技术攻关,于2018年7月研制成功。

  孟祥飞表示,天河E级原型机系统实现了四大自主创新,即3款芯片──“迈创”众核处理器、互连接口芯片、路由器芯片;4类计算、存储和服务节点,10余种PCB电路板;新型的计算处理、高速互连、并行存储、服务处理、监控诊断、基础架构等硬件分系统;系统操作、并行开发、应用支撑和综合管理等软件分系统。

  天河E级原型机系统研制成功后,天津超算中心随即启动了大规模的计算应用测试,涉及国家12个重大创新专项领域、数十个国家重点研发计划。验证结果显示,天河E级原型机的运算能力超强,仅6个机柜就达到“天河一号”120个机柜相当的计算能力。

  如今,大到国产大飞机C919的气动外形制造,小到一个个原子如何结合成新药,超级计算机技术正深入到国家发展的各个层面。

  2020年,当新冠肺炎疫情肆虐全球之时,通过超级计算机的演算,人类发现了新冠肺炎会导致人体停止分解一种叫做缓激肽的化学物质,从而导致患者肺部充满液体并引发炎症,使患者呼吸困难。超算大数据技术在疫情联防联控精准施策过程中的应用也已见成效。

  依托“天河人工智能创新一体化平台”,天津超算中心与国内多家医院,以及中国抗癌协会肿瘤人工智能专业委员会、中国人工智能学会智慧医疗专业委员会等多方合作,经过持续研发攻关和试用测试,构建了全球首个新冠肺炎CT影像人工智能辅助诊断平台,作为临床辅助诊断手段,有效提高新冠肺炎筛查能力。自上线以来,该平台访问量已超过100万次,为美国、墨西哥、印度等多个国家和地区的医疗机构、科研机构提供技术支持,引领智能科技参与全球抗疫。

  无论过去还是现在,无论苦难还是辉煌。面对未来人类发展的诸多难题,超算的故事没有休止符,只有再攀高峰的新起点。