中国设备工程论文文库

中国设备工程论文文库

千万亿次高性能计算集群建设运维与共享实践探究

千万亿次高性能计算集群建设运维与共享实践探究

时间:2023-09-07 作者:褚宏奎,贾东宁,桂琳,彭轶旋,孙文杰,吕梦嘉,魏志强
【摘要】算力作为一个国家科技水平和创新能力的重要标志,在一定程度上体现了一个国家的综合科研实力。然而,随着算力的提升,超算集群的建设投入成本成比例提高,且运行维护成本也会随着运行年限的增加而逐年提升。因此,合理布局集群建设、精细管理日常运维、科学规划共享服务,对充分发挥超算集群在高科技领域支撑服务作用尤其重要。以青岛海洋科学与技术试点国家实验室运行的千万亿次大规模超算集群为案例,总结了从启动建设到运行服务的实践经验,可为各科研院所及企事业单位相关平台的建设运行提供参考。
关键词:高性能计算;集群建设;系统运维管理;共享服务
阅读全文,请下载
 
登录×
 
 
注册×