Loading...
 

基于国家高性能计算环境的HPC教育实践平台

--- “超算习堂”

平台简介:


超级计算机的研发和应用水平是国家科技发展水平和综合竞争力的重要标志,更是本世纪计算机领域技术革新的制高点。我国超级计算机技术发展迅速,但是我国超算应用水平与国外差距较大,超算人才短缺,难以支撑迅猛增长的应用需求。同时,当代超算系统规模庞大、结构复杂、资源异构、应用领域需求多样,进一步加大了超算人才培养的难度。为此,迫切需要基于国家高性能环境构建教育实践平台,提升在校大学生、研究生以及各行业人士的并行计算思维和超算应用研发能力。

    超算习堂(EasyHPC.net)是目前国内规模最大的超算教育实践平台,该平台基于国家高性能计算环境,面向全国广大高校本科生与研究生提供高性能计算优质教育内容(界面见图1)。超算习堂由中山大学、清华大学、北京大学、中国科技大学、湖南大学、西北工业大学、西北大学、中科院网络中心、浪潮公司、并行科技公司、元计算公司等多所国内一流高校和科研机构、企业单位共同合作研发,获得了国家重点研发计划“高性能计算”重点专项支持。国家超算广州中心、国家超算长沙中心、中科院超算中心、上海超算中心等多家超算中心为平台提供机时资源与技术支持。

 

图1:超算习堂主要界面

亮点和特色:


    超算习堂的主要亮点和特色体现在以下三个方面:

1. 个性化递进式的高性能计算学习路径

针对传统高性能计算重理论轻实践的教育模式,超算习堂创新实现了以学习者为中心,个性化递进式实践教学模式(见图2)。通过制定由浅入深的学习路径,集成多层次的资源环境和教育内容,充分引导学习者利用软硬件资源,短期内轻松入门高性能计算,进而进阶挑战,实现实践层次的全覆盖。特别是为了适应高性能计算的多学科交叉性,构建面向不同体系结构以及特定领域编程模型和语言的实践环境,利用了面向学科的可视化分析技术,按需定制不同应用领域的在线教学实验室,达到了实践实验效果,使学习者能够在真实环境中培养自主学习能力以及创新创造精神,满足了超算多层次人才培养需求。

 

图2: 递进式的高性能计算学习路径

2. 大规模并行程序反馈式调测试与分析

高性能计算应用的调测试技术和应用特征分析对于教育用户提升实践水平有着至关重要的作用,考虑到传统调测试工具使用门槛高等问题,超算习堂实现了基于反馈式的并行程序调测试与分析技术(见图3),最大可支持2400核规模并行程序的反馈式调测试,通过程序检查器、应用特征收集器和应用特征分析器,实时监控和分析机群管理/登录节点、计算节点、I/O节点等服务器的处理器、内存、网络和存储性能数据,及时将机群系统中应用软件随时间变化的运行特征反馈给用户,实现机群应用运行过程准确、高效重构,帮助用户发现应用程序运行时的故障和性能瓶颈,增强平台在并行程序调测试方面的交互性。

 

图3:并行程序的反馈式调测试和分析

3. 高效容器化的HPC实践环境快速定制和部署

针对教育用户对资源环境需求的多样性、多层次等特点,实现对容器资源集群的按需动态搭建,支撑用户自适应地构建系统运行软件栈,同时并能面向学生用户快速生成资源容器,并支持高效的批量复制和发布(见图4)。支持资源的按需动态调度和配置,有效调度I/O资源、计算资源、加速器资源、网络资源、数据与软件库资源和应用软件,以实现资源需求与实践环境的最佳匹配。通过资源的动态构建和调度技术,很好地满足了超算教育实践平台的多样性资源环境需求。

 

图4:高效容器化的教育实践平台体系结构

 

平台应用成效:


超算习堂平台自上线以来访问量超过28万人次,服务学生用户数超过7000人,分布于全国29个省份和自治区的100余所单位(见图5),支持了十余所大学30余门高性能计算课程的实践教学,为选课同学完成近8000次并行程序评测,提供机时超过2000万核时/年。同时,超算习堂积极支持在校大学生和研究生参加了RDMA17、CPC17、 PAC17-优化、PAC17-应用、SC17、ASC18、ASC19等一系列国内和国际超算竞赛,在竞赛培训过程中使用超算习堂所提供的课程教学资源,一方面将训练中获得的教学经验注入课程内容的设计之中,另一方面实测课程资源的完整性和实用性。超算习堂平台在高性能人才培养方面取得突出成效,获得广泛关注,被《计算机教育》、《中国计算机学会通讯》、《信息工程与技术》、搜狐、新浪、科学网等多家杂志和媒体报导(见图6)。 

 

图5:超算习堂用户访问量增长情况和用户分布

 

图6:超算习堂相关媒体报道和超算比赛获奖