COMS集群优化管理系统>>

       集群优化管理系统COMS(Cluster Optimization & Management System) 整合了分散于操作系统、集群系统管理、作业调度管理、状态监控等软件中的各个相关管理功能,实现了对集群多个层次的统一管理,将集群所有节点从异构的、松散的状态整合成一个紧密的具有单一映像的“虚拟超级计算机”,实现对集群系统资源有效的管理维护。

COMS软件体系结构

除了具备主流集群管理软件的功能以外,COMS 还具有以下特点:

       ♦   支持多操作系统

       目前能够支持 Windows Server、Redhat Linux、CentOS Linux 以及 SUSE Linux 的各种不同版本。此外,还支持在一套物理集群系统上同时部署多种操作系统,并且能够实现在各种不同操作系统间的一键式切换。

       ♦   实现了对并行应用程序代码透明的 Checkpoint/Restart 机制

       这种机制不仅能够支持串行程序,而且还能支持 MPI 并行程序,实现了对进程状态的保存与恢复。用户无需重编译操作系统内核,也不需要修改任何程序代码,具有良好的透明性。

       ♦   实现了与硬件无关的远程开关机的机制

      这种机制对用户的计算节点在硬件配置方面没有任何特殊要求,管理员通过一个按钮或者命令就可以关闭或者启动整个集群系统,而无须亲自到机房中依次按下每个服务器的电源开关 。

       ♦   实现了可视化的资源预留功能

      管理员可以通过可视化的操作,为用户在某一特定的时间段内或者周期性的时间段内保留特定的计算资源,满足重要用户特定时期对系统资源的使用需求。

       ♦   具备完善的专业应用管理

      通过发布开发和接口规范,对不同用户开发的各种专业应用进行封装,然后在集群优化管理系统中进行注册和审批,可以实现对不同专业应用的的统一管理。

       用户可以在工作站上通过浏览器访问管理节点,或通过访问服务器以命令行或应用程序集成方式访问管理节点,完成各项管理工作。集群计算节点在系统管理、作业调度的控制之下,完成用户提交的高性能计算任务。统计分析服务器不断地从集群系统中各个计算节点收集系统实时状态信息、资源使用信息、 作业信息和记账信息,将这些信息加工处理后存入数据库,并接受用户的查询访问请求。

COMS物理拓扑图

典型用户界面

                                集群状态监控                                     集群资源管理                                  集群系统管理

                                 集群数据管理                                    集群计费管理                                  集群作业管理

                                                    

                                                               集群应用管理                                      集群专业应用

COMS主要适用服务对象:

       全国各理工科高校中需要使用高性能计算的院系,有高性能计算需求的科研院所,有需要使用高性能计算的大型企事业单位,有渲染业务需求的大型文化企业等。