COMS 集群优化管理系统

概述

COMS集群优化管理系统主要面向于高性能集群计算领域及渲染集群领域,系统从集群业务的实际需求出发,在结构上充分考虑了灵活性、扩展性、稳定性和开放性;功能上实现了对集群多个层次的全面管理,包括

  • 整合了分散于操作系统、系统管理、作业管理、状态监控等软件中的各个管理功能,实现了对集群多个层次的统一管理。
  • 将集群所有节点从异构的、松散的状态整合成一个紧密的具有单一映像的“虚拟超级计算机”,实现对集群系统资源有效的管理和维护。
  • 为用户和管理员提供一个友好的Web界面,降低了集群系统的使用及管理难度。

优势与特性

COMS集群优化管理系统从功能上可以分解为多个子系统,包括:  

  • 集群状态监控:

u  查看集群系统当前各项性能指标的总体状态,包括:CPU、内存的利用率,集群负载,网络流量,以及各个主机状态等多项内容;

u  查看集群系统中各个节点的物理布局以及每个节点的基本硬件配置信息等;

u  查看集群系统中各个节点的动态系统状态信息,包括:主机的CPU、内存的利用率,主机负载,网络流量,以及磁盘使用情况等主机系统状态详细信息;

u  用户可以实时查看集群系统中每个节点上主要进程的运行状态信息,包括进程编号、进程所属用户、启动进程的命令、CPU和内存的使用情况等

  • 集群系统管理

u  支持基于PXE方式实现大规模计算节点的自动化部署;

u  支持基于策略的系统分发管理机制,可实现同一个集群内不同软件配置节点的自动部署;

u  实现了集中的用户管理,管理员可以很方便地增加、修改和删除整个集群系统的用户帐号,无需对所有节点逐个操作;

u  实现了基于角色的权限控制,管理员能够根据需要定义拥有不同权限的角色,并将角色分配给不同的用户或用户组

  • 集群资源管理

u  功能强大的资源管理和作业调度功能,支持复杂调度策略配置,并可以根据用户实际需求提供个性化配置;

u  支持各种串行和并行应用程序,支持任务间相关、自动文件传送、多个任务队列、多种系统分组、多种任务优先级策略、多资源管理,并提供详尽的系统诊断功能;

u  灵活而强大的资源预约服务,允许管理员以可视化的方式在某一特定的时间段内或者周期性的时间段内保留特定的系统资源,满足重要客户特定时期对系统资源的使用需求

  • 集群作业管理

u  管理员可以针对用户的作业进行全面管理,包括删除作业、运行作业、重新运行作业、阻塞作业和释放作业等操作;

u  用户可以针对个人作业进行全面管理,包括提交作业、删除作业、阻塞作业和释放作业等操作;

u  支持多种用户作业递交方式,用户可以通过指定一个作业脚本文件或者通过指定作业参数信息由系统自动生成作业脚本来提交作业;

u  用户可以查看作业占用集群计算资源的详细情况

  • 集群应用管理

u  集群应用管理提供一个开放的应用管理和消费平台,通过提供一组开放的接口规范,能够不断地集成各种新的应用;

u  用户可以根据规范对应用进行封装,然后把经过封装的应用注册到应用管理平台,经管理员审核后可以对外发布为一个服务。用户可以根据需要订购服务,经过管理员审批后可以在有效期内访问应用进行计算;

u  针对具体的专业应用,能够对客户的消费和使用信息进行统计,为应用的管理和消费计费提供科学依据

  • 集群计费管理

u  完善的资源使用统计和分析,通过对不同用户、用户组以及不同作业所用系统资源的情况进行统计分析,帮助管理员总体把握集群资源使用的分布情况;

u  提供完整的记账报表功能,实现对集群系统的资源使用情况进行统计,以及基于历史数据对用户资源使用情况进行分析等。其中,资源使用统计支持对集群系统的资源使用情况进行统计,作业统计支持基于历史数据对用户资源使用情况进行分析,支持基于用户/用户组、作业的记账报表功能和资源统计;支持报表生成,如日报、周报、月报等

  • 集群数据管理

u  支持NFS、PVFS2、Lustre等多种不同的网络文件系统;

u  提供FTP、HTTP、Samba等多种不同的数据访问接口;

u  提供基于Web的资源管理器,方便用户对集群系统中的文件资源进行管理,包括新建、删除一个目录;上传、下载、删除一个文件;压缩多个文件、目录或解压缩文件。

规格参数

COMS集群优化管理系统主要适用客户对象:全国各高校需要使用高性能计算的院系,全国使用高性能计算各科研院所,全国需要使用高性能运算的企业单位等。