没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
内容概要:该手册详细介绍Torque系统的管理和优化方法,适用于集群管理员和技术支持人员。文章涵盖了PBS(Portable Batch System)的简介、系统架构、安装准备、系统和Muai部署流程、存储管理和账户管理等方面的内容,同时提供了详细的故障排除指南。手册旨在帮助管理员更好地理解和使用Torque调度系统来提高集群的性能和效率。 适合人群:主要面向具备Linux系统管理基础、从事高性能计算集群管理和维护工作的IT技术人员。 使用场景及目标:①用于新集群的初次部署;②现有集群的技术支持和日常运维工作;③集群性能调优及故障排查。通过学习手册内容,能够快速掌握PBS系统的配置和管理技巧,提升集群的整体管理水平。 其他说明:手册不仅提供详尽的操作步骤,还解释了许多关键概念和技术背景,便于深入理解集群调度机制。推荐结合实际环境边学习边实操。
资源推荐
资源详情
资源评论
Torque 系统管理员手册
起草人员
时间
版本
备注
Rody
2018.08.08
V1.0
2018 年 8 月
目录
一 Torque 简介.......................................................................................................................................4
二 网络架构.............................................................................................................................................4
三 环境准备.............................................................................................................................................4
3.1 操作系统部署 ...............................................................................................................................5
3.1.1 软件选择...........................................................................................................................6
3.1.2 网络设置...........................................................................................................................8
3.1.3 选择安装分区...............................................................................................................10
3.1.4 安装系统 ........................................................................................................................11
3.2 关闭防火墙 .................................................................................................................................14
3.2.1 查看防火墙状态 ..........................................................................................................14
3.2.2 关闭防火墙....................................................................................................................14
3.2.3 设置开机关闭防火墙 .................................................................................................15
3.2.4 关闭 SeLinux .................................................................................................................15
3.3 免密互访......................................................................................................................................16
3.3.1 修改 Hosts 文件...........................................................................................................16
3.3.2 管理节点生成公钥和私钥 ........................................................................................16
3.3.3 计算节点生成公钥和私钥 ........................................................................................16
3.3.4 公钥共享 ........................................................................................................................17
3.3.5 测试验证 ........................................................................................................................18
四 PBS 系统部署..................................................................................................................................18
4.1 管理节点部署.............................................................................................................................18
4.1.1 上传安装包....................................................................................................................18
4.1.2 管理节点安装...............................................................................................................18
4.1.3 配置管理节点...............................................................................................................20
4.2 计算节点部署.............................................................................................................................21
4.3 Muai 部署....................................................................................................................................23
4.4 集群状态查看.............................................................................................................................25
4.4.1 节点上线情况...............................................................................................................25
4.4.2 Torque 服务状态.........................................................................................................26
4.4.3 Muai 运行状态 .............................................................................................................26
五 存储管理 ..........................................................................................................................................27
5.1 融合统一存储使用....................................................................................................................27
5.1.1 存储集群状态检查......................................................................................................28
5.1.2 NAS 文件夹创建..........................................................................................................28
5.2 PBS 节点挂载 .............................................................................................................................28
六 账户管理 ..........................................................................................................................................29
6.1 创建账户......................................................................................................................................29
6.1.1 创建组.............................................................................................................................29
6.1.2 创建用户及家目录......................................................................................................29
6.1.3 修改用户密码...............................................................................................................29
6.2 普通账户节点互信....................................................................................................................29
6.2.1 生成公钥 ........................................................................................................................29
6.2.2 传输公钥到计算节点 .................................................................................................30
6.2.3 互信验证登录...............................................................................................................30
6.3 设置普通账户 SSH 权限 .........................................................................................................31
6.3.1 设置 SSH 访问权限.....................................................................................................31
6.3.2 验证测试 ........................................................................................................................31
七 PBS 使用操作..................................................................................................................................31
7.1 提交任务......................................................................................................................................31
7.1.1 登录普通账户...............................................................................................................31
7.1.2 PBS 状态说明................................................................................................................31
7.2 查看任务状态.............................................................................................................................32
7.2.1 普通用户 ........................................................................................................................32
7.2.2 管理员用户....................................................................................................................32
7.2.3 查看任务执行详细信息.............................................................................................32
7.3 任务状态维护.............................................................................................................................34
7.3.1 强制执行任务...............................................................................................................34
7.3.2 删除任务 ........................................................................................................................34
7.4 其他常用命令.............................................................................................................................34
7.4.1 作业控制 ........................................................................................................................34
7.4.2 作业监测 ........................................................................................................................35
7.4.3 节点状态 ........................................................................................................................35
7.4.4 PBS 作业属性 ..............................................................................................................35
7.4.5 PBS 环境变量 ..............................................................................................................36
7.4.6 取消或停止作业 ..........................................................................................................36
八 FAQ ....................................................................................................................................................37
8.1 PBS 问题 ......................................................................................................................................37
8.1.1 部署过程可能遇到的问题 ........................................................................................37
8.1.2 使用过程中可能遇到的问题....................................................................................38
8.2 Maui 问题....................................................................................................................................39
8.2.1 部署过程中可能遇到的问题....................................................................................39
九 参考....................................................................................................................................................40
一 Torque 简介
PBS 是功能最为齐全,历史最悠久,支持最广泛的本地集群调度器之一。PBS 的目前包
括 OpenPBS、PBS Pro 和 Torque 三个主要分支。其中 OpenPBS 是最早的 PBS 系统,目前
已经没有太多后续开发。PBS Pro 是 PBS 的商业版本,功能最为丰富。Torque 是 Clutering
公司接触过了 OpenPBS,并给与后续支持的一个开源版本。
本文以 Torque+Maui 为例的部署文档,以及本人在部署过程中所遇到的相关问题整理。
二 网络架构
本文是采用虚拟机环境部署,大致架构如下:
三 环境准备
虚拟机
配置参数
IP 地址
操作系统
部署软件
Server
4vCPU 8G 内存
x.x.x.x
CentOS- 7.5.1804
Torque6.1.1+Maui3.3.1
Node1
4vCPU 8G 内存
x.x.x.x
CentOS- 7.5.1804
Torque6.1.1
Node2
4vCPU 8G 内存
x.x.x.x
CentOS- 7.5.1804
Torque6.1.1
软件下载链接:
操 作 系 统 : http://mirrors.nju.edu.cn/centos/7/isos/x86_64/CentOS-7-x86_64-DVD-
1804.iso
Torque 6.1.1+Maui: 建议官网下载
3.1 操作系统部署
剩余35页未读,继续阅读
资源评论
爱豆豆的大豆
- 粉丝: 15
- 资源: 2
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功