PBS管理系统.pdf
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
PBS 管理系统 (一)作业提交系统 Torque 个人安装总结(PBS) PBS 是功能最为齐全, 历史最悠久, 支持最广泛的本地集群调度器之一。 PBS 的目前包括 openPBS,PBS Pro 和 Torque 三个主要分支。其中 OpenPBS 是最早的 PBS 系统,目前已经没有太多后续开发,PBS pro 是 PBS 的商业版本,功能最为 丰富。Torque 是 Clustering 公司接过了 OpenPBS,并给与后续支持的一个开源 版本。 下面是本人安装 torque 的过程。 一、Torque 安装 在 master(管理结点上) 1、解压安装包 [root@master tmp]# tar zxvf torque-2.3.0.tar.gz 2、进入到解压后的文件夹 ./configure --with-default-server=master make make install 3、 (1)[root@master torque-2.3.0]#./torque.setup <user> <user>必须是个普通用户 (2)[root@master torque 【PBS管理系统】是一种广泛应用于本地集群的作业调度系统,它具有丰富的功能和悠久的历史。PBS主要包括openPBS、PBS Pro和Torque三个分支。OpenPBS作为最早的版本,已逐渐停止更新,而PBS Pro作为商业版提供了最全面的功能。Torque则是由Clustering公司接手OpenPBS并持续维护的开源版本。 【Torque安装】主要分为以下步骤: 1. **在Master节点上**: - 解压缩安装包:`tar zxvf torque-2.3.0.tar.gz` - 进入解压后的目录并配置:`./configure --with-default-server=master` - 编译和安装:`make`,`make install` - 使用`torque.setup`命令配置用户(需指定一个普通用户) - 创建并分发客户端和Mom(Manager of Operations)包到所有计算节点 - 在所有节点上安装客户端和Mom - 编辑`/var/spool/torque/server_priv/nodes`文件,添加节点信息 - 启动pbs_server, pbs_sched, pbs_mom服务,并设置开机启动 - 创建队列,如`students`队列,并设置相关参数 2. **在Node节点上**: - 安装客户端和Mom - 启动pbs_mom服务并设置开机启动 【Torque PBS使用】涉及的主要操作有: 1. **创建用户**:在Master节点上创建用户并设置权限 - `useradd test` - `passwd test`设置密码 - 更新NIS信息:`make`在`/var/yp`目录下 - 配置SSH密钥以便无密码登录 2. **配置SSH**: - 生成DSA密钥:`ssh-keygen -t dsa` - 将公钥追加到authorized_keys文件中:`cat id_dsa.pub >> authorized_keys` - 修改authorized_keys权限:`chmod 600 authorized_keys` 3. **编写作业脚本**: - 脚本中应包含PBS指令,如指定输出文件、错误文件、所需节点数量和核心数、队列等 - 示例脚本中使用了`mpirun`来运行并行任务,利用环境变量$PBS_NODEFILE获取节点列表 通过以上步骤,用户可以成功地安装和配置Torque PBS系统,并进行作业的提交和管理。在实际使用中,用户可以根据需要创建多个队列,设置不同的资源限制,以满足不同类型的计算需求。同时,通过SSH无密码登录和作业脚本的编写,用户可以方便地进行分布式计算任务的调度和执行。
剩余12页未读,继续阅读
- 粉丝: 195
- 资源: 3万+
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助