Materials Studio Linux集群安装手册
一般都建议最小化安装,不用安装图形界面。下面我以red hat enterprise linux 6.0 x86-64在AMD Athlon(tm)64 X2 Dual Core Processor 4400+ 电脑上的
一、安装Linux操作系统,进行系统配置 一般都建议最小化安装,不用安装图形界面。下面我以red hat enterprise linux 6.0 x86-64在AMD Athlon(tm)64 X2 Dual Core Processor 4400+ 电脑上的安装为例。rhel6.0的安装过程和windows差不多,一路下一步(或Next)基本就ok了,在您要进行哪种类型的安装?你如果是第一次安装,是新硬盘的话可以选使用所有空间,并勾选下边的查看并修改分区布局,然后下一步,你可以看下大概的分区情况,在Red Hat Enterprise Linux 的默认安装是基本服务器安装。如果对Linux不太熟的话,最好选择软件开发工作站(或Software Development Workstation),这样基本上把要用的软件都安装上了,然后再选上下边的现在自定义(或 Customize now),再下一步,然后把所有能选上的软件都选上,再一路下一步。安装完以后,创建一个非root用户,比如创建一个msi用户,root和msi用户密码设的简单一些比较好,别一会儿你自己都忘了,我是root和msi用的一个密码,当然将来你自己真正组建集群用于计算的时候再设置复杂一些,这样课题提高系统的安全性。 gcc glibc-2.3.4-2.43 (32-bit and 64-bit) libgcc-3.4.6-11 (32-bit and 64-bit) libstdc++-33-3.4.6-11 (32-bit and 64-bit) compat-libstdc++-33-3.2.3-47.3 (32-bit) hpmpi-2.03.01.00-20090402r.x86_64 这几个补丁,好像除了hpmpi-2.03.01.00-20090402r.x86_64和libstdc++-33-3.4.6-11 (32-bit)没有装上之外,别的都给你装好了。这里要说的是,这些补丁每个节点都要装,千万记住。你可以用命令: rpm -qa|grep gcc查询,当然你要查libstdc++就要用命令:rpm -qa|grep libstdc++了。对于hpmpi-2.03.01.00-20090402r.x86_64和libstdc++-33-3.4.6-11 (32-bit)的安装可以用命令rpm安装,首先切换到这两个软件包所在的目录下,执行下列命令,格式如下: rpm -ivh libstdc++-33-3.4.6-11.i386.rpm rpm -ivh hpmpi-2.03.01.00-20090402r.x86_64.rpm 注意,这里都是在root用户执行的操作 二. 为msi用户添加sudo命令使用权限,运行命令 su root,输入root用户的登录密码后,使用vi命令进行下面的修改: 在root权限下,运行命令:vi /etc/sudoers #在root ALL=(ALL) ALL这一行下面添加一行msi ALL=(ALL) ALL 然后运行命令::wq! #在命令模式下,强制执行存盘退出操作 注:修改后,则成功添加msi用户使用sudo命令的权限,在往后的安装中可方便进行提权操作。 三. 于各节点安装HP-MPI,安装方法: a. 挂载MS安装光盘,对应系统版本进入下列相应目录进行安装,下面是版本信息: 1.UNIX/Linux/hpmpi/ for older IA32 Linux a 2.UNIX/Linux_x86_64/hpmpi/ for IA32 Linux systems with x86_64 a 3.UNIX/Linux_IA64/hpmpi/ for IA64 Linux.a b. 安装时需要使用root用户进行安装,终端运行su root后输入密码登录为root,使用下面安装命令: rpm -ivh /UNIX/Linux_x86_64/hpmpi/hpmpi-2.03.01.00-20090402r.x86_64.rpm c. 安装后出现下面提示即成功安装 四.查看各节点网络状态,修改主机名 可以使用ifconfig命令,查看各个节点的网络状态。rhel6.0开机后网络是处于禁用状态,要激活网络接口,可以使用命令:ifcfg eth0 start或ifup eth0。一般情况下rhel6.0在安装的过程中都可以认出主机的网卡,如果由于网卡太新没有认出来,那就需要到网卡官方网站下载Linux网卡驱动程序进行安装了,网上教程很多很容易掌握。使用hostname指令设置主机名。在命令行中输入下面的命令:hostname msinode1 注意:使用hostname指令设置的主机名称仅在系统重新启动前起效,重启系统后将使用原来的主机名称。如果希望启动系统后生效安装unix系统,则需要修改文件“/etc/hosts”。 五. 配置SSH免认证登录,配置过程: a. SSH免认证登录的配置: i. 测试是否已经安装SSH,于终端(Terminal)中输入ssh localhost后回车,若出现下面提示: 则表示已经安装SSH。若提示失败,则需要放入安装光盘进行安装。 ii. 于终端中输入ssh-keygen -t rsa,此时它会提示你生成SSH的密钥。 iii. 此时无须设置密码,你只需要点击回车就可以了,生成的公钥和私钥会保存~/.ssh/目录下。 iv. 进入目录~/.ssh/(命令:cd ~/.ssh/),运行命令: cp id_rsa.pub authorized_keys,将公钥进行复制 v. 同样地,在其他节点上运行上面的命令,将各节点中得到的authorized_key中的内容复制出来,汇总到一个文件中,命名为authorized_key,并放置于各节点的~/.ssh/目录下(覆盖原有文件)。 #可以在xp下使用WinSCP软件进行管理,就像处理word文档一样复制粘贴就行了,每个节点的authorized_key内容在汇总的authorized_key里各占一行。 vi. 修改.ssh/目录下的文件权限以及目录权限,运行命令: 1:chmod 600 * 2:chmod 700 . vii. 再修改home目录的权限为只读,运行命令: 1:cd ~ 2:chmod 755 . viii. 在各节点的对应目录重复以上命令,如成功的话,对localhost(或者其他节点机器名)进行ssh连接则不会再出现密码提示。 1:sudo vi /etc/hosts ix. 为加快SSH连接速度,使用 vi 命令(需要root权限)修改各个节点的 /etc/hosts文件,运行下列命令: 1:sudo vi /etc/hosts 显示如下: 1:# Do not remove the following line, or various programs 2:# that require network functionality will fail. 3:127.0.0.1 localhost.localdomain localhost 4:::1 localhost6.localdomain6 localhost6 5:192.168.2.160 mscnode1 6:192.168.2.161 mscnode2 x. 将127.0.0.1后对应的主机名删除,添加集群中各节点的IP地址和机器名,保存后退出即可,示例如下所示: 1:# Do not remove the following line, or various programs 2:# that require network functionality will fail. 3:#127.0.0.1 localhost.localdomain localhost 4:192.168.128.160 mscnode1 5:192.168.128.161 mscnode2 6::w #保存,如果显示无法保存可以在w后加!强制执行 7::q #退出 xi. SSH免认证登录可使用WinSCP软件进行简化。 六. 以集群模式安装MS 1. 先将MS文件上传到主节点。可以以打包的形式上传,也可以先做成ISO,我一般是习惯先做成ISO上传,以免出现权限不够的问题,遇到权限不够的时候改变文件属性,加上执行权限就可以了。 2. 上传后将ISO文件挂载到某一目录下,如果想挂到根目录下mnt目录下的iso目录中,命令示例如下: 1:mkdir /mnt/iso 2:mount -o loop -t iso9660 ms50_unix.iso /mnt/iso 3. 在主节点上切换到MS安装用户,这里用的是hope,然后到换到/mnt/iso/UNIX下执行 1:./Install --type cluster 2:或是直接./mnt/iso/UNIX/Install --type cluster --type cluster这个参数是并行时必须加的参数,另一个要注意的就是要用非root用户安装。 4. 如果执行上述命令后出现无法安装的提示,可使用下列命令进行提权: 1:chmod 777 /mnt/iso/ -R 5. 安装过程中其他基本上用默认的就可以,但有一个临时文件夹建议不要放在共享目录下,每个节点放一个tmp,这样可以减少节点间的通信量,提高性能。 比如说我的安装目录是/home/hope/Accelrys/MaterialsStudio50,Accelrys是我要共享给其他节点的目录,那tmp我就放在/home/hope/下,用MS的用户创建,保证可写入。其他每个节点的用户目录下都创建一个tmp目录。 6. 安装完成后将Accelrys目录共享给其他节点,方法如下: 1:vi /etc/exports #加入下面一行内容: 2:/home/msi/Accelrys *(rw,no_root_squash) 7. 然后重启nfs服务,service nfs restart。如出现错误提示,则参考《Linux下配置安装NFS》文章中检查portmap服务是否已经启动或者运行命令是否有root权限。 1)NFS服务所需的套件 (1)portmap 运行命令查询portmap是否安装:rpm –qa |grep portmap #显示portmap-4.0-65.2.2.1表示已正确安装 (2)nfs-utils 运行命令查询nfs-utils是否安装:rpm –qa |grep nfs-utils #显示一下内容表示已正确安装 nfs-utils-lib-1.0.8-7.2.22 nfs-utils-1.0.9-33.el5 2)启动NFS服务 NFS服务要正常运行,必须先启动portmap服务。使用以下命令就可以启动NFS服务: service portmap start service nfs start 3)停止NFS服务: service smb stop 4)重启NFS服务 service smb restart 8. 然后到其他节点上使用root用户登录,执行挂载命令: 1:mount -t nfs 主节点名或iP地址:/home/hope/Accelrys/ /home/hope/Accelrys/ 若出现错误提示,则检查该节点是否已经新建Accelrys文件夹、防火墙是否已经关闭以及SELinux功能是否已经关闭。9. 导入证书。在安装光盘中找到msi.lic文件,将licenses文件中里第一行中的机器名改为你的主节点的机器名后,文件名改为msi.lic放到/home/hope/Accelrys/LicensePack/Licenses里。在Terminal中运行: 1:./home/hope/Accelrys/LicensePack/linux/bin/lp_admin 然后在图形界面下进行证书的导入。 如果没有图形界面的话,使用下面命令可以启用命令行的 Licenses administration Tools: 1:/bin/license_admin -cw or 2: /bin/license_admin --console-wizard 3: 即MS的安装目录 10. 修改/home/hope/Accelrys/MaterialsStudio50/share/data下的machines.LINUX,写上各节点的机器名:CPU数。 11. 修改/home/hope/Accelrys/MaterialsStudio50/etc/Gateway/root_default/dsd/conf里两个文件里的CPU数为你各节点CPU总数。 12. 重新启动网关,进入/home/msi/Accelrys/MaterialsStudio50/etc/Gateway,执行 1:./msgateway_control_18888 restart 13. 由于之前安装的时候没有将Gateway注册为自动启动服务的话,可执行下面的命令: 1:cp /home/hope/Accelrys/MaterialsStudio55/etc/Gateway/msgateway_control_18888 /etc/rc.d/init.d/msgateway_control_18888 #接上一行 2:再执行命令:/sbin/chkconfig --add msgateway_control_18888 14. 至此,MS的集群安装基本完成 15. 备注: 1. 防火墙配置要注意,测试时请先关闭防火墙及SELinux Linux关闭防火墙 1)重启后永久性生效: 开启时执行命令: chkconfig iptables on 关闭时执行命令: chkconfig iptables off 2)即时生效,重启后失效: 开启时执行命令: service iptables start 关闭时执行命令:service iptables stop 关闭SELinux的方法: 修改/etc/selinux/config文件中的SELINUX="0" 为 disabled ,然后重启。如果不想重启系统,使用命令setenforce 0。 #也可以在X-windows下进行配置 2. SSH免认证配置需要仔细进行权限配置,一般出问题了都是权限的问题。 3. 上述过程中,NFS和Portmap服务没有注册为自动启动,nfs共享目录也没有进行自动挂载,当节点关机后需要重新进行挂载。同样,License服务也没有注册为系统服务,重启后可能需要重新启动License认证服务。 4. 关于Lniux的安装过程以及VMTools的安装待续。 七. 在windows下添加materials studio集群计算的Gateway 1. 打开Tools下的Server Console 2. 新建一个Server Gateway 3. 在下图中输入主节点的IP地址,再Run Diagnostics,如果显示SUCCESS,再点ok,完成windows和linux集群的连接 4.在linux下输入文件名或路径的时候可以输头几个字母,在按Tab键进行自动补齐,可以提高工作效率,“#”后的都表示注解内容 (编辑:威海站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |