孟令霞 吳瓊
[摘 要] 在介紹了目前集群系統(tǒng)應(yīng)用情況及xCAT軟件的基礎(chǔ)上,提出了一種利用xCAT軟件進(jìn)行系統(tǒng)部署與安裝配置的方法,分別描述了系統(tǒng)部署和軟件配置的具體過(guò)程,介紹了應(yīng)用方法。
[關(guān)鍵詞] xCAT;集群系統(tǒng);系統(tǒng)部署;軟件配置
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2018. 11. 058
[中圖分類號(hào)] TP311 [文獻(xiàn)標(biāo)識(shí)碼] A [文章編號(hào)] 1673 - 0194(2018)11- 0133- 03
1 應(yīng)用背景
集群系統(tǒng)憑借其超強(qiáng)計(jì)算能力、高性價(jià)比使得其應(yīng)用越來(lái)越廣泛,對(duì)于集群管理的研究也成為越來(lái)越熱門的一個(gè)方向[1-2]。其中,在集群系統(tǒng)中集中定制部署操作系統(tǒng)及應(yīng)用軟件更是提高集群系統(tǒng)利用效率,節(jié)省運(yùn)行成本的重要方向[3-4]。本文通過(guò)研究xCAT軟件,實(shí)現(xiàn)集群中操作系統(tǒng)和應(yīng)用軟件系統(tǒng)個(gè)性化定制,使其可以快速在不同的應(yīng)用中切換。
2 xCAT軟件介紹
2.1 xCAT 簡(jiǎn)介
xCAT (Extreme Cluster Administration Toolkit)是一個(gè)可伸縮的linux集群管理和配置工具,xCAT 最先是為IBM xSeries 系列的Linux Cluster做的第三方軟件,但后來(lái)它沒(méi)有發(fā)展成為一個(gè)產(chǎn)品,而是做成了包含一系列有用的腳本的軟件包。使用者可以自己修改,但是不能重新發(fā)布。
2.2 xCAT功能及特性
全自動(dòng)化的安裝;基于網(wǎng)絡(luò)的,無(wú)人看管的安裝;遠(yuǎn)程管理和監(jiān)視;遠(yuǎn)程電源管理和遠(yuǎn)程控制系統(tǒng);軟件管理;并行管理工具和高性能軟件。
xCAT 的特性:硬件管理和監(jiān)控;支持IBM eServer xSerie 系列服務(wù)器遠(yuǎn)程電源控制的高級(jí)系統(tǒng)管理特性;支持遠(yuǎn)程系統(tǒng)狀態(tài)檢測(cè)分析(風(fēng)扇速度,溫度,電壓等);遠(yuǎn)程詳細(xì)檢測(cè)系統(tǒng)狀態(tài)設(shè)備型號(hào)和BIOS 等;硬件事件日志記錄;SNMP 認(rèn)證警報(bào);軟件管理;以及并行的shell 和其他工具同時(shí)的運(yùn)行在xCAT 管理范圍內(nèi)的節(jié)點(diǎn)等。
3 定制部署
3.1 定制操作系統(tǒng)
定制操作系統(tǒng)的第一步是將操作系統(tǒng)導(dǎo)入到xCAT軟件管理中,本文以Red Hat Enterprise Linux Server 6.5版本為例進(jìn)行說(shuō)明。導(dǎo)入操作如下:
copycds -n rhels6u5 /tmp/rhel-server-6.5-x86_64-dvd.iso
導(dǎo)入完成后,利用xCAT軟件提供的命令得到如下導(dǎo)入結(jié)果:
[root@ibmgt ~]# lsdef -t osimage | grep rhels6u5
rhels6u5-x86_64-install-compute (osimage)
rhels6u5-x86_64-install-service (osimage)
rhels6u5-x86_64-netboot-compute (osimage)
利用xCAT軟件提供的命令對(duì)導(dǎo)入結(jié)果進(jìn)行查詢,結(jié)果如下:
[root@ibmgt ~]# lsdef -t osimage -z rhels6u5-x86_64-install-compute
#
rhels6u5-x86_64-install-compute:
objtype=osimage
imagetype=linux
osarch=x86_64
osdistroname=rhels6u5-x86_64
osname=Linux
osvers=rhels6u5
otherpkgdir=/install/post/otherpkgs/rhels6u5/x86_64
pkgdir=/install/rhels6u5/x86_64
pkglist=/opt/xcat/share/xcat/install/rh/compute.rhels6u5.pkglist
profile=compute
provmethod=install
synclists=/install/custom/install/rh/compute.rhels6u5.x86_64.synclist
template=/opt/xcat/share/xcat/install/rh/compute.rhels6u5.tmpl
通過(guò)上面對(duì)導(dǎo)入結(jié)果的查詢可以看到若干配置文件,其中compute.rhels6u5.tmpl可以對(duì)操作系統(tǒng)的分區(qū)及分區(qū)的大小進(jìn)行定制配置,compute.rhels6u5.pkglist對(duì)操作系統(tǒng)安裝過(guò)程中,安裝哪些文件包進(jìn)行定制配置。通過(guò)對(duì)這兩個(gè)文件就可以實(shí)現(xiàn)對(duì)操作系統(tǒng)的定制安裝與部署。
3.2 定制軟件系統(tǒng)
在上面介紹的compute.rhels6u5.tmpl配置文件結(jié)尾有一行腳本調(diào)用post.rh配置文件,通過(guò)對(duì)post.rh文件的修改可以實(shí)現(xiàn)對(duì)操作系統(tǒng)上各種文件的配置,包括創(chuàng)建新的目錄和文件,修改文件權(quán)限,修改系統(tǒng)文件,打開(kāi)關(guān)閉系統(tǒng)服務(wù),在操作系統(tǒng)上批量安裝軟件系統(tǒng)等。配置文件內(nèi)容如下:
#INCLUDE:#ENV:XCATROOT#/share/xcat/install/scripts/post.rh.common#
#INCLUDE:#ENV:XCATROOT#/share/xcat/install/scripts/post.xcat#
cd /
mkdir /soft /u /proj
chmod 777 /scr01
ln -s /soft/geovation /cgg
echo "gctadmin:/proj /proj nfs exec,rw,bg,nointr,noatime,async,nfsvers=3,suid,dev 0 0" >> /etc/fstab
mount /proj
cd /opt
tar zxvfp /soft/install/intel.tar.gz
echo NISDOMAIN=gctnis >> /etc/sysconfig/network
echo "ypserver gctadmin" >> /etc/yp.conf
rpm -ivh /tmp/paramon-pro-6.2.0-2046.el6.x86_64.rpm
cp /etc/rc.local /etc/rc.d/
cd /soft/install/RHEL65
./readme
chkconfig ypbind on
chkconfig iptables off
exit 0
從上述配置文件的描述中可以看到,其創(chuàng)建了若干目錄和鏈接并進(jìn)行了掛載目錄的操作,修改了某些系統(tǒng)文件,啟動(dòng)了某些服務(wù),在操作系統(tǒng)中安裝了應(yīng)用軟件等。這些工作都在完成操作系統(tǒng)安裝后自動(dòng)進(jìn)行,無(wú)須人工干預(yù),在系統(tǒng)完成安裝的同時(shí)也完成了系統(tǒng)上應(yīng)用軟件的配置。
3.3 應(yīng)用方法
在確定安裝節(jié)點(diǎn)后,首先設(shè)置安裝節(jié)點(diǎn)的操作系統(tǒng)類型,其次修改節(jié)點(diǎn)啟動(dòng)順序,最后重新啟動(dòng)節(jié)點(diǎn)即可。操作步驟如下:
[root@ibmgt ~]# nodeset node254 osimage=rhels6u5-x86_64-install-compute
node254: install rhels6u5-x86_64-compute
[root@ibmgt ~]# rbootseq node254 net
node254: net,none,none,none
[root@ibmgt ~]# rpower node254 reset
node254: reset
在節(jié)點(diǎn)安裝完成操作系統(tǒng)安裝后會(huì)自動(dòng)調(diào)用上文提到的配置文件,對(duì)節(jié)點(diǎn)進(jìn)行操作系統(tǒng)和軟件部署和配置。
4 結(jié) 論
目前,該方法在生產(chǎn)實(shí)踐當(dāng)中已經(jīng)開(kāi)始使用,在應(yīng)用了xCAT軟件定制部署操作系統(tǒng)及應(yīng)用軟件后,提高了集群系統(tǒng)的利用效率,保證了集群系統(tǒng)的高效、穩(wěn)定運(yùn)行。
主要參考文獻(xiàn)
[1]Sandip Agarwala,Christian Poellabauer,Jiantao Kong. System-Level Resource Monitoring in High-Performance Computing Environments[J]. Journal of Grid Computing,2003(2):273-289.
[2]Rajermani Thinakaran,Elankovan Sundararajan. Cluster Control Management as Cluster Middleware[C]//Asian Conference on Intelligent Intormation and Database Systems,2012:73-82.
[3]吳瓊,王穎,梁金鈐,等.Linux環(huán)境下基于Qt和xCAT的集群部署系統(tǒng)[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2013,22(7) :27-30.
[4]王海斌.動(dòng)態(tài)虛擬集群部署與管理[D].長(zhǎng)春:吉林大學(xué),2011.