廖若飛
摘要:基于云計(jì)算技術(shù)搭建人工智能專業(yè)群實(shí)訓(xùn)平臺(tái),在高職院校有迫切需求。文章分析了人工智能專業(yè)在高職院校的開設(shè)現(xiàn)狀、人才培養(yǎng)目標(biāo)以及人工智能專業(yè)群實(shí)訓(xùn)平臺(tái)建設(shè)的必要性,分析了專業(yè)群內(nèi)各專業(yè)在實(shí)訓(xùn)和日常教學(xué)過程中場(chǎng)景和技術(shù)解決辦法,論證了采用專業(yè)群集中建設(shè)實(shí)訓(xùn)平臺(tái)的優(yōu)勢(shì)。重點(diǎn)從技術(shù)層面分析了實(shí)訓(xùn)平臺(tái)建設(shè)的技術(shù)要點(diǎn):私有云平臺(tái)、Docker容器技術(shù)、GPU虛擬化技術(shù)以及在實(shí)訓(xùn)平臺(tái)上的應(yīng)用場(chǎng)景,介紹了國(guó)內(nèi)外私有云平臺(tái)的發(fā)展情況以及技術(shù)選型,在此基礎(chǔ)上提出了平臺(tái)的硬件配置和軟件系統(tǒng)的規(guī)劃。
關(guān)鍵詞:人工智能;實(shí)訓(xùn)平臺(tái);私有云;Docker容器;GPU虛擬化
中圖分類號(hào):TP18? 文獻(xiàn)標(biāo)志碼:A
0 引言
人工智能專業(yè)培養(yǎng)掌握人工智能基礎(chǔ)專業(yè)理論知識(shí)、應(yīng)用技術(shù),從事人工智能相關(guān)的應(yīng)用開發(fā)、系統(tǒng)集成與運(yùn)維、產(chǎn)品銷售與咨詢、售前售后技術(shù)支持等工作的高素質(zhì)技術(shù)技能人才。銜接中職專業(yè)是計(jì)算機(jī)應(yīng)用技術(shù)、計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)、軟件與信息服務(wù)等,接續(xù)本科專業(yè)是人工智能、智能科學(xué)與技術(shù)、計(jì)算機(jī)科學(xué)與技術(shù)、軟件工程專業(yè)等。
2019年11月教育部新增高職(專科)人工智能專業(yè),專業(yè)代碼610217。
2019年全國(guó)共173所高職高專院校成功備案人工智能技術(shù)服務(wù)專業(yè),2020年達(dá)到385所,2021年上升到458所[1]。人工智能專業(yè)作為一個(gè)新興的專業(yè),國(guó)內(nèi)高職院校在該專業(yè)的實(shí)訓(xùn)平臺(tái)建設(shè)處于起步階段。如何建成適合專業(yè)發(fā)展,實(shí)現(xiàn)專業(yè)群實(shí)訓(xùn)平臺(tái)數(shù)據(jù)共享、資料共用,教師教學(xué)方便、學(xué)生樂于使用的實(shí)訓(xùn)平臺(tái)是本課題研究的內(nèi)涵和目標(biāo)。
近年來隨著云計(jì)算(Cloud Computing)技術(shù)的不斷發(fā)展和成熟,在企業(yè)中的應(yīng)用越來越廣。云計(jì)算具有虛擬化、按需獲取、靈活、高效等特點(diǎn),能夠基于用戶的需求為用戶提供所需的資源[2]。越來越多的高校采用云計(jì)算技術(shù)建設(shè)實(shí)訓(xùn)室,已經(jīng)成為高校IT類專業(yè)實(shí)訓(xùn)平臺(tái)發(fā)展的一個(gè)顯著特點(diǎn)。
1 建設(shè)人工智能專業(yè)群實(shí)訓(xùn)平臺(tái)的必要性
1.1 實(shí)踐教學(xué)環(huán)節(jié)多
人工智能專業(yè)隸屬于電子信息類專業(yè),它在計(jì)算機(jī)科學(xué)的基礎(chǔ)上融合了計(jì)算機(jī)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)等多門學(xué)科,主要學(xué)習(xí)和人工智能技術(shù)相關(guān)的理論、方法、技術(shù)和應(yīng)用等,研究的具體內(nèi)容包括機(jī)器人、自然語言處理及機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等。人工智能專業(yè)群則包含了軟件技術(shù)、大數(shù)據(jù)技術(shù)、計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)等主要專業(yè)。這些專業(yè)共同的特點(diǎn)是需要理論與實(shí)踐相互結(jié)合,且專業(yè)實(shí)踐教學(xué)環(huán)節(jié)多。針對(duì)專業(yè)群集中統(tǒng)籌建立實(shí)訓(xùn)平臺(tái)投資小,效果明顯,受益的學(xué)生數(shù)量多。
開設(shè)了電子信息類專業(yè)的高職院校,一般已經(jīng)在多年前建成了各專業(yè)的實(shí)訓(xùn)平臺(tái),在開設(shè)人工智能專業(yè)之后,面臨單獨(dú)新建人工智能專業(yè)實(shí)訓(xùn)平臺(tái)和整合專業(yè)群實(shí)訓(xùn)平臺(tái)的選擇,本課題的研究可以為相關(guān)學(xué)院的領(lǐng)導(dǎo)和老師提供參考。
1.2 符合國(guó)家產(chǎn)業(yè)規(guī)劃
人工智能(Artificial Intelligence,AI)是研究智能信息處理和開發(fā)具有智能特性的各類應(yīng)用系統(tǒng)的核心技術(shù),現(xiàn)已成為當(dāng)今科學(xué)技術(shù)發(fā)展的前沿學(xué)科,扮演著越來越重要的角色。世界各國(guó)都十分重視人工智能前沿研究、技術(shù)發(fā)展與教育培養(yǎng)[3]。2021年中央網(wǎng)信辦、國(guó)家發(fā)展改革委會(huì)同有關(guān)部門組織編制了《“十四五”國(guó)家信息化規(guī)劃》(簡(jiǎn)稱《規(guī)劃》),系統(tǒng)謀劃“十四五”時(shí)期數(shù)字中國(guó)建設(shè)的時(shí)間表、路線圖、任務(wù)書?!兑?guī)劃》提出,到2025年,我國(guó)數(shù)字經(jīng)濟(jì)核心產(chǎn)業(yè)增加值占GDP比重從2020年的7.8%提高到10%,人工智能專業(yè)群完全符合產(chǎn)業(yè)規(guī)劃[4]。
1.3 平臺(tái)應(yīng)滿足各專業(yè)實(shí)訓(xùn)要求
人工智能專業(yè)群中包含軟件技術(shù)、大數(shù)據(jù)技術(shù)、計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)等主要專業(yè)。這4個(gè)主要專業(yè)的實(shí)訓(xùn)平臺(tái)各有特點(diǎn)。
計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)專業(yè)實(shí)訓(xùn)平臺(tái)常見的有:設(shè)備模擬軟件、虛擬實(shí)驗(yàn)系統(tǒng)、開放式計(jì)算機(jī)網(wǎng)絡(luò)虛擬化實(shí)驗(yàn)室3類。設(shè)備模擬軟件可以提供虛擬的網(wǎng)絡(luò)化環(huán)境,學(xué)生在虛擬環(huán)境下進(jìn)行網(wǎng)絡(luò)組建、網(wǎng)絡(luò)管理等操作;虛擬實(shí)驗(yàn)系統(tǒng)的主體思想是通過軟件來模擬硬件,以此來節(jié)約成本,增加學(xué)生實(shí)訓(xùn)的機(jī)會(huì),虛擬機(jī)軟件能最大限度地利用硬件資源,在虛擬機(jī)中安裝設(shè)備模擬軟件,還能一定程度上減少實(shí)訓(xùn)室管理的維護(hù)工作;開放式計(jì)算機(jī)網(wǎng)絡(luò)虛擬化實(shí)驗(yàn)室主要是利用遠(yuǎn)程桌面或者Web服務(wù)來為學(xué)生拓展實(shí)訓(xùn)的空間和時(shí)間。設(shè)備模擬軟件與開放式計(jì)算機(jī)網(wǎng)絡(luò)虛擬化實(shí)驗(yàn)室是發(fā)展的趨勢(shì)。
大數(shù)據(jù)技術(shù)專業(yè)實(shí)訓(xùn)平臺(tái)對(duì)帶寬和存儲(chǔ)的要求相對(duì)更高,一般采用虛擬化技術(shù),搭建教學(xué)系統(tǒng)和集群。采用虛擬化技術(shù)將硬件資源設(shè)備進(jìn)行虛擬化,把大數(shù)據(jù)軟件和已有的桌面應(yīng)用云端化,將軟硬件資源進(jìn)行最大化地利用[5]。
軟件技術(shù)專業(yè)實(shí)訓(xùn)平臺(tái)的核心功能是為學(xué)生提供數(shù)據(jù)庫、Web前端、Java、Java Web、Dot Net、Python、Android等開發(fā)環(huán)境,對(duì)單機(jī)的性能要求較高。如果采用虛擬化技術(shù),可以在服務(wù)端針對(duì)不同專業(yè)的學(xué)生定制不同的鏡像包,合理分配計(jì)算和存儲(chǔ)資源來解決問題。
人工智能專業(yè)實(shí)訓(xùn)平臺(tái)對(duì)算力和算力的分配要求較高。如果為每個(gè)學(xué)生工位配置高算力的工作站,投資過大,資源利用率也不高。因此GPU虛擬化是必然的選擇。
通過以上對(duì)各專業(yè)實(shí)訓(xùn)平臺(tái)的需求分析可以看出,在目前現(xiàn)有技術(shù)水平下,完全可以通過一套平臺(tái)解決4個(gè)專業(yè)的實(shí)訓(xùn)問題。
1.4 統(tǒng)一平臺(tái)優(yōu)勢(shì)明顯
一般來講,上述4個(gè)專業(yè)在同一個(gè)系部或者二級(jí)學(xué)院,以系部或者二級(jí)學(xué)院為單位統(tǒng)籌建設(shè)能較好地調(diào)配資源,提高資源利用率,具體表現(xiàn)在以下幾個(gè)方面。
首先,隨著市場(chǎng)行情和人才需求的變化,各專業(yè)招生人數(shù)有一定的浮動(dòng)。例如,2013年左右,軟件技術(shù)專業(yè)移動(dòng)應(yīng)用開發(fā)方向火爆,該專業(yè)招生人數(shù)較多。2015年左右大數(shù)據(jù)專業(yè)成為熱門專業(yè),招生人數(shù)較多。2017年左右Web開發(fā)中,前后端分離開發(fā)逐漸在行業(yè)內(nèi)達(dá)成共識(shí),前端發(fā)開發(fā)人才需求旺盛,直接反映在招生人數(shù)上。2020年前后,市場(chǎng)對(duì)人工智能專業(yè)人才需求明顯提升,高職院校紛紛開設(shè)該專業(yè),招生人數(shù)逐年增多。雖然各專業(yè)人數(shù)有所波動(dòng),但是專業(yè)群招生人數(shù)變化相對(duì)不大。因此,通過專業(yè)群共建實(shí)訓(xùn)平臺(tái),可有效解決專業(yè)群內(nèi)各專業(yè)因招生人數(shù)變化引起的資源調(diào)配問題。
其次,傳統(tǒng)的實(shí)訓(xùn)室以各自的專業(yè)為單位,各建各的,各管各的,管理和維護(hù)人員技術(shù)水平和素質(zhì)參差不齊。服務(wù)器集中管理降低故障率、節(jié)約空間、節(jié)約人力成本。
2 平臺(tái)建設(shè)的技術(shù)要點(diǎn)
基于對(duì)各專業(yè)需求的分析,人工智能專業(yè)群實(shí)訓(xùn)平臺(tái)的建設(shè)應(yīng)采用云計(jì)算技術(shù)架構(gòu),即多臺(tái)中心服務(wù)器加工作站的方案。中心服務(wù)器配置高性能CPU、GPU、大容量?jī)?nèi)存、存儲(chǔ)網(wǎng)絡(luò),組成集群,工作站配置性能一般的PC機(jī)。教師通過Web端進(jìn)行管理,學(xué)生通過Web端訪問學(xué)習(xí)資源,通過HTTP,HTTPS,RDP或者SSH等協(xié)議進(jìn)入實(shí)訓(xùn)環(huán)境進(jìn)行學(xué)習(xí)。
2.1 私有云平臺(tái)
基于對(duì)上文對(duì)專業(yè)群教學(xué)需求的分析,單臺(tái)高性能服務(wù)器無法滿足需求??梢詫⒍嗯_(tái)高性能服務(wù)器和存儲(chǔ)設(shè)備組成私有云平臺(tái),集中管理、調(diào)度,合理分配資源。私有云平臺(tái)的選擇較多,國(guó)外的產(chǎn)品有VMware的vSphere、OpenStack、CloudStack,國(guó)內(nèi)的產(chǎn)品有華為、新華三、浪潮、EasyStack和九州云、SmartX、StarVCenter等。其中VMware的vSphere是最成熟的產(chǎn)品,無論在國(guó)外或是國(guó)內(nèi)的虛擬化市場(chǎng)都占據(jù)著舉足輕重的地位,但是在最近出現(xiàn)的VMware對(duì)俄停服事件,以及國(guó)產(chǎn)化、信創(chuàng)化的大背景下,vSphere無疑應(yīng)該在名單之外。OpenStack是一個(gè)開源的云計(jì)算管理平臺(tái)項(xiàng)目,由一系列的開源項(xiàng)目組成,覆蓋了網(wǎng)絡(luò)、虛擬化、存儲(chǔ)等各個(gè)方面。國(guó)內(nèi)的整體私有云解決方案大部分以O(shè)penStack為基本技術(shù)棧進(jìn)行構(gòu)建。阿里云于2016年面向政企客戶推出了Apsara Stack專有云解決方案,2017左右騰訊云分別推出基于OpenStack,Kubernetes等技術(shù)的TStack和基于公有云架構(gòu)的Tencent Cloud Enterprise平臺(tái),華為Fusion Cloud提供從IaaS,PaaS到DaaS的全棧私有云解決方案,新華三推出基于OpenStack的H3Cloud OS云操作系統(tǒng)。
國(guó)內(nèi)互聯(lián)網(wǎng)巨頭均沒有針對(duì)高校實(shí)訓(xùn)平臺(tái)推出較通用的解決方案。為高校實(shí)訓(xùn)場(chǎng)景提供產(chǎn)品或者解決方案的有:北京普開數(shù)據(jù)技術(shù)有限公司、廣州泰迪智能科技有限公司、優(yōu)選創(chuàng)新科技有限公司、鄭州云??萍加邢薰?、南京云創(chuàng)大數(shù)據(jù)科技股份有限公司、曙光信息產(chǎn)業(yè)股份有限公司等。
2.2 Docker容器技術(shù)
Docker是一個(gè)開源的應(yīng)用容器引擎,開發(fā)者可以將環(huán)境、依賴的組件、應(yīng)用打包到鏡像中,然后發(fā)布到任何流行的Linux,Windows,MacOS操作系統(tǒng)的機(jī)器上實(shí)現(xiàn)虛擬化。容器完全使用沙箱機(jī)制,相互之間不會(huì)有任何接口。Docker系統(tǒng)由四部分構(gòu)成,分別是:Docker Client,Docker Daemon,Docker Image,Docker Container。Docker使用客戶端—服務(wù)器(C/S)架構(gòu)模式,通過API來創(chuàng)建和管理Docker容器。Docker容器通過Docker鏡像來創(chuàng)建實(shí)例。容器與鏡像的關(guān)系類似于面向?qū)ο蟪绦蛟O(shè)計(jì)中的實(shí)例與類的關(guān)系。客戶端和服務(wù)端既可以運(yùn)行在一個(gè)機(jī)器上,也可分開部署,通過Socket或者RESTful API進(jìn)行通信。Docker Daemon 在宿主主機(jī)后臺(tái)運(yùn)行,等待接收來自客戶端的消息。Docker客戶端則為用戶提供一系列可執(zhí)行命令,用戶通過這些命令實(shí)現(xiàn)跟Docker Daemon交互。
Docker有以下幾個(gè)特點(diǎn):一是開銷小,啟動(dòng)速度快,可達(dá)到秒級(jí)。二是提供一致的運(yùn)行環(huán)境。Dockerfile使鏡像構(gòu)建透明化,Dockerfile本身是文本描述文件。三是持續(xù)交付和部署。對(duì)開發(fā)和運(yùn)維人員來說,最希望的就是一次創(chuàng)建或配置,可以在任意地方正常運(yùn)行。使用Docker可以通過定制應(yīng)用鏡像來實(shí)現(xiàn)持續(xù)集成、持續(xù)交付、部署。四是方便遷移。由于Docker確保了執(zhí)行環(huán)境的一致性,使得應(yīng)用的遷移更加容易。Docker可以在很多平臺(tái)上運(yùn)行,無論是物理機(jī)、虛擬機(jī)、公有云、私有云其運(yùn)行結(jié)果是一致的。Docker的典型應(yīng)用場(chǎng)景有:應(yīng)用的打包與部署自動(dòng)化、創(chuàng)建輕量,私密的PAAS環(huán)境、實(shí)現(xiàn)自動(dòng)化測(cè)試和持續(xù)的集成/部署、部署與擴(kuò)展WebApp,數(shù)據(jù)庫和后臺(tái)服務(wù)。
Docker與虛擬機(jī)都能提供類似虛擬化的效果,但是兩者差異明顯。Docker比虛擬機(jī)少了一層操作系統(tǒng),如圖1所示。Docker的APP是直接運(yùn)行在宿主機(jī)上的,而虛擬機(jī)的APP是運(yùn)行在宿主機(jī)上的虛擬操作系統(tǒng)上。在啟動(dòng)時(shí)間上,Docker啟動(dòng)速度快,可達(dá)到秒級(jí);虛擬機(jī)啟動(dòng)達(dá)到分鐘級(jí),包含啟動(dòng)虛擬操作系統(tǒng)和啟動(dòng)應(yīng)用的時(shí)間。存儲(chǔ)資源的使用上,Docker也小得多,一般是MB級(jí)別,僅應(yīng)用的大小,而虛擬機(jī)是GB級(jí),包含操作系統(tǒng)和應(yīng)用的大小。在性能上Docker接近原生部署,虛擬機(jī)弱于原生部署。Docker并非萬能,它有以下3方面的缺點(diǎn):(1)隔離性較差。虛擬機(jī)系統(tǒng)硬件資源完全是虛擬化的,當(dāng)一臺(tái)虛擬機(jī)出現(xiàn)系統(tǒng)級(jí)別的問題,往往不會(huì)蔓延到同一宿主機(jī)上的其他虛擬機(jī),而容器之間共享同一個(gè)操作系統(tǒng)內(nèi)核以及其他組件,所以在受到攻擊、應(yīng)用有Bug之類的情況時(shí),更容易通過底層操作系統(tǒng)影響到其他容器。(2)存儲(chǔ)方案弱。Docker容器提供的解決方案是利用Volume接口形成數(shù)據(jù)的映射和轉(zhuǎn)移,以達(dá)到數(shù)據(jù)持久化的目的,但I(xiàn)/O效率低下。(3)安全性問題。容器與主機(jī)共享相同的系統(tǒng)內(nèi)核。如果出現(xiàn)嚴(yán)重漏洞,惡意代碼可能會(huì)在主機(jī)操作系統(tǒng)上執(zhí)行,而非在容器內(nèi)執(zhí)行;如果此漏洞允許任意內(nèi)存訪問,則攻擊者可以更改或讀取任何其他容器的任何數(shù)據(jù)。
通過上文對(duì)Docker技術(shù)的分析可以發(fā)現(xiàn),在實(shí)訓(xùn)平臺(tái)的建設(shè)中,Docker技術(shù)有廣闊的應(yīng)用前景。比如教師在上“Linux操作系統(tǒng)”等平臺(tái)基礎(chǔ)課程時(shí),可以在數(shù)秒鐘之內(nèi),為全班40名同學(xué)每人創(chuàng)建一個(gè)基于Docker的虛擬Linux環(huán)境。在平臺(tái)建設(shè)中,應(yīng)根據(jù)實(shí)訓(xùn)內(nèi)容選擇適當(dāng)?shù)募夹g(shù)為學(xué)生提供實(shí)訓(xùn)操作環(huán)境。
2.3 Kubernetes
Kubernetes是一個(gè)可移植容器的編排管理工具。隨著應(yīng)用越來越復(fù)雜,容器的數(shù)量也越來越多,造成了容器的管理和運(yùn)維難度加大,僅僅依賴Docker的API進(jìn)行管理,工作量大,非常不方便,在這樣的場(chǎng)景下,Kubernetes出現(xiàn)了。Kubernetes集群由Master節(jié)點(diǎn)和Node節(jié)點(diǎn)組成。Master節(jié)點(diǎn)指的是集群控制節(jié)點(diǎn),管理和控制整個(gè)集群。除Master以外的節(jié)點(diǎn)被稱為Node節(jié)點(diǎn)。每個(gè)Node都會(huì)被Master分配一些工作負(fù)載(Docker容器),當(dāng)某個(gè)Node出現(xiàn)故障時(shí),該節(jié)點(diǎn)上的工作負(fù)載就會(huì)被Master自動(dòng)轉(zhuǎn)移到其他節(jié)點(diǎn)上。
2.4 GPU虛擬化技術(shù)
在IaaS平臺(tái)的技術(shù)選型過程,需要特別注意的問題是GPU的虛擬化,即vGPU。vGPU即真正意義上的GPU虛擬化方案,它是將一塊GPU卡的計(jì)算能力進(jìn)行切片,分成多個(gè)邏輯上虛擬的GPU,以vGPU為單位進(jìn)行算力分配,將單塊GPU卡分配給多臺(tái)虛擬機(jī)使用,即多個(gè)用戶使用,使得虛擬機(jī)能夠運(yùn)行3D軟件、進(jìn)行AI運(yùn)算。真正實(shí)現(xiàn)了GPU資源的按需分配,大大降低用戶的使用成本以及提高數(shù)據(jù)的處理效率和數(shù)據(jù)安全性。過渡方案無法對(duì)物理GPU的計(jì)算能力進(jìn)行切片,但能夠?qū)⑽锢頇C(jī)上指定的GPU綁定到一臺(tái)虛擬機(jī)上,使用完成后從虛擬機(jī)解除綁定即可綁定到另一臺(tái)虛擬機(jī)使用,操作過程中虛擬機(jī)不停機(jī),適用于虛擬機(jī)做圖像渲染和AI計(jì)算的場(chǎng)景。因此,高校在與廠家對(duì)接過程應(yīng)特別注意。
3 平臺(tái)建設(shè)主要內(nèi)容
專業(yè)群實(shí)訓(xùn)平臺(tái)建設(shè)包含硬件平臺(tái)、軟件平臺(tái)、課程資源、實(shí)訓(xùn)平臺(tái)的管理維護(hù)等多個(gè)方面,其中硬件平臺(tái)和軟件平臺(tái)是重點(diǎn),平臺(tái)的系統(tǒng)架構(gòu)如圖2所示。
3.1 硬件平臺(tái)建設(shè)
現(xiàn)代大學(xué)生在入學(xué)之后,配備電腦的比例非常高,根據(jù)2013年《大學(xué)生筆記本電腦調(diào)查報(bào)告》對(duì)某本科在校生的調(diào)查顯示,擁有電腦的人占到被調(diào)查總?cè)藬?shù)的85%。隨著社會(huì)經(jīng)濟(jì)水平的發(fā)展,這一比例應(yīng)該進(jìn)一步提高。專業(yè)群實(shí)訓(xùn)平臺(tái)硬件建設(shè)的重點(diǎn)應(yīng)放在服務(wù)器上,多臺(tái)服務(wù)器、SAN通過萬兆交換機(jī)連接,組成高性能、大容量集群。服務(wù)器CPU的核心和GPU算力的配置是整個(gè)平臺(tái)硬件配置的難點(diǎn)。一般來講,配置虛擬CPU時(shí),虛擬插槽數(shù)應(yīng)不大于實(shí)際物理CPU數(shù)量,每個(gè)插槽內(nèi)核數(shù)應(yīng)不大于每個(gè)物理服務(wù)器的核心數(shù),這樣才能更充分地發(fā)揮虛擬CPU的處理能力[6]。CPU的核心主要分配給平臺(tái)自身軟件以及虛擬化桌面和容器。虛擬化桌面和容器可以根據(jù)各專業(yè)的人數(shù)進(jìn)行計(jì)算。
為提高服務(wù)器的可靠性、穩(wěn)定性,減少服務(wù)器噪聲對(duì)實(shí)訓(xùn)室環(huán)境的影響,可設(shè)立單獨(dú)的服務(wù)器機(jī)房,配備高精度空調(diào),為機(jī)房提供穩(wěn)定可靠的工作溫度、相對(duì)濕度、空氣潔凈度。
考慮到學(xué)??赡苡谐修k高職院校職業(yè)技能大賽、組織“1+X”技能證書考試的需要,實(shí)訓(xùn)室同時(shí)也需要配置一定數(shù)量的工作站。工作站的數(shù)量可根據(jù)各專業(yè)群人數(shù)和場(chǎng)地綜合考慮。工作站硬件配置的下限是達(dá)到承辦高職院校職業(yè)技能大賽的要求。比如,2022年四川省職業(yè)院校技能大賽移動(dòng)應(yīng)用開發(fā)賽要求主辦方提供的比賽電腦能流暢地進(jìn)行Android應(yīng)用開發(fā),那么CPU至少應(yīng)該是Intel的8代酷睿I5以上、內(nèi)存16G以上,并配備固態(tài)硬盤。由于服務(wù)端可以提供GPU虛擬化技術(shù),可以考慮不在工作站配置GPU。
3.2 軟件平臺(tái)建設(shè)
基于高校學(xué)生日常教學(xué)和實(shí)訓(xùn)的具體業(yè)務(wù)需求,專業(yè)群實(shí)訓(xùn)平臺(tái)應(yīng)包含:實(shí)訓(xùn)管理系統(tǒng)、云計(jì)算資源管理系統(tǒng)、課程資源管理系統(tǒng)。3個(gè)系統(tǒng)中,云計(jì)算資源管理系統(tǒng)是基礎(chǔ),管理整個(gè)集群的所有硬件資源,并提供虛擬化和容器服務(wù),可以是基于OpenStack的擴(kuò)展。實(shí)訓(xùn)管理系統(tǒng)和課程資源管理系統(tǒng)屬于核心業(yè)務(wù)系統(tǒng),可以部署在虛擬服務(wù)器上。
云資源管理平臺(tái)應(yīng)具備以下功能:超融合集群部署,無固定中心、高可用,隨著服務(wù)器的增加,計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)的整體運(yùn)行處理能力無限擴(kuò)展;支持主流的虛擬化引擎(KVM)模式;支持容器集群(LXC、Docker)模式;提供各維度(CPU、I/O、網(wǎng)絡(luò)、存儲(chǔ)等)監(jiān)控展示云平臺(tái)資源運(yùn)行狀態(tài);支持獨(dú)立的存儲(chǔ)集群網(wǎng)絡(luò);支持模板鏡像庫、光盤鏡像庫,可通過模板鏡像、光盤鏡像快速創(chuàng)建虛擬機(jī);支持從磁盤鏡像導(dǎo)入,支持MDK,VDI,VHDX,QCOW2等多種格式文件;支持自定義虛擬子網(wǎng),虛擬機(jī)的每塊虛擬網(wǎng)卡都可以接入一個(gè)虛擬子網(wǎng),虛擬子網(wǎng)間支持VLAN隔離;支持物理GPU綁定到虛擬機(jī)與解綁,支持vGPU綁定到虛擬機(jī)與解綁;支持SAN存儲(chǔ)單元管理,發(fā)現(xiàn)物理主機(jī)上新劃分的SAN存儲(chǔ)單元,主要用于SAN存儲(chǔ)接入方式的存儲(chǔ)擴(kuò)容;支持虛擬共享磁盤定義;支持三網(wǎng)分離,管理網(wǎng)、業(yè)務(wù)網(wǎng)、存儲(chǔ)網(wǎng)分別走不同的物理鏈路;支持負(fù)載監(jiān)控、異常監(jiān)測(cè)與告警;支持資源動(dòng)態(tài)視圖。
實(shí)訓(xùn)管理系統(tǒng)應(yīng)具備以下功能:學(xué)生可查看實(shí)訓(xùn)課程、實(shí)驗(yàn)、作業(yè)詳細(xì)內(nèi)容;學(xué)生在實(shí)訓(xùn)過程中通過該系統(tǒng)明確學(xué)習(xí)內(nèi)容、學(xué)習(xí)目標(biāo)、實(shí)驗(yàn)安排、參考資料等信息;實(shí)驗(yàn)按照階段進(jìn)行設(shè)置,學(xué)生可以從全局上看到自己的學(xué)習(xí)路徑,從而按照學(xué)習(xí)內(nèi)容選擇相應(yīng)的實(shí)驗(yàn)課程進(jìn)行實(shí)操;提供在線實(shí)驗(yàn)環(huán)境,可以在線撰寫實(shí)驗(yàn)報(bào)告,支持簡(jiǎn)化交互式計(jì)算與數(shù)據(jù)分析類實(shí)驗(yàn);支持實(shí)驗(yàn)文檔與執(zhí)行代碼收歸;支持Linux/Windows虛擬機(jī)在線實(shí)驗(yàn)環(huán)境,支持Docker容器,集成Linux編譯環(huán)境,可方便地根據(jù)實(shí)驗(yàn)內(nèi)容在Linux環(huán)境中進(jìn)行操作,并直觀地驗(yàn)證實(shí)驗(yàn)結(jié)果;實(shí)訓(xùn)過程中需要用到的各類虛擬環(huán)境,由教師統(tǒng)一配置,學(xué)生可以一鍵進(jìn)入,用完自動(dòng)回收資源,資源分配與回收功能由云計(jì)算資源管理系統(tǒng)提供。
課程資源管理系統(tǒng)與實(shí)訓(xùn)管理系統(tǒng)不同,以課程為單位組織內(nèi)容,包含教學(xué)活動(dòng)、教學(xué)統(tǒng)計(jì)、教學(xué)資源、通知、作業(yè)、考試、討論等功能模塊。課程資源管理系統(tǒng)與實(shí)訓(xùn)管理系統(tǒng)深度整合,學(xué)生在實(shí)訓(xùn)過程中無須登錄課程資源管理系統(tǒng),就可以獲取到相應(yīng)的資源。
4 結(jié)語
隨著時(shí)代飛速發(fā)展,技術(shù)不斷進(jìn)步,通過私有云平臺(tái)搭建實(shí)訓(xùn)環(huán)境已經(jīng)成為主流。人工智能專業(yè)群內(nèi)的多個(gè)專業(yè)有相同點(diǎn),在教學(xué)過程中需要理論與實(shí)踐相互結(jié)合,并且專業(yè)實(shí)踐教學(xué)環(huán)節(jié)較多。同時(shí)各專業(yè)又有自身的特點(diǎn),計(jì)算機(jī)網(wǎng)絡(luò)專業(yè)的實(shí)訓(xùn)環(huán)境要求虛擬化、網(wǎng)絡(luò)化,大數(shù)據(jù)技術(shù)專業(yè)實(shí)訓(xùn)平臺(tái)對(duì)帶寬和存儲(chǔ)的要求相對(duì)更高,軟件技術(shù)專業(yè)需要針對(duì)不同的開發(fā)方向配置不同的鏡像環(huán)境,人工智能專業(yè)實(shí)訓(xùn)平臺(tái)對(duì)算力和算力的分配要求較高。通過對(duì)私有云平臺(tái)核心技術(shù)OpenStack、Docker容器技術(shù)、Kubernetes容器編排技術(shù)、GPU虛擬化技術(shù)的分析,得出專業(yè)群集中建設(shè)實(shí)訓(xùn)平臺(tái)完全可行的結(jié)論,并給出了硬件平臺(tái)配置建議、軟件平臺(tái)功能建議,希望對(duì)高職院校實(shí)訓(xùn)室管理員、實(shí)訓(xùn)中心主任有所幫助。
參考文獻(xiàn)
[1]高校人工智能與大數(shù)據(jù)創(chuàng)新聯(lián)盟.高職院校人工智能技術(shù)應(yīng)用(服務(wù))專業(yè)排行榜2022全國(guó)463所高職高專院校人工智能專業(yè)教育教學(xué)綜合實(shí)力一覽表[EB/OL].(2020-07-08)[2022-06-10].https://www.163.com/dy/article/H9H0OV7F0532N2UB.html.
[2]謝顯杰.基于OpenStack的私有云平臺(tái)構(gòu)建研究[J].信息與電腦(理論版),2022(5):88-91.
[3]謝榕.人工智能的國(guó)際化—多元化創(chuàng)新教學(xué)模式[J].計(jì)算機(jī)教育,2017(6):165-170.
[4]趙英昌.大學(xué)生筆記本電腦調(diào)查報(bào)告[J].企業(yè)導(dǎo)報(bào),2013(4):114-115.
[5]李自臣,劉江越,陳梅.職業(yè)院校大數(shù)據(jù)應(yīng)用技術(shù)實(shí)訓(xùn)平臺(tái)的建設(shè)[J].黑龍江科學(xué),2019(15):7-8,11.
[6]譚志遠(yuǎn),黃巍,宮云平,等.VMware虛擬機(jī)性能評(píng)估分析[J].移動(dòng)通信,2015(5):92-96.
(編輯 傅金睿)
Construction of artificial intelligence specialty group training platform in colleges
Liao? Ruofei
(Sichuan College of Information Technology, Guangyuan 628040, China)
Abstract:? There is an urgent need to build a practical training platform for artificial intelligence professional group based on cloud computing technology in higher vocational colleges. This paper analyzes the current situation of artificial intelligence major in higher vocational colleges, the goal of talent training, and the necessity of the construction of practical training platform of artificial intelligence major group. It analyzes the scenes and technical solutions in the practical training and daily teaching process of each major in the professional group, and demonstrates the advantages of using the professional group to build the practical training platform. Focus from technical analysis of the main technical points in the construction of practical training platform: private cloud platform, Docker container technology, GPU, virtualization technology, as well as in training platform application scenarios, introduces the development of private cloud platform and technology selection, on the basis of this puts forward the platform of hardware configuration and software system planning.
Key words: artificial intelligence; training platform; private clouds; docker container; GPU virtualization