羅富智
(四川大學(xué)計(jì)算機(jī)學(xué)院,成都 610065)
教育興則國家興,教育強(qiáng)則國家強(qiáng)。高等教育是一個(gè)國家發(fā)展水平和發(fā)展?jié)摿Φ闹匾獦?biāo)志。高等院校是立德樹人、培養(yǎng)人才的場所,而學(xué)科是大學(xué)教書育人、科學(xué)研究與社會(huì)服務(wù)的基礎(chǔ)。教育部為提高我國大學(xué)的辦學(xué)水平和國際競爭力,不僅設(shè)置了雙一流背景下的一流大學(xué)和一流學(xué)科建設(shè)計(jì)劃,近乎同時(shí)對全國高校學(xué)科開展了評估工作[1]。學(xué)科評估量化了該學(xué)科目前的發(fā)展實(shí)力和競爭力,學(xué)科建設(shè)計(jì)劃則指引了高校未來發(fā)展的方向。高等教育作為我國人才的搖籃,該兩項(xiàng)相關(guān)工作引發(fā)社會(huì)各界的關(guān)注。
部分即將畢業(yè)的本科生做出了國內(nèi)繼續(xù)讀研深造的選擇。該類人群已經(jīng)隸屬于某個(gè)專業(yè)門類,大部分同學(xué)會(huì)直接報(bào)考對口或相近的研究生專業(yè)。相比于本科的通識教育,院校學(xué)科實(shí)力對研究生的學(xué)習(xí)科研更為重要。然而,面向?qū)嵙Ω饔兴L的眾多高校,高年級本科生們雖然初步了解自身專業(yè)的內(nèi)容,卻對學(xué)科建設(shè)和評估難以有系統(tǒng)性的認(rèn)識,也容易忽略一個(gè)學(xué)科群內(nèi)學(xué)科間的相互帶動(dòng)作用,更無法將自身對學(xué)校城市的偏好與之對比,因而在報(bào)考時(shí)過于盲目。
因此,本文綜合一流高校建設(shè)名單、一流學(xué)科建設(shè)名單、第四次學(xué)科評估結(jié)果,對城市、學(xué)科實(shí)力、發(fā)展前景等進(jìn)行量化評估[2],設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)完整的可視分析系統(tǒng)。該系統(tǒng)能夠基于學(xué)科建設(shè)評估指標(biāo),主要為面臨擇校的高中、本科畢業(yè)生提供含有用戶偏好的院校對比排名,使之擇校決策有專業(yè)依據(jù)可遵循。基于Web端的系統(tǒng)可提供交互手段供用戶調(diào)整指標(biāo)權(quán)重,從而生成具有用戶偏好的排名。系統(tǒng)以計(jì)算機(jī)新興工程科學(xué)群為例進(jìn)行分析,使對比結(jié)果更客觀,用戶決策更合理。
本文使用的數(shù)據(jù)來自于所寫爬蟲從中國教育在線網(wǎng)站、中國學(xué)位與研究生教育信息網(wǎng)上獲取。包含高校概況、高校學(xué)科群實(shí)力評分及高校學(xué)科大類概況三個(gè)部分。
用于描述一所高校的基本信息,包含學(xué)校編號、學(xué)校名稱、學(xué)校各評級學(xué)科數(shù)量、省市、經(jīng)緯度等。學(xué)校編號(招生代碼)用于唯一標(biāo)識一所大學(xué),如四川大學(xué)的高校代碼為10610。學(xué)校學(xué)科評級包括A+~C-,反映學(xué)校的學(xué)科建設(shè)情況。
用于評價(jià)一所高校的實(shí)力,包含城市評分、知名度評分、雙一流評分、第四次學(xué)科評分。城市評分來自于上文獲取的城市排名數(shù)據(jù)。知名度評分參考“2019中國最好大學(xué)排名”。雙一流評分表征高校在一流學(xué)科建設(shè)中是否存在“電子科學(xué)與技術(shù)、信息與通信工程、控制科學(xué)與工程、計(jì)算機(jī)科學(xué)與技術(shù)、軟件工程”,如果存在則代表二十分值。第四次學(xué)科評分:將電子科學(xué)與技術(shù)、信息與通信工程、控制科學(xué)與工程、計(jì)算機(jī)科學(xué)與技術(shù)、軟件工程五個(gè)學(xué)科的學(xué)科評估等級映射為分?jǐn)?shù)進(jìn)行加和,表示該校學(xué)科群的發(fā)展實(shí)力。
用于描述高校的學(xué)科完整度,包含學(xué)校簡介、各學(xué)科門類名單等信息。學(xué)校簡介為該校的主要標(biāo)簽,學(xué)科包含文史、理工、經(jīng)管、醫(yī)學(xué)、農(nóng)學(xué)、藝術(shù)等大類與哲學(xué)、理學(xué)的、工學(xué)等一級學(xué)科。
基于章節(jié)1中的數(shù)據(jù)描述,本文綜合一流高校建設(shè)名單、一流學(xué)科建設(shè)名單、第四次學(xué)科評估結(jié)果,對城市、學(xué)科實(shí)力、發(fā)展前景等進(jìn)行量化評估,提出了三點(diǎn)可視分析任務(wù)[3],使用戶能夠基于Web系統(tǒng)對感興趣的院校進(jìn)行對比分析,從中加入自己的情感偏好。具體的可視化任務(wù)定義如下:
任務(wù)一:不同地理粒度的高校分布:
(1)按省份劃分的高校數(shù)量;
(2)高校地理空間分布;
(3)篩選院校范圍;
(4)基于學(xué)科評估的學(xué)校發(fā)展現(xiàn)狀。
任務(wù)二:基于學(xué)科群的競爭力排名:
(1)學(xué)校的整體競爭力排名;
(2)學(xué)校的固有屬性、學(xué)科群實(shí)力與前景;
(3)定義排名屬性權(quán)重。
任務(wù)三:學(xué)校學(xué)科門類競爭力:
(1)學(xué)科門類實(shí)力和前景;
(2)相似發(fā)展模式院校的探索。
基于以上可視化任務(wù),本文完成了可視化視圖設(shè)計(jì)與系統(tǒng)實(shí)現(xiàn)。
根據(jù)本文獲取的數(shù)據(jù)和本文所定義的可視化任務(wù)來設(shè)計(jì)可視化系統(tǒng)方案,本文基React[4]、Echarts[5]、Pandas[6]等技術(shù)進(jìn)行方案實(shí)現(xiàn)。本文設(shè)計(jì)的可視化能夠清晰地解決定義的三個(gè)可視化任務(wù),幫助用戶完成高校的對比與選擇。
高校本身的地理位置屬性是重要的分析因素,基于地理分布的分析能夠幫助我們發(fā)現(xiàn)全國的高校分布,從而發(fā)現(xiàn)學(xué)科建設(shè)較為完善的省份。如圖1所示,顯示了學(xué)校在全國15個(gè)省級行政區(qū)的數(shù)量分布情況。
圖1 高校分布統(tǒng)計(jì)
進(jìn)一步地,采用地圖與玫瑰圖疊加的方式可以對大學(xué)的地理信息進(jìn)行展示,如圖2所示。通過地圖上疊加的南丁格爾玫瑰圖的半徑編碼某高校從“A+”到“C-”九個(gè)學(xué)科評級上的學(xué)科數(shù)量,并用顏色區(qū)分不同的級別。在控制面板中對學(xué)校進(jìn)行篩選后,可觀察到某省符合條件學(xué)校的地點(diǎn)信息。通過對學(xué)校間學(xué)科評估的分布情況進(jìn)行分析,可以實(shí)現(xiàn)學(xué)校間的比較。在圖2中可以發(fā)現(xiàn),四川大學(xué)和電子科技大學(xué)在第四輪學(xué)科評估中差異明顯。同時(shí)用戶可以通過對拖拽、縮放、單擊雙擊等操作于其他視圖聯(lián)動(dòng)進(jìn)行進(jìn)一步分析。
圖2 地圖視圖:高校學(xué)科評估
本文要分析的高校信息是多維度信息,包括“城市”,“知名度”,“雙一流評分”以及個(gè)學(xué)科實(shí)力等緯度。為了支持同時(shí)對多維度信息的可視化分析,采用雷達(dá)圖[7]與熱力圖矩陣[8]相結(jié)合的方式。如圖3和圖4所示,熱力圖矩陣詳細(xì)展示了學(xué)校之間的排名情況。其中,行代表對應(yīng)高校,列代表高校的某個(gè)屬性,通過顏色深淺編碼對應(yīng)行高校在對應(yīng)列屬性上的表現(xiàn)的優(yōu)劣。雷達(dá)圖中,用五個(gè)坐標(biāo)軸展示高校在五個(gè)緯度的歸一化表示的優(yōu)劣信息,離中心點(diǎn)距離越遠(yuǎn)代表在對應(yīng)屬性上表現(xiàn)越好。雷達(dá)圖可以同時(shí)展示多個(gè)高校,不同高校用不同色相區(qū)分。
圖3 雷達(dá)圖
圖4 熱力圖矩陣
在圖4中,可以發(fā)現(xiàn)南開大學(xué)和四川大學(xué)排名很接近,同時(shí)各項(xiàng)分布得分也基本一致。通過在控制面板對第四次學(xué)科評估權(quán)重進(jìn)行調(diào)整,會(huì)發(fā)現(xiàn)四川大學(xué)的排名有所上升。
如圖5所示,在學(xué)科門類建設(shè)和評估視圖中,通過雙向橫向柱狀圖展示高校在“理工”、“文史”等六類學(xué)科分別在學(xué)科評估和一流學(xué)科建設(shè)方面的實(shí)力,柱狀圖的高低編碼對應(yīng)屬性強(qiáng)弱,從而對所選學(xué)校的學(xué)科評估分?jǐn)?shù)和學(xué)科建設(shè)數(shù)量進(jìn)行展示。在圖5中可以發(fā)現(xiàn),四川大學(xué)在理工和醫(yī)學(xué)領(lǐng)域?qū)W科評估分?jǐn)?shù)較高,同時(shí)所入選的學(xué)科建設(shè)數(shù)量也十分眾多。
圖5 學(xué)科門類建設(shè)和評估視圖
在學(xué)科評估基礎(chǔ)上,采用散點(diǎn)圖的方式展示學(xué)校之間的相似性,如圖6所示。將學(xué)校屬性降維映射到二維坐標(biāo)中,每個(gè)散點(diǎn)代表一個(gè)學(xué)校,散點(diǎn)相近代表這兩所學(xué)校的發(fā)展模式相類似,如發(fā)展程度相當(dāng)?shù)木C合性大學(xué)。通過對圖6的探索,我們發(fā)現(xiàn)投影的結(jié)果符合人們對于學(xué)校的基本認(rèn)知。強(qiáng)工科學(xué)校如合肥工業(yè)大學(xué)、北京交通大學(xué)、華南理工大學(xué)、西安電子科技大學(xué)等聚成了一簇。
圖6 高校投影視圖
結(jié)合以上三小節(jié)中的可視化視圖設(shè)計(jì),最終形成的系統(tǒng)界面圖如圖7所示。用戶通過在地圖上點(diǎn)選自己感興趣的學(xué)校,可以在學(xué)校屬性視圖和學(xué)科門類建設(shè)和評估中對學(xué)校的詳細(xì)信息進(jìn)行查看。同時(shí),用戶通過鼠標(biāo)懸浮操作,可以查看該校的一流學(xué)科建設(shè)名單。在高校對比視圖,用戶通過鼠標(biāo)點(diǎn)擊刪除自己不感興趣的學(xué)校,也可以通過鼠標(biāo)懸浮查看各個(gè)學(xué)校在不同維度的評分情況。
圖7 系統(tǒng)界面圖
本文從高校一流學(xué)科建設(shè)與學(xué)科評估的角度出發(fā),提出了高校學(xué)科分析中應(yīng)關(guān)注的三大可視分析任務(wù),并且從這三個(gè)任務(wù)層次(地理分布、學(xué)科群排名、學(xué)科競爭力)出發(fā)進(jìn)行不同維度的解析。通過交互聯(lián)動(dòng)的方式,使視圖之間進(jìn)行交互探索,從對高校學(xué)科信息提供了全方位、多角度的理解。基于本文實(shí)現(xiàn)的系統(tǒng),用戶能夠從自身需求出發(fā)完成院校對比、專業(yè)選擇等任務(wù)。此外,系統(tǒng)也可面向高校工作人員,鮮明呈現(xiàn)校內(nèi)外學(xué)科建設(shè)的差異,為學(xué)科群發(fā)展政策提供建議。