梁婷婷, 邱素貞, 陸 珊
(南寧學(xué)院 信息工程學(xué)院, 南寧530200)
根據(jù)賽迪發(fā)布的《2019—2021 年中國大數(shù)據(jù)市場預(yù)測與展望數(shù)據(jù)》顯示,預(yù)計(jì)未來三年中國大數(shù)據(jù)市場規(guī)模仍將保持30%以上的增長速度[1]。 到2021 年,中國大數(shù)據(jù)市場規(guī)模將達(dá)到4920.3 億元。希捷科技的一項(xiàng)最新研究表明,到2025 年全球數(shù)據(jù)量將 會(huì) 從2018 年 的33ZB 上 升 至175ZB[2]。 到2020 年,工業(yè)機(jī)器間分享的數(shù)據(jù)將遠(yuǎn)遠(yuǎn)超過人類所生成的數(shù)據(jù)量。 爆炸式增長的數(shù)據(jù)量推動(dòng)和豐富了大數(shù)據(jù)分析及應(yīng)用需求。 各地?cái)?shù)字經(jīng)濟(jì)和新型智慧城市建設(shè)項(xiàng)目需要大量的大數(shù)據(jù)人才。 為了應(yīng)對(duì)大數(shù)據(jù)人才的旺盛需求態(tài)勢,國家加快設(shè)立了一批相關(guān)專業(yè)。 根據(jù)教育部公布的2017—2020 年普通高等學(xué)校本科專業(yè)備案和審批結(jié)果顯示,獲批新增“數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)”專業(yè)的高校累計(jì)達(dá)到616所。 此外,國家還加快設(shè)立了交叉性的新學(xué)科,培育既懂大數(shù)據(jù)技術(shù),又有專業(yè)知識(shí)(如智能建造、智能醫(yī)學(xué)、智能車輛、計(jì)算金融等)的復(fù)合型人才。
人才的培育順應(yīng)國家政策與當(dāng)前及未來的市場需求。 收集具有廣泛影響力的人力資源服務(wù)供應(yīng)商的人才招聘網(wǎng)站數(shù)據(jù),研究海量真實(shí)的名企職位招聘信息,從當(dāng)前的市場實(shí)際需求,定位人才的素質(zhì)能力、知識(shí)儲(chǔ)備等要求,對(duì)各高校制定人才培養(yǎng)方案具有實(shí)際意義。
本研究以“大數(shù)據(jù)”為關(guān)鍵詞,于2020 年3 月爬取前程無憂51Job 人才招聘網(wǎng)站的52 403 條信息。 其中包括12 個(gè)字段:崗位名稱、薪資、教育背景、經(jīng)驗(yàn)要求、招聘人數(shù)、公司名稱、工作地區(qū)、公司性質(zhì)、公司規(guī)模、所處行業(yè)、發(fā)布日期、職位詳情等。去除重復(fù)、大量的房產(chǎn)銷售等人才招聘廣告的噪聲數(shù)據(jù),以及一些字段數(shù)據(jù)為空的記錄,留取22 531條有效數(shù)據(jù)。 為了深入分析人才需求定位,利用tableau 數(shù)據(jù)可視化分析軟件,采用描述統(tǒng)計(jì)分析方法,研究當(dāng)前大數(shù)據(jù)人才市場的實(shí)際需求,包括地域分布、薪資水平、經(jīng)驗(yàn)要求、崗位需求等。 結(jié)合詞頻分析和統(tǒng)計(jì)技術(shù),經(jīng)過對(duì)不同崗位的詳情描述進(jìn)行文本分析,挖掘出各企事業(yè)單位對(duì)大數(shù)據(jù)人才的素質(zhì)能力、知識(shí)儲(chǔ)備等要求。 通過散點(diǎn)圖、條形圖、地圖等可視化圖形展示了主要分析結(jié)果。
本次爬取的數(shù)據(jù)中,有一萬余條(占總數(shù)20%)記錄的招聘人數(shù)為“若干人”。 為了更好的統(tǒng)計(jì)招聘人數(shù),將招聘人數(shù)為“若干人”轉(zhuǎn)換為5 人。 最終計(jì)算出總的招聘人數(shù)為75 876 人。
企事業(yè)單位發(fā)布招聘信息時(shí)間分布在2020 年1—3 月份,3 月份發(fā)布的招聘人數(shù)占74%,需求人數(shù)激增。 分析原因,應(yīng)是受鼠年春節(jié)和新冠病毒疫情影響,企業(yè)需求意愿不強(qiáng)。
數(shù)據(jù)顯示,教育背景要求本科的占比最大,達(dá)到63.4%,大專20%和碩士5.2%。 可見本科學(xué)歷的人才最受歡迎,本科層次人才培養(yǎng)對(duì)整個(gè)大數(shù)據(jù)市場具有重要意義。 為了更好的研究本科層次大數(shù)據(jù)人才的需求狀態(tài),本文篩選出教育背景明確要求為本科學(xué)歷的記錄進(jìn)行研究,從多角度分析并給出相應(yīng)結(jié)果。
各用人單位填寫的招聘崗位名稱不盡相同,部分有交叉重復(fù),共有6 579 種不同名稱。 經(jīng)分析,結(jié)合大多數(shù)實(shí)際崗位的工作內(nèi)容,將這些崗位名稱進(jìn)行分組整理。 分組時(shí),會(huì)有部分崗位名稱涉及不同的組別(如:安全研發(fā)架構(gòu)師),但是僅能處于一個(gè)組別。 如圖1 所示,需求人數(shù)超過總體平均值的有:數(shù)據(jù)分析(含數(shù)據(jù)分析、統(tǒng)計(jì)分析、數(shù)據(jù)統(tǒng)計(jì)、財(cái)務(wù)分析、運(yùn)營分析、數(shù)據(jù)專員等統(tǒng)一歸為數(shù)據(jù)分析)、數(shù)據(jù)開發(fā)、軟件開發(fā)方向、研發(fā)方向、數(shù)據(jù)工程師、數(shù)據(jù)運(yùn)維\運(yùn)營、架構(gòu)方向、銷售方向等。
圖1 不同崗位需求人數(shù)條形圖Fig.1 Bar chart of the number of people in different positions
各用人單位給出的薪資范圍千差萬別。 有元/小時(shí)、元/天、千/月、萬/月、萬/年等單位,以及數(shù)據(jù)類似于“6.5~20 千/月”這樣的格式,數(shù)據(jù)范圍跨度不一。 為了方便統(tǒng)計(jì)分析薪資水平,將所有的薪資單位換算為千/月,并將每個(gè)薪資數(shù)據(jù)范圍分離出最低值和最高值,進(jìn)而計(jì)算出每個(gè)薪資數(shù)據(jù)的平均值。經(jīng)過統(tǒng)計(jì),大數(shù)據(jù)人才的平均月薪為17 千/月。 并將薪資數(shù)據(jù)每5 千為一個(gè)數(shù)據(jù)項(xiàng)繪制平均薪資水平分布直方圖。 如圖2 可見,大多崗位的平均薪資分布在5~20 千/月。
圖2 平均薪資水平分布直方圖Fig.2 Distribution histogram of average salary level
對(duì)數(shù)據(jù)進(jìn)一步鉆取信息,繪制不同崗位招聘人數(shù)及工資散點(diǎn)圖,如圖3 所示。 可見,招聘人數(shù)比較多的崗位,如:數(shù)據(jù)分析、數(shù)據(jù)開發(fā)、軟件開發(fā)等,平均薪資在15 千/月左右。 而架構(gòu)師、BI 和智慧方向的崗位薪資比較高,達(dá)24 千/月以上。
圖3 不同崗位招聘人數(shù)及工資散點(diǎn)圖Fig.3 recruitment number and salary scatter of different positions
對(duì)本科學(xué)歷人才的經(jīng)驗(yàn)要求,大多在3 ~4 年,其次是要求在校生/應(yīng)屆生,如圖4 所示。 結(jié)果顯示,對(duì)在校生/應(yīng)屆生的需求崗位最多的是:研發(fā)方向(數(shù)據(jù)研發(fā)、研發(fā)工程師)、軟件開發(fā);其次是數(shù)據(jù)分析、數(shù)據(jù)工程師。 要求一年經(jīng)驗(yàn)最多是:數(shù)據(jù)分析、數(shù)據(jù)開發(fā);要求2~4 年經(jīng)驗(yàn)的崗位更多的是:數(shù)據(jù)開發(fā)、開發(fā)工程師、數(shù)據(jù)分析師和工程師。 要求5~7年經(jīng)驗(yàn)以上的崗位更多的是架構(gòu)方向、開發(fā)方向。 隨著經(jīng)驗(yàn)?zāi)晗抟笤礁撸劫Y水平也越高。
圖4 不同經(jīng)驗(yàn)要求的人才需求條形圖Fig.4 Bar chart of talent demand for different experience requirements
全國主要城市均需求大數(shù)據(jù)人才,如圖5 所示,需求量最大的城市依次是上海、北京、深圳、廣州、杭州、成都,這六大城市的需求占總需求的57.6%。 除此之外南京、武漢、合肥、西安、珠海、濟(jì)南等地需求也比較大。 可見,這些城市是數(shù)字經(jīng)濟(jì)發(fā)展沃土,是人才聚集地。
公司行業(yè)字段有多個(gè)行業(yè)標(biāo)簽,有些公司跨不同行業(yè),本研究默認(rèn)以第一個(gè)作為該公司的行業(yè)標(biāo)簽。 人才需求行業(yè)主要來源于計(jì)算機(jī)軟件、互聯(lián)網(wǎng)/電子商務(wù)、通信/電信/網(wǎng)絡(luò)設(shè)備,金融/投資/證券,計(jì)算機(jī)服務(wù)(系統(tǒng)、數(shù)據(jù)服務(wù)、維修),電子技術(shù)/半導(dǎo)體/繼承電路,專業(yè)服務(wù)(咨詢、人力資源、財(cái)會(huì))。本文篩選出招聘總?cè)藬?shù)在平均值之上的16 個(gè)行業(yè),繪制出行業(yè)需求餅圖,如圖6 所示。
圖5 大數(shù)據(jù)人才工作地點(diǎn)分布地圖Fig.5 Distribution map of big data talents'work places
圖6 行業(yè)需求餅圖Fig.6 Pie chart of industry demand
此外,民營公司對(duì)大數(shù)據(jù)人才的需求最大,占到一半。 然后依次是國企(20%)和上市公司(13%)。
職位詳情字段中,用人單位描述了對(duì)招聘人才的技能、素養(yǎng)等要求。 采用文本挖掘方法,利用jieba 分詞工具,對(duì)每一條記錄的職位詳情去除停用詞以后進(jìn)行分詞,然后進(jìn)行詞頻統(tǒng)計(jì),如圖7 所示。排在前列的軟件和技術(shù)要求有PYTHON、JAVA、HADOOP、SPARK、excel、spss、mysql 等,這些是大數(shù)據(jù)應(yīng)用過程中所需要的工具和平臺(tái),用來對(duì)數(shù)據(jù)進(jìn)行采集、存儲(chǔ)、計(jì)算、分析等。 對(duì)人才素養(yǎng)的要求更強(qiáng)調(diào)團(tuán)隊(duì)合作、良好的溝通能力。
若按照崗位名稱分類查看工作要求,需求量最大數(shù)據(jù)分析崗位的描述詞云,如圖8 所示。 可見數(shù)據(jù)分析崗位要求熟悉python、R 語言、excel 或spss等熱門編程語言或工具;掌握sql 數(shù)據(jù)庫;具有數(shù)學(xué)、統(tǒng)計(jì)學(xué)、數(shù)據(jù)挖掘等理論知識(shí);或者應(yīng)用相關(guān)技術(shù),通過數(shù)據(jù)揭示業(yè)務(wù)問題。
圖7 職位詳情描述詞頻統(tǒng)計(jì)云圖Fig.7 Word cloud chart of job description frequency statistics
圖8 數(shù)據(jù)分析方向的職位詳情描述詞頻統(tǒng)計(jì)云圖Fig.8 Word cloud chart of job description frequency statistics in data analysis direction
此外,根據(jù)需要可以得到不同條件下顎描述詞云圖,在此則不一一贅述。
經(jīng)過研究和分析大型招聘網(wǎng)站的招聘數(shù)據(jù),獲知當(dāng)前市場對(duì)大數(shù)據(jù)人才的需求是多行業(yè)、多層次、多分類的,薪資較高、需求量大、工作地大多在北上廣深、杭州及成都等主要城市。 本科高校在設(shè)計(jì)人才培養(yǎng)方案時(shí),以國家戰(zhàn)略、產(chǎn)業(yè)行業(yè)發(fā)展的頂層設(shè)計(jì)為出發(fā)點(diǎn),及時(shí)根據(jù)人才市場需求,規(guī)劃和調(diào)整教育教學(xué)體系,培養(yǎng)適應(yīng)多元化發(fā)展的創(chuàng)新性人才。在此提出以下建議供參考:
(1)考慮學(xué)生的職業(yè)發(fā)展路徑,參照上述熱門崗位經(jīng)驗(yàn)要求分析,就業(yè)5 年內(nèi)的職位發(fā)展路徑有跡可循,依次是數(shù)據(jù)研發(fā)、數(shù)據(jù)分析、開發(fā)和運(yùn)營、架構(gòu)。
(2)有針對(duì)性的培養(yǎng)學(xué)生技能。 不同行業(yè)對(duì)崗位的需求也不盡相同,高校在“全科教育”的基礎(chǔ)上培養(yǎng)學(xué)生的某個(gè)領(lǐng)域特長,應(yīng)是較合理的培養(yǎng)方向和理念。
(3)專業(yè)教育與創(chuàng)新教育互為補(bǔ)充和支撐,全面提升大數(shù)據(jù)相關(guān)專業(yè)學(xué)生的素質(zhì),適應(yīng)快速發(fā)展的社會(huì)。
(4)特色培養(yǎng)。 每個(gè)學(xué)校的辦學(xué)基礎(chǔ)不一,有不同的硬軟件環(huán)境。 地方本科院校應(yīng)進(jìn)一步分析本地及輻射地區(qū)的人才需求,為各地?cái)?shù)字經(jīng)濟(jì)和新型智慧城市建設(shè)項(xiàng)目輸送高質(zhì)量的大數(shù)據(jù)人才。 而跨學(xué)科的專業(yè),可深入分析相關(guān)行業(yè)的特殊需求,培養(yǎng)兼具行業(yè)背景和大數(shù)據(jù)技能的復(fù)合型人才。