[摘 要]數(shù)字經濟時代,新商科建設要求學生同時具備商業(yè)分析和數(shù)據(jù)分析能力,但商科生多為文科背景,商業(yè)數(shù)據(jù)分析崗位適應能力較差。文章通過爬取招聘網(wǎng)站并使用文本分析和隱含狄利克雷分布(Latent Dirichlet Allocation,LDA)主題分類方法,挖掘商業(yè)數(shù)據(jù)分析崗位需求特征,進一步通過問卷調查商科專業(yè)學生對該類崗位的適應度。研究發(fā)現(xiàn),商業(yè)數(shù)據(jù)分析崗位重視應聘者的數(shù)學、統(tǒng)計學等專業(yè)知識,以及協(xié)調能力、邏輯分析能力等綜合素質。高校應構建課堂教學、案例教學與實踐教學相結合的體系,培養(yǎng)學生相關能力。
[關鍵詞]新商科;商業(yè)數(shù)據(jù)分析崗位;人才培養(yǎng);文本分析;LDA主題分類
doi:10.3969/j.issn.1673 - 0194.2024.24.077
[中圖分類號]G642 [文獻標識碼]A [文章編號]1673-0194(2024)24-0-04
0" " "引 言
數(shù)字經濟時代,數(shù)據(jù)分析師、數(shù)據(jù)挖掘工程師等數(shù)據(jù)相關崗位炙手可熱。其中,數(shù)據(jù)分析師所需專業(yè)知識涵蓋范圍廣,為滿足崗位要求,商科專業(yè)學生需要注重增強自身商業(yè)分析能力和數(shù)據(jù)分析能力。然而,當前高校的人才培養(yǎng)方案與社會需求還存在一定差距,高校應順應數(shù)字經濟時代發(fā)展趨勢,優(yōu)化人才培養(yǎng)方案,以增強人才供給的針對性和適配性。
目前,國內對數(shù)據(jù)相關崗位的研究主要從招聘信息中挖掘用人單位的需求特征。例如,黃崑等發(fā)現(xiàn)相較于數(shù)據(jù)管理、數(shù)據(jù)挖掘崗位,數(shù)據(jù)分析崗位更重視數(shù)據(jù)采集與分析有關的知識與技能[1]。張俊峰等從能力、專業(yè)和技能3個方面對招聘要求進行了分析和歸納[2]。古揚等通過對崗位職責要求、技能要求、背景要求和社會機構需要4個層面的研究,對情報分析師的人才需求進行了剖析[3]。薛潔等進一步比較了社會招聘和校園招聘中數(shù)據(jù)類崗位在人才特征、技能要求等方面的差異[4]。然而,目前針對商業(yè)數(shù)據(jù)分析崗位需求特征的研究仍顯不足。鑒于商科專業(yè)學生的培養(yǎng)目標與其他專業(yè)存在差異,有必要深入探究商業(yè)數(shù)據(jù)分析崗位的具體需求特征,從而為商科專業(yè)數(shù)據(jù)分析人才培養(yǎng)提供更加精準的指導。
1" " "商業(yè)數(shù)據(jù)分析崗位人才需求特征分析
1.1" "數(shù)據(jù)來源與數(shù)據(jù)預處理
本研究以“商業(yè)數(shù)據(jù)分析”為關鍵詞,利用Python從智聯(lián)招聘網(wǎng)站爬取了全國50個重點城市(包括一、二線城市和省會城市)的招聘信息,最終獲得1 046條數(shù)據(jù)。每條數(shù)據(jù)主要包括崗位名稱、薪資、工作地點、工作經驗、學歷背景、招聘人數(shù)、崗位職責及任職資格等字段。
1.2" "人才需求基本特征分析
1.2.1" "地域分布
統(tǒng)計所爬取數(shù)據(jù)中的工作地點信息后發(fā)現(xiàn),商業(yè)數(shù)據(jù)分析崗位需求呈現(xiàn)出明顯的地域差異和集聚特征。該崗位主要位于京津冀、長三角、粵港澳大灣區(qū)等經濟發(fā)達地區(qū)和數(shù)字經濟先行城市,其次是湖南省長沙市、湖北省武漢市、四川省成都市等一線內陸城市,而西部和東北地區(qū)的需求較少,如青海省西寧市、黑龍江省哈爾濱市等城市。
1.2.2" "學歷要求
根據(jù)收集的1 046條崗位招聘信息,對學歷要求進行數(shù)據(jù)統(tǒng)計,結果顯示,絕大部分崗位都有明確的學歷要求。其中,本科學歷要求比例最高,達到72.47%;其次為大專,占19.12%;研究生學歷要求相對較低,僅為4.59%;剩下3.82%的崗位要求為高中、中?;虿幌迣W歷。
1.2.3" "工作經驗要求
在工作經驗要求上,分析結果顯示大部分單位都有所要求。其中,要求1年以下工作經驗的崗位占1.72%;要求1~3年工作經驗的崗位占比最高,達到31.36%;要求3~5年工作經驗的崗位占28.68%;要求5~10年工作經驗的占10.23%;要求10年以上工作經驗的崗位占0.57%;僅27.44%的崗位對工作經驗無要求。
2" " "基于文本分析法的商業(yè)數(shù)據(jù)分析人才能力需求分析
為深入了解企業(yè)對商業(yè)數(shù)據(jù)分析人才的專業(yè)能力和通用能力的需求特點,本文分別提取了崗位職責數(shù)據(jù)中集中代表專業(yè)能力的關鍵詞和任職資格數(shù)據(jù)中集中代表通用能力的關鍵詞,并進行了詞頻統(tǒng)計。
2.1" "專業(yè)知識
本研究采用Python的jieba庫對崗位職責數(shù)據(jù)進行分詞處理,并使用自然語言處理工具包(Natural Language Toolkit,NLTK)庫進行詞頻統(tǒng)計和排序。結果顯示,專業(yè)知識類關鍵詞排名前三的分別是數(shù)據(jù)分析(784次)、數(shù)據(jù)處理工具(366次)和數(shù)學(342次),其次是統(tǒng)計學、計算機、數(shù)據(jù)庫等。這說明數(shù)學和統(tǒng)計學知識是數(shù)據(jù)分析的理論基石,而數(shù)據(jù)處理工具的運用是重點考查要素。此外,計算機、數(shù)據(jù)庫等信息技術(Information Technology,IT)類知識的高頻出現(xiàn),反映出當前商業(yè)數(shù)據(jù)分析與信息技術應用已經緊密結合。
2.2" "能力要求
對任職資格數(shù)據(jù)集進行相同的分詞和詞頻分析后發(fā)現(xiàn),在能力要求方面,協(xié)調能力(757次)位列榜首,說明商業(yè)數(shù)據(jù)分析通常涉及多部門、多角色協(xié)同;邏輯分析能力(498次)和理解能力(300次)受到高度關注,反映出此類工作需要縝密的邏輯思維和敏銳的商業(yè)洞察力;學習能力(314次)、溝通能力(248次)、執(zhí)行能力(240次)、表達能力(147次)、抗壓能力(131次)等也是用人單位普遍關注的軟實力。
2.3" "專業(yè)工具和技能
對數(shù)據(jù)集中的專業(yè)工具和技能關鍵詞進行統(tǒng)計(見表1),結果顯示,Python和R語言是目前數(shù)據(jù)處理與分析軟件類別中最主要的兩個類型,接著是SPSS、Tableau、SAS和MATLAB等,這說明Python和R語言已經是當前商業(yè)數(shù)據(jù)分析領域的主流數(shù)據(jù)處理工具。
在數(shù)據(jù)庫類型中,MySQL和Oracle位居前列,表明關系型數(shù)據(jù)庫管理系統(tǒng)仍是當前主流。但Hive等大數(shù)據(jù)處理工具的興起,說明非結構性數(shù)據(jù)的處理日益重要。
在企業(yè)辦公軟件類別中,Excel的使用最為廣泛,PPT和Office次之,而Word、ERP和Visio較少。這反映出在企業(yè)數(shù)據(jù)處理、可視化展示等方面,分析師更多地依靠Office辦公軟件。
2.4" "主題分類
本文采用LDA主題分類法,借助Python中的sk-learn包對數(shù)據(jù)實現(xiàn)文檔主題分類,對文本信息進行主題劃分,并計算不同主題數(shù)的困惑度值,在困惑度值最小處取得最佳主題數(shù)為3個[5]。隨后將生成的每個主題下的概率最大的25個詞進行整理并歸納,總結出最符合業(yè)務能力與綜合素質、專業(yè)基礎與個人特質、數(shù)據(jù)分析技術與工具3個主題的中心思想(見表2)。
主題1聚焦業(yè)務能力與綜合素質,涉及對業(yè)務理解、團隊協(xié)作、邏輯思維等的要求,如業(yè)務、團隊、合作、邏輯、運營等。商業(yè)數(shù)據(jù)分析師需要對所在行業(yè)和公司的業(yè)務有深刻的理解,具備敏銳的商業(yè)洞察力,同時要有很強的團隊協(xié)作意識,善于統(tǒng)籌各部門開展數(shù)據(jù)分析項目。
主題2對應專業(yè)基礎與個人特質,一方面強調了數(shù)學、計算機等專業(yè)知識和各類數(shù)據(jù)處理和辦公軟件工具的運用;另一方面,重視責任心、抗壓能力、時間管理意識,并對文字表達能力、細心等方面有一定要求。此外,年齡、學歷也是企業(yè)關注的個人因素。
主題3反映了商業(yè)數(shù)據(jù)分析崗中的數(shù)據(jù)分析技術與工具,包括SQL、Python等編程語言,MySQL等主流數(shù)據(jù)庫,數(shù)據(jù)挖掘技術和機器學習算法,數(shù)據(jù)倉庫,以及數(shù)據(jù)可視化、自動化報表等。同時強調對前沿技術發(fā)展的關注,要不斷優(yōu)化模型。
3" " "商科專業(yè)學生數(shù)據(jù)分析崗位適應度調查分析
為了解商科專業(yè)學生對數(shù)據(jù)分析崗位的適應程度,本文以廣西民族大學商科專業(yè)學生為調查對象,調查內容涵蓋學生基本情況、數(shù)據(jù)分析認知與經歷、數(shù)據(jù)分析工具使用、自評數(shù)據(jù)分析能力、數(shù)據(jù)分析關鍵因素認知、數(shù)據(jù)使用規(guī)范意識、數(shù)據(jù)隱私保護意識、數(shù)據(jù)分析與專業(yè)相關性認知等8個方面。共發(fā)放問卷220份,回收有效問卷195份,經過相關統(tǒng)計分析獲得以下信息。
在數(shù)據(jù)分析經歷上,44.1%的學生有過數(shù)據(jù)分析比賽經驗,83.08%的學生首次接觸數(shù)據(jù)分析是在大學課堂上。這說明學生接觸數(shù)據(jù)分析的主要途徑是學校教育,課外自主學習的比例相對較低。
在數(shù)據(jù)分析工具使用上,絕大部分學生(92.82%)使用過Excel,54.36%和46.67%的學生分別使用過SQL和SPSS,而Python(17.95%)、R語言(6.15%)等工具的使用率低。由此可以看出,學生主要使用的是針對結構化數(shù)據(jù)的傳統(tǒng)工具。
在數(shù)據(jù)分析能力自評方面,77.44%的學生認為自身數(shù)據(jù)分析能力一般,19.49%的學生表示自己完全沒有數(shù)據(jù)分析能力。另外,56.92%的學生對數(shù)據(jù)分析的基本流程不太了解,13.85%的學生則完全不了解。因此,目前學生普遍認為自身數(shù)據(jù)分析能力有待提高,對基礎概念和分析流程認知不夠全面。
在數(shù)據(jù)使用規(guī)范與隱私保護意識上,54.87%的學生一般會對數(shù)據(jù)進行標注,35.9%的學生經常進行標注,這說明大部分學生對數(shù)據(jù)使用規(guī)范有一定認知,但遵守的比例還不夠高。收集數(shù)據(jù)時,56.41%的學生每次都會征求他人同意,這說明多數(shù)學生能夠意識到隱私保護的重要性。在數(shù)據(jù)處理過程中,47.18%的學生只注重保護基本隱私,這說明學生對數(shù)據(jù)隱私保護的重視程度需要提高。
在數(shù)據(jù)分析與專業(yè)相關性認知方面,74.87%的學生認為提高數(shù)據(jù)統(tǒng)計分析能力對自身專業(yè)非常重要,說明絕大多數(shù)學生認識到了數(shù)據(jù)分析能力與專業(yè)的高度相關性。
4" " "結論與建議
4.1" "結 論
本文對商業(yè)數(shù)據(jù)分析崗位的需求特征進行研究,發(fā)現(xiàn)該類崗位的工作地點集中于京津冀、長三角、大灣區(qū)等經濟發(fā)達地區(qū)和數(shù)字經濟先行城市,偏好本科學歷和1~3年相關工作經驗。在專業(yè)知識上,重視數(shù)學、統(tǒng)計學等理論基礎,數(shù)據(jù)處理工具的運用以及數(shù)據(jù)庫管理技能。在能力上,協(xié)調能力、邏輯分析能力等綜合素質不可或缺。主題分類結果進一步顯示,業(yè)務能力與綜合素質、專業(yè)基礎與個人特質、數(shù)據(jù)分析技術與工具是企業(yè)關注的三大核心要素。問卷調查反映,大部分商科學生對數(shù)據(jù)分析基本概念和流程缺乏系統(tǒng)認知,實踐經驗少,規(guī)范使用數(shù)據(jù)和隱私保護方面等也需提高。
4.2" "人才培養(yǎng)建議
4.2.1" "夯實數(shù)學統(tǒng)計等理論基礎,提升專業(yè)基礎能力
數(shù)學、計算機是商業(yè)數(shù)據(jù)分析的基礎,文本分析結果反映出用人單位對此有很高要求,但大部分學生相關基礎理論知識薄弱,對數(shù)據(jù)分析概念和流程的認知不足。對此,建議高校增加商科專業(yè)的數(shù)學、統(tǒng)計學等核心基礎課程的學時,確保學生掌握數(shù)據(jù)分析基礎知識。同時,可以結合數(shù)據(jù)分析案例進行滲透啟發(fā)式教學,帶動學生發(fā)現(xiàn)問題、分析問題,增加實操環(huán)節(jié),讓學生動手使用常見的數(shù)據(jù)分析工具。
4.2.2" "更新課程設置,掌握前沿分析技術
目前,學生主要使用傳統(tǒng)工具處理結構化數(shù)據(jù),對數(shù)據(jù)挖掘、機器學習等前沿技術的掌握程度有限。對此,高校應及時更新商科專業(yè)的課程內容,開設大數(shù)據(jù)分析、機器學習等新興課程,同步引入Python、R語言、Hive等熱門或新興的分析語言和工具。在課程上引入更多前沿動態(tài),鼓勵學生參加課外學術講座,保持前沿知識的輸入。
4.2.3" "加強實踐鍛煉,提升業(yè)務理解能力和綜合素質
從前述分析可以看出業(yè)務理解能力、團隊協(xié)作、邏輯思維等綜合素質是企業(yè)較為重視的能力,但目前學生實踐經歷較少,使用數(shù)據(jù)分析思維解決實際問題的能力較差。對此,高校應增加實踐教學環(huán)節(jié)的比重,鼓勵學生參加相關競賽實踐。另外,與企業(yè)建立合作關系,為學生提供真實的商業(yè)數(shù)據(jù)分析項目。同時,課堂教學中注重案例分析、小組合作等形式,鍛煉學生的邏輯思維、溝通協(xié)調等通用能力。
4.2.4" "重視數(shù)據(jù)道德教育,增強規(guī)范和隱私保護意識
調研發(fā)現(xiàn),部分學生對數(shù)據(jù)使用規(guī)范和隱私保護的重視度不足。對此,高校在人才培養(yǎng)過程中應加強數(shù)據(jù)道德教育,增設相關課程,從理論和實踐兩方面增強學生的數(shù)據(jù)使用規(guī)范與隱私保護意識。理論方面,可采用考試的方式,鞏固學生對數(shù)據(jù)使用準則、隱私法規(guī)的掌握程度。實踐環(huán)節(jié),可以通過組織討論違規(guī)案例、參與科研等方式,使學生切身體會保護隱私的重要性。
主要參考文獻
[1]黃崑,王凱飛,王珊珊,等.數(shù)據(jù)類崗位招聘需求調查及對圖情學科人才培養(yǎng)的啟示[J].圖書情報知識,2016(6):42-53.
[2]張俊峰,魏瑞斌.國內招聘類網(wǎng)站的數(shù)據(jù)類崗位人才需求特征挖掘[J].情報雜志,2018(6):176-182.
[3]古揚,呂斌.國內信息分析師職業(yè)需求結構研究:基于招聘網(wǎng)站信息的挖掘分析[J].情報探索,2018(7):41-47.
[4]薛潔,王嫻,籍艷麗.大數(shù)據(jù)時代數(shù)據(jù)類崗位人才需求特征分析[J].黑龍江高教研究,2022(10):119-124.
[5]趙凱,王鴻源.LDA最優(yōu)主題數(shù)選取方法研究:以CNKI文獻為例[J].統(tǒng)計與決策,2020(16):175-179.