摘 要:以某大學2021-2023年4056份專家評閱意見為研究總體樣本,在全面審視該校碩士學位論文水平實然樣貌后,著重對其中426份不合格論文的評閱意見進行文本語義挖掘與情感價值分析,探討其中蘊含的共性問題。研究結(jié)果表明,科研能力不達標、表述格式不規(guī)范、選題表述不恰當、學術(shù)創(chuàng)新不突出是不合格論文的主要特征。對不合格論文現(xiàn)實問題的解決路徑包括強化科研訓練、培養(yǎng)積極的科研態(tài)度、鼓勵創(chuàng)新思維、加強過程監(jiān)管等。
關(guān)鍵詞:碩士學位論文;專家評閱;不合格特征;改進建議
中圖分類號:G353.1" 文獻標識碼:A" 文章編號:1673-260X(2024)08-0073-06
隨著高等教育進入普及化、大眾化階段,碩士研究生數(shù)量大幅增長,然而由于碩士研究生準入門檻并未提升,甚至有所降低,碩士研究生的科研水平可謂良莠不齊。近年來,國家逐步加大研究生教育質(zhì)量改革步伐,尤其是在2014年出臺了《關(guān)于加強學位與研究生教育質(zhì)量保證和監(jiān)督體系建設的意見》以及《博士碩士學位論文抽檢辦法》,加大了研究生學位論文改革力度,將學位論文質(zhì)量作為衡量高校研究生教育質(zhì)量的重要指標。專家評閱學位論文是對其學術(shù)水平和質(zhì)量的權(quán)威評價,能夠發(fā)現(xiàn)論文中存在的問題和不足,提供有效的改進意見和建議,確保論文的學術(shù)水平和質(zhì)量達到一定的標準。然而,近年來不合格碩士學位論文問題給各高校帶來了一定的負面影響,因此對于不合格論文問題的特征分析顯得尤為重要。在相關(guān)領域內(nèi),李敏等人以詞頻統(tǒng)計為基礎分析了不合格學術(shù)型碩士學位論文的特征[1];常思亮等人采用質(zhì)性研究詞頻統(tǒng)計方法及文獻編碼方法分析了“差評”論文評閱意見[2,3]。近年來文本挖掘及情感分析技術(shù)對于評論類文本的分析方法日趨成熟,張公讓等人通過詞云圖、語義網(wǎng)絡特征關(guān)聯(lián)分析、LDA主題模型的特征分析以及基于語義的情感詞典方法,對十家快遞企業(yè)的客戶評論數(shù)據(jù)進行了情感計算與分析[4];孫建竹通過詞頻提取和特征分析、語義網(wǎng)絡分析、情感分析對某景區(qū)網(wǎng)絡評價文本進行了有效分析[5]。研究采用某大學2021—2023年共4056份專家評閱意見(雙盲審),從中篩選出不合格論文共426份評閱意見進行文本語義挖掘,探究其產(chǎn)生的原因、存在的問題及其對研究生的影響,并提出應對措施和建議,以期為提高碩士研究生的學術(shù)水平和論文質(zhì)量,為高校研究生教育的發(fā)展做出貢獻。
1 論文評閱總體情況
研究數(shù)據(jù)采用某大學2021—2023年碩士學位論文初審的專家評閱數(shù)據(jù),評閱形式為雙盲審。專家評價內(nèi)容分為總評分數(shù)、分項評價檔次、評閱意見等部分。2021—2023年該大學共送審碩士學位論文4056篇次,其中總評分數(shù)未達到合格的論文共426份,占比10.5%。本文以該426篇不合格碩士學位論文的專家評閱數(shù)據(jù)為基礎進行分析。根據(jù)分項評價檔次,學術(shù)型碩士共有選題與綜述、創(chuàng)新性及論文價值、科研能力和基礎知識、論文規(guī)范性四項評價指標,專業(yè)學位碩士共有選題、知識運用與研究方法、研究內(nèi)容、應用性及價值、寫作五項評價指標,評價等級分為“優(yōu)秀”“良好”“一般”“較差”四個等級。對數(shù)據(jù)進行分析,不合格論文各項評價大部分分布在“一般”和“較差”檔次,“優(yōu)秀”檔次基本沒有。學術(shù)型碩士在“選題與綜述”的評價中略好于另外三項,專業(yè)學位碩士則在“選題”的評價中略好于另外三項,其余主要問題集中在創(chuàng)新性、基礎知識、論文規(guī)范性、應用價值、寫作等方面。
2 論文評語文本分析
為了更有效地分析不合格學位論文的具體問題,找出問題存在的原因,有針對性地提出問題論文改進方案,本文擬對426篇問題論文的學術(shù)評語文本依托微詞云文本分析平臺利用詞頻分析、LDA主題模型特征分析和情感詞典分析方法來開展研究。
2.1 詞頻分析
字詞是文本最基本的意義單元,統(tǒng)計文本中用詞的頻次,可以反映與文本主題相關(guān)方面的趨勢和特點[6]。使用中文詞頻分析工具,從426份學術(shù)評閱評語中,共提取2710條語句,總詞數(shù)60157個。采用的基本算法為jieba分詞算法,jieba分詞是一種基于字典匹配和最大匹配法的分詞算法,通過構(gòu)建詞典并綜合考慮正向與逆向最大匹配結(jié)果,實現(xiàn)了對中文文本的有效切分。根據(jù)詞頻分析結(jié)果及TF-IDF計算結(jié)果,選取得到的詞頻表(因篇幅有限,只列出前30條數(shù)據(jù))見表1。TF-IDF通常用來評估某個詞或短語對一個文檔的重要程度,TF-IDF值高,則說明該詞對這個文檔具有較高的重要性[7]。
從表1可以看到,排序前30的詞中包含“研究”“論文”“分析”“作者”等較為中性的詞,作為論文評閱內(nèi)容來講出現(xiàn)這些詞比較正常。另外,“文獻”“理論”“方法”“結(jié)果”“實驗”“表述”“規(guī)范”“綜述”等指向較為明確的詞則體現(xiàn)了評審專家在審閱問題論文時比較關(guān)注的點?!皢栴}”“缺乏”“不夠”等情感描述用詞則說明專家在評閱這些論文時,帶有明顯的否定態(tài)度。
在分析的過程中,還發(fā)現(xiàn)在文本統(tǒng)計詞語的過程中有些專有詞不能直接識別,例如“研究”這個詞在文本中出現(xiàn)了1818次,但相應的“研究方法”“研究內(nèi)容”“研究思路”等需要考察的詞并未體現(xiàn),需要更精準的提取。因此,使用新詞挖掘方法對詞語進一步識別,從文本數(shù)據(jù)中挖掘出具有潛在語義和信息豐富性的新詞匯,為后續(xù)分析做好數(shù)據(jù)準備。新詞挖掘詞表詳見表2。
2.2 基于LDA主題模型的特征分析及情感分析
通過分析可以找出一些專家對論文評價的相關(guān)因素和它們之間的基本關(guān)系,但沒有進一步的挖掘評論內(nèi)容的語義,而主題模型分析是語義挖掘的比較有效的方法。因此,使用LDA主題模型進行進一步分析,這是一種文檔主題生成模型,包含文檔、主題和詞匯三層結(jié)構(gòu),故也被稱為三層貝葉斯概率模型,是眾多主題模型中最方便有效的模型之一[8]。通過加入新詞后的特征詞分析,同時根據(jù)學位論文評價的基本要素,建立了5個主題,分別為:選題與綜述、創(chuàng)新性及論文價值、基本知識與研究方法、論文規(guī)范性、研究內(nèi)容。根據(jù)特征詞含義以及手動篩選將各項評價數(shù)據(jù)分配至不同主題內(nèi),各主題權(quán)重及主要主題詞見表3。
根據(jù)表3的權(quán)重列表中五個方面的權(quán)重其重要性排序依次為:研究內(nèi)容、基本知識與研究方法、論文規(guī)范性、選題與綜述、創(chuàng)新性及論文價值。為了進一步分析各主題文本的情感傾向,通過使用基于情感詞典的中文情感分析算法,采用了文本情感分析方法。情感詞典是一種特殊的工具,用于識別文本中表達的情感色彩。為了更全面地洞察文本中的情感內(nèi)容,進行精準分析,在通用情感詞典的基礎上,從新詞挖掘結(jié)果中選取了部分情感詞,考慮到作為論文評語的實際情況,依據(jù)這些詞的情緒傾向進行了賦值。根據(jù)五個主題進行情感分析,得到結(jié)果如表4所示。
通過五個主題的情緒值占比可以看到,專家對于這五個方面的負面評價占比均為70%以上,正面評價非常少,反映出專家對這些不合格論文普遍不滿,基本沒有正向反饋。其中,選題與綜述部分平均情緒值為-5.86,負面情緒相對偏少,這也與專項評價統(tǒng)計結(jié)果相符。研究內(nèi)容部分情緒值為-11,負面情緒較高,說明在研究內(nèi)容方面專家評價較低,相對應的也是這些論文較為薄弱的部分。
3 不合格論文主要特征分析
對評閱意見的文本內(nèi)容進行情緒價值分析,可以看出有五個主題的負面情緒值占比較高,下面以這五個主題為主要分析維度,深度分析不合格論文主要特征。
3.1 能力特征:科研能力不達標
研究生的科研能力是其從事科研工作的基礎,也是評估碩士教育效果的重要標志。綜合主題和情感分析結(jié)果顯示,研究內(nèi)容、基本知識及研究方法兩個主題的負面情緒值占比最高且評價較低,反映出研究生科研能力的不足是導致論文不合格的主要特征。這種不足體現(xiàn)在多個方面。一是研究定義不清晰。不合格論文在研究問題的選擇和定義上存在缺陷,表現(xiàn)為問題過于寬泛、缺乏明確性或與研究領域不相關(guān)。二是文獻綜述不充分。不合格論文通常未能深入研究領域的文獻,或未能正確引用和引證現(xiàn)有研究,致使研究缺乏堅實的理論基礎。研究方法的不當或不合理也顯著影響論文質(zhì)量。不合格論文常在方法選擇、實驗設計、數(shù)據(jù)采集和數(shù)據(jù)分析方法上存在問題,導致研究結(jié)果的信度和效度不足。數(shù)據(jù)處理和分析的欠缺是另一顯著問題。如數(shù)據(jù)質(zhì)量差、分析方法錯誤或結(jié)果解釋不清晰等。最后,結(jié)論和討論的薄弱也是關(guān)鍵問題??蒲心芰σ笱芯空吣軌驈难芯拷Y(jié)果中得出明確結(jié)論,并將其與文獻綜述相結(jié)合,進行深入討論和推理,不合格論文往往在此方面表現(xiàn)不足,結(jié)論不明確、不一致或無法支持研究問題。
3.2 態(tài)度特征:表述格式不規(guī)范
碩士學位論文的語言表達與格式規(guī)范是衡量作者學術(shù)態(tài)度嚴謹性的重要標尺。作為科學文獻,論文要求語言表達精確嚴謹,以充分體現(xiàn)其學術(shù)性。然而,部分論文在表述和格式方面存在諸多問題,反映出作者態(tài)度上的不足。結(jié)構(gòu)混亂是常見問題,不合格論文往往缺乏清晰的章節(jié)劃分和邏輯順序,導致讀者難以理解主要論點和論證,進而影響論文的可讀性和連貫性。引用和參考文獻格式不規(guī)范也嚴重影響論文質(zhì)量。不正確的引用風格、不完整的引用信息以及未按照規(guī)范格式列出的參考文獻會使讀者思維混亂,削弱論文的學術(shù)嚴謹性。文本排版問題亦不容忽視。不一致的字體和字號、段落間距設置不當、頁邊距錯誤及圖表排列不清晰都會分散讀者注意力,降低論文的可讀性和學術(shù)嚴肅性。語法和拼寫錯誤也是不合格論文的常見特征,這些錯誤不僅分散讀者注意力,還直接影響論文的學術(shù)質(zhì)量和作者的學術(shù)形象。
3.3 方向特征:選題表述不恰當
確定研究主題是學位論文撰寫的首要步驟,涵蓋從問題發(fā)現(xiàn)、明確研究對象范圍到主題解釋與意義反思的全過程,并需要在可研究性、理論意義和現(xiàn)實價值之間取得平衡。對研究生而言,選題不僅要結(jié)合自身的研究能力,還需在廣度和難度上進行適當調(diào)整。然而,部分論文在選題表述上存在諸多問題,反映出作者在研究方向上的不足。研究問題常常不明確或過于寬泛,導致研究范圍和目標模糊,難以深入探討具體議題。選題與研究領域不相關(guān)是另一個突出問題。一些論文選擇的研究課題與作者的專業(yè)領域無關(guān)或相關(guān)性不足,削弱了研究的專業(yè)性和學術(shù)性。選題的重要性未經(jīng)充分論證也是一個常見問題。不合格論文未能充分闡述選題的重要性和研究動機,致使讀者難以理解研究問題的意義和價值。研究目的和假設的不明確進一步削弱了論文的學術(shù)質(zhì)量。研究目的應清晰具體,假設應明確且具有針對性,若表述不清,讀者會對研究的方向和目標感到困惑。
3.4 價值特征:學術(shù)創(chuàng)新不突出
論文的創(chuàng)新性和價值是其構(gòu)建的基石和核心,涵蓋研究思路、內(nèi)容、方法和結(jié)論等多個方面。然而,專家評閱反饋指出,一些論文在學術(shù)創(chuàng)新方面存在明顯不足。研究思路狹窄是常見問題之一。許多論文僅涵蓋非常特定或狹窄的研究問題,未能對更廣泛的領域或相關(guān)問題進行深入探討,這不僅限制了論文的涵蓋范圍,也反映出作者缺乏獨立思考和創(chuàng)新能力,過于依賴導師或前人的研究。結(jié)論深度不足亦是突出問題。不合格的論文在結(jié)論部分通常僅簡單重復研究發(fā)現(xiàn),未能對這些發(fā)現(xiàn)的重要性或意義進行深入分析,缺乏深層次的思考和潛在洞見,甚至未能明確回答研究問題或驗證假設,導致讀者質(zhì)疑研究的目的和意義。此外,研究方法缺乏創(chuàng)新性也是學術(shù)創(chuàng)新不足的表現(xiàn)之一。許多論文僅使用傳統(tǒng)或常見的方法,未能探索新的研究方法或技術(shù),未能展現(xiàn)出對新方法的嘗試和應用。未能提供實際應用價值也是不合格論文的主要特征。不合格的論文在學術(shù)創(chuàng)新方面不足,因為它們未能將研究結(jié)果與實際應用聯(lián)系起來,未能展示研究如何對實際問題或社會產(chǎn)生影響。盡管學術(shù)研究的目標在于增加學術(shù)知識,但其成果也應具有實際應用價值。
4 結(jié)果與討論
研究旨在通過分析同行專家的學位論文評閱評語,深刻了解碩士學位論文撰寫中常見的問題,以便更有針對性地改進碩士研究生的培養(yǎng)和論文指導。通過對不合格論文的特征進行總結(jié)和反思,筆者認為在碩士研究生的培養(yǎng)過程中有以下幾個關(guān)鍵方面需要特別關(guān)注。
碩士研究生應夯實基礎知識,提升科研和實踐應用能力,具體可以通過多方面改進。首先,課程體系應多樣化,涵蓋廣度和深度,分為核心課程和選修課程,以確保學生全面掌握基礎知識。核心課程應強化科學原理、理論框架和方法論等基礎知識的掌握,奠定學科理解的堅實基礎??蒲心芰ε囵B(yǎng)方面,應強調(diào)研究方法的學習與實踐,提升數(shù)據(jù)采集與分析技能,以及學術(shù)寫作和報告的能力。學生應參與研究項目,與導師合作,體驗科研過程。此外,實踐應用能力的提升至關(guān)重要,通過實習、項目合作、實驗室工作和行業(yè)合作等方式,學生能夠?qū)⒄n堂知識應用于實際問題,解決現(xiàn)實挑戰(zhàn)。學術(shù)訓練和獨立思考的培養(yǎng)亦不可忽視,學生需學習撰寫學術(shù)論文、參加學術(shù)研討會,進行批判性分析,從而發(fā)展創(chuàng)新能力和獨立思考能力。最后,持續(xù)反饋和評估機制應貫穿培養(yǎng)過程,確保學生學術(shù)進展,導師應提供及時反饋和建議,助力學生科研和應用能力的不斷提升。
碩士研究生的科研態(tài)度和鉆研精神至關(guān)重要。在培養(yǎng)過程中,應注重學術(shù)榮譽感的培養(yǎng),通過強調(diào)學術(shù)誠信和道德,確保研究生了解并遵守學術(shù)規(guī)范,防止抄襲和作弊行為。還應加強學術(shù)交流和合作,鼓勵學生積極參與學術(shù)研討會、研究小組和交流活動,以拓寬學術(shù)視野,促進師生合作,共同推動科研進展。學校應完善學術(shù)規(guī)范制度和管理,確保學術(shù)誠信和研究道德的遵守,建立規(guī)范化的培養(yǎng)機制,包括研究計劃、定期報告和評估等。最后,鼓勵多樣性和包容性,歡迎不同背景和經(jīng)驗的研究生參與科研活動,營造包容性學術(shù)環(huán)境,促進多樣化的科研方法和觀點交流,提升研究生的自信心和積極性。
高校和導師應鼓勵碩士研究生拓寬研究思維并提供針對性指導。為實現(xiàn)這一目標,高校和導師應緊跟學科發(fā)展趨勢,了解前沿課題和熱點問題,定期參與學術(shù)會議和研討會,以獲取學科發(fā)展的洞察。導師應引導學生探索有價值的研究課題,明確其學術(shù)和實際價值,進行有針對性的研究。高校應制定針對性教育培養(yǎng)計劃,結(jié)合專業(yè)領域特點,提供個性化指導,支持學生在專業(yè)領域發(fā)展研究方向。高校還需提供充足的研究資源,包括圖書館、實驗室設備和科研基金,導師應為學生提供專業(yè)建議和指導,幫助其充分利用學校和學科資源。
堅持過程導向,加強質(zhì)量監(jiān)管,是提升碩士論文質(zhì)量的關(guān)鍵。學校應建立有效的質(zhì)量監(jiān)控體系,明確論文評價標準和體系,確保客觀和一致的質(zhì)量評估。學校應注重中期考核和論文過程指導,通過設立中期評估,對研究進展和論文草稿進行定期審查和反饋,導師應積極參與提供專業(yè)指導,幫助學生糾正問題提升質(zhì)量。學校應提供論文寫作培訓,包括學術(shù)寫作技巧和引用規(guī)范等,提高學生的寫作質(zhì)量和學術(shù)規(guī)范,并提供文獻檢索和數(shù)據(jù)分析工具的技術(shù)支持。最后,學術(shù)委員會和評審機構(gòu)應積極參與論文質(zhì)量評估,提供獨立的意見和反饋,確保論文符合學術(shù)標準和要求,進一步提升論文質(zhì)量。
參考文獻:
〔1〕李敏,陳紅婕.不合格學術(shù)型碩士研究生學位論文的典型特征——基于論文抽檢專家評閱意見的分析[J].學位與研究生教育,2017,34(06):50-55.
〔2〕常思亮,羅小丹,盧堃.“差評”研究生學位論文主要特點鑒別[J].黑龍江高教研究,2019,37(05):107-112.
〔3〕常思亮,歐陽攀園.專業(yè)碩士“差評”學位論文典型特征——基于H省1486份專家盲審評閱書的分析[J].大學教育科學,2021,39(06):41-50.
〔4〕張公讓,鮑超,王曉玉,等.基于評論數(shù)據(jù)的文本語義挖掘與情感分析[J].情報科學,2021,39(05):53-61.
〔5〕孫建竹.基于網(wǎng)絡文本分析的智慧景區(qū)游客滿意度影響因素分析[J].遼寧科技學院學報,2023, 25(03):75-78.
〔6〕冉華.國際視角下學校評估標準的特點與趨勢——基于Nvivo 11.0的編碼分析[J].比較教育研究,2018,40(01):70-77.
〔7〕Shahid N, Ilyas M U, Alowibdi J S. Word cloud segmentation for simplified exploration of trending topics on Twitter[J].IET Software,2017,11(05):214-220.
〔8〕柳位平,朱艷輝,栗春亮,等.中文基礎情感詞詞典構(gòu)建方法研究[J].計算機應用,2009,29(10):2875-2877.