王琳 江雨薇
(1.杭州電子科技大學中國科教評價研究院,杭州,310018;2.中國農業(yè)大學文獻情報中心,北京,100083)
當前,在科學繁榮發(fā)展和科研環(huán)境不斷改善的良好勢頭背后,作為科技創(chuàng)新基石的科研誠信卻時有問題發(fā)生,引發(fā)各界關注。美國伯爾曼的數據偽造事件[1]、日本理化研究所小保方晴子的論文撤稿事件[2]、韓國首爾大學的黃禹錫事件[3]、中國工程院院士李連達團隊的科研論文造假事件[4]等學術丑聞將科研誠信的治理推到幕前,防治科研不端成為學界、政界和公眾共同關注的焦點。科研活動的進行是一個動態(tài)的過程,科研誠信問題可能出現在這個過程中的任何一個環(huán)節(jié)中,因此,我們需要全方位、多角度、全過程地對科研誠信問題進行治理。
目前,政界和學界通常采用“違背科研道德”“違背學術道德”等負面詞語定義科研誠信[5-8]。2019年10月,科技部等發(fā)布的《科研誠信案件調查處理規(guī)則(試行)》中將科研不端行為定義為個人學術信息造假、剽竊科研成果、偽造實驗數據、人體研究中侵犯隱私權或知情同意權、違反實驗動物保護規(guī)范等違反科學共同體公認的科研行為準則的行為。中共中央辦公廳、國務院辦公廳印發(fā)的《關于進一步加強科研誠信建設的若干意見》和《關于進一步弘揚科學家精神加強作風和學風建設的意見》更是從頂層對科研誠信治理提出了制度設計。當前,學術界、政界對于科研誠信定義及治理政策等學術視角下的研究已經較為成熟,但從公眾視角下運用量化方法和實證方法探究其對科研誠信態(tài)度和看法的相關研究卻十分缺乏。國家發(fā)展改革委、科技部等41個部門和單位于2018年11月聯(lián)合頒布的《關于對科研領域相關失信責任主體實施聯(lián)合懲戒的合作備忘錄》中強調,將科研誠信建設納入“社會信用體系”,把防治科研不端與社會及公眾緊密相連,凸顯了公眾參與科研誠信治理的重要性。鑒于此,本文以知乎平臺為例,運用共詞分析和文本情感分類等方法,探究社交媒體環(huán)境下公眾對科研誠信的認知和評價,為科學知識的有效傳播,加強公眾對科研的信任,充分發(fā)揮公共媒體、社會輿論對科研的宣傳和監(jiān)督作用提供一定參考,并基于研究結果提出公眾視角下我國科研誠信治理和建設的路徑。
當前,已有學者對科研人員和學生等群體的科研誠信認知進行了研究。王爽等人運用問卷調查法探究了醫(yī)學科研人員的科研倫理認知,研究結果表明科研人員對科技倫理的主動性及規(guī)范化的實施性有待進一步加強[9];基于以上研究,何光喜等人進一步分析了我國醫(yī)學科研人員對科研倫理的態(tài)度。他們發(fā)現醫(yī)學科研人員的客觀知識水平不容樂觀,而且正規(guī)化培訓渠道不足,此外,大多數人對遵從科研倫理規(guī)范持積極態(tài)度,但也有部分人持消極態(tài)度,認為違反科研誠信的現象時常發(fā)生[10]。與趙延東等人在2012年的研究相比[11],科研人員對科研道德和學術規(guī)范的認知程度顯著提高,對遵從科研誠信規(guī)范的態(tài)度也有了積極轉變。除了科研人員之外,李睿婕等人以博士生為研究對象,探討了他們對學術不端行為的態(tài)度、評價及變化趨勢,研究發(fā)現,相比于2007年和2016年,我國博士生對學術不端行為的容忍度明顯降低[12]。此外,有學者提出了“公眾評議”的概念,它主要是指公眾對科研工作者的職業(yè)道德、科學研究帶來的社會影響,科學研究本身的一些方法和結論及科研體制、權力干預等科學研究的外部因素等進行評議[13]。它和“專家評議”“同行評議”的區(qū)別在于其評議主體是公眾,且是一種借助公眾輿論力量的非制度化參與方式。公眾參與科研評議有利于監(jiān)督科研的“價值”,厘清科研的“事實”,改變科研的“治理機制”[14]。Smolak等人的研究發(fā)現亞洲公眾對科研倫理的關注度較低且與教育程度呈正相關,該研究強調了從社會視角探究倫理在科學研究中的重要性[15]。
隨著移動互聯(lián)網技術的迅猛發(fā)展和智能手機的大力普及,輿論對于科研誠信問題的敏感性逐步上升,輿論中呈現出明顯的公眾集群現象和負面情感傾向。因此,大量學者利用情感分析和自然語言處理等方法對網絡輿情進行了較為深入的研究。例如針對“雪鄉(xiāng)事件”“石首事件”等,研究人員基于不同社交媒體平臺,對公眾評論中的情感態(tài)勢進行了探究[16-17]。還有學者構建了公眾群體的負面情緒模型,為網絡輿情演變過程中不同政府響應措施下公眾群體行為決策規(guī)范的探究和預測提供了參考[18]。
綜上所述,政界、學界對于科研誠信的認知與評價研究都已經相對成熟。隨著網絡平臺的不斷發(fā)展,公眾也對科研誠信這一話題越來越敏感,政策關注度和輿論關注度也在逐漸上升。目前,已有研究對學生、科研人員等群體的科研誠信認知和網絡輿情中公眾的情感態(tài)勢進行分析,但鮮有研究基于公眾視角對科研誠信的認知和評價進行探究。許多研究表明,公眾參與科學研究的意愿越來越強烈[19-21],而科研誠信是科學研究的基礎。因此,探究公眾對科研誠信的認知與評價對科學知識的傳播和科研誠信的治理具有重要意義。
本文首先以“學風建設”“科研誠信”等為主題檢索的關鍵詞在知乎平臺上獲取實驗數據,然后通過使用Python軟件編寫代碼爬取知乎問答社區(qū)中主題和科研誠信一致的所有問題和回答,再基于停用詞表,使用pkuseg分詞對爬取到的回答進行中文文本分詞,最后將分詞后的結果存入文件中進行共詞分析和文本情感分類。本研究的研究框架如圖1所示。
圖1 研究框架Fig.1 Research Framework
在文本預處理階段,結合哈工大停用詞、百度停用詞等詞庫過濾掉停用的詞語,使用pkuseg預設的網絡用語詞典對過濾后的數據進行分詞處理,pkuseg提供了不同領域的訓練模型,它的簡單易用和領域細分的特性有效提高了分詞的準確度。剔除掉形容詞、介詞等無意義的詞語,以減少無關詞語的影響。最終,基于詞義對詞匯進行規(guī)范化處理得到分詞結果。
在使用SVM進行文本情感分類的過程中,由于計算機無法直接識別字符串,需要將其轉換為數字表示的向量形式。本文用TF-TDF(詞頻-逆向文件頻率)來提取關鍵詞和計算關鍵詞的權重,它可以通過篩選掉經常使用的詞語從而留下有價值的詞語。為了更好地解決傳統(tǒng)文本情感分類中只有正向、負向及中性的三分類問題,本文根據肖樂等人提出的基于情感詞典的七分類文本情感分析,將文本情感分為樂、好、怒、哀、懼、厭惡、驚及中性等八類[22]。
共詞分析是一種成熟的科學計量方法,它能夠改善傳統(tǒng)文本挖掘方法中無法顯示詞語之間關聯(lián)的缺點,建立詞與詞之間的共現關系,客觀清晰地映射出詞與詞之間的緊密程度及它們所表示的文本主題之間的關系[23]。詞之間的頻數是基于共詞矩陣體現的,而它們之間的緊密程度則是基于共詞網絡圖中不同距離的節(jié)點來體現的[24]。在形成共詞矩陣之后,采用ucinet軟件生成共詞網絡圖并進行可視化呈現。
以知乎學術平臺為例,在對文獻進行仔細研讀后確定了“學風建設”“科研誠信”“學術不端”“抄襲”“造假”“科研不端”“學術道德”“篡改”“剽竊”“一稿多發(fā)”10個關鍵詞作為科研誠信檢索的主題詞,對每個關鍵詞下的主題內容進行人工判斷和篩選,剔除掉與“科研誠信”主題無關的問題。截至2021年2月21日,筆者一共爬取了知乎平臺問答社區(qū)中140個相關主題下的20,518條回答,使用pkuseg對過濾清洗后的知乎文本進行分詞并統(tǒng)計詞頻。結果顯示,“論文”在知乎文本中出現5,631次,詞頻達到1.05%,位于首位;“造假”“實驗”“重復”“院士”等詞也出現較多,詞頻均超過0.5%;“饒毅”“舉報”“調查”“裴鋼”等也是公眾評論中較常出現的詞語,出現頻率均在1,000次左右;相比于“造假”“重復”等常見的科研不端行為,“抄襲”出現的頻率則較低,共出現653次,詞頻為0.12%;“翟天臨事件”雖然已經過去了一年左右,但是隨著其他科研不端事件的爆出,“翟天臨”“畢業(yè)論文”等相關詞語又重新活躍在公眾認知與評價中。
基于詞頻統(tǒng)計表,剔除掉無實際意義且與本研究相關的主題詞,如“簡單”“估計”“不用”“科研”“學術”“科研誠信”等。根據普賴斯定律,本研究取前66個高頻詞進行共詞分析,設定閾值為6并進行聚類分析,得到共詞網絡圖(見圖2)。分析發(fā)現,公眾主要關注科研不端行為、科研不端舉報調查、科研不端預防監(jiān)督及科研誠信教育四個方面的科研誠信問題。
圖2 共詞網絡圖Fig.2 Co-word Network Diagram
(1)科研不端行為:該類團中的詞語包括“論文”“院士”“造假”“實驗”“教授”等,它們出現在共詞網絡圖的中心位置且節(jié)點較大。“實驗”與“造假”、“數據”與“重復”這四個詞語兩兩之間的關聯(lián)性很強,結合爬取出來的評論可以發(fā)現,“實驗不可重復”和“數據造假”是公眾認知中科研不端行為的兩種常見表述。從中央和各部委頒布的文件來看,“抄襲”“剽竊”“造假”等是科研不端行為的表現形式。公眾在知乎平臺上的評論中反復地使用“實驗”“造假”“數據”和“重復”這四個詞語來進行表達,表明公眾對科研不端行為的表現形式雖然有一定的認知,但是了解得不夠深入。
(2)科研不端舉報調查:該類團中的詞語包括“饒毅”“院士”“教授”“舉報”“調查”“委員會”等?!梆堃闩e報院士學術造假”等話題掀起了輿論的高度關注,圖中顯示上述詞語出現頻率較高且有著緊密聯(lián)系。結合公眾評論,可以發(fā)現大部分公眾對教授和院士等科研人員抱有較高的期望,認為他們可能更注重學術誠信相關規(guī)范的遵守以及更傾向于對不端案例進行舉報。信任是公眾理解科學的基礎,也是科學研究和科學知識傳播的基礎,當科研不端行為的案例被公開時,大部分公眾仍然會選擇相信科研工作者并肯定他們對科學研究的貢獻和對社會的積極影響[25]。同時,公眾對學術委員會、學術道德委員會等相關機構的調查處理過程和結果也十分關注。
(3)科研不端預防監(jiān)督:該類團中的詞語包括“學校”“學生”“畢業(yè)”“老師”“成果”等。2019年2月“翟天臨事件”之后,教育部進一步規(guī)范了對全國高校畢業(yè)生學位論文質量的控制,對學術不端行為給予了高度重視。隨著其他科研不端事件的出現,本科、碩士、博士學位論文的規(guī)范又一次引起公眾討論。“學?!薄袄蠋煛薄皩W生”出現頻次較高且存在一定程度的聯(lián)系,學校和教師在科研誠信的預防和監(jiān)督過程中起著較大作用,學校一系列科研誠信政策的出臺對科研不端行為起著警示作用。還有研究表明,當教師缺乏監(jiān)督導致其學生的不當行為時,教師將承擔連帶責任并受到懲罰[26]。
(4)科研誠信教育:該類團中的詞語包括“教育”“陳銘”“北大”“孩子”等。近些年我國科研誠信建設取得了一定成效,但主要側重事后管理,忽略了事前對科研誠信的教育和防治管理[27]??蒲姓\信教育是預防和治理科研不端行為的重要途徑,然而該主題下關鍵詞的詞頻較低,從一定程度上說明公眾視角下科研誠信教育也沒有得到足夠的重視。因此,無論是對政界、學界還是公眾,科研誠信教育宣傳及工作均有待加強完善。
本文首先抽取了10%的文本,即2,002條回答,進行了人工標注作為訓練集。參加標注的人員一共有三位,除了本文的兩位作者之外,還邀請了一位具有圖書情報背景的專業(yè)人員。三人分別對訓練集進行情感傾向標注,然后從三組標注中選取最多的情感傾向賦予每條評論,文本情感分類結果如下圖3所示,標注依據及示例如表1所示。將所有的知乎文本輸入到分類器中得到每條回答的文本情感分類,分類后的結果如表2所示。為了對文本情感進行進一步探究,筆者對每一類情感下的文本做了詞頻分析,將不同情感文本下的詞與共詞分析中的高頻詞進行匹配,從而對共詞分析中的高頻詞賦予不同的情感,形成如圖4所示的共詞網絡圖。若高頻詞同時出現在兩個或兩個以上情感文本中,則累積情感。
表1 人工標注依據示例Table 1 Examples of the Basis for Manual Annotation
圖3 人工標注結果Fig.3 Artificial Marker Sample
觀察表2可以發(fā)現:情緒“哀”的占比高達63.67%,其次是“厭惡”(占33.10%),再次是“怒”(占1.66%),后面依次是中性、“好”“驚”“懼”“樂”等情緒,這五類情緒的占比都較少?!鞍А薄皡拹骸薄芭钡蓉撁媲榫w的占比高達98.43%,表明大部分公眾對科研不端行為持反對態(tài)度。白新文等人的研究結果顯示我國科研工作人員不管在何種歸因下對科研不端行為均持反對態(tài)度,這表明無論是科研工作者還是普通公眾,都是極力反對科研不端行為的[28]。
表2 文本情感分類Table 2 Text Sentiment Classification
由圖4和每類情感下的詞頻分析可以看出,“論文”是出現頻率最高的詞匯,它在情緒“哀”“懼”“怒”中的詞頻較高,表明公眾對現階段論文中科研誠信的問題主要呈現出悲哀和畏懼的情緒,一方面是對我國科研誠信的建設成果表示失望,另一方面是對我國未來科研誠信的發(fā)展表示不確定;“造假”和“實驗”兩個詞在各種情緒中的詞頻由高到低依次是“怒”“厭惡”“哀”,與此同時,“數據”“重復”和“抄襲”在“怒”情緒中的詞頻也是最高的,表明公眾對實驗不可重復、數據造假和抄襲等科研不端行為感到十分憤怒。“怒”還體現在“圖片”“誤用”等表述上,結合爬取的數據,可以看出公眾對中科院科研道德委員會公布的圖片誤用調查結果非常不滿意。此外,有相當一部分公眾對科研失信案例調查的公開程度表示失望,強烈要求科技部等政府相關部門公開科研不端案例的詳細調查過程及懲罰措施,這也是圖4中“調查”和“公開”兩個詞語表現出“怒”和“哀”情緒的原因;與“翟天臨”一詞不同,公眾對“曹雪濤”這一詞語表現出更多“驚”的情緒且“院士”“教授”這兩個詞語在“怒”中的詞頻最高,說明公眾對非科研人員學術不端行為更多地表現出厭惡的情緒,而認為“院士”“教授”等高層次科研人員不應該出現學術不端行為,因此呈現出驚訝和憤怒的情緒。國內外的研究表明,公眾通常對科學家給予了高度的信任[27],趙延東等人在對新冠肺炎疫情期間公眾對科學家的信任及其影響因素研究中發(fā)現,疫情期間我國公眾對科學家給予了高度信任,而且個人的價值觀、信息獲得等因素都會對科學家的信任產生影響[29]。
圖4 基于文本情感分類的共詞網絡圖Fig.4 Co-word Network Diagram Based on Text Sentiment Classification
中性情緒的占比為0.80%,也占了剩下情緒中的一小部分比重,如“SCI 不能一概而論定價”“不猜測,靜等結果”“不捧殺,不站隊,客觀看待”等言論,圖4 中的“群眾”“團隊”“陳銘”“饒毅”等詞語中也體現出中性的情感,這些公眾在回答問題時更偏向于陳述客觀事實,并沒有表現出明顯的情感傾向,他們更傾向于站在中立的角度去評價科研不端案件,陳述他們對科研誠信的相關認知和評價,而不是帶有主觀情緒地去批評或褒揚某次輿論事件。這也從一定程度上反映了知乎上存在較高學歷和對科研誠信認知較為完整的一群人,他們在評論一些事情時會保持清醒和冷靜。
從文本情感分類結果來看,有極少數人對科研誠信持“樂”或“好”的正面情緒,如“我們國家近幾年在科研誠信治理方面已經取得了一些成就”“支持饒毅,真正的國士!”等,我們可以發(fā)現,圖4中“支持”和“舉報”兩個詞語呈現的都是“好”的情緒,“饒毅”一詞體現出的情感有“樂”“好”“哀”及中性,其中“樂”與“好”的占比最大,說明大多數公眾對饒毅學術不端舉報一事持支持態(tài)度,同時也有人對饒毅舉報后的事業(yè)和生活表示擔心。他們并不是學術不端的縱容者,這樣的回答在很多時候并不是針對問題本身,而是以一種積極的態(tài)度去看待科研誠信的建設與發(fā)展,對科研人員和科學研究給予更多信任。
總體上看,公眾對科研誠信的認知與評價呈現出以下三個特點。
(1)評論內容單一,對科研誠信認知不足
由上述分析可知,公眾對科研誠信概念、科研失信行為表現形式的認知十分缺乏,反復使用“數據”“實驗”“造假”和“重復”來表達科研不端行為。公眾對科研誠信的認知只停留在表面,對科研誠信政策、科研誠信相關研究了解較淺,對科研誠信等相關概念的實質性內容關注不夠。此外,公眾對政府及相關科研機構部門存在著一種整體性認知的現象,他們將政府機構與非政府機構均視作一體,這種混同一談導致出現負面消息時,公眾會產生“院士大都是互相提名上去的”等相關言論和認識,從而大大降低政府回應及處理的可信度。
(2)價值基調正向,對科研人員給予肯定和信任
結合以上數據分析結果表明,公眾對科研誠信的認知雖然存在一定的不足,但是整體價值基調是正向的,能夠給予科研人員高度的信任和肯定。從公眾科研誠信認知來看,大部分公眾比較信任教授、研究員、院士等科學家或科研工作者,他們認為科研人員是學術不端行為的有效監(jiān)督群體之一;從公眾科研誠信情感來看,許多公眾對教授或院士出現科研不端行為表現出“驚”的情緒,他們對此表示驚訝和懷疑,但是在“饒毅舉報事件”中他們又呈現出支持和贊同的情緒,這表明公眾對科學和科研人員的信任度較高。
(3)社會對科研不端高度關注,并持負面批評態(tài)度
由于本文數據采集策略及知乎上多是對科研失信行為的話題討論,因此絕大多數回答表達的都是對事件相關主體的諷刺、批判和嘲笑,同時也體現出社會輿論氛圍對科研不端行為的高度關注。從上述分析可以看出,“科研不端”這個話題往往不僅受到公眾的高度關注,還可能隱含各種敏感的社會問題。例如,在“翟天臨事件”中,許多公眾認為當前學位論文查重和學位授予嚴格性與翟天臨密切相關;在“曹雪濤院士事件”和饒毅舉報3位科學家學術造假中,公眾對“院士”“科學家”“女博士”“師妹”等身份尤其關注,反映出背后隱含的輿論對學術環(huán)境的關切。輿論的關注度可能會隨著科研不端與已有社會問題的結合而不斷上升,公眾的情緒也可能會更加激烈。
(1)加強對公眾科研誠信宣傳教育,保障科學知識有效傳播
近些年來,政府出臺了許多關于科研不端懲處的政策,對科研不端治理起到了重要作用。但從本文的共詞分析結果可以發(fā)現,公眾視角下科研誠信教育卻沒有得到足夠的重視。公眾的認知與評價是間接參與和監(jiān)督科研誠信的一種方式,公眾作為主要監(jiān)督群體之一,應對科研誠信相關知識有全面深刻的認識,避免產生片面或不正確的言論。中央和各部委應該加快出臺對公眾科研誠信宣傳教育的有關政策,各地方部門應該持續(xù)關注中央政策并盡快落實落地。2021年7月14日,由愛思唯爾和中國科學技術信息研究所舉辦的“科研誠信”高端研討會中強調,要幫助公眾進一步認識和理解科研誠信[30]。加強對公眾的科研誠信宣傳教育,不僅可以減少不正當言論的產生,降低不良輿論的影響,還可以保障科學知識在社會公眾間的有效傳播。
(2)完善學術不端案例公開制度,提升公眾對科研的信任
由文本情感分析結果可知,“調查”和“公開”二詞均呈現出“怒”和“哀”的情感,其中有相當一部分公眾強烈要求科技部等政府相關部門公開科研不端案例的詳細調查過程及懲罰措施。得當的案例公開信息便于我國更好地積累經驗,也是良好的教育和預防途徑。此外,公眾還可以通過完整的公開案例信息更全面地了解到學術不端事件詳細的來龍去脈,更好地建立起對科學研究和科學家的信任。目前我國對于案件的公布內容僅包括案件概要和處罰措施,可以借鑒日本經驗,在“小保方晴子事件”發(fā)生后,文部科學省會增強了對科研誠信治理的透明度,對案件的發(fā)生原因進行探究與陳述,并針對發(fā)生原因進一步指明今后針對此類問題可以采取的預防措施,從而促進了日本科研誠信的治理與建設[31]。完善案例公開制度,可以避免在社會各界之間產生信息不對等的問題,加強公眾對科研的信任程度,提高科研誠信治理的有效性。
(3)形成官方與相關部門的聯(lián)合調查和回應力量,充分發(fā)揮公共媒體、社會輿論對科研的宣傳和監(jiān)督作用
本研究數據分析結果顯示,“科研誠信”話題在很多時候并不是單獨受到關注,而是和某些社會敏感問題一起出現且涉及多個部門。正是因為學術不端事件和敏感的社會問題相結合,又涉及高校和科研院所等部門,才導致輿論對此關注度很高,公眾的情緒也愈發(fā)高漲。因此,官方在回應和處理此類問題時應與相關部門形成聯(lián)合力量,避免由于回應不及時、處理不到位引發(fā)其他次生問題。國家科技主管部門在進行科研誠信治理的過程中,既要得到科研人員的支持和響應,同時也需要獲得社會公眾的理解與監(jiān)督。在著名的“伯爾曼事件”中,美國科研誠信辦公室(ORI)在聯(lián)邦檢察長辦公室的協(xié)助下對民眾看法進行了調查,結果發(fā)現了伯爾曼更加嚴重的學術不端行為[32]。在政府和科研機構的帶頭領導下,公眾與其形成了通暢嚴密的“學術監(jiān)督網”,共同推動科研誠信的治理與發(fā)展。
公眾的認知與評價是一種間接參與和監(jiān)督科研誠信的方式,他們對于科學知識的傳播和科研工作的有效進行起著重要作用。而社交媒體作為公眾和公眾之間信息交流的工具和平臺,它的快速成長逐漸擴大了公眾的知情權和監(jiān)督權。本研究以知乎平臺為例,運用共詞分析、文本情感分類等技術方法對社交媒體環(huán)境下公眾對科研誠信的認知與評價進行了探究,為科研誠信治理和建設提供了參考??傮w上看,雖然公眾對科研誠信的認知程度不同,但是他們對科學研究和科學家給予了高度信任且對科研不端行為持“零容忍”的態(tài)度??蒲姓\信是一項涉及生態(tài)系統(tǒng)中每個人的集體責任,因此,當前需要進一步加強社會各界對科研誠信的認知和理解,推動科研對話和交流,進而促進行動,一方面為建設更加強大的科研群體提供有力支撐,另一方面為增加公眾信任奠定理論基礎。未來的研究可從以下兩個方面展開:一是將微博、微信、博客等社交媒體平臺納入研究中,進一步深化對社交媒體環(huán)境下公眾對科研誠信認知與評價特征的認識,增強研究結果的普適性;二是考慮比較不同時期、不同群體對科研誠信問題的認知與評價,考察不同群體對學術不端行為態(tài)度的發(fā)展趨勢,揭示其變化過程和演變特征。
作者貢獻說明
王琳:提出研究思路,擬定論文框架,修改和審定論文;
江雨薇:設計研究方案,采集與分析數據,論文撰寫。
支撐數據
支撐數據由作者自存儲,E-mail:jiangyw@cau.edu.cn。
1、江雨薇.Originaldata.xlsx.知乎爬取數據.
2、江雨薇.Word frequency.xlsx.分詞詞頻.
3、江雨薇.Sample.xlsx.人工標注訓練集.
4、江雨薇.1.0.xlsx-8.0.xlsx.SVM 文本情感分類結果.