• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      政策文本量化研究的綜述與展望

      2021-02-04 07:50:27鄭新曼董瑜
      現(xiàn)代情報(bào) 2021年2期
      關(guān)鍵詞:政策文本文本分析定量分析

      鄭新曼 董瑜

      摘?要:[目的/意義]政策文本量化是一種新興的跨學(xué)科研究方向。本文從文本數(shù)據(jù)與分析方法融合的角度,系統(tǒng)梳理了政策文本量化研究的最新進(jìn)展,以指導(dǎo)政策文本量化分析實(shí)踐。[方法/過(guò)程]基于文本量化的不同方式,將現(xiàn)有研究方法歸納為政策計(jì)量分析、內(nèi)容分析法和效詞分析法,分別總結(jié)了這些方法的特點(diǎn)、流程及典型應(yīng)用。[結(jié)果/結(jié)論]政策文本量化研究近年來(lái)發(fā)展迅速,集中體現(xiàn)在文本數(shù)據(jù)類(lèi)型拓展、多領(lǐng)域方法遷移與應(yīng)用,其中效詞分析法應(yīng)用逐漸廣泛;未來(lái)應(yīng)關(guān)注政策文本數(shù)據(jù)源和語(yǔ)料庫(kù)建設(shè)以及方法的誤差研究。

      關(guān)鍵詞:政策文本;定量分析;文本量化;文本分析

      DOI:10.3969/j.issn.1008-0821.2021.02.018

      〔中圖分類(lèi)號(hào)〕G203?〔文獻(xiàn)標(biāo)識(shí)碼〕A?〔文章編號(hào)〕1008-0821(2021)02-0168-10

      Abstract:[Purpose/Significance]The quantitative analysis of political texts is an emerging interdisciplinary research direction.From the perspective of the integration of text data and analysis methods,this paper systematically summarizes the latest developments in the quantitative research of political texts,aiming to support practical guidance for future research.[Method/Process]Three main quantitative methods were summarized in the different ways of how political texts were converted into data,then concluded their process,characteristics and research tasks.[Result/Conclusion]The quantitative research of political texts has developed rapidly in recent years,which mainly studied the expansion of data resources,application of multi-domain methods,and the tokenization method became increasingly popular.In the future,researchers can pay more attention to adopting more data sources for policy research,the construction of political texts corpus and validation of methods.

      Key words:political texts;quantitative analysis;text as data;text analysis

      政策文本是政策存在的物理載體,是政府政策行為的反映,也是記述政策意圖和政策過(guò)程的客觀憑證[1],因此政策文本研究是追溯和觀察政策過(guò)程的一個(gè)重要途徑。近些年,隨著政府信息公開(kāi)化以及互聯(lián)網(wǎng)的蓬勃發(fā)展,政策文本研究能夠利用前人難以想象的數(shù)據(jù),這些數(shù)據(jù)不僅體量大,而且種類(lèi)豐富。同時(shí),信息技術(shù)的快速發(fā)展,文本挖掘、數(shù)據(jù)分析等領(lǐng)域不斷涌現(xiàn)的新方法和新工具,也極大地拓展了政策文本研究的范式。目前政策文本研究方法主要包括定性分析和定量分析,其中定性分析高度依賴(lài)研究者的實(shí)踐經(jīng)驗(yàn)和分析能力,強(qiáng)調(diào)從總體和宏觀角度把握政策內(nèi)容的復(fù)雜背景和思想結(jié)構(gòu)。隨著政策文本研究數(shù)據(jù)的增長(zhǎng),定性分析的人力成本激增。定量分析是將政策文本中有價(jià)值的信息轉(zhuǎn)換成計(jì)算機(jī)可處理的結(jié)構(gòu)化數(shù)據(jù),進(jìn)而利用數(shù)學(xué)模型進(jìn)行分析,這極大降低了大樣本量政策文本研究的人力成本,提高了結(jié)果的可復(fù)制性[2],因此成為當(dāng)前政策文本研究的趨勢(shì)。

      目前政策文本研究中所使用的定量方法大多遷移自其他學(xué)科,方法多樣且近年來(lái)發(fā)展迅速,有必要及時(shí)進(jìn)行梳理與總結(jié)。此外,現(xiàn)有的研究綜述多從方法本身的角度進(jìn)行梳理,如楊正總結(jié)了政策計(jì)量方法的概念、研究現(xiàn)狀及未來(lái)趨勢(shì)[3],裴雷等從政策文本計(jì)算的角度對(duì)方法論、應(yīng)用工具和典型研究議題進(jìn)行了梳理[4],但這些綜述對(duì)研究方法與文本數(shù)據(jù)的融合分析關(guān)注不多,這一定程度上影響了對(duì)政策文本分析實(shí)踐的指導(dǎo)。因此,本文從文本數(shù)據(jù)與分析方法融合的角度,系統(tǒng)梳理了國(guó)內(nèi)外相關(guān)研究成果,歸納研究特點(diǎn)、流程及典型應(yīng)用,以期為后續(xù)研究提供參考。

      1?數(shù)據(jù)來(lái)源與處理

      政策文本的定量分析融合了管理學(xué)、政治學(xué)、統(tǒng)計(jì)學(xué)、信息技術(shù)等多個(gè)學(xué)科。在文獻(xiàn)檢索過(guò)程中,為了盡可能覆蓋相關(guān)文獻(xiàn),首先根據(jù)文獻(xiàn)調(diào)研,對(duì)國(guó)內(nèi)外文章中主題詞的描述進(jìn)行整理,然后結(jié)合數(shù)據(jù)庫(kù)檢索規(guī)則,確定檢索主題詞,如表1所示。

      以WoS核心合集、CNKI等數(shù)據(jù)庫(kù)為文獻(xiàn)來(lái)源,以表1的主題詞進(jìn)行檢索,檢索邏輯是“或含”。僅選擇期刊文獻(xiàn)。檢索結(jié)果顯示,WoS核心合集第一篇相關(guān)文獻(xiàn)發(fā)表于1959年,CNKI的第一篇相關(guān)文獻(xiàn)發(fā)表于2007年。以2007年為起始時(shí)間進(jìn)行發(fā)文數(shù)量統(tǒng)計(jì),可以看出,2016年后國(guó)內(nèi)外相關(guān)文獻(xiàn)均有較為明顯地增長(zhǎng)。需要注意的是截至論文成稿日,2020年文獻(xiàn)尚未完全收錄。

      因此,為了總結(jié)最新研究進(jìn)展,本文以近5年(2016—2020年)發(fā)表的文獻(xiàn)為切入點(diǎn),經(jīng)過(guò)主題篩選、文獻(xiàn)溯源等方式,獲得代表性文獻(xiàn)75篇,其中中文文獻(xiàn)31篇,英文文獻(xiàn)38篇,中英文專(zhuān)著6部?;谶@些文獻(xiàn),本文對(duì)政策文本定量研究的最新進(jìn)展進(jìn)行總結(jié)和分析。

      2?相關(guān)概念辨析

      2.1?政策文本量化的定義

      在政策研究領(lǐng)域,國(guó)內(nèi)外研究者對(duì)定量研究政策文本有多種表述,例如政策文獻(xiàn)計(jì)量[5-6]、政策文本計(jì)算[4]、政策內(nèi)容分析[7]等。政策文獻(xiàn)計(jì)量主要是對(duì)政策文本的結(jié)構(gòu)屬性進(jìn)行量化分析[5],政策文本計(jì)算強(qiáng)調(diào)運(yùn)用計(jì)算機(jī)科學(xué)、語(yǔ)言學(xué)和政治學(xué)理論進(jìn)行政策文本挖掘[4],政策內(nèi)容分析突出了對(duì)文本內(nèi)容的定量和定性分析[7]。這些表述雖然側(cè)重點(diǎn)有所不同,但核心思想一致,即區(qū)別于定性方法對(duì)少量政策文本的解讀,展示出對(duì)大量政策文本分析方法的關(guān)注,探索的是一種新的研究范式。本文將上述表述統(tǒng)稱(chēng)為政策文本量化。

      從內(nèi)涵上看,政策文本量化是通過(guò)一系列的轉(zhuǎn)換范式將非結(jié)構(gòu)化政策文本轉(zhuǎn)換成抽象化、特征化的計(jì)算機(jī)可處理的結(jié)構(gòu)化數(shù)據(jù)[8]。從研究范圍看,政策文本量化是政策研究、計(jì)算機(jī)科學(xué)等領(lǐng)域交叉融合產(chǎn)生的新領(lǐng)域。從研究方法看,政策文本量化是從計(jì)算機(jī)科學(xué)、文獻(xiàn)計(jì)量學(xué)到政策科學(xué)的多領(lǐng)域方法遷移。

      2.2?政策文本的范圍

      政策文本是指因政策活動(dòng)而產(chǎn)生的記錄文獻(xiàn),既包括國(guó)家、地方各級(jí)權(quán)力或行政機(jī)關(guān)以文件形式頒布的法律、法規(guī)、規(guī)章等官方文獻(xiàn),也包括政策制定者或政治領(lǐng)導(dǎo)人在政策制定過(guò)程中形成的研究、咨詢(xún)、聽(tīng)證或決議等公文檔案,以及政策活動(dòng)過(guò)程中因辯論、演說(shuō)、報(bào)道、評(píng)論等形成的政策輿情文本[4],如候選人在競(jìng)選期間的辯論和政策立場(chǎng)陳述,新聞中有關(guān)國(guó)際關(guān)系的報(bào)道等,這些文本都可看作是廣義上的政策文本。目前常用于分析的政策文本類(lèi)型包括立法、決策機(jī)關(guān)的公文、政黨聲明、聽(tīng)證會(huì)陳述、條約、政治科學(xué)論文以及媒體數(shù)據(jù)等。

      可以看出,政策文本類(lèi)型多樣,結(jié)構(gòu)復(fù)雜。在實(shí)際研究中,獲取政策文本的方式主要有:①基于政府部門(mén)的主動(dòng)公開(kāi)和社交媒體平臺(tái)的開(kāi)放性,使用應(yīng)用程序接口(API)或根據(jù)網(wǎng)頁(yè)特征編寫(xiě)腳本批量獲取;②基于研究機(jī)構(gòu)和研究者的收集整理,建立專(zhuān)門(mén)的政策文本數(shù)據(jù)庫(kù),比如國(guó)內(nèi)的綜合性法律文件檢索平臺(tái)北大法寶、清華大學(xué)開(kāi)發(fā)的政策文件數(shù)據(jù)庫(kù)iPolicy[9]以及中國(guó)科協(xié)創(chuàng)新戰(zhàn)略研究院建立的全球政策法規(guī)庫(kù)等。

      3?政策文本量化研究的典型方法

      政策文本量化通常分為4個(gè)步驟[8]:①獲取文本數(shù)據(jù)并進(jìn)行預(yù)處理;②將政策文本表示成計(jì)算機(jī)可處理的數(shù)據(jù)形式,即文本量化;③處理數(shù)據(jù)獲得量化結(jié)果;④檢驗(yàn)方法,并對(duì)結(jié)果進(jìn)行描述性分析或因果分析。

      在文本量化步驟,目前有多種把政策文本轉(zhuǎn)化成數(shù)據(jù)的方式,基于這些方式的特點(diǎn),可以把當(dāng)前政策文本量化方法分為三大類(lèi):政策計(jì)量分析、內(nèi)容分析法和效詞分析法,如圖2所示。其中政策計(jì)量分析是通過(guò)定義并識(shí)別政策文本的結(jié)構(gòu)要素,使其結(jié)構(gòu)化后再進(jìn)行分析;內(nèi)容分析法是構(gòu)建從政策語(yǔ)詞到政策語(yǔ)義的分析單元框架,并以編碼的方式將文本內(nèi)容轉(zhuǎn)變成含有語(yǔ)義信息的數(shù)字;效詞分析法是使用文本表示模型將政策文本分解成含語(yǔ)義特征且可處理的基本單元,從而進(jìn)行后續(xù)的分析。在實(shí)踐中,文本量化方式的選擇需要權(quán)衡計(jì)算成本和分析效果,即想要獲得簡(jiǎn)單且有意義的數(shù)據(jù)以精簡(jiǎn)計(jì)算,但不要因此丟失過(guò)多的信息影響分析效果。

      在數(shù)據(jù)處理步驟,模型選擇是關(guān)鍵,其有效性直接決定了結(jié)果的可靠性。相比其他領(lǐng)域,政策研究對(duì)分析結(jié)果的可信度要求更高。在結(jié)果分析步驟,為了提高易讀性,研究者通常利用可視化工具對(duì)結(jié)果進(jìn)行可視化。

      3.1?政策計(jì)量分析

      政策計(jì)量分析(Policiometrics)是一種分析政策文獻(xiàn)體系和結(jié)構(gòu)屬性的方法,由文獻(xiàn)計(jì)量學(xué)、統(tǒng)計(jì)學(xué)、數(shù)學(xué)等學(xué)科有機(jī)結(jié)合產(chǎn)生,繼承并遷移了文獻(xiàn)計(jì)量學(xué)中的三大定律(“洛特卡定律”“布拉德福定律”與“齊夫定律”)。其基本流程主要包括收集政策文本,并根據(jù)文本的結(jié)構(gòu)要素將政策文本結(jié)構(gòu)化;借助文獻(xiàn)計(jì)量學(xué)或社會(huì)網(wǎng)絡(luò)分析相關(guān)方法進(jìn)行分析。

      3.1.1?政策文本的結(jié)構(gòu)要素

      政策文本具有與科技文獻(xiàn)類(lèi)似的基本結(jié)構(gòu)要素,如發(fā)文機(jī)關(guān)、發(fā)布日期等,目前政策計(jì)量分析常用的結(jié)構(gòu)要素及計(jì)量方法[6,10],如表2所示。

      與論文相比,政策文本的結(jié)構(gòu)要素在含義、表征等方面有著自身的特殊性,如政策文獻(xiàn)缺乏關(guān)鍵詞和參考文獻(xiàn)等結(jié)構(gòu)要素。因此研究者常通過(guò)人工整理政策的標(biāo)題和正文獲取相關(guān)數(shù)據(jù)。張會(huì)平等[11]運(yùn)用詞頻分析軟件和人工方式提取從政府門(mén)戶(hù)網(wǎng)站收集到的政策文本的關(guān)鍵詞。蘇竣等[12]整理制定了由18類(lèi)586個(gè)術(shù)語(yǔ)構(gòu)成的檢索詞表。

      3.1.2?主要的應(yīng)用

      政策計(jì)量分析?;谡呶谋窘Y(jié)構(gòu)要素的統(tǒng)計(jì)來(lái)分析政策的分布特征,如時(shí)間分布、文種分布、主題詞詞頻分布等,可展現(xiàn)政策文本中隱含的關(guān)系網(wǎng)絡(luò),如頒布機(jī)構(gòu)的合作關(guān)系,政策擴(kuò)散及主題變遷等。黃萃等[13]對(duì)4 707份科技創(chuàng)新政策文本的主題詞進(jìn)行詞頻統(tǒng)計(jì)、共詞和聚類(lèi)分析,揭示出我國(guó)不同歷史時(shí)期科技創(chuàng)新政策主題及其演進(jìn)的階段特征。李燕萍等[14]從發(fā)布時(shí)間、文種、頒發(fā)部門(mén)及關(guān)鍵詞等4個(gè)方面對(duì)我國(guó)488份科技人才政策文本進(jìn)行量化,并結(jié)合共詞網(wǎng)絡(luò)梳理了我國(guó)科技人才政策的整體狀況、發(fā)展過(guò)程及趨勢(shì)。陳慧茹[15]集成扎根理論、詞頻分析等,構(gòu)建了基于政策屬性與關(guān)鍵詞權(quán)重的共詞網(wǎng)絡(luò)模型。張會(huì)平等[11]采用CiteSpace 5.0分析政策文本的時(shí)間分布、關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)、高頻關(guān)鍵詞及其共現(xiàn)關(guān)系。

      3.1.3?存在的問(wèn)題與對(duì)策

      政策計(jì)量分析融合了文獻(xiàn)計(jì)量學(xué)和社會(huì)網(wǎng)絡(luò)分析法,有助于宏觀層面的政策分析,如政策主體的合作模式、政策體系的結(jié)構(gòu)與演進(jìn)等分析,但也存在較為突出的問(wèn)題。首先,更為深層的語(yǔ)義角度的分析仍依靠人工解讀,同時(shí)一些低頻重要詞匯易被忽視。其次,現(xiàn)有傳統(tǒng)指標(biāo)無(wú)法滿(mǎn)足復(fù)雜的政策研究需求,因此如何構(gòu)建有效的分析指標(biāo)是政策計(jì)量分析的一個(gè)重要方向。一些學(xué)者也在積極探索政策計(jì)量指標(biāo)的設(shè)計(jì),如張劍等[16]基于政策參照網(wǎng)絡(luò)和關(guān)鍵詞時(shí)序分析圖譜,設(shè)計(jì)了強(qiáng)度、廣度、速度與方向4個(gè)維度作為政策擴(kuò)散的測(cè)量指標(biāo);劉建華[17]從直接語(yǔ)義關(guān)系、直接共現(xiàn)關(guān)系、間接共現(xiàn)關(guān)聯(lián)、關(guān)聯(lián)路徑衰減指數(shù)4個(gè)維度構(gòu)建了科技政策實(shí)體關(guān)聯(lián)的多指標(biāo)模型,并結(jié)合時(shí)間屬性揭示了政策演化路徑。此外,政策計(jì)量分析及應(yīng)用較為依賴(lài)結(jié)構(gòu)化語(yǔ)料庫(kù),但現(xiàn)有政策文本語(yǔ)料庫(kù)在數(shù)量、質(zhì)量以及開(kāi)放性等方面尚無(wú)法完全滿(mǎn)足需求,未來(lái)應(yīng)關(guān)注政策文本結(jié)構(gòu)化語(yǔ)料庫(kù)的建設(shè)。

      3.2?內(nèi)容分析法

      內(nèi)容分析法(Content Analysis)是當(dāng)前政策文本研究中常用的分析方法,通過(guò)定義能反映政策語(yǔ)義與語(yǔ)詞之間映射關(guān)系的分析單元進(jìn)行政策概念的識(shí)別和處理,并構(gòu)建從分析單元到數(shù)值的編碼標(biāo)準(zhǔn)與從政策文本到政策語(yǔ)義的政策分析框架[18]。具體研究過(guò)程包括4個(gè)步驟:①提出研究問(wèn)題并抽取政策文獻(xiàn)樣本;②確定分析單元與編碼標(biāo)準(zhǔn);③對(duì)文本內(nèi)容進(jìn)行編碼并進(jìn)行百分比、平均值、相關(guān)分析、回歸分析等統(tǒng)計(jì)操作;④解釋并檢驗(yàn)。

      3.2.1?定義分析單元并編碼

      分析單元是內(nèi)容分析中最重要、可結(jié)構(gòu)化的元素,能夠反映政策語(yǔ)義與政策文本內(nèi)容之間的關(guān)系,可以是單詞、符號(hào)、主題、以及意義獨(dú)立的詞組、句子或段落等[18]。在政策研究中,通?;谡吖ぞ呃碚撟鳛槎x分析單元的理論依據(jù),如典型的Rothwell R等的政策工具分類(lèi)法[19]。編碼是將政策文本中的分析單元轉(zhuǎn)變?yōu)閿?shù)值數(shù)據(jù)的過(guò)程,其關(guān)鍵在于編碼標(biāo)準(zhǔn)及編碼的可信度[20]。

      目前常用的編碼方式有人工編碼和計(jì)算機(jī)輔助編碼。人工編碼包括編碼標(biāo)準(zhǔn)構(gòu)建、編碼員培訓(xùn)和編碼員間編碼可靠性評(píng)估等要素[20]。有研究證實(shí)提早確立編碼標(biāo)準(zhǔn)有利于辨清和查找文本內(nèi)容中固有的語(yǔ)義問(wèn)題[21],由于當(dāng)前大多數(shù)編碼方案是通過(guò)閱讀文本歸納所得,因此為了確保內(nèi)容分析法有效,在對(duì)政策文本進(jìn)行編碼前,往往需要邀請(qǐng)專(zhuān)家對(duì)編碼標(biāo)準(zhǔn)進(jìn)行修訂。此外,由于人工編碼依賴(lài)于人工對(duì)文本的理解,因此編碼初期需要測(cè)度編碼員對(duì)內(nèi)容編碼的一致性,即信度檢驗(yàn),通常認(rèn)為Kappa系數(shù)達(dá)到0.8以上時(shí)編碼可靠[22]。

      隨著計(jì)算機(jī)技術(shù)的進(jìn)展,計(jì)算機(jī)輔助編碼蓬勃發(fā)展。CAQDAS、Code-A-text,Ethnograph、MAXQDA、Nvivo、QDA Miner、Symphony Content Analysis、ROST Content Mining(ROST CM)、DICTION、AtlasTi和ALCESTE等文本分析工具的出現(xiàn),幫助了編碼人員對(duì)大樣本文本內(nèi)容進(jìn)行編碼[20,23-24]。有研究者對(duì)比了人工編碼和工具編碼的結(jié)果,發(fā)現(xiàn)使用計(jì)算機(jī)輔助編碼一定程度提高了編碼效率,降低了編碼成本[25],但仍要注意信度檢驗(yàn)。

      3.2.2?主要的應(yīng)用

      當(dāng)前許多國(guó)內(nèi)學(xué)者采用內(nèi)容分析法進(jìn)行政策發(fā)展演化研究,從政策工具[26-27]、政策主體[28]、政策作用場(chǎng)域[25]等方面分析并總結(jié)了某領(lǐng)域政策演化的階段性特征及路徑趨勢(shì)[29-31]。黃新平等[25]對(duì)我國(guó)72份科技金融發(fā)展政策進(jìn)行編碼分類(lèi),總結(jié)出其政策工具體系、結(jié)構(gòu)及運(yùn)行特征。黃如花等[22]對(duì)我國(guó)政府?dāng)?shù)據(jù)開(kāi)放共享政策文本進(jìn)行編碼,并基于編碼結(jié)果進(jìn)行描述性統(tǒng)計(jì)和分析。Huang C等[9]從“政策目標(biāo)—政策工具”角度對(duì)中國(guó)核能政策進(jìn)行編碼,通過(guò)計(jì)算“政策目標(biāo)—政策工具”網(wǎng)絡(luò)節(jié)點(diǎn)的特征向量中心性,確定了不同時(shí)期的主要“政策目標(biāo)”和主要“政策工具”,梳理了我國(guó)核能政策的演變過(guò)程。裴雷等[32]對(duì)我國(guó)智慧城市政策文本進(jìn)行編碼和扎根統(tǒng)計(jì),分析了我國(guó)智慧城市建設(shè)的現(xiàn)狀。程瑨[33]綜合利用內(nèi)容分析法和計(jì)量分析法,探究了政策轉(zhuǎn)移與政策協(xié)同的關(guān)系。

      3.2.3?目前的局限與發(fā)展方向

      內(nèi)容分析法從語(yǔ)義的角度對(duì)政策文本進(jìn)行編碼,并使用統(tǒng)計(jì)學(xué)指標(biāo)、PMC指數(shù)模型[34]等對(duì)編碼結(jié)果進(jìn)行計(jì)算分析,具有可操作性強(qiáng)、適用性廣等特點(diǎn)。內(nèi)容分析法在具體應(yīng)用方面存在一些需要注意的地方,包括清楚地說(shuō)明抽樣依據(jù),分析框架設(shè)計(jì)的合理性,編碼方案等。此外,隨著樣本數(shù)量和分析視角的增加,內(nèi)容分析法的人力成本和使用難度將成倍增長(zhǎng),如何提高內(nèi)容分析法的效率是亟待解決的問(wèn)題,其中立足政策文本特征制定通用的分析單元體系和框架,基于當(dāng)前通用的文本分析工具研制專(zhuān)用于政策文本分析的工具等將是有效的解決途徑。

      3.3?效詞分析法

      效詞分析(Tokenization)源于自然語(yǔ)言處理(NLP),是指通過(guò)文本表示模型將文本分解成可處理的基本單元[35]。該方法使用文本表示模型表征政策文本中有意義的內(nèi)容,旨在最大程度實(shí)現(xiàn)自動(dòng)化文本分析,這也是該方法與前兩類(lèi)方法的最大區(qū)別。在政策研究領(lǐng)域,國(guó)外學(xué)者將此類(lèi)方法統(tǒng)稱(chēng)為“Text as Data”[36],以區(qū)別于自然語(yǔ)言處理、文本挖掘等較為通用的表示。該方法集成了機(jī)器學(xué)習(xí)、自然語(yǔ)言處理、文本挖掘等技術(shù)[23,37-39],可以從語(yǔ)義角度量化和分析大型文本集,為進(jìn)行大樣本量政策文本的深入分析提供了機(jī)會(huì)。如Haeder S F等[38]利用Heckman選擇模型和自動(dòng)內(nèi)容分析軟件WCopyfind分析了美國(guó)管理和預(yù)算辦公室(OMB)大量政策法規(guī)的變化。

      3.3.1?分析流程

      效詞分析法的流程由Grimmer J等[36]最早提出,通常包含以下步驟:①獲取文本,并對(duì)文本進(jìn)行效詞處理;②根據(jù)研究問(wèn)題選擇合適的算法進(jìn)行計(jì)算和分析;③對(duì)建立的模型進(jìn)行評(píng)估并驗(yàn)證;④結(jié)合實(shí)際問(wèn)題對(duì)結(jié)果進(jìn)行實(shí)質(zhì)性解析[40]。

      3.3.2?文本效詞處理

      根據(jù)語(yǔ)義表達(dá)粒度不同,常將文本表示分為詞語(yǔ)級(jí)、句子級(jí)和篇章級(jí),其中詞語(yǔ)是語(yǔ)義最細(xì)粒度的表達(dá)。結(jié)合政策文本研究對(duì)語(yǔ)義的關(guān)注,效詞分析法通常基于詞袋模型表示文本,如TF-IDF算法;為了提高語(yǔ)義表示的精度,研究者也使用文本分布式表示方法,如Skip-Gram模型等。

      1)詞袋模型

      詞袋模型(Bag of Words Model)是常用的文本表示方法。其特點(diǎn)在于不考慮詞語(yǔ)在文檔中出現(xiàn)的順序,將文檔表示成一系列不同詞語(yǔ)的組合,即所謂的單詞袋,并計(jì)算文本中出現(xiàn)的不同單詞的頻率。Linguistic Inquiry Word Count(LIWC)是基于詞袋模型構(gòu)建的自動(dòng)詞分析工具[41],有研究者使用該工具對(duì)政策文本進(jìn)行量化,把LIWC生成的單詞作為語(yǔ)言變量進(jìn)行統(tǒng)計(jì)學(xué)角度的研究[42]?;谠~袋模型的常見(jiàn)工具還包括WordScores[7]和WordFish[43],這兩個(gè)工具常用于從政策文本中提取觀點(diǎn)意圖[44]。WordScores是有監(jiān)督學(xué)習(xí)模型,依賴(lài)于帶有標(biāo)簽的文檔樣本,例如有專(zhuān)家注釋的政黨宣言,以帶標(biāo)簽文檔中單詞出現(xiàn)的相對(duì)概率作為每個(gè)單詞的分?jǐn)?shù),并將此分?jǐn)?shù)視為相應(yīng)意圖的指標(biāo),之后將分?jǐn)?shù)應(yīng)用于新文檔中找到的單詞,以此估計(jì)新文檔的政治立場(chǎng)類(lèi)型。Daigneault P M等[45]使用WordScores定量分析半結(jié)構(gòu)化訪談出版物,研究表明Wordscores在補(bǔ)充定性分析方面具有較大潛力。WordFish是無(wú)監(jiān)督學(xué)習(xí)模型,所需的唯一輸入是列出了所有文檔中每個(gè)單詞頻率的單詞頻率矩陣,因此避免了WordScores對(duì)專(zhuān)家注釋的依賴(lài)和某些單詞語(yǔ)義受表達(dá)習(xí)慣和語(yǔ)義環(huán)境影響等問(wèn)題。

      詞袋模型考慮到了用單詞來(lái)映射文本語(yǔ)義,但未考慮詞法和語(yǔ)序的問(wèn)題,如僅關(guān)注一個(gè)單詞在文檔中是否出現(xiàn)和其出現(xiàn)次數(shù),而忽略其上下文關(guān)系,這往往會(huì)丟失一部分文本的語(yǔ)義。從理論上講,WordScores和WordFish都可以擴(kuò)展為一個(gè)以上單詞的序列,但這會(huì)增加計(jì)算成本[46]。有學(xué)者針對(duì)此問(wèn)題進(jìn)行了探索,如Alschner W等[47]使用由文本中連續(xù)5個(gè)字符組成的“詞”的詞袋模型[48]來(lái)表示雙邊投資條約(BIT)文本??傮w而言,詞袋模型能從語(yǔ)義角度表示文本且易于解釋?zhuān)湟蕾?lài)單詞詞頻,在實(shí)踐中還需考慮單詞和上下文的關(guān)系以及處理高維度變量時(shí)權(quán)衡計(jì)算成本等問(wèn)題。

      2)分布式表示

      分布式表示(Distributed Representation)通常也被稱(chēng)為基于神經(jīng)網(wǎng)絡(luò)的分布表示、詞嵌入或詞向量(Word Embedding)。相比詞袋模型離散、高維且稀疏的表示,分布式表示將詞表示成一個(gè)低維且連續(xù)的稠密向量。Word2vec是常用的工具,首先輸入文本語(yǔ)料作為訓(xùn)練集,根據(jù)訓(xùn)練文本數(shù)據(jù)構(gòu)建詞匯表,并學(xué)習(xí)單詞的向量表示,最后生成低維連續(xù)的實(shí)數(shù)向量并輸出。Rodman E[49]使用Word2vec對(duì)單詞含義隨時(shí)間變化的過(guò)程進(jìn)行分析,顯示出詞嵌入模型在政策研究領(lǐng)域的應(yīng)用潛力。Rheault L等[46]介紹了詞嵌入模型在分析議會(huì)演講文本方面的應(yīng)用;Jentsch C等[50]為了研究政黨立場(chǎng),提出了一種詞典可隨時(shí)間變化的新模型。詞向量認(rèn)為相同上下文語(yǔ)境的詞具有相似的含義,因而能夠通過(guò)共現(xiàn)來(lái)發(fā)現(xiàn)和表示單詞之間的關(guān)系,在一定程度上解決了僅依賴(lài)單詞詞頻方法導(dǎo)致的語(yǔ)義不足問(wèn)題。但是,詞向量的使用效果非常依賴(lài)訓(xùn)練用的文本語(yǔ)料庫(kù),語(yǔ)料越多效果越好。

      3.3.3?效詞分析

      通過(guò)文本挖掘工具或方法對(duì)文本效詞處理后[51],需要根據(jù)研究問(wèn)題選擇合適的算法進(jìn)行計(jì)算和分析,如主題模型[52-53]、文本相似度算法[54]、循環(huán)神經(jīng)網(wǎng)絡(luò)[55]等。Hollibaugh G E等[40]使用結(jié)構(gòu)主題模型(Structural Topic Model)將現(xiàn)實(shí)事件與主題變化相對(duì)應(yīng),以分析政策文本中的主題變化。Alschner W等[47]使用Jaccard Distance來(lái)計(jì)算全球主要國(guó)家的雙邊投資條約的文本相似度,研究追溯了全球主要國(guó)家投資條約文本中的一致性和創(chuàng)新性。楊銳等[56]通過(guò)高頻詞識(shí)別、共詞分析及關(guān)鍵詞聚類(lèi)等方法探索了不同階段科研誠(chéng)信政策的主題演變。

      3.3.4?主要的應(yīng)用

      效詞分析法目前在國(guó)內(nèi)外應(yīng)用逐漸廣泛,不僅促進(jìn)了政策文本研究方法的創(chuàng)新,而且也為定量分析政策文本提供了新的視角。首先,該方法可用來(lái)深度挖掘大樣本量或時(shí)間跨度較長(zhǎng)的政策文本。盛東方等[57]使用LDA主題模型分析了401份文本,以研究突發(fā)公共事件下中小企業(yè)扶持政策的供需匹配問(wèn)題。張寶建等[58]采用K-means聚類(lèi)算法分析了我國(guó)1996—2017年57份國(guó)家科技創(chuàng)新政策典型文本,揭示出不同政策在科技創(chuàng)新發(fā)展各個(gè)階段表現(xiàn)出的差異性和失配特征。其次,效詞分析法常用以分析政黨立場(chǎng)、政治傾向等隱含知識(shí)[59-60]。Windsor L等[42]將領(lǐng)導(dǎo)人發(fā)言中的單詞變成數(shù)據(jù)進(jìn)行研究,提供了對(duì)某些政治現(xiàn)象的解釋依據(jù)。Shaffer R[61]利用國(guó)會(huì)會(huì)議筆錄的原始數(shù)據(jù)集來(lái)測(cè)量個(gè)人關(guān)注度的多樣性。Rheault L等[46]通過(guò)對(duì)議會(huì)演講文本的分析,估算了政黨立場(chǎng)。利用政策文本研究政治主體的政治傾向,一定程度彌補(bǔ)了傳統(tǒng)訪談法樣本小,受時(shí)間、人力限制[50]以及訪談過(guò)程中訪談對(duì)象易受影響等不足。

      此外,效詞分析法能廣泛利用非傳統(tǒng)政策文本分析公共政策問(wèn)題,如社交媒體數(shù)據(jù)。Meng Q等[62]使用社交網(wǎng)絡(luò)分析工具PKUVIS對(duì)政府在微博上發(fā)布的消息進(jìn)行深入分析,探討了政府在社交媒體上如何治理突發(fā)公共事件。Barberá P等[63]分析了數(shù)百萬(wàn)Twitter用戶(hù)的社交媒體數(shù)據(jù)用以估算用戶(hù)的政治傾向。Chang W H等[64]通過(guò)分析大量異構(gòu)社交媒體數(shù)據(jù),研究了政治立場(chǎng)和政治策略等問(wèn)題。Casas A等[65]分析了上萬(wàn)條美國(guó)共和黨人的推文(Twitter)發(fā)現(xiàn),強(qiáng)大的政黨形象可以幫助候選人保持或獲得多數(shù)控制權(quán)。Miller C[66]通過(guò)對(duì)來(lái)自澳大利亞兩個(gè)最盛行的反伊斯蘭團(tuán)體在社交媒體上的所有公開(kāi)帖子進(jìn)行分析,調(diào)查了這些團(tuán)體的關(guān)注點(diǎn)。

      3.3.5?優(yōu)勢(shì)與不足

      效詞分析法集成了自然語(yǔ)言處理中的文本表示模型以及文本挖掘中的多項(xiàng)技術(shù),能夠借助計(jì)算機(jī)快速處理大樣本量的政策文本,人力成本低,結(jié)果可復(fù)制性強(qiáng),一定程度彌補(bǔ)了政策計(jì)量分析深度不夠和內(nèi)容分析方法無(wú)法快速分析大樣本文本數(shù)據(jù)的不足。但該方法仍有需要改進(jìn)的地方,如為了獲得較好的分析結(jié)果,易出現(xiàn)模型過(guò)擬合等問(wèn)題[67];由于不同領(lǐng)域政策研究問(wèn)題的側(cè)重點(diǎn)與分析精度需求不同,加之政策文本類(lèi)型多樣,僅通過(guò)已有模型或單一數(shù)據(jù)源進(jìn)行政策研究也是不夠的。此外,相較前兩類(lèi)方法,效詞分析法存在一定的技術(shù)門(mén)檻,雖然目前有不少開(kāi)源工具包可使用[68-69],但在實(shí)踐中仍要求具備一定的技術(shù)能力。因此,效詞分析法未來(lái)需結(jié)合政策研究實(shí)踐中的真實(shí)問(wèn)題,不斷設(shè)計(jì)和開(kāi)發(fā)符合政策研究特點(diǎn)的分析框架、方法與工具等。

      4?總結(jié)、討論與展望

      4.1?總結(jié)與討論

      政策文本量化作為一種新興的跨學(xué)科研究方向,建立在多學(xué)科研究知識(shí)和技術(shù)專(zhuān)長(zhǎng)之上。近年來(lái)研究人員在方法融合、數(shù)據(jù)拓展、實(shí)踐應(yīng)用等方面進(jìn)行了積極的探索和研究,取得了一定的研究成果。在研究方法上,不斷融合機(jī)器學(xué)習(xí)、自然語(yǔ)言處理、文本挖掘等新技術(shù)和新工具,逐步向大規(guī)模政策文本分析發(fā)展;在工具方面,關(guān)注并探索政策文本專(zhuān)用分析工具的研制,如政策分析專(zhuān)有詞表;在分析深度上,從基于政策文本外部結(jié)構(gòu)屬性的分析逐步深化至對(duì)文本內(nèi)部語(yǔ)義特征的挖掘;在數(shù)據(jù)類(lèi)型上,積極推動(dòng)專(zhuān)業(yè)語(yǔ)料庫(kù)的建設(shè)和跨語(yǔ)料庫(kù)的分析,如多語(yǔ)種分析、視頻、音頻等多語(yǔ)料分析等;在應(yīng)用方面,從傳統(tǒng)的政策演化、協(xié)同、擴(kuò)散等研究,拓展至政策認(rèn)同、政治傾向、政治策略、政黨競(jìng)爭(zhēng)與合作以及選情預(yù)測(cè)等研究。

      [8]Gentzkow M,Kelly B,Taddy M.Text as Data[J].Journal of Economic Literature,2019,57(3):535-74.

      [9]Huang C,Yang C,Su J.Policy Change Analysis Based on“Policy Target-Policy Instrument”P(pán)atterns:A Case Study of China's Nuclear Energy Policy[J].Scientometrics,2018,117(2):1081-114.

      [10]宋偉,夏輝.地方政府人工智能產(chǎn)業(yè)政策文本量化研究[J].科技管理研究,2019,39(10):192-9.

      [11]張會(huì)平,郭寧,湯璽楷.推進(jìn)邏輯與未來(lái)進(jìn)路:我國(guó)政務(wù)大數(shù)據(jù)政策的文本分析[J].情報(bào)雜志,2018,37(3):152-7,92.

      [12]蘇竣,黃萃.中國(guó)科技政策要目概覽[M].北京:科學(xué)技術(shù)文獻(xiàn)出版社,2012.

      [13]黃萃,趙培強(qiáng),李江.基于共詞分析的中國(guó)科技創(chuàng)新政策變遷量化分析[J].中國(guó)行政管理,2015,(9):115-22.

      [14]李燕萍,劉金璐,洪江鵬,等.我國(guó)改革開(kāi)放40年來(lái)科技人才政策演變、趨勢(shì)與展望——基于共詞分析法[J].科技進(jìn)步與對(duì)策,2019,36(10):108-17.

      [15]陳慧茹.基于扎根理論的國(guó)家自主創(chuàng)新示范區(qū)科技創(chuàng)新政策共詞網(wǎng)絡(luò)研究[D].合肥:中國(guó)科學(xué)技術(shù)大學(xué),2017.

      [16]張劍,黃萃,葉選挺,等.中國(guó)公共政策擴(kuò)散的文獻(xiàn)量化研究——以科技成果轉(zhuǎn)化政策為例[J].中國(guó)軟科學(xué),2016,(2):145-55.

      [17]劉建華.基于實(shí)體及實(shí)體間關(guān)系的科技政策演化揭示方法研究[D].北京:中國(guó)科學(xué)院大學(xué),2017.

      [18]邱均平,鄒菲.關(guān)于內(nèi)容分析法的研究[J].中國(guó)圖書(shū)館學(xué)報(bào),2004,30(2):12-7.

      [19]Rothwell R,Zegveld W.Reindusdalization and Technology[J].Logman Group Limited,1985:83-104.

      [20]Neuendorf K A,Kumar A.Content Analysis[J].The International Encyclopedia of Political Communication,2015:1-10.

      [21]Berelson B.Content Analysis in Communication Research[J].1952.

      [22]黃如花,溫芳芳.我國(guó)政府?dāng)?shù)據(jù)開(kāi)放共享的政策框架與內(nèi)容:國(guó)家層面政策文本的內(nèi)容分析[J].圖書(shū)情報(bào)工作,2017,61(20):12-25.

      [23]Pandey S,Pandey S K,Miller L.Measuring Innovativeness of Public Organizations:Using Natural Language Processing Techniques in Computer-Aided Textual Analysis[J].International Public Management Journal,2017,20(1):78-107.

      [24]李燕萍,吳紹棠,郜斐,等.改革開(kāi)放以來(lái)我國(guó)科研經(jīng)費(fèi)管理政策的變遷、評(píng)介與走向——基于政策文本的內(nèi)容分析[J].科學(xué)學(xué)研究,2009,27(10):1441-7,53.

      [25]黃新平,黃萃,蘇竣.基于政策工具的我國(guó)科技金融發(fā)展政策文本量化研究[J].情報(bào)雜志,2020,39(1):130-7.

      [26]譚春輝,謝榮,劉倩.政策工具視角下的我國(guó)科技評(píng)估政策文本量化研究[J].情報(bào)雜志,2020,39(10):181-90.

      [27]李健,榮幸.“放管服”改革背景下社會(huì)組織發(fā)展的政策工具選擇——基于2004—2016年省級(jí)政策文本的量化分析[J].國(guó)家行政學(xué)院學(xué)報(bào),2017,(4):73-8,146-7.

      [28]許斌豐.技術(shù)創(chuàng)新鏈視角下長(zhǎng)三角三省一市區(qū)域創(chuàng)新系統(tǒng)協(xié)同研究[D].合肥:中國(guó)科學(xué)技術(shù)大學(xué),2018.

      [29]楊艷,郭俊華,余曉燕.政策工具視角下的上海市人才政策協(xié)同研究[J].中國(guó)科技論壇,2018,(4):148-56.

      [30]劉紅波,林彬.中國(guó)人工智能發(fā)展的價(jià)值取向、議題建構(gòu)與路徑選擇——基于政策文本的量化研究[J].電子政務(wù),2018,(11):47-58.

      [31]范利君.2006—2014年間中國(guó)創(chuàng)新政策協(xié)同演變研究[D].成都:電子科技大學(xué),2016.

      [32]裴雷,周兆韜,孫建軍.政策計(jì)量視角的中國(guó)智慧城市建設(shè)實(shí)踐與應(yīng)用[J].圖書(shū)與情報(bào),2016,(6):41-6.

      [33]程瑨.國(guó)家自主創(chuàng)新示范區(qū)政策轉(zhuǎn)移量化與協(xié)同研究[D].合肥:中國(guó)科學(xué)技術(shù)大學(xué),2017.

      [34]張永安,郄海拓.國(guó)務(wù)院創(chuàng)新政策量化評(píng)價(jià)——基于PMC指數(shù)模型[J].科技進(jìn)步與對(duì)策,2017,34(17):127-36.

      [35]Webster J J,Kit C.Tokenization As The Initial Phase In NLP,F(xiàn),1992[C].

      [36]Grimmer J,Stewart B M.Text as Data:The Promise and Pitfalls of Automatic Content Analysis Methods for Political Texts[J].Political Analysis,2013,21(3):267-97.

      [37]Marvel J D,Mcgrath R J.Congress as Manager:Oversight Hearings and Agency Morale[J].Journal of Public Policy,2016,36(3):489-520.

      [38]Haeder S F,Yackee S W.Influence and the Administrative Process:Lobbying the U.S.President's Office of Management and Budget[J].American Political ence Review,2015,109(3):507-22.

      [39]Baker S R,Bloom N,Davis S J.Measuring Economic Policy Uncertainty[J].The Quarterly Journal of Economics,2016,131(4):1593-636.

      [40]Hollibaugh G E,J R.The Use of Text as Data Methods in Public Administration:A Review and an Application to Agency Priorities[J].Journal of Public Administration Research and Theory,2019,29(3):474-90.

      [41]Tausczik Y R,Pennebaker J W.The Psychological Meaning of Words:LIWC and Computerized Text Analysis Methods[J].Journal of Language and Social Psychology,2010,29(1):24-54.

      [42]Windsor L,Dowell N,Windsor A,et al.Leader Language and Political Survival Strategies[J].International Interactions,2018,44(2):321-36.

      [43]Slapin J B,Proksch S O.A Scaling Model for Estimating Time-series Party Positions from Texts[J].American Journal of Political Science,2008,52(3):705-22.

      [44]Hjorth F,Klemmensen R,HobolT S,et al.Computers,Coders,and Voters:Comparing Automated Methods for Estimating Party Positions[J].Research & Politics,2015,2(2).

      [45]Daigneault P M,Duval D,Imbeau L M.Supervised Scaling of Semi-structured Interview Transcripts to Characterize the Ideology of a Social Policy Reform[J].Quality & Quantity,2018,52(5):2151-62.

      [46]Rheault L,Cochrane C.Word Embeddings for the Analysis of Ideological Placement in Parliamentary Corpora[J].Political Analysis,2020,28(1):112-33.

      [47]Alschner W,Skougarevskiy D.Mapping the Universe of International Investment Agreements[J].Journal of International Economic Law,2016,19(3):561-88.

      [48]Spirling A.U.S.Treaty Making with American Indians:Institutional Change and Relative Power,1784-1911[J].American Journal of Political Science,2012,56(1):84-97.

      [49]Rodman E.A Timely Intervention:Tracking the Changing Meanings of Political Concepts with Word Vectors[J].Political Analysis,2020,28(1):87-111.

      [50]Jentsch C,Lee E R,Mammen E.Time-dependent Poisson Reduced Rank Models for Political Text Data Analysis[J].Computational Statistics & Data Analysis,2020,142.

      [51]張永安,閆瑾.基于文本挖掘的科技成果轉(zhuǎn)化政策內(nèi)部結(jié)構(gòu)關(guān)系與宏觀布局研究[J].情報(bào)雜志,2016,35(2):44-9.

      [52]Blaydes L,Grimmer J,Mcqueen A.Mirrors for Princes and Sultans:Advice on the Art of Governance in the Medieval Christian and Islamic Worlds[J].Journal of Politics,2018,80(4):1150-67.

      [53]楊慧,楊建林.融合LDA模型的政策文本量化分析——基于國(guó)際氣候領(lǐng)域的實(shí)證[J].現(xiàn)代情報(bào),2016,36(5):71-81.

      [54]張濤,馬海群,易揚(yáng).文本相似度視角下我國(guó)大數(shù)據(jù)政策比較研究[J].圖書(shū)情報(bào)工作,2020,64(12):26-37.

      [55]Alschner W,Skougarevskiy D.Can Robots Write Treaties?Using Recurrent Neural Networks to Draft International Investment Agreements[M].Bex F,Villata S.Legal Knowledge and Information Systems,2016b:119-24.

      [56]楊銳,楊亮,李良強(qiáng),等.我國(guó)科研誠(chéng)信政策特征及演化邏輯——基于文本挖掘法[J].科技進(jìn)步與對(duì)策,1-10.

      [57]盛東方,尹航.基于政策文本計(jì)算的突發(fā)公共事件下中小企業(yè)扶持政策供需匹配研究——以新冠肺炎疫情為例[J].現(xiàn)代情報(bào),2020,40(8):10-9.

      [58]張寶建,李鵬利,陳勁,等.國(guó)家科技創(chuàng)新政策的主題分析與演化過(guò)程——基于文本挖掘的視角[J].科學(xué)學(xué)與科學(xué)技術(shù)管理,2019,40(11):15-31.

      [59]Gentzkow M,Shapiro J M,Taddy M.Measuring Group Differences in High-Dimensional Choices:Method and Application to Congressional Speech[J].Econometrica,2019,87(4):1307-40.

      [60]Laver M,Garry J.Estimating Policy Positions from Political Texts[J].American Journal of Political Science,2000,44(3):619-34.

      [61]Shaffer R.Cognitive Load and Issue Engagement in Congressional Discourse[J].Cognitive Systems Research,2017,44:89-99.

      [62]Meng Q,Zhang N,Zhao X,et al.The Governance Strategies for Public Emergencies on Social Media and Their Effects:A Case Study Based on the Microblog Data[J].Electronic Markets,2016,26(1):15-29.

      [63]Barberá P,Jost J T,Nagler J,et al.Tweeting from Left to Right:Is Online Political Communication More Than an Echo Chamber?[J].Psychological Science,2015,26(10):1531-42.

      [64]Chang W H,Li J L,Lee C C,et al.Learning Semantic-Preserving Space Using User Profile and Multimodal Media Content from Political Social Network[M].2019 Ieee International Conference on Acoustics,Speech and Signal Processing,2019:3990-4.

      [65]Casas A,Wilkerson J.A Delicate Balance:Party Branding During the 2013 Government Shutdown[J].American Politics Research,2017,45(5):790-812.

      [66]Miller C.Australia's Anti-Islam Right in Their Own Words.Text as Data Analysis of Social Media Content[J].Australian Journal of Political Science,2017,52(3):383-401.

      [67]Egami N,F(xiàn)ong C J,Grimmer J,et al.How to Make Causal Inferences Using Texts[J].arXiv Preprint arXiv:180202163,2018,

      [68]Wilkerson J,Casas A,Annual R.Large-Scale Computerized Text Analysis in Political Science:Opportunities and Challenges[M].Annual Review of Political Science,2017,20:529-44.

      [69]Benoit K,Watanabe K,Wang H,et al.Quanteda:An R Package for the Quantitative Analysis of Textual Data[J].Journal of Open Source Software,2018,3(30):774.

      [70]段堯清,周密,尚婷.我國(guó)政府信息公開(kāi)態(tài)勢(shì)及其調(diào)控策略研究——基于2008—2018年國(guó)務(wù)院部門(mén)政府信息公開(kāi)年報(bào)分析[J].現(xiàn)代情報(bào),2020,40(8):121-8,77.

      [71]陳玲,段堯清.我國(guó)政府開(kāi)放數(shù)據(jù)政策的實(shí)施現(xiàn)狀和特點(diǎn)研究:基于政府公報(bào)文本的量化分析[J].情報(bào)學(xué)報(bào),2020,39(7):698-709.

      [72]Proksch S-O,Wratil C,Waeckerle J.Testing the Validity of Automatic Speech Recognition for Political Text Analysis[J].Political Analysis,2019,27(3):339-59.

      [73]Alschner W,Seiermann J,Skougarevskiy D.Text of Trade Agreements(ToTA)A Structured Corpus for the Text-as-Data Analysis of Preferential Trade Agreements[J].Journal of Empirical Legal Studies,2018,15(3):648-66.

      [74]Benoit K,Conway D,Lauderdale B E,et al.Crowd-sourced Text Analysis:Reproducible and Agile Production of Political Data[J].American Political Science Review,2016,110(2):278-95.

      [75]Roberts M E,Stewart B M,Tingley D.Stm:An R Package for Structural Topic Models[J].Journal of Statistical Software,2019,91(1):1-40.

      (責(zé)任編輯:郭沫含)

      猜你喜歡
      政策文本文本分析定量分析
      中國(guó)男女平等政策演變特征研究
      我國(guó)住房保障政策演進(jìn)分析
      我國(guó)來(lái)華留學(xué)生教育政策變遷的路徑與特點(diǎn)
      中國(guó)節(jié)能減排政策的演進(jìn)
      大規(guī)模古籍文本在中國(guó)史定量研究中的應(yīng)用探索
      FTA在工業(yè)氣體探測(cè)報(bào)警系統(tǒng)中的應(yīng)用
      投資者情緒短期對(duì)股票市場(chǎng)的影響研究
      商務(wù)英語(yǔ)詞匯量與商務(wù)英語(yǔ)閱讀能力相關(guān)性研究
      維護(hù)正統(tǒng)還是觀念復(fù)辟?
      戲劇之家(2016年22期)2016-11-30 16:49:57
      德語(yǔ)小說(shuō)《布登勃洛克一家》中的家文化與中國(guó)傳統(tǒng)家庭觀念比較
      盐源县| 夹江县| 江西省| 长葛市| 栖霞市| 咸丰县| 昌都县| 中卫市| 三门峡市| 新宁县| 宜宾市| 凤翔县| 博野县| 博乐市| 定南县| 大庆市| 凤庆县| 冀州市| 股票| 中宁县| 铜陵市| 长岭县| 定兴县| 勐海县| 青岛市| 新民市| 灵丘县| 泸西县| 中阳县| 惠水县| 明溪县| 泾源县| 襄城县| 青神县| 温泉县| 丰台区| 诏安县| 南昌市| 长泰县| 拜泉县| 上思县|