◆宋濤 劉雙花
(百色學(xué)院廣西 533000)
隨著知識(shí)經(jīng)濟(jì)的興起,知識(shí)在社會(huì)經(jīng)濟(jì)中的地位愈發(fā)突出。知識(shí)的消費(fèi)層次也由傳統(tǒng)的以獲取單一型的事實(shí)和機(jī)理為主的“無機(jī)溫飽型”模式向上發(fā)展為以搜索復(fù)合型知識(shí)的產(chǎn)生、脈絡(luò)和聯(lián)系為主的“有機(jī)營養(yǎng)型”模式,逐漸呈現(xiàn)出多層需求共存的狀態(tài)。而專業(yè)門類的高度細(xì)分增強(qiáng)了學(xué)術(shù)壁壘,加劇了跨界研究規(guī)律的不可知性,迫切需要新的文獻(xiàn)服務(wù)組織方式。從學(xué)術(shù)文獻(xiàn)的發(fā)展來看,學(xué)術(shù)成果數(shù)量激增,內(nèi)容涉及廣泛,不僅人文學(xué)科內(nèi)部交叉研究活躍,與自然科學(xué)的融通滲透性也不斷增強(qiáng)。而人們對跨界研究規(guī)律的認(rèn)識(shí)卻極為有限,已有的研究多以定性研究為主,觀點(diǎn)多局限在某單一領(lǐng)域,缺乏整體性認(rèn)識(shí)[1]。另一方面,對于逐漸走向國際化的人文學(xué)科而言,其學(xué)術(shù)成果對國家的發(fā)展具有不可低估的重要價(jià)值。探索人文學(xué)科跨界知識(shí)模型建模方法,將延展學(xué)術(shù)成果的展現(xiàn)半徑,促進(jìn)知識(shí)承載來源話語體系之間的交流,為學(xué)術(shù)服務(wù)、學(xué)科建設(shè)和研究規(guī)劃等領(lǐng)域提供諸多決策參考[2]。
跨界知識(shí)是相對于領(lǐng)域知識(shí)而言,熊偉等[3]在強(qiáng)調(diào)跨界搜索通過組織資源改善提高組織競爭優(yōu)勢時(shí),指出跨界搜索與組織群落之間的密切關(guān)系,一方面,跨界搜索行為需要相應(yīng)的組織加以依托,另一方面,組織反映著從事這種組織的個(gè)人和群體的活動(dòng)、價(jià)值觀及意圖。Tortoriello 和 Krackhardt[4]指出組織群落背景下跨界知識(shí)的強(qiáng)關(guān)系是實(shí)現(xiàn)跨界搜索的必要條件,群落內(nèi)部和群落之間的橋接關(guān)系能夠促進(jìn)組織搜尋界外不同的新知識(shí),兩類信息的集成是有效提升組織跨界搜索能力的關(guān)鍵,于是跨界結(jié)構(gòu)的關(guān)鍵是穩(wěn)健的跨界群落的發(fā)現(xiàn)。
跨界知識(shí)模型提出的一個(gè)誘因是現(xiàn)存人文學(xué)科學(xué)術(shù)成果評價(jià)體系無法滿足跨界研究規(guī)律的認(rèn)識(shí)需要。目前人文學(xué)科學(xué)術(shù)成果評價(jià)體系中的主流評價(jià)方法有兩類:一是專家系統(tǒng)同行評議法;二是基于引文分析的文獻(xiàn)計(jì)量影響因子法。將同行評議法直接用于跨界知識(shí)提取存在跨界評審專家的遴選困難,數(shù)據(jù)主觀性強(qiáng),成本高,可比性差等問題[5]?;谝姆治鰧W(xué)術(shù)影響因子是學(xué)術(shù)評價(jià)體系的主要標(biāo)準(zhǔn),對知識(shí)結(jié)構(gòu)的揭示作用有限。鑒此,科學(xué)數(shù)據(jù)文獻(xiàn)情報(bào)學(xué)領(lǐng)域已嘗試使用引文網(wǎng)絡(luò)研究文源規(guī)律,典型的研究如[6]等,但引文分析的學(xué)科廣度評價(jià)不適用于跨界知識(shí)提煉。
從文獻(xiàn)的搜索來看,學(xué)科之間大范圍的密切滲透無疑加大了跨界知識(shí)搜索的難度,倒不如承認(rèn)跨界的普遍存在性,而將實(shí)際的跨越定義為程度或距離上的統(tǒng)計(jì)顯著性,于是可以將問題簡化為通過大量數(shù)據(jù)來對未知的跨界進(jìn)行估計(jì),估計(jì)知識(shí)之間的聯(lián)通關(guān)系成為認(rèn)識(shí)跨界知識(shí)發(fā)展脈絡(luò)的主題,關(guān)系的估計(jì)和檢驗(yàn)過程是建立穩(wěn)定的跨界知識(shí)模型的核心。
根據(jù)Li,Y等和Sid hu等對跨界搜索的需求調(diào)查顯示,學(xué)者們主要關(guān)注的跨界內(nèi)容分為三層結(jié)構(gòu):個(gè)體、項(xiàng)目和組織[7]。其中個(gè)體層次的搜索是指個(gè)體獲取外部創(chuàng)造性想法的活動(dòng);項(xiàng)目層次的跨界搜索指了解外部項(xiàng)目新信息或搜尋新項(xiàng)目組成員的過程;組織層次的跨界需求表現(xiàn)為側(cè)重于搜尋新聯(lián)盟成員或?qū)τ幸庀蚝献鞯穆?lián)盟的可行性分析。
跨界知識(shí)和學(xué)術(shù)成果評價(jià)之間的關(guān)系是緊密的,跨界知識(shí)模型與學(xué)術(shù)評價(jià)共同構(gòu)成知識(shí)的評價(jià)體系,如圖1所示,其中基于引文關(guān)系的學(xué)術(shù)影響力因子、半衰期等主要反映了知識(shí)自身體系的成長發(fā)展的貢獻(xiàn),另一方面,知識(shí)對外部領(lǐng)域的滲透與融合是其學(xué)術(shù)影響力的一個(gè)重要方面??缃缰R(shí)模型可以是對不同來源技術(shù)領(lǐng)域創(chuàng)造性活動(dòng)的規(guī)律總結(jié),是對基于引文的知識(shí)評價(jià)體系的有益補(bǔ)充。
圖1 知識(shí)的價(jià)值體系
為了使跨界知識(shí)規(guī)律能夠體現(xiàn)社會(huì)的認(rèn)可程度,選擇學(xué)者選讀文獻(xiàn)是基礎(chǔ)。
首先,納入社會(huì)化影響效果是建立面向?qū)W術(shù)服務(wù)的知識(shí)模型的必要條件。美國社會(huì)學(xué)家羅伯特·默頓[9]1985年在《科學(xué)的規(guī)范結(jié)構(gòu)》中給出了學(xué)術(shù)成果的一個(gè)重要的功能,指出其價(jià)值是在科學(xué)家之間起著根本的交流作用。交流的結(jié)果是科學(xué)家通過同構(gòu)性問題映射開啟新思維,獲得新知識(shí)創(chuàng)作的源泉與素材,選讀文獻(xiàn)一般貫穿于整個(gè)研究過程之中,可作為社會(huì)化影響效果的一個(gè)重要方面。
其次,學(xué)者選讀文獻(xiàn)是提煉跨界知識(shí)的最佳視角。塔佳,瓦卡瑞,弗萊和沃特斯(Talja,Vakkari,F(xiàn)ry,Wouters)指出跨學(xué)科性與一個(gè)領(lǐng)域的科學(xué)家使用其他學(xué)科的文獻(xiàn)有關(guān),科學(xué)家對文獻(xiàn)的選擇行為可用于度量學(xué)科之間聯(lián)系的程度[10]。
跨界知識(shí)是一種隱性知識(shí),不易直接測量,只能通過微觀個(gè)體數(shù)據(jù)間接估計(jì)得出,并利用建模過程進(jìn)行模式的統(tǒng)計(jì)確認(rèn),關(guān)鍵的問題是對不同維度的強(qiáng)關(guān)系矩陣進(jìn)行估計(jì),主要解決的問題有兩個(gè):一是關(guān)系類的識(shí)別,主要使用社會(huì)網(wǎng)絡(luò)理論中的社群關(guān)系估計(jì)挖掘算法;二是關(guān)系結(jié)構(gòu)的解釋,使用統(tǒng)計(jì)推斷中的隨機(jī)圖檢驗(yàn)方法,兩者聯(lián)合命名為 “網(wǎng)絡(luò)關(guān)系估計(jì)-隨機(jī)圖檢驗(yàn)”跨界知識(shí)連體建模框架,該框架首先是將彼此具有較強(qiáng)關(guān)系的節(jié)點(diǎn)聚集,并將互聯(lián)顯示較弱的群彼此割裂,隨機(jī)圖檢驗(yàn)則固化核心結(jié)構(gòu)。
Newman于2004[11]年提出模塊Q方法是社群挖掘中比較典型的方法。
其中Avw表示關(guān)系圖中頂點(diǎn)v和w之間的邊數(shù),這里我們選擇復(fù)雜圖,此時(shí)Avw取值為0或權(quán)重c,表示節(jié)點(diǎn)之間有關(guān)系或強(qiáng)度為c的兩兩關(guān)系;m是總邊數(shù),常數(shù)項(xiàng)1/2是歸一化系數(shù),Pvw表示零模型(即隨機(jī)圖)中頂點(diǎn)v和w之間期望的邊數(shù);示性函數(shù)δ(Cv,Cw)=1,如果社群Cv=Cw(即頂點(diǎn)v和w屬于同一個(gè)社群),否則為0。Q定義了實(shí)際圖社群邊連通密度相對于隨機(jī)圖的差異,社群內(nèi)邊密度與隨機(jī)圖期望邊密度相比越大,表明社群結(jié)構(gòu)越明顯。在跨學(xué)科研究中,學(xué)科合作具有規(guī)模不等和合作不平衡等特點(diǎn),直接使用Q算法,將掩蓋小學(xué)科的特色合作。社群挖掘算法需要考慮帶邊權(quán)重的WFN算法。
隨機(jī)圖模型的作用是對典型的網(wǎng)絡(luò)模式的顯著性進(jìn)行檢驗(yàn),指數(shù)圖模型是較為常見的檢驗(yàn)?zāi)J降姆椒ǎ僭O(shè)圖G=(V,E),Y=(Yij)是隨機(jī)關(guān)系矩陣,如式2所示,
其中,H是一種圖結(jié)構(gòu),gH(y)是關(guān)于某個(gè)結(jié)構(gòu)的統(tǒng)計(jì)量,θH是對應(yīng)的參數(shù)。k是歸一化常數(shù)。
直接解指數(shù)族圖模型的參數(shù)估計(jì)不容易,一般是采用指數(shù)族圖模型估計(jì)方程,如式(3),對于y,令是兩個(gè)對應(yīng)的矩陣。的(i,j)、(j, i)位置上的元素是1,其他位置元素與y相同;的(i,j)、(j, i)位置上的元素是0,其他位置元素與y相同。那么邊(i,j)存在的概率的對數(shù)為:
概率隨機(jī)圖模型參數(shù)估計(jì)采用對式(3)進(jìn)行極大似然估計(jì),求解期望的問題就可以使用蒙特卡羅或Gibbs采樣。逼近估計(jì)表示為:
文章以學(xué)者選讀文獻(xiàn)為分析對象,對跨地域協(xié)同合作的成效進(jìn)行相關(guān)分析,試圖找出人文學(xué)科領(lǐng)域跨界協(xié)同創(chuàng)新聯(lián)盟的合作特點(diǎn)。數(shù)據(jù)以211或985高校和邊遠(yuǎn)地區(qū)高校組成創(chuàng)新聯(lián)盟,時(shí)間選擇了自2011年201月共計(jì)16204條取某人文學(xué)科大學(xué)博士生和在職教師下載中國知網(wǎng)學(xué)術(shù)文獻(xiàn),西部地區(qū)選擇了西藏、重慶、四川、貴州、云南、陜西、甘肅、青海、寧夏、新疆、內(nèi)蒙古和廣西12個(gè)有西部省市自治區(qū)機(jī)構(gòu)參與的論文共計(jì)2457篇作為研究跨機(jī)構(gòu)合作的基礎(chǔ)數(shù)據(jù),其中涉及了2102個(gè)不重復(fù)的中外研究機(jī)構(gòu),這些機(jī)構(gòu)包括所在省市、機(jī)構(gòu)名稱、主管部門、所在地和辦學(xué)層次。根據(jù)記錄生成機(jī)構(gòu)間的鄰接矩陣。通過Q方法產(chǎn)生合作網(wǎng)絡(luò)關(guān)系圖2,9個(gè)社群彼此相對獨(dú)立,7個(gè)社群群內(nèi)成員多數(shù)僅限于同一省份內(nèi),說明地理位置是實(shí)現(xiàn)跨界協(xié)同創(chuàng)新的一個(gè)重要因素。9個(gè)社群多位于不同的省份,但其共同點(diǎn)是每個(gè)區(qū)域的中心機(jī)構(gòu)均為“社群多位或全國重點(diǎn)建設(shè)大學(xué)。
表1的隨機(jī)圖模型檢驗(yàn)中,三角型互聯(lián)結(jié)構(gòu)沒有通過檢驗(yàn),p-值為0.1148,星型輻射結(jié)構(gòu)較互聯(lián)結(jié)構(gòu)相比通過檢驗(yàn),p-值為10-6,支持了輻射結(jié)構(gòu)的結(jié)論。結(jié)果說明社群名校的強(qiáng)弱“幫補(bǔ)型”合作在創(chuàng)新研究中特色突出,反映了跨機(jī)構(gòu)協(xié)同創(chuàng)新合作中的星型結(jié)構(gòu)和地域特點(diǎn),星型結(jié)構(gòu)中的強(qiáng)校紐帶作用比較突出,呈現(xiàn)出明顯的強(qiáng)弱聯(lián)盟合作創(chuàng)新模式,這離不開教育部2001年開始實(shí)施的“對口支援西部地區(qū)高等學(xué)校計(jì)劃”。
圖2 跨層次機(jī)構(gòu)合作關(guān)系圖
表1 隨機(jī)圖檢驗(yàn)結(jié)果
取某人文學(xué)科大學(xué)二級(jí)教授及其博士生2011年上半年在中國知網(wǎng)選讀文獻(xiàn),兩個(gè)學(xué)科的跨學(xué)科關(guān)系強(qiáng)度定義為被同一學(xué)者在所選時(shí)間范圍內(nèi)兩學(xué)科文獻(xiàn)的數(shù)量,基于同讀同時(shí)性的要求,獲取有效文獻(xiàn)53268篇,學(xué)者300位分屬22個(gè)學(xué)科,文獻(xiàn)來自37個(gè)學(xué)科。對數(shù)據(jù)一次做二分圖轉(zhuǎn)化和過濾程序后,使用社區(qū)提取方法得到共讀文獻(xiàn)的跨學(xué)科影響,文獻(xiàn)學(xué)科網(wǎng)絡(luò)聚類將跨學(xué)科影響關(guān)系分為4大群:第一大群是人文學(xué)科類(紅色類和綠色類),綠色類可以看作是人文學(xué)科類,紅色類為社會(huì)科學(xué)類,可以看出人文與社會(huì)科學(xué)兩類聯(lián)系很緊密;第二大群是理工類。計(jì)算機(jī)科學(xué)與技術(shù)在理工科類和人文學(xué)科類中起到關(guān)鍵的聯(lián)系作用。
圖6 文獻(xiàn)跨學(xué)科影響社群結(jié)構(gòu)圖
第三大群是工程類學(xué)科組成的群,包括計(jì)算機(jī)科學(xué)與技術(shù)、數(shù)學(xué)、基礎(chǔ)醫(yī)學(xué)、生物學(xué)等組成的社群。其中核心學(xué)科是計(jì)算機(jī)科學(xué)與技術(shù),跨學(xué)科最強(qiáng)的關(guān)系是計(jì)算機(jī)科學(xué)與數(shù)學(xué),生物學(xué)-計(jì)算機(jī)科學(xué)。第四大群是機(jī)械工程、環(huán)境科學(xué)與工程、藥學(xué)等組成的社群。
從跨學(xué)科文獻(xiàn)閱讀來看,自然科學(xué)向人文學(xué)科的滲透強(qiáng)于人文學(xué)科向自然科學(xué)的滲透,人文學(xué)科各門類之間的交融面上發(fā)揮連接橋梁的學(xué)科是經(jīng)濟(jì)學(xué)、政治學(xué)、法學(xué)、哲學(xué)、新聞學(xué)、語言文學(xué)等學(xué)科。
文章研究了學(xué)術(shù)成果中蘊(yùn)含的跨界群落產(chǎn)生的數(shù)據(jù)和分析模型,從人文學(xué)科學(xué)者選讀文獻(xiàn)視角出發(fā)探討跨界關(guān)系的估計(jì)問題,引入社會(huì)網(wǎng)絡(luò)理論的網(wǎng)絡(luò)關(guān)系估計(jì)算法,發(fā)展出 章網(wǎng)絡(luò)關(guān)系估計(jì)-隨機(jī)圖檢驗(yàn)”跨界知識(shí)連體建??蚣埽摽蚣馨缃珀P(guān)聯(lián)矩陣的估計(jì)算法和隨機(jī)圖模型穩(wěn)健模式檢驗(yàn)兩個(gè)部分。綜合使用模塊社群挖掘算法和隨機(jī)圖檢驗(yàn)連體,揭示了人文學(xué)科跨機(jī)構(gòu)協(xié)同創(chuàng)新合作和跨學(xué)科合作基本模式。
網(wǎng)絡(luò)安全技術(shù)與應(yīng)用2020年12期