謝文亮,溫優(yōu)華,鄭添尹
(1. 廣東財(cái)經(jīng)大學(xué) 學(xué)報(bào)編輯部,廣東 廣州 510320;2.韓山師范學(xué)院 學(xué)報(bào)編輯部,廣東 潮州 521041;3. 廣西師范大學(xué) 政治與公共管理學(xué)院,廣西 桂林 541004)
目前,我國(guó)高校學(xué)術(shù)期刊出版研究主要集中在媒介融合上.在學(xué)術(shù)期刊傳統(tǒng)媒體的網(wǎng)絡(luò)化、數(shù)字化和信息化上,程維紅[1]、游濱[2]、趙文義[3]等分析我國(guó)數(shù)字出版的發(fā)展現(xiàn)狀和存在的問(wèn)題,提出我國(guó)科技期刊的數(shù)字出版策略和改革取向;李剛[4]、李新根[5]、劉英[6]等研究互聯(lián)網(wǎng)下學(xué)術(shù)不端行為以及學(xué)術(shù)期刊的防范對(duì)策;張科[7]、謝暄[8]研究網(wǎng)絡(luò)互動(dòng)采編和網(wǎng)絡(luò)采編平臺(tái)優(yōu)化,深化內(nèi)容融合程度的策略;徐文娟[9]、張艷艷[10]、周海秋[11]等研究互聯(lián)網(wǎng)思維本質(zhì),創(chuàng)新學(xué)術(shù)期刊經(jīng)營(yíng)模式以實(shí)現(xiàn)跨越式發(fā)展.從互聯(lián)網(wǎng)向移動(dòng)互聯(lián)網(wǎng)和“互聯(lián)網(wǎng)+”應(yīng)用轉(zhuǎn)型研究上,史春薇[12]研究利用微信進(jìn)行稿件的遠(yuǎn)程校對(duì);石婧[13]研究利用微信平臺(tái)構(gòu)建科技期刊影響力和傳播力評(píng)價(jià)指標(biāo)體系;吳彬[14]研究將微信平臺(tái)應(yīng)用于科技期刊審稿、組稿、定稿以及人性化讀者服務(wù)等;袁澤軼[15]研究利用微信公眾平臺(tái)實(shí)現(xiàn)科技期刊的多極傳播與精準(zhǔn)傳播;余溢文[16]研究將微信公眾平臺(tái)作為交流平臺(tái),提供信息服務(wù)、互動(dòng)交流等;周建森[17]探討“互聯(lián)網(wǎng)+”時(shí)代出版轉(zhuǎn)型升級(jí)路徑,實(shí)現(xiàn)從內(nèi)容提供商向服務(wù)提供商的轉(zhuǎn)變;鄧菁[18]提出以互聯(lián)網(wǎng)思維改革期刊發(fā)展模式,實(shí)現(xiàn)期刊出版與互聯(lián)網(wǎng)的全方位對(duì)接;嚴(yán)飛[19]提出重新定位期刊內(nèi)容,重新塑造傳播模式和構(gòu)建服務(wù)模式;劉成勇[20]指出大多數(shù)學(xué)術(shù)期刊還停留在粗放式出版階段,沒(méi)有真正實(shí)施互聯(lián)網(wǎng)出版及服務(wù)模式.
國(guó)內(nèi)開(kāi)始研究5G在出版業(yè)的應(yīng)用,但尚未重視在學(xué)術(shù)期刊的應(yīng)用.在中國(guó)知網(wǎng)上,傳播領(lǐng)域的5G研究集中在新聞和傳媒.以“5G+傳媒”“5G+新聞”“5G+出版”為主題進(jìn)行檢索,檢索到85、143和62篇中文文獻(xiàn)①注:檢索時(shí)間是2020-12-15.下同.;以“5G+學(xué)報(bào)”進(jìn)行檢測(cè),未發(fā)現(xiàn)有相關(guān)主題的文獻(xiàn);以“5G+期刊”、“5G+學(xué)術(shù)期刊”為主題進(jìn)行檢索,則分別檢索到9篇和5篇研究文獻(xiàn).在已有的文獻(xiàn)中,蔣傳洋[21]以博庫(kù)集團(tuán)為例,研究5G時(shí)代以圖書(shū)電商為基礎(chǔ)的出版生態(tài)系統(tǒng).劉允杰[22]、馮宏聲[23]分析5G時(shí)代出版業(yè)的發(fā)展變化規(guī)律和前景;李曉鹓[24]研究5G時(shí)代出版業(yè)與新技術(shù)融合發(fā)展,更好利用新技術(shù)實(shí)現(xiàn)傳承文化、服務(wù)社會(huì)的功能.從已有的中文文獻(xiàn)可以看到,對(duì)5G 在新聞傳媒方面的應(yīng)用研究尚屬起步階段,研究的層次、深度都較低,有待多層次、多方面進(jìn)行系統(tǒng)、深入的研究;5G尚未引起學(xué)術(shù)期刊界的重視,對(duì)學(xué)術(shù)期刊的5G時(shí)代的資源融合與創(chuàng)新方面沒(méi)有相關(guān)的研究成果公開(kāi)發(fā)表.
學(xué)術(shù)期刊出版隨著通信技術(shù)和信息技術(shù)的發(fā)展而發(fā)生變革和創(chuàng)新.早在2015年,我國(guó)就已經(jīng)發(fā)布《5G概念白皮書(shū)》[25],2017年8月國(guó)務(wù)院發(fā)布《關(guān)于進(jìn)一步擴(kuò)大和升級(jí)信息消費(fèi)持續(xù)釋放內(nèi)需潛力的指導(dǎo)意見(jiàn)》中提到,要“推動(dòng)信息基礎(chǔ)設(shè)施提速升級(jí)”.隨著第五代移動(dòng)通信技術(shù)的實(shí)施,5G具有高數(shù)據(jù)速率、減少延遲、節(jié)省能源、降低成本、提高系統(tǒng)容量和大規(guī)模設(shè)備連接等特點(diǎn),我國(guó)學(xué)術(shù)期刊在5G通信技術(shù)支撐下與物聯(lián)網(wǎng)、人工智能、大數(shù)據(jù)等信息技術(shù)融合,將進(jìn)入智能互聯(lián)出版時(shí)代.雖然4G時(shí)代已存在物聯(lián)網(wǎng)、人工智能、大數(shù)據(jù)技術(shù),但缺乏強(qiáng)大、高效的通信能力支撐,與學(xué)術(shù)期刊融合沒(méi)有取得突破性進(jìn)展.5G時(shí)代通信能力將得到解決,形成強(qiáng)大的智能互聯(lián)網(wǎng).我國(guó)學(xué)術(shù)期刊要抓住政策機(jī)遇,加快與科技融合,真正推動(dòng)學(xué)術(shù)期刊信息化建設(shè).學(xué)術(shù)期刊以“內(nèi)容為王”,內(nèi)容資源是學(xué)術(shù)期刊“寶藏”,傳統(tǒng)的學(xué)術(shù)期刊內(nèi)容資源缺乏技術(shù)支撐,無(wú)法做到有效的內(nèi)容資源整合.5G環(huán)境下智能互聯(lián)網(wǎng)出版將給內(nèi)容資源帶來(lái)整合技術(shù)和整合方式,如何更好整合學(xué)術(shù)期刊內(nèi)容資源“寶藏”將是本文研究的目標(biāo).
學(xué)術(shù)期刊內(nèi)容資源包括全文和元數(shù)據(jù)兩部分.全文包括題名、作者信息、摘要、關(guān)鍵詞、正文、參考文獻(xiàn)等,是學(xué)術(shù)論文的全部?jī)?nèi)容;元數(shù)據(jù)包括刊名、刊號(hào)等版權(quán)頁(yè)信息、中英文目次、欄目、文章題名、作者信息、摘要、關(guān)鍵詞、中圖分類號(hào)、文獻(xiàn)標(biāo)識(shí)碼、文章編號(hào)、收稿日期、基金項(xiàng)目、參考文獻(xiàn)等,是學(xué)術(shù)論文的部分內(nèi)容.
學(xué)術(shù)期刊內(nèi)容資源整合經(jīng)常被辦刊者所忽視.我國(guó)學(xué)術(shù)期刊缺乏內(nèi)容資源的信息挖掘、數(shù)據(jù)分析、知識(shí)發(fā)現(xiàn)以及關(guān)聯(lián)等,使得內(nèi)容資源利用率不高,內(nèi)容重復(fù)現(xiàn)象嚴(yán)重,浪費(fèi)了大量的辦刊資源;再者,學(xué)術(shù)期刊資源的關(guān)聯(lián)度不高,無(wú)法進(jìn)一步挖掘出相關(guān)的、有用的信息,使得資源與資源之間形成一個(gè)個(gè)“孤島”.只有通過(guò)關(guān)聯(lián)挖掘,才能為這些資源“孤島”搭建起“橋梁”,實(shí)現(xiàn)信息資源之間的共享.內(nèi)容是立刊之本,是期刊競(jìng)爭(zhēng)力強(qiáng)弱的主要因素之一,因此大多數(shù)學(xué)術(shù)期刊都采取“內(nèi)容為王”的策略,以策劃、組織高質(zhì)量的稿件為主.學(xué)術(shù)論文公開(kāi)發(fā)表后,沒(méi)有對(duì)內(nèi)容作進(jìn)一步處理,也很少有期刊對(duì)內(nèi)容資源的內(nèi)涵進(jìn)行研究,導(dǎo)致內(nèi)容資源在整合上顯現(xiàn)一盤(pán)沙的狀態(tài),這對(duì)期刊內(nèi)容資源來(lái)說(shuō)是極度浪費(fèi).我國(guó)學(xué)術(shù)期刊的內(nèi)容資源豐富,以最大的學(xué)術(shù)期刊數(shù)據(jù)庫(kù)中國(guó)知網(wǎng)為例,截止到2019 年9 月份,共收錄了8 730 多種期刊,全文文獻(xiàn)5 500 多萬(wàn)篇論文(數(shù)據(jù)來(lái)源:中國(guó)知網(wǎng)).但是,龐大的學(xué)術(shù)期刊資源,缺乏有效的深度數(shù)字化加工、資源整合,使學(xué)術(shù)期刊內(nèi)容資源難以得到有效利用.早在2014年4月份,原國(guó)家新聞出版廣電總局《關(guān)于規(guī)范學(xué)術(shù)期刊出版秩序促進(jìn)學(xué)術(shù)期刊健康發(fā)展的通知》[26]指出,當(dāng)前學(xué)術(shù)期刊的集約化水平較低,表示形態(tài)單一,對(duì)其內(nèi)容資源之間缺乏相關(guān)的深度挖掘、分析和關(guān)聯(lián),使得所出版的內(nèi)容互相獨(dú)立、互相割裂,相互之間成了“信息孤島”.雖然數(shù)據(jù)挖掘、分類、聚合等圖書(shū)情報(bào)和計(jì)算機(jī)網(wǎng)絡(luò)、大數(shù)據(jù)計(jì)算等技術(shù)使學(xué)術(shù)期刊資源整合取得了進(jìn)步,然而,這些技術(shù)過(guò)于依賴人工制定的計(jì)算機(jī)程序,無(wú)法模擬人類的辨識(shí)能力,知識(shí)發(fā)現(xiàn)和知識(shí)推理能力有限,資源整合的程度不高,使資源無(wú)法得到充分的利用.3G和4G時(shí)代,雖然已存在物聯(lián)網(wǎng)、人工智能、大數(shù)據(jù)技術(shù),但缺乏強(qiáng)大、高效的通信能力支撐,學(xué)術(shù)期刊內(nèi)容資源的開(kāi)發(fā)沒(méi)有取得突破性進(jìn)展.5G時(shí)代高數(shù)據(jù)速率通信能力下將形成強(qiáng)大的智能互聯(lián)網(wǎng),為學(xué)術(shù)期刊利用人工智能進(jìn)行內(nèi)容資源整合帶來(lái)機(jī)遇.
1.2.1 學(xué)術(shù)期刊內(nèi)容資源整合涵義
學(xué)術(shù)期刊內(nèi)容資源整合指的是將已出版的學(xué)術(shù)期刊元數(shù)據(jù)和內(nèi)容數(shù)據(jù)通過(guò)知識(shí)發(fā)現(xiàn)方法,將看似獨(dú)立、無(wú)聯(lián)系的數(shù)據(jù)有機(jī)結(jié)合起來(lái),形成內(nèi)容資源數(shù)據(jù)庫(kù);在此基礎(chǔ)上運(yùn)用知識(shí)推理、聚類分析、關(guān)聯(lián)規(guī)則等知識(shí)發(fā)現(xiàn)技術(shù),通過(guò)時(shí)序推理、不確定推理、概率推理和主觀貝葉斯方法等人工智能方法,對(duì)內(nèi)容資源進(jìn)行高級(jí)推理,推出各種可能性,并從概率上推出最大可能的知識(shí)關(guān)聯(lián);最后,通過(guò)人工智能系統(tǒng)建設(shè)各種專家系統(tǒng),深層次挖掘、高附加值、個(gè)性化的服務(wù)產(chǎn)品,形成智能決策支持系統(tǒng),為各種單位提供專家支持,達(dá)到有效的開(kāi)發(fā)和利用學(xué)術(shù)期刊內(nèi)容資源的目的.
1.2.2 學(xué)術(shù)期刊內(nèi)容資源整合的重要性
(1)通過(guò)內(nèi)容資源整合形成大數(shù)據(jù)庫(kù).數(shù)據(jù)庫(kù)是學(xué)術(shù)期刊數(shù)字化程度高低的體現(xiàn),通過(guò)內(nèi)容資源的整合,建立起期刊數(shù)據(jù)庫(kù),提高學(xué)術(shù)期刊數(shù)字化水平.傳統(tǒng)數(shù)據(jù)庫(kù)僅有期刊論文資源,而內(nèi)容資源整合而成的數(shù)據(jù)庫(kù)則是全方位、多層次和寬領(lǐng)域,包括了各種期刊內(nèi)容數(shù)據(jù)庫(kù),如元數(shù)據(jù)庫(kù)、作者信息數(shù)據(jù)庫(kù)、專家信息數(shù)據(jù)庫(kù)以及讀者數(shù)據(jù)庫(kù)等,為進(jìn)一步建立起智庫(kù)系統(tǒng)提供支撐.
(2)通過(guò)內(nèi)容資源整合形成各種智庫(kù)應(yīng)用.內(nèi)容資源整合形成的數(shù)據(jù)庫(kù),通過(guò)進(jìn)一步的知識(shí)挖掘、關(guān)聯(lián)、分類、聚類等,形成一張互聯(lián)的知識(shí)網(wǎng),并從知識(shí)網(wǎng)中進(jìn)一步挖掘信息,形成智庫(kù).智庫(kù)能幫助出版單位發(fā)現(xiàn)作者人才、研究團(tuán)隊(duì)、選題重點(diǎn)等;幫助讀者了解期刊選題新穎性、時(shí)效性以及重要性等,也為讀者提供選題的智能支持、期刊相關(guān)信息獲取等;對(duì)于政府、企業(yè)和社會(huì)各單位來(lái)說(shuō),智庫(kù)能提供咨詢功能,為各個(gè)單位提供支持,包括智力支撐、數(shù)據(jù)支撐、決策支撐等.
(3)內(nèi)容資源整合有利于擴(kuò)大學(xué)術(shù)期刊傳播力.以內(nèi)容資源為支撐,以期刊出版過(guò)程中的各個(gè)對(duì)象、內(nèi)容資源以及互聯(lián)網(wǎng)平臺(tái)等形成互聯(lián)網(wǎng)出版平臺(tái)生態(tài)圈,促進(jìn)以內(nèi)容資源為核心的平臺(tái)生態(tài)圈吸引用戶加入,在資源共享與信息互動(dòng)中成長(zhǎng),通過(guò)平臺(tái)生態(tài)圈激發(fā)網(wǎng)絡(luò)效應(yīng),賦予用戶歸屬感,促進(jìn)用戶規(guī)模不斷持續(xù)擴(kuò)大,擴(kuò)大學(xué)術(shù)期刊的傳播力,保持和增強(qiáng)學(xué)術(shù)期刊競(jìng)爭(zhēng)力.
(4)通過(guò)內(nèi)容資源整合促進(jìn)集約辦刊局面的形成.我國(guó)學(xué)術(shù)期刊由于歷史原因,形成了粗放式出版的模式.以高校學(xué)報(bào)為例,普遍形成一校辦一刊,或一校辦多刊的局面,根本就不必考慮出版的內(nèi)容是否與其它的刊物重復(fù),或是出版的內(nèi)容是否有價(jià)值.這種一盤(pán)散沙辦刊的方式,造成了極大的辦刊資源浪費(fèi).在國(guó)外,出版商利用網(wǎng)絡(luò)優(yōu)勢(shì),形成以名刊為龍頭的出版集團(tuán),技術(shù)商提供技術(shù)支撐,出版經(jīng)營(yíng)分開(kāi)的大型出版集團(tuán)模式,如Elsvier,Springer,在這些出版集團(tuán)內(nèi)部,廣泛采用集約式的出版,將一切的出版要素投入到能產(chǎn)生最大效益的內(nèi)容資源獲取上,并通過(guò)出版集團(tuán)的協(xié)調(diào),對(duì)期刊內(nèi)容資源進(jìn)行整合,避免同一出版集團(tuán)中不同刊物的內(nèi)容重復(fù)出版;利用整合將期刊里的資源連點(diǎn)成線,形成一系列有針對(duì)性、有連貫性的期刊,期刊之間是互補(bǔ)的、內(nèi)容資源無(wú)競(jìng)爭(zhēng)性,各個(gè)期刊之間能滿足市場(chǎng)對(duì)某一方面的內(nèi)容的需求;而期刊又能充分利用出版集團(tuán)的雄厚實(shí)力、傳播手段以及發(fā)行渠道,將內(nèi)容資源發(fā)送到讀者手中.
傳統(tǒng)的學(xué)術(shù)期刊資源整合是采用計(jì)算機(jī)數(shù)據(jù)挖掘的方法分三步實(shí)施:一是學(xué)術(shù)期刊檢索數(shù)據(jù)庫(kù)的建立,用于學(xué)術(shù)期刊資源的采集;二是挖掘發(fā)現(xiàn)數(shù)據(jù)庫(kù)中的各種關(guān)系,運(yùn)用各種數(shù)據(jù)挖掘分析工具,發(fā)現(xiàn)數(shù)據(jù)與數(shù)據(jù)之間的深層次聯(lián)系;三是決策系統(tǒng)的建立,根據(jù)分析的結(jié)果,為用戶提供決策建議.存在的問(wèn)題是:首先,采取關(guān)鍵詞匹配算法,關(guān)鍵詞匹配方法是被動(dòng)的,無(wú)法實(shí)現(xiàn)計(jì)算機(jī)程序與人之間的互動(dòng);其次,智能程度低,在匹配過(guò)程中,缺乏啟發(fā)式的知識(shí)發(fā)現(xiàn)和關(guān)聯(lián);第三,關(guān)鍵詞匹配提供的結(jié)果唯一,缺乏多方面的可選擇性結(jié)果.由于被動(dòng)、非智能式數(shù)據(jù)挖掘方式,學(xué)術(shù)期刊內(nèi)容資源的整合無(wú)法達(dá)到更精確,也無(wú)法提供多個(gè)決策選擇或提供根據(jù)不同需求的人性化內(nèi)容資源整合.
5G環(huán)境下人工智能為學(xué)術(shù)期刊資源的有效整合和利用帶來(lái)了機(jī)遇.大數(shù)據(jù)和人工智能的結(jié)合得到5G高效通信能力支撐,形成了智能互聯(lián)網(wǎng).智能互聯(lián)網(wǎng)與學(xué)術(shù)期刊出版結(jié)合的重點(diǎn)之一就是基于“智能互聯(lián)網(wǎng)+出版”理論體系下學(xué)術(shù)期刊內(nèi)容融合.本文提出了依托5G+大數(shù)據(jù)技術(shù),建設(shè)“數(shù)據(jù)驅(qū)動(dòng)”和“智能驅(qū)動(dòng)”共同作用的學(xué)術(shù)期刊內(nèi)容挖掘與知識(shí)發(fā)現(xiàn)系統(tǒng),對(duì)內(nèi)容資源進(jìn)行準(zhǔn)確、可靠、穩(wěn)定的挖掘、分類和聚類;利用人工智能出版多元化知識(shí)產(chǎn)品,將傳統(tǒng)學(xué)術(shù)期刊內(nèi)容資源進(jìn)一步擴(kuò)展為文獻(xiàn)產(chǎn)品、知識(shí)產(chǎn)品、知識(shí)資源、知識(shí)工具、知識(shí)服務(wù)等,以此實(shí)現(xiàn)智能互聯(lián)網(wǎng)下學(xué)術(shù)期刊內(nèi)容整合途徑.
內(nèi)容資源知識(shí)表示是知識(shí)處理的基礎(chǔ).學(xué)術(shù)期刊內(nèi)容資源的知識(shí)表示是將內(nèi)容以及內(nèi)容之間的關(guān)系用計(jì)算機(jī)能夠識(shí)別的方式表示出來(lái).不同國(guó)家、不同期刊在不同時(shí)期采取了不同的知識(shí)表示,難以形成統(tǒng)一的標(biāo)準(zhǔn),而內(nèi)容資源的表示也關(guān)系到不同期刊數(shù)據(jù)庫(kù)之間的共享、互操作以及檢索等問(wèn)題.學(xué)術(shù)期刊內(nèi)容資源是由元數(shù)據(jù)(mega data)組成,元數(shù)據(jù)是學(xué)術(shù)期刊數(shù)據(jù)表示的主要方法,如題名、摘要、關(guān)鍵詞等,是元數(shù)據(jù)的組成元素.目前國(guó)際上比較出名的元數(shù)據(jù)有DC(Dublin Core)、MARC等,國(guó)內(nèi)有CNMARC等,不同的元數(shù)據(jù)表示導(dǎo)致不同的數(shù)據(jù)庫(kù)之間的互操作性變?nèi)?,因此必須?duì)元數(shù)據(jù)進(jìn)行深度加工.多種表示格式對(duì)整個(gè)學(xué)術(shù)期刊在開(kāi)展數(shù)字化建設(shè)時(shí),造成極大的資源(包括人力、財(cái)力和物力)浪費(fèi),又不利于學(xué)術(shù)期刊內(nèi)容資源的交換和整合.
5G下內(nèi)容資源的知識(shí)表示將以人工智能的本體資源描述得以解決.人工智能下學(xué)術(shù)期刊對(duì)本體的研究有了突破性的進(jìn)展.不同的學(xué)術(shù)期刊數(shù)字化可因地制宜,采用多種數(shù)據(jù)格式,然后通過(guò)基于XML的RDF對(duì)資源進(jìn)行描述,實(shí)現(xiàn)各期刊資源的信息映射.隨著語(yǔ)義出版研究的進(jìn)一步深入,學(xué)術(shù)期刊開(kāi)始構(gòu)建本學(xué)科的本體,如CSSCI本體[27]、醫(yī)學(xué)領(lǐng)域本體[28]、中醫(yī)藥領(lǐng)域本體[29]、農(nóng)業(yè)學(xué)本體[30]、地理本體[31]等.本體對(duì)期刊內(nèi)容資源進(jìn)行自動(dòng)重新標(biāo)引,形成新的知識(shí)庫(kù),知識(shí)庫(kù)中各期刊的元數(shù)據(jù)都用統(tǒng)一的本體表示方法.本體技術(shù)通過(guò)語(yǔ)義映射,將用戶不同的語(yǔ)言表達(dá)查詢轉(zhuǎn)化為本體的表達(dá),實(shí)現(xiàn)了語(yǔ)義查詢.
經(jīng)過(guò)人工智能本體表示后的學(xué)術(shù)期刊內(nèi)容,適合進(jìn)行智能數(shù)據(jù)挖掘,以發(fā)現(xiàn)更多有價(jià)值的信息.智能互聯(lián)下學(xué)術(shù)期刊內(nèi)容資源的挖掘依托5G+大數(shù)據(jù)和人工智能技術(shù),建設(shè)“數(shù)據(jù)驅(qū)動(dòng)”與“智能驅(qū)動(dòng)”的學(xué)術(shù)期刊內(nèi)容挖掘與知識(shí)發(fā)現(xiàn)系統(tǒng),并對(duì)內(nèi)容資源進(jìn)行準(zhǔn)確、可靠、穩(wěn)定地分類和聚類.
2.2.1 學(xué)術(shù)期刊內(nèi)容資源數(shù)據(jù)挖掘
基于“數(shù)據(jù)驅(qū)動(dòng)”與“智能驅(qū)動(dòng)”的學(xué)術(shù)期刊內(nèi)容資源數(shù)據(jù)挖掘分三步走:一是學(xué)術(shù)期刊檢索數(shù)據(jù)庫(kù)的建立;二是挖掘發(fā)現(xiàn)數(shù)據(jù)庫(kù)中的各種關(guān)系,運(yùn)用各種數(shù)據(jù)挖掘分析工具,發(fā)現(xiàn)在數(shù)據(jù)與數(shù)據(jù)之間的深層次聯(lián)系;三是決策系統(tǒng)的建立,根據(jù)分析的結(jié)果,提供決策建議.人工智能在內(nèi)容資源挖掘中發(fā)揮了重要的作用.Agent(艾真體)是一種計(jì)算機(jī)智能體,在傳播過(guò)程中,具有自主和自適應(yīng)的能力,根據(jù)所遇到的情況調(diào)整自身的探索目標(biāo),如計(jì)算機(jī)爬蟲(chóng)就是內(nèi)容挖掘中經(jīng)常使用的艾真體.計(jì)算機(jī)爬蟲(chóng)在學(xué)術(shù)期刊內(nèi)容結(jié)構(gòu)發(fā)現(xiàn)中發(fā)揮了重要作用,爬蟲(chóng)能從錯(cuò)綜復(fù)雜的內(nèi)容資源中進(jìn)行結(jié)點(diǎn)探索,理清出各個(gè)結(jié)點(diǎn)之間的關(guān)系和結(jié)構(gòu).
2.2.2 學(xué)術(shù)期刊內(nèi)容資源的知識(shí)關(guān)聯(lián)
基于“數(shù)據(jù)驅(qū)動(dòng)”與“智能驅(qū)動(dòng)”的學(xué)術(shù)期刊內(nèi)容資源知識(shí)發(fā)現(xiàn)是對(duì)由大數(shù)據(jù)挖掘出來(lái)的知識(shí)進(jìn)行關(guān)聯(lián)分析.知識(shí)關(guān)聯(lián)是發(fā)現(xiàn)知識(shí)點(diǎn)與知識(shí)點(diǎn)之間的相互關(guān)系.通過(guò)不同時(shí)間期刊的研究熱點(diǎn)的變化,可得到學(xué)術(shù)研究趨勢(shì);并發(fā)現(xiàn)核心作者群、期刊的欄目發(fā)展趨勢(shì)、作者學(xué)術(shù)領(lǐng)域、作者學(xué)術(shù)團(tuán)隊(duì)、同類期刊的各種指標(biāo)對(duì)比等.國(guó)外先進(jìn)的學(xué)術(shù)期刊通過(guò)聯(lián)機(jī)分析處理、數(shù)據(jù)倉(cāng)庫(kù)、知識(shí)關(guān)聯(lián)、知識(shí)發(fā)現(xiàn)、云計(jì)算、大數(shù)據(jù)分析等數(shù)據(jù)挖掘與處理技術(shù),分析和獲取讀者偏好、刊物質(zhì)量反饋等信息,為選題策劃、作者發(fā)現(xiàn)、信息推送、辦刊方向等提供數(shù)據(jù)支撐,以便作戰(zhàn)略決策上的預(yù)測(cè),及時(shí)調(diào)整辦刊方向,提高讀者服務(wù)水平,確??锏奈恼沦|(zhì)量、欄目的特色以及整個(gè)刊物的影響力.在國(guó)內(nèi),以中國(guó)知網(wǎng)為代表的出版集團(tuán)已實(shí)現(xiàn)了全文數(shù)據(jù)庫(kù)的存儲(chǔ),在此基礎(chǔ)上進(jìn)行期刊的內(nèi)容加工和挖掘,從分類、聚類、索引、自動(dòng)標(biāo)引等全方位、深層次地進(jìn)行知識(shí)管理和知識(shí)挖掘,從傳統(tǒng)的內(nèi)容資源組織向內(nèi)容資源的檢索轉(zhuǎn)化,最終達(dá)到提供決策化、個(gè)性化內(nèi)容資源產(chǎn)品的轉(zhuǎn)變.通過(guò)中國(guó)知網(wǎng)、萬(wàn)方數(shù)據(jù)以及超星發(fā)現(xiàn)的基本期刊信息和知識(shí)網(wǎng)絡(luò)進(jìn)行研究,發(fā)現(xiàn)基本期刊信息越齊全,其通過(guò)知識(shí)發(fā)現(xiàn)而形成的知識(shí)網(wǎng)絡(luò)就越能發(fā)現(xiàn)各種知識(shí)關(guān)聯(lián),其推導(dǎo)出來(lái)的各種關(guān)系網(wǎng)絡(luò)就越有價(jià)值,起決策作用的準(zhǔn)確性就越強(qiáng).中國(guó)知網(wǎng)目前的處理是由知識(shí)節(jié)點(diǎn)和知識(shí)網(wǎng)絡(luò)組成,其中,知識(shí)節(jié)點(diǎn)包括了期刊基本信息,用元數(shù)據(jù)表示,包括題名、作者姓名、作者單位、摘要、關(guān)鍵詞、分類號(hào)等.而知識(shí)網(wǎng)絡(luò)通過(guò)各種數(shù)據(jù)挖掘的方法,將知識(shí)節(jié)點(diǎn)形成知識(shí)網(wǎng)絡(luò),如引文網(wǎng)絡(luò)、關(guān)聯(lián)作者、相似文獻(xiàn)等.而萬(wàn)方數(shù)據(jù)的期刊信息更齊全,基本信息還包括了中國(guó)知網(wǎng)所沒(méi)有的信息:年卷(期)、所屬期刊欄目、在線出版日期、頁(yè)數(shù)、頁(yè)碼等.其知識(shí)網(wǎng)絡(luò)除了引文網(wǎng)絡(luò)、關(guān)聯(lián)作者、相似文獻(xiàn)外,還包括了相關(guān)主題、相關(guān)機(jī)構(gòu)、相關(guān)學(xué)者等;超星發(fā)現(xiàn)的元數(shù)據(jù)也更加齊全,在萬(wàn)方的基本信息之外,還添加了基金、分類導(dǎo)航等元數(shù)據(jù)信息,其知識(shí)網(wǎng)絡(luò)(知識(shí)圖譜)也有更多的發(fā)現(xiàn),包括主題指數(shù)、引文網(wǎng)絡(luò)、引證文獻(xiàn)、引文圖譜、影響因子趨勢(shì)、相似文獻(xiàn)、讀者推薦、基金文獻(xiàn)、全國(guó)館藏、關(guān)聯(lián)作者等.目前中國(guó)知網(wǎng)的內(nèi)容資源挖掘尚處于起步階段,要形成有真正決策意義的信息,還需要進(jìn)一步的研發(fā)關(guān)聯(lián)挖掘技術(shù),才能實(shí)現(xiàn)對(duì)內(nèi)容資源的深度加工.
學(xué)術(shù)期刊內(nèi)容資源的知識(shí)增值是利用人工智能出版多元化知識(shí)產(chǎn)品,將傳統(tǒng)學(xué)術(shù)期刊內(nèi)容資源進(jìn)一步擴(kuò)展為文獻(xiàn)產(chǎn)品、知識(shí)產(chǎn)品、知識(shí)資源、知識(shí)工具、知識(shí)服務(wù)等,以此實(shí)現(xiàn)智能互聯(lián)網(wǎng)下學(xué)術(shù)期刊內(nèi)容整合途徑.
2.3.1 學(xué)術(shù)期刊二次文獻(xiàn)檢索系統(tǒng)的建立
學(xué)術(shù)期刊已發(fā)表的內(nèi)容為一次文獻(xiàn),一次文獻(xiàn)的特點(diǎn)是分散、零亂、無(wú)序,難以從中發(fā)現(xiàn)文獻(xiàn)與文獻(xiàn)之間的關(guān)系,難以發(fā)揮一次文獻(xiàn)的最大應(yīng)用效益,因此,必須對(duì)文獻(xiàn)進(jìn)行加工,進(jìn)行整理、濃縮、提煉,按照一定的邏輯順序和科學(xué)體系編排存儲(chǔ),使之系統(tǒng)化,以便于檢索利用.加工過(guò)程中經(jīng)過(guò)著錄、標(biāo)引、編目等,其優(yōu)化的結(jié)果是以題錄、目錄、索引、文摘等為主的二次文獻(xiàn).國(guó)外出版集團(tuán)重視學(xué)術(shù)期刊資源的優(yōu)化,形成了幾大著名的索引:SSCI、SCI、EI、A&HCI、CPCI-SSH、CP?CI-S,國(guó)內(nèi)有一些有名的索引,如CSSCI、CSCD等,并形成《高等學(xué)校文科學(xué)術(shù)文摘》《中國(guó)社會(huì)科學(xué)文摘》《新華文摘》以及人大復(fù)印報(bào)刊資料等文摘.這些二次文獻(xiàn)極大提高了一次文獻(xiàn)的利用率,給讀者研究、寫(xiě)作、訂閱、信息檢索等帶來(lái)極大方便.另外,結(jié)合一次文獻(xiàn)和二次文獻(xiàn)再進(jìn)一步的分析、綜合、總結(jié)等,可得到三次文獻(xiàn),三次文獻(xiàn)便于系統(tǒng)掌握學(xué)科發(fā)展歷史、學(xué)科動(dòng)態(tài)、研究成果、預(yù)測(cè)學(xué)科發(fā)展文獻(xiàn),為各種策劃、課題研究、戰(zhàn)略研究等提供決策依據(jù).期刊編輯部可對(duì)一次文獻(xiàn)和二次文獻(xiàn)進(jìn)行加工,得到三次文獻(xiàn),概括本刊所刊發(fā)的某個(gè)欄目、學(xué)科的文章、思想論點(diǎn)、創(chuàng)新之處、選題意義、研究的現(xiàn)狀等,供讀者參考,有利于讀者更好地了解本刊,根據(jù)本刊所關(guān)注的選題寫(xiě)文章,有的放矢,提高錄用的概率.
2.3.2 學(xué)術(shù)期刊專題庫(kù)及智庫(kù)的建立
(1)專題庫(kù)和知識(shí)庫(kù)等的建立.在已建立的學(xué)術(shù)期刊數(shù)據(jù)庫(kù)的基礎(chǔ)上,將相同或相近主題的文章從期刊數(shù)據(jù)庫(kù)中抽取出來(lái),并根據(jù)主題進(jìn)行分類,建立專題庫(kù)、知識(shí)庫(kù)、參考咨詢庫(kù)等,如黨的群眾路線專題文庫(kù)、《深化文化體制改革、推動(dòng)社會(huì)主義文化大發(fā)展大繁榮》專題文庫(kù)、行業(yè)知識(shí)服務(wù)平臺(tái)等;在中國(guó)知網(wǎng)中,建立起一系列知識(shí)庫(kù),如規(guī)范術(shù)語(yǔ)、中國(guó)林業(yè)科學(xué)數(shù)據(jù)檢索、表格搜索、圖形搜索、概念搜索、數(shù)字搜索等基于知識(shí)元的數(shù)據(jù)庫(kù);還有參考咨詢庫(kù),如黨政領(lǐng)導(dǎo)決策參考平臺(tái)、學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng);評(píng)價(jià)中心,包括中國(guó)學(xué)術(shù)期刊評(píng)價(jià)開(kāi)放型定制服務(wù)系統(tǒng)(CAJES)、個(gè)刊影響力統(tǒng)計(jì)分析數(shù)據(jù)庫(kù)等.
(2)開(kāi)發(fā)智庫(kù),提供智庫(kù)決策.以知識(shí)庫(kù)為基礎(chǔ),通過(guò)知識(shí)增值,形成基于學(xué)術(shù)期刊知識(shí)發(fā)現(xiàn)的專家決策系統(tǒng).通過(guò)人工智能,達(dá)到高附加值的目標(biāo),實(shí)現(xiàn)知識(shí)的增值,形成服務(wù)產(chǎn)品,用于決策參考.利用內(nèi)容資源整合的結(jié)果建成不同的專家系統(tǒng),為不同的決策機(jī)構(gòu)提供專家決策支撐.對(duì)于學(xué)術(shù)期刊來(lái)說(shuō),根據(jù)專家系統(tǒng),對(duì)作者信息、基金項(xiàng)目、引文情況等內(nèi)容資源進(jìn)行分析,得到各項(xiàng)評(píng)刊指標(biāo);對(duì)評(píng)刊指標(biāo)進(jìn)行對(duì)比,可了解到自己的不足之處,以便改進(jìn).可通過(guò)專家系統(tǒng)分析和預(yù)測(cè)選題,用于選題策劃;對(duì)作者的團(tuán)隊(duì)研究情況進(jìn)行追蹤,可得到作者研究團(tuán)隊(duì)動(dòng)向,方便進(jìn)行約稿.而對(duì)于政府機(jī)關(guān)和各行各業(yè),也可以從學(xué)術(shù)期刊內(nèi)容資源整合得到的智庫(kù)或?qū)<易稍兿到y(tǒng)獲取有價(jià)值的參考.
5G下的互聯(lián)網(wǎng)特點(diǎn)是智能和萬(wàn)物互聯(lián),因此,要拓展多種內(nèi)容資源的出版形態(tài),使學(xué)術(shù)期刊內(nèi)容資源能以多種出版狀態(tài)呈現(xiàn)在互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)中,建立起學(xué)術(shù)期刊物聯(lián)網(wǎng).學(xué)術(shù)期刊的出版形態(tài)目前只有兩種最基本的形態(tài),即紙介質(zhì)和電子介質(zhì)(主要以中國(guó)知網(wǎng)、萬(wàn)方數(shù)據(jù)、維普資訊和龍?jiān)雌诳W(wǎng)為代表的數(shù)據(jù)庫(kù)出版物).紙質(zhì)期刊由于訂閱麻煩、讀者閱讀習(xí)慣的改變等原因,除了圖書(shū)館、資料室訂閱之外,讀者個(gè)人很少訂閱;數(shù)據(jù)庫(kù)出版期刊是目前讀者普通使用的方式,因此,數(shù)據(jù)庫(kù)出版形態(tài)占主流.然而,數(shù)據(jù)庫(kù)出版物有本身的不足,即電子期刊僅僅是紙介質(zhì)期刊的復(fù)制品,用掃描或由排版軟件導(dǎo)出的PDF、或CAJ 文件,與紙介質(zhì)的內(nèi)容完全一致.內(nèi)容沒(méi)有進(jìn)行優(yōu)化、關(guān)聯(lián)等,這種形態(tài)只能適合在電腦上閱讀,也無(wú)法得到進(jìn)一步的信息.在國(guó)外,學(xué)術(shù)期刊出版集團(tuán)如Springerlink、Elsevier等基本上取消了紙介質(zhì)出版物,只提供預(yù)印本供讀者下載自行打?。浑娮映霭嫖镆彩侵饕某霭嫘螒B(tài),除了以上兩種之外,國(guó)外出版集團(tuán)在互聯(lián)網(wǎng)出版和手機(jī)出版等已經(jīng)形成一定的規(guī)模.互聯(lián)網(wǎng)出版形態(tài)是網(wǎng)頁(yè)的形式的,由于網(wǎng)頁(yè)的可擴(kuò)展功能,可對(duì)原文中的內(nèi)容添加一些注釋、備注、鏈接等,還可以加上視頻、聲頻、彩圖、3D模形等,使本來(lái)單一形態(tài)的內(nèi)容變得活潑起來(lái),也方便讀者閱讀;手機(jī)出版是隨著近幾年來(lái)移動(dòng)智能終端的普及而發(fā)展起來(lái)的,讀者閱讀習(xí)慣從電腦閱讀轉(zhuǎn)到手機(jī)閱讀,最主要的是,手機(jī)閱讀支持碎片化閱讀,以及從淺到深的閱讀,因此,手機(jī)出版在對(duì)內(nèi)容資源深度加工時(shí),都需要進(jìn)行淺深閱讀的編輯加工.和互聯(lián)網(wǎng)出版形態(tài)一樣,手機(jī)出版也可以對(duì)文章內(nèi)容添加一些元素,方便讀者閱讀.Springerlink、中國(guó)知網(wǎng)等已經(jīng)推出了手機(jī)出版形態(tài)的出版物,但目前學(xué)術(shù)期刊還沒(méi)對(duì)手機(jī)出版給予關(guān)注;另外,目前移動(dòng)出版、富媒體出版、語(yǔ)義出版已經(jīng)開(kāi)始在學(xué)術(shù)期刊中應(yīng)用,5G時(shí)代這幾種出版方式將得到進(jìn)一步推廣,并與其它出版方式融合出版,使得5G下學(xué)術(shù)期刊資內(nèi)容資源出版形態(tài)多樣化.
學(xué)術(shù)期刊內(nèi)容資源的整合有利于改善版權(quán)管理.目前學(xué)術(shù)期刊內(nèi)容資源版權(quán)主要是向數(shù)據(jù)庫(kù)服務(wù)商提供期刊全文所得到的收益,資源整合擴(kuò)大了學(xué)術(shù)期刊版權(quán)受益范圍,也增加了內(nèi)容資源版權(quán)管理難度.首先,由于知識(shí)表示的改變,學(xué)術(shù)期刊版權(quán)由全文擴(kuò)大到元數(shù)據(jù),將元數(shù)據(jù)列入版權(quán)的范圍內(nèi).一些數(shù)據(jù)庫(kù)服務(wù)商由于期刊獨(dú)家代理沒(méi)有合作全文收錄,但期刊授權(quán)數(shù)據(jù)庫(kù)服務(wù)商對(duì)該刊元數(shù)據(jù)的使用,數(shù)據(jù)庫(kù)服務(wù)商也必須向期刊繳納相應(yīng)的版權(quán)費(fèi).其次,學(xué)術(shù)期刊內(nèi)容資源知識(shí)增值所帶來(lái)的二次文獻(xiàn)檢索數(shù)據(jù)庫(kù)以及專題數(shù)據(jù)庫(kù),其數(shù)據(jù)庫(kù)的直接來(lái)源是學(xué)術(shù)期刊全文內(nèi)容資源,這方面的版權(quán)收益一般由數(shù)據(jù)庫(kù)服務(wù)商獨(dú)享.數(shù)據(jù)庫(kù)服務(wù)商在和期刊簽署合作協(xié)議時(shí)將數(shù)字化匯編權(quán)也列入相應(yīng)權(quán)利當(dāng)中去,但卻沒(méi)有將相應(yīng)匯編收益進(jìn)行合理分配.隨著期刊內(nèi)容資源整合的深入進(jìn)行,匯編產(chǎn)品如二次文獻(xiàn)檢索數(shù)據(jù)庫(kù)以及專題數(shù)據(jù)庫(kù)等價(jià)值越來(lái)越大,收益越來(lái)越多,而學(xué)術(shù)期刊卻依然忽視了這部分收益分配的合理性,沒(méi)有作相應(yīng)收益分配調(diào)整,必須引起注意.最后,由于學(xué)術(shù)期刊內(nèi)容資源出版形態(tài)多樣化,特別是移動(dòng)出版的發(fā)展,移動(dòng)出版受益所占的份額越來(lái)越大,學(xué)術(shù)期刊在與學(xué)術(shù)期刊簽署的協(xié)議上卻將移動(dòng)出版版權(quán)當(dāng)作是網(wǎng)絡(luò)全文內(nèi)容出版的附贈(zèng)品,沒(méi)有對(duì)其給予充分重視.因此,內(nèi)容資源整合后的版權(quán)管理要突破原有的分配模式,將元數(shù)據(jù)、二次文獻(xiàn)檢索數(shù)據(jù)庫(kù)、專題數(shù)據(jù)庫(kù)、移動(dòng)出版等作為重要版權(quán)給予重視,與數(shù)據(jù)庫(kù)服務(wù)商協(xié)議這部分版權(quán)的二次分配事宜,以提高學(xué)術(shù)期刊整合后的內(nèi)容資源版權(quán)收益.
學(xué)術(shù)期刊的內(nèi)容資源是立刊之本,是期刊的生命線,同時(shí),也要重視學(xué)術(shù)期刊的傳播能力與傳播效果.因此,除了要重視對(duì)高質(zhì)量的內(nèi)容資源的出版之外,還要對(duì)內(nèi)容資源進(jìn)行有效的整合.5G下人工智能和大數(shù)據(jù)的興起和廣泛應(yīng)用為學(xué)術(shù)期刊的資源整合帶來(lái)了機(jī)遇,能否抓住機(jī)遇,并進(jìn)行學(xué)術(shù)期刊內(nèi)容資源整合,可避免學(xué)術(shù)期刊內(nèi)容出版的資源浪費(fèi),并提高學(xué)術(shù)期刊內(nèi)容資源的利用率,為提高我國(guó)學(xué)術(shù)期刊的競(jìng)爭(zhēng)力提供借鑒.存在的挑戰(zhàn)是,人工智能在學(xué)術(shù)期刊的利用尚未得到重視,也缺乏成熟的技術(shù)支持,目前僅處于探索與實(shí)踐階段.但是,從發(fā)展的角度來(lái)看,5G下大數(shù)據(jù)和人工智能在學(xué)術(shù)期刊資源整合中的應(yīng)用將受到各方面的重視,并廣泛應(yīng)用于各種信息決策中.