李廣建
(北京大學(xué)信息管理系,北京 100871)
構(gòu)建國(guó)家科研論文和科技信息高端交流平臺(tái)(以下簡(jiǎn)稱“高端交流平臺(tái)”)是《中共中央關(guān)于制定國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展第十四個(gè)五年規(guī)劃和二〇三五年遠(yuǎn)景目標(biāo)的建議》提出的加強(qiáng)我國(guó)科學(xué)戰(zhàn)略力量的重要任務(wù)之一??萍夹畔⒑涂萍记閳?bào)工作已經(jīng)上升到國(guó)家戰(zhàn)略層面,在國(guó)家科技創(chuàng)新中已起到舉足輕重的作用。作為科技信息學(xué)科的研究者和工作者,我們不能辜負(fù)黨中央對(duì)科技信息戰(zhàn)線的期望,要深刻領(lǐng)會(huì)中共中央在“十四五”規(guī)劃中對(duì)強(qiáng)化國(guó)家戰(zhàn)略科技力量的頂層設(shè)計(jì)和戰(zhàn)略規(guī)劃,要深入研究分析高端交流平臺(tái)的內(nèi)涵、目標(biāo)以及高端交流平臺(tái)應(yīng)具備的核心能力,這將為我們后續(xù)構(gòu)建可落地、可應(yīng)用、可服務(wù)、可持續(xù)發(fā)展的高端交流平臺(tái)提供理論上的支撐。
當(dāng)前,科技信息界對(duì)高端交流平臺(tái)的認(rèn)識(shí)和研究尚處于探索階段,學(xué)界和業(yè)界尚未形成有關(guān)高端交流平臺(tái)的統(tǒng)一的、公認(rèn)的理解和定義,盡管已有部分研究對(duì)高端交流平臺(tái)展開了討論,但其側(cè)重點(diǎn)各不相同。正如美國(guó)情報(bào)專家菲利普·泰洛克所言,研究人員要具備蜻蜓復(fù)眼觀察世界的能力,能夠從不同的視角去認(rèn)識(shí)復(fù)雜對(duì)象的特征,從而以更加全面、系統(tǒng)的方式刻畫和描述研究對(duì)象的真實(shí)面貌[1]。為力求從多視角、多維度對(duì)高端交流平臺(tái)進(jìn)行全面、客觀的分析,深刻認(rèn)識(shí)和理解高端交流平臺(tái)的本質(zhì),筆者將從國(guó)家科學(xué)創(chuàng)新戰(zhàn)略(高端交流平臺(tái)的背景)、人工智能與大數(shù)據(jù)(高端交流平臺(tái)的技術(shù)基礎(chǔ)與機(jī)遇)、科技人員(高端交流平臺(tái)的需求)3個(gè)不同的角度嘗試分析、理解高端交流平臺(tái),以期能夠從更加全面的、更加多維的視角對(duì)高端交流平臺(tái)進(jìn)行解讀。
從國(guó)家科技創(chuàng)新戰(zhàn)略角度來看,高端交流平臺(tái)的構(gòu)建是特定時(shí)代和歷史背景下中國(guó)科技創(chuàng)新發(fā)展的必然選擇。首先,中國(guó)作為一個(gè)發(fā)展中國(guó)家,在全球科技創(chuàng)新鏈中的地位發(fā)生根本性的轉(zhuǎn)變。自1949年新中國(guó)成立以來,歷經(jīng)70多年的發(fā)展,在一代又一代科學(xué)工作者艱苦卓絕的持續(xù)奮斗之下,中國(guó)已經(jīng)從全世界科學(xué)技術(shù)落后的國(guó)家之一發(fā)展成為全球科技創(chuàng)新鏈中舉足輕重的科技創(chuàng)新大國(guó),為全世界科學(xué)發(fā)展、技術(shù)創(chuàng)新持續(xù)貢獻(xiàn)中國(guó)智慧。例如,據(jù)世界知識(shí)產(chǎn)權(quán)組織數(shù)據(jù)顯示[2],2019年中國(guó)專利申請(qǐng)數(shù)量為140余萬件,位居世界第一,是專利申請(qǐng)第二大國(guó)美國(guó)申請(qǐng)量(62.15萬件)的2倍以上,并且在多個(gè)世界知識(shí)產(chǎn)權(quán)指標(biāo)上有亮眼的表現(xiàn)。因此,筆者認(rèn)為,高端交流平臺(tái)是中國(guó)科技水平發(fā)展到一定階段的必然產(chǎn)物,高端交流平臺(tái)的“高端”應(yīng)該體現(xiàn)出中國(guó)當(dāng)前和未來在全球科技創(chuàng)新領(lǐng)域應(yīng)有的大國(guó)地位和作用。其次,隨著全球科技創(chuàng)新格局的變化,中國(guó)國(guó)家科技創(chuàng)新發(fā)展的站位也在變化。中國(guó)國(guó)家科技創(chuàng)新的發(fā)展大致經(jīng)歷了4個(gè)階段,從新中國(guó)成立之初一窮二白的“追跑”,到改革開放后有一定基礎(chǔ)的“跟跑”,此后隨著中國(guó)在全球科技地位的上升和綜合科技實(shí)力的增強(qiáng),在許多領(lǐng)域已進(jìn)入“并跑”階段,當(dāng)前我國(guó)科技創(chuàng)新正在向“領(lǐng)跑”態(tài)勢(shì)發(fā)展,逐漸打破由美國(guó)和歐洲國(guó)家主導(dǎo)的“兩極”格局,正在形成“三極”和“多極”的全球科技創(chuàng)新格局。這意味著高端交流平臺(tái)的“高端”是一種戰(zhàn)略性定位,是我國(guó)科技自信的表現(xiàn),是國(guó)家有能力引領(lǐng)世界科技創(chuàng)新的具體體現(xiàn)。因此,高端交流平臺(tái)不僅僅要服務(wù)于“跟跑”,即作為了解科技前沿的窗口,更重要的是要服務(wù)于“領(lǐng)跑”,即服務(wù)于國(guó)家科技創(chuàng)新發(fā)展的新思路和新方向,在功能定位上要服務(wù)于原創(chuàng)性的科學(xué)研究、重大基礎(chǔ)創(chuàng)新、顛覆性技術(shù)研究、世界領(lǐng)先技術(shù)的開發(fā)等“領(lǐng)跑”的科技創(chuàng)新。
從技術(shù)的角度看,高端交流平臺(tái)不是人工智能和大數(shù)據(jù)技術(shù)的簡(jiǎn)單應(yīng)用,而是人工智能和大數(shù)據(jù)技術(shù)與科學(xué)發(fā)現(xiàn)過程、科技信息處理深度融合的產(chǎn)物。歷史上,人工智能技術(shù)在科學(xué)發(fā)現(xiàn)領(lǐng)域的應(yīng)用與嘗試從未停止過。赫伯特·西蒙在20世紀(jì)40年代就進(jìn)行了科學(xué)發(fā)現(xiàn)的認(rèn)知方面的研究[3-4]。20世紀(jì)60年代,愛德華·費(fèi)根鮑姆與喬舒亞·萊德伯格在斯坦福大學(xué)研究了有機(jī)分子的自動(dòng)識(shí)別和有機(jī)分子質(zhì)譜的學(xué)習(xí)規(guī)則[5]。近年來,以數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)為代表的人工智能技術(shù)的發(fā)展,催生了數(shù)據(jù)科學(xué),為科學(xué)家?guī)砹藦?qiáng)大的數(shù)據(jù)驅(qū)動(dòng)發(fā)現(xiàn)能力[6]。人工智能在科學(xué)研究和科學(xué)發(fā)現(xiàn)領(lǐng)域的應(yīng)用引發(fā)了科研活動(dòng)的顛覆性變革,《科學(xué)》雜志曾發(fā)文指出人工智能改變了科學(xué)[7]。例如,Alphabet旗下的人工智能公司DeepMind開發(fā)了一款基于人工智能的分子研究平臺(tái),可以準(zhǔn)確預(yù)測(cè)蛋白質(zhì)在幾天時(shí)間里會(huì)折疊成什么樣的結(jié)構(gòu),在短時(shí)間內(nèi)就解決了過去50年來生物學(xué)領(lǐng)域一直懸而未決的重大問題,從而幫助科學(xué)家更好地了解疾病和加速藥物研發(fā)[8]??梢钥闯?,人工智能賦能的科技信息工作和科學(xué)研究平臺(tái)對(duì)科學(xué)發(fā)現(xiàn)與科學(xué)創(chuàng)新的影響是前所未有的,他們不但增強(qiáng)了人類科學(xué)家科學(xué)研究的能力,在某些領(lǐng)域甚至?xí)饺祟惪茖W(xué)家,完成人類科學(xué)家無法完成的工作。據(jù)此,可以說,未來科技創(chuàng)新的主角不僅是科學(xué)家,還將會(huì)是高端交流平臺(tái),未來世界各國(guó)科學(xué)創(chuàng)新的核心競(jìng)爭(zhēng)力將是高端交流平臺(tái)所支撐的科技信息、科技情報(bào)的大數(shù)據(jù)計(jì)算能力。因此,高端交流平臺(tái)作為科技信息工作和服務(wù)的主要載體,其“高端”體現(xiàn)在:高端交流平臺(tái)是高度智能的、綜合性的科技信息和科技創(chuàng)新平臺(tái);同時(shí),高端交流平臺(tái)從以往科學(xué)研究的工具轉(zhuǎn)變成為未來科學(xué)研究的主體以及科學(xué)家的合作伙伴,從科學(xué)研究和創(chuàng)新的幕后走向了臺(tái)前,并將成為支撐我國(guó)科技創(chuàng)新的重要力量。
首先,對(duì)于科學(xué)家和技術(shù)開發(fā)人員而言,科技信息服務(wù)應(yīng)該是高端交流平臺(tái)最基礎(chǔ)、也最核心的功能。當(dāng)然,高端交流平臺(tái)的科技信息服務(wù)不是普通的信息服務(wù)或知識(shí)服務(wù),而是智慧化的服務(wù)[9],能夠真正做到“想科學(xué)家之所想、急科學(xué)家之所急”。從用戶服務(wù)的角度講,“高端”就是它提供的服務(wù)更加智慧、服務(wù)內(nèi)容更加多元、服務(wù)的時(shí)效性更強(qiáng)、服務(wù)的精準(zhǔn)性更高,使用戶對(duì)服務(wù)的滿意度更高。簡(jiǎn)單地說,就是有用、好用、權(quán)威。所謂“有用”就是指服務(wù)所提供的內(nèi)容齊全、準(zhǔn)確、前沿,能夠包括科學(xué)研究以及科技開發(fā)所需的經(jīng)過提煉的各類型知識(shí)、數(shù)據(jù),甚至是可執(zhí)行的代碼和分析的工具;“好用”是指高端交流平臺(tái)的服務(wù)模式和交互方式更加便利、智能,不僅有傳統(tǒng)的檢索、瀏覽功能,還可以嵌入科學(xué)研究和科技開發(fā)的過程中,能夠理解科學(xué)家和技術(shù)開發(fā)人員的意圖和上下文關(guān)系,甚至高端交流平臺(tái)比科學(xué)家和技術(shù)開發(fā)人員還更了解他/她們需要的信息、知識(shí);“權(quán)威”是指高端交流平臺(tái)提供的科學(xué)信息、研究成果可信、可靠,科學(xué)數(shù)據(jù)、科學(xué)實(shí)驗(yàn)可驗(yàn)證、可重現(xiàn),研究成果的水平和質(zhì)量可評(píng)價(jià)、可溯源。
其次,從科技人員的角度看,高端交流平臺(tái)不僅是一個(gè)科技信息的服務(wù)平臺(tái),而且是一個(gè)讀懂科學(xué)家的人機(jī)協(xié)作平臺(tái)、學(xué)術(shù)研究的交流平臺(tái)。學(xué)術(shù)交流是科技創(chuàng)新過程中必不可少的一個(gè)重要環(huán)節(jié),學(xué)術(shù)交流可以促進(jìn)學(xué)術(shù)思想和知識(shí)在科技人員之間以及學(xué)術(shù)機(jī)構(gòu)之間流動(dòng)與碰撞,促進(jìn)不同領(lǐng)域、不同學(xué)科知識(shí)的融合與創(chuàng)新,其目的是要激發(fā)出新的知識(shí)和新的觀點(diǎn)。當(dāng)今人類已進(jìn)入智慧社會(huì),機(jī)器(智能傳感器、系統(tǒng)平臺(tái)、智能代理)、人和網(wǎng)絡(luò)形成一個(gè)比人類社會(huì)網(wǎng)絡(luò)還龐大的虛擬網(wǎng)絡(luò)空間[9],這也包括學(xué)術(shù)研究和科技開發(fā)的知識(shí)交流網(wǎng)絡(luò)。高端交流平臺(tái)中的“高端”交流具有兩層含義:在微觀層面上,是指人與人、人與平臺(tái)、平臺(tái)與平臺(tái)之間的交流[10];在宏觀層面上,是指國(guó)際交流,包括中國(guó)與西方國(guó)家的交流、中國(guó)與“一帶一路”國(guó)家的交流、中國(guó)與第三世界國(guó)家的交流等。學(xué)術(shù)交流的前提條件是要基于一個(gè)交流的網(wǎng)絡(luò),有了網(wǎng)絡(luò)才能產(chǎn)生交流,有交流就會(huì)有融合,有融合就能涌現(xiàn)出新的知識(shí)和智慧[11]。這表明高端交流平臺(tái)既是一個(gè)平臺(tái),又是一個(gè)網(wǎng)絡(luò),更是一個(gè)由人、平臺(tái)、論文、科技信息、科技知識(shí)等科技創(chuàng)新要素構(gòu)成的能夠產(chǎn)生新知識(shí)和智慧的復(fù)雜系統(tǒng)[12]。因此,高端交流平臺(tái)“高端”交流的目的就是,通過交流打通中國(guó)科技創(chuàng)新的“任督二脈”,通過交流提升中國(guó)科技創(chuàng)新在全球的軟實(shí)力,通過交流重塑世界科技創(chuàng)新的新秩序。
綜上所述,高端交流平臺(tái)并不是簡(jiǎn)單地提升和集成現(xiàn)有科技信息平臺(tái)的功能,而是在指導(dǎo)思想、功能、定位、效果上都展現(xiàn)出全新風(fēng)貌的平臺(tái)。高端交流平臺(tái)應(yīng)該是在復(fù)雜系統(tǒng)思想指導(dǎo)下,通過頂層設(shè)計(jì)思維自上而下對(duì)國(guó)家科技創(chuàng)新系統(tǒng)的重新設(shè)計(jì)和具體體現(xiàn),是對(duì)科學(xué)交流、科學(xué)發(fā)現(xiàn)、知識(shí)創(chuàng)新范式的重新定義,以此保障國(guó)家科技創(chuàng)新體系能夠應(yīng)對(duì)新時(shí)期全球科技創(chuàng)新中包括國(guó)家安全、生存環(huán)境、醫(yī)療衛(wèi)生、生物安全、地緣政治在內(nèi)的,涉及國(guó)家發(fā)展、社會(huì)民生諸多方面的重大挑戰(zhàn),從而增強(qiáng)國(guó)家的科技創(chuàng)新競(jìng)爭(zhēng)力、加速國(guó)家的科技創(chuàng)新效率、提升國(guó)家的科技創(chuàng)新質(zhì)量。
基于以上3個(gè)方面的認(rèn)識(shí),高端交流平臺(tái)不是西方科技創(chuàng)新體系和平臺(tái)的復(fù)制和照搬,也不是單純地對(duì)現(xiàn)有各類科技信息平臺(tái)和交流平臺(tái)的功能進(jìn)行提升和集成(當(dāng)然這并不影響我們要對(duì)已有體系和平臺(tái)的學(xué)習(xí)和吸收),而是一個(gè)具有中國(guó)特色的,能夠充分發(fā)揮科技人員聰明才智的,更加適合中國(guó)科技創(chuàng)新需要的,前所未有的平臺(tái),這就需要我們?cè)谖宅F(xiàn)有創(chuàng)新體系及科技信息平臺(tái)優(yōu)勢(shì)的前提下,對(duì)它所涉及的功能技術(shù)做全面深入的研究。
如前所述,高端交流平臺(tái)是一個(gè)前所未有的平臺(tái),可能很難用三言兩語就把這個(gè)平臺(tái)說的很清楚,就筆者當(dāng)前的理解而言,高端交流平臺(tái)至少是一個(gè)數(shù)據(jù)驅(qū)動(dòng)和知識(shí)驅(qū)動(dòng)的綜合性科技信息服務(wù)與交流平臺(tái)。要做到數(shù)據(jù)驅(qū)動(dòng)、知識(shí)驅(qū)動(dòng),就需要情報(bào)計(jì)算能力的支撐。因此,高端交流平臺(tái)的落地、應(yīng)用、服務(wù),一個(gè)非常重要的方面就是要加強(qiáng)高端交流平臺(tái)情報(bào)計(jì)算能力的建設(shè)。所謂的情報(bào)計(jì)算能力,就是利用情報(bào)計(jì)算模型、情報(bào)分析算法、情報(bào)計(jì)算框架,通過計(jì)算的方式解決科技信息服務(wù)、科學(xué)發(fā)現(xiàn)、知識(shí)創(chuàng)新中與知識(shí)、情報(bào)獲取、組織、分析、開發(fā)與利用相關(guān)的問題,使這些問題的解決模型化、形式化、自動(dòng)化,最終達(dá)到智能化的一種綜合性的能力[13]。根據(jù)以上對(duì)高端交流平臺(tái)目標(biāo)、定位和功能理解,在高端交流平臺(tái)的建設(shè)過程中,我們要著重加強(qiáng)構(gòu)建以下3個(gè)方面的情報(bào)計(jì)算能力。
科學(xué)創(chuàng)新有兩個(gè)非常重要的步驟,即知識(shí)的發(fā)現(xiàn)和知識(shí)的融合,以計(jì)算的方式實(shí)現(xiàn)科學(xué)知識(shí)的發(fā)現(xiàn)與融合是高端交流平臺(tái)最重要的兩種情報(bào)計(jì)算能力。
一方面,高端交流平臺(tái)的科學(xué)知識(shí)發(fā)現(xiàn)的情報(bào)計(jì)算能力是指通過知識(shí)抽取、知識(shí)建模和知識(shí)挖掘等算法實(shí)現(xiàn)對(duì)科技文獻(xiàn)的大規(guī)模機(jī)器自動(dòng)閱讀,以理性、道德和主動(dòng)的方式尋找、獲取甚至構(gòu)建完成科學(xué)研究和技術(shù)開發(fā)任務(wù)所需的知識(shí),從不同類型、不同學(xué)科的科技文獻(xiàn)中發(fā)現(xiàn)有用的、有價(jià)值的、可轉(zhuǎn)化的知識(shí),挖掘出科技文獻(xiàn)中所蘊(yùn)含的潛在知識(shí),將這類知識(shí)按一定的方式進(jìn)行組織,用適當(dāng)?shù)谋憩F(xiàn)方式表達(dá)出來,并提供給科技人員,以輔助他們進(jìn)行知識(shí)發(fā)現(xiàn)。
另一方面,單純的、孤立的知識(shí)的發(fā)現(xiàn)意義并不大,重要的是要將不同來源的知識(shí)融合成一個(gè)整體,相互比照,去除噪音,保留知識(shí)精華(Essence of Knowledge),形成相互關(guān)聯(lián)的知識(shí)網(wǎng)絡(luò),這是知識(shí)創(chuàng)新過程中的最重要的一步。高端交流平臺(tái)的科學(xué)知識(shí)融合的情報(bào)計(jì)算能力就是要將從不同文獻(xiàn)中學(xué)習(xí)到的多個(gè)單一的內(nèi)容、模式、公式、關(guān)系等知識(shí)通過匯聚、統(tǒng)一、集成等融合模式,轉(zhuǎn)換成可描述、可解釋、相對(duì)完整的知識(shí)鏈條,使得蘊(yùn)含在海量科技文獻(xiàn)中的隱藏的模式、規(guī)律、因果關(guān)系等高階知識(shí)顯性化,并把這些知識(shí)作為科技創(chuàng)新的基礎(chǔ)。關(guān)于知識(shí)發(fā)現(xiàn)和融合的情報(bào)計(jì)算能力可以借鑒的典型實(shí)例有哈佛大學(xué)醫(yī)學(xué)院INDRA實(shí)驗(yàn)室研發(fā)的EMMMA(Ecosystem of Machine-maintained models with Automated Analysis)[14],該系統(tǒng)的主要思路是建立一系列計(jì)算模型,自動(dòng)閱讀醫(yī)學(xué)文獻(xiàn)和醫(yī)學(xué)數(shù)據(jù),對(duì)其中的知識(shí)進(jìn)行自動(dòng)化的提取、組配合融合,從而發(fā)現(xiàn)生物醫(yī)學(xué)文獻(xiàn)和數(shù)據(jù)中所蘊(yùn)含的復(fù)雜機(jī)制。該系統(tǒng)對(duì)海量的生物醫(yī)學(xué)文獻(xiàn)(約32%的全文,68%的摘要)進(jìn)行機(jī)器自動(dòng)化閱讀并提取250萬種知識(shí)點(diǎn)之間的關(guān)系,與生物數(shù)據(jù)庫(kù)(Pathway Commons,SIGNOR和BEL Large Corpus)構(gòu)成的先驗(yàn)知識(shí)網(wǎng)絡(luò)進(jìn)行融合,自動(dòng)化構(gòu)建了COVID-19病毒生物學(xué)的因果機(jī)制,用于新藥物的研發(fā)或?qū)o法解釋的臨床現(xiàn)象進(jìn)行機(jī)理上的解釋,發(fā)現(xiàn)了男性比女性更容易感染重癥COVID-19的機(jī)理。
情報(bào)分析是情報(bào)工作的“看家本領(lǐng)”,是科學(xué)研究和探索過程中必不可少的階段和環(huán)節(jié)。傳統(tǒng)的分析往往依賴于情報(bào)分析人員長(zhǎng)期積累的經(jīng)驗(yàn)以及對(duì)分析工具使用的熟練程度,分析的效率較低,情報(bào)分析研究的可重現(xiàn)性和可重用性較差。高端交流平臺(tái)應(yīng)該是一個(gè)智慧的平臺(tái),在建設(shè)中要注重情報(bào)分析的自動(dòng)化能力建設(shè),要深入研究人類專家在情報(bào)研究中分析的方式,包括分析過程的模型化和模型的自動(dòng)構(gòu)建。
情報(bào)分析過程的模型化是指根據(jù)情報(bào)任務(wù)、情報(bào)分析的方法以及分析用到的數(shù)據(jù),利用系統(tǒng)化和形式化的表達(dá)方式對(duì)情報(bào)分析過程進(jìn)行抽象的描述,這是實(shí)現(xiàn)情報(bào)計(jì)算化的重要途徑。情報(bào)分析過程的模型化是近年來情報(bào)分析的一個(gè)重要特征和發(fā)展趨勢(shì)[15]。總的來看,當(dāng)前情報(bào)分析過程的模型構(gòu)建過程主要還是依賴學(xué)科專家和情報(bào)專家的配合,具有非常高的人力成本。隨著科學(xué)研究越來越復(fù)雜,人類在認(rèn)知方面的局限性和缺點(diǎn)越來越突出[16]。特別是在數(shù)據(jù)驅(qū)動(dòng)型的研究中,科技文獻(xiàn)和科學(xué)數(shù)據(jù)的多樣性、異構(gòu)性、復(fù)雜性以及大量的科學(xué)假設(shè)和科學(xué)模型構(gòu)成了緊密相關(guān)但又非常離散的信息空間,學(xué)科專家和情報(bào)專家都難以在沒有任何輔助的情況下準(zhǔn)確、快速地構(gòu)建起有效的情報(bào)分析模型。正因?yàn)槿绱?,情?bào)分析的自動(dòng)建模正在成為當(dāng)前情報(bào)界的重要研究課題。例如,由美國(guó)DARPA主導(dǎo)的“數(shù)據(jù)驅(qū)動(dòng)模型發(fā)現(xiàn)”項(xiàng)目(D3M,Data Driven Discovery of Models)[17]旨在開發(fā)一種用于科學(xué)研究的自動(dòng)模型發(fā)現(xiàn)系統(tǒng),能夠?yàn)椴煌茖W(xué)研究領(lǐng)域的科學(xué)家創(chuàng)建真實(shí)的、復(fù)雜過程的經(jīng)驗(yàn)?zāi)P?。該?xiàng)目的目標(biāo)有兩個(gè):一是輔助學(xué)科專家在沒有情報(bào)專家?guī)椭蛘卟痪邆浣VR(shí)的情況下能自動(dòng)生成經(jīng)驗(yàn)?zāi)P?,并通過自動(dòng)化方式提高科學(xué)研究的效率;二是通過模型的自動(dòng)構(gòu)建,提高情報(bào)專家構(gòu)建分析模型的效率和質(zhì)量。筆者認(rèn)為,我國(guó)要構(gòu)建的高端交流平臺(tái)的功能應(yīng)該遠(yuǎn)遠(yuǎn)超出現(xiàn)有這類項(xiàng)目,成為科學(xué)家的得力研究助手。
科學(xué)交流與協(xié)作是提升人類解決重大問題能力的有效手段。傳統(tǒng)上,情報(bào)學(xué)側(cè)重于科學(xué)交流的現(xiàn)象和規(guī)律的研究。隨著科學(xué)問題變得越來越復(fù)雜,科學(xué)交流與協(xié)作越來越重要,這就需要高端交流平臺(tái)加強(qiáng)科學(xué)研究交流規(guī)律的利用與協(xié)作能力的建設(shè),從而優(yōu)化和加速科學(xué)發(fā)現(xiàn)和知識(shí)創(chuàng)新??茖W(xué)交流與協(xié)作的情報(bào)計(jì)算能力是通過可計(jì)算的高端交流網(wǎng)絡(luò)和高端協(xié)作網(wǎng)絡(luò),將學(xué)科專家、情報(bào)專家、研究機(jī)構(gòu)、知識(shí)服務(wù)平臺(tái)等科學(xué)創(chuàng)新實(shí)體連接起來,實(shí)現(xiàn)科學(xué)知識(shí)、科學(xué)數(shù)據(jù)的自由交換、共享及利用,并能通過軟件定義的方式有意識(shí)地優(yōu)化重組科學(xué)研究交流網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),從而更好地促進(jìn)科學(xué)創(chuàng)新實(shí)體之間的協(xié)作,最大限度地發(fā)揮創(chuàng)新實(shí)體的智慧,推動(dòng)科學(xué)技術(shù)的快速發(fā)展。
高端交流網(wǎng)絡(luò)應(yīng)是可計(jì)算的、異構(gòu)的、面向溝通交流的、大型的復(fù)雜網(wǎng)絡(luò),它既連接了不同區(qū)域的科學(xué)研究交流的子網(wǎng)絡(luò),也連接了不同領(lǐng)域或不同學(xué)科的學(xué)科子網(wǎng)絡(luò)。高端交流網(wǎng)絡(luò)的連接對(duì)象既包括人、機(jī)構(gòu),也包括機(jī)器和平臺(tái),從而能夠打破地理、學(xué)科、組織的界限。一方面,高端交流網(wǎng)絡(luò)基于科學(xué)交流的規(guī)律和復(fù)雜網(wǎng)絡(luò)的理論智能地將需要交流和溝通的實(shí)體對(duì)象連接起來,促進(jìn)科學(xué)知識(shí)、觀點(diǎn)、思想、數(shù)據(jù)以最優(yōu)化的方式進(jìn)行流動(dòng),從而推動(dòng)理論與方法創(chuàng)新;另一方面,高端交流網(wǎng)絡(luò)還要具有較強(qiáng)的適配性,既要對(duì)人類友好、可理解,也要對(duì)機(jī)器友好、可計(jì)算。
除了科學(xué)交流與知識(shí)共享以外,當(dāng)代科學(xué)研究越來越需要科學(xué)家緊密協(xié)作,很多科學(xué)問題的解決,需要更多的科學(xué)家一起工作數(shù)月或數(shù)年才能得出滿意的結(jié)果[18]。目前,跨學(xué)科、跨組織的國(guó)際合作通過匯集人才、資源文化和科學(xué)知識(shí)的獨(dú)特組合促進(jìn)科學(xué)研究的發(fā)展,特別需要非常好的協(xié)作網(wǎng)絡(luò)來支撐。未來高端交流平臺(tái)不僅是一個(gè)高端交流網(wǎng)絡(luò),同時(shí)也應(yīng)該是一個(gè)高端協(xié)作網(wǎng)絡(luò)。高端協(xié)作網(wǎng)絡(luò)是在交流能力的基礎(chǔ)之上,通過分布式的科學(xué)協(xié)作平臺(tái),將世界各地的優(yōu)秀科學(xué)家聯(lián)系在一起從事復(fù)雜科學(xué)的研究,從而共同解決重大復(fù)雜的科學(xué)問題。一方面,高端協(xié)作網(wǎng)絡(luò)要具有整個(gè)科學(xué)研究生命周期的管理能力,從項(xiàng)目的立項(xiàng),到科學(xué)儀器的共享、科學(xué)數(shù)據(jù)的分析,再到研究成果的發(fā)布等都可實(shí)現(xiàn)在線的、實(shí)時(shí)的、分布式的協(xié)作;另一方面,高端協(xié)作網(wǎng)絡(luò)要具有分布式的項(xiàng)目管理能力,能夠制定多團(tuán)隊(duì)分工協(xié)作的研究計(jì)劃、進(jìn)度跟蹤、科學(xué)數(shù)據(jù)管理等能力[19]。例如,GitHub就是一個(gè)典型的協(xié)作平臺(tái),研究人員通常用于科學(xué)項(xiàng)目的協(xié)作管理和代碼數(shù)據(jù)的共享,其中GitHub的Jira用于總體項(xiàng)目管理,研究問題的提出,而OmniPlan則用于創(chuàng)建研究的時(shí)間表和跟蹤時(shí)間。這些功能都值得我們?cè)诟叨私涣髌脚_(tái)建設(shè)過程中借鑒。
高端交流平臺(tái)的建設(shè)是我國(guó)科技界一件大事,更是我國(guó)科技信息(情報(bào))界的大事,需要我們對(duì)高端交流平臺(tái)的目標(biāo)、體系結(jié)構(gòu)、主要功能、關(guān)鍵技術(shù)、實(shí)現(xiàn)路徑多個(gè)方面做深入的理論探討和實(shí)踐探索,這里僅是對(duì)高端交流平臺(tái)做了一點(diǎn)管中窺豹式的認(rèn)識(shí),但即使是這樣,已經(jīng)能夠反映出高端交流平臺(tái)的建設(shè)具有很高的要求,對(duì)科技信息(情報(bào))界來說,高端交流平臺(tái)的建設(shè),任重而道遠(yuǎn)。