姜麗華, 方松, 張丹丹, 趙瑞雪*, 常曉燕
(1.中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所,北京 100081; 2.農(nóng)業(yè)農(nóng)村部農(nóng)業(yè)大數(shù)據(jù)重點實驗室,北京 100081;3.中國農(nóng)業(yè)科學(xué)院,北京 100081; 4.北京航天豐益信息技術(shù)有限公司,北京 100081)
黨的十八大以來,“創(chuàng)新驅(qū)動發(fā)展”成為國家戰(zhàn)略,科技創(chuàng)新被擺在國家發(fā)展全局的核心位置。黨中央、國務(wù)院決策部署,堅持把農(nóng)業(yè)科技創(chuàng)新擺到農(nóng)業(yè)農(nóng)村發(fā)展的核心,進一步完善政策舉措,加大支持力度,力圖通過加快提升農(nóng)業(yè)科技進步和創(chuàng)新水平,為我國由農(nóng)業(yè)大國走向農(nóng)業(yè)強國提供堅實的科技支撐[1]。在2019年第十三屆全國人大二次會議和全國政協(xié)二次會議上,習(xí)近平總書記指出,“只有把核心技術(shù)掌握在自己手中,才能真正掌握競爭和發(fā)展的主動權(quán),才能從根本上保障國家經(jīng)濟安全、國防安全和其他安全”。2020 年中央經(jīng)濟工作會議提出,在農(nóng)業(yè)領(lǐng)域要開展種源“卡脖子”技術(shù)攻關(guān),堅決落實“藏糧于地、藏糧于技”戰(zhàn)略。農(nóng)業(yè)“卡脖子”問題第一次被提到國家戰(zhàn)略高度[2]。2022 年國務(wù)院《“十四五”推進農(nóng)業(yè)農(nóng)村現(xiàn)代化規(guī)劃》提到,“加快實施農(nóng)業(yè)生物育種重大科技項目,有序推進生物育種產(chǎn)業(yè)化應(yīng)用”[3]。2022 年中央一號文件更是明確提出,“全面實施種業(yè)振興行動方案,推進種業(yè)重大創(chuàng)新平臺建設(shè)[4]?!碑?dāng)前,突破核心技術(shù)的瓶頸并解決農(nóng)業(yè)“卡脖子”難題的有效路徑是發(fā)揮市場經(jīng)濟條件下新型舉國體制優(yōu)勢,集中優(yōu)勢資源和科研力量實施協(xié)同攻關(guān),實施自主研發(fā)和科研創(chuàng)新,這樣才能最終解決我國農(nóng)業(yè)領(lǐng)域“卡脖子”問題,穩(wěn)住農(nóng)業(yè)基本盤,筑牢“三農(nóng)”壓艙石。按照問題導(dǎo)向、頂層統(tǒng)籌、數(shù)據(jù)驅(qū)動、開放共享、協(xié)同攻關(guān)的發(fā)展思路,構(gòu)建農(nóng)業(yè)農(nóng)村科研協(xié)同創(chuàng)新基礎(chǔ)設(shè)施,是維護國家糧食安全重要戰(zhàn)略的具體舉措,具有重要現(xiàn)實意義。
隨著人工智能、云計算、物聯(lián)網(wǎng)技術(shù)和大數(shù)據(jù)技術(shù)突飛猛進發(fā)展,數(shù)據(jù)爆炸式增長,農(nóng)業(yè)科學(xué)研究持續(xù)向精細化、智能化方向演進,數(shù)據(jù)密集型科研已成為科研創(chuàng)新的典型特征。世界各國紛紛制定數(shù)據(jù)密集型科研發(fā)展戰(zhàn)略,持續(xù)投入大量資金支撐數(shù)據(jù)密集型科研的數(shù)字基礎(chǔ)設(shè)施建設(shè),促進科研模式的變革,實現(xiàn)科技創(chuàng)新跨越。歐盟、美國等推出一系列行動規(guī)劃,予以持續(xù)推進,已形成了明確的數(shù)字基礎(chǔ)設(shè)施發(fā)展架構(gòu)。我國也高度重視新型基礎(chǔ)設(shè)施建設(shè)[5],“十四五”規(guī)劃做出明確部署,截至2020 年10 月,國家發(fā)展和改革委員會已布局建設(shè)55 個國家重大科技基礎(chǔ)設(shè)施[6],為科學(xué)技術(shù)研究提供了有力支撐。
科學(xué)研究的進步促使科研數(shù)字基礎(chǔ)設(shè)施的性能和規(guī)模加速向更高量級發(fā)展,我國新型基礎(chǔ)設(shè)施建設(shè)相關(guān)政策路線日趨清晰,農(nóng)業(yè)農(nóng)村科研協(xié)同創(chuàng)新基礎(chǔ)設(shè)施已成為未來鄉(xiāng)村振興的新動能和搶占全球農(nóng)業(yè)制高點的重要物質(zhì)技術(shù)基礎(chǔ)。因此,新型基礎(chǔ)設(shè)施必將與科學(xué)研究的整個生命周期共融,促進數(shù)據(jù)高效流動,催生更多、更具價值的科學(xué)發(fā)現(xiàn)[1],支撐原始創(chuàng)新、基礎(chǔ)研究和產(chǎn)業(yè)應(yīng)用,推動農(nóng)業(yè)農(nóng)村高質(zhì)量發(fā)展,促進我國從科技大國向科技強國轉(zhuǎn)變。本文系統(tǒng)分析了我國農(nóng)業(yè)科研協(xié)同創(chuàng)新研究現(xiàn)狀及當(dāng)前存在的問題,創(chuàng)造性地提出建立1套支撐系統(tǒng)、2套服務(wù)體系和多項應(yīng)用內(nèi)容的系統(tǒng)基礎(chǔ)實施架構(gòu),構(gòu)建了服務(wù)多學(xué)科交叉融合的農(nóng)業(yè)農(nóng)村科研協(xié)同創(chuàng)新平臺,簡化并加速人工智能模型和數(shù)據(jù)的迭代和流動,實現(xiàn)大規(guī)模異構(gòu)計算資源調(diào)度技術(shù)、多模態(tài)數(shù)據(jù)融合方法和友好的開發(fā)支撐環(huán)境。
縱觀已有研究,技術(shù)創(chuàng)新從最初的個體企業(yè)創(chuàng)新逐步延伸到全面創(chuàng)新和協(xié)同創(chuàng)新[2]。然而,由于理解視角差異,學(xué)者們對協(xié)同創(chuàng)新的內(nèi)涵尚未達成一致,一般認為科研協(xié)同創(chuàng)新是以科研團隊或人員間資源共享為前提,以各類聯(lián)合攻關(guān)、效益分配、風(fēng)險分擔(dān)為原則,以分工協(xié)作、共同開展技術(shù)攻關(guān)為方式,達到創(chuàng)新解決科研難題的目的。協(xié)同創(chuàng)新的概念源于協(xié)同學(xué),1976 年著名物理學(xué)家Haken[3]首次系統(tǒng)地提出協(xié)同理論,并發(fā)表了《協(xié)同學(xué)導(dǎo)論》等著作。當(dāng)前,該研究主要分3 種類型,分別是概念、模式、要素。
20世紀(jì)80年代后,協(xié)同思想在創(chuàng)新系統(tǒng)理論中得到應(yīng)用,很多文獻以國家創(chuàng)新系統(tǒng)及產(chǎn)學(xué)研合作為主題,探索企業(yè)與大學(xué)、科研機構(gòu)或中介組織等不同合作對象之間的協(xié)同創(chuàng)新問題。美國麻省理工學(xué)院斯隆中心(MIT Sloan’s Center for Collective Intelligence)的研究員彼得·葛洛(Peter Gloor)最早給出“協(xié)同創(chuàng)新”的定義,即“由自我激勵的人員所組成的網(wǎng)絡(luò)小組形成集體愿景,借助網(wǎng)絡(luò)交流思路、信息及工作狀況,合作實現(xiàn)共同的目標(biāo)”[4]。
近年來,協(xié)同創(chuàng)新引起了國外很多學(xué)者的關(guān)注,經(jīng)典理論有“三重螺旋”理論、科學(xué)知識生產(chǎn)“模式2”等,但目前對協(xié)同創(chuàng)新的內(nèi)涵、動因、要素、模式等仍未系統(tǒng)化和體系化。例如,在協(xié)同創(chuàng)新模式方面,有學(xué)者認為,與競爭對手合作不是實現(xiàn)產(chǎn)品創(chuàng)新最合適的方式,因為存在信息泄漏的潛在風(fēng)險,并且不同的合作伙伴有不同的利益。但Ritala 等[5]認為,與競爭對手合作是創(chuàng)造漸進性創(chuàng)新和根本性創(chuàng)新的有效途徑,在高科技產(chǎn)業(yè)領(lǐng)域尤為明顯。
在協(xié)同創(chuàng)新要素方面,也有不同的結(jié)論。國外產(chǎn)學(xué)研協(xié)同創(chuàng)新在實踐方面已積累了一系列成功經(jīng)驗,如美國硅谷產(chǎn)學(xué)研“聯(lián)合創(chuàng)新網(wǎng)絡(luò)”;美國北卡三角科技園官、產(chǎn)、學(xué)、研協(xié)同創(chuàng)新;日本《工礦業(yè)技術(shù)研究組合法》提出的企業(yè)協(xié)同創(chuàng)新;韓國“技術(shù)研究組合”提出的若干行業(yè)大科學(xué)工程;歐洲一體化進程中芬蘭、愛爾蘭、瑞典等協(xié)同創(chuàng)新網(wǎng)絡(luò)[6]。
《國家中長期科學(xué)和技術(shù)發(fā)展規(guī)劃綱要(2006—2020 年)》首次提出“建立產(chǎn)學(xué)研結(jié)合的技術(shù)創(chuàng)新體系是建設(shè)國家創(chuàng)新體系的突破口”[7]。目前,產(chǎn)學(xué)研已經(jīng)成為我國科技創(chuàng)新的最新范式,現(xiàn)有文獻定性論述了產(chǎn)學(xué)研協(xié)同創(chuàng)新的現(xiàn)狀、內(nèi)涵、動力、模式、機制、過程、影響因素、績效評價和政策建議等方面,且普遍采用系統(tǒng)論分析,代表觀點是陳勁等[8]提出的“多主體協(xié)同互動論”。縱觀近幾年的研究成果,我國學(xué)者主要從以下幾方面對政產(chǎn)學(xué)協(xié)同創(chuàng)新進行了研究。①有關(guān)協(xié)同創(chuàng)新效率及其影響因素的研究。黃菁菁[9]在分析產(chǎn)學(xué)研協(xié)同創(chuàng)新內(nèi)在機理的基礎(chǔ)上,利用企業(yè)面板數(shù)據(jù)對產(chǎn)學(xué)研協(xié)同創(chuàng)新的效率及其影響因素進行了研究。陳懷超等[10]探究了制度支持對產(chǎn)學(xué)研協(xié)同創(chuàng)新的影響,認為正式和非正式制度支持均對產(chǎn)學(xué)研協(xié)同創(chuàng)新有正向影響。②基于博弈理論模型。研究主體之間的協(xié)同創(chuàng)新機制及其利益分配策略,研究的側(cè)重點是協(xié)同創(chuàng)新過程中不同利益分配機制下主體間的策略選擇。方煒等[11]從創(chuàng)新治理角度,構(gòu)建了產(chǎn)學(xué)研協(xié)同創(chuàng)新治理風(fēng)險分擔(dān)機制,分析了如何利用參與主體風(fēng)險偏好、風(fēng)險承擔(dān)能力、風(fēng)險管理能力以及風(fēng)險損益對治理風(fēng)險分擔(dān)進行調(diào)配。嵇留洋等[12]構(gòu)建了公平偏好影響下產(chǎn)學(xué)研合作主體資源投入行為決策的演化博弈模型,研究了成員的公平偏好程度、產(chǎn)出能力、利益分享比例等因素對資源投入行為選擇的影響。③三螺旋理論模型。借助于信息論相關(guān)理論,利用信息熵指標(biāo)測度主體之間的協(xié)同度,熵越大表示主體之間的合作越密切,協(xié)同度越高。吳衛(wèi)紅等[13]基于三螺旋理論模型,構(gòu)建了政府、企業(yè)、大學(xué)研究機構(gòu)和資本部門的四螺旋模型,并從互信息的角度利用信息熵測度了4 個主體之間的協(xié)同創(chuàng)新程度。另外,還有部分學(xué)者對產(chǎn)學(xué)研協(xié)同創(chuàng)新的機理或管理模式進行了研究,如原長弘等[14]在探討企業(yè)家主導(dǎo)產(chǎn)學(xué)研協(xié)同創(chuàng)新提高企業(yè)創(chuàng)新能力和創(chuàng)新績效機理的基礎(chǔ)上,提出了以企業(yè)為主體的產(chǎn)學(xué)研協(xié)同創(chuàng)新管理框架。教育部“高等學(xué)校創(chuàng)新能力提升計劃”(簡稱“2011 計劃”),自2012年啟動實施,4年為1個周期。
環(huán)顧國內(nèi),協(xié)同創(chuàng)新已經(jīng)成為各省市區(qū)競相探索的新型創(chuàng)新模式。我國載入史冊的兩彈一星工程、載人航天工程、嫦娥工程等重大技術(shù)攻關(guān)[15],都是具有中國特色的協(xié)同創(chuàng)新的成果。近年來,北京、江蘇等省(自治區(qū)、直轄市)在全面推進原始創(chuàng)新、集成創(chuàng)新、引進消化吸收再創(chuàng)新的同時,也在探索推動協(xié)同創(chuàng)新模式,力求在新一輪的世界科技創(chuàng)新競賽中爭得先機,爭取科技創(chuàng)新優(yōu)勢[16]。如北京成立了協(xié)同創(chuàng)新服務(wù)聯(lián)盟,服務(wù)于重大科技成果轉(zhuǎn)化和產(chǎn)業(yè)化,大力促進戰(zhàn)略性新興產(chǎn)業(yè)發(fā)展。
我國的TD-SCDMA(time division-synchronous code division multiple access,時分同步碼分多址)產(chǎn)業(yè)化專項成立首個企業(yè)自發(fā)形成的產(chǎn)業(yè)協(xié)調(diào)組織(TD industry alliance,TDIA),形成了專利共享、共同開發(fā)、協(xié)同組織的產(chǎn)業(yè)發(fā)展機制,開創(chuàng)了我國政、產(chǎn)、學(xué)、研相結(jié)合的產(chǎn)業(yè)協(xié)同創(chuàng)新發(fā)展模式[17],加快了產(chǎn)業(yè)化整體進程。如新型冠狀病毒爆發(fā)以來,中央統(tǒng)籌科學(xué)技術(shù)部、衛(wèi)生健康委員、國家藥品監(jiān)督管理局、教育部等12 個部門進行協(xié)同攻關(guān),設(shè)立藥物研發(fā)、疫苗研發(fā)、檢測試劑等10個重點工作專班,聚焦臨床救治、藥物和疫苗研發(fā)及檢測技術(shù)、病毒病原學(xué)、流行病學(xué)、動物模型構(gòu)建等5個研究方向,部署83個應(yīng)急攻關(guān)項目,組織動員全國優(yōu)勢力量開展疫情防控科研攻關(guān)[18],形成了全國一盤棋的攻關(guān)格局,并取得了全世界矚目的成績。
當(dāng)前,我國正加快從農(nóng)業(yè)大國向農(nóng)業(yè)科技強國邁進,農(nóng)業(yè)科技創(chuàng)新也將由跟跑、并跑向領(lǐng)跑轉(zhuǎn)變。長期以來,我國農(nóng)業(yè)科技創(chuàng)新體系缺乏有效的統(tǒng)籌協(xié)同機制,解決重大科技問題的協(xié)同創(chuàng)新合力不夠。從科技創(chuàng)新組織模式來看,現(xiàn)代科技多學(xué)科交叉融合趨勢加劇,迫切需要打破各創(chuàng)新主體間的壁壘,圍繞共同的創(chuàng)新目標(biāo),有效匯聚創(chuàng)新資源和創(chuàng)新要素,實現(xiàn)優(yōu)勢互補、資源共享和合作攻關(guān),建立起完整的創(chuàng)新鏈條,不斷提升創(chuàng)新效率和科技成果產(chǎn)出。從解決農(nóng)業(yè)重大科技問題的現(xiàn)實需求來看,農(nóng)業(yè)科技活動的綜合性、系統(tǒng)性和開放性突出,創(chuàng)新環(huán)節(jié)多、鏈條長和成果產(chǎn)出周期長,多學(xué)科交叉明顯,外部影響因素多,不通過持續(xù)協(xié)同攻關(guān)很難解決制約產(chǎn)業(yè)發(fā)展的瓶頸性問題[19]。這對構(gòu)建完全自主、安全、可控且突破“卡脖子”關(guān)鍵核心技術(shù)的新型數(shù)字科研基礎(chǔ)設(shè)施,實現(xiàn)從根本上保障國家農(nóng)業(yè)科技創(chuàng)新安全和科技自立自強提出了迫切需求。習(xí)近平總書記強調(diào),要推動互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能和實體經(jīng)濟深度融合,加快制造業(yè)、農(nóng)業(yè)、服務(wù)業(yè)數(shù)字化、網(wǎng)絡(luò)化、智能化。這可以瞄準(zhǔn)農(nóng)業(yè)現(xiàn)代化主攻方向,提高農(nóng)業(yè)生產(chǎn)智能化、經(jīng)營網(wǎng)絡(luò)化水平,幫助廣大農(nóng)民增加收入[20]。農(nóng)業(yè)農(nóng)村部高度重視智能農(nóng)業(yè)的發(fā)展,并在頂層設(shè)計、統(tǒng)籌協(xié)調(diào)、創(chuàng)新應(yīng)用、產(chǎn)業(yè)發(fā)展、區(qū)域示范等方面取得了顯著進展,但是仍然存在一些束縛農(nóng)業(yè)農(nóng)村科研協(xié)同創(chuàng)新的瓶頸性問題亟待解決。
伴隨生物和信息技術(shù)的發(fā)展,過去10 年間我國育種數(shù)據(jù)的數(shù)量呈現(xiàn)爆炸性增加趨勢。據(jù)國家農(nóng)業(yè)科學(xué)數(shù)據(jù)中心調(diào)研測算,我國目前年產(chǎn)出育種數(shù)據(jù)超過500 PB,且年增長率超過30%。從企業(yè)調(diào)研情況來看,70.8%的企業(yè)育種科研團隊將相關(guān)數(shù)據(jù)內(nèi)部保存;20.8%愿意將數(shù)據(jù)提交數(shù)據(jù)管理機構(gòu)統(tǒng)一存儲;4.2%將數(shù)據(jù)隨論文發(fā)表公開。但相較于上萬家育種團隊、年產(chǎn)出的數(shù)百PB育種數(shù)據(jù)來說,國家農(nóng)業(yè)科學(xué)數(shù)據(jù)中心的總存儲能力僅為不到2 PB,“小馬拉大車”的窘境凸顯。數(shù)據(jù)作為生產(chǎn)要素的重要作用沒有得到充分發(fā)揮,同時行業(yè)數(shù)據(jù)的較低共享水平造成數(shù)據(jù)生產(chǎn)的較高重復(fù)投入。
農(nóng)業(yè)農(nóng)村部存儲和計算能力較強的是農(nóng)業(yè)農(nóng)村部信息中心和大數(shù)據(jù)管理中心,存儲能力分別為5.0 和2.4 PB,計算能力分別為9 000 和1 000核[21]。中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所高性能計算平臺存儲能力達到1 PB,運算能力22萬億次·s-1。育種數(shù)據(jù)必須經(jīng)過充分分析和挖掘才能發(fā)揮價值,實現(xiàn)對育種產(chǎn)業(yè)的支撐作用。當(dāng)前最先進的育種技術(shù)中普遍涉及的基因編輯位點篩選和設(shè)計、高密度圖譜構(gòu)建與精細定位、優(yōu)勢基因聚合和表型預(yù)測等試驗,以及市場導(dǎo)向下快速、精準(zhǔn)育種等育種目標(biāo)的制定,都需要建立在對大田、實驗室、市場等方面各種數(shù)據(jù)的精細挖掘和分析的基礎(chǔ)之上。算力基礎(chǔ)設(shè)施的缺位嚴重制約了計算育種分析挖掘能力,桎梏育種產(chǎn)業(yè)升級。
黨的十九屆四中全會首次提出“要健全數(shù)據(jù)作為一種新型生產(chǎn)要素由市場評價貢獻、按貢獻決定報酬的機制[22]。”然而,當(dāng)前數(shù)據(jù)要素市場尚未建立流通體制機制,數(shù)據(jù)確權(quán)、定價、交易、跨境流通等基本制度還未構(gòu)建完成,合法、成熟的數(shù)據(jù)流通模式尚未建立起來。比如數(shù)據(jù)確權(quán)方面,現(xiàn)有的物權(quán)法、合同法、知識產(chǎn)權(quán)法等法律未能及時完善。
政務(wù)數(shù)據(jù)共享方面,數(shù)據(jù)資源共享壁壘仍難以打破,由此帶來數(shù)據(jù)資源的調(diào)度欠缺統(tǒng)籌管理,條塊分割問題普遍存在,共享渠道不暢[23]。將數(shù)據(jù)視為“私人財產(chǎn)”的科研人員和團隊普遍存在。
在應(yīng)用和算法層面,我國在大數(shù)據(jù)算法的原始創(chuàng)新、工程實現(xiàn)和系統(tǒng)平臺3 個核心領(lǐng)域與世界發(fā)達國家相比均存在較大差距。前沿的計算框架和衍生生態(tài)圈分布均在國外開源社區(qū),一旦開源代碼和軟件受到管制,我國大數(shù)據(jù)產(chǎn)業(yè)將面臨巨大風(fēng)險。
近日,聯(lián)合國經(jīng)濟合作與發(fā)展組織發(fā)布《科技與創(chuàng)新的數(shù)字化:關(guān)鍵發(fā)展與政策》,指出數(shù)字技術(shù)正在以多元化方式變革科技創(chuàng)新。為把握農(nóng)業(yè)科技創(chuàng)新發(fā)展主動權(quán),我國亟需加速數(shù)字技術(shù)賦能科技協(xié)同創(chuàng)新,優(yōu)化與重構(gòu)農(nóng)業(yè)科技創(chuàng)新體系底層基礎(chǔ)設(shè)施和運行邏輯。一是盤活數(shù)據(jù)要素活力,改變高價值農(nóng)業(yè)科學(xué)數(shù)據(jù)國內(nèi)未充分挖掘就流失國外的現(xiàn)狀,改變過去以“實體化”“條塊化”“區(qū)域化”“領(lǐng)域化”為基礎(chǔ)的數(shù)據(jù)要素模式,推動數(shù)據(jù)要素有序流動與價值開發(fā);二是提高自主可控核心技術(shù)研發(fā)能力,基于人工智能、區(qū)塊鏈、云計算、大數(shù)據(jù)、邊緣計算等關(guān)鍵技術(shù)構(gòu)建“數(shù)據(jù)”+“算法”+“算力”的新興農(nóng)業(yè)協(xié)同創(chuàng)新基礎(chǔ)設(shè)施,打造群體性、鏈條化、跨領(lǐng)域創(chuàng)新生態(tài);三是應(yīng)對數(shù)據(jù)密集型科研發(fā)展新范式,構(gòu)建新型數(shù)字科研基礎(chǔ)設(shè)施,推進交叉學(xué)科融合創(chuàng)新,改變農(nóng)業(yè)領(lǐng)域?qū)W科鏈、創(chuàng)新鏈與產(chǎn)業(yè)鏈融通性不足的問題。
從農(nóng)業(yè)科研的實際出發(fā),將人工智能、區(qū)塊鏈、云計算、大數(shù)據(jù)等新型信息技術(shù)與農(nóng)業(yè)科研相融合,構(gòu)建基于“數(shù)據(jù)”+“算法”+“算力”的新興農(nóng)業(yè)協(xié)同創(chuàng)新基礎(chǔ)設(shè)施,搭建科研協(xié)同創(chuàng)新平臺,打造農(nóng)業(yè)科研協(xié)同創(chuàng)新環(huán)境,構(gòu)建農(nóng)業(yè)領(lǐng)域科研數(shù)據(jù)池及科研場景,服務(wù)全國農(nóng)業(yè)科研工作人員、科研機構(gòu)、高校院所,突破農(nóng)業(yè)科技核心關(guān)鍵領(lǐng)域和“卡脖子”技術(shù),實現(xiàn)農(nóng)業(yè)科技自立自強。該平臺作為智能化科學(xué)計算的基礎(chǔ)設(shè)施簡化并加速了人工智能模型和數(shù)據(jù)的迭代和流動,實現(xiàn)了大規(guī)模異構(gòu)計算資源調(diào)度技術(shù)、多模態(tài)數(shù)據(jù)融合方法和易用性開發(fā)支撐環(huán)境。農(nóng)業(yè)農(nóng)村科研協(xié)同創(chuàng)新基礎(chǔ)設(shè)施按照“統(tǒng)籌規(guī)劃、統(tǒng)一設(shè)計”原則進行建設(shè),整體分為5 層架構(gòu)1 套保障機制,5 層架構(gòu)包括數(shù)據(jù)資源層、基礎(chǔ)支撐層、服務(wù)系統(tǒng)層、應(yīng)用場景層和服務(wù)用戶層,1 套保障機制即平臺運行保障機制,如圖1所示。
圖1 系統(tǒng)總體結(jié)構(gòu)Fig. 1 Whole frame of system
多維度、多粒度、多模態(tài)的大數(shù)據(jù)資源是農(nóng)業(yè)農(nóng)村科研協(xié)同創(chuàng)新平臺向各類用戶提供知識服務(wù)的基礎(chǔ)。通過對多來源、多類型基礎(chǔ)數(shù)據(jù)進行系統(tǒng)采集、匯聚和深度挖掘,實現(xiàn)農(nóng)業(yè)科技大數(shù)據(jù)的匯聚治理與挖掘利用,構(gòu)建包括科研論文在內(nèi)的科技信息交流的新生態(tài)。該平臺的數(shù)據(jù)資源主要包括國家農(nóng)業(yè)農(nóng)村部大數(shù)據(jù)中心、國家農(nóng)業(yè)圖書館的文獻數(shù)據(jù)、農(nóng)業(yè)科研基地與實驗室科學(xué)數(shù)據(jù)、“數(shù)字農(nóng)科院”科研管理數(shù)據(jù)、國家農(nóng)業(yè)科學(xué)數(shù)據(jù)中心科研項目數(shù)據(jù)以及農(nóng)業(yè)領(lǐng)域數(shù)據(jù)等,如計算育種數(shù)據(jù)、植保有害數(shù)據(jù)和旱作農(nóng)業(yè)數(shù)據(jù)等。數(shù)據(jù)資源層的建設(shè)目標(biāo)是通過整合目前已有數(shù)字資源(國家農(nóng)業(yè)圖書館、數(shù)字農(nóng)科院以及國家農(nóng)業(yè)科學(xué)數(shù)據(jù)中心)、農(nóng)業(yè)科研基地與實驗室新建數(shù)據(jù)資源以及在平臺使用過程中沉淀下來的專業(yè)領(lǐng)域數(shù)據(jù)庫等多種方式,實現(xiàn)多源異構(gòu)知識資源的有效整合和關(guān)聯(lián)打通,構(gòu)建規(guī)范的農(nóng)業(yè)領(lǐng)域科技知識大數(shù)據(jù)倉儲,建立安全存儲機制和一體化管理平臺,為農(nóng)業(yè)科研協(xié)同創(chuàng)新提供可靠的數(shù)字基礎(chǔ)設(shè)施保障。
數(shù)字經(jīng)濟時代,數(shù)據(jù)成為新的生產(chǎn)資料,計算力成為新的生產(chǎn)力,高性能計算和通用算法成為先進的生產(chǎn)工具。農(nóng)業(yè)科研在科學(xué)履職的同時,面臨著大量科學(xué)數(shù)據(jù)、實驗數(shù)據(jù)等數(shù)據(jù)安全問題,極大地影響著我國農(nóng)業(yè)科技自主創(chuàng)新和數(shù)字農(nóng)業(yè)生態(tài)建設(shè)。比如在計算育種領(lǐng)域,信息技術(shù)與作物育種的深度融合使得作物育種數(shù)據(jù)呈現(xiàn)爆炸式增長,且所獲得的數(shù)據(jù)也不再局限于田間性狀調(diào)查結(jié)果,同時還包括動態(tài)環(huán)境數(shù)據(jù)(土壤、氣候、水分等)、影像數(shù)據(jù)、基因表達及分子標(biāo)記等基因型數(shù)據(jù)、代謝物動態(tài)數(shù)據(jù)以及生產(chǎn)管理數(shù)據(jù)等[24],數(shù)據(jù)量龐大。以中國“3K”水稻基因組數(shù)據(jù)為例,其收集了全球2 859 份水稻品種,產(chǎn)生了將近16 T的數(shù)據(jù)量。大數(shù)據(jù)的5V(volume,大體量;velocity,時效性;variety,多樣性;value,大價值;veracity,準(zhǔn)確性)特性以及高安全性的需求,都需要自建分布式大數(shù)據(jù)高性能計算與分析基礎(chǔ)設(shè)施,實現(xiàn)科研基礎(chǔ)大數(shù)據(jù)匯聚融合、治理管控與挖掘分析,為第四范式科研創(chuàng)新提供高速穩(wěn)定的大數(shù)據(jù)傳輸通道。
我國農(nóng)業(yè)科研創(chuàng)新過度依賴國外底盤技術(shù)(如工具和模型等)不僅嚴重制約數(shù)據(jù)的共享和利用形式,更面臨日益嚴峻的“卡脖子”技術(shù)風(fēng)險。哈爾濱工業(yè)大學(xué)、哈爾濱工程大學(xué)2 所院校被美國禁用MATLAB,再次證明關(guān)鍵的底盤技術(shù)必須依靠科技的自立自強。基于農(nóng)業(yè)科研協(xié)同創(chuàng)新大數(shù)據(jù)體系,集成并優(yōu)化深度學(xué)習(xí)、認知計算、文本挖掘等人工智能技術(shù),研制1 套新型知識共享服務(wù)系統(tǒng),實現(xiàn)智能化、專業(yè)化的農(nóng)業(yè)學(xué)術(shù)搜索引擎和知識發(fā)現(xiàn),提供多維度地供給智能知識服務(wù)支撐。以我國農(nóng)業(yè)科學(xué)自主研發(fā)的各類算法和模型為基礎(chǔ),研制1 套智能模型服務(wù)系統(tǒng),實現(xiàn)模型構(gòu)建、模型驗證、模型訓(xùn)練、結(jié)果可視化等功能,為農(nóng)業(yè)科研模型創(chuàng)新提供模型構(gòu)建可視化環(huán)境、知識庫、案例庫等支撐。
n個應(yīng)用場景,是以n個專業(yè)領(lǐng)域數(shù)據(jù)源為核心,以新型知識共享服務(wù)系統(tǒng)和智能模型服務(wù)系統(tǒng)為支撐的具體化應(yīng)用模塊,體現(xiàn)了農(nóng)業(yè)農(nóng)村科研協(xié)同平臺的開放性和拓展性?;谀壳拔覈谟嬎阌N、植保有害物種協(xié)同監(jiān)測預(yù)警、旱作農(nóng)業(yè)等領(lǐng)域的“跟跑”緊迫性,本研究基于1 套支撐平臺和豐富的知識服務(wù)、模型服務(wù)系統(tǒng),面向這3個應(yīng)用領(lǐng)域開展科研創(chuàng)新應(yīng)用研究,搭建作物計算育種、植保有害協(xié)同監(jiān)測以及旱作農(nóng)業(yè)共3 個科研協(xié)同創(chuàng)新應(yīng)用系統(tǒng)。其中,作物計算育種平臺聚焦作物重要性狀的遺傳網(wǎng)絡(luò)解析,以合成生物、基因組編輯、全基因組選擇等前沿技術(shù)驅(qū)動,深度融合人工智能、大數(shù)據(jù)等前沿學(xué)科,建設(shè)“性狀解析-元件設(shè)計-通路合成-材料測試-育種決策”一體化的作物精準(zhǔn)設(shè)計育種重大科技基礎(chǔ)設(shè)施平臺[25],打造成為我國作物種業(yè)創(chuàng)新的國家戰(zhàn)略科技力量;植保有害協(xié)同監(jiān)測科研協(xié)同創(chuàng)新應(yīng)用系統(tǒng)主要實現(xiàn)遠程智能一體化的農(nóng)作物外來有害生物監(jiān)測預(yù)警、潛在外來有害生物前瞻性風(fēng)險智能預(yù)判、原發(fā)性農(nóng)業(yè)有害生物發(fā)生/流行與災(zāi)變的人工智能監(jiān)測、診斷與預(yù)警等應(yīng)用功能;全球旱作農(nóng)業(yè)科研協(xié)同創(chuàng)新應(yīng)用系統(tǒng)主要實現(xiàn)干旱災(zāi)害預(yù)測及旱作種植結(jié)構(gòu)調(diào)整等應(yīng)用功能。
創(chuàng)新基礎(chǔ)設(shè)施定位于構(gòu)建開放科學(xué)研究、自主安全可控、泛在可持續(xù)服務(wù)農(nóng)業(yè)第四范式的新型數(shù)據(jù)密集型科研協(xié)同創(chuàng)新平臺,打造支撐科學(xué)實驗、科學(xué)研究、數(shù)據(jù)分析、學(xué)術(shù)交流的農(nóng)業(yè)科研協(xié)同創(chuàng)新環(huán)境,吸引全國范圍內(nèi)農(nóng)業(yè)領(lǐng)域人才入駐,在平臺上進行科學(xué)研究、數(shù)據(jù)共享,構(gòu)建農(nóng)業(yè)領(lǐng)域科研數(shù)據(jù)池及科研場景,推進互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等新技術(shù)在農(nóng)業(yè)領(lǐng)域的深度融合,服務(wù)于農(nóng)業(yè)系統(tǒng)各個科研機構(gòu),各個實驗室、基地、創(chuàng)新中心及團隊,以及全國范圍內(nèi)的涉農(nóng)科研院所、各?。ㄖ陛犑小⒆灾螀^(qū))農(nóng)業(yè)科研機構(gòu)、高校院所等研究機構(gòu)。
建立1 套平臺的標(biāo)準(zhǔn)規(guī)范體系,統(tǒng)一標(biāo)準(zhǔn)、統(tǒng)一服務(wù)、縱向貫通、橫向集成,通過對現(xiàn)有相關(guān)標(biāo)準(zhǔn)規(guī)范的繼承、拓展,以及根據(jù)需要編訂新的標(biāo)準(zhǔn)規(guī)范,構(gòu)建統(tǒng)一的、適用性強的應(yīng)用標(biāo)準(zhǔn)體系,保證農(nóng)業(yè)農(nóng)村科研協(xié)同創(chuàng)新平臺項目將來在全國范圍內(nèi)的推廣實施。建立1 套平臺的建設(shè)運行管理體系,圍繞總體任務(wù)目標(biāo),明確分工、協(xié)同配合,形成多方、多層次共同參與的組織運作機制,使之最大程度地發(fā)揮算力支撐、數(shù)據(jù)服務(wù)、知識共享、模型服務(wù)等效能,保障平臺正常、健康、高效的運行。建立1套安全保障體系,重點解決當(dāng)前數(shù)據(jù)安全領(lǐng)域出現(xiàn)的一系列全新挑戰(zhàn)和問題,圍繞服務(wù)器芯片、云數(shù)據(jù)庫、中間件、分布式計算與存儲,建立網(wǎng)絡(luò)和數(shù)據(jù)一體化安全防護體系和面向數(shù)據(jù)、算力、算法等資源流通的綜合監(jiān)管體系,強化大數(shù)據(jù)安全保障,有效促進國產(chǎn)化數(shù)據(jù)安全產(chǎn)業(yè)發(fā)展。
科學(xué)數(shù)據(jù)是國家科技創(chuàng)新發(fā)展和經(jīng)濟社會發(fā)展的重要基礎(chǔ)性戰(zhàn)略資源。近年來,隨著我國科技投入不斷增長,科技創(chuàng)新能力不斷提升,科學(xué)數(shù)據(jù)呈現(xiàn)出“井噴式”增長,而且質(zhì)量大幅提高[26]。以育種數(shù)據(jù)為例,當(dāng)前遺傳育種科學(xué)研究高度依賴NCBI 等多個國外基礎(chǔ)性數(shù)據(jù)中心。這些數(shù)據(jù)中心通過免費提供多種樞紐性的數(shù)據(jù)庫、基礎(chǔ)性的數(shù)據(jù)分析工具、體系化的論文這—數(shù)據(jù)庫共生制度,形成了對育種科學(xué)研究的國際性壟斷?!拔覈?jīng)費支持數(shù)據(jù)國內(nèi)產(chǎn)出-科學(xué)家免費上傳至國外數(shù)據(jù)中心-國外數(shù)據(jù)中心支配再分配”已經(jīng)成為危險的閉環(huán)。這給我國育種科學(xué)研究留下諸多隱患。面對我國科技基礎(chǔ)數(shù)據(jù)外流的嚴峻現(xiàn)實,帶來研發(fā)工作受制于人、國家戰(zhàn)略和科技安全存在隱患等問題,需要打造安全可靠的國家科技數(shù)據(jù)基礎(chǔ)設(shè)施,牢牢把握住我國科學(xué)家自己生產(chǎn)的數(shù)據(jù),開發(fā)、利用、共享和保護好這一重要的基礎(chǔ)性戰(zhàn)略資源。
伴隨著大數(shù)據(jù)人工智能等學(xué)科的發(fā)展,基因編輯、合成生物等基因組定向精準(zhǔn)改良技術(shù)的逐步建立,智能育種開啟了全新的4.0時代。以水稻為例,水稻有4 萬多個基因,幾乎是人類基因總數(shù)的2 倍[27],面對海量的基因數(shù)據(jù),以人工智能為依托,通過基因型與表型數(shù)據(jù)的高通量自動化獲取與解析,整合各類數(shù)據(jù),建立基于深度學(xué)習(xí)的精準(zhǔn)預(yù)測模型,借助基因編輯與合成生物學(xué)等先進技術(shù),實現(xiàn)智能、高效、定向培育新品種。深度融合“高密計算+大數(shù)據(jù)+深度學(xué)習(xí)”等技術(shù),構(gòu)建科技創(chuàng)新算力基礎(chǔ)設(shè)施和公共計算服務(wù)平臺,通過現(xiàn)有的基因、分子、環(huán)境和表型等多模態(tài)和多尺度海量數(shù)據(jù)集,建立高精度模型,推動作物育種從“試驗選優(yōu)”向“計算選優(yōu)”的根本轉(zhuǎn)變[28],支撐國家南繁科研育種基地育種數(shù)據(jù)的存儲和高性能計算,全面提高育種數(shù)量、速度、質(zhì)量和產(chǎn)量,推進分子精準(zhǔn)育種技術(shù)在我國農(nóng)作物育種領(lǐng)域的規(guī)?;瘧?yīng)用。
我國從追趕到自主創(chuàng)新轉(zhuǎn)型過程中,存在原始創(chuàng)新能力不強、核心技術(shù)受制于先發(fā)達國家的困難,如目前基因編輯技術(shù)原始專利大多被國外控制,需要超前布局一批科學(xué)研究設(shè)施。以計算育種為例,目前使用的分析方法如深度學(xué)習(xí)、機器學(xué)習(xí)、統(tǒng)計學(xué)習(xí)等算法均由國外開發(fā),專用的深度神經(jīng)網(wǎng)絡(luò)基因組預(yù)測模型、從基因型到表型預(yù)測算法、標(biāo)記輔助輪回選擇模擬算法、模擬染色體片段置換系育種模擬工具等都是國外開源的代碼和模型,而少有我國自主深入研發(fā)的算法和模型,面臨缺“芯”之痛。我國轉(zhuǎn)基因產(chǎn)業(yè)化因為基因編輯工具等底盤技術(shù)的缺失而面臨著巨大的壓力。平臺支持Tensorflow、Caffe、PyTorch、Theano、MXNet、Keras、Paddle 等國內(nèi)外的主流深度學(xué)習(xí)框架和人工智能算法庫軟件。作為核心技術(shù),平臺將以各領(lǐng)域農(nóng)業(yè)科研需求為牽引,梳理、整合我國科學(xué)家自主研發(fā)的各類算法和模型,進行推廣應(yīng)用,實現(xiàn)算法和模型的迭代升級,研制1 套智能模型服務(wù)系統(tǒng),實現(xiàn)模型構(gòu)建、模型驗證、模型訓(xùn)練和結(jié)果可視化等功能,為農(nóng)業(yè)科研模型創(chuàng)新提供模型構(gòu)建可視化環(huán)境、知識庫、案例庫等支撐,加速優(yōu)異品種的選育編輯,從根本上改變“我國大豆從原產(chǎn)國淪為進口國”的尷尬境地。
本文從構(gòu)建農(nóng)業(yè)農(nóng)村協(xié)同創(chuàng)新基礎(chǔ)設(shè)施的政策背景和國內(nèi)外研究現(xiàn)狀出發(fā),深度剖析我國農(nóng)業(yè)科技創(chuàng)新面臨的科研大數(shù)據(jù)、高性能計算、原創(chuàng)算法模型、數(shù)據(jù)應(yīng)用創(chuàng)新和數(shù)據(jù)安全防護等瓶頸問題,基于人工智能、區(qū)塊鏈、云計算、大數(shù)據(jù)等先進信息技術(shù)構(gòu)建“數(shù)據(jù)”+“算法”+“算力”深度融合的新型基礎(chǔ)設(shè)施,構(gòu)建服務(wù)多學(xué)科交叉融合的農(nóng)業(yè)農(nóng)村科研協(xié)同創(chuàng)新平臺,簡化并加速人工智能模型和數(shù)據(jù)的迭代和流動,實現(xiàn)大規(guī)模異構(gòu)計算資源調(diào)度技術(shù)、多模態(tài)數(shù)據(jù)融合方法和友好的開發(fā)支撐環(huán)境。該平臺致力于協(xié)助不同學(xué)科領(lǐng)域的科研工作者,將數(shù)據(jù)、模型、算法和算力等資源深度整合,打造即開即用的交互式云端開發(fā)環(huán)境,應(yīng)用到教學(xué)、科學(xué)研究、科學(xué)數(shù)據(jù)集和算法研究等多個場景,形成人工智能融合多學(xué)科的生態(tài)閉環(huán),催生更多且更具價值的科學(xué)發(fā)現(xiàn)。