科學智能(AI for Science,AI4S)是當前人工智能(AI)應用發(fā)展的一個重點方向。2024年4月29日,美國總統(tǒng)科學技術顧問委員會(PCAST)組織美國領域內權威專家,發(fā)布了《賦能研究:利用人工智能應對全球挑戰(zhàn)》報告(本文簡稱《報告》)。該報告提出AI4S發(fā)展的“三角”模型,詳細分析了AI4S的發(fā)展?jié)摿?、重點領域和面臨的挑戰(zhàn),并為美國總統(tǒng)提供了清晰的建議。
《報告》是美國總統(tǒng)《關于安全、可靠和可信地開發(fā)和使用人工智能的行政令》中的一項研究任務。美國白宮圍繞人工智能發(fā)展的重點方向,不定期發(fā)布重要文件,包括:《人工智能權利法案藍圖:讓自動化系統(tǒng)服務于美國人民》 《美國國家人工智能研發(fā)戰(zhàn)略計劃》《關于安全、可靠和可信地開發(fā)和使用人工智能的行政令》。《報告》作為《關于安全、可靠且可信賴的開發(fā)和使用人工智能的行政令》的指定任務,在美國的人工智能政策文件中占有重要地位。
《報告》是首份呈送美國總統(tǒng)的AI4S專案報告。美國能源部、國防部、衛(wèi)生與公眾服務部等部門近年來已陸續(xù)發(fā)布本領域的AI4S報告。PCAST作為總統(tǒng)最高級別的科學政策顧問團,《報告》內容統(tǒng)籌協(xié)調了各部門的研究成果和政策建議,從更宏觀、更綜合的角度對AI4S的發(fā)展機遇和挑戰(zhàn)做出了回應。
《報告》預計將成為未來美國AI4S政策的基本依據。依據《關于安全、可靠和可信地開發(fā)和使用人工智能的行政令》中的要求,《報告》立足于解決重大的全球挑戰(zhàn),解決當前科學研究過程中人工智能技術的應用障礙?!秷蟾妗返某雠_,為美國總統(tǒng)提供了新的科研組織模式和科研流程規(guī)范建議,將為美國政府在AI4S領域的下一步決策提供有力支撐。
《報告》的基本內容
《報告》的主體內容包括三部分,即AI4S的發(fā)展邏輯、發(fā)展方向和面臨挑戰(zhàn)。
AI4S發(fā)展邏輯——AI4S發(fā)展“三角”模型 "《報告》提出人工智能支持科學發(fā)展的三大關鍵要素:提升能力、共享資源和規(guī)范制度。三大要素在AI4S領域形成了一個互相作用、互相促進的良性循環(huán),為科學研究的快速發(fā)展提供了強有力的支持。
“提升能力”,指科學家使用人工智能提升科研能力與效率??茖W家基于AI4S產生的創(chuàng)新成果能夠進一步促進“AI的資源共享”和“科研活動的規(guī)范”。
“共享資源”,指分享算力、數(shù)據、模型等AI4S基礎資源。推動AI4S資源的廣泛使用,一方面能加快“規(guī)范科研活動”的普及速度,同時也能助力更多科研團隊“提升能力”,提升整體科研水平。
“規(guī)范制度”,指科研全流程負責任使用人工智能工具。規(guī)范科研活動,有助于保證“AI資源共享”的質量,也在“提升科學家能力”過程中加速高質量成果產出。
提升能力、共享資源和規(guī)范制度的三角模型
“三角”模型解析了AI4S范式中的技術要素,以及三要素在提升科研效率中的協(xié)同作用,為評判AI4S科研工作流程提供了基礎的分析框架。
基于三角模型,AI4S的發(fā)展前景(如表1)主要分為三方面:一是科研能力提升,AI能夠協(xié)助科學家決策、處理日常任務、自動化實驗流程、承擔高通量計算模擬、分析復雜數(shù)據等任務;二是基礎資源共享,多模態(tài)科學模型能夠進行學科融合、降低科研成本、促進科研機構合作、使AI4S大科學計劃成為可能;三是規(guī)范科研制度,AI4S需要負責任的科研制度,這些科研制度將整合到科研工作全流程中。
AI4S發(fā)展方向:七大核心領域布局 "目前來看,AI并非在所有的科學領域都能夠高效應用。《報告》綜合評估AI4S對社會經濟發(fā)展、公共安全、環(huán)境保護等關鍵領域的深遠影響,確定了七大核心領域。在生命科學領域推動疾病治療進展,在氣象科學領域減輕極端天氣事件的影響,在物理學和宇宙學領域探索新的規(guī)律,在集成電路領域增強半導體自動化設計能力,在材料科學研究領域開發(fā)超導體技術,在農業(yè)和藥物設計領域創(chuàng)新應用,以及在社會科學領域利用數(shù)據驅動政策制定。雖然AI4S能夠發(fā)揮作用的領域不僅限于此七大領域,但是《報告》撰寫組認為,這七個領域的科學研究與AI4S范式適配度高,在應對社會與全球挑戰(zhàn)方面具有先發(fā)優(yōu)勢,預計可獲得較大收益。
AI4S面臨挑戰(zhàn)與行動建議 "《報告》深入調研美國AI4S科研現(xiàn)狀,提出當前發(fā)展階段面臨的挑戰(zhàn),并給出相應行動建議。
鑒于表2中面臨的挑戰(zhàn),《報告》提出了5條建議,其中2條是關于資源共享,2條關于制度規(guī)范,1條關于能力提升。
資源共享方面,《報告》考察了當前美國國會主導的國家人工智能研究資源(NAIRR)項目,該項目在2023至2025年期間的預算高達24億美元,涉及多個政府機構,如國防部高級研究計劃局(DARPA)、美國宇航局(NASA)等共同為獲批研究項目分享計算資源、內部AI模型和數(shù)據集。《報告》強調,為了支持尖端研究,需要高質量數(shù)據和最先進的AI模型。因此,該報告建議在NAIRR的基礎上,一是擴大共享人工智能模型評測基準和計算資源,二是進一步對研究項目開放聯(lián)邦數(shù)據集,以促進科研創(chuàng)新和進步。
規(guī)范制度方面,《報告》指出,人工智能系統(tǒng)在缺乏適當基準指標、驗證程序和負責任使用的情況下,可能產生不可靠的輸出結果,對科學領域造成潛在危害。為此,《報告》建議:一是制定評估AI模型準確性、可重復性和可解釋性的標準,并開發(fā)識別數(shù)據偏見以及區(qū)分合成數(shù)據與真實數(shù)據的工具;二是在科研全階段采用負責任、透明和可信的AI使用原則,以管理潛在風險。
提升科學家研究能力方面,《報告》強調應新增相關科研項目,激勵科研人員完善AI4S的科研基礎設施。建議將科學數(shù)據標注、科學模型訓練等關鍵環(huán)節(jié)納入科研基金項目支持范圍,以激勵科研人員積極參與AI4S模型配套系統(tǒng)設施的開發(fā)研究工作。
借鑒與建議
面對AI4S領域的廣泛應用,“三角”模型可以作為發(fā)展的基本思路參考?!叭恰蹦P蛷娬{在關鍵研究領域進行戰(zhàn)略布局,促進新興科研項目的培育,并以優(yōu)化的科研管理體系為基石,旨在全面提升科研活動的效率。
為了進一步提高國家科研的整體實力,AI4S的研究布局可參考《報告》中提出的七大優(yōu)先發(fā)展領域。各省市可依托本地產業(yè)基礎,有的放矢地推進AI4S的研究與應用。以上海市為例,其戰(zhàn)略舉措包括但不限于:首先,在生物醫(yī)藥領域,致力于新藥創(chuàng)制、基因研究、生物育種等前沿課題的探索;其次,在新材料領域,開展量子材料、超導材料、熱電材料、軟材料等創(chuàng)新材料的開發(fā)、性能預測以及合成路徑的設計研究。
在AI4S項目指南方面,增加AI相關基礎建設項目。在科研基金項目的支持范圍中,建議增加專門針對AI4S基礎建設的研究項目。一是將科學數(shù)據標注和科學模型訓練等關鍵活動納入科研基金項目的資助范圍。二是研究評估科學模型的基準數(shù)據集,以建立評估和比較不同AI4S模型性能的標準化方法。
在AI4S制度建設方面,健全智能科研管理體系。在科研管理規(guī)范方面,需要根據AI4S范式特征進行相應調整。一是在科研項目規(guī)則要求中實施全流程管控,以提升科研工作的效率,并防止人工智能輔助過程中可能出現(xiàn)的錯誤。二是應確保AI4S科研實踐符合倫理標準與安全要求,以促進科研的可持續(xù)發(fā)展。
在AI4S資源共享方面,增加科研設施共享項目。建議參考NAIRR機制,在重點學科與研究方向設立AI4S科研設施共享項目。推動國家學科數(shù)據庫之間以及與其他數(shù)據庫進行科研數(shù)據、科研模型等資源共享。推動科研云平臺、算力云服務平臺、數(shù)字孿生軟件平臺等基礎設施加強聯(lián)合,以打破AI4S科研資源壁壘,保證AI4S科研數(shù)據成果安全集中,提升AI4S研究生態(tài)縱深。
————————
本文作者吳琪為上海市科學學研究所科技與社會研究室博士后、助理研究員;李輝為上海市科學學研究所科技與社會研究室副主任、研究員。