李沫 付強(qiáng) 趙志囡
摘要:日本科學(xué)技術(shù)振興機(jī)構(gòu)下屬的研究開發(fā)戰(zhàn)略中心(CRDS)以科研周期中的“假說(shuō)”為視角,提出三個(gè)研究開發(fā)課題,旨在建立“AI自動(dòng)化科研周期”體系,從而搶占未來(lái)科研競(jìng)爭(zhēng)制高點(diǎn)。我國(guó)有關(guān)人工智能驅(qū)動(dòng)科研周期自動(dòng)化發(fā)展的研究較少,該文具體分析了日本研究開發(fā)戰(zhàn)略中心(CRDS)發(fā)布的戰(zhàn)略提案報(bào)告《人工智能與科學(xué)——以AI·數(shù)據(jù)驅(qū)動(dòng)科學(xué)促進(jìn)發(fā)現(xiàn)和理解》,闡述了日本對(duì)AI自動(dòng)化科研周期體系建立的一些戰(zhàn)略方針,以期對(duì)我國(guó)未來(lái)科研周期的智能化發(fā)展提供參考。
關(guān)鍵詞:人工智能 ?科研周期 ?數(shù)據(jù)密集型科學(xué) ?戰(zhàn)略提案
中圖分類號(hào):TP18 ? 文獻(xiàn)標(biāo)識(shí)碼:A ? 文章編號(hào):1672-3791(2021)09(c)-0000-00
Research on Japanese Strategic Proposal from the Perspective of Artificial Intelligence Driven Scientific Research
LI Mo ?FU Qiang ?ZHAO Zhinan
(Jilin Institute of Science and Technology Information, Changchun,JilinProvince, 130033 China)
Abstract:The research and Development Strategy Center (CRDS) under Japan's science and technology promotion agency puts forward three research and development topics from the perspective of "hypothesis" in the scientific research cycle, in order to establish the "Ai automated scientific research cycle" system, so as to seize the commanding height of scientific research competition in the future. This paper specifically analyzes the strategic proposal report "artificial intelligence and science --Toward discovery and understanding by AI-driven science" issued by the Japanese research and Development Strategy Center (CRDS), This paper expounds some strategic policies for the establishment of AI automatic scientific research cycle system in Japan, in order to provide reference for the intelligent development of scientific research cycle in China in the future.
Key Words:AI; Research cycle data; Intensive science; Strategy proposal
2021年4月,中國(guó)信通院發(fā)布的《人工智能核心技術(shù)產(chǎn)業(yè)白皮書》指出,人工智能與科學(xué)研究的結(jié)合已開始改變基于傳統(tǒng)學(xué)術(shù)經(jīng)驗(yàn)的科學(xué)研究方式[1]。對(duì)此,日本研究開發(fā)戰(zhàn)略中心(CRDS)提出科研周期中“假說(shuō)”階段的智能化驅(qū)動(dòng)方案和具體推進(jìn)方法[2]。科研周期的智能化不僅能夠強(qiáng)化科研能力,擴(kuò)大知識(shí)發(fā)現(xiàn)的范圍,同時(shí)能夠加速新材料、醫(yī)藥化合物的發(fā)現(xiàn),在成本削減和附加價(jià)值方面占據(jù)優(yōu)勢(shì)。因此,研究分析日本在人工智能驅(qū)動(dòng)科學(xué)研究上的戰(zhàn)略提案和推進(jìn)措施,對(duì)我國(guó)未來(lái)科研的智能化發(fā)展能夠提供可行性參考。
1問題提出背景
1.1數(shù)據(jù)密集型科學(xué)范式
隨著數(shù)據(jù)的爆炸性增長(zhǎng),基于大數(shù)據(jù)提出的數(shù)據(jù)密集型科學(xué)(或電子科學(xué))成為科學(xué)第四范式[3]。數(shù)據(jù)密集型科學(xué)采取了基于數(shù)據(jù)導(dǎo)出科學(xué)知識(shí)和社會(huì)有益知識(shí)的方法,數(shù)據(jù)和計(jì)算理論方法的融合能夠提高模擬的高度化和預(yù)測(cè)的高精度化,同時(shí)削減研發(fā)成本,也給科學(xué)知識(shí)發(fā)現(xiàn)模式帶來(lái)新變革。
1.2人類認(rèn)知有限性和偏差
科學(xué)發(fā)現(xiàn)過(guò)程智能化引起重視的另一個(gè)背景是人類認(rèn)知能力的界限。在很多科學(xué)領(lǐng)域,想要閱讀完研究相關(guān)的所有文獻(xiàn)本就不是易事,在新冠疫情反復(fù)襲來(lái)的情況下就愈加困難。有研究者指出只著眼于符合自己假設(shè)的數(shù)據(jù),只對(duì)不符合設(shè)想的情況進(jìn)行嚴(yán)格檢查會(huì)有認(rèn)知偏差存在,科學(xué)發(fā)現(xiàn)的可能性也會(huì)減小。如果利用AI技術(shù),則有望超越這種界限和偏差,帶來(lái)與以往不同的科學(xué)發(fā)現(xiàn)。
1.3機(jī)器學(xué)習(xí)的快速發(fā)展
2012年深度學(xué)習(xí)進(jìn)入爆發(fā)期,隨著第三次AI熱潮的到來(lái),AI不僅應(yīng)用于產(chǎn)業(yè),對(duì)各領(lǐng)域的科學(xué)研究也產(chǎn)生了很大影響。比如:在生命科學(xué)、醫(yī)學(xué)領(lǐng)域,最顯著的是使用卷積神經(jīng)網(wǎng)絡(luò)(CNN:Convolutional Neural Network)的圖像識(shí)別。人工智能領(lǐng)域的機(jī)器學(xué)習(xí)可以幫助完成醫(yī)學(xué)圖像診斷的自動(dòng)識(shí)別,數(shù)字化地輔助醫(yī)學(xué)診斷過(guò)程,同時(shí)降低醫(yī)務(wù)工作者的工作量[4]。
隨著數(shù)據(jù)密集型科學(xué)時(shí)代的到來(lái),科研人員對(duì)知識(shí)的探索也要隨勢(shì)而動(dòng),充分利用人工智能和大數(shù)據(jù)的優(yōu)勢(shì),彌補(bǔ)人類認(rèn)知有限性和認(rèn)知偏差的不足。因此,科研探索的智能化進(jìn)程也顯得尤為重要。
2.研究開發(fā)課題戰(zhàn)略提案
2.1大規(guī)模假說(shuō)的生成與探索
人類在發(fā)現(xiàn)未知知識(shí)的時(shí)候,如果得到了用現(xiàn)有理論無(wú)法說(shuō)明的觀測(cè)事實(shí),大多會(huì)建立補(bǔ)充現(xiàn)有知識(shí)欠缺部分的假說(shuō)。如果新的假說(shuō)具備新穎性,并且實(shí)驗(yàn)驗(yàn)證的結(jié)果十分可靠的話,就被認(rèn)為是新發(fā)現(xiàn)。因此,大規(guī)模假說(shuō)的生成與探索,其目標(biāo)就是合理利用計(jì)算機(jī)來(lái)完成從發(fā)現(xiàn)未知、建立假說(shuō)到實(shí)驗(yàn)驗(yàn)證的過(guò)程。具體而言,基于AI系統(tǒng)從論文或?qū)嶒?yàn)結(jié)果等數(shù)據(jù)中提取的知識(shí),來(lái)生成大規(guī)模的假說(shuō),篩選有研究?jī)r(jià)值的假說(shuō)轉(zhuǎn)到后續(xù)驗(yàn)證過(guò)程中。
2.2假說(shuō)驗(yàn)證的高通量化
龐大的假說(shuō)探索背后,意味著大量的驗(yàn)證假說(shuō)的實(shí)驗(yàn)工作。在材料科學(xué)和藥物研發(fā)領(lǐng)域,多采用“虛擬篩選”的手法,因?yàn)榧幢闶歉呔攘孔踊瘜W(xué)計(jì)算、第一原理計(jì)算或者分子動(dòng)力學(xué)模擬等方法,也會(huì)有無(wú)法計(jì)算體量龐大的化合物的情況。另外,實(shí)驗(yàn)方法和順序所涉及的范圍廣、難度大,為保證高速正確實(shí)施實(shí)驗(yàn),機(jī)器人是必不可少的手段之一。自動(dòng)化機(jī)器人的導(dǎo)入不僅提高了工作的速度,還確保了實(shí)驗(yàn)的可再現(xiàn)性。
2.3以人為核心的架構(gòu)設(shè)計(jì)
科研周期的智能化發(fā)展,需要有軟硬件兼有的綜合性平臺(tái),整合各種技術(shù)要素,為科學(xué)發(fā)現(xiàn)提供自動(dòng)化、連貫性、良性循環(huán)體系。同時(shí),AI系統(tǒng)在未來(lái)應(yīng)用中,也可用于科學(xué)家驗(yàn)證自己提出的假說(shuō)。從這個(gè)意義上來(lái)說(shuō),AI系統(tǒng)是離不開人類本身的,在整體架構(gòu)設(shè)計(jì)上應(yīng)向人類協(xié)調(diào)型方向發(fā)展,形成人機(jī)協(xié)同兼具科學(xué)研究的智能化系統(tǒng)。
3研究開發(fā)課題推進(jìn)措施
3.1強(qiáng)化設(shè)備共享
自動(dòng)化科學(xué)研究過(guò)程的AI系統(tǒng)是計(jì)算機(jī)、數(shù)據(jù)庫(kù)、實(shí)驗(yàn)機(jī)器人、測(cè)量機(jī)器等通過(guò)網(wǎng)絡(luò)連接起來(lái)的網(wǎng)絡(luò)物理系統(tǒng)。實(shí)驗(yàn)機(jī)器人的價(jià)格昂貴,集中于一個(gè)研究室運(yùn)維整個(gè)系統(tǒng)十分困難。因此,強(qiáng)化大型設(shè)備共享是十分必要的。日本提出建立一個(gè)全新的外部化法人的民營(yíng)性運(yùn)營(yíng)機(jī)構(gòu)。例如:可以考慮由內(nèi)閣府主導(dǎo)外部化法人制度,整合并靈活運(yùn)用現(xiàn)有大學(xué)和民間團(tuán)體力量來(lái)促進(jìn)開放創(chuàng)新。在實(shí)際運(yùn)行中,提出可從生命科學(xué)和材料科學(xué)領(lǐng)域入手,有了成功案例之后,再試點(diǎn)其他領(lǐng)域。
3.2任務(wù)導(dǎo)向項(xiàng)目和登月研發(fā)制度
如何實(shí)現(xiàn)AI自動(dòng)化科研周期體系,日本提出任務(wù)導(dǎo)向創(chuàng)新項(xiàng)目作為國(guó)家的戰(zhàn)略目標(biāo),項(xiàng)目針對(duì)某個(gè)課題,不指定具體的方法,而是廣泛收集方案,根據(jù)課題達(dá)成度給予獎(jiǎng)金。此外,日本內(nèi)閣府提出登月(Moonshot)型研究開發(fā)制度,共設(shè)置了7個(gè)“登月目標(biāo)”。日本科學(xué)技術(shù)振興機(jī)構(gòu)(JST)負(fù)責(zé)登月目標(biāo)3是“2050年前,通過(guò)AI和機(jī)器人的共進(jìn)化,實(shí)現(xiàn)能夠自主學(xué)習(xí)、行動(dòng)、與人共生的機(jī)器人”[5]。未來(lái),在自然科學(xué)、人文社會(huì)科學(xué)的廣泛領(lǐng)域中,實(shí)現(xiàn)AI機(jī)器人能夠有計(jì)劃(Planning)實(shí)驗(yàn),自主地進(jìn)行少數(shù)的試行(Trial)和實(shí)驗(yàn),到2030年為止實(shí)現(xiàn)AI機(jī)器人能夠?qū)θ祟愔噶畹奶囟▎栴}(新藥開發(fā)、材料開發(fā)等),獲得科學(xué)原理和解法。
3.3跨領(lǐng)域教育普及
探索建立AI自動(dòng)化科研周期體系需要各種技術(shù)領(lǐng)域和行業(yè)的儲(chǔ)備知識(shí),需要培育具備多領(lǐng)域知識(shí)和技術(shù)并且能夠熟練掌握AI和大數(shù)據(jù)技術(shù)的綜合性人才??茖W(xué)相關(guān)領(lǐng)域里,對(duì)科學(xué)的方法論進(jìn)行廣泛的普及化教育是十分必要的。隨著科研方式方法的變化,數(shù)學(xué)、倫理學(xué)、統(tǒng)計(jì)等推論工具,論文、國(guó)際會(huì)議等合作方式,都需要打牢基礎(chǔ)教育底子。
4對(duì)我國(guó)科研發(fā)展的啟示
2020年我國(guó)人工智能產(chǎn)業(yè)保持平穩(wěn)增長(zhǎng),產(chǎn)業(yè)規(guī)模不斷擴(kuò)大。未來(lái)我國(guó)需要進(jìn)一步構(gòu)建人工智能基礎(chǔ)理論與應(yīng)用技術(shù)相結(jié)合的學(xué)科體系,布局一批企業(yè)級(jí)人工智能研究院來(lái)引領(lǐng)技術(shù)落地,打造區(qū)域人工智能技術(shù)融合創(chuàng)新生態(tài)體系,連通企業(yè)、高校、研究院所和政府等創(chuàng)新主體形成共同體生態(tài)[6]。
結(jié)合日本對(duì)人工智能驅(qū)動(dòng)科學(xué)發(fā)展的戰(zhàn)略方案,一是要明確我國(guó)人工智能驅(qū)動(dòng)科學(xué)發(fā)展的技術(shù)路線,制定重點(diǎn)行業(yè)領(lǐng)域的目標(biāo),構(gòu)建具有中國(guó)特色的人工智能科學(xué)體系;二是要集中關(guān)鍵要素,建立以政府為主導(dǎo),產(chǎn)學(xué)研協(xié)同的人工智能創(chuàng)新系統(tǒng),保障系統(tǒng)間關(guān)鍵要素的流通;三是要加強(qiáng)人才培養(yǎng),夯實(shí)人工智能相關(guān)學(xué)科基礎(chǔ)教育,高校和企業(yè)共同賦能基礎(chǔ)型人才。
參考文獻(xiàn)
[1] 中國(guó)信通院.人工智能核心技術(shù)產(chǎn)業(yè)白皮書[R/OL].(2021-04-19).
http://www.caict.ac.cn/kxyj/qwfb/bps/202104/P020210420614092578238.pdf.
[2] 日本科學(xué)技術(shù)振興機(jī)構(gòu)研究開発戦略センター. 人工知能と科學(xué)、AI·データ駆動(dòng)科學(xué)による発見と理解[EB/OL].[2021-09-18].https://www.jst.go.jp/crds/report/CRDS-FY2021-SP-03.html.
[3] 金莎.數(shù)據(jù)密集型科學(xué)的運(yùn)行機(jī)制研究[D].天津:天津大學(xué),2018.
[4] 圣文順,孫艷文.卷積神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別中的應(yīng)用[J].軟件工程,2019,22(2):13-16.
[5] 日本內(nèi)閣府.ムーンショット型研究開発制度が目指すべき「ムーンショット目標(biāo)」について[EB/OL].(2020-01-23).https://www8.cao.go.jp/cstp/moonshot/mokuhyou.pdf.
[6] 中國(guó)信通院,京東探索研究院.可信人工智能白皮書[R/OL].(2021-07-08).
http://www.caict.ac.cn/kxyj/qwfb/bps/202107/P020210709319866413974.pdf.