張梓堃
(北京師范大學(xué)第二附屬中學(xué),北京 100088)
人工智能是計算機科學(xué)與應(yīng)用的重要研究領(lǐng)域,它集合了信息學(xué)、邏輯學(xué)、生物學(xué)等眾多學(xué)科,以算法、算力與數(shù)據(jù)為基礎(chǔ),于機器學(xué)習(xí)、圖像處理、自然語言處理、智能機器人等領(lǐng)域取得了大量成果[1]。自誕生以來至今的數(shù)十年間,人工智能在理論與應(yīng)用上取得了重大成就。作為“人工智能戰(zhàn)勝人類”的標(biāo)志性事件,2016年的AlphaGo對戰(zhàn)李世石一役使得人工智能進入了大眾的視野,而近幾年人工智能的大量成果也逐步進入人們?nèi)粘I睿喝绺鞔笫謾C廠商相繼推出的智能語音助手,輸入法中的語音輸入功能,廣泛應(yīng)用于公安追逃、交通驗票、酒店入住等場景的人臉識別技術(shù),以及2018年6月在谷歌I/O大會上亮相的能夠“以假亂真”的智能助理Google Duplex等。人工智能的這些應(yīng)用成果令人矚目,為加深對人工智能的理解,探析人工智能在人類社會中的重要意義,本文回顧了人工智能的發(fā)展歷史,并就其發(fā)展現(xiàn)狀與未來的發(fā)展前景進行了探討,希望使讀者對這一領(lǐng)域有更深入的了解。
1955年,在美國西部計算機聯(lián)合大會中的在一場名為“學(xué)習(xí)機器討論會”的討論會上,著名的科學(xué)家奧利弗·塞弗里奇和艾倫·紐厄爾分別提出了對于計算機模式識別與下棋的研究,人工智能的雛形得以出現(xiàn)。但“人工智能”一詞的首次使用,則是在次年的達特茅斯會議上。在這次會議上,除前文提到的兩位科學(xué)家外,約翰·麥卡錫、克勞德·仙農(nóng)、馬文·明斯基、赫伯特·西蒙等當(dāng)時頂尖的科學(xué)家也參與其中,確定了人工智能發(fā)展的大方向,也確定了人工智能最初的發(fā)展路線與發(fā)展目標(biāo)[2]。此外,這場會議也標(biāo)志著以符號主義學(xué)派為主導(dǎo)的第一次人工智能浪潮的開端,隨后符號主義學(xué)派的代表紐厄爾與赫伯特·西蒙等人率先于上世紀(jì)50年代完成了Logic Theorist程序的編寫,用其成功證明了伯特蘭·羅素與阿爾弗雷德·N·懷特黑德的著作《數(shù)學(xué)原理》中的38個定理,并提出將解題的過程分為若干步驟的思想,將之推廣至數(shù)學(xué)以外的更多領(lǐng)域,成功編寫出了GPS(General Problem Solving)通用問題求解程序。而在同一時期,IBM公司的阿瑟·塞繆爾提出了機器學(xué)習(xí)理論,并制成了能夠挑戰(zhàn)人類的西洋跳棋程序,開創(chuàng)了計算機模擬人類學(xué)習(xí)過程的先河,于1962年成功擊敗了美國的西洋跳棋大師[3-4]。雖然這些人工智能領(lǐng)域的最初成果離大規(guī)模應(yīng)用仍有不小的距離,但這些發(fā)展成就既體現(xiàn)了人工智能這門新興學(xué)科的旺盛生命力,又為日后人工智能領(lǐng)域的進一步發(fā)展提供了堅實的理論與實踐基礎(chǔ)。
人工智能驚人的發(fā)展成就與發(fā)展速度,使得當(dāng)時人工智能學(xué)界處于過度的樂觀之中,1958 年西蒙和紐厄爾就曾預(yù)測,人工智能在十年內(nèi)將能夠勝任擊敗國際象棋大師、完成數(shù)學(xué)理論的發(fā)現(xiàn)與證明、進行音樂創(chuàng)作、實現(xiàn)大多數(shù)心理學(xué)理論這四項任務(wù),但第一項直至90年代末才得以成真[5],而計算機根據(jù)一定的需求創(chuàng)作音樂,也直至近一兩年來年來才初步有了如DeepMusic等實驗性的成果。此外,在70年代由于人工智能算力上的不足,且符號主義學(xué)派在算法上存在缺陷,再加之計算任務(wù)復(fù)雜而巨量,人工智能的前景并不為人看好,隨之而來的經(jīng)費削減使得人工智能陷入了第一次低谷。
上世紀(jì)70年代中葉隨著符號主義學(xué)派的降溫,以仿生學(xué)為主導(dǎo)的連接主義學(xué)派漸漸興起。BP算法的廣泛應(yīng)用使得神經(jīng)網(wǎng)絡(luò)訓(xùn)練擁有了更為先進的訓(xùn)練技術(shù),在之前第一次人工智能浪潮中發(fā)明的感知器算法也一并得到廣泛的接受,并于80年代大放異彩,推動了神經(jīng)網(wǎng)絡(luò)在這一時期的高速發(fā)展[1]。在此背景下,基于已有知識對實際問題進行解決的專家系統(tǒng)大量投入使用,并成功地幫助工業(yè)界降低了大量成本,創(chuàng)造了大量收益。例如美國的DEC公司在上世紀(jì)80年代通過使用諸如XCON/R1等專家系統(tǒng),每年在電子設(shè)備的生產(chǎn)、組裝等環(huán)節(jié)節(jié)省成本可達千萬美元量級;美國用于地質(zhì)勘探的PROSPECTOR專家系統(tǒng)成功分析出了價值上億美元的礦藏[6]。值得一提的是,此次浪潮得益于飛速增長的算力與軟硬件發(fā)展水平,但這些技術(shù)水平終究沒能達到進一步發(fā)展的要求,因此深度學(xué)習(xí)在當(dāng)時的條件之下仍然無法實現(xiàn)[5]。此外,針對專家系統(tǒng)應(yīng)用領(lǐng)域較為單一的問題,人們所嘗試研制的通用于各領(lǐng)域的人工智能程序也遇到了危機[6],彼時日本的第五代計算機研制終因不能實現(xiàn)人機對話而宣告失敗,對當(dāng)時的學(xué)術(shù)界也是一場打擊,人工智能在上世紀(jì)90年代再一次陷入低谷期。
1997年,“深藍”成功戰(zhàn)勝了國際象棋大師卡斯帕羅夫,驗證了西蒙與紐厄爾40年前的預(yù)言。此后,由于互聯(lián)網(wǎng)及分布式計算的技術(shù)發(fā)展所帶來的算力增加,以及數(shù)據(jù)量的不斷增長,基于大數(shù)據(jù)的深度學(xué)習(xí)與增強學(xué)習(xí)成為了可能[5],基于神經(jīng)網(wǎng)絡(luò)下的深度學(xué)習(xí)算法,為人工智能的這一輪爆發(fā)提供了理論基礎(chǔ)。目前,深度學(xué)習(xí)已經(jīng)廣泛運用于圖像、語音、文字識別以及數(shù)據(jù)挖掘等領(lǐng)域并取得一定成果。例如谷歌、百度等公司的拍照翻譯產(chǎn)品運用深度學(xué)習(xí),可以做到即時識別文字,并立即給出翻譯;曠視公司等基于深度學(xué)習(xí)推出的人臉識別技術(shù),可以實現(xiàn)即時的人臉?biāo)阉?、識別等功能。
GPU的發(fā)展,谷歌TPU、寒武紀(jì)1H8、1H16等定制化處理器的相繼研制成功與使用等科技的進步所帶來的算力提升,則成為了此輪人工智能爆發(fā)的科技基礎(chǔ)。除前述的谷歌、寒武紀(jì)等公司之外,百度、阿里巴巴、IBM等國內(nèi)外科技公司也加入了設(shè)計、研發(fā)人工智能定制化芯片這一行列。一方面,GPU具有高并發(fā)性計算方面的優(yōu)勢,使之更為適合人工智能領(lǐng)域所需的算法,其在全世界個人與商用計算機上的廣泛使用也為人工智能的下一步推廣應(yīng)用提供了兼容性上的可能,而GPU計算若與互聯(lián)網(wǎng)乃至近期火熱的區(qū)塊鏈技術(shù)所結(jié)合,分布式計算可以帶來算力上的進一步提升,在降低成本的同時可以推動人工智能的進一步發(fā)展。另一方面,定制化的芯片使得人工智能得以在更為契合的硬件平臺上運行,相較于傳統(tǒng)的CPU計算,減少了許多計算中因硬件廠商追求商業(yè)化所帶來的性能上的浪費,使得人工智能的研發(fā)與使用更為高效經(jīng)濟,有助于人工智能產(chǎn)業(yè)規(guī)?;l(fā)展。人工智能的發(fā)展基礎(chǔ)需要海量的數(shù)據(jù)支持,而移動互聯(lián)網(wǎng)的發(fā)展方便了大數(shù)據(jù)的收集與預(yù)處理,拓展了人工智能的應(yīng)用場景,使得諸如Siri、Cortana等語音助手以及如科大訊飛等語音輸入服務(wù)得到了廣泛應(yīng)用。在數(shù)據(jù)的收集上,如地圖、網(wǎng)約車等應(yīng)用可以收集如出行、路況等方面的數(shù)據(jù),方便在訓(xùn)練人工智能以及進行進一步的數(shù)據(jù)挖掘等方面進行應(yīng)用。
正如1955年皮茨所說,“(一派人)企圖模擬神經(jīng)系統(tǒng),而紐厄爾則企圖模擬心智(mind)…但殊途同歸”[7],在“用什么方法發(fā)展人工智能”這個問題上,學(xué)術(shù)界長期以來一直有著“結(jié)構(gòu)”與“功能”兩種路線。
由生物學(xué)、醫(yī)學(xué)與神經(jīng)科學(xué)主導(dǎo)的一派試圖去模擬大腦結(jié)構(gòu),從而理清智能產(chǎn)生的過程。眾所周知,人類的智慧來源于大腦。這一派學(xué)者通過模擬大腦皮層中神經(jīng)元的結(jié)構(gòu)與功能來復(fù)刻出與大腦結(jié)構(gòu)相似的機器,從而造出人工智能[3]。然而人腦的神經(jīng)元有數(shù)百萬,模擬這么多神經(jīng)元并使它們協(xié)調(diào)工作具有極大挑戰(zhàn)性,需要人們對大腦及神經(jīng)工作原理的透徹理解,但迄今為止,科學(xué)家仍未真正弄清人腦智能的產(chǎn)生機理[8]。此外,現(xiàn)有的神經(jīng)網(wǎng)絡(luò)只能模擬較為簡單的主干神經(jīng)元及其功能,相較于人類復(fù)雜的神經(jīng)網(wǎng)甚至是人類的末梢神經(jīng)都還有很大差距[9],這些障礙使得這一派的研究工作變得十分困難。而由計算機科學(xué)家主導(dǎo)的一派則更傾向于跳過對神經(jīng)結(jié)構(gòu)的模擬,直接復(fù)制大腦思考的功能,他們通過利用深度學(xué)習(xí)對算法進行改進,以達到具有分析、預(yù)測和識別等能力的效果。相較于結(jié)構(gòu)路線,他們的研究更適合于實際應(yīng)用,且研究難度更低,因此也獲得了更多青睞。但無論如何,兩條路線終究殊途同歸:它們都是為建造更為智能、功能更為強大、應(yīng)用價值更高的人工智能而努力。
今日,人工智能已經(jīng)大量應(yīng)用于各行各業(yè)。例如,在智慧網(wǎng)絡(luò)方面,人工智能進行網(wǎng)絡(luò)維護與需求預(yù)測;在醫(yī)學(xué)方面,人工智能可以進行基于圖片分析的檢驗結(jié)果分析,從而實現(xiàn)輔助診斷,且在部分診斷領(lǐng)域可達到90%以上;在智能金融方面,人工智能可以通過大數(shù)據(jù)分析,定制理財方案[10];在人臉識別方面,人工智能也實現(xiàn)了準(zhǔn)確率超過99%等一系列的研究成果[11]。
雖然人工智能產(chǎn)業(yè)正在蓬勃發(fā)展,但人工智能技術(shù)上的挑戰(zhàn)更值得我們重視。目前基于人工智能的計算機視覺已能夠在一些情況下準(zhǔn)確提取出圖片中的內(nèi)容,分辨其中的物體,然而在面對針對性的攻擊時,人工智能卻十分脆弱。一個典型的例子則是2015年Ian Goodfellow 等研究者對一幅置信度57.7%的熊貓圖片加入針對性的干擾,生成的圖片人類可以無障礙地正確辨別,然而AI則給出了置信度99.3%為長臂猿的識別結(jié)果[12]。人工智能面對針對性的攻擊所體現(xiàn)的脆弱一面,恰恰說明了人工智能在未來還有廣闊的發(fā)展空間,并且其未來發(fā)展方向不僅要著重于任務(wù)的復(fù)雜性,更要著重于完成任務(wù)的可靠性。在自然語言處理方面,現(xiàn)有的人工智能只能夠進行語義分析,卻不能真正理解文本中所傳遞的信息,而這也體現(xiàn)在機器翻譯上。翻譯真正的要旨,是真正理解語言表達的內(nèi)容、情感,并以另一種語言表達。但現(xiàn)有的機器翻譯原理是將原文分塊后逐塊翻譯并重新組合,這不可避免地會帶來譯文表述不自然,以及語法、語義上的錯誤,此外,人工智能在基于常識的邏輯推斷上相較于人類也有著較大的不足,從而導(dǎo)致難以處理語言歧義等問題。因此,建造能夠基于常識進行邏輯推斷的算法也是人工智能未來的發(fā)展方向之一。
人工智能的發(fā)展為社會帶來的新挑戰(zhàn)主要集中在就業(yè)與人工智能技術(shù)的不當(dāng)使用等方面。人工智能的發(fā)展在達到一定程度后,將不可避免地以其低成本、高效率的優(yōu)勢取代該領(lǐng)域中的絕大多數(shù)高重復(fù)性、創(chuàng)新性低的職位,從而造成該行業(yè)內(nèi)大規(guī)模失業(yè)。對于這些問題,政府方面要加強社會保障,實行基本收入制度[13];勞動者也要注意關(guān)注前沿科技變化,終身學(xué)習(xí),以應(yīng)對潛在的失業(yè)風(fēng)險。人工智能由于研發(fā)成本較高,因此相關(guān)前沿研究主要由少數(shù)公司或大學(xué)等科研機構(gòu)進行,而許多大公司在形成技術(shù)壟斷后,由于商業(yè)競爭等原因不將算法進行公開,由此帶來的算法上的不透明將會導(dǎo)致社會力量難以對其監(jiān)督,產(chǎn)生技術(shù)不當(dāng)使用、算法惡意利用或不當(dāng)?shù)美葐栴}。這方面的先例有YouTube智能推薦算法引發(fā)的“艾莎門”事件,滴滴出行等網(wǎng)絡(luò)平臺的“大數(shù)據(jù)殺熟”事件等,這些都體現(xiàn)了算法上的不透明使得消費者乃至公眾利益受到侵犯時人們不能及時有效地作出應(yīng)對。因此,未來的人工智能發(fā)展應(yīng)在技術(shù)的開源與透明化上下功夫。區(qū)塊鏈技術(shù)或許可成為備選方案,其擁有去中心化、開放等優(yōu)點,能夠更好地保障算法的透明度。目前,基于區(qū)塊鏈的人工智能處于探索階段,已有不少專業(yè)人士提出了此類設(shè)想[14]。
作為一門新興學(xué)科,人工智能在發(fā)展歷程中歷經(jīng)坎坷,并在不斷的失敗中找尋未來的發(fā)展方向。人工智能在算法、算力與數(shù)據(jù)的帶動下正在高速發(fā)展并不斷取得新的突破,并在未來會變得更加強大,其影響也將更具革命性。因此,我們應(yīng)在道德與法律的指引下不斷推動人工智能發(fā)展,并使人工智能技術(shù)真正起到助力經(jīng)濟建設(shè)、推動社會發(fā)展的作用,從而使之更好地造福人類社會。