什么是AI
AI是研究、開(kāi)發(fā)能夠模擬、延伸和擴(kuò)展人類智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門(mén)新技術(shù)科學(xué),研究目的是令智能機(jī)器能聽(tīng)(語(yǔ)音識(shí)別、機(jī)器翻譯等)、能看(圖像識(shí)別、文字識(shí)別等)、能說(shuō)(語(yǔ)音合成、人機(jī)對(duì)話等)、能思考(人機(jī)對(duì)弈、定理證明等)、能學(xué)習(xí)(機(jī)器學(xué)習(xí)、知識(shí)表示等)、能行動(dòng)(機(jī)器人、自動(dòng)駕駛汽車(chē)等)。
AI的起源與發(fā)展
AI起源于1956年的達(dá)特茅斯會(huì)議,并在此后逐漸發(fā)展為一門(mén)學(xué)科。1956年夏,麥卡錫、明斯基等科學(xué)家在美國(guó)達(dá)特茅斯學(xué)院開(kāi)會(huì)研究“如何用機(jī)器模擬人的智能”,首次提出了“人工智能(Artificial Intelligence,簡(jiǎn)稱AI)”這一概念,AI自此誕生。
與大多數(shù)新興事物一樣,AI誕生后,其發(fā)展并非一帆風(fēng)順,因?yàn)樘剿魑粗牡缆房偸乔鄣?。關(guān)于AI自1956年以來(lái)的發(fā)展歷程,科學(xué)界可謂仁者見(jiàn)仁、智者見(jiàn)智,主流觀點(diǎn)一般將其劃分為以下6個(gè)階段。
起步發(fā)展期:1956年—20世紀(jì)60年代初期。
AI概念被提出后,科學(xué)界相繼取得了一批令人矚目的研究成果,如機(jī)器定理證明、跳棋程序等,掀起了AI發(fā)展的第一個(gè)高潮。
反思發(fā)展期:20世紀(jì)60年代初期—20世紀(jì)70年代初期。
初期的突破性進(jìn)展大幅提升了人們對(duì)AI的期望值,科學(xué)家開(kāi)始嘗試完成更具挑戰(zhàn)性的任務(wù),并提出了一些不切實(shí)際的研發(fā)目標(biāo)。當(dāng)喧囂歸于平靜之后,接二連三的失敗,如無(wú)法用機(jī)器證明兩個(gè)連續(xù)函數(shù)之和還是連續(xù)函數(shù)、機(jī)器翻譯驢唇不對(duì)馬嘴等,使AI的發(fā)展進(jìn)入了低谷。
應(yīng)用發(fā)展期:20世紀(jì)70年代初期—20世紀(jì)80年代中期。
20世紀(jì)70年代出現(xiàn)的專家系統(tǒng)可以模擬人類的知識(shí)和經(jīng)驗(yàn)解決特定領(lǐng)域的問(wèn)題,實(shí)現(xiàn)了AI從理論研究走向?qū)嶋H應(yīng)用、從一般推理策略探討轉(zhuǎn)向運(yùn)用專業(yè)知識(shí)的重大突破。該系統(tǒng)在醫(yī)療、化學(xué)、地質(zhì)等領(lǐng)域取得了成功,推動(dòng)AI走入應(yīng)用發(fā)展的新高潮。
低迷發(fā)展期:20世紀(jì)80年代中期—20世紀(jì)90年代中期。
隨著AI的應(yīng)用規(guī)模不斷擴(kuò)大,專家系統(tǒng)存在的應(yīng)用領(lǐng)域狹窄、缺乏常識(shí)性知識(shí)、知識(shí)獲取困難、推理方法單一、難以與現(xiàn)有數(shù)據(jù)庫(kù)兼容等問(wèn)題逐漸暴露出來(lái),AI的發(fā)展再次進(jìn)入低谷。
穩(wěn)步發(fā)展期:20世紀(jì)90年代中期—2010年。
網(wǎng)絡(luò)技術(shù)特別是互聯(lián)網(wǎng)技術(shù)的發(fā)展,加速了AI的創(chuàng)新研究,促使AI技術(shù)走向深度應(yīng)用。1997年,國(guó)際商業(yè)機(jī)器公司(以下簡(jiǎn)稱IBM)的深藍(lán)超級(jí)計(jì)算機(jī)戰(zhàn)勝了國(guó)際象棋世界冠軍卡斯帕羅夫。2008年,IBM又提出了“智慧地球”這一概念。
蓬勃發(fā)展期:2011年至今。
隨著大數(shù)據(jù)、云計(jì)算、互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等信息技術(shù)不斷發(fā)展,泛在感知數(shù)據(jù)和圖形處理器等計(jì)算平臺(tái)推動(dòng)了以深度神經(jīng)網(wǎng)絡(luò)為代表的AI技術(shù)飛速發(fā)展,大幅跨越了科學(xué)與應(yīng)用之間的技術(shù)鴻溝,諸如圖像分類、語(yǔ)音識(shí)別、知識(shí)問(wèn)答、人機(jī)對(duì)弈、無(wú)人駕駛等AI技術(shù)實(shí)現(xiàn)了從“不能用、不好用”到“可以用、很實(shí)用”的技術(shù)突破,AI迎來(lái)了爆發(fā)式發(fā)展的新高潮。
AI的分類
近幾年,隨著ChatGPT、文心一言等AI產(chǎn)品相繼涌現(xiàn),生成式AI成為大家茶余飯后熱議的話題。那么,為什么要在AI前面加上“生成式”這三個(gè)字?難道還有其他形式的AI?生成式AI究竟是什么?我們接著往下看。
如果按照用途簡(jiǎn)單分類,AI可被劃分為決策式AI和生成式AI。其中,決策式AI專注于分析情況并作出決策,它能通過(guò)評(píng)估多種選項(xiàng)和可能出現(xiàn)的結(jié)果,幫助用戶或系統(tǒng)選擇最佳行動(dòng)方案。例如,自動(dòng)駕駛汽車(chē)就是由決策式AI系統(tǒng)決定何時(shí)加速、減速及變換車(chē)道的。生成式AI專注于整合知識(shí),創(chuàng)造全新內(nèi)容。它可以根據(jù)學(xué)習(xí)到的數(shù)據(jù)自動(dòng)生成文本、圖像、音樂(lè)等內(nèi)容。例如,你可以將一篇文章發(fā)給生成式AI,它可以很快提煉出其中的關(guān)鍵思想、重要結(jié)論。
此外,如果按照應(yīng)用范圍分類,AI大體可分為專用AI和通用AI。面向特定任務(wù)(如下圍棋、寫(xiě)詩(shī)、繪畫(huà))的專用AI由于任務(wù)單一、需求明確、應(yīng)用邊界清晰、領(lǐng)域知識(shí)豐富、建模相對(duì)簡(jiǎn)單,形成了人工智能領(lǐng)域的單點(diǎn)突破,在局部智能水平的單項(xiàng)測(cè)試中甚至可以超越人類智能。近幾年,AI的進(jìn)展主要集中在專用AI領(lǐng)域。例如,Al? phaGo在圍棋比賽中戰(zhàn)勝人類冠軍,AI程序在大規(guī)模圖像識(shí)別和人臉識(shí)別中超越了人類水平,AI系統(tǒng)診斷皮膚癌達(dá)到專業(yè)醫(yī)生水平等。
通用AI尚處于起步階段,它的目標(biāo)是模擬甚至超越人腦的功能。人的大腦是一個(gè)通用的智能系統(tǒng),能舉一反三、融會(huì)貫通,可處理判斷、推理、學(xué)習(xí)、思考、規(guī)劃、設(shè)計(jì)等各類問(wèn)題,可謂“一腦萬(wàn)用”。真正意義上完備的AI系統(tǒng)應(yīng)該是一個(gè)通用的智能系統(tǒng)。目前,雖然專用AI已取得突破性進(jìn)展,但是通用AI的研究與應(yīng)用仍然任重道遠(yuǎn),AI總體發(fā)展水平仍處于起步階段。當(dāng)前,AI系統(tǒng)在信息感知、機(jī)器學(xué)習(xí)等“淺層智能”方面進(jìn)步顯著,但是在概念抽象和推理決策等“深層智能”方面的能力還很弱。總體上看,目前的AI系統(tǒng)可謂有智能沒(méi)智慧、有智商沒(méi)情商、有專才而無(wú)通才。因此,AI依舊存在明顯的局限性,與人類智慧還相差甚遠(yuǎn)。
當(dāng)然,我們也可以預(yù)見(jiàn),一旦通用AI得以實(shí)現(xiàn),對(duì)于人類而言將是前所未有的大變革。完善的通用AI具有極其強(qiáng)大的功能,可被用于解決各種問(wèn)題,如目前科學(xué)界的難題:尋找外星人與地外宜居星系、人工核聚變控制、納米或超導(dǎo)材料篩選、抗癌藥研發(fā)等。這些問(wèn)題通常需要花費(fèi)人類研究員數(shù)十年的時(shí)間來(lái)解決,部分前沿領(lǐng)域的研究量已超出人力極限。通用AI在自己的虛擬世界中擁有近乎無(wú)限的時(shí)間和精力,這使得其在部分容易虛擬化的任務(wù)中,有可能成為人類研究員的替代。但到了那個(gè)時(shí)候,人類如何監(jiān)督這些在智能水平上超過(guò)自己的AI,確保其不會(huì)危害人類,又將是一個(gè)值得思考的問(wèn)題。
知識(shí)鏈接:圖靈測(cè)試
“機(jī)器能思考嗎?”1950年,圖靈在他的論文《計(jì)算機(jī)器與智能》中提出了這一問(wèn)題。為了求證這個(gè)問(wèn)題,圖靈設(shè)想了一個(gè)模仿游戲。在這個(gè)游戲中,一位人類評(píng)判員分別與一臺(tái)計(jì)算機(jī)和一名人類(陪襯者)對(duì)話,計(jì)算機(jī)和陪襯者要想方設(shè)法讓評(píng)判員相信自己才是人類。重要的是,計(jì)算機(jī)、陪襯者和評(píng)判員之間無(wú)法對(duì)視,他們只能通過(guò)文本交流。在與計(jì)算機(jī)和陪襯者對(duì)話后,評(píng)判員要判斷哪個(gè)才是真正的人類。
這個(gè)由圖靈提出的游戲,現(xiàn)在被廣泛稱為圖靈測(cè)試。它在當(dāng)時(shí)用以反駁人們的直覺(jué)性認(rèn)知:計(jì)算機(jī)的機(jī)械性質(zhì)決定了其不能思考。圖靈的觀點(diǎn)是,如果一臺(tái)計(jì)算機(jī)在表現(xiàn)上與人類無(wú)法區(qū)分(除了外貌和其他物理特征),那么為什么不能將其視為一個(gè)有思維的實(shí)體呢?
因此,嚴(yán)格來(lái)說(shuō)圖靈測(cè)試是一種理念而不是方法,圖靈將他的測(cè)試作為一個(gè)哲學(xué)思想實(shí)驗(yàn),而不是一種衡量機(jī)器智能的方法。然而,在公眾的認(rèn)知中,圖靈測(cè)試已經(jīng)成為AI的終極里程碑——評(píng)判通用AI是否實(shí)現(xiàn)的主要標(biāo)準(zhǔn)。
AI領(lǐng)域的“新秀”
生成式AI ChatGPT
與人類連續(xù)對(duì)話,能在短時(shí)間內(nèi)完成郵件、文案、代碼、詩(shī)歌等的創(chuàng)作,輕松通過(guò)工程師、醫(yī)師資格等難度較高的專業(yè)測(cè)試……推出2個(gè)月即擁有1億月活用戶,ChatGPT已成為AI發(fā)展史上一座新的里程碑。那么,它究竟有何神奇之處呢?
身份檔案
ChatGPT是OpenAI公司研發(fā)的一款聊天機(jī)器人程序,于2022年11月30日發(fā)布。ChatGPT是AI技術(shù)驅(qū)動(dòng)的自然語(yǔ)言處理工具,它能夠基于在預(yù)訓(xùn)練階段所見(jiàn)的模式和統(tǒng)計(jì)規(guī)律來(lái)生成回答,還能根據(jù)聊天的上下文進(jìn)行互動(dòng),做到真正像人類一樣交流。
功能強(qiáng)大
ChatGPT最直接的應(yīng)用場(chǎng)景就是搜索、問(wèn)答、咨詢等交互領(lǐng)域。目前,不少機(jī)器電話客服飽受詬病,服務(wù)質(zhì)量一言難盡;一些搜索引擎給出的信息也往往不準(zhǔn)確、片面。ChatGPT可以通過(guò)海量數(shù)據(jù)和機(jī)器學(xué)習(xí),更好地滿足人們對(duì)信息和知識(shí)的需求。
ChatGPT在科學(xué)研究、文學(xué)創(chuàng)作、藝術(shù)創(chuàng)作、設(shè)計(jì)等領(lǐng)域也有巨大的應(yīng)用潛力。你可以嘗試?yán)肅hatGPT來(lái)寫(xiě)小說(shuō)、寫(xiě)詩(shī)歌,在此過(guò)程中,你甚至可以要求它模仿某個(gè)作家或以某種風(fēng)格進(jìn)行創(chuàng)作。
更重要的是,隨著科技不斷發(fā)展及自身不斷完善,ChatGPT正以驚人的速度更新迭代,這意味著它的功能在不斷升級(jí)。未來(lái),ChatG? PT定能讓大家切實(shí)感受到科技的偉大力量。
技術(shù)支撐
在ChatGPT跨越式提升的背后,是科技界一場(chǎng)“大力出奇跡”的好戲。ChatGPT之所以這么強(qiáng)大,一方面在于它選擇了合適可行的技術(shù)路徑。ChatGPT在技術(shù)路徑上采用的是“大數(shù)據(jù)+大算力+強(qiáng)算法=大模型”的路線,又在“基礎(chǔ)大模型+指令微調(diào)”領(lǐng)域探索出了新范式,其中基礎(chǔ)大模型類似大腦,指令微調(diào)是交互訓(xùn)練,二者結(jié)合便實(shí)現(xiàn)了接近人類的語(yǔ)言智能。另一方面在于它在數(shù)據(jù)和人力資源方面的巨大投入。OpenAI公司為了讓ChatGPT的語(yǔ)言合成結(jié)果更自然流暢,用了45TB的數(shù)據(jù)、近1萬(wàn)億個(gè)單詞來(lái)訓(xùn)練大模型,這個(gè)詞匯量大概相當(dāng)于1351萬(wàn)本牛津詞典的詞匯量總和。在人力資源方面,OpenAI公司構(gòu)建了一個(gè)算力規(guī)模位居全球前列的超算平臺(tái),以支持ChatGPT的研發(fā),它還在全球范圍雇用了近千名專員處理數(shù)據(jù)。據(jù)專家估算,此類大模型一次訓(xùn)練的成本接近千萬(wàn)美元,運(yùn)營(yíng)成本一個(gè)月要數(shù)百萬(wàn)美元。
總而言之,ChatGPT是AI技術(shù)量變引發(fā)質(zhì)變的代表,它代表了目前機(jī)器學(xué)習(xí)大模型、大訓(xùn)練數(shù)據(jù)和大算力能夠達(dá)到的新高度。ChatGPT在GPT模型基礎(chǔ)上,采用人類反饋強(qiáng)化學(xué)習(xí)的訓(xùn)練機(jī)制和提示導(dǎo)引模式,促使模型越來(lái)越符合人類的思考邏輯、認(rèn)知習(xí)慣,這是一個(gè)重要?jiǎng)?chuàng)新,也是一個(gè)重大趨勢(shì)。
技術(shù)缺陷
就像硬幣擁有正面和反面一樣,ChatGPT在帶給我們驚艷體驗(yàn)的同時(shí),也有明顯缺陷。比如,它有知識(shí)盲區(qū),它給出的答案常出現(xiàn)事實(shí)性錯(cuò)誤;它在使用中常面臨隱私泄露、技術(shù)濫用、造假、社會(huì)公平等問(wèn)題。鑒于其模型能力出眾、用戶眾多,這些風(fēng)險(xiǎn)隱患還會(huì)被放大。
知識(shí)鏈接:生成式AI發(fā)展簡(jiǎn)史
生成式AI并不是近幾年才誕生的,它經(jīng)歷了漫長(zhǎng)的發(fā)展過(guò)程。
1950年,圖靈提出了著名的圖靈測(cè)試,這是生成式AI領(lǐng)域的一個(gè)里程碑,揭示了AI生成內(nèi)容的可能性。
1957年,歷史上第一首完全由計(jì)算機(jī)作曲的音樂(lè)作品《Illiac Suite》誕生。
20世紀(jì)60年代中期,世界上第一款可人機(jī)對(duì)話的機(jī)器人“Eliza”面世,它通過(guò)關(guān)鍵字掃描和重組與人類交互。
20世紀(jì)80年代,IBM公司基于隱形馬爾可夫鏈模型,開(kāi)發(fā)了語(yǔ)音控制打字機(jī)“Tangora”。
2007年,紐約大學(xué)的人工智能系統(tǒng)撰寫(xiě)了小說(shuō)《1 The Road》。這是世界第一部完全由人工智能創(chuàng)作的小說(shuō)。
2012年,微軟公司發(fā)布了一個(gè)全自動(dòng)同聲傳譯系統(tǒng),可以利用英文語(yǔ)音生成中文語(yǔ)音。
2017年,微軟人工智能“小冰”推出了世界首部由人工智能創(chuàng)作的詩(shī)集《陽(yáng)光失了玻璃窗》。
2019年,谷歌發(fā)布了DVDGAN架構(gòu)用以生成連續(xù)視頻。
2020年,OpenAI公司發(fā)布了ChatGPT3。這是自然語(yǔ)言處理和生成式AI領(lǐng)域一個(gè)重要的里程碑。
2022年至今,OpenAI公司發(fā)布多個(gè)ChatGPT新型號(hào),掀起了生成式AI的發(fā)展高潮。
文生視頻模型Sora
2024年2月16日,OpenAI公司發(fā)布了大模型Sora及它生成的48個(gè)視頻,引發(fā)了全球關(guān)注。一些業(yè)內(nèi)人士甚至將Sora的問(wèn)世稱為視頻生成領(lǐng)域的“ChatGPT時(shí)刻”。
身份檔案
Sora是OpenAI公司發(fā)布的文生視頻大模型,但OpenAI公司并未單純將其視為視頻大模型,而是將其作為“世界模擬器”。Sora在日語(yǔ)中是“天空”的意思,引申含義還有“自由”,這個(gè)名字象征著其擁有無(wú)限的創(chuàng)造潛力。
強(qiáng)大功能
Sora能夠根據(jù)用戶輸入的提示詞、文本指令或靜態(tài)圖像,生成長(zhǎng)達(dá)1分鐘的視頻。它擁有三大突出亮點(diǎn):一是在1分鐘的視頻里可以保持視頻主體與背景的高度流暢性與穩(wěn)定性;二是在一個(gè)視頻內(nèi)出現(xiàn)多角度鏡頭,分鏡切換符合邏輯且十分流暢;三是具有理解真實(shí)世界的能力,對(duì)于光影反射、運(yùn)動(dòng)方式、鏡頭移動(dòng)等細(xì)節(jié)處理得十分到位,極大地提升了真實(shí)感。
AI視頻生成的難點(diǎn)有兩個(gè):一是視頻是連續(xù)的多幀圖像,并且要有邏輯性,并非簡(jiǎn)單的圖片組合;二是相比于生成文字,生成視頻大幅提升了模型復(fù)雜度、計(jì)算難度和成本。此外,文生視頻需要大量的“文本-視頻”配對(duì)數(shù)據(jù),而目前業(yè)內(nèi)缺乏多樣化的數(shù)據(jù)集,且數(shù)據(jù)標(biāo)注的工作量較大。因而,在Sora出現(xiàn)之前,AI生成的視頻長(zhǎng)度大多為5~15秒,而Sora將視頻時(shí)長(zhǎng)提升到了1分鐘,還支持生成多個(gè)鏡頭,同時(shí)基本維持了角色和視覺(jué)風(fēng)格的一致性,并能在一定程度上“理解”現(xiàn)實(shí)世界。
引發(fā)的擔(dān)憂
Sora一經(jīng)推出就引發(fā)了巨大爭(zhēng)議,一部分人拍手叫好,也有一部分人憂心忡忡。人們恐慌的核心在于,以前大家認(rèn)為視頻的可信度是較高的,要虛構(gòu)、篡改比較困難,而Sora的出現(xiàn)打破了這一局面。Sora可以用模擬真實(shí)世界的方式生成視頻,這就像電影《盜夢(mèng)空間》里面的筑夢(mèng)師,可以根據(jù)自己的想法,快速生成一個(gè)世界。雖然OpenAI公司也承認(rèn)現(xiàn)階段的Sora在視頻中對(duì)部分細(xì)節(jié)的處理與真實(shí)世界不一致,如生成的椅子會(huì)變形,但對(duì)于大多數(shù)人而言,Sora對(duì)世界模型的掌握程度與真實(shí)世界過(guò)于接近,生成的視頻真假難辨,這很可能會(huì)給我們的生活帶來(lái)不利影響。
AI時(shí)代,做有“智”少年
從當(dāng)前形勢(shì)來(lái)看,AI的商業(yè)價(jià)值和社會(huì)價(jià)值是毋庸置疑的,它的崛起趨勢(shì)也是不可阻擋的。從個(gè)人角度來(lái)說(shuō),AI可以幫助我們完成一些事務(wù),也可以提升我們的生活品質(zhì)。從國(guó)家角度來(lái)說(shuō),AI未來(lái)將成為國(guó)家實(shí)力的一部分,在科技博弈和國(guó)防事業(yè)方面發(fā)揮重大作用。從整個(gè)人類的角度來(lái)說(shuō),AI在疾病治療、災(zāi)害預(yù)測(cè)、氣候預(yù)測(cè)方面,也可以做出重要貢獻(xiàn)。
盡管AI有種種弊端,但我們目前并沒(méi)有合適的方法解決,只能在發(fā)展AI的過(guò)程中,一點(diǎn)點(diǎn)探索、思考和解決。
作為普通人,與其焦慮,不如勇敢面對(duì)、積極擁抱,我們目前最現(xiàn)實(shí)的做法是先了解它、學(xué)習(xí)它,借助它的能力提升自我,改善生活品質(zhì)。因?yàn)槲磥?lái)與你競(jìng)爭(zhēng)的很可能不是AI,而是掌握了AI的人,只有將主動(dòng)權(quán)掌握在自己手中才有可能贏得未來(lái)。