朱秋雨
“AI的盡頭是光伏和儲(chǔ)能!我們不能只想著算力,如果考慮計(jì)算機(jī),我們需要燒掉14個(gè)地球的能源?!苯?,網(wǎng)傳英偉達(dá)創(chuàng)始人黃仁勛在公開場(chǎng)合發(fā)表了此番言論。
芯片大佬“能源危機(jī)”宣言一出,多個(gè)國(guó)內(nèi)清潔能源股飄紅,同時(shí)揭開了生成式AI蓬勃發(fā)展被遮蔽的一面。據(jù)荷蘭數(shù)據(jù)科學(xué)家亞歷克斯·德弗里斯估算,到2027年,全球AI領(lǐng)域一年將消耗85—134太瓦時(shí)電量。這與荷蘭的年能源需求大致相同。
多個(gè)研究也指向了ChatGPT等生成式AI值得擔(dān)憂的一面。
牛津大學(xué)教授沃切特發(fā)現(xiàn),每訓(xùn)練一次ChatGPT,相當(dāng)于約126個(gè)丹麥家庭1年的用電量。這僅僅是訓(xùn)練AI大模型的前期電力,未包含模型實(shí)際使用推理時(shí)所消耗的電力。
國(guó)際能源署2024年的一份報(bào)告也預(yù)測(cè),由于人工智能和加密貨幣的發(fā)展,全球數(shù)據(jù)中心的用電量不久后將大幅增加兩倍。該機(jī)構(gòu)表示,2022年,全球數(shù)據(jù)中心的用電量約為460太瓦時(shí),到2026年可能增至620太瓦時(shí)至1050太瓦時(shí),分別相當(dāng)于瑞典、德國(guó)的年用電量。
ChatGPT等生成式AI導(dǎo)致能源危機(jī)的消息甚囂塵上。但幾天后,黃仁勛的“信徒”們發(fā)現(xiàn),這位科技圈大鱷從未說過“AI的盡頭是光伏和儲(chǔ)能”或類似的話。這位當(dāng)紅科技人物表達(dá)了完全相反的意思。
更完整的版本是,黃仁勛說:“如果你假設(shè)計(jì)算機(jī)的速度永遠(yuǎn)不會(huì)變快,你可能得出結(jié)論—我們需要14個(gè)不同的行星、3個(gè)不同星系、4個(gè)太陽為它們提供燃料?!?/p>
“但很明顯,計(jì)算機(jī)的架構(gòu)正不斷進(jìn)步。在過去十年,人類一大貢獻(xiàn)是將計(jì)算和人工智能的性能提高了100萬倍,但它所消耗的能源沒有隨之提高?!?/p>
被誤解的“名言”,將一個(gè)此前并不清晰的問題擺在人們面前:究竟,生成式AI消耗了多少電力和能源?這會(huì)威脅我們的未來嗎?
黃仁勛的話雖然屬于謠傳,但此番論調(diào)已經(jīng)在美國(guó)硅谷科技圈流行多時(shí)。
剛讓星艦進(jìn)行第三次升空試飛的埃隆·馬斯克便是其中之一。不久前,他在博世互聯(lián)世界2024大會(huì)上說:“接下來,陷入短缺的將是電力。等到明年,我們將沒有足夠的電力來運(yùn)行所有的芯片了?!?/p>
1月16日,OpenAI CEO山姆·奧特曼也在訪談中說道:在人工智能時(shí)代,世界未來將有兩種重要“貨幣”—算力和能源。“AI技術(shù)的發(fā)展將取決于能源突破?!?/p>
在科技名人的帶動(dòng)下,生成式AI背后的能源問題引起了國(guó)際注意。
據(jù)《紐約客》消息,國(guó)外研究機(jī)構(gòu)報(bào)告顯示,ChatGPT每天要響應(yīng)大約2億個(gè)請(qǐng)求,在此過程中消耗超過50萬度電力。而美國(guó)家庭平均用電量只有29度,也就是說,ChatGPT每天用電量相當(dāng)于1.7萬個(gè)美國(guó)家庭用電。
國(guó)際能源署也在報(bào)告中提及了人們即將面臨的“能源危機(jī)”。其報(bào)告指出,如果在谷歌搜索中融入AI,其用電量可能會(huì)增加十倍。
只是,當(dāng)下對(duì)于AI大模型的耗電量,絕大多數(shù)停留在估算和預(yù)測(cè)的階段。這是因?yàn)榭萍脊靖髯酝度氪罅抠Y金在AI后,紛紛選擇對(duì)技術(shù)和細(xì)節(jié)進(jìn)行保密。不同研究估算的方式不同,對(duì)比的坐標(biāo)不同,也給人不同的心理沖擊。
中國(guó)數(shù)據(jù)中心工作組(CDCC)專家技術(shù)委員會(huì)副主任委員曲海峰告訴南風(fēng)窗,生成式AI帶來的變化是—這類人工智能多使用性能較高的GPU卡進(jìn)行計(jì)算。
而根據(jù)美國(guó)AI咨詢公司Formula Monks的說法,更先進(jìn)的圖形處理器GPU屬于“能源密集型”?!癎PU每個(gè)處理周期消耗的電量是CPU(中央處理器)的10~15倍。它們非常耗能?!?/p>
但曲海峰表示:“我國(guó)目前存量不超過30萬片高性能GPU卡,這點(diǎn)耗電量可以忽略不計(jì)。30萬片,一年也就耗個(gè)幾億度電而已?!?blockquote>“推理是分布式的,今后可能10億人同時(shí)用。每個(gè)人即便是250瓦,也需要耗2500億瓦。”
盡管,中國(guó)科技從業(yè)者對(duì)我國(guó)算力資源的表述,也存在巨大差別。清華智能產(chǎn)業(yè)研究院院長(zhǎng)張亞勤在2023年4月參加清華論壇說:“如果把中國(guó)的算力加一塊,相當(dāng)于50萬塊英偉達(dá)A100?!盇I公司曠視科技CEO印奇接受采訪時(shí)則說:中國(guó)目前可用作大模型訓(xùn)練的A100總共只有約4萬塊。
如果照曲海峰的說法,以2023年中國(guó)全社會(huì)用電量92241億千瓦時(shí)換算,當(dāng)下AI的耗電量占全國(guó)用電的不及萬分之一。
西安交大數(shù)字經(jīng)濟(jì)研究院數(shù)字服務(wù)中心首席科學(xué)家、微品致遠(yuǎn)CDO李家貴也告訴南風(fēng)窗,AI的耗電量目前來看還不會(huì)對(duì)當(dāng)下電力系統(tǒng)產(chǎn)生影響。只是,未來隨著訓(xùn)練AI的智算中心發(fā)展,能耗還將進(jìn)一步增長(zhǎng)。
相比于大模型的訓(xùn)練階段,李家貴認(rèn)為,大模型在推理時(shí)的耗電量更值得關(guān)注?!癆I的耗電在預(yù)訓(xùn)練和推理都很大,但因?yàn)轭A(yù)訓(xùn)練是一次性的,所以單次絕對(duì)規(guī)模很大,但占的比例不夠?!?/p>
但用于回答用戶每次需求的“推理”階段,他表示:“推理是分布式的,今后可能10億人同時(shí)用。每個(gè)人即便是250瓦,也需要耗2500億瓦?!?h3>人工智能的B面
目前對(duì)AI耗能的擔(dān)心也許過早,但十分有必要。這讓人們意識(shí)到,大舉發(fā)展人工智能的B面,是我們的環(huán)境已經(jīng)被迫承載了巨大消耗。
2021年,美國(guó)馬薩諸塞大學(xué)研究員以當(dāng)時(shí)幾種大型AI大模型為例,發(fā)現(xiàn)該訓(xùn)練過程排放超過62.6萬磅二氧化碳,幾乎是普通汽車壽命周期排放量的五倍(包括汽車的制造過程)。
美國(guó)科羅拉多大學(xué)和得克薩斯大學(xué)的研究人員,在論文《讓AI不那么渴》中寫道,微軟僅在訓(xùn)練GPT-3時(shí),就消耗了70萬升多的水。這足以生產(chǎn)370輛寶馬汽車,或者320輛特斯拉電動(dòng)汽車。
原因是,用于訓(xùn)練和支撐AI運(yùn)行的數(shù)據(jù)中心,實(shí)際上便是堆滿一個(gè)個(gè)服務(wù)器的機(jī)房。而因?yàn)榉?wù)器長(zhǎng)時(shí)間運(yùn)作,無法中斷,經(jīng)常可能過熱,這些數(shù)據(jù)中心尤其強(qiáng)調(diào)涼爽的環(huán)境。為此,各數(shù)據(jù)中心需要大量的水進(jìn)行降溫,而且必須用干凈的淡水資源,以避免設(shè)備腐蝕或者細(xì)菌滋生。
中國(guó)數(shù)據(jù)中心節(jié)能委員會(huì)數(shù)據(jù)顯示,在數(shù)據(jù)中心,IT設(shè)備能耗占比最大,為45%。其次是空調(diào)系統(tǒng),占比40%。以大熱的ChatGPT為例,加州大學(xué)的一個(gè)研究發(fā)現(xiàn),每回答用戶20個(gè)問題,ChatGPT就需要消耗500多毫升水,用于冷卻硬件。
擁有20余年數(shù)據(jù)經(jīng)驗(yàn)的曲海峰也曾在采訪中表示,“相比其他行業(yè),無論單位產(chǎn)能用電量,還是單位建筑面積耗電量,數(shù)據(jù)中心均已位居前列。按照8—10年運(yùn)行周期計(jì)算,能源成本已占到數(shù)據(jù)中心總成本的一半左右,電費(fèi)甚至比機(jī)房還貴。”
“它們就像一個(gè)個(gè)不冒煙的鋼廠,創(chuàng)造經(jīng)濟(jì)價(jià)值的同時(shí)也帶來高能耗?!鼻7灞扔?。
據(jù)新華社2023年報(bào)道,我國(guó)數(shù)據(jù)中心2020年用電量超過2000億千瓦,占全社會(huì)用電量的2.7%。預(yù)計(jì)到2025年,中國(guó)數(shù)據(jù)中心用電量將突破4000億千瓦時(shí),占全社會(huì)用電量4.1%。高能耗的數(shù)據(jù)中心,變成了十足的“吃電”大戶。
但曲海峰告訴南風(fēng)窗,當(dāng)下數(shù)據(jù)中心耗能高,實(shí)際的利用率卻很低?!霸S多地方只是建了數(shù)據(jù)中心的建筑本體和一些機(jī)電和空調(diào)的設(shè)備而已,并不是意味著里面真正運(yùn)行了IT系統(tǒng)。”這也導(dǎo)致了我國(guó)數(shù)據(jù)中心“服務(wù)器裝機(jī)率和計(jì)算服務(wù)資源被使用的比率非常低,造成了大量浪費(fèi)”。
上述現(xiàn)象也被新華社在報(bào)道中“點(diǎn)名”。報(bào)道指出,我國(guó)大量數(shù)據(jù)中心服務(wù)器的CPU平均利用率僅為5%至10%,絕大多數(shù)時(shí)間處于低效的“空轉(zhuǎn)”狀態(tài)。一些地方甚至還沒搞清楚數(shù)據(jù)中心的原理,就盲目扎堆上項(xiàng)目。
意識(shí)到了AI帶給環(huán)境和能耗壓力后,科技大佬與從業(yè)者們都在想解決之道。
李家貴介紹,為了節(jié)約能源,AI業(yè)界正在進(jìn)行架構(gòu)的創(chuàng)新。這是因?yàn)?,人們發(fā)現(xiàn),訓(xùn)練以ChatGPT為大模型,要消耗大量算力,并不環(huán)保。許多公司開始追求用更少的訓(xùn)練步數(shù),訓(xùn)練一個(gè)更大的模型。
一個(gè)比較熱門的方向是名叫MoE(Mixed Expert Model)的大模型。研究者發(fā)現(xiàn),這個(gè)基于Transformer改進(jìn)過的大模型在同等算力下訓(xùn)練速度更快。而且它的擴(kuò)展度高,允許模型在計(jì)算成本不變的情況下增加參數(shù),使其擴(kuò)展到非常大的模型。
在“源頭”上進(jìn)行節(jié)流,是當(dāng)下技術(shù)加速主義者擁抱的方向。對(duì)技術(shù)保持樂觀的一派相信,隨著技術(shù)的加速發(fā)展,許多事情在迭代中自然會(huì)找到答案。
曲海峰也認(rèn)為,應(yīng)理智看待AI耗電一事。他告訴南風(fēng)窗,我國(guó)當(dāng)下許多數(shù)據(jù)中心,都是在為互聯(lián)網(wǎng)平臺(tái)提供的社會(huì)服務(wù)運(yùn)作,也就是“消費(fèi)互聯(lián)網(wǎng)”買單。但真正能夠深入到產(chǎn)業(yè)互聯(lián)網(wǎng),“在AI的用電量和計(jì)算量仍是偏低的”。
在更遙遠(yuǎn)、全世界矚目的硅谷大佬圈,許多人早已“未雨綢繆”。
曲海峰同時(shí)認(rèn)為,“我國(guó)每年浪費(fèi)掉的電力以及沒有產(chǎn)生社會(huì)價(jià)值的用電量非常多”。如果在AI的耗電量上提高,“說明這個(gè)產(chǎn)業(yè)技術(shù)在發(fā)展,這些用能是高質(zhì)量用能”。
如此估算下來,以ChatGPT日耗電50萬度估算,電解鋁的日耗電量相當(dāng)于ChatGPT運(yùn)行2900天。
“所以,不要去恐懼?jǐn)?shù)據(jù)中心的用電量,我們要在意提升它的能效,而不是抑制它的規(guī)模?!鼻7蹇偨Y(jié),“這就跟碳中和的道理一樣。我們并非要減少對(duì)能源的消耗,而是控制碳的排放量,提升能源消費(fèi)的質(zhì)量?!?/p>
短期來看,人類社會(huì)仍需要AI的發(fā)展,來為高質(zhì)量的經(jīng)濟(jì)發(fā)展和能源轉(zhuǎn)型鋪路。
不過,在更遙遠(yuǎn)、全世界矚目的的硅谷大佬圈,許多人早已“未雨綢繆”。他們有著普通企業(yè)家難以企及的資本和起點(diǎn),這些底氣讓他們?cè)噲D給全社會(huì)創(chuàng)造未來。
這其中最顯眼的,要屬引領(lǐng)這一代技術(shù)革命AGI信徒,OpenAI掌權(quán)者—山姆·奧特曼。
鼓吹能源危機(jī)的他,也的確在為他想象中的危機(jī)世界做準(zhǔn)備。奧特曼個(gè)人職業(yè)生涯最大筆的投資,不是用來去火星或者造火箭,而是投資了兩家能源公司—Helion、Oklo。它們都在做著人類過去突破了幾十年年都沒法實(shí)現(xiàn)的事—核聚變。
這個(gè)技術(shù)的別名,叫人造太陽。也就是在地球模擬太陽上億攝氏度的環(huán)境,實(shí)現(xiàn)發(fā)電。
2023年,奧特曼在接受采訪時(shí)說:核聚變的潛力“巨大得令人難以置信”。“如果我們能夠真正實(shí)現(xiàn)豐富、廉價(jià)、安全、清潔能源的夢(mèng)想,那么所有人的生活質(zhì)量將會(huì)難以置信地提高。這就是為什么我這么長(zhǎng)時(shí)間以來都對(duì)這兩個(gè)項(xiàng)目充滿熱情?!?/p>
除了奧特曼外,亞馬遜的創(chuàng)始人杰夫·貝索斯也向加拿大的核聚變初創(chuàng)公司General Fusion籌集了1.3億美元。類似的入局者還有彼得·蒂爾、比爾·蓋茨等科技大腕。他們共同相信,多年未實(shí)現(xiàn)的可控核聚變,有望在幾年內(nèi)變成現(xiàn)實(shí)。
但一切都離落地還有漫長(zhǎng)的距離。以奧特曼押注的Helion為例,雖然它已經(jīng)可以通過核聚變產(chǎn)生能量,但還沒建造出能產(chǎn)生電力的裝置。這仍然是像賭局一樣的高風(fēng)險(xiǎn)賽道。
對(duì)此,奧特曼回應(yīng):“幾個(gè)月前,也有很多人對(duì)人工智能表示懷疑?!?/p>
毫無疑問,現(xiàn)在,人工智能掀起的浪潮,已經(jīng)不止停留在人工智能本身了。