陳鄧新
文心一言,終于揭開了神秘面紗。
2023年3月16日14時(shí),百度在北京總部召開新聞發(fā)布會(huì),宣布正式邀請(qǐng)測(cè)試基于百度新一代大語(yǔ)言模型的生成式AI 產(chǎn)品文心一言。
百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏表示:“百度希望和大家一起,推動(dòng)人工智能技術(shù)進(jìn)步,讓所有人都能使用最先進(jìn)的生產(chǎn)力工具,讓所有人都能從中受益?!?/p>
時(shí)代,變了。
2023年3月15日凌晨,OpenAI正式發(fā)布了升級(jí)后的GPT-4,具備了圖像處理,盡管如此仍有不足之處:在新版本中,AI 依舊存在社會(huì)偏見、捏造事實(shí)、對(duì)抗生成等問題。
而一天之隔,百度的“文心一言”也橫空出世。
巧合的背后,則是棋逢對(duì)手,標(biāo)志著AI 正式邁入“iPhone 時(shí)刻”,拉開新時(shí)代的序幕。
事實(shí)上,文心一言雖然對(duì)標(biāo)GPT-4,卻大有不同:走了一條“人有我有,人有我優(yōu)”之路,尋求差異化競(jìng)爭(zhēng)力,與GPT-4 形成錯(cuò)位競(jìng)爭(zhēng)。
具體來看,文心一言對(duì)人類意圖的理解頗深,在現(xiàn)場(chǎng)展示的互動(dòng)中,準(zhǔn)確性、邏輯性與流暢性已逐漸接近人類的水平。
此外,文心一言也有獨(dú)到之處。
一方面,大模型更懂中文。
中文博大精深,同一個(gè)詞匯,在不同語(yǔ)境或有不同的意義,這對(duì)AI 是一個(gè)巨大的挑戰(zhàn),但難不倒文心一言。
畢竟,作為一家中國(guó)公司,百度天然占據(jù)中文語(yǔ)境的優(yōu)勢(shì),再疊加持之以恒地深耕,從而對(duì)中國(guó)文化的理解更深:文心一言大模型的訓(xùn)練數(shù)據(jù)包括萬(wàn)億級(jí)網(wǎng)頁(yè)數(shù)據(jù),數(shù)十億搜索數(shù)據(jù)和圖片數(shù)據(jù),百億級(jí)語(yǔ)音日均調(diào)用數(shù)據(jù),以及5500億事實(shí)的知識(shí)圖譜。
一言以蔽之,百度的文心大模型扎根于中國(guó)本土,比國(guó)外開發(fā)的大語(yǔ)言模型更適合中文語(yǔ)境和中國(guó)市場(chǎng)。
另外一方面,多模態(tài)更豐富。
相比GPT-4,文心一言可以生成視頻與方言語(yǔ)音,前者降低了視頻制作的門檻,一次創(chuàng)作,觸及文本、圖片、視頻等全域內(nèi)容生態(tài);后者覆蓋不同地區(qū)的群體,方便用戶流暢地進(jìn)行智能互動(dòng)。
百度多模態(tài)的實(shí)力,可見一斑。
未來,百度多模態(tài)統(tǒng)一大模型的能力增強(qiáng),文心一言的多模態(tài)生成能力也會(huì)不斷提升。
需要注意的是,Open Al 為美國(guó)創(chuàng)業(yè)公司,而正式發(fā)布對(duì)標(biāo)GPT 產(chǎn)品的,百度是全球大廠的第一個(gè),值得高看一眼。
這并非突擊數(shù)月就辦得到的,而是厚積薄發(fā)的結(jié)果。
首先,十年投入超千億元。
2013年起,百度陸續(xù)成立了百度美國(guó)研究院、百度深度學(xué)習(xí)研究院、大數(shù)據(jù)實(shí)驗(yàn)室、硅谷人工智能實(shí)驗(yàn)室,從此不斷加碼勇攀AI 技術(shù)的高峰。
這十年來,百度在AI 累計(jì)投入了超1000億元,其中核心研發(fā)投入占核心收入比例連續(xù)多個(gè)季度超過了20%。
以2022年為例,百度的研發(fā)費(fèi)用為233億元,占核心收入的比例高達(dá)24.42%,而全年的凈利潤(rùn)也不過206.8億元。
專注之下,回報(bào)也肉眼可見。
據(jù)《中國(guó)人工智能專利技術(shù)分析報(bào)告(2022)》顯示,百度AI專利申請(qǐng)量為16754件,AI 專利授權(quán)量為5705件, AI 專利申請(qǐng)量與授予量連續(xù)五年全國(guó)第一。
實(shí)際上,從全球AI 專利數(shù)量排名來看,百度已穩(wěn)壓微軟、谷歌一頭,這意味著百度AI 在中國(guó)乃至全球范圍均具有綜合優(yōu)勢(shì)。
其次,持續(xù)夯實(shí)算力底座。
技術(shù)占優(yōu)之外,百度也有承接AI 算力的底氣。
多年以來,百度一直是“新基建”的主力之一,在算力基礎(chǔ)設(shè)施上一向未雨綢繆,并規(guī)劃2030年百度智能云服務(wù)器數(shù)量超500萬(wàn)臺(tái)。
如此一來,百度自然沒有算力瓶頸的困擾。
更為重要的是,百度在山西陽(yáng)泉、江蘇鹽城等地建設(shè)智算中心;其中,百度陽(yáng)泉智算中心是亞洲最大單體智算中心,建設(shè)規(guī)模為4 EFLOPS(每秒400 億億次浮點(diǎn)運(yùn)算)AI 算力,可滿足各行業(yè)超大規(guī)模AI 計(jì)算需求。
再次,打造AI 閉環(huán)。
百度是中國(guó)唯一一家擁有全棧AI 技術(shù)架構(gòu)的公司:從高端芯片昆侖芯,到飛槳深度學(xué)習(xí)框架,到文心預(yù)訓(xùn)練大模型,再到行業(yè)AI 落地,在芯片層、框架層、模型層與應(yīng)用層都有關(guān)鍵自研技術(shù)。
截至2023年3月17日10點(diǎn),申請(qǐng)文心一言AIP調(diào)用服務(wù)測(cè)試的企業(yè)已達(dá)7.6 萬(wàn)家,涉及互聯(lián)網(wǎng)、媒體、金融、汽車、軟件等行業(yè),而百度智能云已與5 家企業(yè)完成首批簽約合作,并與650 家企業(yè)啟動(dòng)簽約。
讓每一家公司離客戶更近,成為百度智能云最大的訴求。
中信證券認(rèn)為:“百度具備‘模型、框架、芯片、應(yīng)用的全棧布局,上述領(lǐng)域的產(chǎn)業(yè)落地有望帶動(dòng)百度云計(jì)算業(yè)務(wù)在AI 領(lǐng)域的持續(xù)拓展,持續(xù)強(qiáng)化公司智能云業(yè)務(wù)的競(jìng)爭(zhēng)力與遠(yuǎn)期市場(chǎng)空間。”
總而言之,文心一言承載了百度科技改變世界的夢(mèng)想,是賦能千行百業(yè)的新平臺(tái),勢(shì)必成為產(chǎn)業(yè)的智能牽引,驅(qū)動(dòng)產(chǎn)業(yè)不斷降本增效。
畢竟,文心一言的一小步,百度的一大步。