1. AI大模型還處于萌芽階段,既有新方向,也有大忽悠。好多年前,計(jì)算機(jī)剛剛開(kāi)始普及,那時(shí)候連算命的都叫“電腦算命”,價(jià)格還挺貴。不久之后呢?
2. 中國(guó)的AI公司或者大模型公司,面對(duì)的最主要問(wèn)題不是技術(shù)問(wèn)題,而是商業(yè)問(wèn)題。我們判斷,未來(lái)主流應(yīng)該是混合模型。有很多同行,都已經(jīng)在布局更小參數(shù)規(guī)模的模型。
3. 越大的模型越容易同質(zhì)化。想象一下,一個(gè)班上的同學(xué),訓(xùn)練數(shù)據(jù)是相同的,訓(xùn)練方法是相似的,老師也是同一個(gè),越大規(guī)模參數(shù)的大模型,不就越可能同質(zhì)化嗎?
4. 大模型公司能不能養(yǎng)活自己?API(應(yīng)用程序接口)的商業(yè)模式會(huì)不會(huì)被開(kāi)源顛覆?隨著行業(yè)的“內(nèi)卷”,大模型本身將不再是一個(gè)昂貴的東西,大模型將越來(lái)越不值錢(qián)。
5. 我們有兩個(gè)堅(jiān)持:第一,我們不愿意收不是AI的錢(qián);第二,我們不只靠賣(mài)技術(shù)賺錢(qián)。小冰(北京紅棉小冰科技有限公司)在積極推進(jìn)新的商業(yè)模式,是一種共享終端利益的商業(yè)模式,而非一種提供鏟子的商業(yè)模式。
6. 人工智能公司的護(hù)城河到底是什么?以前搞人工智能、自然語(yǔ)言處理的團(tuán)隊(duì),全國(guó)算起來(lái)可能也沒(méi)多少,大模型出現(xiàn)以后大家發(fā)現(xiàn)誰(shuí)都可以做。技術(shù)本身越來(lái)越不成為護(hù)城河。什么是護(hù)城河?Deep Relationship(深度關(guān)聯(lián)),有用戶(hù)數(shù)據(jù),有深厚關(guān)系。
7. AI是助手,而不是對(duì)手。小冰是打造用戶(hù)與AI的“孤島”,而不是建立用戶(hù)與用戶(hù)的“廣場(chǎng)”。與同行業(yè)者普遍使用的“廣場(chǎng)”“話題”“排行榜”等產(chǎn)品設(shè)計(jì)不同,小冰的每個(gè)用戶(hù)僅能與AI接觸,從產(chǎn)品底層設(shè)計(jì)邏輯上,避免了用戶(hù)之間的任何聚集。
8. 產(chǎn)品中不冒然使用大模型,而是使用技術(shù)成熟的小模型和檢索模型。小冰目前在產(chǎn)品中,僅使用技術(shù)成熟的小模型,模型參數(shù)規(guī)模最大僅為3.5B,最小為0.5B。同時(shí)綜合運(yùn)用了技術(shù)更為成熟的檢索模型作為安全模式。
小冰公司前身微軟小冰團(tuán)隊(duì),是微軟全球最大的人工智能獨(dú)立產(chǎn)品研發(fā)團(tuán)隊(duì)。小冰框架目前是全球承載交互量最大的人工智能框架之一,技術(shù)覆蓋自然語(yǔ)言處理、計(jì)算機(jī)語(yǔ)音、計(jì)算機(jī)視覺(jué)及人工智能內(nèi)容生成。
2020年7月,小冰開(kāi)始獨(dú)立運(yùn)營(yíng),微軟互聯(lián)網(wǎng)工程院副院長(zhǎng)李笛擔(dān)任CEO;2021年7月,小冰公司完成A輪融資,估值超10億美元;2022年11月,小冰公司宣布完成10億元融資,估值超20億美元。少女小冰、Rinna、夏語(yǔ)冰、小堂妹、冬奧裁判觀君等AI虛擬人,都是小冰框架孵化出的AI Being(人工智能數(shù)字員工)。
以下內(nèi)容來(lái)自小冰公司CEO李笛的分享,希望能給大家?guī)?lái)一些啟發(fā)。
我必須先談一件事,這件事直接影響我們各行各業(yè)如何看待大模型。
坦率來(lái)說(shuō),我個(gè)人觀點(diǎn),人工智能發(fā)展到今天為止,仍處于孟德?tīng)杽倓偘l(fā)現(xiàn)遺傳學(xué)規(guī)律的那會(huì)兒。
也就是說(shuō),當(dāng)下的AI大模型,還處于萌芽階段。
在萌芽階段,可以想象,也可以看到各種各樣跟大模型有關(guān)的東西冒出來(lái)。有一些是真正的新方向,有一些是大忽悠。
我記得多年前,計(jì)算機(jī)剛剛開(kāi)始普及,那時(shí)候就出現(xiàn)了“電腦算命”,價(jià)格還挺貴。
很多人認(rèn)為,大模型新的能力會(huì)不斷涌現(xiàn),誰(shuí)在大模型時(shí)代領(lǐng)先一步,誰(shuí)就能夠在接下來(lái)的時(shí)間里步步領(lǐng)先。
可惜,事物的發(fā)展并不是如此。這更像是一個(gè)波形,大模型在接下來(lái)也會(huì)遇到瓶頸。整個(gè)科技界會(huì)期待新的方法,下一波浪潮也會(huì)來(lái)解決我們當(dāng)下遇到的這些瓶頸問(wèn)題。
第二點(diǎn),我想跟大家分享的是,截至目前,對(duì)于大模型時(shí)代的技術(shù),科學(xué)家們還只是停留在一個(gè)觀察結(jié)果上面,并沒(méi)有特別多的關(guān)于背后原理的了解。
我們今天還處在人工智能的蠻荒時(shí)代,更準(zhǔn)確地說(shuō),是蠻荒時(shí)代的一次劇烈波動(dòng)期。
我個(gè)人判斷,從現(xiàn)在開(kāi)始,到明年二季度,大模型等技術(shù)還會(huì)產(chǎn)生劇烈的波動(dòng)。
我在微軟時(shí),除了是小冰的負(fù)責(zé)人,還是微軟搜索引擎必應(yīng)的亞洲負(fù)責(zé)人。
從我的視角來(lái)看,為什么最先推出大模型的公司不是谷歌?是因?yàn)樗鼪](méi)有嗎?那是因?yàn)椋雀柙谒阉饕骖I(lǐng)域處于老大的位置。
微軟必應(yīng)在全球范圍內(nèi)最大的競(jìng)爭(zhēng)對(duì)手是谷歌。谷歌的規(guī)模大約是必應(yīng)的10倍左右。當(dāng)微軟使用大模型來(lái)沖擊這個(gè)市場(chǎng)的時(shí)候,谷歌要印證,就必須付出10倍的成本。
此外,由于谷歌在搜索引擎上面的收入非常大,當(dāng)它使用新的技術(shù)范式的時(shí)候,就會(huì)直接導(dǎo)致毛利迅速下降,已經(jīng)構(gòu)建成功的商業(yè)模式也會(huì)迅速被破壞。
谷歌沒(méi)有任何的主動(dòng)意愿,在自己占據(jù)優(yōu)勢(shì)的領(lǐng)域嘗試新的技術(shù)模式。
但對(duì)于微軟而言,大模型就是一個(gè)非常棒的挑戰(zhàn)者的新武器。
百度在幾個(gè)月前宣布推出文心一言的時(shí)候,很多人都認(rèn)為它會(huì)將文心用到搜索引擎上。我們當(dāng)時(shí)的判斷是不太可能的,更可能的方式是將大模型利用到百度占據(jù)老二、老三的位置上去。果然,最后它是和百度云深度捆綁。
對(duì)于大公司來(lái)講,如果你已經(jīng)在某一個(gè)市場(chǎng)具備了領(lǐng)先地位,就應(yīng)該把大模型當(dāng)作戰(zhàn)略性?xún)?chǔ)備武器。對(duì)于挑戰(zhàn)者來(lái)講,它是一個(gè)比較好的武器,使你有機(jī)會(huì)在短時(shí)間內(nèi)獲得更多的市場(chǎng)份額。
不同人看待大模型的視角不同,不可避免地會(huì)附帶各自的主觀期望。我也會(huì)帶有主觀色彩,但盡量客觀。
我認(rèn)為,中國(guó)的AI公司或者大模型公司,面對(duì)的最主要的問(wèn)題不是技術(shù)問(wèn)題,而是商業(yè)模式問(wèn)題。
幾個(gè)月前,行業(yè)里面普遍認(rèn)為大模型將通吃。換句話說(shuō),就是未來(lái)將有一個(gè)唯一的大模型,這個(gè)大模型能夠取代其他已有的技術(shù)范式。這也是很多人貿(mào)然布局大模型的原因。
我們當(dāng)時(shí)判斷,不是這樣的。大模型不是越大越好,大模型不會(huì)通吃,未來(lái)將是混合模型居多。
給大家舉一個(gè)簡(jiǎn)單的例子:
如果你的模型參數(shù)規(guī)??刂圃?30億以?xún)?nèi),就可以用單卡的A100驅(qū)動(dòng)這個(gè)模型;如果控制在70億參數(shù)左右,可以用單卡的V100去驅(qū)動(dòng);如果控制在40億參數(shù)規(guī)模,甚至可以用非常廉價(jià)的T4去驅(qū)動(dòng)。
而這中間產(chǎn)生的成本差,大概有上百倍的差異。
所以像我們小冰公司,還有很多同行,其實(shí)都在布局更小參數(shù)規(guī)模的模型。
很多的技術(shù)創(chuàng)新都會(huì)有一種從眾心態(tài),從眾就意味著整個(gè)領(lǐng)域會(huì)“卷”得非??臁?/p>
現(xiàn)在有很多大模型,比如有650億參數(shù)以上的,甚至有超過(guò)千億參數(shù)的。
第一,它們都需要海量的數(shù)據(jù)。大部分的同行業(yè)者所拿到,或者所準(zhǔn)備的訓(xùn)練數(shù)據(jù),都是類(lèi)似的,彼此之間差異不大。
第二,它們的訓(xùn)練方法也是類(lèi)似的。大家都想先追上GPT(生成式預(yù)訓(xùn)練Transformer模型,一種基于互聯(lián)網(wǎng)的、可用數(shù)據(jù)來(lái)訓(xùn)練的、文本生成的深度學(xué)習(xí)模型),所以大家的訓(xùn)練方法也是相似的。
想象一下,一個(gè)班上的同學(xué),訓(xùn)練數(shù)據(jù)是相同的,訓(xùn)練方法是相同的,老師也是同一個(gè),那么越大規(guī)模參數(shù)的大模型,不就越可能會(huì)同質(zhì)化嗎?
反而是中模型和小模型,因?yàn)橛?xùn)練數(shù)據(jù)少,所以能精細(xì)地篩選訓(xùn)練數(shù)據(jù),訓(xùn)練方法也可以不同,就有可能產(chǎn)生足夠高的差異性,進(jìn)而形成壁壘。
還有,到目前為止,大模型的涌現(xiàn)是不是已經(jīng)到了尾聲?
有一種觀點(diǎn)認(rèn)為,再要涌現(xiàn)新的能力,可能需要參數(shù)規(guī)模3個(gè)數(shù)量級(jí)的增長(zhǎng)。還有其他的觀點(diǎn)認(rèn)為,需要新的一種技術(shù)范式的變化,比如楊立昆(Yann LeCun,Meta首席人工智能科學(xué)家)提到的世界模型。
毫無(wú)疑問(wèn)的是,涌現(xiàn)并沒(méi)有像我們所想象的那樣繼續(xù)激動(dòng)人心,這意味著什么?
這意味著對(duì)于大模型而言,基于當(dāng)前的技術(shù)進(jìn)行場(chǎng)景應(yīng)用的深挖,變成了最至關(guān)重要的事情。
大模型公司能不能養(yǎng)活自己,我們甚至都不討論它能不能賺錢(qián)。
先跟大家分享一個(gè)例子—“這個(gè)女孩叫小美”。
可能很多年輕的朋友,在B站(嗶哩嗶哩)、抖音上看過(guò)這種電影解說(shuō)。實(shí)際上,這個(gè)聲音是微軟云服務(wù)里面所包含的一個(gè)聲音。
很多視頻創(chuàng)作者都使用了這個(gè)聲音。其中,有短視頻做得非常棒,賺了很多錢(qián)的人;也有因?yàn)榉N種原因短視頻完全不掙錢(qián)的人。微軟作為提供聲音技術(shù)服務(wù)的公司,能不能從中獲得不同的回報(bào)?
答案是否定的。
類(lèi)比到人工智能。AIGC(生成式人工智能)創(chuàng)造了巨大的價(jià)值,但是人工智能企業(yè)能不能從巨大價(jià)值中獲得應(yīng)有的價(jià)值?
答案可能也是否定的。
人工智能服務(wù)提供者,無(wú)論使用它做出來(lái)的內(nèi)容是多么賺錢(qián)或者不賺錢(qián),都只能按照次數(shù)或者時(shí)長(zhǎng)來(lái)收取相同的錢(qián)。還有可能面對(duì)很多同行,以免費(fèi)的方式來(lái)跟我們競(jìng)爭(zhēng),最后大家誰(shuí)都賺不到錢(qián)。
再給大家舉一個(gè)例子:
一個(gè)媒體朋友跟我咨詢(xún)?nèi)斯ぶ悄茏?,讓AI寫(xiě)出符合媒體調(diào)性又高質(zhì)量的稿件。
我好奇地問(wèn):“你愿意為此付多少錢(qián)?”
對(duì)方回答:“這不是有定價(jià)嗎?1 000個(gè)Token(在自然語(yǔ)言處理中,指文本中的一個(gè)最小單位,通常是一個(gè)單詞、一個(gè)標(biāo)點(diǎn)符號(hào)、一個(gè)數(shù)字、一個(gè)符號(hào)等)是0.2美分,一個(gè)月200篇稿件?!?/p>
我說(shuō):“刨去成本,我一個(gè)月能從你身上掙到多少錢(qián)?100元都不到?!?/p>
換作人類(lèi)撰稿,一篇稿件或要1 500元起,200篇稿件則要35萬(wàn)元。人們是不會(huì)給人工智能企業(yè)按照創(chuàng)造的價(jià)值來(lái)付費(fèi)的。
回顧過(guò)去,一些人工智能公司,比如做人臉識(shí)別的,幫我們解決了很大的問(wèn)題,但它的服務(wù)很難收到錢(qián),最后不得不去做軟硬結(jié)合。
所以說(shuō),制約大模型和AI發(fā)展的,其實(shí)是經(jīng)濟(jì)學(xué)規(guī)律。
這一波人工智能新技術(shù)有一個(gè)巨大的特點(diǎn),那就是:降低了人工智能領(lǐng)域從業(yè)者的進(jìn)入門(mén)檻。
以前搞人工智能、自然語(yǔ)言處理的團(tuán)隊(duì),全國(guó)算起來(lái)可能也沒(méi)多少。大模型出現(xiàn)以后,大家發(fā)現(xiàn)誰(shuí)都可以做大模型,甚至很多傳統(tǒng)領(lǐng)域的企業(yè),也開(kāi)始親自訓(xùn)練自己的大模型。
各行各業(yè)都可以參與其中,所以技術(shù)本身越來(lái)越不成為護(hù)城河。
那么什么才是人工智能公司的護(hù)城河?
我先給大家講一個(gè)例子:Inflection Pi(人工智能初創(chuàng)公司Inflection AI推出的首款聊天機(jī)器人Pi)。
Inflection AI公司近期宣布,在微軟、里德·霍夫曼、比爾·蓋茨、埃里克·施密特和新投資者英偉達(dá)(NVIDIA)牽頭的一輪融資中,共籌集到了13億美元,總計(jì)融資達(dá)到15.25億美元。據(jù)路透社報(bào)道,該公司最新一輪估值約為40億美元。
Inflection AI的首席執(zhí)行官Suleyman(蘇萊曼)介紹說(shuō):
“我們不知道所有的答案,但我們正在著手開(kāi)發(fā)一種真正對(duì)你有用的個(gè)人智能,它就在你身邊。我們的使命是將你的人工智能與你和你的興趣,堅(jiān)定地聯(lián)系在一起。這意味著設(shè)計(jì)一種人工智能,可以幫助你表達(dá)你的意圖,組織你的生活,并在你需要的時(shí)候?yàn)槟惴?wù)?!?/p>
ChatGPT(美國(guó)人工智能研究公司OpenAI研發(fā)的一款聊天機(jī)器人程序)不管用戶(hù)是誰(shuí),更關(guān)心后端,更像搜索引擎。
Inflection AI則尋找另外一個(gè)方向,認(rèn)為護(hù)城河是其對(duì)用戶(hù)的理解。
如果大家使用Inflection AI,會(huì)發(fā)現(xiàn)一個(gè)很明顯的特點(diǎn),襲天卷地的各種各樣的提問(wèn),他會(huì)抓住一切機(jī)會(huì)去理解你,甚至一天之內(nèi)會(huì)問(wèn)你200個(gè)問(wèn)題。
說(shuō)實(shí)話,只要是具有相關(guān)從業(yè)經(jīng)驗(yàn),并且資金儲(chǔ)備、算力儲(chǔ)備差不多,在技術(shù)產(chǎn)品上,誰(shuí)也不會(huì)比誰(shuí)領(lǐng)先一兩個(gè)月的時(shí)間,但是用戶(hù)數(shù)據(jù)的護(hù)城河能夠領(lǐng)先很久。
我們以前認(rèn)為,人工智能是可以取代人的。但真的是這樣嗎?
比方說(shuō),已經(jīng)有一個(gè)莫言了,人工智能是要寫(xiě)出比莫言更好的小說(shuō)嗎?不是的。
人工智能真正的特點(diǎn)和價(jià)值,是在同樣質(zhì)量的情況下,人工智能可以不眠不休,可以7×24小時(shí),可以同時(shí)和千萬(wàn)人進(jìn)行交互。
人工智能會(huì)不會(huì)取代人?如果他是我的助手,他就不會(huì)取代我。大家想想,如果今天每一個(gè)人類(lèi)的創(chuàng)作者都有了一個(gè)助手,它可以幫助人類(lèi)去更好地創(chuàng)作,不是更好嗎?
按照助手的邏輯,AI一定和人是一對(duì)一交互的。
小冰公司致力于打造用戶(hù)與AI的“孤島”,而不是建立用戶(hù)與用戶(hù)的“廣場(chǎng)”。
與同行業(yè)者普遍使用的“廣場(chǎng)”“話題”“排行榜”等產(chǎn)品設(shè)計(jì)不同,小冰的每個(gè)用戶(hù)僅能與AI接觸,從產(chǎn)品底層設(shè)計(jì)邏輯上,避免了用戶(hù)之間的任何聚集。
如果一定要把人工智能摻到人和人之間,無(wú)異于破壞式地改變?cè)械牧夹越Y(jié)構(gòu)。
以前,一家公司可以通過(guò)技術(shù)研發(fā),掌握一種別人很難追上的知識(shí)圖譜的能力。現(xiàn)在,這件事情不存在了。
所以,如果做了一個(gè)抄襲型的大模型,達(dá)到了跟別人一樣的質(zhì)量,那最后商業(yè)模式才是關(guān)鍵。如果率先推出了一個(gè)原創(chuàng)型的大模型,你就等著被別人追趕吧。為什么?因?yàn)榇竽P投唐趦?nèi)看不到新的能力的涌現(xiàn),所以你自己不能加速甩掉后面的跟從者,你只能在原地等著,直到被后來(lái)者追上。
我們可以看到,大模型多是API的商業(yè)模式,這個(gè)商業(yè)模式會(huì)不會(huì)被開(kāi)源顛覆?隨著行業(yè)的競(jìng)爭(zhēng)加劇,大模型本身將不再是一個(gè)昂貴的東西,大模型將越來(lái)越不值錢(qián)。
小冰公司在探索商業(yè)化時(shí),有兩個(gè)堅(jiān)持:
第一,我們不愿意收不是AI的錢(qián)。比方說(shuō),有一個(gè)智能防盜門(mén),可以人臉識(shí)別,它可能賣(mài)3 000元。之所以賣(mài)3 000元,是因?yàn)榉辣I門(mén)的成本有2 800元。所以,這2 800元就不是AI的錢(qián)。我們今天有很多智能音箱,更多的是音箱值那么多錢(qián),而不是智能值那么多錢(qián)。
第二,我們不只靠賣(mài)技術(shù)賺錢(qián)。OpenAI把研究室的研究成果API直接賣(mài)給客戶(hù)來(lái)使用。我們追求的是,一定要取得實(shí)際產(chǎn)生價(jià)值的那部分。小冰在積極推進(jìn)新的商業(yè)模式,是一種共享終端利益的商業(yè)模式,而不是一種提供鏟子的商業(yè)模式。像我們跟奈飛、網(wǎng)易云音樂(lè)的合作,就是掙共創(chuàng)的錢(qián)。
我們也仍然只是在探索,小冰也有可能是“前浪死在沙灘上”。
到目前為止,人工智能無(wú)論是To C還是To B,尚未產(chǎn)生一個(gè)成熟或者成功的端到端的商業(yè)模式。所以各位,咱們大家都還有機(jī)會(huì)。