假如你是一名小游戲研發(fā)者,想要研發(fā)制作一款休閑類(lèi)小游戲,如何在短時(shí)間內(nèi)完成?
當(dāng)你向AI提出這個(gè)問(wèn)題,AI會(huì)告訴你,它無(wú)法直接做出可以實(shí)際操作的游戲,但可以提供一段代碼,你可以在此基礎(chǔ)上完善、開(kāi)發(fā),最終寫(xiě)出屬于自己的小游戲。
但如果你是向AI智能體(Agent)提出這個(gè)問(wèn)題,只需坐等游戲完成,智能體會(huì)直接生成小游戲鏈接,讓你試玩。
AI智能體并不是一個(gè)新概念。今年上半年,被稱(chēng)為“全球首款通用AI Agent”的Manus大火,讓AI智能體進(jìn)入公眾視野,但也面臨著“套殼”“技術(shù)縫合”“過(guò)度營(yíng)銷(xiāo)”等爭(zhēng)議。
隨著時(shí)間的推移,智能體熱度不減,多個(gè)大廠(chǎng)都推出了相應(yīng)產(chǎn)品,并將其看作AI發(fā)展的下一必爭(zhēng)方向。那么,AI智能體是啥?縈繞背后的技術(shù)縫合爭(zhēng)議如何理解?智能體時(shí)代是否能夠快速到來(lái)?
AI智能體并不是一個(gè)新事物。2023年,斯坦福大學(xué)和谷歌的聯(lián)合研究團(tuán)隊(duì),發(fā)表了一篇題為《生成式智能體:人類(lèi)行為的交互式模擬》的研究論文。
論文稱(chēng),居住在虛擬小鎮(zhèn)Smallville的25個(gè)虛擬人在接入ChatGPT之后,表現(xiàn)出各種類(lèi)似人類(lèi)的行為,由此帶火了智能體概念。
知道創(chuàng)宇首席安全官周景平告訴記者,可以將AI 智能體看作一種不僅會(huì)“動(dòng)腦思考”,還能“動(dòng)手干活”的AI助手。他所在的企業(yè)也推出了自己的智能體產(chǎn)品,相關(guān)產(chǎn)品通過(guò)大模型API調(diào)用以實(shí)現(xiàn)通用任務(wù)理解、規(guī)劃、執(zhí)行。
“過(guò)去的大模型像是一個(gè)超強(qiáng)大腦,只能告訴你答案。而智能體不光會(huì)想,還能干活,它會(huì)自己規(guī)劃步驟、寫(xiě)代碼、調(diào)用工具,最后給你輸出文檔?!敝芫捌秸f(shuō)。
比如,用戶(hù)上傳10份簡(jiǎn)歷壓縮包,Manus會(huì)自主解壓文件、分析候選人資質(zhì)、生成Excel排名表,甚至附上評(píng)估標(biāo)準(zhǔn)。對(duì)于有些AI大模型來(lái)說(shuō),卻不一定能支持解壓文件夾。
如果用一個(gè)公式來(lái)表示,參考OpenAI Safety團(tuán)隊(duì)前負(fù)責(zé)人Lilian Weng的表述,智能體= LLM(Large Language Model,大語(yǔ)言模型,即大腦)+記憶(確保前后目標(biāo)一致)+任務(wù)規(guī)劃(任務(wù)拆解和檢查)+工具使用(執(zhí)行行動(dòng))。
智能體裝在哪里?目前可以通過(guò)網(wǎng)頁(yè)或者手機(jī)進(jìn)行體驗(yàn),和日常打開(kāi)網(wǎng)站、使用APP的體驗(yàn)沒(méi)有區(qū)別。
不少企業(yè)紛紛推出了自己的智能體。國(guó)外,OpenAI推出智能體Operator,自稱(chēng)能網(wǎng)購(gòu)、會(huì)訂票,甚至?xí)霰砬榘?/p>
國(guó)內(nèi),不少AI企業(yè)也推出了智能體。智譜Agent 產(chǎn)品 AutoGLM沉思能在進(jìn)行復(fù)雜思考的同時(shí)進(jìn)行操作。字節(jié)的扣子空間、百度的通用智能體產(chǎn)品“心響”APP等相繼推出。阿里則選擇和Manus合作,通義千問(wèn)將為Manus提供堅(jiān)實(shí)的底層模型支撐。
智能體熱潮之下,“套殼”爭(zhēng)議不斷。關(guān)于套殼,可以理解為相關(guān)產(chǎn)品并不掌握核心技術(shù),而是在技術(shù)基礎(chǔ)上進(jìn)行表面改造或包裝。
拿做菜舉例,菜譜是別人的,套殼可以看作只換了菜名。如上述提及的Manus并不避諱套殼,其產(chǎn)品底層模型采用Claude和Qwen,然后接入實(shí)用工具。
AI行業(yè)中存在“套殼”鄙視鏈,Manus也因此引起了相關(guān)爭(zhēng)議。套殼背后,大家在意的是,這類(lèi)產(chǎn)品究竟是不是真正的創(chuàng)新,以及企業(yè)護(hù)城河要如何構(gòu)建。
值得關(guān)注的是,Manus爆火后,多個(gè)團(tuán)隊(duì)成功復(fù)刻Manus并開(kāi)源,有的甚至只花了3個(gè)小時(shí)。
關(guān)于“套殼”,觀(guān)點(diǎn)不一。
Manus創(chuàng)始人兼CEO肖弘表示,“套殼”可以視為一種整合和優(yōu)化資源的方式,只要能夠滿(mǎn)足用戶(hù)需求,提供良好的用戶(hù)體驗(yàn),那么“套殼”就是一種成功的產(chǎn)品策略。
OpenAI首席執(zhí)行官薩姆·奧爾特曼(Sam Altman)表示,就像當(dāng)年被嘲笑為“云服務(wù)套殼”的創(chuàng)業(yè)公司一樣,關(guān)鍵在于能否創(chuàng)造獨(dú)特的用戶(hù)價(jià)值。
MiniMax副總裁劉華則表示,底層模型一次重大迭代對(duì)產(chǎn)品帶來(lái)的優(yōu)化效果,遠(yuǎn)超在工程實(shí)現(xiàn)層面對(duì)產(chǎn)品進(jìn)行“雕花”。
周景平認(rèn)為,目前大模型只有大腦、沒(méi)有手腳,或者手腳被束縛了。要發(fā)揮大模型能力就需要解放大模型,真正實(shí)現(xiàn)“干活”,糾結(jié)“套殼”問(wèn)題沒(méi)有太多意義。
智能體被不少人看作通往AGI (通用人工智能)的必經(jīng)之路。
OpenAI列出實(shí)現(xiàn)通用人工智能的五級(jí)路線(xiàn)圖:L1是聊天機(jī)器人;L2是推理者,即像人類(lèi)一樣能夠解決問(wèn)題的AI,如OpenAI近期推出了OpenAI o1大模型;L3即智能體,不僅能思考,還可采取行動(dòng);L4是創(chuàng)新者,協(xié)助發(fā)明創(chuàng)造;L5是組織者,完成組織工作。
多方看好2025年將成為智能體落地元年。
國(guó)際數(shù)據(jù)公司(IDC)今年4月發(fā)布《中國(guó)AI Agent應(yīng)用市場(chǎng)概覽》,其中顯示2025年,AI Agent將迎來(lái)規(guī)?;涞乩顺保渫ㄟ^(guò)智能化任務(wù)處理重構(gòu)標(biāo)準(zhǔn)化作業(yè)流程的潛力備受期待。隨著技術(shù)迭代與行業(yè)滲透加深,建立AI Agent標(biāo)準(zhǔn)化體系已成為產(chǎn)業(yè)共識(shí)。
周景平亦贊同上述觀(guān)點(diǎn),在他看來(lái),當(dāng)前的Agent靠拼接工具、制定各種調(diào)用協(xié)議來(lái)讓AI顯得“像會(huì)干活”;未來(lái)的Agent則將持續(xù)進(jìn)化,AI可以直接寫(xiě)代碼、獲取反饋,在現(xiàn)實(shí)世界里真正“做事情”。
責(zé)編:郭霽瑤" guojiyao@ceweekly.cn
美編:孫珍蘭