剛剛過去的2024年,人工智能技術(shù)發(fā)展突飛猛進(jìn),目前AI技術(shù)已經(jīng)實(shí)現(xiàn)了從靜態(tài)輸出轉(zhuǎn)向跨文本、語(yǔ)音和視覺輸入的動(dòng)態(tài)實(shí)時(shí)交互。在人工智能時(shí)代已經(jīng)開啟的背景下,眾多企業(yè)和機(jī)構(gòu)參與到人工智能技術(shù)的開發(fā)和應(yīng)用推廣之中,近來,國(guó)產(chǎn)大模型DeepSeek因其表現(xiàn)被認(rèn)為可與OpenAI的大語(yǔ)言模型o1相媲美,且具有訓(xùn)練成本大幅可控的優(yōu)勢(shì),一時(shí)受到廣泛關(guān)注。開放、充分的競(jìng)爭(zhēng)是推動(dòng)人工智能技術(shù)日益進(jìn)步的重要條件,深度求索只是國(guó)內(nèi)進(jìn)行人工智能大模型研發(fā)的眾多參與者之一,本文根據(jù)公開信息收集整理了幾個(gè)國(guó)內(nèi)大模型產(chǎn)品,通過對(duì)這些模型的介紹,讓讀者了解國(guó)產(chǎn)大模型DeepSeek取得今日成績(jī)并非偶然,因?yàn)槲覈?guó)有大量的優(yōu)秀團(tuán)隊(duì)在你追我趕,人工智能技術(shù)的進(jìn)步就是依靠這些力量不斷推動(dòng)的。
無(wú)問芯穹
無(wú)問芯穹的優(yōu)勢(shì)包括其軟硬協(xié)同優(yōu)化和異構(gòu)算力整合能力。
其利用軟硬協(xié)同優(yōu)化技術(shù),實(shí)現(xiàn)了多源異構(gòu)算力的整合利用,提供了異構(gòu)算力最優(yōu)解。
其發(fā)布了全球首個(gè)千卡規(guī)模異構(gòu)芯片混訓(xùn)平臺(tái),該平臺(tái)支持包括AMD、華為昇騰、天數(shù)智芯、沐曦、摩爾線程、NVIDIA等六種異構(gòu)芯片在內(nèi)的大模型混合訓(xùn)練,算力利用率最高可達(dá)97.6%。
其Infini-AI云平臺(tái)是全球首個(gè)可進(jìn)行單任務(wù)千卡規(guī)模異構(gòu)芯片混合訓(xùn)練的平臺(tái),具備萬(wàn)卡擴(kuò)展性,支持多種大模型和異構(gòu)芯片的自由搭配和組合,已支持30多個(gè)模型和10余種計(jì)算卡,既支持單一算法與芯片的一對(duì)一連接,又支持多種模型和多種芯片的組合使用。
無(wú)問芯穹創(chuàng)始人團(tuán)隊(duì)來自清華大學(xué)。
潞晨科技
潞晨科技的創(chuàng)始人尤洋是一位“90后”教授,擁有清華大學(xué)和加州大學(xué)伯克利分校的學(xué)術(shù)背景,并在多個(gè)頂級(jí)會(huì)議上發(fā)表過論文。尤洋在高性能計(jì)算領(lǐng)域有著顯著的成就,曾被加州大學(xué)伯克利分校提名為ACM Doctoral Dissertation Award候選人。
潞晨科技自研并發(fā)布了全球首個(gè)開源類Sora架構(gòu)視頻生成模型Open-Sora,展示了其在視頻大模型方面的能力。
其專注于人工智能基礎(chǔ)設(shè)施領(lǐng)域,特別是在大模型訓(xùn)練和推理方面,所推出的訓(xùn)推一體機(jī)和大模型平臺(tái)能夠顯著降低訓(xùn)練和推理的成本,同時(shí)提升效率和速度。
其產(chǎn)品在大模型訓(xùn)練和推理方面表現(xiàn)不錯(cuò),能夠幫助企業(yè)像做PPT一樣簡(jiǎn)單快速地完成大模型開發(fā),模型訓(xùn)練/推理加速2-10倍,效率和成本亦可優(yōu)化。
零一萬(wàn)物
在LMSYS盲測(cè)榜單上,Yi-Lightning超越了OpenAI的GPT-4和Anthropic的Claude 3.5 Sonnet,排名世界第六,中國(guó)第一。
與上一代旗艦?zāi)P蚘i-Large相比,Yi-Lightning的最高生成速度提升了近四成,首包時(shí)間縮短了一倍。在保持高性能的同時(shí),推理成本也得到了進(jìn)一步的降低,每百萬(wàn)Token僅需0.99元,接近行業(yè)最低價(jià)。
Yi-Lightning采用了Mixture of Experts(MoE)混合專家模型架構(gòu),引入了混合注意力機(jī)制和動(dòng)態(tài)Top-P路由機(jī)制,提供了更高起點(diǎn)的標(biāo)準(zhǔn)化基座模型,能更快速、高效、低成本地完成定制模型訓(xùn)練。
基于動(dòng)態(tài)Top-P路由機(jī)制,Yi-Lightning能根據(jù)任務(wù)的難度動(dòng)態(tài)自動(dòng)選擇最合適的專家網(wǎng)絡(luò)組合,平衡推理成本和模型性能。
Yi-Lightning的訓(xùn)練過程采用了多階段訓(xùn)練模式,前期注重?cái)?shù)據(jù)多樣性,后期側(cè)重于更豐富、知識(shí)性更強(qiáng)的數(shù)據(jù),這種訓(xùn)練方法有助于模型吸收不同階段的知識(shí),通過調(diào)整batch size和學(xué)習(xí)率(LR)來保證訓(xùn)練速度和穩(wěn)定性。
零一萬(wàn)物推出的基于Yi-Lightning模型的AI 2.0數(shù)字人解決方案,聚焦零售和電商等場(chǎng)景,提供了動(dòng)作訓(xùn)練、表情生成、多國(guó)語(yǔ)言和情感表達(dá)、智能對(duì)話等能力,在實(shí)際應(yīng)用中取得了顯著的GMV提升。
MiniMax
MiniMax視頻大模型平臺(tái)具有以下特點(diǎn):可生成原生高分辨率、高幀率視頻;平臺(tái)支持多種風(fēng)格的視頻生成;能夠根據(jù)用戶輸入的文本提示,快速生成與之匹配的視頻內(nèi)容,實(shí)現(xiàn)文生視頻的便捷轉(zhuǎn)換。
MiniMax視頻大模型平臺(tái)的應(yīng)用場(chǎng)景廣泛,包括:為內(nèi)容創(chuàng)作者提供強(qiáng)大的創(chuàng)意支持,提高內(nèi)容創(chuàng)作的效率和質(zhì)量;快速生成多種風(fēng)格的廣告視頻,提升廣告效果;輔助影視制作團(tuán)隊(duì)快速生成預(yù)覽視頻和特效鏡頭,提高制作效率;生成教學(xué)視頻、動(dòng)畫故事等,豐富視覺體驗(yàn)。
MiniMax視頻大模型平臺(tái)的市場(chǎng)潛力主要體現(xiàn)在:高質(zhì)量視頻生成,對(duì)應(yīng)的是用戶對(duì)高質(zhì)量視頻內(nèi)容的追求;多樣化,對(duì)應(yīng)的是支持多種風(fēng)格的視頻生成,提高用戶滿意度和忠誠(chéng)度;輔助工具,對(duì)應(yīng)的是幫助用戶提高內(nèi)容創(chuàng)作的效率和質(zhì)量,降低制作成本,提高市場(chǎng)競(jìng)爭(zhēng)力。
百川智能
百川智能的大模型解決方案包括Baichuan4-Turbo和Baichuan4-Air。
Baichuan4-Turbo在文本生成、知識(shí)問答、多語(yǔ)言處理等核心能力上相比Baichuan 4有顯著提升,只需2卡4090的算力即可完成部署,且部署成本最低,非常適合企業(yè)探索復(fù)雜場(chǎng)景。
Baichuan4-Air則適用于較大規(guī)模流量的場(chǎng)景,推理成本行業(yè)最低,僅為Baichuan 4的1%,百萬(wàn)Token只需0.98元。
百川智能的一站式大模型商業(yè)化解決方案能夠幫助企業(yè)以最低成本實(shí)現(xiàn)效果最佳的私有化部署,支持企業(yè)將專有數(shù)據(jù)與百川智能自用的全鏈路優(yōu)質(zhì)訓(xùn)練數(shù)據(jù)混合,對(duì)模型進(jìn)行調(diào)優(yōu)和增強(qiáng),實(shí)現(xiàn)了行業(yè)最高的96%多場(chǎng)景可用率。
其大模型在多個(gè)權(quán)威評(píng)測(cè)基準(zhǔn)上表現(xiàn)優(yōu)異,其產(chǎn)品矩陣包括全鏈路優(yōu)質(zhì)通用訓(xùn)練數(shù)據(jù)、Baichuan4-Turbo和Baichuan4-Air兩款模型,以及全鏈路領(lǐng)域增強(qiáng)工具鏈,工具多、速度快、效果好、成本低。
百川智能通過大量適配工作解決了不同硬件的適配問題,可高效適配多種主流芯片。
月之暗面
月之暗面的核心產(chǎn)品Kimi Chat能夠處理長(zhǎng)達(dá)20萬(wàn)字的長(zhǎng)文本,這一技術(shù)優(yōu)勢(shì)使其在處理復(fù)雜文檔和長(zhǎng)文本時(shí)表現(xiàn)出色。
例如,在情況比較特殊的法律領(lǐng)域,Kimi Chat可快速處理復(fù)雜的合同條款和法律判例。
Kimi Chat亦具備無(wú)損記憶和長(zhǎng)文本處理功能,能夠在多輪對(duì)話中保持上下文一致性,提供更加智能和個(gè)性化的服務(wù)。
創(chuàng)始人楊植麟擁有清華大學(xué)計(jì)算機(jī)系本科和卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)學(xué)院的博士學(xué)位,并曾在Google Brain和FAIR等頂級(jí)公司工作,具有行業(yè)經(jīng)驗(yàn)和學(xué)術(shù)背景。
其團(tuán)隊(duì)成員大多來自Google、盤古、智源悟道等大模型領(lǐng)域的參與者。
智譜AI
智譜AI不僅提供了知識(shí)圖譜相關(guān)技術(shù)和語(yǔ)言模型等基礎(chǔ)功能,還推出了如AutoGLM這樣的自主智能體,能夠模擬人類操作手機(jī)執(zhí)行各種任務(wù),以及端到端情感語(yǔ)音模型GLM-4-Voice,能夠理解情感并實(shí)現(xiàn)高度擬人的情緒表達(dá)。
其在底層通用模型、國(guó)產(chǎn)算力芯片適配、多模態(tài)生成以及AI Agent智能體等方面取得了顯著進(jìn)展,打通了人工智能產(chǎn)業(yè)鏈中全流程的技術(shù)和商業(yè)閉環(huán)。
其比較高效的信息檢索和深度推理能力,支持超過100個(gè)網(wǎng)頁(yè)的并發(fā)搜索,能夠在數(shù)秒內(nèi)迅速閱讀、總結(jié)信息,提高了獲取信息的效率。
其深度推理能力使得它能夠通過邏輯推演,得到更為準(zhǔn)確的答案,特別是在數(shù)據(jù)分析方面,可發(fā)現(xiàn)數(shù)據(jù)的潛在趨勢(shì)并生成直觀的結(jié)果。
智譜AI的優(yōu)勢(shì)包括其智能互聯(lián)能力,以及生態(tài)系統(tǒng)的構(gòu)建等。
智譜AI是清華大學(xué)計(jì)算機(jī)系技術(shù)成果轉(zhuǎn)化的公司,CEO為張鵬,其清華校友劉德兵、王紹蘭分別任董事長(zhǎng)和總裁。
(以上不分先后)