摘要:【目的】近期ChatGPT成為人工智能領(lǐng)域的一個(gè)熱門(mén)話題,因其出色的語(yǔ)言生成技術(shù)而受到廣泛關(guān)注,能夠通過(guò)學(xué)習(xí)和理解人類(lèi)的語(yǔ)言來(lái)進(jìn)行對(duì)話。ChatGPT的橫空出世,對(duì)谷歌、百度等科技巨頭而言很焦慮,但ChatGPT的沖擊力不僅止于此。文章旨在探討它帶來(lái)了新一輪的AI技術(shù)范式革新?!痉椒ā课恼聫牧奶鞕C(jī)器人的發(fā)展說(shuō)起,詳述其背后的各項(xiàng)AI技術(shù)發(fā)展情況?!窘Y(jié)果】總結(jié)ChatGPT在未來(lái)存在的機(jī)會(huì)與挑戰(zhàn)。【結(jié)論】ChatGPT的熱潮帶來(lái)的是人們對(duì)通用人工智能發(fā)展的期望。誰(shuí)的適應(yīng)能力更強(qiáng),能快速擁抱這個(gè)趨勢(shì),就能抓住下一個(gè)時(shí)代的機(jī)會(huì)。
關(guān)鍵詞:ChatGPT;人工智能;對(duì)話機(jī)器人;AI 技術(shù)" " " " 中圖分類(lèi)號(hào):G234.2" " " " " " 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1671-0134(2023)02-025-05" " " " "DOI:10.19483/j.cnki.11-4653/n.2023.02.004
本文著錄格式:徐楨虎.從ChatGPT爆火的必然性,揭開(kāi)背后的AI技術(shù)發(fā)展現(xiàn)狀[J].中國(guó)傳媒科技,2023(02):25-29.
1.對(duì)話機(jī)器人的前世今生
1.1" "對(duì)話機(jī)器人的起源
談到對(duì)話機(jī)器人的發(fā)展歷史,必須提及著名的圖靈測(cè)試。1950年,被稱(chēng)為“人工智能之父”的數(shù)學(xué)家圖靈發(fā)表了論文《計(jì)算機(jī)器與智能》,首次提出了對(duì)人工智能的評(píng)價(jià)準(zhǔn)則,即圖靈測(cè)試。測(cè)試者和被測(cè)試者通常是一個(gè)人和一臺(tái)機(jī)器,通過(guò)一些裝置進(jìn)行交流。如果有超過(guò)30%的測(cè)試者不能區(qū)分哪些問(wèn)題是由人還是機(jī)器回答的,那么機(jī)器通過(guò)測(cè)試,證明機(jī)器具有了一定的人類(lèi)智慧。盡管目前用圖靈測(cè)試評(píng)測(cè)對(duì)話系統(tǒng)存在爭(zhēng)議,但圖靈測(cè)試的思路引領(lǐng)了幾十年間人工智能對(duì)話系統(tǒng)的發(fā)展。對(duì)話機(jī)器人是人工智能領(lǐng)域的一個(gè)重要分支,隨著人工智能技術(shù)的不斷進(jìn)步,對(duì)話機(jī)器人也經(jīng)歷了多個(gè)發(fā)展階段。
第一階段是早期的規(guī)則和模板對(duì)話機(jī)器人。在人工智能領(lǐng)域的早期,對(duì)話機(jī)器人主要是基于規(guī)則和模板進(jìn)行設(shè)計(jì)和實(shí)現(xiàn)的。這種機(jī)器人需要開(kāi)發(fā)人員手動(dòng)編寫(xiě)規(guī)則和模板,然后根據(jù)用戶(hù)的輸入進(jìn)行匹配和回答。由于規(guī)則和模板缺乏靈活性,這種機(jī)器人往往只能應(yīng)對(duì)特定場(chǎng)景的對(duì)話,無(wú)法處理更廣泛的對(duì)話場(chǎng)景。
第二階段是基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)的對(duì)話機(jī)器人。隨著機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)的對(duì)話機(jī)器人逐漸興起。這種機(jī)器人利用自然語(yǔ)言處理、機(jī)器學(xué)習(xí)等技術(shù)對(duì)用戶(hù)輸入進(jìn)行分析和處理,然后根據(jù)歷史數(shù)據(jù)和模型預(yù)測(cè)生成回答。由于可以利用歷史數(shù)據(jù)和模型進(jìn)行學(xué)習(xí)和預(yù)測(cè),這種機(jī)器人的應(yīng)對(duì)能力比基于規(guī)則和模板的機(jī)器人更強(qiáng)大。
第三階段是基于深度學(xué)習(xí)的對(duì)話機(jī)器人。近年來(lái),隨著深度學(xué)習(xí)技術(shù)的發(fā)展,基于深度學(xué)習(xí)的對(duì)話機(jī)器人逐漸崛起。這種機(jī)器人通過(guò)對(duì)大規(guī)模語(yǔ)料庫(kù)進(jìn)行學(xué)習(xí),自動(dòng)學(xué)習(xí)生成回答的模式和規(guī)律,可以處理更復(fù)雜的對(duì)話場(chǎng)景和用戶(hù)輸入情況。其中,基于Transformer架構(gòu)的預(yù)訓(xùn)練語(yǔ)言模型,如BERT、GPT等被廣泛應(yīng)用于對(duì)話機(jī)器人的設(shè)計(jì)和實(shí)現(xiàn),可以呈現(xiàn)更自然、流暢和準(zhǔn)確的對(duì)話回答。
對(duì)話機(jī)器人經(jīng)歷了從基于規(guī)則和模板到基于統(tǒng)計(jì)機(jī)器學(xué)習(xí),再到基于深度學(xué)習(xí)的演進(jìn)過(guò)程。此時(shí)期,基于機(jī)器學(xué)習(xí)來(lái)進(jìn)行自然語(yǔ)言理解的方法百花齊放。但隨著后來(lái)的發(fā)展,傳統(tǒng)的機(jī)器學(xué)習(xí)遇到了瓶頸,特別是在語(yǔ)音識(shí)別和圖像分類(lèi)方面準(zhǔn)確率無(wú)法提高。因此,在第三代的研究中,這些系統(tǒng)基本上轉(zhuǎn)向了基于大數(shù)據(jù)和深度學(xué)習(xí)的技術(shù),如Amazon Alexa、天貓精靈和Siri等助手類(lèi)機(jī)器人。它們主要采用深度學(xué)習(xí)方法,即意圖識(shí)別和語(yǔ)言理解的方式。基于深度學(xué)習(xí)技術(shù),使得端到端的對(duì)話系統(tǒng)變得可行。
1.2" "ChatGPT與傳統(tǒng)對(duì)話機(jī)器人的區(qū)別
傳統(tǒng)對(duì)話機(jī)器人通常是基于規(guī)則或模板進(jìn)行設(shè)計(jì)和實(shí)現(xiàn)的,后期加入了語(yǔ)義分析和理解等自然語(yǔ)言處理的技術(shù)。傳統(tǒng)對(duì)話機(jī)器人在與用戶(hù)進(jìn)行交互時(shí),首先通過(guò)預(yù)設(shè)的規(guī)則或模板匹配用戶(hù)的輸入,然后根據(jù)匹配結(jié)果返回相應(yīng)的回答。本質(zhì)上說(shuō)還算按照搜索的思路在做,因此生成的回答給用戶(hù)感覺(jué)會(huì)是拼湊感多。這種方法的優(yōu)點(diǎn)是實(shí)現(xiàn)簡(jiǎn)單、速度快,但缺點(diǎn)是需要大量的手動(dòng)工作來(lái)編寫(xiě)規(guī)則和模板,并且很難覆蓋所有的對(duì)話場(chǎng)景和用戶(hù)輸入。封面新聞算是國(guó)內(nèi)媒體做對(duì)話機(jī)器人最早的幾家,那時(shí)候基本也是基于這個(gè)思路。業(yè)界技術(shù)沒(méi)有突破。在應(yīng)用上也很難更進(jìn)一步。[1]
ChatGPT則是基于深度學(xué)習(xí)技術(shù)的對(duì)話生成模型。與傳統(tǒng)對(duì)話機(jī)器人不同的是,ChatGPT不需要預(yù)先編寫(xiě)規(guī)則或模板,而是通過(guò)對(duì)大規(guī)模語(yǔ)料庫(kù)的學(xué)習(xí),自動(dòng)學(xué)習(xí)生成回答的模式和規(guī)律。因此,這類(lèi)模型可以在更廣泛的對(duì)話場(chǎng)景和用戶(hù)輸入情況下提供更自然、流暢和準(zhǔn)確的回答。此外,它還可以進(jìn)行上下文理解,能根據(jù)之前的對(duì)話歷史生成更連貫的回答,因此用戶(hù)的體驗(yàn)更加良好。
因此,傳統(tǒng)對(duì)話機(jī)器人與ChatGPT的主要區(qū)別在于實(shí)現(xiàn)方式和能力范圍。傳統(tǒng)對(duì)話機(jī)器人是基于規(guī)則或模板,需要手動(dòng)編寫(xiě),適用于少量場(chǎng)景和固定對(duì)話流程;而ChatGPT是基于深度學(xué)習(xí)技術(shù),自動(dòng)學(xué)習(xí)回答的模式和規(guī)律,適用于更廣泛的對(duì)話場(chǎng)景和用戶(hù)輸入情況。
1.3" "ChatGPT全球爆火的核心原因
為什么ChatGPT能夠在全世界引起如此廣泛的關(guān)注,對(duì)普通人來(lái)說(shuō)最主要的原因是,ChatGPT在一定程度上滿(mǎn)足了很多人對(duì)影視中出現(xiàn)的AI想象。它能夠通過(guò)學(xué)習(xí)和理解人類(lèi)的語(yǔ)言來(lái)進(jìn)行對(duì)話,還能根據(jù)聊天內(nèi)容的上下文進(jìn)行互動(dòng),像人一樣來(lái)溝通交流。
可能源于人們對(duì)人工智能技術(shù)的期望往往高于實(shí)際能力,以往出現(xiàn)的那些人機(jī)交互類(lèi)型的AI產(chǎn)品,比如聊天機(jī)器人、自動(dòng)駕駛系統(tǒng)、智能家居設(shè)備,由于表現(xiàn)不佳、結(jié)果不準(zhǔn)確或不可靠,常常被用戶(hù)稱(chēng)為“人工智障”。而ChatGPT看起來(lái)像是真的有了自己的思想,就像是流浪地球2中的MOSS系統(tǒng)。用戶(hù)問(wèn)什么它都可以給出相對(duì)滿(mǎn)意的答案。
2.從技術(shù)層面如何解讀ChatGPT
2.1" "對(duì)AI研究發(fā)展的意義
作為一個(gè)大型的自然語(yǔ)言處理(NLP)模型,ChatGPT可以在許多方面對(duì)人工智能研究的發(fā)展產(chǎn)生影響。主要有以下三個(gè)方面。
2.1.1" "推動(dòng)自然語(yǔ)言處理的發(fā)展
ChatGPT是自然語(yǔ)言處理領(lǐng)域的一項(xiàng)重要技術(shù),可以幫助處理自然語(yǔ)言文本中的語(yǔ)義、上下文等方面的問(wèn)題。在未來(lái),這些技術(shù)有望進(jìn)一步發(fā)展,使得機(jī)器能夠更好地理解自然語(yǔ)言,并能夠進(jìn)行更加復(fù)雜的任務(wù),如自然語(yǔ)言推理、文本生成等。
2.1.2" "推動(dòng)大模型在深度學(xué)習(xí)的應(yīng)用
ChatGPT的背后是基于Transformer的模型結(jié)構(gòu),它是深度學(xué)習(xí)領(lǐng)域的一個(gè)重要技術(shù)。ChatGPT的成功證明了大模型在自然語(yǔ)言處理領(lǐng)域的有效性,也為研究者提供了其他人工智能領(lǐng)域新的思路,從而推動(dòng)了機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的發(fā)展。
2.1.3" "提高人機(jī)交互的效率
ChatGPT可以用于開(kāi)發(fā)更高效的對(duì)話系統(tǒng),從而改善人機(jī)交互的體驗(yàn)。例如,ChatGPT可以幫助機(jī)器人或虛擬助手更好地理解和回應(yīng)人類(lèi)的語(yǔ)言,從而更準(zhǔn)確地滿(mǎn)足用戶(hù)需求。
所以,當(dāng)ChatGPT出現(xiàn)時(shí),內(nèi)行的震驚程度比外行更高,因?yàn)橹肋@樣的提升是非常困難的。AI算法科研領(lǐng)域正經(jīng)歷算法、開(kāi)源代碼、工程、算力的增長(zhǎng)飛輪,ChatGPT所代表的大模型的創(chuàng)建和學(xué)習(xí)能力會(huì)成為新的流行方向。而且可以預(yù)見(jiàn),更多這類(lèi)大模型會(huì)雨后春筍一般快速出現(xiàn)??偟膩?lái)說(shuō),ChatGPT代表了人工智能領(lǐng)域中的重要突破,通過(guò)不斷地改進(jìn)和應(yīng)用,ChatGPT將有望為人工智能研究的發(fā)展帶來(lái)更多的貢獻(xiàn)。
2.2" "技術(shù)層面的革新
ChatGPT帶來(lái)了新一輪的AI技術(shù)范式革新,意味著業(yè)內(nèi)期望已久的通用人工智能應(yīng)用開(kāi)始出現(xiàn)。ChatGPT的橫空出世,使谷歌、百度等科技巨頭非常焦慮,但它的沖擊力不僅止于此。它真正讓所有人都感到吃驚的是背后大語(yǔ)言模型(LLM)的創(chuàng)建和學(xué)習(xí)能力。
很多人對(duì)ChatGPT的了解還僅僅限于它是一個(gè)更智能的聊天機(jī)器人。但實(shí)際上其對(duì)技術(shù)層面的革新重點(diǎn)在于“GPT”而不是“Chat”。目前最流行的Transformer核心架構(gòu)大語(yǔ)言模型包括GPT和BERT兩種,在說(shuō)大模型之前先了解一下Transformer架構(gòu)。它與RNN(Recurrent Neural Network)架構(gòu)是在自然語(yǔ)言處理領(lǐng)域中經(jīng)常用于處理序列數(shù)據(jù)的兩種架構(gòu)。但是Transformer支持千億級(jí)參數(shù)的超大規(guī)模數(shù)據(jù)量,RNN則承載不了這么大的數(shù)據(jù)量。RNN中的每個(gè)時(shí)間步都需要等待前一個(gè)時(shí)間步的計(jì)算結(jié)果,因此模型的并行性較差。Transformer可以并行計(jì)算,通過(guò)自注意力機(jī)制來(lái)處理序列數(shù)據(jù),可以同時(shí)處理整個(gè)序列。
BERT和GPT都是非常強(qiáng)大的大語(yǔ)言模型,在不同的任務(wù)和場(chǎng)景中都有對(duì)應(yīng)很好的表現(xiàn)。BERT是基于轉(zhuǎn)移學(xué)習(xí)的思想開(kāi)發(fā)的,主要用于解決語(yǔ)言理解相關(guān)的任務(wù),如問(wèn)答、語(yǔ)義關(guān)系抽取等。GPT則是基于生成式預(yù)訓(xùn)練的思想開(kāi)發(fā)的,主要用于解決語(yǔ)言生成相關(guān)的任務(wù),如文本生成、機(jī)器翻譯等。在使用場(chǎng)景上,BERT更適用于在已有標(biāo)注數(shù)據(jù)上微調(diào)的場(chǎng)景,GPT更適用于在大量未標(biāo)注數(shù)據(jù)上預(yù)訓(xùn)練的場(chǎng)景。簡(jiǎn)言之,GPT是做下文預(yù)測(cè),BERT是做整句預(yù)測(cè)。
然而OpenAI的GPT系列模型并沒(méi)有開(kāi)源?;谖谋绢A(yù)訓(xùn)練的GPT前三代模型都是采用的以Transformer為核心結(jié)構(gòu)的模型,不同的是模型的層數(shù)和詞向量長(zhǎng)度等超參。GPT-3被提出時(shí),除了它遠(yuǎn)超GPT-2的效果,引起更多討論的是它1750億的參數(shù)量。GPT-3的訓(xùn)練使用了情境學(xué)習(xí),它是元學(xué)習(xí)的一種,其核心思想在于通過(guò)少量的數(shù)據(jù)尋找一個(gè)合適的初始化范圍,使得模型能夠在有限的數(shù)據(jù)集上快速擬合,并獲得不錯(cuò)的效果。人類(lèi)喜歡的不僅包括生成內(nèi)容的流暢性和語(yǔ)法的正確性,還包括生成內(nèi)容的有用性、真實(shí)性。強(qiáng)化學(xué)習(xí)的思路是通過(guò)對(duì)獎(jiǎng)勵(lì)的大量采樣來(lái)擬合損失函數(shù),從而實(shí)現(xiàn)模型的訓(xùn)練。同樣人類(lèi)反饋也是不可導(dǎo)的,那么我們也可以將人工反饋?zhàn)鳛閺?qiáng)化學(xué)習(xí)的獎(jiǎng)勵(lì),基于人工反饋的強(qiáng)化學(xué)習(xí)便應(yīng)運(yùn)而生。[2]如果把對(duì)話機(jī)器人的優(yōu)化比喻成一個(gè)人在進(jìn)行知識(shí)學(xué)習(xí)的話,傳統(tǒng)對(duì)話機(jī)器人以前是在幼兒園階段就學(xué)習(xí)某類(lèi)專(zhuān)科知識(shí)就進(jìn)行訓(xùn)練,而ChatGPT是先學(xué)習(xí)完所有大學(xué)知識(shí),再進(jìn)行訓(xùn)練。
在ChatGPT推出之前,國(guó)內(nèi)外已有不少大模型。但相比其他大模型,ChatGPT在AI的技術(shù)路線和訓(xùn)練方式上的變革,帶來(lái)了業(yè)界意料之外的突破。包括有一個(gè)非常強(qiáng)大的技術(shù)底座,即InstructGPT模型,同時(shí)在引入的強(qiáng)化學(xué)習(xí)機(jī)制上取得了突破,并且在數(shù)據(jù)質(zhì)量和多樣性上也非常講究。光是基礎(chǔ)模型本身的差距,雖然國(guó)內(nèi)外也訓(xùn)練了很多萬(wàn)億模型或者是幾千億的模型,但訓(xùn)練的充分程度是遠(yuǎn)遠(yuǎn)不夠的。有人用同樣的問(wèn)題向某大型AI廠商的大模型和ChatGPT發(fā)問(wèn),ChatGPT從回答的邏輯性和完整度上都遠(yuǎn)超對(duì)手。
2.3" "數(shù)據(jù)集的構(gòu)成
除了大模型的加持,ChatGPT的對(duì)話表現(xiàn)很大程度上取決于它所使用的數(shù)據(jù)集。數(shù)據(jù)集提供了模型訓(xùn)練和評(píng)估所需的輸入和輸出數(shù)據(jù)。在訓(xùn)練ChatGPT模型時(shí),需要大量的文本數(shù)據(jù)來(lái)訓(xùn)練模型,使其能夠?qū)W習(xí)語(yǔ)言模式和規(guī)律,從而具有語(yǔ)義理解和生成能力。訓(xùn)練數(shù)據(jù)集的質(zhì)量和數(shù)量對(duì)模型的性能和表現(xiàn)至關(guān)重要。通常,訓(xùn)練數(shù)據(jù)集越大、多樣化和質(zhì)量越高,模型的性能和泛化能力就越好。
因此,數(shù)據(jù)集對(duì)ChatGPT模型的性能和表現(xiàn)具有非常重要的影響。一個(gè)好的數(shù)據(jù)集應(yīng)該具有充分的數(shù)據(jù)量、多樣化的文本類(lèi)型和質(zhì)量高的數(shù)據(jù)標(biāo)注。截至2023年2月,絕大部分用戶(hù)能接觸到的ChatGPT是采用的GPT-3.5模型,但目前公開(kāi)資料能找到關(guān)于其模型數(shù)據(jù)集構(gòu)成的信息主要來(lái)自O(shè)penAI于2020年發(fā)布的GPT-3模型論文。其論文闡明了所用訓(xùn)練數(shù)據(jù)集的token數(shù)量,但訓(xùn)練數(shù)據(jù)集的內(nèi)容和大小尚不清楚。該數(shù)據(jù)集包含了多種來(lái)源的文本數(shù)據(jù),如維基百科、新聞、書(shū)籍、社交媒體等。[3]這些數(shù)據(jù)集經(jīng)過(guò)處理和清洗,以便用于預(yù)訓(xùn)練模型。數(shù)據(jù)集針對(duì)不同的應(yīng)用場(chǎng)景和目的而設(shè)計(jì),主要包括:
維基百科(Wikipedia):是一個(gè)免費(fèi)的多語(yǔ)言協(xié)作在線百科全書(shū)。維基百科中的文本很有價(jià)值,因?yàn)樗粐?yán)格引用,以說(shuō)明性文字形式寫(xiě)成,并且跨越多種語(yǔ)言和領(lǐng)域。一般來(lái)說(shuō),重點(diǎn)研究實(shí)驗(yàn)室會(huì)首先選取它的純英文過(guò)濾版作為數(shù)據(jù)集。
書(shū)籍(Books):由小說(shuō)和非小說(shuō)兩大類(lèi)組成,主要用于訓(xùn)練模型的故事講述能力和反應(yīng)能力,數(shù)據(jù)集包括Project Gutenberg和Smashwords等。
雜志期刊(Journals):預(yù)印本和已發(fā)表期刊中的論文為數(shù)據(jù)集提供了堅(jiān)實(shí)而嚴(yán)謹(jǐn)?shù)幕A(chǔ),因?yàn)閷W(xué)術(shù)寫(xiě)作通常來(lái)說(shuō)更有條理更細(xì)致。
Reddit鏈接:WebText是一個(gè)大型數(shù)據(jù)集,它的數(shù)據(jù)是從社交媒體平臺(tái)Reddit所有出站鏈接網(wǎng)絡(luò)中爬取的,每個(gè)鏈接至少有3個(gè)贊,代表了流行內(nèi)容的風(fēng)向標(biāo),對(duì)輸出優(yōu)質(zhì)鏈接和后續(xù)文本數(shù)據(jù)具有指導(dǎo)作用。
Common Crawl(CC):是2008年至今的一個(gè)網(wǎng)站抓取的大型數(shù)據(jù)集,數(shù)據(jù)包含原始網(wǎng)頁(yè)、元數(shù)據(jù)和文本提取,它的文本來(lái)自不同語(yǔ)言、不同領(lǐng)域。重點(diǎn)研究實(shí)驗(yàn)室一般會(huì)首先選取它的純英文過(guò)濾版(C4)作為數(shù)據(jù)集。
其他數(shù)據(jù)集(Other):不同于上述類(lèi)別,這類(lèi)數(shù)據(jù)集由GitHub等代碼數(shù)據(jù)集、StackExchange 等對(duì)話論壇和視頻字幕數(shù)據(jù)集組成。
圖1" " GPT-3數(shù)據(jù)集總結(jié)[3]
國(guó)內(nèi)大型互聯(lián)網(wǎng)公司沒(méi)有率先做出類(lèi)似ChatGPT的應(yīng)用,除了OpenAI相關(guān)技術(shù)領(lǐng)先的原因,國(guó)內(nèi)做AI應(yīng)用拿不到足夠多領(lǐng)域的數(shù)據(jù),這也是另外一個(gè)重要原因。國(guó)外的絕大部分應(yīng)用都有網(wǎng)頁(yè)版數(shù)據(jù)可以采集。國(guó)內(nèi)互聯(lián)網(wǎng)內(nèi)卷嚴(yán)重的環(huán)境導(dǎo)致了大型App應(yīng)用的數(shù)據(jù)孤島。
但ChatGPT在中文的識(shí)別效果也很不錯(cuò),這是因?yàn)樵谟?xùn)練ChatGPT的大型語(yǔ)言數(shù)據(jù)集中,也包含了大量的中文文本。這些文本包括新聞、社交媒體、百科全書(shū)、小說(shuō)等,經(jīng)過(guò)處理和清洗后,被用于訓(xùn)練ChatGPT模型。因此,ChatGPT在處理中文文本時(shí),可以利用這些訓(xùn)練數(shù)據(jù)中的中文語(yǔ)言模式和規(guī)律,從而獲得對(duì)中文的語(yǔ)義理解和生成能力。
此外,ChatGPT采用了預(yù)訓(xùn)練—微調(diào)的方法,即在大規(guī)模數(shù)據(jù)集上預(yù)先訓(xùn)練語(yǔ)言模型,然后通過(guò)微調(diào)來(lái)適應(yīng)特定的任務(wù)和領(lǐng)域。在微調(diào)過(guò)程中,ChatGPT可以通過(guò)訓(xùn)練樣本來(lái)進(jìn)一步調(diào)整模型參數(shù),以適應(yīng)特定的語(yǔ)言和任務(wù),包括中文語(yǔ)言和任務(wù)。這使得ChatGPT能夠更好地適應(yīng)中文語(yǔ)言和語(yǔ)境,從而獲得更好的中文語(yǔ)義理解和生成能力,這得益于在訓(xùn)練數(shù)據(jù)和模型設(shè)計(jì)上的綜合考慮和優(yōu)化。
2.4" "ChatGPT能否理解邏輯本身
ChatGPT可以識(shí)別并使用邏輯語(yǔ)言的結(jié)構(gòu)和形式,但其理解能力基于訓(xùn)練數(shù)據(jù)和算法,而不是真正的“理解”或類(lèi)似于人類(lèi)的推理??梢愿鶕?jù)給定的邏輯語(yǔ)句或問(wèn)題進(jìn)行計(jì)算和推理,但推理可能受到限制或出現(xiàn)偏差。此外,邏輯的解釋和使用也可能因特定的上下文和語(yǔ)境而發(fā)生變化,這對(duì)ChatGPT說(shuō)來(lái)可能會(huì)帶來(lái)一定的挑戰(zhàn)和限制。因此,雖然可以使用邏輯語(yǔ)言和形式,但能力和表現(xiàn)仍然受到許多因素的影響,并不能與人類(lèi)的邏輯思維能力完全媲美。另外,有時(shí)候用戶(hù)會(huì)在主觀上覺(jué)得答案結(jié)果不夠準(zhǔn)確,可能更主要的原因在于問(wèn)題描述不夠準(zhǔn)確,對(duì)它來(lái)說(shuō)只能是當(dāng)前語(yǔ)境下的最優(yōu)答案。
2.5" "目前存在的問(wèn)題
得益于ChatGPT背后最先進(jìn)的GPT3.5大模型,它的絕大部分回答在數(shù)據(jù)集時(shí)間范圍內(nèi)都是準(zhǔn)確的,因此普通用戶(hù)并不知道它的運(yùn)作機(jī)制,會(huì)傾向于認(rèn)為它無(wú)所不知。ChatGPT可能會(huì)以一種非常自信的口吻來(lái)編造事實(shí),這是一個(gè)大問(wèn)題。
目前主要有三類(lèi)問(wèn)題:
(1)結(jié)果不穩(wěn)定。這會(huì)導(dǎo)致對(duì)結(jié)果準(zhǔn)確性要求高的業(yè)務(wù)無(wú)法直接應(yīng)用,需要人工審核,更多是作為輔助應(yīng)用或應(yīng)用于娛樂(lè)性強(qiáng)的場(chǎng)景。
(2)推理能力有限。例如詢(xún)問(wèn)現(xiàn)在的美國(guó)總統(tǒng)是誰(shuí),會(huì)回答奧巴馬或特朗普,但又能回答出拜登是第46任總統(tǒng)??梢园l(fā)現(xiàn)模型中事實(shí)存在,但它無(wú)法推理出正確答案。
(3)知識(shí)更新實(shí)時(shí)性不夠。一方面是因?yàn)槟壳罢麄€(gè)模型的二次訓(xùn)練成本很高,另一方面知識(shí)更新也會(huì)帶來(lái)知識(shí)遺忘。
但對(duì)這些問(wèn)題不必過(guò)于擔(dān)憂,ChatGPT背后有著海量的資料庫(kù)和龐大的算力做支撐,隨著它與搜索引擎的結(jié)合越來(lái)越高,對(duì)知識(shí)更新的實(shí)時(shí)性問(wèn)題肯定可以得到解決。以后人們甚至可以把ChatGPT當(dāng)成一個(gè)交互式的搜索引擎來(lái)用。
總而言之,ChatGPT內(nèi)容信源的可靠性依然是一個(gè)大問(wèn)題。除此之外,目前最核心的問(wèn)題還是,它會(huì)以一種非常自信的口吻來(lái)編造事實(shí)。因此,需要引入不同的行業(yè)專(zhuān)家。比如哲學(xué)、社會(huì)科學(xué)、藝術(shù)和人文學(xué)科的人士來(lái)參與管理ChatGPT的使用。所以,AI公司有責(zé)任讓公眾意識(shí)到這些問(wèn)題,同時(shí),監(jiān)管機(jī)構(gòu)和政府也需要對(duì)這個(gè)系統(tǒng)進(jìn)行更多的重視。
3.ChatGPT的機(jī)會(huì)與挑戰(zhàn)
3.1" "對(duì)傳媒領(lǐng)域帶來(lái)的影響
現(xiàn)在的ChatGPT能力非常全面,能完成創(chuàng)意生成、視頻腳本、活動(dòng)文案、文章寫(xiě)作、代碼編寫(xiě)等各種類(lèi)型的任務(wù)。但其實(shí)它還是更適合應(yīng)用在小說(shuō)寫(xiě)作、劇本創(chuàng)作、活動(dòng)策劃、數(shù)據(jù)分析等需要解放生產(chǎn)力和提升效率的行業(yè)。但對(duì)某些領(lǐng)域來(lái)說(shuō)ChatGPT的應(yīng)用會(huì)引起巨大爭(zhēng)議,甚至?xí)獾綐I(yè)界的“封殺令”。比如說(shuō)學(xué)術(shù)領(lǐng)域,ChatGPT即使不需要理解專(zhuān)業(yè)的知識(shí),它也能生成一篇專(zhuān)業(yè)性更高的內(nèi)容,并獲得專(zhuān)家認(rèn)可。學(xué)術(shù)倫理的問(wèn)題需要得到更多的監(jiān)管。
就在兩三年以前,AI在傳媒行業(yè)的作用更多是輔助內(nèi)容生產(chǎn),媒體的內(nèi)容要有自己的價(jià)值觀。但現(xiàn)在AI技術(shù)的發(fā)展太快,數(shù)字人+ChatGPT+多模態(tài)內(nèi)容生成,已經(jīng)能夠替代主持人、記者、編輯的很多工作。從文章寫(xiě)作、新聞獲取、方案制定、人機(jī)互動(dòng),ChatGPT都能在數(shù)秒內(nèi)完成,未來(lái)傳媒行業(yè)的人機(jī)高效協(xié)作將會(huì)成為更加常見(jiàn)的場(chǎng)景。
從積極的方向來(lái)說(shuō),ChatGPT也可以促進(jìn)媒體產(chǎn)業(yè)的創(chuàng)新和進(jìn)步,提高媒體內(nèi)容的產(chǎn)量和質(zhì)量,并為用戶(hù)提供更好的體驗(yàn)和服務(wù)。包括為媒體公司提供新的技術(shù)和工具,改進(jìn)內(nèi)容的質(zhì)量和生產(chǎn)效率,為用戶(hù)提供更好的體驗(yàn)。
3.2" "應(yīng)該如何與它共存
對(duì)普通用戶(hù)來(lái)說(shuō),ChatGPT目前還有很多問(wèn)題。但只要用過(guò)的ChatGPT的人,即使一小部分人還不認(rèn)可它是真正的AI,但沒(méi)人認(rèn)為它和之前那些“人工智障”的聊天機(jī)器人是一樣的。直觀來(lái)說(shuō),人們會(huì)認(rèn)為是AI的智力提升了,但實(shí)際上ChatGPT背后的GPT3.5大模型,更多的提升在于“用人類(lèi)所喜歡的方式回答”。
人類(lèi)應(yīng)該積極地與ChatGPT共存合作,發(fā)揮人工智能技術(shù)的優(yōu)勢(shì),同時(shí)也需要關(guān)注其潛在的風(fēng)險(xiǎn)和挑戰(zhàn),加強(qiáng)人工智能技術(shù)的監(jiān)管和管理,以及加強(qiáng)對(duì)人工智能技術(shù)的教育和培訓(xùn)。
人類(lèi)和ChatGPT應(yīng)該進(jìn)行合作和互補(bǔ),相互協(xié)作,共同解決一些現(xiàn)實(shí)問(wèn)題和挑戰(zhàn)。ChatGPT可以為人類(lèi)提供一些基礎(chǔ)的服務(wù)和支持,例如自動(dòng)化生產(chǎn)、數(shù)據(jù)分析、預(yù)測(cè)和推薦等。人類(lèi)可以利用ChatGPT的技術(shù)和工具,進(jìn)行一些更高級(jí)別的創(chuàng)新和創(chuàng)造。
3.3" "未來(lái)展望
ChatGPT的熱潮帶來(lái)的是人們對(duì)通用人工智能發(fā)展的期望。大企業(yè)不一定能夠獲得最大的紅利,但這是創(chuàng)新型小企業(yè)一個(gè)千載難逢的機(jī)遇。如果大企業(yè)不進(jìn)行二次創(chuàng)業(yè),那么就會(huì)失去自己的優(yōu)勢(shì)走下坡路。總體來(lái)說(shuō),小企業(yè)的機(jī)會(huì)可能更多在應(yīng)用層。大企業(yè)更多是要在基礎(chǔ)層和中間層開(kāi)始創(chuàng)新,不然肯定會(huì)受到巨大的挑戰(zhàn)。
對(duì)商業(yè)圈來(lái)說(shuō),有可能帶來(lái)新一輪技術(shù)革新和商業(yè)模式革新,最近開(kāi)始流行一句話:“所有行業(yè)都值得用AI重新再做一遍”。不斷挖掘新的商業(yè)應(yīng)用場(chǎng)景,讓近幾年陷入應(yīng)用瓶頸的AI領(lǐng)域重新煥發(fā)活力,相信未來(lái)幾年我們會(huì)看到一大批人機(jī)交互類(lèi)型的AI應(yīng)用百花齊放。例如,微軟已經(jīng)開(kāi)始在嘗試用ChatGPT取代財(cái)報(bào)分析師,也許一年以后就不再需要財(cái)報(bào)分析人員,AI可以直接分析海量的公司財(cái)報(bào)數(shù)據(jù),形成關(guān)鍵信息與用戶(hù)進(jìn)行多輪互動(dòng)。可能每個(gè)人都無(wú)法完全置身事外。誰(shuí)的適應(yīng)能力更強(qiáng),能快速擁抱這個(gè)趨勢(shì),就能抓住下一個(gè)時(shí)代的機(jī)會(huì)。
[1]徐楨虎. 媒體智能機(jī)器人IP的打造路徑及應(yīng)用探究[J]. 中國(guó)傳媒科技,2022(12):17-20.
[2] ChatGPT/Instruct GPT詳解[EB/OL]. https ://zhuanlan ." " " " "zhihu.com/p/590311003.2022-12-08/2023-02-25.
[3]ChatGPT數(shù)據(jù)集之謎[EB/OL]. https://mp.weixin.qq.com/s/LLAs45yJFbvfZRYIbcgU6A.2023-02-17/2023-02-25.
作者簡(jiǎn)介:徐楨虎 (1986-),男,四川達(dá)州,封面?zhèn)髅娇萍几笨偨?jīng)理兼首席數(shù)據(jù)官,研究方向?yàn)槊襟w人工智能與大數(shù)據(jù)應(yīng)用。
(責(zé)任編輯:陳旭管)