大語(yǔ)言模型(以下簡(jiǎn)稱“大模型”a)是當(dāng)前生成式人工智能最主流的技術(shù),具有強(qiáng)大的生成、遷移與交互能力。簡(jiǎn)單地說(shuō),該技術(shù)通過(guò)訓(xùn)練模型閱讀海量文本,使其在語(yǔ)言表達(dá)、即時(shí)對(duì)話、任務(wù)規(guī)劃、邏輯推衍等許多方面具備了與人類媲美的能力。目前,學(xué)界業(yè)界主要圍繞3 個(gè)方面開(kāi)展大模型的研究:(1)傾盡所有算力,通過(guò)提高數(shù)據(jù)質(zhì)量、優(yōu)化模型架構(gòu)和訓(xùn)練策略等各種手段來(lái)研發(fā)基礎(chǔ)、通用大模型,提升模型能力;(2)深入探索大模型的機(jī)理,拓展其性能,將最初僅能處理文本的模型,推向兼具文本、語(yǔ)音、圖片、視頻處理能力的多模態(tài)大模型;(3)開(kāi)發(fā)專用或領(lǐng)域大模型、多智能體框架,以滿足特定目標(biāo),拓展其應(yīng)用場(chǎng)景。這些研究為大模型應(yīng)用奠定了物質(zhì)基礎(chǔ),為大模型的使用者提供了模型選擇空間。
大模型的評(píng)測(cè)研究是伴隨其研發(fā)同時(shí)開(kāi)展的。為了探究大模型各種能力的天花板,對(duì)比不同大模型對(duì)特定任務(wù)的適配性,引導(dǎo)模型不斷地改進(jìn)優(yōu)化,滿足應(yīng)用需求,研究者開(kāi)發(fā)了公共的評(píng)測(cè)平臺(tái),設(shè)計(jì)評(píng)測(cè)任務(wù)和測(cè)試試題,從語(yǔ)法、語(yǔ)義、語(yǔ)用、邏輯、知識(shí)、計(jì)算、推理、規(guī)劃等各個(gè)維度開(kāi)展大模型的能力評(píng)測(cè)。在所有評(píng)測(cè)任務(wù)中,語(yǔ)言能力的測(cè)試是其中最重要、最基礎(chǔ)的內(nèi)容。深入挖掘語(yǔ)言研究成果,精準(zhǔn)地設(shè)計(jì)探測(cè)、激發(fā)大模型深層語(yǔ)言能力的測(cè)試試題,是利用語(yǔ)言學(xué)研究成果引導(dǎo)大模型技術(shù)推進(jìn)的一種方式,同時(shí)也向語(yǔ)言學(xué)研究提出了挑戰(zhàn)。
大模型超強(qiáng)的智能表現(xiàn),不但大跨步地推進(jìn)了人工智能的發(fā)展,改變了其研究范式,同時(shí)也深刻影響著社會(huì)生活,為各個(gè)領(lǐng)域的研究帶來(lái)新的契機(jī)。就語(yǔ)言研究領(lǐng)域而言,大模型為語(yǔ)言研究帶來(lái)了新的研究對(duì)象和工具。首先,大模型是通過(guò)海量閱讀、自注意力機(jī)制、強(qiáng)大的神經(jīng)網(wǎng)絡(luò)、反饋學(xué)習(xí)等技術(shù)學(xué)到了與人類比肩的語(yǔ)言能力,這些技術(shù)與人類獲得語(yǔ)言能力的過(guò)程是否一樣?與已經(jīng)存在的語(yǔ)言學(xué)理論是否一致?其次,大模型使自然語(yǔ)言不再是人類獨(dú)有獨(dú)用的產(chǎn)物與工具,機(jī)器生成的與人類產(chǎn)出的語(yǔ)言及其內(nèi)容各自有什么特點(diǎn)?第三,大模型作為分析語(yǔ)言數(shù)據(jù)的強(qiáng)大工具,促進(jìn)了大規(guī)模、深層次的語(yǔ)料加工,既可以輔助語(yǔ)言現(xiàn)象的系統(tǒng)描寫(xiě)和語(yǔ)言規(guī)律的挖掘,也可以為模型訓(xùn)練提供高質(zhì)量的數(shù)據(jù)。因而,大模型與語(yǔ)言研究是雙向賦能、融合發(fā)展。
將大語(yǔ)言模型與語(yǔ)言研究相結(jié)合,首先要了解模型的“能”與“不能”。前期研究表明,大模型擅長(zhǎng)解決答問(wèn)、閑聊(含角色扮演)、翻譯、文本摘要、改寫(xiě)、創(chuàng)作、信息抽取、代碼分析與生成等類別的任務(wù),但在以下能力上存在缺陷:(1)大模型往往生成流暢但不準(zhǔn)確的內(nèi)容,即產(chǎn)生“幻覺(jué)”現(xiàn)象,表現(xiàn)為語(yǔ)義理解、邏輯關(guān)聯(lián)、基本常識(shí)、領(lǐng)域知識(shí)等方面的錯(cuò)誤。由于大模型的工作機(jī)制目前仍處于“黑箱”狀態(tài),解決幻覺(jué)問(wèn)題還需要時(shí)日。(2)由于預(yù)訓(xùn)練模型的成本極高、微調(diào)數(shù)據(jù)規(guī)模有限,對(duì)于時(shí)效性、專業(yè)性較強(qiáng)的問(wèn)題,大模型幾乎沒(méi)有能力處理。(3)大模型強(qiáng)依賴于預(yù)訓(xùn)練數(shù)據(jù)中的先驗(yàn)知識(shí),生成文本極易受其影響,例如在修正語(yǔ)法錯(cuò)誤時(shí),模型往往存在過(guò)度修改潤(rùn)色的情況。(4)模型目前還無(wú)法準(zhǔn)確理解、區(qū)分不同數(shù)字的含義。因而人們以試探、引導(dǎo)的方式應(yīng)用大模型輔助人類提高效率。
利用大模型開(kāi)展語(yǔ)言研究,有3 種訪問(wèn)大模型的方式:(1)通過(guò)網(wǎng)頁(yè)或者APP 對(duì)話;如文心一言、ChatGPT、智譜清言等;(2)通過(guò)API 調(diào)用,如GPT4、Qwen-turbo,智譜AI 等都提供了API 接口;(3)使用開(kāi)源模型,如Llama 系列、Qwen 系列、ChatGLM 系列等,還可對(duì)它們進(jìn)行微調(diào)或二次開(kāi)發(fā)。無(wú)論哪種方式,其本質(zhì)主要是利用大模型強(qiáng)大的上下文學(xué)習(xí)能力和遷移能力,引導(dǎo)其適應(yīng)具體的語(yǔ)言研究任務(wù)。因而先測(cè)試模型對(duì)應(yīng)的能力,然后有目標(biāo)地開(kāi)展引導(dǎo),誘發(fā)出大模型潛在的知識(shí)和能力,已經(jīng)成為大模型應(yīng)用的一種主要模式。
“提示”是當(dāng)前最通用、最便捷的引導(dǎo)大模型的方式?!疤崾尽庇胁话蝿?wù)樣例(零樣本),包含少量樣例(少樣本),以及附加額外知識(shí)等形式,而提示詞的設(shè)計(jì)直接影響對(duì)模型引導(dǎo)的效果。設(shè)計(jì)提示詞的常用策略包括:
第一,為模型設(shè)定角色,如“擅長(zhǎng)分析語(yǔ)言現(xiàn)象和總結(jié)規(guī)律的語(yǔ)言學(xué)家”“經(jīng)驗(yàn)豐富的國(guó)際中文教師”等。
第二,給出清晰具體的任務(wù)說(shuō)明和解決方案,包括:(1)提供必要的背景信息和具體的任務(wù)說(shuō)明;(2)給出問(wèn)題和答案示例;(3)針對(duì)復(fù)雜任務(wù)設(shè)定分步驟解決思路;(4)提供外部知識(shí)庫(kù)或工具檢索等必要的專業(yè)知識(shí)作為參考;(5)設(shè)置限制和要求;等等。
第三,在提示詞的格式方面,建議:(1)用換行符和###、\"\"\" 等分隔符來(lái)區(qū)分提示的不同部分(如指令、背景信息、輸入數(shù)據(jù)等),讓模型更容易區(qū)分和理解;(2)可要求模型以特定格式輸出,如列表、JSON 等,以便在批量調(diào)用時(shí)獲得結(jié)構(gòu)化、易解析的結(jié)果。
第四,通過(guò)API 調(diào)用模型或使用開(kāi)源模型時(shí),宜參考文檔設(shè)置合理的參數(shù)值,例如,當(dāng)追求模型輸出的一致性和穩(wěn)定性時(shí),可將temperature 參數(shù)設(shè)為接近0 的數(shù)值。
綜上,利用大模型開(kāi)展語(yǔ)言研究時(shí),人的判斷、決策與引導(dǎo)扮演著極為關(guān)鍵的角色。人工智能時(shí)代的語(yǔ)言研究亟需深入診斷模型機(jī)理,充分挖掘模型潛力,使得大語(yǔ)言模型和語(yǔ)言研究實(shí)現(xiàn)雙向賦能。在這一探索過(guò)程中,或會(huì)引發(fā)諸多值得探討的新問(wèn)題,例如,語(yǔ)言學(xué)知識(shí)如何賦能語(yǔ)言智能技術(shù)發(fā)展,實(shí)現(xiàn)知識(shí)與技術(shù)的雙向迭代?如何高效地為模型注入專門(mén)領(lǐng)域知識(shí),以減輕幻覺(jué)現(xiàn)象,并促進(jìn)解決專業(yè)性問(wèn)題?人類社會(huì)存在高度多樣性和復(fù)雜性,如何探究模型與人類價(jià)值觀對(duì)齊的方法論?多模態(tài)大模型與多智能體等技術(shù)的發(fā)展又會(huì)為語(yǔ)言研究帶來(lái)哪些新的挑戰(zhàn)和機(jī)遇?為此,《語(yǔ)言戰(zhàn)略研究》期刊專門(mén)組織了“大語(yǔ)言模型”專題,邀請(qǐng)語(yǔ)言學(xué)與計(jì)算機(jī)領(lǐng)域的研究者們共同探討相關(guān)問(wèn)題,圍繞領(lǐng)域模型的研發(fā)、模型的特定語(yǔ)言能力測(cè)試任務(wù)設(shè)計(jì)與分析,利用大模型輔助具體語(yǔ)言問(wèn)題的研究,交流他們的研究成果;同時(shí),就語(yǔ)言知識(shí)的研究與利用、語(yǔ)言數(shù)據(jù)與人類知識(shí)的相互融合來(lái)為大模型提供資源,大模型及智能體對(duì)研究和應(yīng)用產(chǎn)生的影響,以及大模型帶來(lái)的安全、價(jià)值取向和倫理問(wèn)題,交叉學(xué)科人才培養(yǎng),等等,給出了研究者的觀點(diǎn),期待通過(guò)上述交流,推動(dòng)語(yǔ)言學(xué)與人工智能技術(shù)的創(chuàng)新融合發(fā)展。