寫(xiě)詩(shī)作畫(huà)樣樣精通、診病解題事事都行…如今,“十項(xiàng)全能\"的AI令人驚嘆不已。作為幕后推手,AI訓(xùn)練師逐漸走入大眾視野。從數(shù)據(jù)“搬運(yùn)工”,到專(zhuān)家“培養(yǎng)者”,AI訓(xùn)練師見(jiàn)證了人工智能的飛速發(fā)展,自身也正經(jīng)歷著日新月異的變化,甚至悄然催生出新的培訓(xùn)需求。
從數(shù)據(jù)標(biāo)注做起
“這兩年國(guó)內(nèi)AI越來(lái)越火,相關(guān)崗位也變多了?!苯衲瓿?,物聯(lián)網(wǎng)專(zhuān)業(yè)本科畢業(yè)的小雅正式進(jìn)入互聯(lián)網(wǎng)大廠外包公司,成為一名AI訓(xùn)練師。主要做數(shù)據(jù)標(biāo)注,我分到的是數(shù)學(xué)方向,用LaTeX這種工具寫(xiě)解題過(guò)程?!毙⊙盘寡裕@項(xiàng)工作并不需要太多專(zhuān)業(yè)背景,“有規(guī)則文檔,對(duì)照著把步驟整理出來(lái)”。
去年底,美術(shù)專(zhuān)業(yè)出身的小琳也從UI(用戶(hù)界面)設(shè)計(jì)師轉(zhuǎn)行成為AI訓(xùn)練師?!爸白隽?0年設(shè)計(jì)工作,后來(lái)覺(jué)得這個(gè)行業(yè)快要被AI取代,于是選擇改行?!毙×瞻l(fā)現(xiàn),如今的工作與設(shè)計(jì)基本毫無(wú)關(guān)系,“我主要做文本類(lèi)的數(shù)據(jù)標(biāo)注,按照公司規(guī)則對(duì)模型生成的內(nèi)容打分、改寫(xiě),從而訓(xùn)練大模型?!睂?duì)于這份新工作,小琳有著自己的理解:“可以把大模型想象成一個(gè)小孩,你要教這個(gè)小孩怎么輸出更合理的內(nèi)容。如果小孩犯錯(cuò),還要給糾錯(cuò)。”
相比起這兩名剛?cè)胄械摹靶率帧眮?lái)說(shuō),小磊儼然已經(jīng)是行業(yè)里的“老兵”。作為金屬材料專(zhuān)業(yè)的肆業(yè)生,小磊手中的最高學(xué)歷只有高中。2018年,從事客服工作的他偶然接觸到智能客服產(chǎn)品,“當(dāng)時(shí)在一個(gè)外包項(xiàng)目里負(fù)責(zé)輔助互聯(lián)網(wǎng)大廠的訓(xùn)練師做數(shù)據(jù)標(biāo)注,一年后被訓(xùn)練師介紹過(guò)去專(zhuān)門(mén)做這個(gè)”
在當(dāng)時(shí),這項(xiàng)工作十分冷門(mén),“對(duì)方看我有工作經(jīng)驗(yàn),也就沒(méi)有卡學(xué)歷”。就這樣,小磊抱著學(xué)習(xí)的態(tài)度踏入AI行業(yè)。
“最初主要為智能產(chǎn)品做個(gè)性化需求落地,以問(wèn)答為主,可以算小模型,通過(guò)搭建知識(shí)庫(kù)、調(diào)整問(wèn)答策略來(lái)提升回答質(zhì)量。\"2022年以來(lái),小磊轉(zhuǎn)向從事與大模型有關(guān)的數(shù)據(jù)標(biāo)注,主要負(fù)責(zé)提供各種語(yǔ)料,并帶領(lǐng)資源團(tuán)隊(duì)進(jìn)行數(shù)據(jù)生產(chǎn)?!靶枰c算法技術(shù)團(tuán)隊(duì)密切溝通,將他們對(duì)數(shù)據(jù)的需求轉(zhuǎn)化為具體的標(biāo)注規(guī)則?!?/p>
以常見(jiàn)的問(wèn)答文本標(biāo)注為例,小磊不僅要制訂答案質(zhì)量的打分標(biāo)準(zhǔn),如考量回答的正確性、全面性等,還要對(duì)低分答案進(jìn)行修改,將其轉(zhuǎn)化為高分答案?!耙?guī)則都是五花八門(mén)的,永遠(yuǎn)不知道下一批任務(wù)的規(guī)則是什么。
現(xiàn)階段,小磊面對(duì)的數(shù)據(jù)標(biāo)注規(guī)模動(dòng)輒上萬(wàn)甚至幾十萬(wàn)條,需要團(tuán)隊(duì)協(xié)作完成?!皥F(tuán)隊(duì)規(guī)模根據(jù)項(xiàng)目需求動(dòng)態(tài)調(diào)整,小的時(shí)候可能只有五六個(gè)人,大的時(shí)候則可達(dá)上百人?!?/p>
薪資待遇差別大
在行業(yè)內(nèi)打拼多年,小磊目睹了大模型出現(xiàn)對(duì)AI訓(xùn)練師帶來(lái)的影響?!霸诖竽P统霈F(xiàn)之前,AI訓(xùn)練師的工作相對(duì)聚焦?!毙±诨貞浾f(shuō),“以前輸出內(nèi)容主要依賴(lài)知識(shí)庫(kù)檢索,數(shù)據(jù)標(biāo)注只是重新設(shè)計(jì)表現(xiàn)不好的語(yǔ)料,標(biāo)注工作相對(duì)輕量,問(wèn)題觸發(fā)的內(nèi)容也都是行業(yè)內(nèi)部知識(shí),可控性比較強(qiáng)?!?/p>
自從大模型誕生,這項(xiàng)工作變得復(fù)雜許多?!艾F(xiàn)在任務(wù)類(lèi)型多種多樣,除了文本以外,還可能有圖像、音頻等,大模型根據(jù)語(yǔ)料推理出來(lái)的答案也更加不可控。”
小磊提到,DeepSeek的出現(xiàn)也給行業(yè)帶來(lái)很大變化?!斑^(guò)去大家都在堆語(yǔ)料,覺(jué)得越多越好,但現(xiàn)在要打個(gè)問(wèn)號(hào),思考是不是應(yīng)該調(diào)整方向?!毙±谡f(shuō),以往做小模型的知識(shí)庫(kù)構(gòu)建時(shí)也曾遇到過(guò)類(lèi)似問(wèn)題,“一開(kāi)始確實(shí)堆的知識(shí)越多效果越好,但超過(guò)臨界值以后,反而會(huì)出現(xiàn)意圖纏繞,知識(shí)變得混淆不清”。
盡管大模型的功能日益強(qiáng)大,但小磊發(fā)現(xiàn)問(wèn)題也逐漸凸顯?!按竽P痛_實(shí)很擅長(zhǎng)公文寫(xiě)作,只是精準(zhǔn)度依然有限。像央企國(guó)企的公文,通常要求較高,大模型暫時(shí)還很難達(dá)到這個(gè)標(biāo)準(zhǔn)?!?/p>
為了提升語(yǔ)料的質(zhì)量,小磊會(huì)嚴(yán)格篩選可靠信源?!氨热?,文本類(lèi)主要選擇權(quán)威新聞、期刊和實(shí)體書(shū)等,而不是一些營(yíng)銷(xiāo)號(hào)的內(nèi)容?!痹跇?biāo)注過(guò)程中,小磊也會(huì)對(duì)標(biāo)注人員進(jìn)行規(guī)范培訓(xùn),要求他們按照標(biāo)準(zhǔn)流程進(jìn)行信息采集和處理。同時(shí),團(tuán)隊(duì)還會(huì)參考其他大模型的回復(fù),“相互借鑒,不斷優(yōu)化自己的模型”。
在大模型的推動(dòng)下,AI訓(xùn)練師的崗位不斷細(xì)分。“之前給AI當(dāng)老師,主要是教基本知識(shí),有點(diǎn)像教小孩子學(xué)常識(shí)?,F(xiàn)在AI具備了一定的認(rèn)知能力,就需要有更高水平或者更專(zhuān)業(yè)的人來(lái)教它高階思維。”據(jù)小磊介紹,現(xiàn)在大模型涉及越來(lái)越多專(zhuān)業(yè)領(lǐng)域知識(shí),也就需要更多具備醫(yī)療、教育、法律等專(zhuān)業(yè)知識(shí)背景和從業(yè)經(jīng)驗(yàn)的人才加入進(jìn)來(lái),“這些專(zhuān)業(yè)性強(qiáng)的語(yǔ)料生成,外行確實(shí)做不了。”
在小磊看來(lái),崗位細(xì)分的同時(shí),AI訓(xùn)練師的薪資待遇差距也在拉大?!跋窕A(chǔ)的數(shù)據(jù)標(biāo)注崗位,月薪可能只有幾千元;而大公司里要求較高的崗位,月薪可以達(dá)到三五萬(wàn)元。”
沒(méi)必要盲目跟風(fēng)
記者在調(diào)查中了解到,隨著AI訓(xùn)練師崗位需求不斷增加,相關(guān)培訓(xùn)迅速興起。
“現(xiàn)在很多人轉(zhuǎn)行做這個(gè),培訓(xùn)班上什么專(zhuān)業(yè)的都有。有剛畢業(yè)的,也有工作好多年的?!鄙蠉徢埃⊙啪蛨?bào)班參加了AI訓(xùn)練師課程?!耙还惨簿?0次課,報(bào)班就是為了心里有個(gè)底,其實(shí)也可以自己投簡(jiǎn)歷,面試多了自然就知道會(huì)問(wèn)什么,面試通過(guò)以后可以在干中學(xué)?!?/p>
轉(zhuǎn)行前,小琳同樣選擇先報(bào)班“補(bǔ)課”?!八闶腔亓髁耍?013年剛畢業(yè)那會(huì)兒就在這個(gè)機(jī)構(gòu)學(xué)的UI設(shè)計(jì)師。這兩年好多設(shè)計(jì)師的工作干不下去,機(jī)構(gòu)就又開(kāi)了AI訓(xùn)練師的課,讓大家學(xué)完盡快轉(zhuǎn)行?!闭f(shuō)到這里,小琳不由得苦笑,“我要是有講課的天賦,我也去開(kāi)班了,還是開(kāi)班賺錢(qián)?!?/p>
記者在社交平臺(tái)上搜索,發(fā)現(xiàn)不少分享轉(zhuǎn)行經(jīng)驗(yàn)的AI訓(xùn)練師都在小琳所說(shuō)的這家機(jī)構(gòu)報(bào)過(guò)課?!拔覀兊腁I訓(xùn)練師課程是就業(yè)導(dǎo)向的,需要線下學(xué)習(xí),在北京、深圳、杭州都設(shè)有校區(qū),這些城市的工作崗位也比較集中?!睋?jù)機(jī)構(gòu)工作人員介紹,培訓(xùn)持續(xù)5周,上課時(shí)間安排在周末,共10次課。從大綱來(lái)看,課程相當(dāng)緊湊,學(xué)員需要在一天之內(nèi)學(xué)習(xí)大模型行業(yè)通用規(guī)則、單輪對(duì)話項(xiàng)目實(shí)訓(xùn)、多輪對(duì)話項(xiàng)目實(shí)訓(xùn)和AI訓(xùn)練師必學(xué)代碼課?!皩W(xué)完專(zhuān)業(yè)課,會(huì)分配一對(duì)一的就業(yè)輔導(dǎo)老師?!?/p>
工作人員稱(chēng),學(xué)費(fèi)每期漲1000元“現(xiàn)在報(bào)名的話是第13期,3月29日開(kāi)課。原價(jià)22999元,最近幾天有一個(gè)拼團(tuán)折扣價(jià),優(yōu)惠完20999元。第14期的話是5月10日開(kāi)課,差不多就是這么一個(gè)招生節(jié)奏。每期50名學(xué)員,分成兩個(gè)班。”
在去年10月的培訓(xùn)中,小琳從課上了解到Reward模型、RAG項(xiàng)目等內(nèi)容。“但這些只是基礎(chǔ)知識(shí),到了公司還是要靠自己在實(shí)際工作中摸索?!比绾卧诤?jiǎn)歷關(guān)和面試關(guān)解決零經(jīng)驗(yàn)的問(wèn)題?小雅從培訓(xùn)中學(xué)到了“應(yīng)對(duì)策略”,“可以結(jié)合以前的經(jīng)驗(yàn),把AI融入進(jìn)去”。
作為過(guò)來(lái)人,小磊發(fā)現(xiàn),很多數(shù)據(jù)標(biāo)注方面的外包公司招聘需求很大?!斑@項(xiàng)工作相對(duì)比較枯燥,成長(zhǎng)性也有限,很多人干一段時(shí)間就走了。”小磊說(shuō),如果本身學(xué)歷有限,對(duì)這一行感興趣,暫時(shí)也沒(méi)有太多機(jī)會(huì)和選擇,那么不妨嘗試從數(shù)據(jù)標(biāo)注做起,“起碼也算接觸了這個(gè)行業(yè),后期通過(guò)工作經(jīng)驗(yàn)積累,也能慢慢往更高階的訓(xùn)練師方向轉(zhuǎn)?!?/p>
至于要不要報(bào)班,小磊表示沒(méi)必要盲目跟風(fēng)?!叭绻皇亲鰯?shù)據(jù)標(biāo)注,其實(shí)要求沒(méi)那么高。就算是為了應(yīng)對(duì)面試時(shí)的問(wèn)題,也未必需要花高價(jià)報(bào)班,完全可以找一些相關(guān)知識(shí)自學(xué)一下。”
(摘自《北京晚報(bào)》宗媛媛)