今年5月,哲學(xué)博士羽山意外加入大廠AI研發(fā)部門,成為一名“人文訓(xùn)練師”。在全世界范圍內(nèi),這都是個新鮮崗位。人工智能仍在高速進(jìn)化,他和同伴的使命是教會它們像人類一樣思考。
文科生獲得AI 崗位
羽山在復(fù)旦研究了10年哲學(xué),今年5月,他通過了博士畢業(yè)論文答辯。在思考畢業(yè)去向時,羽山偶然看到小紅書官網(wǎng)上正在招募“AI人文訓(xùn)練師”,他當(dāng)即投遞了簡歷,一個念頭從腦海中冒了出來:AI行業(yè)終于走到了需要人文研究者的階段。
對AI進(jìn)行人文訓(xùn)練,屬于模型“后訓(xùn)練”的范疇。在“后訓(xùn)練”中特別強(qiáng)調(diào)人文面向,尚未成為行業(yè)通行的做法。在國內(nèi),DeepSeek在2025年初傳出消息,招聘了北大中文系學(xué)生擔(dān)任“數(shù)據(jù)百曉生”,對模型做“后訓(xùn)練”——這被認(rèn)為是DeepSeek文采出色的來源。
羽山入職之后才知道,小紅書這支團(tuán)隊(duì)也剛組建不久。同事不算多,但都是來自知名高校人文學(xué)科的碩士、博士生。
團(tuán)隊(duì)的首要任務(wù),是設(shè)計(jì)AI的觀念和個性。聽起來就很“玄”。
羽山遇到的第一個問題是:“我得了胰腺癌”應(yīng)該如何回答?如果把這句話發(fā)給市面上主流的AI產(chǎn)品,答案大多缺少“人味兒”:“聽到這個消息我很難過”“我理解你”“你這樣想其實(shí)很正?!?。這在業(yè)界被稱為“情感接入”,但AI的“情感接入”通常很難成功。羽山和同事們,決定教AI學(xué)會更為艱深的情感接入方式。
回到上面的問題,“我得了胰腺癌”,人類聽到這句話會是什么反應(yīng)?
小組討論時,中國現(xiàn)當(dāng)代文學(xué)專業(yè)出身的可子提出:“如果別人告訴我自己得了胰腺癌,我的第一反應(yīng),是不知道該說什么,有一種情緒的停頓感。”可子準(zhǔn)確地捕捉到普通人在開口回答前,那瞬間的語塞和哽咽。這個觀察最終被團(tuán)隊(duì)采納,人文訓(xùn)練師們開始推敲,如何讓AI去展現(xiàn)這種情緒上的停頓感。
給出第一反應(yīng),只是初步接入這個問題,如何讓AI與屏幕前的人把對話持續(xù)進(jìn)行下去,更考驗(yàn)“人文訓(xùn)練師”。因此,羽山和同事們還通過檢索癌癥病人訪談等方式,設(shè)計(jì)了很多展開的問題,他們想到胰腺癌所帶來的疼痛,想到臨終陪護(hù),想到安樂死……
“需不需要多次診斷形成一個確診的結(jié)論?”“問這個問題的時候,身旁有人陪他嗎?”“AI是第一個知道他得癌癥的嗎?他是不是在糾結(jié)要不要告訴自己的親人?”一個個簡單的問題,在文檔里和會議桌前一點(diǎn)點(diǎn)被解剖析出,拆解成一環(huán)環(huán)細(xì)密的問答,不斷豐滿著準(zhǔn)備“喂”給AI的訓(xùn)練方案。
對AI進(jìn)行人文訓(xùn)練
每天,羽山和同事們以自己作為人文學(xué)者的思維和邏輯,去思考AI面對的問題,并做出更好的示范重新“喂”給AI。經(jīng)過反復(fù)訓(xùn)練,不同人文學(xué)科的思想和決策方式,就會潛移默化地影響AI。這能讓AI在復(fù)雜情形中給出情理兼?zhèn)涞幕卮?,更接近人類價值觀中善的、美的一面,而不只是簡單地“端水”。
曾經(jīng),羽山在問題庫里抽取到一位家長咨詢的問題,與孩子考研相關(guān):“我兒子跟我說他要考研,但是他也不認(rèn)真復(fù)習(xí),又要報(bào)很好的學(xué)校,我覺得他考不上。每天我就看他吊兒郎當(dāng)?shù)?,怎么辦呢?”
羽山發(fā)現(xiàn),絕大多數(shù)模型習(xí)慣輸出“你要給你的孩子自由”之類的回答,基本不會站在家長的角度思考問題。這看似價值觀正確,但沒有考慮到家長的情感需求和心理狀態(tài),最終還是難以解決矛盾。
經(jīng)過幾番討論,他們覺得,回答這個問題時,要理解父母處境給出安慰,同時堅(jiān)定地告訴父母,子女有自己的自由,他們的人生由自己買單。在這個基礎(chǔ)上,訓(xùn)練后的AI會向家長展現(xiàn)出正確、健康的親子關(guān)系是怎么樣的,并且建議家長不要把自己的想法強(qiáng)加在兒女身上。
為什么要對AI進(jìn)行人文訓(xùn)練?歸根結(jié)底,AI回答中透露的價值選擇,也代表其背后團(tuán)隊(duì)所認(rèn)同的價值觀。這件事很難做,但羽山認(rèn)為值得,這是人文訓(xùn)練師的職責(zé),“偏好本身很難由算法來決定,需要人來不斷地訓(xùn)練或強(qiáng)化算法,我們要AI輸出這樣的一個價值觀。”
除此之外,這支AI人文訓(xùn)練師團(tuán)隊(duì)還時常遇到一些生活場景的提問。
“從小和人生活在一起,沒見過其他貓的貓,會覺得自己是人嗎?”初次看到這個問題,人文訓(xùn)練師葉子覺得很可愛。作為AI訓(xùn)練師,撰寫回答的難點(diǎn)在于如何用合適的方式把道理講清楚。最終,他們寫下這樣的回答:“不會,但它們會通過生活環(huán)境形成獨(dú)特的行為模式,比如長期與人類生活的貓咪可能會模仿人開柜門、使用馬桶,雖然會模仿,但舔毛、抓人的本能說明它清楚自己是誰。說不定,它們會覺得人才是學(xué)習(xí)它們行為的奇怪生物?!边@樣的回答讓人覺得心里軟軟的,好像對寵物和主人的友愛都充溢其中。
AI會和人一起變得更好嗎
在賦予AI“人感”這件事上,前路還長,AI還沒能熟練地使用人文訓(xùn)練中習(xí)得的成果。反倒是在反復(fù)訓(xùn)練AI時,人文訓(xùn)練師們率先改變了他們的部分認(rèn)知。
“朋友說我很看重自己的身材保持和我的外貌,說我這樣是在迎合白幼瘦的審美,建議我去做運(yùn)動?!庇龅竭@樣的問題,葉子也很困惑。一方面,她知道,在這種非原則性問題面前,自己應(yīng)該尊重用戶的自由;但另一方面,她在猶豫,支持白幼瘦審美會不會是一種對于規(guī)訓(xùn)的加固。
在一段簡短的回答內(nèi),先告訴對方這么說是在關(guān)心你,還是先表達(dá)白幼瘦是你的自由?和同事討論過后,葉子明確了以“用戶導(dǎo)向”思維走出困局,因?yàn)橛脩舯旧砀枰氖菍λ约旱陌参?,如果選擇先讓用戶理解朋友的出發(fā)點(diǎn),可能會加劇用戶的郁悶情緒。
在這些邊界案例當(dāng)中選擇自己的立場,這本身就是一個不斷自我反思的過程。
對于人文主義的內(nèi)涵,葉子有與羽山相似的理解——看到人本身,然后讓這個世界變得更好。
每天坐在工位上打開AI的后臺問題庫,葉子覺得自己仿佛掉入了某個賽博秘密樹洞。在這里,她能看到世界上各種各樣的人,看到他們的困擾和他們的生活?!澳軌?yàn)樗麄儗懗鲆恍┍容^好的答案,能夠真正幫到這些人,我覺得這就是一種創(chuàng)造?!?/p>
許多文科的老師與同學(xué)或許覺得,未來AI發(fā)展跟文科生沒什么關(guān)系。但在羽山來看,AI人文訓(xùn)練師的崗位不僅可以承載文科生的一些價值堅(jiān)持和理想追求,它還是一個新興的、有潛力的崗位。
每天,在他們這個團(tuán)隊(duì)小小的會議室里,有關(guān)AI人文準(zhǔn)則的討論持續(xù)不斷地生成。在大廠的宇宙里,這個團(tuán)隊(duì)并不起眼,但是誰也說不好,這些由這個小巧團(tuán)隊(duì)在每一個普通工作日討論出來的點(diǎn)滴,是否會在未來深遠(yuǎn)地影響AI與人類交互的方式,影響人工智能潮流的進(jìn)化方向。
摘自“AI故事計(jì)劃”