人最原始的能力為什么是重要的?換句話說,人的眼耳口鼻五官四肢所帶來的運動、情緒、感知、勞動,進而品格、毅力,為什么是重要的和可持續(xù)的?近期人工智能所引發(fā)的多模態(tài)信息、具身智能可能為我們理解這個教育問題提供了另外一種思路。
如果將人的眼耳口鼻五官四肢所能感受和處理的信息按從低到高的層級排列的話,可以簡單分為視頻、音頻、語言、圖畫、符號、文字、圖示、數(shù)學(xué)公式等。有研究表明,動物最低級的視覺(眼晴)信息進化了5億年,相對來說,科學(xué)符號只有2000年,現(xiàn)代科學(xué)與數(shù)學(xué)公式只有幾百年歷史,我們通過12年分科學(xué)習(xí)的體系是工業(yè)革命后的產(chǎn)物。進化越充分的低級信息數(shù)量越大、信息密度越低,但是越接近人的本能和原始能力,而產(chǎn)生時間越晚的高級信息效率越高、信息密度越高,卻越遠離人的原始能力。
人是如此,社會工具的進化更是如此。一個新工具的產(chǎn)生,首先要考慮的是讓新一代什么都不會的年輕人能更高效地使用,而不是只有經(jīng)過20年訓(xùn)練的人才會使用。因此,當(dāng)一個經(jīng)過嚴格訓(xùn)練使用老式工具的“工具人”基礎(chǔ)人體能力退化后,新的工具更適合最具備基礎(chǔ)人體能力的人,而不是相反。
目前,機器人跑馬拉松和機器人當(dāng)保姆、保潔、保安、快遞員,比計算機自動編程要難多了,因此才有了具身智能的熱潮,具身智能主要涉及多模態(tài)數(shù)據(jù)的處理能力。
多模態(tài)數(shù)據(jù)的處理,簡單說就包含前面所述的低級和高級信息,然而人類處理以上信息更高效和更智能的原因在于采用了與計算機完全不同的處理方式。例如,計算機處理總是通過CPU或者GPU來進行,但人類是通過眼耳口鼻五官四肢分工完成的。人類在通過五官四肢與器官收集信息的同時,還能對其進行分類,完成比智能體更智能的去除幻覺作用。在這個過程中,高級信息的信息量極少效率極高,低級信息雖然信息量極大效率極低,卻起到了分支開關(guān)的作用,聯(lián)合起來形成了人的具身智能。例如,教師的大腦如果接到信號—一個學(xué)生聚精會神,就會直接輸出“是個認真的好學(xué)生”的結(jié)論,但是低級視覺信息還觀察到,同學(xué)們在討論問題時這個孩子很少發(fā)言,可能會有不合群的直覺,這個直覺就會將教師的思考分支到另外一個判斷計算模型中。
“信息即負熵”,人類發(fā)現(xiàn)的科學(xué)和發(fā)明的技術(shù)與工具,都試圖揭示世界的本質(zhì)原因,用最高級的形式表達最本質(zhì)的意義,因此人類對科技有執(zhí)念,也希望科技能夠替代人類的重復(fù)勞動,然而真理向前一步往往就是謬誤。信息在生成過程中,是需要人做功的,在做功的過程中是需要不同類別的信息分工協(xié)作的,而“作為人”部分的具身智能,往往信息含量少、密度低,卻是關(guān)鍵少數(shù)信息。人類揭示自然的奧秘還是要服務(wù)于人,也要靠人去揭示,人工智能更是如此。人工智能在模擬與學(xué)習(xí)人類行為的過程中,抽象出來的高度簡化的“高級信息”,很有可能是誤導(dǎo)的和缺少指向的,而人類保持的原始具身能力對訓(xùn)練和升級過程就極為重要,在教育領(lǐng)域尤為如此,教師的具身能力往往比高度簡化的數(shù)據(jù)更具有意義。
借用維特根斯坦所說的“凡是能夠說的,都能夠說清楚;凡是不能說的,必須保持沉默”,在教育領(lǐng)域“凡是能夠用數(shù)據(jù)表達的,都能夠表達清楚;凡是不能表達的,必須保持教師的具身”。教育的價值是由人的價值決定的,而人的價值很大程度上是具身價值。