“過度擬合”是人工智能學(xué)習(xí)中一個普遍存在的問題。擬合是數(shù)學(xué)上的一個術(shù)語。比如,我們做一個物理實驗,研究力和加速度的關(guān)系(力=質(zhì)量×加速度)。我們測量得到一組力和加速度的數(shù)據(jù),將其描畫在坐標(biāo)紙上。從理論上講,力和加速度應(yīng)該是正比關(guān)系,在坐標(biāo)紙上對應(yīng)一條直線。但在實際測量中,把測量所得到的數(shù)據(jù)畫在坐標(biāo)紙上時,這些點不可能剛好都落在一條直線上。這就需要通過適當(dāng)?shù)霓k法,來歸納出這組數(shù)據(jù)的規(guī)律。這就是擬合。但擬合的方式有很多,你可以用最接近所有點的一條直線來擬合,也可以直接用一段段折線把相鄰點簡單連接起來。在后一種情況下,雖然所有點都落在你描畫的折線上,但這對于我們探索規(guī)律毫無意義。這就屬于過度擬合。過度擬合就是過度拘泥于一些不重要的東西,沒抓住本質(zhì),只能死板地重復(fù)已有的數(shù)據(jù),而不能預(yù)言新情況。
假如你訓(xùn)練人臉識別系統(tǒng)時,所有人臉圖片上的人都是有頭發(fā)的,而且頭發(fā)都是黑色的,那么這樣訓(xùn)練出來的人臉識別系統(tǒng),很可能就把“有沒有頭發(fā)”甚至“頭發(fā)是不是黑色”當(dāng)作判斷是人臉還是普通物體的重要依據(jù)。這就屬于過度擬合。因為我們完全可以剃光頭或者把頭發(fā)染成黃色。
推而廣之,生活中死磕書本、死抱教條、思維僵化,應(yīng)付不了新事物、新挑戰(zhàn),從人工智能的角度說,也屬于過度擬合。
為了讓人工智能在學(xué)習(xí)過程中避免陷入過度擬合的陷阱,科學(xué)家往往在訓(xùn)練時,有意輸入一些隨機的、扭曲變形的東西。譬如在訓(xùn)練人臉識別系統(tǒng)時,故意讓有些圖片中的人臉模糊不清,讓有些人臉經(jīng)過適當(dāng)變形,這樣一個人即使離鏡頭較遠或者哪怕經(jīng)歷胖瘦的變化,也能識別出來。這種策略對于提高人工智能的靈活性非常有效,現(xiàn)在被認為是不可或缺的步驟。
(愉兒摘自龍源期刊網(wǎng))