邵婷
伍迪·布萊索坐在他開(kāi)放車庫(kù)里的輪椅上,等待周日當(dāng)?shù)亟?jīng)過(guò)教堂的人們向他打招呼,這個(gè)74歲老人的雙頰凹陷了,退化性疾病剝奪了他說(shuō)話和走路的能力,但是他的頭腦還是很敏銳。直到退休前,他一直是得克薩斯大學(xué)奧斯汀分校的教授,致力于推動(dòng)自動(dòng)推理和人工智能領(lǐng)域的發(fā)展。
1950年后期,伍迪有一項(xiàng)工作是研發(fā)面部識(shí)別技術(shù),并吸引了美國(guó)政府的興趣,實(shí)際上伍迪的實(shí)驗(yàn)主要出資者似乎正是中央情報(bào)局的前身。如今面部識(shí)別已成為手機(jī)、筆記本電腦、護(hù)照和支付應(yīng)用程序的首選安全功能,提升了人們工作和生活的效率。但在上世紀(jì)60年代,面部識(shí)別的基礎(chǔ)工作在科技界幾乎是一片空白。幸運(yùn)的是,伍迪的大部分研究工作和書(shū)信仍有保存,讓我們回顧一下這段歷史。
伍迪于1921年出生在俄克拉荷馬州的梅斯維爾鎮(zhèn),整個(gè)童年時(shí)期都在幫助父親維持農(nóng)場(chǎng)的生計(jì)。
12歲時(shí)伍迪的父親去世,在大蕭條時(shí)期,整個(gè)家庭陷入了更加貧困的境地。高中畢業(yè)時(shí),伍迪在養(yǎng)雞場(chǎng)上班,然后搬到諾曼市,開(kāi)始在俄克拉荷馬大學(xué)上課,第二次世界大戰(zhàn)前夕加入軍隊(duì)。之后伍迪表現(xiàn)出數(shù)學(xué)天賦,在密蘇里州倫納德伍德堡的辦公室工作,在那里訓(xùn)練一波又一波的美國(guó)士兵進(jìn)行戰(zhàn)斗。1944年6月7日,即“驅(qū)逐日”的第二天,伍迪終于被派往歐洲,在那里他設(shè)計(jì)了大型海軍艦艇(為海灘登陸而建造),獲得了青銅之星。
戰(zhàn)爭(zhēng)結(jié)束后,伍迪回到猶他大學(xué)主修數(shù)學(xué),并在兩年半內(nèi)完成學(xué)業(yè),然后去伯克利攻讀博士學(xué)位。畢業(yè)后,他在新墨西哥州的桑迪亞公司工作,與氫彈的發(fā)明者之一斯坦尼斯拉夫·烏蘭等名人一起從事政府資助的核武器研究。1956年,伍迪飛往馬紹爾群島,觀察對(duì)埃涅韋塔克環(huán)礁的武器測(cè)試,該地區(qū)的部分放射性污染比切爾諾貝利或福島更為嚴(yán)重。他在日記中寫(xiě)道:“幫助祖國(guó)成為世界上最強(qiáng)大的國(guó)家令我很滿意?!?h3>全景研究公司的誕生
桑迪亞為伍迪提供了進(jìn)入計(jì)算世界的第一步,起初,他在編寫(xiě)代碼方面的努力與核武器研究的嚴(yán)謹(jǐn)計(jì)算直接相關(guān)。一項(xiàng)較早的工作是“計(jì)算大規(guī)模熱核襲擊產(chǎn)生的沉降概率的程序”,它考慮了爆炸的產(chǎn)量、爆破點(diǎn)、爆炸時(shí)間、平均風(fēng)速等因素,以預(yù)測(cè)在這種情況下沉降物將落在何處攻擊。
但是隨著他對(duì)計(jì)算機(jī)的熱愛(ài)越來(lái)越深,伍迪對(duì)自動(dòng)模式識(shí)別(尤其是機(jī)器讀?。┊a(chǎn)生了興趣,這是教計(jì)算機(jī)識(shí)別未標(biāo)記文字字符的過(guò)程。他與他的朋友和同事伊本·布朗寧合作,后者是數(shù)學(xué)家、航空工程師和生物物理學(xué)家。
他們首先設(shè)計(jì)了一個(gè)印刷字符——字母Q,然后根據(jù)是否包含字符的一部分,為每個(gè)單元格分配一個(gè)二進(jìn)制數(shù):空單元格為0,填充單元格為1。然后將單元格隨機(jī)分組為有序?qū)?,例如坐?biāo)集(理論上,分組可以包括任意數(shù)量的單元格,因此命名為n-tuple)。通過(guò)進(jìn)一步的數(shù)學(xué)操作,計(jì)算機(jī)能夠?yàn)榻巧木W(wǎng)格分配唯一的分?jǐn)?shù)。當(dāng)計(jì)算機(jī)遇到一個(gè)新字符時(shí),它會(huì)簡(jiǎn)單地將該字符的網(wǎng)格與數(shù)據(jù)庫(kù)中的其他字符進(jìn)行比較,直到找到最接近的匹配項(xiàng)為止。
美麗n元組的方法是,它可以識(shí)別同一個(gè)字符的許多變種:最Q小號(hào)往往很接近其他得分Q秒。更好的是,該過(guò)程可以使用任何模式,而不僅僅是文本。
1960年伍迪與布朗寧和桑迪亞的第三位同事合作,成立了自己的公司Panoramic Research Incorporated(全景研究公司),最初是在加利福尼亞州帕洛阿爾托的一個(gè)小辦公室中成立的。當(dāng)時(shí),世界上大多數(shù)計(jì)算機(jī)(大型數(shù)據(jù)存儲(chǔ)在打孔卡或磁帶上的大型計(jì)算機(jī))都位于大型公司辦公室和政府實(shí)驗(yàn)室中。
在Panoramic運(yùn)營(yíng)的整個(gè)過(guò)程中,有一個(gè)贊助者:中央情報(bào)局。在伍迪檔案中幸存的證據(jù)表明,多年來(lái)Panoramic與CIA前線公司開(kāi)展業(yè)務(wù)。根據(jù)專門(mén)針對(duì)《信息自由法》建立的網(wǎng)站Black Vault獲得的記錄,Panoramic是從事MK-Ultra項(xiàng)目的80個(gè)組織之一,MK-Ultra項(xiàng)目是CIA的“頭腦控制”程序。
另一家公司金赫爾利也資助了伍迪在Panoramic的最著名的研究,在1963年初,公司提議“進(jìn)行一項(xiàng)研究,以確定簡(jiǎn)化的面部識(shí)別機(jī)的可行性”。運(yùn)用之前伍迪和布朗寧在工作中的n元組方法,給計(jì)算機(jī)建立一個(gè)數(shù)據(jù)庫(kù),其中包含10個(gè)人的不同照片,并查看它是否可以識(shí)別每個(gè)人的新照片。不久以后,測(cè)試人數(shù)擴(kuò)大到數(shù)千人。
在現(xiàn)代,識(shí)別十張面孔似乎是非常輕松的事情,但是在1963年卻充滿挑戰(zhàn)。從識(shí)別文字到識(shí)別面孔是一個(gè)巨大的飛躍。首先,沒(méi)有標(biāo)準(zhǔn)的方法可以將照片數(shù)字化,也沒(méi)有現(xiàn)有的數(shù)字圖像數(shù)據(jù)庫(kù)可以借鑒。如今的研究人員可以在數(shù)百萬(wàn)個(gè)免費(fèi)的自拍照上訓(xùn)練他們的算法,但是Panoramic必須從頭開(kāi)始逐張建立其數(shù)據(jù)庫(kù)。
還有一個(gè)更大的問(wèn)題:與頁(yè)面上的二維字母不同,活著的人類上的三維面孔不是一成不變的。同一個(gè)人的圖像在頭部旋轉(zhuǎn)、光線強(qiáng)度和角度方面可能有所不同;人們的年齡和發(fā)型改變;在一張照片中看起來(lái)無(wú)憂無(wú)慮的人可能在下一張照片中顯得焦慮。就像在一組極其復(fù)雜的分?jǐn)?shù)中找到公分母一樣,團(tuán)隊(duì)將需要以某種方式校正所有這些可變性并標(biāo)準(zhǔn)化他們正在比較的圖像。還有個(gè)障礙是:他們的主要機(jī)器之一是CDC 1604,它只有192 KB的RAM ,比基本的現(xiàn)代智能手機(jī)小得多的工作內(nèi)存。
伍迪從一開(kāi)始就充分意識(shí)到這些挑戰(zhàn),因此采用了分而治之的方法,將研究分解為多個(gè)部分,并將其分配給其他全景研究人員。一位年輕的研究員開(kāi)始研究數(shù)字化問(wèn)題:他用16毫米膠卷拍攝了該項(xiàng)目的人臉黑白照片。然后使用了由Browning開(kāi)發(fā)的掃描設(shè)備,將每張圖片轉(zhuǎn)換為成千上萬(wàn)個(gè)數(shù)據(jù)點(diǎn),每個(gè)數(shù)據(jù)點(diǎn)代表光強(qiáng)度值【范圍從0(完全暗)到3(完全亮)】。但是對(duì)于計(jì)算機(jī)而言,這太多的數(shù)據(jù)點(diǎn)無(wú)法一次全部處理,因此這位年輕的研究人員編寫(xiě)了一個(gè)名為NUBLOB的程序,該程序?qū)D像切成隨機(jī)大小的色板并計(jì)算出每個(gè)人的分?jǐn)?shù)。
整個(gè)1965年,Panoramic嘗試為面部創(chuàng)建全自動(dòng)的Bertillon系統(tǒng)。該團(tuán)隊(duì)試圖設(shè)計(jì)一種程序,通過(guò)解析照片中的明暗模式來(lái)定位鼻子、嘴唇等,但這種努力大多是失敗的。
因此,伍迪開(kāi)始探索他們所謂的“人機(jī)”方法進(jìn)行面部識(shí)別,這種方法將一些人的幫助納入了方程式。全景公司征召伍迪十幾歲的兒子Gregory和他的一位朋友瀏覽了一堆照片(總共122張照片,代表大約50個(gè)人),并對(duì)每張臉進(jìn)行了22次測(cè)量,包括從上到下的耳朵長(zhǎng)度以及從下到上的嘴巴寬度。
1967年伍迪終于完成了最后一項(xiàng)任務(wù),該實(shí)驗(yàn)的目的是幫助執(zhí)法機(jī)構(gòu)快速篩查杯子照片和肖像數(shù)據(jù)庫(kù),尋找比賽對(duì)象。和以前一樣,該項(xiàng)目的資金似乎來(lái)自美國(guó)政府,CIA在2005年解密的一份1967年文件中提到了面部識(shí)別系統(tǒng)的“外部合同”,該系統(tǒng)可以將搜索時(shí)間縮短。
伍迪在該項(xiàng)目上的主要合作者是斯坦福研究所應(yīng)用物理實(shí)驗(yàn)室的研究工程師彼得·哈特(現(xiàn)在被稱為SRI International,該研究所于1970年從斯坦福大學(xué)分離出來(lái),因?yàn)樗鼑?yán)重依賴軍事資金在校園內(nèi)引起了爭(zhēng)議)。伍迪和哈特從大約800張圖像的數(shù)據(jù)庫(kù)開(kāi)始,“400名成年男性白種人”每張大約兩張新聞紙品質(zhì)的照片,年齡和頭部旋轉(zhuǎn)情況各異。使用RAND平板電腦,他們將每張照片記錄了46個(gè)坐標(biāo),其中每個(gè)耳朵記錄了五個(gè)坐標(biāo),鼻子上記錄了七個(gè)坐標(biāo),每個(gè)眉毛四個(gè)。
該計(jì)算機(jī)的任務(wù)是記住每個(gè)面孔的一個(gè)版本,并使用它來(lái)識(shí)別另一個(gè)版本。伍迪和哈特為機(jī)器提供了兩個(gè)快捷方式。使用第一種(稱為組匹配),計(jì)算機(jī)會(huì)將臉部分為多個(gè)特征(左眉、右耳等),并比較它們之間的相對(duì)距離。第二種方法依賴貝葉斯決策理論,它使用22次測(cè)量來(lái)對(duì)整體進(jìn)行有根據(jù)的猜測(cè)。
最后這兩個(gè)程序大致完成了任務(wù),當(dāng)伍迪和哈特讓三個(gè)人交叉匹配100張面孔的子集時(shí),即使最快的一張也要花六個(gè)小時(shí)才能完成。CDC 3800計(jì)算機(jī)在大約三分鐘內(nèi)完成了類似的任務(wù),時(shí)間大大縮短。伍迪和哈特承認(rèn),人類在應(yīng)對(duì)頭部旋轉(zhuǎn)和照片質(zhì)量差異方面表現(xiàn)得更好,但在耐受衰老造成的差異方面,計(jì)算機(jī)“絕對(duì)優(yōu)越”,他們總結(jié)道,機(jī)器未來(lái)會(huì)“支配”人類。