趙霞
(昆明醫(yī)科大學(xué)圖書館,云南 昆明 650500)
黨的十九大報告提出“建設(shè)智慧社會”的構(gòu)想,這是對未來社會信息化趨勢的戰(zhàn)略部署。2021年3月,《中華人民共和國國民經(jīng)濟(jì)和社會發(fā)展第十四個五年規(guī)劃和2035年遠(yuǎn)景目標(biāo)綱要》將“智慧服務(wù)”繪入國家發(fā)展藍(lán)圖,指出“加快數(shù)字社會建設(shè)步伐”首先體現(xiàn)在“提供智慧便捷的公共服務(wù)”。作為智慧社會的具體實(shí)踐,智慧圖書館建設(shè)成為學(xué)界共識[1]。以新技術(shù)革命為載體,智慧服務(wù)成為圖書館創(chuàng)新性轉(zhuǎn)型的契機(jī),備受圖書館界關(guān)注。它借助大數(shù)據(jù)、云計算、物聯(lián)網(wǎng)以及人工智能等新技術(shù),推動圖書館在物理空間、資源組織、服務(wù)方式以及管理手段等方面的智能化,為用戶提供更精準(zhǔn)的服務(wù)、構(gòu)建更具粘合力的信息互聯(lián)情境、形成更多維的信息共享空間,實(shí)現(xiàn)圖書館升級換代。其中人工智能是利用計算機(jī)進(jìn)行分析、感知,模擬人類思考過程的技術(shù)。其分支包括機(jī)器人、圖像識別、語言識別、自然語言處理和專家系統(tǒng)等,人臉識別是近年人工智能中發(fā)展最快的分支,在多個領(lǐng)域均有成功應(yīng)用[2]。
人臉識別技術(shù)是以人的面部生物特征為對象,進(jìn)行身份識別的生物識別技術(shù)。它利用攝像頭等圖像采集設(shè)備對人臉進(jìn)行信息采集,對采集到的圖像進(jìn)行檢測和跟蹤,再結(jié)合計算機(jī)圖像處理算法進(jìn)行特征信息處理,最終與圖像庫中的信息進(jìn)行比對,完成主體的身份認(rèn)證。它包括人臉檢測、人臉?biāo)阉?、人臉比對等一系列技術(shù)。該技術(shù)是計算機(jī)圖像處理與生物統(tǒng)計學(xué)原理的綜合運(yùn)用。它將對象面部特征通過計算機(jī)處理,再利用生物學(xué)原理進(jìn)行解析,構(gòu)造相應(yīng)數(shù)學(xué)模型,實(shí)現(xiàn)對人物身份的甄別。它是計算機(jī)視覺領(lǐng)域“智慧化”的產(chǎn)物[3]。
1965年《Personal identification and description》一文發(fā)表,開啟了運(yùn)用計算機(jī)進(jìn)行人臉識別的探索。隨后出現(xiàn)了LBP 局部二值化算法、Gabor 小波算法、方向梯度直方圖算法、傳統(tǒng)人臉識別算法等。以上方法主要基于特定影響因素進(jìn)行研究,例如識別年齡變化的算法、針對姿勢變化和光線明暗的改進(jìn)算法等。它們主要依據(jù)人臉大小、維度和生物學(xué)特征等判定個人身份。當(dāng)對象場景和周邊環(huán)境發(fā)生變化時,容易出現(xiàn)誤判,特征信息的可塑性和遷移性不理想[4]。20世紀(jì)90年代初,計算機(jī)采集信息的精度和效率顯著提高后,出現(xiàn)了針對人臉整體的識別方法,如形狀分離、灰度處理、圖像彈性匹配和人臉可變模型等。20世紀(jì)90年代末,許多國家對人臉識別技術(shù)加大投入,特別是人工神經(jīng)網(wǎng)絡(luò)的蓬勃發(fā)展,使人臉識別在速度和準(zhǔn)確率方面顯著提高,有了更強(qiáng)的環(huán)境適應(yīng)性[5]。近年來,得益于大數(shù)據(jù)和深度學(xué)習(xí)算法,人臉識別精度不斷提高。例如谷歌Face Net 系統(tǒng)的人臉檢測算法,正確率可達(dá)到99.63%±0.09%[2]。作為新興生物識別技術(shù),人臉識別具有非接觸性、唯一性、識別快速等既往技術(shù)不能比擬的優(yōu)勢。基于此,越來越多的高校圖書館引入人臉識別技術(shù),用“刷臉”代替“刷卡”。與過去使用“一卡通”刷卡認(rèn)證身份相比,人臉識別技術(shù)以其高效、精準(zhǔn)給讀者帶來全新體驗(yàn),提高服務(wù)效率、提升用戶體驗(yàn),成為服務(wù)智慧化轉(zhuǎn)型的切入口[6]。以檢索式“(主題:圖書館(精確))和(篇名:人臉識別(精確))”在CNKI 數(shù)據(jù)庫檢索,得到相關(guān)文獻(xiàn)54 篇,如圖1所示。2017年以前,偶有相關(guān)文獻(xiàn)。2017年10月,在黨的十九大報告“建設(shè)智慧社會”理念的導(dǎo)向下,2018年發(fā)文顯著增加。2017年之前的發(fā)文重在從理論構(gòu)想方面對人臉識別技術(shù)進(jìn)行應(yīng)用前景分析。2018年后,人臉識別技術(shù)開始推廣于圖書館服務(wù)之中。發(fā)文結(jié)合該技術(shù)在圖書館界的應(yīng)用實(shí)踐,從多方面展開探索,其中關(guān)于門禁系統(tǒng)的文獻(xiàn)最多。
圖1 發(fā)文趨勢
智慧圖書館場景下的人臉識別技術(shù)不是一項(xiàng)獨(dú)立應(yīng)用,而是與圖書館其他服務(wù)相結(jié)合的應(yīng)用。通過它完成身份驗(yàn)證后,需要進(jìn)一步和圖書館其他服務(wù)系統(tǒng)有效對接,以實(shí)現(xiàn)圖書館服務(wù)的智能化。因此,在圖書館引入人臉識別技術(shù),不是簡單的產(chǎn)品購買,還應(yīng)結(jié)合本館智慧服務(wù)場景,下文從三個方面有針對性地考察產(chǎn)品。
技術(shù)穩(wěn)定的保障來自產(chǎn)品是否擁有版權(quán)自主的算法。算法是決定人臉識別準(zhǔn)確率的核心要素,目前國內(nèi)知名廠商如:騰訊、阿里、商湯、曠視、云識客均有版權(quán)自主的人臉識別算法。更多公司則采用開源的人臉識別算法,或用自己的硬件終端搭載購買的算法進(jìn)行銷售。如上文提到的谷歌Face Net 就為開源的人臉識別算法提供應(yīng)用程序接口(API)和相關(guān)軟件開發(fā)工具包(SDK)。兩者相比,擁有自主版權(quán)算法的優(yōu)勢在于,廠商可以充分發(fā)揮大數(shù)據(jù)條件下深度神經(jīng)網(wǎng)絡(luò)強(qiáng)大的學(xué)習(xí)能力,不斷優(yōu)化算法。還可以利用算法中的深度學(xué)習(xí)能力,進(jìn)行后期識別訓(xùn)練,使人臉識別更趨精準(zhǔn)、高效。因此這樣的產(chǎn)品能更好地和圖書館既有服務(wù)相融合,又有支持未來服務(wù)升級。
以具體使用場景的需求為依據(jù),考察產(chǎn)品支持服務(wù)的性能指標(biāo)是否全面。主要指標(biāo)為:
3.2.1 人臉標(biāo)定
人臉標(biāo)定又稱人臉配準(zhǔn),是在人臉上的五官關(guān)鍵點(diǎn)進(jìn)行坐標(biāo)定位的一項(xiàng)技術(shù)。五官關(guān)鍵點(diǎn)的數(shù)量可以根據(jù)不同使用場景定義,預(yù)先設(shè)定固定數(shù)值,常見的有7 點(diǎn)、21 點(diǎn)、68 點(diǎn)、90 點(diǎn)等[7]。人臉登記的圖片經(jīng)過算法標(biāo)定,產(chǎn)生人臉比對關(guān)鍵點(diǎn)位置,形成特征庫。性能較好的人臉標(biāo)定技術(shù)大多基于深度學(xué)習(xí)框架,在人臉檢測坐標(biāo)框基礎(chǔ)上能夠進(jìn)行關(guān)鍵點(diǎn)位置的預(yù)測。這對于疫情時期讀者入館需佩戴口罩的情況能有效兼容。
3.2.2 活體檢測
人臉識別分兩步完成:一是人臉比對。衡量采集到的人臉和特征庫人臉的相似度。具體算法是輸入兩個人臉特征,然后輸出兩個特征的相似度,達(dá)到設(shè)定閾值判定為同一人。二是活體檢測。判斷采集到的人臉來自真人還是來自假體。人臉識別面臨著三種主要假體:打印的照片、顯示屏上圖像或視頻、人臉面具等三維模型。針對上述情況,人臉活體檢測算法的輸入有兩種,一種是輸入搖頭、點(diǎn)頭、眨眼、張嘴這幾種姿態(tài)的人臉圖片序列,輸出是圖片中人臉是否有相應(yīng)標(biāo)簽,比如張嘴、閉眼。另一種是靜默活體檢測。如多光譜法(基于皮膚反射率)、近紅外人臉活體檢測、人臉活體3D 檢測等。在門禁系統(tǒng)中,活體檢測能杜絕冒用他人身份入館,是門禁必須具備的功能。
3.2.3 準(zhǔn)確率
準(zhǔn)確率則是衡量人臉識別技術(shù)可靠性的關(guān)鍵指標(biāo)。像圖書借還這樣的操作,需要有可靠的準(zhǔn)確率為保障。在理想環(huán)境下,目前大部分人臉識別產(chǎn)品的準(zhǔn)確率都可達(dá)97%以上,主流產(chǎn)品能達(dá)到99%以上。然而在現(xiàn)實(shí)場景中,受圖像采集質(zhì)量、人物姿態(tài)、光照等因素的影響,準(zhǔn)確率往往難以達(dá)到理想值,需要進(jìn)行具體場景中的反復(fù)測試。其中超期罰款和自助借還服務(wù)中的準(zhǔn)確率測試尤為重要。
3.2.4 識別速度
識別速度決定著產(chǎn)品的用戶體驗(yàn)。從可用性出發(fā),系統(tǒng)應(yīng)達(dá)到秒級響應(yīng),用戶體驗(yàn)以小于1秒/人為佳。
主要指產(chǎn)品的量產(chǎn)能力、設(shè)計風(fēng)格、產(chǎn)品線豐富度等。產(chǎn)品應(yīng)該足夠豐富,確保能夠覆蓋圖書館多種服務(wù)場景,并能滿足現(xiàn)有服務(wù)及硬件迭代的潛在需求。
智慧圖書館引入人臉識別技術(shù),實(shí)現(xiàn)管理自動化和服務(wù)智慧化的雙重效果提升,促進(jìn)圖書館傳統(tǒng)服務(wù)的智慧增值。圖2是將人臉識別技術(shù)植入服務(wù)系統(tǒng)后,形成的包括門禁識別、信息推送、自助借還和座位預(yù)約在內(nèi)的智慧圖書館場景結(jié)構(gòu)示意圖。讀者在識別端通過認(rèn)證后,身份信息進(jìn)入圖書館局域網(wǎng)。在局域網(wǎng)內(nèi),讀者信息和服務(wù)器端數(shù)據(jù)反復(fù)交互,從而在應(yīng)用面體驗(yàn)到各種智慧化服務(wù)。服務(wù)范圍隨著技術(shù)覆蓋面的擴(kuò)大將繼續(xù)增加。
圖2 植入人臉識別的智慧圖書館場景結(jié)構(gòu)示意圖
圖書館讀者庫中的讀者到指定地址進(jìn)行上傳人臉登記信息,審核通過后進(jìn)入系統(tǒng),形成人臉特征庫,圖3為人臉識別系統(tǒng)應(yīng)用界面。今后讀者每次入館時,系統(tǒng)將實(shí)時人臉信息與人臉特征庫信息進(jìn)行比對,完成審核驗(yàn)證。驗(yàn)證成功閘機(jī)自動開啟,如圖4所示。人員通過時,門禁系統(tǒng)中的紅外感應(yīng)器感應(yīng)到讀者已通過全部感應(yīng)點(diǎn)后,會自動關(guān)閉閘機(jī)??紤]到讀者多樣的習(xí)慣和疫情防控需要,我館還開啟了人臉識別的口罩和帽子模式,如圖5所示。進(jìn)行人臉識別的同時,測溫裝置會同時啟動,發(fā)現(xiàn)體溫異常讀者時門禁系統(tǒng)自動報警,提示需要人工測溫。流程如圖6所示。
圖3 人臉識別系統(tǒng)應(yīng)用界面圖
圖4 門禁閘機(jī)通道圖
圖5 口罩和帽子模式的人臉識別
圖6 門禁系統(tǒng)應(yīng)用流程
人臉識別有效控制冒用他人身份進(jìn)入圖書館的行為,排除了不安全隱患。還能避免手指指紋不清晰、刷卡速度慢等問題,從根本上解決了傳統(tǒng)圖書館門禁系統(tǒng)識別速度慢、準(zhǔn)確性低的問題。通過門禁系統(tǒng)記錄的信息,還可以進(jìn)行讀者入館統(tǒng)計,反映全?;蛘吣硞€學(xué)院、專業(yè)的讀者到館的數(shù)量、峰值、頻率等[8]。
隨著Beacon、Wi-Fi、微信小程序等技術(shù)的廣泛應(yīng)用,個性化信息已經(jīng)可以實(shí)時推送到讀者手機(jī)。
讀者通過人臉識別后,觸發(fā)Beacon 或WI-FI 自動將入館歡迎信息發(fā)送到讀者手機(jī)[9]。系統(tǒng)接著分析讀者以往在圖書館的行為數(shù)據(jù),為讀者定制個性化消息。比如可能感興趣的圖書、期刊、館內(nèi)近期活動以及超期圖書提醒等。當(dāng)讀者到某個館藏區(qū)域時,向讀者推送該區(qū)域入藏的新書及新書在架情況。當(dāng)讀者停留在自助服務(wù)設(shè)備區(qū)域時,系統(tǒng)還可向讀者推送自助服務(wù)設(shè)備的使用方法。智慧化推送促進(jìn)了圖書館與讀者之間的互聯(lián)互動,使定制服務(wù)成為現(xiàn)實(shí)。
人臉識別技術(shù)基于人臉的特殊生物特征,能準(zhǔn)確完成讀者身份認(rèn)證,杜絕盜用證件借閱的情況。讀者將臉對準(zhǔn)攝像頭即可啟動外借、歸還或續(xù)借程序。
外借:點(diǎn)擊“借書”按鈕,選擇冊數(shù)。將要借閱的圖書放于操作臺上的凹槽中,等待系統(tǒng)依次讀取圖書信息。全部圖書顯示借閱成功后點(diǎn)擊“退出”按鈕。讀者手機(jī)APP 同時收到借閱圖書的信息并提示歸還日期。
歸還:點(diǎn)擊“還書”按鍵,選擇冊數(shù)。將要?dú)w還的圖書放于操作臺上的凹槽中,等待系統(tǒng)依次讀取圖書信息。全部圖書顯示歸還成功后點(diǎn)擊“退出”按鈕。
續(xù)借:點(diǎn)擊“續(xù)借”按鈕,如果符合續(xù)借條件,直接點(diǎn)擊“續(xù)借”。續(xù)借的圖書將自動調(diào)整還書日期。和外借相同,讀者手機(jī)APP 會同時收到續(xù)借圖書的信息并提示歸還日期。
圖書借閱時間到期前,系統(tǒng)還可自動向讀者發(fā)送短信,提醒讀者及時歸還。以上措施提高了流通效率和管理水平。
圖書館一般平時座位充足,期末座位緊張,還有很多同學(xué)占座位。僅通過座位管理系統(tǒng)還是不能完全控制占座問題,這時就可利用人臉識別技術(shù)的監(jiān)控功能。將人臉識別系統(tǒng)與座位管理系統(tǒng)做對接。讀者在圖書館入口通過人臉識別驗(yàn)證并預(yù)約座位,預(yù)約數(shù)據(jù)進(jìn)入座位監(jiān)控系統(tǒng),系統(tǒng)開啟計時并鎖定讀者所預(yù)約的位置。如果十分鐘后座位狀態(tài)沒有變化,系統(tǒng)自動解鎖此座位,其他讀者可以繼續(xù)對其預(yù)約。連續(xù)失約三次的讀者可以進(jìn)行處罰,比如一周內(nèi)無法預(yù)約座位。這樣可以方便讀者快速預(yù)約圖書館座位,提高閱覽室座位利用率,給讀者創(chuàng)造良好的學(xué)習(xí)環(huán)境。
隨著人臉識別技術(shù)的推廣和成熟,圖書館的刷臉時代已經(jīng)來臨。人臉識別技術(shù)與手機(jī)應(yīng)用、微信小程序等技術(shù)的融合,成為智慧服務(wù)、智慧學(xué)習(xí)、智慧圖書館必不可少的推動力。圖書館作為學(xué)校文獻(xiàn)中心,是知識聚集和傳播的交匯點(diǎn)。在智慧服務(wù)的發(fā)展趨勢下,僅提供信息服務(wù)已經(jīng)不夠了。智慧圖書館立足在信息服務(wù)基礎(chǔ)上,創(chuàng)造性地對知識進(jìn)行搜集、組織、歸類、分析、整合,產(chǎn)出全新的知識增值產(chǎn)品,將技術(shù)轉(zhuǎn)化為更高的智慧服務(wù)能力,全面支持讀者的拓展學(xué)習(xí)和知識創(chuàng)新。