郭楠
摘 要:本文對(duì)數(shù)字圖書館移動(dòng)視覺(jué)搜索的資源庫(kù)建設(shè)機(jī)制進(jìn)行了分析,提出通過(guò)分包理念獲取新的視覺(jué)資源,從眾包任務(wù)的設(shè)計(jì)及眾包結(jié)果的質(zhì)量控制展開(kāi)深入探討,最終提出數(shù)字圖書館移動(dòng)視覺(jué)搜索的資源建設(shè)機(jī)制。
關(guān)鍵詞:數(shù)字圖書館;移動(dòng)視覺(jué)搜索;眾包模式
互聯(lián)網(wǎng)時(shí)代的到來(lái)使得用戶需求,信息形式等發(fā)生了重大變化,數(shù)字圖書館要想在新信息環(huán)境下更好的發(fā)揮作用,必須進(jìn)一步豐富現(xiàn)有圖像與視頻資源,網(wǎng)絡(luò)視覺(jué)資源多樣化,更新速度各不相同。不同來(lái)源的信息結(jié)構(gòu)差異,影響了視覺(jué)對(duì)象資源庫(kù)建設(shè)的基本架構(gòu),現(xiàn)有數(shù)字圖書館在精準(zhǔn)化的用戶需求方面存在較大的不足。移動(dòng)視覺(jué)搜索可解決資源構(gòu)建中的各種場(chǎng)景問(wèn)題。將移動(dòng)智能終端與視覺(jué)搜索技術(shù)結(jié)合能快速幫助用戶找到其感興趣的信息資源。
1 數(shù)字圖書館移動(dòng)視覺(jué)資源構(gòu)建
大數(shù)據(jù)環(huán)境下,數(shù)據(jù)的類型多樣及復(fù)雜性等特征使得數(shù)據(jù)屬性更難把握,現(xiàn)有數(shù)字圖書館內(nèi)容集中與傳統(tǒng)的圖書等文獻(xiàn)資源,隨著搜索引擎的不斷發(fā)展,數(shù)字圖書館在用戶獲取信息的業(yè)務(wù)上失去了優(yōu)勢(shì),其提供的服務(wù)視覺(jué)的直觀性有所欠缺,不能有效的開(kāi)發(fā)移動(dòng)終端視覺(jué)信息服務(wù)。
1.1 移動(dòng)視覺(jué)搜索概述
移動(dòng)視覺(jué)搜索指通過(guò)獲取視覺(jué)對(duì)象資源,在存儲(chǔ)知識(shí)庫(kù)中匹配視覺(jué)對(duì)象,移動(dòng)視覺(jué)搜索技術(shù)可快速方便的連接到用戶所需查詢的信息內(nèi)容。用戶對(duì)視覺(jué)資源進(jìn)行掃描時(shí),圖像識(shí)別軟件自動(dòng)連接到相關(guān)信息內(nèi)容。
移動(dòng)視覺(jué)搜索技術(shù)使得用戶搜索訴求變?yōu)楦由罨膶?shí)體搜索,輸入方式因使用場(chǎng)景的多變性發(fā)生變化,輸入結(jié)果因移動(dòng)設(shè)備的特征變得更加智能。使得信息搜索過(guò)程更加自然化,將人與設(shè)備的信息交互變?yōu)槿伺c人間的信息交流,使得資源檢索過(guò)程更加人性化。
MVS指利用移動(dòng)終端設(shè)備獲取視覺(jué)資源作為檢索項(xiàng),返回相應(yīng)結(jié)果的信息檢索方式,從廣義上理解MVS更貼近于圖情學(xué)科的角度,突破技術(shù)范疇延伸到更廣的服務(wù)理念與運(yùn)作機(jī)制[1]。從資源采集,展示及服務(wù)的角度,MVS充分體現(xiàn)了大數(shù)據(jù)時(shí)代特征。
1.2 基于MVS的視覺(jué)資源庫(kù)構(gòu)建
移動(dòng)視覺(jué)搜索技術(shù)能開(kāi)創(chuàng)數(shù)字圖書館信息的新局面,用戶可任意的訪問(wèn)數(shù)字圖書館的圖書資源,將移動(dòng)視覺(jué)搜索與多個(gè)數(shù)字圖書館相結(jié)合,用戶可同時(shí)獲取整合不同數(shù)字圖書館的相關(guān)資源信息。移動(dòng)視覺(jué)搜索更側(cè)重于視覺(jué)資源的獲取重建,以視覺(jué)資源為主題的資源庫(kù)建設(shè)是構(gòu)建基本的移動(dòng)視覺(jué)搜索的前提。
目前各類搜索引擎,門戶網(wǎng)站等積累了豐富的圖片與視頻資源,博物館與檔案館進(jìn)行了很多數(shù)字化工作,圖博檔已有的數(shù)字信息資源符合大眾提供的現(xiàn)實(shí)世界的視覺(jué)資源,如用戶通過(guò)移動(dòng)終端上傳的圖像等更傾向于非結(jié)構(gòu)化資源,面向結(jié)構(gòu)化數(shù)據(jù),可采用XML/RDF采集,非結(jié)構(gòu)化的數(shù)據(jù)特征,可構(gòu)建相應(yīng)的視覺(jué)資源庫(kù)。
現(xiàn)有資源庫(kù)內(nèi)容難以為視覺(jué)搜索服務(wù)提供支持,已有資源庫(kù)以圖書等文獻(xiàn)資源為主,更新速度慢,圖像資源相對(duì)偏少,檢索入口單一,難以為用戶提供更全面的知識(shí)服務(wù)。不能保障高效率的視覺(jué)對(duì)象資源庫(kù)的建設(shè)。圖書館數(shù)字資源庫(kù)建設(shè)依賴圖書館員,從視覺(jué)資源的采集獲取,標(biāo)引與描述到使用維護(hù),需大量的人力資源參與,對(duì)大數(shù)據(jù)背景下圖書館資源建設(shè)的需求分析基礎(chǔ)上,如何完成圖書館移動(dòng)視覺(jué)資源構(gòu)建值得進(jìn)一步探討
2 移動(dòng)視覺(jué)資源庫(kù)建設(shè)的眾包模式
2.1 眾包模式的概念
企業(yè)或可充分利用網(wǎng)絡(luò)的勞動(dòng)力資源完成工作任務(wù),如IT公司無(wú)法解決的技術(shù)研發(fā)問(wèn)題,可能被外行人快速解決。眾包的概念由杰夫·豪在2006年提出,指企事業(yè)單位將工作任務(wù),以自愿的形式外包給非特定社會(huì)大眾解決。其核心思想是利用群體力量完成機(jī)構(gòu)無(wú)法完成的任務(wù)。眾包跨越了傳統(tǒng)的組織界限[2]。
眾包的理念源于互聯(lián)網(wǎng)的開(kāi)放性,眾包必須依托后臺(tái)系統(tǒng)功能技術(shù)實(shí)現(xiàn),眾包模式的搜索使得新一代搜索方式將人的智慧融入其中,用戶搜索時(shí)會(huì)相應(yīng)的輸入用戶自身的行為數(shù)據(jù),眾包模式的信息資源采集獲取方式有廣泛的應(yīng)用前景。
2.2 眾包模式構(gòu)建視覺(jué)資源庫(kù)的必要性
圖書館,檔案館,門戶網(wǎng)站等都包含了大量的視覺(jué)資源,需大量的檢索篩選才能更好的滿足大眾的社會(huì)信息服務(wù)。目前數(shù)字圖書館的資源多以人工標(biāo)因的形式,各種非結(jié)構(gòu)haunted數(shù)據(jù)為圖書館員的工作增加了難度。因相關(guān)訓(xùn)練集尚不發(fā)達(dá),對(duì)視覺(jué)對(duì)象機(jī)器標(biāo)引的效果不很理想,眾包模式借助大眾參與共同完成資源庫(kù)的構(gòu)建工作,提高了大眾的參與熱情,節(jié)約了圖書館視覺(jué)對(duì)象資源構(gòu)建的成本。
2.3 MVS視覺(jué)資源庫(kù)構(gòu)建的眾包模式應(yīng)用
將眾包技術(shù)與智能終端相結(jié)合蘊(yùn)含巨大的經(jīng)濟(jì)價(jià)值,移動(dòng)視覺(jué)搜索借助大眾參與,使得大眾參與者獲得信息,幫助了數(shù)據(jù)庫(kù)信息的擴(kuò)充。洛杉磯創(chuàng)業(yè)公司開(kāi)發(fā)了圖像識(shí)別應(yīng)用,用關(guān)鍵詞對(duì)圖片進(jìn)行標(biāo)記,CamFind搜索有更多的使用機(jī)制,如用戶用CamFind識(shí)別寵物信息,后臺(tái)搜索到拍攝的物體,準(zhǔn)確的識(shí)別搜索對(duì)象的顏色等信息,用戶可推搜索結(jié)果進(jìn)行翻頁(yè)瀏覽。其結(jié)合眾包模式解決問(wèn)題,CamFind讓相關(guān)專家為用戶反饋的圖像識(shí)別信息結(jié)果,專家無(wú)法給出準(zhǔn)確答案時(shí),APP后臺(tái)讓用戶參與共同識(shí)別圖像,參與識(shí)別圖像的用戶越多,反饋結(jié)果會(huì)更準(zhǔn)確。
為進(jìn)一步豐富館藏?cái)?shù)字資源,上海圖書館推出關(guān)聯(lián)數(shù)據(jù)技術(shù)的開(kāi)放數(shù)字人文服務(wù),關(guān)聯(lián)數(shù)據(jù)技術(shù)用以發(fā)布連接各類數(shù)據(jù)信息,直接通過(guò)搜索可準(zhǔn)確的查找分享相關(guān)聯(lián)信息,用戶可在線查詢自己家族信息,在下側(cè)表區(qū)中現(xiàn)實(shí)檢索的命中記錄,用戶可獲取姓氏概況,相關(guān)家譜等信息[3]。
3 數(shù)字圖書館MVS眾包模式分析
3.1 實(shí)現(xiàn)移動(dòng)視覺(jué)資源庫(kù)構(gòu)建的問(wèn)題
大眾參與的數(shù)字圖書館建設(shè)方式旨在提高館藏利用率,增強(qiáng)用戶的忠誠(chéng)度。數(shù)字圖書館因其非營(yíng)利性,完成海量視覺(jué)資源的收集超出了工作人員的能力范圍,因而需引入眾包模式,使組織利用大眾將分散的資源進(jìn)行聚集,網(wǎng)絡(luò)普及率提高的信息環(huán)境,為移動(dòng)視覺(jué)資源構(gòu)建眾包模式運(yùn)用提供了有利保障。
數(shù)字圖書館移動(dòng)資源庫(kù)建設(shè)需注重視覺(jué)資源的主題選擇,如基于特定主題的圖片收集等,應(yīng)關(guān)注如何通過(guò)設(shè)計(jì)物質(zhì)等建立模式提高用戶主動(dòng)參與熱情,應(yīng)關(guān)注所搜集的視覺(jué)資源內(nèi)容糾錯(cuò),通過(guò)眾包模式實(shí)現(xiàn)數(shù)字圖書館移動(dòng)視覺(jué)資源庫(kù)構(gòu)建需解決眾包任務(wù)的設(shè)計(jì),如何激勵(lì)用戶參與眾包活動(dòng)?如何進(jìn)行眾包結(jié)果的質(zhì)量控制等問(wèn)題。
3.2 眾包建設(shè)的質(zhì)量控制
場(chǎng)景的復(fù)雜性與用戶的不確定性使得眾包服務(wù)出現(xiàn)許多弊端,視覺(jué)資源上傳結(jié)果質(zhì)量參差不齊,如英文視頻信息標(biāo)引,收集的視覺(jué)資源質(zhì)量各有差異。一些參與者為使自己的利益最大化,可能錯(cuò)誤的提高無(wú)關(guān)信息資源。進(jìn)行視覺(jué)對(duì)象資源庫(kù)建設(shè)時(shí)要進(jìn)行眾包結(jié)結(jié)果的質(zhì)量控制,保證其準(zhǔn)確性。為移動(dòng)視覺(jué)搜索服務(wù)提供保障[4]將眾包過(guò)程中的質(zhì)量控制按時(shí)間維度劃分,分別進(jìn)行視覺(jué)資源庫(kù)眾包建設(shè)中質(zhì)量控制。
視覺(jué)資源多基于UGC生成,搜集的高效性很大程度上取決于參與者的自身素質(zhì)。資源搜集前識(shí)別參與者能力,如分析搜索歷史,標(biāo)引歷史等信息,可測(cè)試參與者對(duì)資源標(biāo)引的了解程度?;谧R(shí)別的參與者能力形成個(gè)性化推送。
圖書館視覺(jué)資源構(gòu)建的眾包過(guò)程中,因用戶知識(shí)水平不可識(shí)別,一些參與者僅為獲得報(bào)酬,眾包任務(wù)執(zhí)行中識(shí)別欺騙者非常重要??稍诒姲?xiàng)目集合的任意工作段結(jié)束后,通過(guò)參與者投票的方法評(píng)估參與者的質(zhì)量,組織可在任務(wù)中隨機(jī)添加常識(shí)問(wèn)題,可添加簡(jiǎn)單的動(dòng)植物圖片讓用戶標(biāo)引,如為欺詐者則進(jìn)行剔除,任務(wù)進(jìn)行中識(shí)別欺詐者,可節(jié)約任務(wù)完成時(shí)間成本,添加常識(shí)問(wèn)題時(shí)避免被用戶發(fā)現(xiàn)。
3.3 比較分析
開(kāi)展移動(dòng)視覺(jué)資源建設(shè),眾包模式在圖書館視覺(jué)資源建設(shè)中有廣泛的應(yīng)用前景,視覺(jué)資源收集方式任務(wù)完成時(shí)間方面具有很大的優(yōu)勢(shì)。傳統(tǒng)的方法視覺(jué)資源構(gòu)建多依賴于組織內(nèi)部完成,如某些高校課程教學(xué)視頻,資源構(gòu)建與參與者不僅局限于圖書館員,面向社會(huì)大眾參與用戶。
傳統(tǒng)的內(nèi)部人員構(gòu)建視覺(jué)資源中,某些圖片等資料的整理常需耗費(fèi)很大的人力,眾包項(xiàng)目為圖書館資源建設(shè)提供了豐富的信息資源。依賴圖書館員進(jìn)行視覺(jué)資源構(gòu)建工作時(shí),資源收集工作具有工作時(shí)限,眾包模式跨越了時(shí)空的概念,用戶可隨時(shí)隨地的進(jìn)行圖片上傳,網(wǎng)絡(luò)環(huán)境很好的融合了地域與時(shí)間間隔?;诒姲J降囊曈X(jué)資源構(gòu)建,保障了高質(zhì)量視覺(jué)資源的建設(shè)。
4 結(jié)語(yǔ)
大眾參與者知識(shí)共享為組織資源建設(shè)提供了高質(zhì)量的信息,本文探索高效的視覺(jué)資源庫(kù)的建設(shè)機(jī)制,重點(diǎn)從分包模式的任務(wù)設(shè)計(jì),眾包模式的質(zhì)量控制方面開(kāi)展深入分析,提出移動(dòng)視覺(jué)搜索的資源建設(shè)機(jī)制。
參考文獻(xiàn)
[1]韓璽,齊云飛,朱慶華.移動(dòng)視覺(jué)搜索在國(guó)內(nèi)圖書館應(yīng)用的探索研究[J].圖書館學(xué)研究,2017(07):79-83.
[2]馬騰騰,趙宇翔,朱慶華.國(guó)外移動(dòng)視覺(jué)搜索產(chǎn)品的比較分析研究[J].圖書館雜志,2016,35(09):81-88.
[3]張亭亭,趙宇翔,朱慶華.數(shù)字圖書館移動(dòng)視覺(jué)搜索的眾包模式初探[J].情報(bào)資料工作,2016(04):11-18.
[4]劉喜球,張興旺.移動(dòng)視覺(jué)搜索:“互聯(lián)網(wǎng)+”時(shí)代數(shù)字圖書館信息檢索新模式[J].情報(bào)理論與實(shí)踐,2016,39(05):58-63.