蔡迎春
(上海外國(guó)語(yǔ)大學(xué)圖書(shū)館,上海 200083)
人工智能應(yīng)用于圖書(shū)館,是推動(dòng)智慧圖書(shū)館建設(shè)的重要一環(huán),促使圖書(shū)館由原來(lái)的生長(zhǎng)和轉(zhuǎn)化階段過(guò)渡到超越和變革階段。首先,圖書(shū)館面對(duì)的外在環(huán)境已不再是傳統(tǒng)單一的信息環(huán)境,而是一個(gè)充斥著各種新型技術(shù)和數(shù)字化資源類型的大家庭[1];其次,圖書(shū)館用戶已不再是傳統(tǒng)意義上被動(dòng)的信息接收者,他們對(duì)圖書(shū)館提供資源的多樣性、個(gè)性化、便捷性和精準(zhǔn)性更加關(guān)注。因此,在多載體共存互融的環(huán)境下,對(duì)圖書(shū)館資源采集、組織和服務(wù)提供等專業(yè)性活動(dòng)提出智能化的要求[2]。面對(duì)如此眾多的資源類型,如此海量的書(shū)目數(shù)據(jù),如何優(yōu)化不同類型圖書(shū)配置,如何精準(zhǔn)選書(shū)滿足用戶需求,已經(jīng)成為圖書(shū)館精準(zhǔn)采購(gòu)面臨的問(wèn)題和挑戰(zhàn)。
最早的智能選書(shū)理論是產(chǎn)生于20世紀(jì)70年代的拉·斯氏選書(shū)標(biāo)準(zhǔn)[3],后來(lái)有人應(yīng)用其中的一些內(nèi)容設(shè)計(jì)出適合機(jī)器推理、演算方式的選書(shū)模型。國(guó)內(nèi)選書(shū)專家系統(tǒng)研究始于1982年[4],雖然相關(guān)研究晚于國(guó)外,但是在圖書(shū)選擇專家系統(tǒng)的概念、圖書(shū)“質(zhì)量”的評(píng)價(jià)、復(fù)本的判定算法、館藏結(jié)構(gòu)模型的建立及模擬人腦的選書(shū)過(guò)程等理論和技術(shù)方面已有成型的思路。1988年Fenly等[5]報(bào)告了美國(guó)國(guó)會(huì)圖書(shū)館使用專家系統(tǒng)在其職能部門(mén),如采購(gòu)、編目和期刊等部門(mén)控制中進(jìn)行技術(shù)處理的可行性。雖然早期的智能選書(shū)理論相對(duì)成熟,但圖書(shū)采購(gòu)智能系統(tǒng)主要是基于用數(shù)學(xué)模型解決劣構(gòu)的問(wèn)題,而不是逼真地模擬人腦的選書(shū)過(guò)程,其準(zhǔn)確性難以保證。此外,對(duì)這些劣構(gòu)問(wèn)題(具有非數(shù)值、不適定、離散和開(kāi)放信息等),很難建立傳統(tǒng)的數(shù)學(xué)模型,導(dǎo)致智能選書(shū)的烏托邦狀態(tài)。
隨著大數(shù)據(jù)時(shí)代的到來(lái),圖書(shū)館行業(yè)迎來(lái)了智能化管理創(chuàng)新的機(jī)遇,其文獻(xiàn)資源采訪工作也受到了很大影響。無(wú)論是移動(dòng)互聯(lián)網(wǎng)、大數(shù)據(jù)技術(shù)、云計(jì)算技術(shù)還是人工智能技術(shù)都有了日新月異的發(fā)展,已經(jīng)能對(duì)用戶需求[6]、書(shū)目分類[7]、館藏?cái)?shù)據(jù)[8]、圖書(shū)價(jià)值[9]、經(jīng)費(fèi)分配[10]等作出深度分析。從涉及圖書(shū)采購(gòu)的人工智能理論研究來(lái)看,主要包括三方面:一是從實(shí)證角度,分析影響圖書(shū)采購(gòu)的各種因素,間接提供采購(gòu)決策方法等規(guī)律;二是運(yùn)用數(shù)學(xué)模型或早期人工智能算法對(duì)圖書(shū)采訪進(jìn)行定量研究;三是利用人工智能的神經(jīng)網(wǎng)絡(luò)技術(shù)模擬人類思維,實(shí)現(xiàn)智能采訪。許多數(shù)據(jù)庫(kù)制造商還可以提供圖書(shū)選擇和訂購(gòu)系統(tǒng)。例如,EBSCO的GOBI專家圖書(shū)訂購(gòu)系統(tǒng),可以根據(jù)預(yù)設(shè)的采購(gòu)模式,為專業(yè)圖書(shū)館員和學(xué)科聯(lián)絡(luò)員提供專業(yè)學(xué)科的新書(shū),許多美國(guó)大學(xué)圖書(shū)館就使用GOBI系統(tǒng)來(lái)挑選和訂購(gòu)圖書(shū)[11]。
在此大環(huán)境下,利用計(jì)算機(jī)系統(tǒng)模擬人的思維與行為過(guò)程,從而形成智慧化采訪的技術(shù)取得了一定進(jìn)步。例如,基于改進(jìn)的遺傳算法建立購(gòu)書(shū)模型,從制約用戶購(gòu)買(mǎi)圖書(shū)資源時(shí)的一些規(guī)則性知識(shí),對(duì)影響因素的權(quán)重和閾值進(jìn)行優(yōu)化,以此來(lái)判斷哪些書(shū)應(yīng)該入選,哪些書(shū)不宜采購(gòu)[12];利用神經(jīng)網(wǎng)絡(luò)算法建立基于薦購(gòu)圖書(shū)信息、圖書(shū)受歡迎程度和價(jià)格等多種綜合信息下的圖書(shū)訂購(gòu)決策模型,可以有效排除圖書(shū)訂購(gòu)者個(gè)人喜好因素的干擾[13];根據(jù)深度學(xué)習(xí)理論,讓人工智能基于用戶與圖書(shū)館之間的交互數(shù)據(jù),對(duì)用戶需求做出更準(zhǔn)確的預(yù)測(cè),逐步形成貼近人類認(rèn)知的館藏特征、采集偏好和圖書(shū)評(píng)價(jià)數(shù)據(jù)[14]等。以上這些研究成果均在宏觀層面為圖書(shū)館智能采訪的發(fā)展提供了可供參考的思路。在實(shí)踐操作層面,目前國(guó)內(nèi)已有復(fù)旦大學(xué)、中國(guó)人民大學(xué)、重慶大學(xué)等高校的圖書(shū)館,先后研發(fā)了選書(shū)輔助采訪系統(tǒng),能在一定程度上提高紙質(zhì)圖書(shū)采訪的效率和精準(zhǔn)度[15]。
紙電融合出版是指出版社同種圖書(shū)的紙質(zhì)版和電子版同時(shí)出版的融合發(fā)展的狀態(tài)。由于國(guó)外圖書(shū)館普遍存在單復(fù)本政策,出版社沒(méi)有惜售心理,紙電同步發(fā)售在國(guó)外推行得比較順暢。早在2012年,美國(guó)排名前六的出版社已實(shí)現(xiàn)93%的紙電同步率[16];即使是占據(jù)世界出版市場(chǎng)份額較小的俄羅斯,在2015年的紙電同步率也已達(dá)到45%[17]。很多國(guó)外大型出版集團(tuán)數(shù)字化轉(zhuǎn)型較早,如劍橋大學(xué)出版社早在2014年,紙電同步率已接近100%[18]。部分學(xué)術(shù)性較強(qiáng)的科技與醫(yī)學(xué)類圖書(shū)出版商,如Elsevier和Springer已完全實(shí)現(xiàn)數(shù)字出版,新書(shū)出版更是采取“先出電子書(shū),如果有需求,才印刷紙質(zhì)書(shū)”的策略[19]。國(guó)內(nèi)情況則不同,出版社由于擔(dān)心電子書(shū)銷售影響到紙書(shū)利潤(rùn),一般采取紙書(shū)優(yōu)先模式,真正實(shí)現(xiàn)紙電同步的相對(duì)較少。據(jù)2017年對(duì)36家核心出版社的統(tǒng)計(jì),新書(shū)出版之后的第一年內(nèi)可供電子書(shū)的僅占9.72%,第二年內(nèi)超過(guò)50%,第三年則超過(guò)60%[20]。但是,隨著民眾電子書(shū)閱讀率的不斷提升,以及電子書(shū)市場(chǎng)內(nèi)容供給不斷提質(zhì)增量,近些年紙電融合發(fā)展乃至同步的速度也在加快。據(jù)《中國(guó)圖書(shū)市場(chǎng)報(bào)告》(2019—2020年度),紙電同步銷售的品種占比越來(lái)越高,2017年占比14.3%,到2019年已經(jīng)超過(guò)35%[21]。
在紙電融合出版環(huán)境下,圖書(shū)館文獻(xiàn)資源建設(shè)與傳統(tǒng)紙書(shū)采選有所不同,不但要考慮圖書(shū)的內(nèi)容、用戶借閱頻次,還要考慮圖書(shū)價(jià)格和復(fù)本需求,以及電子書(shū)延遲銷售期間紙本復(fù)本的補(bǔ)充問(wèn)題。對(duì)用戶而言,多一種選擇是一件好事,但是對(duì)采訪人員來(lái)說(shuō),則存在紙電如何優(yōu)先配置的問(wèn)題。目前,已有部分出版社構(gòu)建了自己的線上電子圖書(shū)銷售平臺(tái);還有一些有影響力的館配商也開(kāi)始通過(guò)研發(fā)紙電同步平臺(tái),同步銷售中文紙本與電子圖書(shū),如北京人天書(shū)店“暢想之星”、湖北三星“云田智慧”、浙江新華書(shū)店“蕓臺(tái)購(gòu)”等。目前從圖書(shū)館采購(gòu)角度看,主要存在以下問(wèn)題:①不同館配供應(yīng)商搭建的平臺(tái)之間無(wú)法對(duì)接,而且在與圖書(shū)館管理系統(tǒng)融合對(duì)接方面容易出現(xiàn)分歧和困難;②各大紙電同步平臺(tái)簽約的出版社有限,并且重復(fù),圖書(shū)館無(wú)法做到只使用一個(gè)平臺(tái)采選所需圖書(shū),嚴(yán)重影響圖書(shū)選書(shū)的便利性和效率;③查重困難,無(wú)法與館藏圖書(shū)進(jìn)行對(duì)比和查重。
目前圖書(shū)館紙質(zhì)圖書(shū)普遍是政府招標(biāo)采購(gòu)為主、用戶薦購(gòu)為輔,具體以書(shū)目圈選、現(xiàn)場(chǎng)采購(gòu)、網(wǎng)上采購(gòu)、用戶薦購(gòu)等作為發(fā)現(xiàn)有價(jià)值圖書(shū)資源的主要手段;電子圖書(shū)則從包庫(kù)模式逐漸轉(zhuǎn)向單本采購(gòu)模式。在傳統(tǒng)的選書(shū)模式下,高校圖書(shū)館選書(shū)工作主要由采訪館員和學(xué)科館員根據(jù)往年館藏采選情況、學(xué)校教學(xué)科研需求、學(xué)生的借閱使用等情況進(jìn)行綜合判斷,并確定當(dāng)年采選策略。在實(shí)際圖書(shū)采訪過(guò)程中,這些采訪方式雖都具有一定的優(yōu)點(diǎn),但也存在較大的弊端。
首先,從選書(shū)人員角度,傳統(tǒng)采選對(duì)采訪館員的要求主要體現(xiàn)在學(xué)科專業(yè)水平、知識(shí)結(jié)構(gòu)、判斷能力、經(jīng)驗(yàn)等方面,由于將這些知識(shí)運(yùn)用到實(shí)踐中需要一個(gè)較長(zhǎng)的培養(yǎng)過(guò)程,勢(shì)必要求采訪隊(duì)伍保持相對(duì)穩(wěn)定。然而近年來(lái)采訪館員人數(shù)不斷精簡(jiǎn),加上圖書(shū)館實(shí)行輪崗制度,新老采訪館員更迭較快。此外,在部分選書(shū)環(huán)節(jié)中,院系教師和學(xué)生也會(huì)參與到選書(shū)過(guò)程中,但是教師空閑時(shí)間較少,參與選書(shū)的熱情不高;學(xué)生參與薦書(shū)熱情較高,且對(duì)所學(xué)專業(yè)有一定領(lǐng)悟,但所選圖書(shū)一般為普通讀物和暢銷書(shū),保存收藏價(jià)值不高。其次,從采購(gòu)方式來(lái)看,各種方式優(yōu)點(diǎn)和弊端并存,其中書(shū)目圈選是目前圖書(shū)館主流采購(gòu)模式,但是無(wú)法實(shí)現(xiàn)精準(zhǔn)采選,甚至館配商可能會(huì)有意無(wú)意地過(guò)濾掉部分質(zhì)量好、價(jià)格高的圖書(shū)信息;現(xiàn)場(chǎng)采書(shū)由于圖書(shū)數(shù)量多,采選時(shí)容易漏掉真正需要的圖書(shū);網(wǎng)上采購(gòu)原先只針對(duì)零購(gòu)圖書(shū),但在新型冠狀病毒肺炎疫情之后涌現(xiàn)出一批“云采購(gòu)”平臺(tái),由于品種不全、無(wú)法查重、無(wú)法實(shí)現(xiàn)多平臺(tái)數(shù)據(jù)交互,應(yīng)用局限性大;用戶薦購(gòu)較為符合用戶的利用需求,但是存在重復(fù)、交叉、推薦圖書(shū)年限過(guò)于久遠(yuǎn)無(wú)法獲取等問(wèn)題,同時(shí)工作比較瑣碎、煩雜,零購(gòu)圖書(shū)不在招標(biāo)采購(gòu)范圍內(nèi),致使操作難度大,到書(shū)數(shù)量和質(zhì)量無(wú)法保證。
目前,多數(shù)圖書(shū)館使用的傳統(tǒng)圖書(shū)館管理系統(tǒng)在處理圖書(shū)館專業(yè)活動(dòng)方面凸顯不足:第一,信息資源數(shù)量激增與單個(gè)圖書(shū)館館藏能力有限之間的矛盾加劇,資源需求的普遍性和復(fù)雜性與圖書(shū)館滿足需求的能力形成強(qiáng)烈反差;第二,信息資源的組織僅根據(jù)紙質(zhì)資源的需求進(jìn)行設(shè)計(jì),不適合圖書(shū)館資源載體的多樣性共存,不能面對(duì)所有媒體資源的統(tǒng)一管理和數(shù)據(jù)共享問(wèn)題;第三,傳統(tǒng)的管理系統(tǒng)在系統(tǒng)建設(shè)中沒(méi)有考慮用戶,更側(cè)重以業(yè)務(wù)流程為主要設(shè)計(jì)模塊,不能真正關(guān)注用戶的需求,不能透徹解讀用戶的信息需求和行為。因此,傳統(tǒng)的圖書(shū)館管理體制難以完全滿足圖書(shū)館信息環(huán)境和用戶不斷變化的需求,而現(xiàn)有的數(shù)字圖書(shū)館聯(lián)盟僅限于數(shù)字資源共建和服務(wù)共享,還存在管理系統(tǒng)不統(tǒng)一、共享效果不佳、服務(wù)水平不高等問(wèn)題。
在紙電同步平臺(tái)與圖書(shū)館現(xiàn)有管理系統(tǒng)的兼容對(duì)接問(wèn)題上,圖書(shū)館希望新的平臺(tái)能嵌入圖書(shū)館管理系統(tǒng),而目前國(guó)內(nèi)多個(gè)平臺(tái)并存競(jìng)爭(zhēng)的局面又給這種對(duì)接融合帶來(lái)了一定程度上的困難。在2012年“下一代圖書(shū)館服務(wù)平臺(tái)”(Next Generation Library Services Platforms,LSP)的概念被首次提出后[22],人們已經(jīng)開(kāi)始思考圖書(shū)館自動(dòng)化管理系統(tǒng)的變革和升級(jí),對(duì)融合了紙本資源、電子資源和數(shù)據(jù)資源管理的“下一代圖書(shū)館系統(tǒng)”報(bào)以期待,隨著新的平臺(tái)研發(fā)成功,國(guó)內(nèi)外一些圖書(shū)館已經(jīng)進(jìn)行系統(tǒng)遷移。如香港大學(xué)圖書(shū)館長(zhǎng)聯(lián)席會(huì)所屬的香港8所高校圖書(shū)館聯(lián)合將新平臺(tái)作為區(qū)域共用平臺(tái),在統(tǒng)一工作流程的基礎(chǔ)上開(kāi)展館藏開(kāi)發(fā)和深度合作,拓展共享形式與內(nèi)容,有效實(shí)現(xiàn)管理、資源和服務(wù)等方面的共享[23]。上海阿法迪智能標(biāo)簽系統(tǒng)技術(shù)有限公司也開(kāi)始研發(fā)國(guó)產(chǎn)的“云圖書(shū)智能管理平臺(tái)”,平臺(tái)具備大數(shù)據(jù)分析和電子資源管理功能[24]。同時(shí),國(guó)內(nèi)部分圖書(shū)館(如重慶大學(xué)圖書(shū)館、南京大學(xué)圖書(shū)館等)也參與到智慧管理平臺(tái)的建設(shè),與數(shù)據(jù)庫(kù)商或者平臺(tái)商共同構(gòu)建基于智慧采訪的新一代系統(tǒng)。
紙電同采主要是指基于紙電融合出版,圖書(shū)館依據(jù)館藏策略、選書(shū)原則或用戶需求優(yōu)化圖書(shū)采選類型。從國(guó)內(nèi)當(dāng)前采選現(xiàn)狀來(lái)說(shuō),首先需要優(yōu)先保障紙本圖書(shū),沒(méi)有證據(jù)顯示電子書(shū)在保存和使用方面比紙本書(shū)更可靠,而電子書(shū)獲取的不穩(wěn)定性,導(dǎo)致依靠館際互借等遠(yuǎn)程獲取方式,會(huì)給用戶帶來(lái)諸多不便。所以大多數(shù)高校圖書(shū)館仍然采取較為保守的策略,尤其是對(duì)研究類館藏至少采購(gòu)一個(gè)紙本,以確保本校研究者具有較為可靠的資料來(lái)源。其次需要合理配置電子圖書(shū)。紙本書(shū)不僅占據(jù)了較大的館舍空間,而且到館后需要經(jīng)過(guò)多個(gè)流程的加工和調(diào)撥才能在多校區(qū)之間流通,而電子書(shū)在這方面的投入幾乎為零。因此,對(duì)圖書(shū)館而言,紙電同采是實(shí)現(xiàn)資源優(yōu)化配置的必由之路,越來(lái)越多圖書(shū)館希望通過(guò)紙電同步采購(gòu)和融合建設(shè)來(lái)緩解館舍空間緊張、經(jīng)費(fèi)有限等方面的問(wèn)題,并同時(shí)滿足用戶閱讀需要。而且,當(dāng)前的大數(shù)據(jù)技術(shù)已經(jīng)可以自動(dòng)收集并報(bào)告信息,依托大數(shù)據(jù)分析平臺(tái),人工智能技術(shù)通過(guò)對(duì)已有采訪數(shù)據(jù)進(jìn)行分析,挖掘出一些隱藏的規(guī)律、現(xiàn)象、原理等,進(jìn)一步為紙電同采提供決策依據(jù)。
(1)人工智能測(cè)算電子圖書(shū)發(fā)售時(shí)效。根據(jù)已有研究,超過(guò)一定時(shí)限,一些核心出版社開(kāi)始逐漸釋放一些電子書(shū)。出版后一年內(nèi),出版社可供電子書(shū)的數(shù)量非常少,而紙本書(shū)出版后的2~4年,是電子本發(fā)售比例最高的時(shí)段。如果利用人工智能技術(shù)追蹤各家核心出版社紙本書(shū)配套電子本的發(fā)售時(shí)間,采訪人員可以不需要被動(dòng)等待圖書(shū)供應(yīng)商制作出統(tǒng)一的書(shū)目訂單后再做選擇,而是預(yù)見(jiàn)性地做好經(jīng)費(fèi)規(guī)劃,在獲得最新的電子本書(shū)目數(shù)據(jù)后即可下單。
(2)人工智能預(yù)測(cè)哪些圖書(shū)需要追加復(fù)本。一般來(lái)說(shuō),紙電圖書(shū)在需求上具有較大差異性,理工科用戶更加追求文獻(xiàn)獲取的時(shí)效性和便捷性,對(duì)電子書(shū)的需求量會(huì)比較大;人文社科用戶更偏向紙質(zhì)書(shū)的深度閱讀體驗(yàn);而教學(xué)輔導(dǎo)型圖書(shū),由于紙書(shū)利潤(rùn)較大,電子書(shū)可獲取程度較難。同時(shí),紙電圖書(shū)建設(shè)成本也是資源建設(shè)中必須考慮的問(wèn)題。Miller[25]對(duì)比了高校圖書(shū)館紙質(zhì)圖書(shū)和電子書(shū)的價(jià)格差異,發(fā)現(xiàn)除宗教、哲學(xué)和社會(huì)科學(xué)以外的其他學(xué)科的電子書(shū)價(jià)格高于紙質(zhì)圖書(shū),科學(xué)圖書(shū)的紙電價(jià)格最高。人工智能技術(shù)可以根據(jù)品種和預(yù)算判斷采購(gòu)的內(nèi)容和載體類型,確定是否需要追加復(fù)本。一般情況下,一個(gè)平臺(tái)可以提供5個(gè)電子本的并發(fā)數(shù),如果沒(méi)有電子本,則根據(jù)需要再行添加紙本復(fù)本,但對(duì)于一些暢銷書(shū)和教材、教輔書(shū),仍會(huì)存在供應(yīng)不夠的問(wèn)題。
(3)人工智能對(duì)用戶的需求把握更準(zhǔn)確。實(shí)際工作中,采訪人員需要實(shí)時(shí)關(guān)注用戶需求和館藏歷史記錄。通過(guò)對(duì)用戶借閱數(shù)據(jù)的分析,利用人工智能技術(shù)整體上預(yù)測(cè)用戶閱讀趨勢(shì)的變化,并根據(jù)某類圖書(shū)受用戶歡迎的程度來(lái)及時(shí)調(diào)整采訪策略。同時(shí)也可以對(duì)用戶群體進(jìn)行觀察和分析,對(duì)年齡、學(xué)歷、職業(yè)等海量信息進(jìn)行提取,可以更加準(zhǔn)確地把握用戶的選書(shū)品味,購(gòu)買(mǎi)到此階段用戶最需要的圖書(shū)品種,提升圖書(shū)的利用率。
從傳統(tǒng)采訪技術(shù)的弊端來(lái)看,無(wú)論是書(shū)目圈選、現(xiàn)場(chǎng)采購(gòu)、網(wǎng)上采購(gòu)還是用戶薦購(gòu),無(wú)法很好把握所有學(xué)科和專業(yè)發(fā)展的動(dòng)向,導(dǎo)致對(duì)自己不熟悉或無(wú)興趣的圖書(shū)有可能不采選或采選數(shù)量較少。而用戶薦購(gòu)圖書(shū)本身就帶有偶發(fā)性和自發(fā)性,采選的效率也較低。因此,在采訪過(guò)程中引入科學(xué)決策、統(tǒng)計(jì)分析乃至人工智能思想,讓機(jī)器代替人類去記憶、判斷、推理和決策,是人類一直以來(lái)的夢(mèng)想。20世紀(jì)80年代的選書(shū)專家系統(tǒng)已經(jīng)可以推理和演算,但不能推導(dǎo)出新知識(shí)。實(shí)際上,面對(duì)海量的書(shū)目信息,當(dāng)前圖書(shū)采購(gòu)過(guò)程受到多方面因素影響,已經(jīng)由采訪人員“經(jīng)驗(yàn)式”采購(gòu)轉(zhuǎn)變?yōu)閷W(xué)科發(fā)展、建設(shè)目標(biāo)、用戶個(gè)性化需求等綜合因素下的采購(gòu),具有相當(dāng)?shù)膹?fù)雜性和不確定性。
2006年Hinton等[26]首次提出了深度學(xué)習(xí)的概念,通過(guò)類似人腦的思維方式為解決特征提取問(wèn)題提供了途徑,能夠有效解決若干對(duì)人來(lái)說(shuō)很容易執(zhí)行,但很難形式化描述的任務(wù)。其中的神經(jīng)網(wǎng)絡(luò)算法,因其具有良好的非線性映射能力,能反映出圖書(shū)的各項(xiàng)參數(shù)與能被選中之間的關(guān)系;較快的數(shù)據(jù)處理速度,有利于解決圖書(shū)館供應(yīng)商提供的圖書(shū)數(shù)據(jù)多而雜的問(wèn)題;自適應(yīng)學(xué)習(xí)能力,能夠通過(guò)訓(xùn)練(學(xué)習(xí)),獲得圖書(shū)被采購(gòu)與不被采購(gòu)所具有的相關(guān)知識(shí),因此在2007年就有研究人員基于改進(jìn)的遺傳神經(jīng)網(wǎng)絡(luò)算法,建立了圖書(shū)采購(gòu)模型系統(tǒng)[27]。
把深度學(xué)習(xí)技術(shù)引入圖書(shū)采購(gòu)領(lǐng)域,在處理復(fù)雜決策問(wèn)題時(shí)更具智慧。首先,深度學(xué)習(xí)更容易引發(fā)大數(shù)據(jù)優(yōu)勢(shì)。在不計(jì)算電子書(shū)數(shù)量的情況下,單以一年新增20萬(wàn)種紙質(zhì)書(shū)的數(shù)據(jù)規(guī)模,計(jì)算機(jī)完全能根據(jù)訓(xùn)練模型對(duì)圖書(shū)特征和用戶自身數(shù)據(jù)進(jìn)行有效整理,主動(dòng)匹配用戶特征、行為偏好,滿足不同機(jī)構(gòu)用戶的個(gè)性化需求。這種采訪方式能減少人工采購(gòu)的偏差與失誤,保證館藏結(jié)果與品質(zhì)的穩(wěn)定。其次,深度學(xué)習(xí)在模仿人類認(rèn)知、學(xué)習(xí)和判斷方面,只需通過(guò)類似圖書(shū)MARC的描述方式,就能快速對(duì)大量數(shù)據(jù)進(jìn)行標(biāo)記,有效預(yù)防在海量數(shù)據(jù)預(yù)處理時(shí)所產(chǎn)生的重復(fù)數(shù)據(jù)、數(shù)據(jù)丟失、虛假數(shù)據(jù)等問(wèn)題。再次,深度學(xué)習(xí)能進(jìn)行自主學(xué)習(xí)和進(jìn)化。人工智能能實(shí)時(shí)自動(dòng)追蹤出版社數(shù)據(jù)、專業(yè)作者數(shù)據(jù),發(fā)布最新出版情況和學(xué)科發(fā)展,以最大限度地彌補(bǔ)采訪人員認(rèn)知結(jié)構(gòu)的不足。最后,在輸出智能采訪結(jié)果后,采訪人員如果不滿意,可用參數(shù)調(diào)節(jié)方式進(jìn)行干預(yù),為下一次輸出采訪結(jié)果進(jìn)行校正。
為了最大限度地減少現(xiàn)有采訪模式帶來(lái)的弊端,我們亟需建立一個(gè)方便、快捷,并且全面鏈接出版社、書(shū)商、圖書(shū)館和讀者的紙電融合一體化采選平臺(tái)。這個(gè)平臺(tái)主要依托人工智能技術(shù),由計(jì)算機(jī)來(lái)代替人工,對(duì)各類信息迅速進(jìn)行相關(guān)性比較、權(quán)衡、評(píng)價(jià),最后基于用戶需求,智能化地處理互聯(lián)網(wǎng)的海量信息。隨著圖書(shū)館管理系統(tǒng)的研發(fā)和探索,國(guó)內(nèi)的“新一代智慧圖書(shū)館管理平臺(tái)”也逐漸成熟,以超星公司的“智慧圖書(shū)館管理平臺(tái)”為例,基于微服務(wù)的開(kāi)放式構(gòu)架,可以將紙電資源納入統(tǒng)一管理,并且通過(guò)安裝各類應(yīng)用,允許圖書(shū)館靈活設(shè)計(jì)更適合需求的工作流程。有了這樣的服務(wù)平臺(tái),完全可以將智能選書(shū)理念融入此類智慧采訪平臺(tái)中,根據(jù)使用場(chǎng)景設(shè)計(jì)出最適合使用場(chǎng)景的人工智能算法。采訪人員可以在統(tǒng)一界面下,接收來(lái)自不同出版社、不同學(xué)科分類的圖書(shū)信息;并在決定購(gòu)買(mǎi)后,把在版編目數(shù)據(jù)納入本館的自動(dòng)化管理系統(tǒng)中,書(shū)商通過(guò)查看訂購(gòu)數(shù)據(jù)直接進(jìn)行書(shū)目配送;采訪人員還可以查看用戶留言信息,遇到用戶薦購(gòu)圖書(shū),系統(tǒng)會(huì)直接比對(duì)已有館藏,自動(dòng)進(jìn)行查重;最后整合各出版社不同年份的圖書(shū)信息,并基于圖書(shū)館采訪政策、圖書(shū)出版信息、用戶借閱分析數(shù)據(jù)、經(jīng)費(fèi)分配方案、出版社權(quán)值等自動(dòng)生成智慧書(shū)單,作為圖書(shū)精準(zhǔn)采購(gòu)的依據(jù)。
要實(shí)現(xiàn)精準(zhǔn)采購(gòu)和智能選書(shū),大數(shù)據(jù)和人工智能算法是其中的關(guān)鍵。在大數(shù)據(jù)方面,主要有決策指導(dǎo)數(shù)據(jù)(館藏發(fā)展目標(biāo)、館藏級(jí)別劃分、文獻(xiàn)采選原則、經(jīng)費(fèi)分配和控制、各類文獻(xiàn)選擇標(biāo)準(zhǔn)等)、書(shū)目信息數(shù)據(jù)(各種書(shū)目數(shù)據(jù)、各領(lǐng)域?qū)<覍W(xué)者數(shù)據(jù)等)、推薦分析數(shù)據(jù)(出版社重點(diǎn)圖書(shū)數(shù)據(jù)、各種好書(shū)榜數(shù)據(jù)、網(wǎng)上書(shū)店或館配商銷售數(shù)據(jù)、其他圖書(shū)館訂單數(shù)據(jù)、學(xué)科專業(yè)建設(shè)數(shù)據(jù)、師生薦購(gòu)數(shù)據(jù)、電子圖書(shū)借閱數(shù)據(jù)、社交媒體數(shù)據(jù)等)。在人工智能算法方面常見(jiàn)的有人工神經(jīng)網(wǎng)絡(luò)算法、決策樹(shù)算法、小波分析算法、蟻群算法等幾十種[28]。每種類型的大數(shù)據(jù)、每種具體算法,對(duì)于不同類型的藏書(shū)都有適合自己的使用場(chǎng)景,智能選書(shū)平臺(tái)的構(gòu)建就需要為每一種使用場(chǎng)景配置不同的人工智能算法,用于對(duì)數(shù)據(jù)集進(jìn)行預(yù)測(cè)性分析和規(guī)范性分析。
根據(jù)圖書(shū)館的藏書(shū)結(jié)構(gòu)體系可分為兩大使用場(chǎng)景:一類是基本館藏圖書(shū);另一類是用戶薦購(gòu)圖書(shū)?;攫^藏圖書(shū)是圖書(shū)館館藏資源建設(shè)的主體,集中體現(xiàn)了圖書(shū)館的性質(zhì)和功能,如大型出版物、工具書(shū)和學(xué)術(shù)類圖書(shū)等。此類圖書(shū)的采購(gòu)主要由圖書(shū)館專業(yè)采購(gòu)人員負(fù)責(zé),以保證圖書(shū)館館藏結(jié)構(gòu)的系統(tǒng)性、科學(xué)性和合理性。在實(shí)現(xiàn)智能采購(gòu)的過(guò)程中,首先需要導(dǎo)入政策指導(dǎo)類數(shù)據(jù),這是人工智能算法得以實(shí)施的基礎(chǔ)和依據(jù)。當(dāng)采訪人員將可供書(shū)目導(dǎo)入系統(tǒng)時(shí),系統(tǒng)首先自動(dòng)與政策指導(dǎo)類數(shù)據(jù)進(jìn)行對(duì)比,判斷是否符合學(xué)校的專業(yè)設(shè)置情況、是否符合圖書(shū)館對(duì)出版年的限制、是否已有紙質(zhì)圖書(shū)館藏、是否符合經(jīng)費(fèi)分配原則等,根據(jù)這些情況來(lái)剔除無(wú)效重復(fù)數(shù)據(jù)。同時(shí),系統(tǒng)自動(dòng)利用各種預(yù)設(shè)或?qū)崟r(shí)的推薦分析類數(shù)據(jù),通過(guò)大數(shù)據(jù)分析對(duì)書(shū)目進(jìn)行評(píng)價(jià)。最后,系統(tǒng)自動(dòng)輸出智能選書(shū)訂單,采訪人員進(jìn)一步核查后發(fā)訂。例如,通過(guò)對(duì)學(xué)校重點(diǎn)學(xué)科、碩博士建設(shè)點(diǎn)、本碩博人數(shù)等因素進(jìn)行分析,確定生均圖書(shū)總量和學(xué)科經(jīng)費(fèi)配比,對(duì)各學(xué)科核心出版社、核心作者在內(nèi)的書(shū)目進(jìn)行標(biāo)引,提醒采訪者關(guān)注,計(jì)算機(jī)將自動(dòng)對(duì)比、推斷、匯總和確定購(gòu)買(mǎi)各學(xué)科圖書(shū)種類和經(jīng)費(fèi),根據(jù)用戶需求確定圖書(shū)復(fù)本量,并獲取需要購(gòu)買(mǎi)圖書(shū)的種類和復(fù)本結(jié)果;用戶薦購(gòu)圖書(shū)主要是為了滿足用戶的一般閱讀需求和個(gè)性化需求,不同類型的圖書(shū)館可以根據(jù)自身實(shí)際情況合理設(shè)置可選圖書(shū)的主題、類型和最高價(jià)格,也可以根據(jù)用戶身份設(shè)置不同的用戶群,分配不同的購(gòu)買(mǎi)金額。
人工智能將全面賦能圖書(shū)館專業(yè)活動(dòng)的變革發(fā)展,有力促進(jìn)圖書(shū)館超越現(xiàn)有思維、持續(xù)自我更新、形成新型模式,為圖書(shū)采訪更高效、精準(zhǔn)、智慧和貼近用戶的需求提供全新思路。圖書(shū)館應(yīng)抓住智能時(shí)代的機(jī)遇,通過(guò)對(duì)人工智能技術(shù)的深入研究,在紙電同采的基礎(chǔ)上,將深度學(xué)習(xí)技術(shù)應(yīng)用到具體采選流程中,并研發(fā)紙電融合的一體化智能選書(shū)平臺(tái),勢(shì)必會(huì)有力助推圖書(shū)館傳統(tǒng)采訪工作的轉(zhuǎn)型,不僅能優(yōu)化館藏結(jié)構(gòu),促進(jìn)紙電資源協(xié)調(diào)發(fā)展,還能促進(jìn)選書(shū)效率最大化,使圖書(shū)館逐漸從傳統(tǒng)、數(shù)字向智能圖書(shū)館過(guò)渡,最終向智慧圖書(shū)館邁進(jìn)。