• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      區(qū)域高校圖書館聯(lián)盟文獻(xiàn)傳遞服務(wù)的用戶細(xì)分研究*

      2020-09-03 12:34:52陳添源
      圖書館論壇 2020年9期
      關(guān)鍵詞:細(xì)分聚類成員

      陳添源

      0 引言

      實(shí)現(xiàn)資源共建共享是區(qū)域圖書館聯(lián)盟成立的主要目的,而非返還式電子文獻(xiàn)傳遞服務(wù)則是實(shí)現(xiàn)聯(lián)盟資源共享的主要服務(wù)方式之一。歷經(jīng)多年來(lái)的資源集群化和服務(wù)整合,該服務(wù)已經(jīng)邁入創(chuàng)新發(fā)展階段。對(duì)成員館共建共享的參與程度和用戶獲取稀缺文獻(xiàn)的行為特征等進(jìn)行分析,進(jìn)而有針對(duì)性地提高區(qū)域圖書館聯(lián)盟資源整合效益,已成為推動(dòng)聯(lián)盟邁向精細(xì)化服務(wù)的重要途徑。本研究以福建省高校數(shù)字圖書館(以下簡(jiǎn)稱FULink)文獻(xiàn)傳遞服務(wù)為實(shí)證對(duì)象,依托全聯(lián)盟翔實(shí)的文獻(xiàn)傳遞數(shù)據(jù),通過(guò)爬取技術(shù)獲得更加精準(zhǔn)的用戶行為數(shù)據(jù)集,采用用戶細(xì)分理論和聚類分析方法展開實(shí)證研究,從而為區(qū)域高校圖書館聯(lián)盟創(chuàng)新服務(wù)提供借鑒。

      1 相關(guān)理論研究

      1.1 區(qū)域高校圖書館聯(lián)盟研究

      對(duì)區(qū)域高校圖書館聯(lián)盟的研究,國(guó)內(nèi)集中在聯(lián)盟內(nèi)涵、業(yè)務(wù)定位和功能、運(yùn)營(yíng)模式構(gòu)建、實(shí)現(xiàn)機(jī)制和績(jī)效評(píng)價(jià)等方面。張紅芹等[1]調(diào)研8個(gè)區(qū)域圖書館聯(lián)盟的建設(shè)目標(biāo)、運(yùn)維情況和發(fā)展規(guī)劃,發(fā)現(xiàn)存在成員館參與度低、資源優(yōu)勢(shì)未能互補(bǔ)等困境。羅鈞等[2]分析JALIS聯(lián)盟的館際互借和文獻(xiàn)傳遞服務(wù)網(wǎng),發(fā)現(xiàn)在服務(wù)推廣、用戶體驗(yàn)、效益質(zhì)量等方面需加強(qiáng)。與此同時(shí),對(duì)聯(lián)盟成員館及其用戶的文獻(xiàn)傳遞行為分析研究陸續(xù)展開。張玉霞[3]分析區(qū)域性數(shù)字圖書館聯(lián)盟的文獻(xiàn)傳遞服務(wù),但僅對(duì)各館的申請(qǐng)量、申請(qǐng)文獻(xiàn)類型和回復(fù)情況等進(jìn)行統(tǒng)計(jì)和歸納,尚未就成員館的資源獲取特征和文獻(xiàn)傳遞規(guī)律深入研究。秦霞[4]基于用戶行為還原法構(gòu)建文獻(xiàn)傳遞用戶評(píng)價(jià)與行為關(guān)系的模型,總結(jié)影響文獻(xiàn)傳遞效率的因素,提出保證獲取率、提高服務(wù)效率、整合資源和簡(jiǎn)化流程等建議。陸堯等[5]以BALIS文獻(xiàn)傳遞服務(wù)為對(duì)象,通過(guò)平臺(tái)獲取用戶行為數(shù)據(jù)探討圖書館聯(lián)盟文獻(xiàn)傳遞用戶的信息行為,提出及時(shí)響應(yīng)用戶需求、減少用戶流失和優(yōu)化資源結(jié)構(gòu)等對(duì)策。

      國(guó)外關(guān)于圖書館聯(lián)盟文獻(xiàn)傳遞服務(wù)的研究中,Bangani等[6]通過(guò)對(duì)南非西北大學(xué)文獻(xiàn)傳遞統(tǒng)計(jì)數(shù)據(jù)分析,提出加強(qiáng)宣傳、提升用戶對(duì)館際互借與文獻(xiàn)傳遞認(rèn)識(shí)、通過(guò)技術(shù)革新確保用戶無(wú)縫獲取信息資源,從而在有限的資源采購(gòu)預(yù)算中保持資源保障服務(wù)。Mwaurah 等[7]對(duì)肯尼亞圖書館和信息服務(wù)聯(lián)盟112 個(gè)成員館采用抽樣調(diào)查,證實(shí)受訪者對(duì)數(shù)據(jù)庫(kù)熟悉和使用較少,需要加強(qiáng)基礎(chǔ)設(shè)施更新、產(chǎn)品服務(wù)創(chuàng)新和提升宣傳力度,擴(kuò)展聯(lián)盟數(shù)字資源的可用性和自動(dòng)化服務(wù)能力。Grevatt[8]為研究館際互借率下降趨勢(shì)的原因,從OCLCA 的tlas館際互借系統(tǒng)接口獲取Web報(bào)告,借助數(shù)據(jù)分析工具,通過(guò)觀察使用模式、用戶注冊(cè)特征和取消語(yǔ)言因素等闡述提升博伊西州立大學(xué)艾伯森圖書館的館際互借策略和方法。Ahmadi 等[9]通過(guò)建立帶有季節(jié)變化的數(shù)學(xué)模型預(yù)測(cè)文獻(xiàn)傳遞服務(wù)的需求,提出對(duì)需求的準(zhǔn)確評(píng)估可以提升圖書館輔助用戶科研的能力。MacDonald[10]通過(guò)對(duì)美國(guó)大型綜合性公立大學(xué) 2012~2015 年 11,981 個(gè)文獻(xiàn)傳遞申請(qǐng)記錄的統(tǒng)計(jì)分析發(fā)現(xiàn),用戶對(duì)文獻(xiàn)傳遞服務(wù)的易得性、實(shí)時(shí)性和便捷性等充滿迫切需求,應(yīng)減少中介化和提升交付效益。

      1.2 圖書館用戶細(xì)分研究

      用戶細(xì)分是指營(yíng)銷管理者通過(guò)市場(chǎng)調(diào)研,根據(jù)用戶需求和欲望、使用行為和購(gòu)買習(xí)慣等方面的差異把某一產(chǎn)品或服務(wù)的市場(chǎng)整體劃分為若干用戶群的分類過(guò)程。它是溫德爾·史密斯于1956年提出的市場(chǎng)營(yíng)銷理論[11],目的在于滿足用戶的差異化需求,挖掘潛在的用戶市場(chǎng),促進(jìn)資源配置優(yōu)化,最終提高企業(yè)經(jīng)濟(jì)效益。用戶細(xì)分研究范式在國(guó)內(nèi)外得到廣泛的應(yīng)用。在圖書館領(lǐng)域,用戶細(xì)分應(yīng)用于立法決策服務(wù)營(yíng)銷[12]、移動(dòng)圖書館感知差異性[13]、社交網(wǎng)絡(luò)群體結(jié)構(gòu)[14]、碎片化閱讀行為[15]、情報(bào)服務(wù)[16]等方面的探索,為圖書館的精準(zhǔn)化服務(wù)提供參考。

      1.3 區(qū)域高校圖書館聯(lián)盟用戶細(xì)分的意義

      區(qū)域高校圖書館聯(lián)盟的文獻(xiàn)傳遞服務(wù)作為一種平臺(tái)型服務(wù),用戶細(xì)分理論對(duì)其具有極強(qiáng)的適用性,在文獻(xiàn)傳遞服務(wù)的發(fā)展之初,聯(lián)盟關(guān)注的是用戶拉新和提高用戶知曉程度,以同質(zhì)化需求為主導(dǎo);步入成長(zhǎng)期后,用戶對(duì)聯(lián)盟的某些功能已形成了持續(xù)使用行為,平臺(tái)依賴性開始顯化,用戶需求不再趨同,如能對(duì)成員館進(jìn)行細(xì)分,明晰成員館的需求結(jié)構(gòu),就能精準(zhǔn)化識(shí)別成熟用戶群、潛在用戶群和目標(biāo)用戶群,不斷挖掘潛在需求,既維系老成員館也有利于開拓新的成員館加盟。當(dāng)前研究主要是針對(duì)文獻(xiàn)傳遞服務(wù)的行為數(shù)據(jù)開展定量分析,而圍繞聯(lián)盟的資源保障能力、成員館文獻(xiàn)申請(qǐng)?zhí)卣?、成員館之間的資源互補(bǔ)關(guān)系等領(lǐng)域的研究,囿于數(shù)據(jù)的采集困難,目前鮮有文獻(xiàn)涉及。本研究從文獻(xiàn)傳遞的行為日志出發(fā),基于數(shù)據(jù)統(tǒng)計(jì)特征解析FULink 聯(lián)盟及其成員館之間的文獻(xiàn)傳遞互補(bǔ)效益,從數(shù)據(jù)挖掘、聚類分析和群體畫像可視化等方面闡述聯(lián)盟成員館之間的資源互補(bǔ)關(guān)系,為區(qū)域高校圖書館聯(lián)盟提供可借鑒的文獻(xiàn)傳遞行為實(shí)證分析方法,為高校圖書館聯(lián)盟的持續(xù)發(fā)展和服務(wù)創(chuàng)新提供參考建議。

      2 研究設(shè)計(jì)

      2.1 研究背景和數(shù)據(jù)來(lái)源

      FULink成立于2010年,目前有53家高校圖書館加盟,其構(gòu)建的文獻(xiàn)檢索與傳遞平臺(tái)以一站式檢索框的形式直接嵌入成員館網(wǎng)站首頁(yè),成為加盟館用戶獲取文獻(xiàn)資源的重要入口。其業(yè)務(wù)運(yùn)行機(jī)制為:用戶通過(guò)成員館主頁(yè)或聯(lián)盟門戶網(wǎng)站檢索文獻(xiàn),本館已購(gòu)數(shù)字資源的可直接查看館藏信息或下載全文,缺藏?cái)?shù)字資源的則需要提交文獻(xiàn)傳遞申請(qǐng),F(xiàn)ULink中心門戶調(diào)度有館藏的成員館服務(wù)器自動(dòng)響應(yīng),聯(lián)盟內(nèi)均缺藏的文獻(xiàn)將通過(guò)全國(guó)參考咨詢聯(lián)盟響應(yīng)傳遞。本研究通過(guò)Web開發(fā)者工具分析FULink 后臺(tái)日志頁(yè)面,對(duì)每條傳遞行為數(shù)據(jù)進(jìn)行HTML代碼解析和相應(yīng)數(shù)據(jù)庫(kù)字段設(shè)計(jì),共設(shè)計(jì)存儲(chǔ)字段17個(gè)。爬取的字段分為3類:第一類是申請(qǐng)信息,包含申請(qǐng)ID、申請(qǐng)用戶名、申請(qǐng)成員館、申請(qǐng)IP、申請(qǐng)時(shí)間、申請(qǐng)標(biāo)題、申請(qǐng)內(nèi)容、傳遞郵箱和申請(qǐng)文獻(xiàn)類型;第二類是響應(yīng)信息,包含響應(yīng)狀態(tài)、響應(yīng)題名、響應(yīng)內(nèi)容、響應(yīng)成員館、響應(yīng)時(shí)間、響應(yīng)處理人員、響應(yīng)文獻(xiàn)類型、響應(yīng)附件類型;第三類為文獻(xiàn)傳遞服務(wù)的評(píng)價(jià)和滿意度值,由于實(shí)際獲取的此類數(shù)據(jù)值較少,本文只對(duì)前兩類字段采集分析。

      2.2 變量選取理論依據(jù)和設(shè)計(jì)

      用戶細(xì)分實(shí)證研究主要分為事前細(xì)分和事后細(xì)分[17]兩大類。事前細(xì)分以用戶行為的定性分析為依據(jù),事后細(xì)分則采集用戶使用行為的分類變量和關(guān)鍵性描述信息,依賴多元統(tǒng)計(jì)分析技術(shù)來(lái)識(shí)別。其主流研究工具有AIO(activity,interest,opinion)細(xì)分 和 VALS(value and lifestyles)細(xì)分,其中VALS又被修正為僅與用戶行為有關(guān)的VALS2 細(xì)分。該范式認(rèn)為,細(xì)分市場(chǎng)基于兩個(gè)因素:消費(fèi)者的資源和自我導(dǎo)向[18]。消費(fèi)者的資源包括收入、教育、自信、健康、購(gòu)買愿望、智力和能力水平;自我導(dǎo)向被解釋為用戶行為、價(jià)值觀念和激勵(lì)因素等,用戶類型據(jù)此被對(duì)應(yīng)劃分為以原則為導(dǎo)向、以地位為導(dǎo)向和面向行為3類。

      將區(qū)域高校圖書館聯(lián)盟的成員館視為一個(gè)單體用戶,將前述采集的可獲取字段與VALS2細(xì)分范式的兩個(gè)因素一一對(duì)應(yīng)重構(gòu),成員館基本屬性對(duì)應(yīng)于“消費(fèi)者的資源”、文獻(xiàn)申請(qǐng)和傳遞情況對(duì)應(yīng)于“自我導(dǎo)向”的用戶行為及激勵(lì)因素等3類行為特征變量,以此組成成員館用戶細(xì)分的描述體系。具體細(xì)分如下:成員館基本屬性:學(xué)校層次,院校類型,用戶數(shù),研究生數(shù),教師數(shù),加盟時(shí)間,館藏圖書,館藏期刊。文獻(xiàn)申請(qǐng)行為:文獻(xiàn)申請(qǐng)數(shù),申請(qǐng)IP數(shù),申請(qǐng)郵箱個(gè)數(shù),圖書申請(qǐng)數(shù),期刊申請(qǐng)數(shù),學(xué)位論文申請(qǐng)數(shù),專利申請(qǐng)數(shù),報(bào)紙申請(qǐng)數(shù),標(biāo)準(zhǔn)申請(qǐng)數(shù),會(huì)議論文申請(qǐng)數(shù)。文獻(xiàn)傳遞行為:文獻(xiàn)傳遞數(shù),文獻(xiàn)保障時(shí)效,圖書傳遞數(shù),期刊傳遞數(shù),學(xué)位論文傳遞數(shù),專利傳遞數(shù),報(bào)紙傳遞數(shù),標(biāo)準(zhǔn)傳遞數(shù),會(huì)議論文傳遞數(shù)。其中,成員館基本屬性采集自其所在學(xué)校官方網(wǎng)站簡(jiǎn)介、網(wǎng)絡(luò)調(diào)研和FULink 工作委員會(huì)提供的數(shù)據(jù)。文獻(xiàn)保障時(shí)效用于衡量成員館的資源保障效益,選取文獻(xiàn)申請(qǐng)與傳遞的時(shí)差值在8小時(shí)以內(nèi)的記錄數(shù),計(jì)算和匯總成員館文獻(xiàn)傳遞的時(shí)差值,然后按照7級(jí)權(quán)重賦值,累加統(tǒng)計(jì)得出最終值。

      2.3 研究框架

      確立用戶細(xì)分指標(biāo)體系后,提出圖1所示的實(shí)證研究框架。在遵循數(shù)據(jù)合理使用、用戶隱私保護(hù)和數(shù)據(jù)規(guī)范控制等前提下,以此為主體研究路線,選取R語(yǔ)言平臺(tái)的網(wǎng)頁(yè)爬取工具從FULink后臺(tái)獲取、清洗和存儲(chǔ)文獻(xiàn)傳遞服務(wù)的日志數(shù)據(jù),利用Tableau大數(shù)據(jù)可視化平臺(tái)的數(shù)據(jù)匯聚和透視功能形成聯(lián)盟文獻(xiàn)傳遞行為數(shù)據(jù)集,一方面從文獻(xiàn)類型、文獻(xiàn)保障時(shí)效和文獻(xiàn)流向等角度分析FULink 的稀缺資源保障效益;另一方面按照用戶細(xì)分指標(biāo)體系抽取、計(jì)算和存儲(chǔ)對(duì)應(yīng)指標(biāo)值,依據(jù)數(shù)據(jù)分布特征選型適宜的聚類模型算法,對(duì)所有成員館的行為數(shù)據(jù)展開基于聚類的成員館用戶細(xì)分,對(duì)比分析、可視化展示不同聚類的文獻(xiàn)獲取與傳遞行為特征,最后根據(jù)細(xì)分結(jié)果提出相應(yīng)的文獻(xiàn)傳遞差異化服務(wù)策略。

      圖1 區(qū)域高校圖書館聯(lián)盟文獻(xiàn)傳遞服務(wù)的用戶細(xì)分實(shí)證框架

      3 實(shí)證分析

      3.1 FULink平臺(tái)的資源保障特征分析

      (1)文獻(xiàn)申請(qǐng)總量和文獻(xiàn)類型分布。截至2018 年 12 月 31 日,F(xiàn)ULink 所有成員館申請(qǐng)傳遞的文獻(xiàn)量共計(jì) 2,929,789 條,分 7 種文獻(xiàn)類型,分類匯聚情況如表1所示。其中,期刊、學(xué)位論文和圖書的申請(qǐng)量居前三位,遠(yuǎn)超其他類型。文獻(xiàn)申請(qǐng)總量在2014 年和2016 年達(dá)到峰值,2017年后下降趨勢(shì)明顯。

      表1 FULink聯(lián)盟文獻(xiàn)傳遞申請(qǐng)類型統(tǒng)計(jì)(2012.09-2018.12) (單位:條)

      (2)文獻(xiàn)傳遞時(shí)效。選取文獻(xiàn)申請(qǐng)和響應(yīng)時(shí)間兩個(gè)字段計(jì)算差值,大部分介于0~6小時(shí),見圖2。1小時(shí)之內(nèi)響應(yīng)的占16.81%,4小時(shí)以內(nèi)的達(dá)到31.21%,1 天之內(nèi)的文獻(xiàn)響應(yīng)高達(dá)98.92%。以2018年為例,平均文獻(xiàn)響應(yīng)時(shí)間為7.7 小時(shí)。通過(guò)文獻(xiàn)調(diào)研[19]和咨詢同類型聯(lián)盟,相比國(guó)內(nèi)其他文獻(xiàn)傳遞平臺(tái),F(xiàn)ULink文獻(xiàn)傳遞的時(shí)效最高,文獻(xiàn)響應(yīng)快速有效,較好地保障了成員館缺藏文獻(xiàn)的獲取需求。

      圖2 FULink中心平臺(tái)文獻(xiàn)傳遞響應(yīng)時(shí)效分布圖 (單位:小時(shí))

      (3)文獻(xiàn)整合效益。為可視化展示FULink的文獻(xiàn)供給保障能力,采用和弦圖呈現(xiàn)FULink與各成員館的文獻(xiàn)傳遞流向和數(shù)量關(guān)系。和弦圖常被用于表示兩者間的數(shù)據(jù)關(guān)系和流量,不同顏色的每個(gè)圓環(huán)表示一個(gè)節(jié)點(diǎn),弧長(zhǎng)及標(biāo)尺表示數(shù)據(jù)量大小。環(huán)內(nèi)側(cè)不同顏色的連接帶表示數(shù)據(jù)流向、數(shù)量級(jí)和位置信息。在R語(yǔ)言平臺(tái)上通過(guò)RODBC函數(shù)包連接存儲(chǔ)數(shù)據(jù)庫(kù),按自然年匯聚FULink平臺(tái)與各成員館的文獻(xiàn)傳遞數(shù)值鄰接矩陣,繪制結(jié)果見圖3。成員館FZU(以字符簡(jiǎn)寫代表成員館,下同)、FJNU 和FAFU申請(qǐng)的文獻(xiàn)量最多,其他館的申請(qǐng)量從圓環(huán)節(jié)點(diǎn)下方自右向左依次遞減。分析(圖3下方每個(gè)圓環(huán)節(jié)點(diǎn)表示的)成員館歷年文獻(xiàn)申請(qǐng)數(shù)量,條狀帶呈現(xiàn)逐年遞減趨勢(shì)。從和弦圖上半?yún)^(qū)域7個(gè)表示FULink 平臺(tái)每年傳遞量的圓環(huán)節(jié)點(diǎn)觀察,平臺(tái)響應(yīng)的文獻(xiàn)申請(qǐng)總量除2012 年剛起步數(shù)量較少外,其他歷年基本持平,2016年后穩(wěn)中有降。

      3.2 FULink成員館的用戶細(xì)分

      (1)數(shù)據(jù)特征分析與算法選擇 。根據(jù)上述確立的成員館用戶細(xì)分指標(biāo),對(duì)現(xiàn)有數(shù)據(jù)集按設(shè)計(jì)字段抽取相應(yīng)數(shù)據(jù)匯聚到Tableau上,數(shù)據(jù)導(dǎo)入并連接R語(yǔ)言平臺(tái)展開聚類前的描述性統(tǒng)計(jì)分析,如表2所示。標(biāo)準(zhǔn)方差和均值較大,各個(gè)字段經(jīng)過(guò)正態(tài)分布檢驗(yàn),大多數(shù)字段屬于偏態(tài)分布。

      基于表2數(shù)據(jù)的分布特征和聚類分析的模型特點(diǎn),個(gè)別成員館在文獻(xiàn)傳遞數(shù)、文獻(xiàn)申請(qǐng)數(shù)取值較大時(shí),聚類分析時(shí)在其他特征字段上的取值也會(huì)較大。為取消量綱不一致的影響,采用scale 函數(shù)對(duì)所有待聚類數(shù)據(jù)標(biāo)準(zhǔn)化處理,實(shí)現(xiàn)特征縮放達(dá)到聚類結(jié)果權(quán)重一致。然后通過(guò)get_clust_tendency函數(shù)評(píng)估數(shù)據(jù)集是否具備聚類的可能性。運(yùn)算獲取的hopkins_stat值為0.134(<0.5),表明數(shù)據(jù)高度可聚合。結(jié)合plot子字段匯聚圖來(lái)看,存在高度可聚類。

      圖3 FULink中心門戶傳遞至各成員館的歷年文獻(xiàn)量統(tǒng)計(jì)(2012~2018)

      表2 FULink資源特征聚類變量描述性統(tǒng)計(jì)(2012.09-2018.12) (單位:條)

      因?yàn)榫垲惙治鰧儆跓o(wú)監(jiān)督學(xué)習(xí)的算法,對(duì)于某一類樣本應(yīng)歸屬于哪一個(gè)聚類并無(wú)任何先驗(yàn)知識(shí),加之實(shí)證數(shù)據(jù)集中存在較多極端值,易對(duì)聚類分析產(chǎn)生離群點(diǎn)干擾。故此,參照相關(guān)聚類分析實(shí)證,采用Kmeans算法對(duì)數(shù)據(jù)集聚類,為確保聚類質(zhì)量,一般多次使用隨機(jī)種子確定待選的簇?cái)?shù),再使用輪廓系數(shù)評(píng)估聚類結(jié)果的優(yōu)劣。本文采用肘方法(elbow)確立最佳簇?cái)?shù)。肘方法原理為:在給定的k>0情況下,計(jì)算族內(nèi)方差和var(k),每增加簇?cái)?shù)都有助于降低內(nèi)方差之和。而當(dāng)曲線出現(xiàn)第一個(gè)拐點(diǎn),即為最佳的簇?cái)?shù)。故此,采用R語(yǔ)言的sjPlot包sjc.elbow函數(shù)預(yù)估聚類數(shù),初始設(shè)定為15個(gè),如圖4(上)的折線圖所示??梢钥闯?,最佳聚類數(shù)為3個(gè)或者4個(gè)。據(jù)此分別調(diào)用kmeans函數(shù)聚類,兩次聚類結(jié)果的可視化如圖4(中、下)所示。factoextra的fviz_nbclust 函數(shù)確定最佳的聚類數(shù),方法設(shè)置為組內(nèi)平方差(WSS)方法。從圖4的聚類分布看出,聚類個(gè)數(shù)為3、4時(shí),F(xiàn)ZU數(shù)據(jù)點(diǎn)因各項(xiàng)字段值偏高離群而產(chǎn)生被剝離的情況。從聚類結(jié)果的分布圖觀察,95%的數(shù)據(jù)分布在右側(cè)空間內(nèi),而剩下的5%的數(shù)據(jù)分布在其余的大空間內(nèi)(限于篇幅本文不展示后續(xù)聚類結(jié)果)。當(dāng)聚類個(gè)數(shù)不斷增加時(shí),Kmeans模型繼續(xù)對(duì)剩余95%空間內(nèi)的數(shù)據(jù)往下細(xì)分,因?yàn)椴町愔荒茉谶@些數(shù)據(jù)之間繼續(xù)下探和剝離。結(jié)合FULink 的業(yè)務(wù)發(fā)展路徑、實(shí)際的數(shù)據(jù)分布和圖4(上)肘拐點(diǎn)曲線變化趨勢(shì),本文實(shí)證傾向于將圖4(中、下)3 個(gè)離群點(diǎn)聚為一類,而對(duì)剩余的數(shù)據(jù)點(diǎn)再次分類。

      (2)聚類分析。經(jīng)過(guò)多個(gè)已有的聚類算法篩選[20]和數(shù)據(jù)集的多次測(cè)試,本文采用RForML深度學(xué)習(xí)的聚類模型包flexclust,其kcca函數(shù)內(nèi)置的神經(jīng)氣體(Neural Gas)算法符合本次實(shí)證需要的聚類選擇,該方法的主要思想是通過(guò)評(píng)估在先前的適應(yīng)步驟期間收集的局部統(tǒng)計(jì)測(cè)量值,將新單元連續(xù)地添加到最初的小型網(wǎng)絡(luò)中。它引入競(jìng)爭(zhēng)神經(jīng)網(wǎng)絡(luò)機(jī)制,最接近數(shù)據(jù)點(diǎn)的神經(jīng)元競(jìng)爭(zhēng)獲勝并被激活,朝向數(shù)據(jù)點(diǎn)移動(dòng)從而形成聚類[21]。據(jù)此,通過(guò)set.seed函數(shù)設(shè)置隨機(jī)種子以復(fù)現(xiàn)本次聚類,遵循類內(nèi)相似和類間分類的聚類原則,基于前述分析的限制條件等先驗(yàn)知識(shí),調(diào)用kcca函數(shù)運(yùn)算獲取的最終聚類結(jié)果為4 個(gè)。將聚類結(jié)果數(shù)據(jù)導(dǎo)入barchart函數(shù),在R語(yǔ)言平臺(tái)上可視化展示的聚類段剖圖如圖5所示。運(yùn)用R語(yǔ)言的MASS包將上述用戶細(xì)分聚類結(jié)果展開顯著性檢驗(yàn)。在α=0.05的水平上,除院校類型外,在學(xué)校層次、加入聯(lián)盟時(shí)間、用戶數(shù)、研究生數(shù)、教師數(shù)、館藏圖書和館藏期刊等均存在顯著差異。這說(shuō)明FULink成員館在文獻(xiàn)傳遞服務(wù)上的申請(qǐng)和傳遞行為與上述幾個(gè)因素緊密相關(guān),區(qū)域高校圖書館聯(lián)盟服務(wù)于每個(gè)細(xì)分市場(chǎng)的差異營(yíng)銷可據(jù)此展開討論。

      圖4 聚類結(jié)果為4個(gè)的可視化展示

      圖5 FULink成員館文獻(xiàn)傳遞服務(wù)的聚類段剖圖

      (3)用戶細(xì)分結(jié)果及可視化展示。根據(jù)圖5各字段均值分布和柱狀圖長(zhǎng)短情況,參照用戶細(xì)分中對(duì)于用戶生命周期“初生期、成長(zhǎng)期、穩(wěn)定期、成熟期、衰退期和流失期”的定義和命名方式[22],結(jié)合文獻(xiàn)傳遞服務(wù)的特征,以用戶行為狀態(tài)和類型的劃分邏輯將4個(gè)用戶細(xì)分市場(chǎng)做如下命名:聚類1除了少數(shù)幾個(gè)指標(biāo)外,各項(xiàng)指標(biāo)均超過(guò)(紅點(diǎn))均值且是所有聚類最高的,可命名為成熟期成員館;聚類2 各項(xiàng)指標(biāo)均未達(dá)到均值,此聚類成員大部分是剛加入FULink 的新成員館,可命名為初生期成員館;聚類3同聚類2相比,傳遞效益和各種文獻(xiàn)類型傳遞數(shù)等字段的均值相對(duì)較高,文獻(xiàn)申請(qǐng)量和傳遞量近幾年都處于持續(xù)增長(zhǎng)態(tài)勢(shì),可命名為成長(zhǎng)期成員館;聚類4 除加盟時(shí)長(zhǎng)字段外,各種文獻(xiàn)類型申請(qǐng)傳遞數(shù)均處于均值附近,申請(qǐng)IP、申請(qǐng)郵箱數(shù)、文獻(xiàn)申請(qǐng)量等指標(biāo)基本穩(wěn)定持平,可命名為穩(wěn)定期成員館。據(jù)此,采用雷達(dá)圖將聚類結(jié)果以畫像集中展示,在R語(yǔ)言平臺(tái)上調(diào)用ggradar函數(shù),用戶細(xì)分的4個(gè)聚類在各個(gè)字段的指標(biāo)值表現(xiàn)見圖6。

      (4)成員館細(xì)分市場(chǎng)之間的申請(qǐng)與傳遞關(guān)系分析。經(jīng)過(guò)上述基于聚類分析的用戶細(xì)分,通過(guò)Tableau 平臺(tái)將成員館匯聚到每個(gè)細(xì)分市場(chǎng),抽取相應(yīng)字段計(jì)算得出文獻(xiàn)申請(qǐng)與傳遞關(guān)系表(表3)。從數(shù)量關(guān)系來(lái)看,成熟期成員館的文獻(xiàn)申請(qǐng)和傳遞量最高,穩(wěn)定期和成長(zhǎng)期成員館的文獻(xiàn)申請(qǐng)和傳遞比基本持平,初生期成員館的文獻(xiàn)申請(qǐng)和傳遞比最高。

      圖6 FULink各成員館聚類結(jié)果畫像展示雷達(dá)圖

      表3 FULink成員館細(xì)分市場(chǎng)之間的文獻(xiàn)申請(qǐng)與傳遞關(guān)系表(2012.09~2018.12) (單位:條)

      3.3 FULink聯(lián)盟文獻(xiàn)傳遞細(xì)分市場(chǎng)特征分析

      (1)中心門戶資源保障特征。從實(shí)證分析獲取的結(jié)果來(lái)看,F(xiàn)ULink 文獻(xiàn)傳遞服務(wù)具備了“快傳”的核心特質(zhì),契合了用戶獲取缺藏文獻(xiàn)的時(shí)效性需求,讓成員館用戶體驗(yàn)到了資源整合獲取的便捷性和易用性,已然成為FULink 聯(lián)盟的核心服務(wù)。雖然中心門戶與各成員館的和弦圖關(guān)系展示結(jié)果再次印證了圖書館聯(lián)盟文獻(xiàn)傳遞量日益下降且不可逆轉(zhuǎn)的事實(shí)[23],但這不排除與學(xué)術(shù)文獻(xiàn)開放獲取加速、互聯(lián)網(wǎng)學(xué)術(shù)文獻(xiàn)商業(yè)性提供蓬勃發(fā)展等因素拓展了其他獲取文獻(xiàn)渠道緊密相關(guān)[24-25]。而總體來(lái)說(shuō),本次實(shí)證從定量分析上清晰展現(xiàn)了以FULink 為代表的區(qū)域高校圖書館聯(lián)盟帶給成員館高效的文獻(xiàn)傳遞服務(wù)保障。

      (2)成員館用戶細(xì)分市場(chǎng)1:成熟期成員館特征(6%)。該聚類包含F(xiàn)ZU、FJNU和FAFU3個(gè)成員館,文獻(xiàn)傳遞申請(qǐng)總量占FULink 平臺(tái)的67.5%。從3館的自身?xiàng)l件來(lái)看,其均為FULink的發(fā)起館,館藏資源總量最大,服務(wù)的用戶數(shù)最多。從圖6可以看出,該聚類成員館期刊、學(xué)位論文和會(huì)議論文等文獻(xiàn)類型的傳遞保障率最好,雖然其他文獻(xiàn)類型傳遞數(shù)有短板,但總的文獻(xiàn)傳遞效益最高。該聚類成員館用戶的資源獲取行為特征:申請(qǐng)文獻(xiàn)傳遞的郵箱數(shù)(71.71%)和IP 數(shù)(88.23%)占比最高,結(jié)合郵箱個(gè)數(shù)、用戶數(shù)、教師數(shù)等指標(biāo)分析,該聚類用戶申請(qǐng)郵箱個(gè)數(shù)均值超過(guò)1 個(gè),而且文獻(xiàn)申請(qǐng)類型覆蓋面廣,還出現(xiàn)了同一位用戶在FULink 的不同成員館申請(qǐng)文獻(xiàn)的行為特征。對(duì)申請(qǐng)時(shí)段的數(shù)據(jù)下探抽取分析發(fā)現(xiàn),請(qǐng)求時(shí)間分布于每日的9~24點(diǎn),1~7點(diǎn)也有一定的申請(qǐng)量。FULink平臺(tái)已成為該聚類成員館用戶資源檢索的主要入口和稀缺文獻(xiàn)獲取的首要途徑,平臺(tái)用戶粘性較強(qiáng),使用率高。

      (3)成員館用戶細(xì)分市場(chǎng)2:穩(wěn)定期成員館特征(19%)。該聚類涵蓋FJMU、FJTCM、FJUT和FJJXU等10個(gè)成員館,以FULink聯(lián)盟的發(fā)起館居多。其館藏資源、用戶數(shù)、教師數(shù)和研究生數(shù)處于FULink 聯(lián)盟的平均值,文獻(xiàn)傳遞申請(qǐng)量占比達(dá)到了15.97%。各項(xiàng)行為指標(biāo)數(shù)值均處于平均值附近,文獻(xiàn)傳遞效益略顯乏力且不及成長(zhǎng)期成員館。該聚類成員館用戶的資源獲取行為特征為:申請(qǐng)文獻(xiàn)傳遞的郵箱數(shù)(17.85%)和IP 數(shù)(0.06%)高于成長(zhǎng)期成員館,文獻(xiàn)申請(qǐng)數(shù)量持續(xù)平穩(wěn),覆蓋了各種文獻(xiàn)類型,請(qǐng)求時(shí)間集中于9~11 點(diǎn)、15~16 點(diǎn)、20~22 點(diǎn)3 個(gè)時(shí)段,根據(jù)網(wǎng)絡(luò)采樣調(diào)研,其他時(shí)段請(qǐng)求較少的原因是受到VPN體驗(yàn)不佳、網(wǎng)絡(luò)環(huán)境不穩(wěn)定和校園網(wǎng)臨時(shí)關(guān)閉等因素限制。這些都充分說(shuō)明該細(xì)分市場(chǎng)的成員館在平臺(tái)的使用率高,對(duì)FULink 稀缺文獻(xiàn)的保障力認(rèn)知程度較高,但從該聚類用戶郵箱的文獻(xiàn)傳遞數(shù)來(lái)看,用戶流失較高,文獻(xiàn)申請(qǐng)量下降較快,近兩年申請(qǐng)總量均低于成長(zhǎng)期成員館。

      (4)成員館用戶細(xì)分市場(chǎng)3:成長(zhǎng)期成員館特征(13%)。該聚類包含XMU、HQU和JMU等7個(gè)成員館。其館藏資源、用戶數(shù)、教師數(shù)和研究生數(shù)僅次于成熟期成員館,盡管加入聯(lián)盟時(shí)間較短,但文獻(xiàn)申請(qǐng)量占據(jù)了12.17%,最為顯著的特征為文獻(xiàn)傳遞效益較好,尤其是圖書、標(biāo)準(zhǔn)、報(bào)紙、專利等類型的傳遞供給,在圖6中與成熟期聚類形成資源互補(bǔ),有效豐富了FULink 平臺(tái)的稀缺文獻(xiàn)傳遞類型。該聚類成員館用戶的資源獲取行為特征為:申請(qǐng)文獻(xiàn)傳遞的郵箱數(shù)(8.99%)和IP 數(shù)(0.05%)占比低于平均值,除期刊外,其他類型的文獻(xiàn)申請(qǐng)量接近平均值且較均衡,文獻(xiàn)申請(qǐng)時(shí)間多集中于10~11點(diǎn)、20~22點(diǎn)和15~17點(diǎn)3個(gè)時(shí)段,該聚類成員館的用戶使用時(shí)段和頻率尚處于上升期,對(duì)于FULink 在稀缺文獻(xiàn)保障上的認(rèn)知程度不夠。

      (5)成員館用戶細(xì)分市場(chǎng)4:初生期成員館特征(62%)。該聚類包含上述聚類之外的本科、??坪透呗氃盒5阮愋偷?3個(gè)成員館。以新加入FULink的成員館居多,文獻(xiàn)傳遞申請(qǐng)量也僅占比4.36%。從圖6可以看出,各項(xiàng)行為指標(biāo)值尚處于起步階段。該聚類成員館用戶的資源獲取行為特征為:申請(qǐng)文獻(xiàn)傳遞的郵箱數(shù)(1.45%)占比低,IP數(shù)(11.66%)因該細(xì)分市場(chǎng)的成員館多而占比高,文獻(xiàn)請(qǐng)求時(shí)間集中于10~11點(diǎn)、15~16點(diǎn)兩個(gè)時(shí)段,其申請(qǐng)總量年均維持2000 條左右。該聚類的成員館用戶還處于FULink 的認(rèn)知和使用初期,正在逐步與FULink 平臺(tái)進(jìn)行磨合和館藏資源需求調(diào)適。因該聚類成員館的館藏資源規(guī)模相對(duì)比較小,從表3 得出的申請(qǐng)傳遞比來(lái)看,F(xiàn)ULink能極大程度保障該聚類的缺藏文獻(xiàn)需求。

      4 區(qū)域高校圖書館聯(lián)盟文獻(xiàn)傳遞服務(wù)的用戶細(xì)分策略

      要深入推進(jìn)區(qū)域高校圖書館聯(lián)盟文獻(xiàn)傳遞服務(wù),需要加強(qiáng)中心門戶和成員館的館藏資源對(duì)接與嵌入,提高整合后各種文獻(xiàn)類型的可見性和易獲取性,尤其在會(huì)議論文、專利、標(biāo)準(zhǔn)和報(bào)紙等文獻(xiàn)類型。在傳遞時(shí)效方面,要提高文獻(xiàn)傳遞任務(wù)調(diào)度過(guò)程中自動(dòng)匹配館藏和快速調(diào)度的效率,調(diào)整和優(yōu)化文獻(xiàn)申請(qǐng)隊(duì)列的負(fù)載均衡策略,實(shí)現(xiàn)聯(lián)盟數(shù)字資源的優(yōu)化配置和高效響應(yīng)。在文獻(xiàn)傳遞服務(wù)的覆蓋范圍方面,要協(xié)調(diào)各成員館優(yōu)化平臺(tái)資源訪問(wèn)的網(wǎng)絡(luò)環(huán)境,保障用戶使用時(shí)段的連續(xù)性,積極探索采用機(jī)構(gòu)關(guān)聯(lián)賬號(hào)或者對(duì)接校園統(tǒng)一身份認(rèn)證等便利的訪問(wèn)機(jī)制,從而提升文獻(xiàn)傳遞服務(wù)的易獲得性和可用性。

      對(duì)成熟期成員館,要積極推進(jìn)成員館不斷完善自有館藏資源與聯(lián)盟資源的整合揭示,發(fā)揮其在聯(lián)盟中的資源供給優(yōu)勢(shì)和傳遞效益,更好地支撐聯(lián)盟稀缺文獻(xiàn)的保障能力。用戶服務(wù)方面,定期收集文獻(xiàn)傳遞的用戶反饋和質(zhì)量評(píng)價(jià),加強(qiáng)文獻(xiàn)傳遞服務(wù)的各項(xiàng)功能優(yōu)化和用戶體驗(yàn)提升,減少用戶流失,激活沉睡用戶,實(shí)現(xiàn)用戶在聯(lián)盟中的更新迭代。不斷累積成熟期成員館的營(yíng)銷效應(yīng),帶動(dòng)聯(lián)盟其他聚類的成員館發(fā)展和用戶增長(zhǎng)。

      對(duì)穩(wěn)定期成員館,聯(lián)盟要深化其資源共建共享的共識(shí),引導(dǎo)其進(jìn)一步提高與聯(lián)盟平臺(tái)之間的資源互補(bǔ)和整合程度,利用聯(lián)盟的一站式資源揭示和文獻(xiàn)獲取功能,拉動(dòng)該聚類在聯(lián)盟平臺(tái)上的資源貢獻(xiàn)率。在用戶服務(wù)方面,分析、調(diào)研和對(duì)比穩(wěn)定期中處在流失、蒸餾和穩(wěn)定等3個(gè)階段用戶的資源訴求,發(fā)掘其資源需求痛點(diǎn),尋求更大的契合點(diǎn)和用戶粘性,減少平臺(tái)使用的網(wǎng)絡(luò)限制,優(yōu)化網(wǎng)絡(luò)環(huán)境,觸發(fā)用戶使用聯(lián)盟平臺(tái)的意愿,提高他們?cè)诼?lián)盟平臺(tái)的文獻(xiàn)傳遞申請(qǐng)數(shù)量。從而激發(fā)更多的用戶稀缺文獻(xiàn)需求,實(shí)現(xiàn)該聚類用戶的快速增長(zhǎng),逐步向成熟期成員館的階段轉(zhuǎn)化。

      對(duì)成長(zhǎng)期成員館,聯(lián)盟要積極引導(dǎo)其發(fā)揮自身館藏?cái)?shù)字資源對(duì)聯(lián)盟中心門戶的傳遞保障能力,在網(wǎng)絡(luò)安全等級(jí)保護(hù)的框架下,理順、優(yōu)化和保障文獻(xiàn)傳遞代理服務(wù)器與聯(lián)盟平臺(tái)的順暢連接。在用戶服務(wù)與宣傳推廣方面,可借鑒成熟期成員館的優(yōu)秀經(jīng)驗(yàn),加強(qiáng)聯(lián)盟文獻(xiàn)傳遞服務(wù)的宣傳推廣以提高用戶對(duì)聯(lián)盟的認(rèn)知,減少網(wǎng)絡(luò)限制以提高使用頻率和時(shí)段范圍,借助新媒體開展專題推廣活動(dòng)以擴(kuò)大用戶覆蓋面,實(shí)現(xiàn)用戶快速增長(zhǎng)。聯(lián)盟也要積極與其融合與對(duì)接數(shù)字資源館藏,尋求更好的資源共享和揭示模式,推進(jìn)該聚類成員館向成熟期階段轉(zhuǎn)化。

      對(duì)初生期成員館,聯(lián)盟要積極引導(dǎo)其借鑒其他館平臺(tái)對(duì)接、服務(wù)宣傳和用戶推廣等方面的成功經(jīng)驗(yàn),廣泛調(diào)研和掌握用戶對(duì)于稀缺文獻(xiàn)資源的需求共同點(diǎn),打造核心用戶群,廣泛推廣聯(lián)盟的文獻(xiàn)資源保障功能??s短初生期用戶的認(rèn)知培育時(shí)間,加速向穩(wěn)定期和成熟期成長(zhǎng)轉(zhuǎn)化。

      5 結(jié)語(yǔ)

      本研究從傳遞總量、文獻(xiàn)類型、傳遞效益和傳遞流向等不同視角呈現(xiàn)和展示了區(qū)域高校圖書館聯(lián)盟文獻(xiàn)傳遞服務(wù)強(qiáng)大的資源保障效益,詳細(xì)描述了各個(gè)成員館在聯(lián)盟文獻(xiàn)傳遞的共建共享行為,對(duì)處于成熟期、成長(zhǎng)期、穩(wěn)定期和初生期等不同用戶細(xì)分市場(chǎng)的成員館給出了相適宜的精準(zhǔn)服務(wù)發(fā)展策略。本研究的局限性:(1)由于缺乏FULink 移動(dòng)APP 的傳遞行為數(shù)據(jù),未能全面揭示全終端的稀缺文獻(xiàn)獲取行為特征。雖然通過(guò)肘方法驗(yàn)證了聚類結(jié)果的普適性,但有條件時(shí)仍需進(jìn)一步采集和匯聚用戶在移動(dòng)APP的行為數(shù)據(jù),從而增強(qiáng)用戶細(xì)分理論在支撐精準(zhǔn)營(yíng)銷服務(wù)上的可用性。(2)獲取的成員館細(xì)分結(jié)果,還需借助后續(xù)文獻(xiàn)傳遞行為數(shù)據(jù)跟蹤、模型迭代修正和疊加增量數(shù)據(jù)等方式進(jìn)一步驗(yàn)證此種聚類的合理性和有效性。尤其需要借助文本分析工具挖掘成員館之間傳遞文獻(xiàn)的學(xué)科屬性、研究領(lǐng)域和文獻(xiàn)類型,從而精確地輔助每個(gè)成員館確立未來(lái)館藏?cái)?shù)字資源建設(shè)的方向。未來(lái)考慮橫向與縱向相結(jié)合的研究方法不斷豐富和完善區(qū)域高校圖書館聯(lián)盟用戶細(xì)分的理論體系和實(shí)踐研究,為聯(lián)盟發(fā)展提供更為精準(zhǔn)化的數(shù)據(jù)支撐和決策建議。

      猜你喜歡
      細(xì)分聚類成員
      主編及編委會(huì)成員簡(jiǎn)介
      主編及編委會(huì)成員簡(jiǎn)介
      主編及編委會(huì)成員簡(jiǎn)介
      主編及編委會(huì)成員簡(jiǎn)介
      深耕環(huán)保細(xì)分領(lǐng)域,維爾利為環(huán)保注入新動(dòng)力
      基于DBSACN聚類算法的XML文檔聚類
      1~7月,我國(guó)貨車各細(xì)分市場(chǎng)均有增長(zhǎng)
      專用汽車(2016年9期)2016-03-01 04:17:02
      基于改進(jìn)的遺傳算法的模糊聚類算法
      整體低迷難掩細(xì)分市場(chǎng)亮點(diǎn)
      專用汽車(2015年2期)2015-03-01 04:05:42
      一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
      漾濞| 巢湖市| 伽师县| 黔南| 潮州市| 宜川县| 平安县| 大冶市| 安平县| 陇西县| 定西市| 九台市| 陕西省| 莫力| 新绛县| 武威市| 繁昌县| 新泰市| 区。| 义马市| 彰武县| 淮滨县| 奎屯市| 涞水县| 旌德县| 镇原县| 唐海县| 泰顺县| 铁岭县| 宁国市| 肇东市| 广南县| 环江| 商河县| 铅山县| 花莲市| 政和县| 大余县| 桓台县| 拜泉县| 抚顺县|