摘 要:【目的】建設(shè)數(shù)字標準館是推進標準數(shù)字化轉(zhuǎn)型的重要目標?!痉椒ā勘疚耐ㄟ^辨析數(shù)字標準館的內(nèi)涵和外延,明確建設(shè)目標,提出上海數(shù)字標準館建設(shè)路線圖,形成“四位一體”的建設(shè)內(nèi)容和技術(shù)路徑。結(jié)合基礎(chǔ)設(shè)施層、標準數(shù)據(jù)層、標準知識層、標準應用層、實體空間層的技術(shù)運用,深入探究大模型賦能上海數(shù)字標準館建設(shè)的發(fā)展路徑。【結(jié)果】大模型技術(shù)賦能數(shù)字標準館應用場景的建設(shè)是未來大勢所趨,將呈現(xiàn)由內(nèi)部知識管理、對外智慧服務過渡到實體空間體驗的發(fā)展方向。【結(jié)論】結(jié)合組織、數(shù)據(jù)、技術(shù)、能力四個方面的保障性措施,以期為全國范圍內(nèi)同類標準館數(shù)字化轉(zhuǎn)型工作提供可參考的路徑經(jīng)驗。
關(guān)鍵詞:標準數(shù)字化;數(shù)字標準館;建設(shè)框架;建設(shè)路徑;大模型
DOI編碼:10.3969/j.issn.1674-5698.2025.02.013
0 引 言
數(shù)字標準館是標準化工作順應數(shù)字化轉(zhuǎn)型的必然產(chǎn)物。建設(shè)上海數(shù)字標準館是夯實標準化發(fā)展基礎(chǔ),提升數(shù)字化支撐能力和水平的重要載體,是實現(xiàn)數(shù)字資源開發(fā)、標準知識加工、平臺智慧服務與實體空間再造接軌的必要保障。
從外部政策驅(qū)動而言,數(shù)字標準館的建設(shè)已然上升到了國家戰(zhàn)略的高度。《國家標準化發(fā)展綱要》《“十四五”推動高質(zhì)量發(fā)展的國家標準體系建設(shè)規(guī)劃》《質(zhì)量強國建設(shè)綱要》[1-3]等我國質(zhì)量和標準化頂層規(guī)劃文件中均提出要加強質(zhì)量創(chuàng)新服務,以數(shù)字化、智能化、智慧化為突破口,積極深化全國統(tǒng)一協(xié)調(diào)、分工負責的數(shù)字標準館、標準信息系統(tǒng)和標準數(shù)字化平臺建設(shè)。
從內(nèi)部現(xiàn)實需要出發(fā),隨著標準信息的范疇越來越廣和標準文獻的體量越來越大,標準用戶的潛在需求也發(fā)生了質(zhì)的變化:在標準使用方面,能夠滿足數(shù)字時代對標準高效率、高精度的知識級、指標級使用的需要;在嵌套引用方面,能夠?qū)崿F(xiàn)鏈條和量級標準之間復雜的結(jié)構(gòu)關(guān)系和版本變化的自動關(guān)聯(lián);在應用場景方面,能夠智能匹配企業(yè)數(shù)智化平臺、工具和流程,直接調(diào)用標準中的指標、公式、模型和數(shù)據(jù)。
因此亟待建設(shè)集標準資源、信息技術(shù)與用戶服務相互融合的數(shù)字標準館,以實現(xiàn)標準數(shù)據(jù)資源知識化的充分共享[4]。可以預見,通過上海標準館的數(shù)字化升級改造,能夠更好滿足政府智慧監(jiān)管、企業(yè)創(chuàng)新發(fā)展、群眾安全消費中關(guān)鍵標準的應用需要。
1 數(shù)字標準館概述
1.1 數(shù)字標準館的內(nèi)涵
目前,標準化領(lǐng)域?qū)?shù)字標準館尚未形成統(tǒng)一和公認的清晰界定。因此,本文對標圖情領(lǐng)域圖書館的發(fā)展形態(tài)和概念,得出數(shù)字標準館的內(nèi)涵是以人機交互的耦合方式致力于實現(xiàn)深層次知識服務的高級標準館形態(tài)[5],以人的智慧和物的智能相結(jié)合,以用戶需求和智能技術(shù)為雙驅(qū)動,以貫穿整個運行流程的數(shù)據(jù)為核心鏈接,實現(xiàn)標準館可持續(xù)發(fā)展的目標。
1.2 數(shù)字標準館的外延
數(shù)字標準館較傳統(tǒng)標準館在設(shè)施部署上,從依賴外部技術(shù)、通用計算向國產(chǎn)化、高計算能力轉(zhuǎn)變;在資源建設(shè)上,從資源驅(qū)動型向用戶主導型轉(zhuǎn)變,編目方式由人為文本加工向自動數(shù)據(jù)加工模式轉(zhuǎn)變,開發(fā)數(shù)字化集成工具;在服務內(nèi)容上,從整冊文獻傳遞為主的基礎(chǔ)服務向碎片化知識獲取的專業(yè)服務轉(zhuǎn)變,服務形式具有自我學習、自我適應和感知用戶需求的能力;在館舍利用上,從單一的文獻提供向立體式的標準數(shù)字化科普體驗空間轉(zhuǎn)變[4]。
2 上海數(shù)字標準館建設(shè)總體規(guī)劃
2.1 建設(shè)目標
上海數(shù)字標準館將重點建設(shè)數(shù)據(jù)中心、智算底座、系統(tǒng)平臺、基礎(chǔ)設(shè)施四大板塊,實現(xiàn)標準數(shù)據(jù)資源的匯聚與存儲中心、標準數(shù)據(jù)資源共享利用的核心樞紐、標準數(shù)字化服務應用的前沿陣地、標準智能化生態(tài)建設(shè)的領(lǐng)航旗艦“4種角色”能力。通過打造上海標準館“數(shù)字館”,與“實體館”配合形成1個“虛實空間”。
2.2 建設(shè)框架
在數(shù)據(jù)要素驅(qū)動經(jīng)濟增長的環(huán)境下,上海數(shù)字標準館以大數(shù)據(jù)、云計算、人工智能為技術(shù)基礎(chǔ),以智能化設(shè)施為表現(xiàn)手段,以“數(shù)據(jù)挖掘、知識發(fā)現(xiàn)、智慧服務、空間再造”為主要特征,按照“四位一體”的建設(shè)框架(如圖1所示),推進建成適配信創(chuàng)環(huán)境的智算底座,提升AI智能計算能力;建成智能化標準數(shù)據(jù)資源中心,不斷豐富和創(chuàng)新標準數(shù)字資源的組織體系、集成工具和知識管理;建成一站式標準數(shù)字化公共服務平臺,開發(fā)面向多維應用場景的知識服務能力;建成交互式標準數(shù)字體驗館,為用戶提供多元化、個性化的智慧服務。
2.3 建設(shè)內(nèi)容
2.3.1 建成適用信創(chuàng)服務環(huán)境的基礎(chǔ)設(shè)施
信創(chuàng)升級改造是上海數(shù)字標準館提升信息技術(shù)自主可控能力的關(guān)鍵一步。對上海市標準信息服務系統(tǒng)以及上海質(zhì)量發(fā)展和標準信息公共服務平臺兩大系統(tǒng)進行更新?lián)Q代,包括機柜租賃、互聯(lián)網(wǎng)線路租賃、云服務器租用、IP地址租用、信創(chuàng)服務器及網(wǎng)絡交換機采購、超融合軟件采購以及智能化應用建設(shè)等,旨在構(gòu)建安全可靠、高效協(xié)同的數(shù)字化基座。
智算底座的建設(shè)是上海數(shù)字標準館促進人工智能技術(shù)與實體經(jīng)濟有機結(jié)合的重要媒介。通過構(gòu)建高性能硬件設(shè)施的數(shù)據(jù)中心(IDC)基礎(chǔ)設(shè)施層、提供強大算力支持的云原生基礎(chǔ)設(shè)施層、促進算法優(yōu)化與創(chuàng)新的大模型開發(fā)平臺層、實現(xiàn)數(shù)據(jù)高效流通與利用的行業(yè)應用層,推動上海數(shù)字標準館大模型賦能的應用場景創(chuàng)新。
2.3.2 建成智能化標準數(shù)據(jù)資源中心
數(shù)據(jù)資源底座是上海數(shù)字標準館建設(shè)的核心基石。以數(shù)字資源獲取為重點,轉(zhuǎn)變館藏載體結(jié)構(gòu),滿足未來標準資源的應用需求。通過拓寬數(shù)字標準資源的獲取渠道,擴大國內(nèi)外XML格式文本、題錄等標準數(shù)據(jù)采購、專利數(shù)據(jù)采購、技術(shù)法規(guī)數(shù)據(jù)更新,豐富標準數(shù)據(jù)種類,實施數(shù)據(jù)質(zhì)量管理,夯實分級分類的標準數(shù)據(jù)資源體系。
開發(fā)標準數(shù)字化工具池是上海數(shù)字標準館重塑編目方式的必要保障。通過標準元數(shù)據(jù)智能化標引、碎片化加工、立體化知識關(guān)聯(lián)、圖譜化知識網(wǎng)絡,建成標準知識結(jié)構(gòu)化庫、標準知識建模數(shù)據(jù)庫、標準知識挖掘數(shù)據(jù)庫、標準知識融合數(shù)據(jù)庫等標準知識大腦,逐步實現(xiàn)標準載體的無紙化、數(shù)字化,信息傳遞的立體化、網(wǎng)絡化,知識表達的自動化、智慧化。
2.3.3 建成一站式標準數(shù)字化公共服務平臺[6,7]
標準數(shù)字化公共服務平臺作為上海數(shù)字標準館對外服務的一站式門戶,其數(shù)字化建設(shè)是實現(xiàn)標準從呈現(xiàn)到應用全方位創(chuàng)新的重要載體。本文面向一般用戶、企業(yè)級用戶、標準化主管部門等不同用戶類型的主要需求,設(shè)計了12項平臺數(shù)字化服務功能模塊。這些模塊可根據(jù)實際應用場景排列組合,為社會提供專業(yè)的標準數(shù)字化普惠性公共服務產(chǎn)品,具體功能如圖2所示。
2.3.4 建成交互式標準數(shù)字體驗館
上海數(shù)字標準館實體空間再造是適應未來發(fā)展趨勢的重要舉措。擬建設(shè)“館藏資源閱覽區(qū)、館藏資源庫房區(qū)、標準智能問答區(qū)、數(shù)據(jù)資源加工區(qū)、產(chǎn)品研發(fā)區(qū)、科普展示區(qū)”六大核心功能區(qū)以及輔助功能區(qū)等,支撐數(shù)字標準館的業(yè)務功能實現(xiàn)。
充分運用數(shù)字孿生、人機交互、虛擬現(xiàn)實(VR)、增強現(xiàn)實(AR)、3D 打印等技術(shù),建成標準信息交互式智慧空間。典型應用場景如下:基于AR的標準館智慧導航,幫助用戶及時在館內(nèi)找到所需的資源或服務;利用大模型作為人機交互入口,打造虛擬數(shù)字人館員與用戶進行智能問答交互;通過接入AR眼鏡等智能終端實現(xiàn)珍貴標準館藏資源的虛擬現(xiàn)實場景展示;引入3D打印工具實現(xiàn)標準產(chǎn)品符合性驗證試驗等互動體驗,增強標準知識科普的互動性和趣味性。
3 上海數(shù)字標準館建設(shè)技術(shù)路徑
3.1 建設(shè)基本路徑
3.1.1 基礎(chǔ)設(shè)施層
信創(chuàng)升級改造主要圍繞自主可控和信息安全,構(gòu)建國產(chǎn)化信息技術(shù)軟硬件底層架構(gòu)。國產(chǎn)化改造主要包括操作系統(tǒng)和服務器、數(shù)據(jù)庫、應用中間件及密評等,通過適配改造,實現(xiàn)與國產(chǎn)基礎(chǔ)軟硬件的兼容。實施步驟主要包括評估規(guī)劃、遷移準備、實驗驗證、業(yè)務切換、試運行、上線運維,根據(jù)現(xiàn)有系統(tǒng)與信創(chuàng)環(huán)境的兼容程度,采取兼容遷移、適配改造等模式實施。
智能算力底座主要圍繞數(shù)據(jù)中心(IDC)基礎(chǔ)設(shè)施層、云原生基礎(chǔ)設(shè)施層、大模型開發(fā)平臺層和行業(yè)應用層四層架構(gòu)建設(shè)。從物理空間與硬件設(shè)施的部署到現(xiàn)代數(shù)據(jù)中心與計算資源池的建立,從服務AI模型研發(fā)環(huán)境的開發(fā)到推動“人工智能+”行業(yè)落地的應用,每一層的分層設(shè)計都承擔了不同的功能和角色,旨在構(gòu)建高效、靈活且可擴展的AI計算平臺,賦能數(shù)字標準館的智能化升級。
3.1.2 標準數(shù)據(jù)層和標準知識層
標準數(shù)據(jù)資源中心的核心是標準知識大腦的創(chuàng)建,整合多源異構(gòu)的標準全文數(shù)據(jù),綜合運用光學字符識別(OCR)、數(shù)據(jù)清洗、自然語言處理(N L P)、深度學習、知識圖譜等技術(shù),按照數(shù)字化、結(jié)構(gòu)化、碎片化/知識元化、網(wǎng)絡化和圖譜化的技術(shù)路徑,建立標準文檔版面識別、智能標引、智能拆分、動態(tài)重組、知識標注、知識挖掘、智能關(guān)聯(lián)的標準加工流程,生成以標準數(shù)據(jù)為核心的標準知識庫,包括章條庫、圖片庫、表格庫、術(shù)語庫、指標庫、公式庫等,在統(tǒng)一的標準體系和指標體系下為數(shù)字標準研發(fā)和其他平臺提供標準知識服務。
3.1.3 標準應用層
標準數(shù)字化公共服務平臺以實現(xiàn)標準化工作編、查、用、管全過程數(shù)字化為目標,開發(fā)標準數(shù)字化普惠性公共產(chǎn)品,解決用戶對標準獲取難、使用難、理解難、管理難等核心問題?;诋a(chǎn)品設(shè)計理論開展平臺功能模塊設(shè)計。構(gòu)建標準知識服務后臺系統(tǒng),實現(xiàn)業(yè)務邏輯層的功能,處理用戶請求和數(shù)據(jù)交互?;谟脩粲押瞄_發(fā)前端平臺交互界面,以提高用戶體驗。設(shè)計高效的數(shù)據(jù)庫索引和查詢語句,提高數(shù)據(jù)的訪問速度。進行系統(tǒng)集成和測試,確保各功能模塊之間的協(xié)同工作和平臺的穩(wěn)定性、安全性。通過用戶畫像技術(shù)對標準用戶行為進行深入的標簽化處理和數(shù)據(jù)挖掘,以掌握用戶全貌。不斷跟進用戶需求,迭代升級服務產(chǎn)品。
3.1.4 實體空間層
數(shù)字標準館實體空間的再造不僅是一次物理空間的升級,更是一場關(guān)于知識傳播、用戶體驗與未來科普模式的深刻變革。在空間設(shè)計中,強調(diào)將數(shù)字技術(shù)與物理環(huán)境有機結(jié)合。例如在線下實體館引入智能圖情服務設(shè)備,通過設(shè)置AI數(shù)字館員,將數(shù)字大屏與虛擬人形象結(jié)合,模擬標準館員的角色,實現(xiàn)與標準用戶的智能交互,提升用戶服務體驗;利用AR技術(shù),將二維的標準文本和圖像轉(zhuǎn)化為三維的互動模型或場景,通過佩戴AR眼鏡或使用手機應用,與珍貴標準館藏展品進行互動,立體化了解其背后的歷史,增強標準知識傳播和科普服務新模式。此外,數(shù)字標準館通過設(shè)計靈活多樣的空間區(qū)域,滿足各類用戶在不同業(yè)務場景下的需求,通過可移動的家具和可變的空間布局,快速響應用戶的變化需求。
3.2 建設(shè)發(fā)展路徑
建設(shè)上海數(shù)字標準館是一項長期且系統(tǒng)性的工程,需要以前瞻性的眼光來規(guī)劃,關(guān)注新興技術(shù)發(fā)展趨勢。而大模型技術(shù)賦能數(shù)字標準館應用場景的建設(shè)是未來大勢所趨,將呈現(xiàn)由內(nèi)部知識管理、對外智慧服務過渡到實體空間體驗的發(fā)展路徑??紤]到大語言模型存在幻覺現(xiàn)象、價值對齊不足,以及產(chǎn)生不負責任的輸出等問題,未來數(shù)字標準館大模型技術(shù)應用需要經(jīng)過一定時間的訓練調(diào)優(yōu)過程。標準館作為公共服務機構(gòu),需要針對提供給標準用戶的內(nèi)容事實性、準確性、安全性進行嚴格把關(guān)。
從短期來看,大模型技術(shù)賦能數(shù)字標準館的應用場景將集中在標準數(shù)據(jù)層和標準知識層,以標準館數(shù)字資源的語義化管理和分析挖掘為主,面向業(yè)務流程開發(fā)智能化加工工具,通過應用大模型技術(shù)提升館員對于標準館數(shù)字資源的分析挖掘、知識組織和管理能力,提高館員的工作效率,并由館員作為數(shù)字標準館大模型技術(shù)應用場景的把關(guān)、審核中間環(huán)節(jié)。
從中期來看,隨著大語言模型經(jīng)過標準文獻領(lǐng)域?qū)I(yè)數(shù)據(jù)的微調(diào)訓練,并通過對接知識庫等外部系統(tǒng)以實現(xiàn)更加專業(yè)、準確的交互效果,提升對標準數(shù)字資源的語義理解、信息匹配組織、內(nèi)容生成等自然語言處理能力,大模型技術(shù)賦能數(shù)字標準館的應用場景將向標準應用層拓展,即利用大模型技術(shù)實現(xiàn)個性化推薦、專業(yè)知識問答、知識分析服務等專業(yè)類功能需求,為數(shù)字標準館的高價值標準內(nèi)容服務提供有效的技術(shù)支撐。
從長期來看,隨著沉浸式交互、全息通信、擴展現(xiàn)實、元宇宙等技術(shù)進一步發(fā)展和成熟,以及大模型技術(shù)與元宇宙的無縫集成應用,數(shù)字標準館大模型應用場景將不僅僅停留在線上網(wǎng)頁端、移動端,也將向線上線下虛實融合的元宇宙體驗場景拓展延伸。屆時大模型技術(shù)賦能數(shù)字標準館將呈現(xiàn)更多智慧空間的應用場景,大模型將成為標準用戶與館藏資源互動的智能入口,帶領(lǐng)用戶在由生成式人工智能(AIGC)等技術(shù)打造的元宇宙標準館中進行沉浸式的標準知識服務探索、體驗、分享與創(chuàng)造,從而營造極具未來感的新型體驗。
4 上海數(shù)字標準館建設(shè)保障措施
4.1 加強組織領(lǐng)導
加強組織協(xié)調(diào),推動建立領(lǐng)導小組和工作專班,將上海數(shù)字標準館建設(shè)框架細化分解為可操作、可量化的短、中、長期目標任務和工作項目。通過項目化推進數(shù)字化建設(shè),做好項目預研,確保有清晰的目標預算、明確的起止時間,細化的工作內(nèi)容,保證多方協(xié)同參與。加強全過程管理,重點任務落實牽頭責任制,建立有效的工作激勵機制,扎實推進項目落地。
4.2 完善數(shù)據(jù)保障
從數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)安全防護、數(shù)據(jù)運營機制三方面,建立統(tǒng)一協(xié)調(diào)的數(shù)據(jù)治理規(guī)則。加強標準資源、文獻業(yè)務、服務數(shù)據(jù)采集,實施數(shù)據(jù)清洗,建立可靠的數(shù)據(jù)源,在此基礎(chǔ)上打通數(shù)據(jù)孤島,建立數(shù)據(jù)聯(lián)系,集成清潔、完整一致的數(shù)據(jù)湖。通過主體對象、智能標簽、業(yè)務流程等方面的主題聯(lián)結(jié),為數(shù)字標準館建設(shè)提供堅實可靠的數(shù)據(jù)支撐。
4.3 加大技術(shù)投入
加強技術(shù)創(chuàng)新研究和應用,探索自然語言處理、生成式人工智能、通用人工智能(AGI)、深度學習等新一代數(shù)字技術(shù)在數(shù)字標準館建設(shè)中的應用研究。加大資金要素投入,推動標準文獻領(lǐng)域承載AI計算、大模型開發(fā)的算力底座基礎(chǔ)設(shè)施建設(shè)。
4.4 深化能力建設(shè)
深化創(chuàng)新團隊建設(shè)。加強數(shù)字化轉(zhuǎn)型核心團隊與信息化基礎(chǔ)支撐團隊建設(shè),深化具備“標準化+數(shù)字化”能力的復合型人才培育。圍繞數(shù)字標準館建設(shè)和發(fā)展需要,加強信息化供應商遴選和管理。
建立外部合作機制。面向數(shù)字標準館建設(shè)相關(guān)方加強合作,通過緊密聯(lián)系用戶,聯(lián)合同行院所、專業(yè)機構(gòu)、技術(shù)公司等,探索組建標準數(shù)字化創(chuàng)新聯(lián)盟,制定共同認可的規(guī)范和要求,構(gòu)建共商共建共享的數(shù)字標準館合作新模式。
5 結(jié) 語
上海數(shù)字標準館的建設(shè)對加快標準數(shù)字化轉(zhuǎn)型,落實創(chuàng)新驅(qū)動高質(zhì)量發(fā)展戰(zhàn)略具有重大促進作用。本文聚焦上海數(shù)字標準館建設(shè)目標,研究繪制建設(shè)路線圖,形成“四位一體”的建設(shè)內(nèi)容和技術(shù)路徑,結(jié)合保障措施,以期推進上海數(shù)字標準館建設(shè)的早日落地,為同類標準館的數(shù)字化轉(zhuǎn)型工作提供參考借鑒。
參考文獻
[1]中共中央、國務院.國家標準化發(fā)展綱要[EB/OL]. (2021-10-10)[引用時間]. http://www.sac.gov.cn/zt/gyzt/zxdt/202110/t20211011_348074.html.
[2]國家標準化管理委員會. “十四五”推動高質(zhì)量發(fā)展的國家標準體系建設(shè)規(guī)劃[EB/OL]. (2021-12-06)[引用時間].http://www.sac.gov.cn/sxxgk/zcwj/202112/t20211222_349879.html.
[3]中共中央、國務院. 質(zhì)量強國建設(shè)綱要[EB/OL]. (2022-02-06)[引用時間]. https://www.gov.cn/gongbao/content/2023/content_5742204.htm.
[4]甘克勤,孫紅軍.國家數(shù)字標準館建設(shè)與實現(xiàn)路徑研究[J].信息技術(shù)與標準化,2022(10): 23-26.
[5]初景利,任嬌菡,王譯晗.從數(shù)字圖書館到智慧圖書館[J]. 大學圖書館學報,2022,40(2): 52-58.
[6]狄矢聰.標準數(shù)字化平臺建設(shè)機制與發(fā)展路徑研究[J].標準科學,2024(1): 64-71.
[7]牛艷茹,魏梅,王立璽,等.電子信息領(lǐng)域數(shù)字標準館建設(shè)實踐[J].信息技術(shù)與標準化,2024(6): 46-51.