摘 要:在數(shù)字化轉(zhuǎn)型的大背景下,推動(dòng)我國(guó)產(chǎn)業(yè)鏈和供應(yīng)鏈數(shù)字化轉(zhuǎn)型已成為提升產(chǎn)業(yè)競(jìng)爭(zhēng)力和韌性的重要舉措。面對(duì)產(chǎn)業(yè)發(fā)展對(duì)標(biāo)準(zhǔn)制定效率和使用方式的新需求,標(biāo)準(zhǔn)化工作必須進(jìn)行主動(dòng)、系統(tǒng)的轉(zhuǎn)型升級(jí)。本文通過(guò)分析現(xiàn)有標(biāo)準(zhǔn)數(shù)字化概念和機(jī)器可讀能力分級(jí)模型,梳理現(xiàn)有研究標(biāo)準(zhǔn)數(shù)字化關(guān)鍵技術(shù)的概念、優(yōu)勢(shì)與不足,探討了未來(lái)標(biāo)準(zhǔn)數(shù)字化技術(shù)路線圖,涵蓋層級(jí)間和大類技術(shù)內(nèi)容,還展望了標(biāo)準(zhǔn)數(shù)字化的未來(lái)發(fā)展方向,對(duì)于推動(dòng)機(jī)器可讀標(biāo)準(zhǔn)的發(fā)展和應(yīng)用具有重要的理論和實(shí)踐價(jià)值。
關(guān)鍵詞:標(biāo)準(zhǔn)數(shù)字化,機(jī)器可讀,技術(shù)路線
DOI編碼:10.3969/j.issn.1002-5944.2024.015.004
0 引 言
在產(chǎn)業(yè)數(shù)字化進(jìn)程中,數(shù)字技術(shù)得到廣泛的應(yīng)用和推廣,使得生產(chǎn)效率和創(chuàng)新能力得到關(guān)鍵提升。數(shù)字經(jīng)濟(jì)作為當(dāng)下的一種主要經(jīng)濟(jì)形態(tài),通過(guò)信息技術(shù)融合與全要素?cái)?shù)字化轉(zhuǎn)型,快速、廣泛、深刻地影響著生產(chǎn)生活治理方式的革新。2022年,中國(guó)的數(shù)字經(jīng)濟(jì)總量達(dá)到了50.2萬(wàn)億元,按名義值計(jì)算年增長(zhǎng)率為10.3%,這標(biāo)志著數(shù)字經(jīng)濟(jì)增速已經(jīng)連續(xù)第11年明顯超過(guò)同期的GDP增速。此外,數(shù)字經(jīng)濟(jì)在國(guó)內(nèi)生產(chǎn)總值(GDP)中的占比為41.5%,與第二產(chǎn)業(yè)在整個(gè)國(guó)民經(jīng)濟(jì)中的比重相當(dāng)。
數(shù)字化的歷史洪流要求我國(guó)全要素轉(zhuǎn)型,其中產(chǎn)業(yè)鏈和供應(yīng)鏈數(shù)字化轉(zhuǎn)型是重中之重。標(biāo)準(zhǔn)作為國(guó)家質(zhì)量基礎(chǔ)設(shè)施,對(duì)于產(chǎn)業(yè)鏈和供應(yīng)鏈的發(fā)展與穩(wěn)定意義深刻。為滿足服務(wù)主體轉(zhuǎn)型完成后的用標(biāo)新型需求,適應(yīng)產(chǎn)業(yè)高速發(fā)展,杜絕“扯后腿”現(xiàn)象,標(biāo)準(zhǔn)化工作同樣需要將數(shù)字化理念引入工作流程,系統(tǒng)改革、橫縱接納,從標(biāo)準(zhǔn)呈現(xiàn)形式與標(biāo)準(zhǔn)化活動(dòng)雙向推進(jìn),培育標(biāo)準(zhǔn)高新服務(wù)模式,持續(xù)跟進(jìn)發(fā)揮標(biāo)準(zhǔn)的基礎(chǔ)性、引領(lǐng)性作用。
本文圍繞標(biāo)準(zhǔn)數(shù)字化轉(zhuǎn)型的概念與核心要素,對(duì)轉(zhuǎn)型所需要的新興技術(shù)進(jìn)行分析,重點(diǎn)梳理知識(shí)圖譜、大數(shù)據(jù)、機(jī)器學(xué)習(xí)、大模型等新興數(shù)字化技術(shù)的優(yōu)缺點(diǎn),并結(jié)合機(jī)器可讀標(biāo)準(zhǔn)分級(jí)模型,構(gòu)建標(biāo)準(zhǔn)數(shù)字化技術(shù)路徑。
1 標(biāo)準(zhǔn)數(shù)字化概念
隨著數(shù)字化技術(shù)的不斷進(jìn)步,標(biāo)準(zhǔn)領(lǐng)域的數(shù)字化轉(zhuǎn)型正成為一項(xiàng)迫切且充滿挑戰(zhàn)的任務(wù)。在我國(guó),關(guān)于標(biāo)準(zhǔn)數(shù)字化的規(guī)范和操作框架尚未完全確立,但對(duì)其基本概念與理論基礎(chǔ)的探討已成為推動(dòng)行業(yè)發(fā)展的關(guān)鍵一環(huán)。鑒于此,對(duì)標(biāo)準(zhǔn)數(shù)字化的基本概念和理論基礎(chǔ)進(jìn)行深入研究與分析顯得尤為重要。
1.1 標(biāo)準(zhǔn)數(shù)字化
標(biāo)準(zhǔn)數(shù)字化是一種將傳統(tǒng)標(biāo)準(zhǔn)化活動(dòng)與先進(jìn)數(shù)字技術(shù)融合的創(chuàng)新實(shí)踐,通過(guò)電子化文檔、結(jié)構(gòu)化數(shù)據(jù)格式及線上協(xié)作平臺(tái),極大提升標(biāo)準(zhǔn)的制定、執(zhí)行與監(jiān)控的效率與精確性。此過(guò)程涉及將標(biāo)準(zhǔn)內(nèi)容轉(zhuǎn)換為易于機(jī)器處理的電子格式,利用物聯(lián)網(wǎng)、大數(shù)據(jù)分析等技術(shù)進(jìn)行實(shí)時(shí)的標(biāo)準(zhǔn)執(zhí)行監(jiān)控,從而實(shí)現(xiàn)標(biāo)準(zhǔn)實(shí)施的高度精準(zhǔn)與動(dòng)態(tài)調(diào)整。標(biāo)準(zhǔn)數(shù)字化不僅加速了標(biāo)準(zhǔn)的迭代更新和廣泛傳播,還提高了標(biāo)準(zhǔn)施行的透明度和公眾參與度,是推動(dòng)行業(yè)快速響應(yīng)市場(chǎng)變化、提升全球競(jìng)爭(zhēng)力的關(guān)鍵驅(qū)動(dòng)力。
在數(shù)字經(jīng)濟(jì)時(shí)代,我國(guó)正在經(jīng)歷標(biāo)準(zhǔn)數(shù)字化發(fā)展,出現(xiàn)了諸如開(kāi)源標(biāo)準(zhǔn)、機(jī)器可讀標(biāo)準(zhǔn)、SMART標(biāo)準(zhǔn)等多種概念。全球趨勢(shì)也顯示標(biāo)準(zhǔn)數(shù)字化轉(zhuǎn)型是不可避免的,各國(guó)紛紛推動(dòng)數(shù)字化、網(wǎng)絡(luò)化的標(biāo)準(zhǔn)化工作。開(kāi)源標(biāo)準(zhǔn)是指一種公開(kāi)發(fā)表的標(biāo)準(zhǔn),為多個(gè)團(tuán)隊(duì)和開(kāi)發(fā)者提供了共同參與和改進(jìn)的機(jī)會(huì),推動(dòng)了技術(shù)的共享和創(chuàng)新,其關(guān)鍵特征包括開(kāi)放的源代碼、可自由獲取、可修改和可分發(fā)。關(guān)于機(jī)器可讀標(biāo)準(zhǔn),依據(jù)IEC和ISO的相關(guān)文件,機(jī)器可讀標(biāo)準(zhǔn)指的是那些可以直接被機(jī)器、軟件或自動(dòng)化系統(tǒng)解讀并應(yīng)用的技術(shù)標(biāo)準(zhǔn),這些標(biāo)準(zhǔn)以一種用戶和應(yīng)用特定的數(shù)字化格式提供。SMART標(biāo)準(zhǔn)是指用戶(人類和機(jī)器)與標(biāo)準(zhǔn)互動(dòng)所需的格式、流程和工具等形式,可滿足鏈條用戶利益相關(guān)者的需求。
1.2 機(jī)器可讀能力分級(jí)模型
在2019年,IEC、ISO以及其他區(qū)域性和國(guó)家級(jí)標(biāo)準(zhǔn)化機(jī)構(gòu)提出了一個(gè)機(jī)器可讀標(biāo)準(zhǔn)的分級(jí)模型。此模型依據(jù)標(biāo)準(zhǔn)的機(jī)器可讀程度進(jìn)行等級(jí)劃分,規(guī)范對(duì)機(jī)器可讀標(biāo)準(zhǔn)范疇的理解,同步規(guī)劃策略的演進(jìn)層級(jí)。在2021年,德國(guó)國(guó)家標(biāo)準(zhǔn)化機(jī)構(gòu)(DIN)與德國(guó)電工委員會(huì)(DKE)基于第一版分級(jí)模型向更高層級(jí)延伸了一級(jí),并定義了Level 4以上的高級(jí)別機(jī)器可讀標(biāo)準(zhǔn)為機(jī)器可控內(nèi)容,具體如圖1所示。
在標(biāo)準(zhǔn)分級(jí)模型中,0級(jí)代表傳統(tǒng)的紙質(zhì)標(biāo)準(zhǔn);1級(jí)代表數(shù)字文檔格式,如Word、PDF文件;2級(jí)為機(jī)器可讀文檔,標(biāo)準(zhǔn)文檔的架構(gòu)被數(shù)字化解析,可以導(dǎo)出局部塊狀內(nèi)容,初步分離內(nèi)容與標(biāo)題表現(xiàn)形式;3級(jí)為機(jī)器可讀和可執(zhí)行內(nèi)容,對(duì)標(biāo)準(zhǔn)中的信息單元模塊可以精準(zhǔn)識(shí)別,關(guān)聯(lián)關(guān)系詳細(xì)標(biāo)記;4級(jí)為機(jī)器可解釋內(nèi)容,標(biāo)準(zhǔn)信息與其應(yīng)用信息關(guān)聯(lián),支持機(jī)器直接、自動(dòng)執(zhí)行復(fù)雜狀況和決策;5級(jí)為機(jī)器可控內(nèi)容,標(biāo)準(zhǔn)可以被系統(tǒng)設(shè)備機(jī)器自主修改,支持自主決策,并將成果標(biāo)準(zhǔn)通過(guò)標(biāo)準(zhǔn)化組織的發(fā)布渠道進(jìn)行自動(dòng)審查與發(fā)布。從3級(jí)起,這些標(biāo)準(zhǔn)被稱為“SMART Standards”。此模型的每個(gè)級(jí)別都是基于前一級(jí)別的技術(shù)進(jìn)一步構(gòu)建的,可以細(xì)致評(píng)估標(biāo)準(zhǔn)的機(jī)器互操作性能力級(jí)別。
在機(jī)器可讀標(biāo)準(zhǔn)的分級(jí)模型中,等級(jí)2至等級(jí)5展示了從傳統(tǒng)的文檔管理到高度自動(dòng)化和智能化的標(biāo)準(zhǔn)應(yīng)用的演進(jìn)。等級(jí)2主要涉及以PDF格式存儲(chǔ)的文檔,這些文檔通過(guò)成熟的技術(shù)和流程提供廣泛的信息和深入的索引,便于用戶查找和應(yīng)用標(biāo)準(zhǔn)。隨著等級(jí)的提升至等級(jí)3,標(biāo)準(zhǔn)不僅可讀,還可執(zhí)行,能夠直接集成到企業(yè)的產(chǎn)品設(shè)計(jì)、生產(chǎn)和售后服務(wù)中,通過(guò)自動(dòng)化提高效率和降低成本。到了等級(jí)4,標(biāo)準(zhǔn)信息被進(jìn)一步細(xì)化為可由機(jī)器解釋的語(yǔ)義組件,這些組件能夠根據(jù)特定的應(yīng)用需求進(jìn)行智能化的決策和自動(dòng)化處理,使得標(biāo)準(zhǔn)的應(yīng)用更加靈活和個(gè)性化。最終,在等級(jí)5中,標(biāo)準(zhǔn)化過(guò)程完全自動(dòng)化,由人工智能驅(qū)動(dòng)的決策流程取代傳統(tǒng)標(biāo)準(zhǔn),實(shí)現(xiàn)動(dòng)態(tài)更新和適應(yīng)技術(shù)及監(jiān)管框架的變化,從而支持全球生態(tài)系統(tǒng)的可持續(xù)發(fā)展。這一系列的演進(jìn)不僅反映了技術(shù)在標(biāo)準(zhǔn)化工作中的應(yīng)用深度,也展示了向數(shù)字化和自動(dòng)化轉(zhuǎn)型的巨大潛力。
2 標(biāo)準(zhǔn)數(shù)字化關(guān)鍵技術(shù)
據(jù)統(tǒng)計(jì)分析,全球數(shù)字化轉(zhuǎn)型的七大重要數(shù)字技術(shù)分別是人工智能(AI)、大數(shù)據(jù)、區(qū)塊鏈技術(shù)(DLT)、物聯(lián)網(wǎng)(IoT)、機(jī)器人、3D打印和無(wú)人載具。對(duì)于標(biāo)準(zhǔn)數(shù)字化轉(zhuǎn)型,調(diào)研國(guó)內(nèi)外相關(guān)機(jī)構(gòu)、學(xué)者的研究成果發(fā)現(xiàn),所涉及的數(shù)字化技術(shù)涵蓋面廣、類別跨度大,主要包含人工智能、云服務(wù)、大數(shù)據(jù)、通信安全等大類。具體來(lái)說(shuō),大部分研究工作中均使用和推薦的技術(shù)集中在知識(shí)圖譜、大數(shù)據(jù)、機(jī)器學(xué)習(xí)、自然語(yǔ)言處理上,且絕不是單一技術(shù)就可滿足標(biāo)準(zhǔn)數(shù)字化的需求,往往是核心技術(shù)與輔助技術(shù)集成處理。
2.1 知識(shí)圖譜技術(shù)
(1)概述
知識(shí)圖譜的概念最早可以追溯到20世紀(jì)60年代,但直到2012年,當(dāng)Google引入其“知識(shí)圖譜”來(lái)增強(qiáng)其搜索引擎的語(yǔ)義搜索能力時(shí),這一概念才廣為人知。知識(shí)圖譜是一種通過(guò)圖形結(jié)構(gòu)來(lái)組織和表達(dá)知識(shí)的方法,它標(biāo)志著信息檢索從關(guān)鍵詞匹配向深層語(yǔ)義理解的轉(zhuǎn)變。在知識(shí)圖譜中,實(shí)體(如人、地點(diǎn)、物體等)被表示為節(jié)點(diǎn),實(shí)體的屬性用于描述節(jié)點(diǎn)的特性,而實(shí)體間的關(guān)系則由邊來(lái)表示。這種結(jié)構(gòu)使得知識(shí)圖譜不僅能表達(dá)實(shí)體的屬性,還能描述實(shí)體之間的各種復(fù)雜關(guān)系,從而提供更豐富的語(yǔ)義信息。
(2)研究現(xiàn)狀
知識(shí)圖譜技術(shù)是當(dāng)下標(biāo)準(zhǔn)數(shù)字化研究過(guò)程中突出重視的一環(huán)。知識(shí)圖譜技術(shù)通過(guò)構(gòu)建和利用標(biāo)準(zhǔn)知識(shí)的結(jié)構(gòu)化表示,顯著提升了標(biāo)準(zhǔn)內(nèi)容的查詢效率和關(guān)聯(lián)分析能力,進(jìn)而提高了標(biāo)準(zhǔn)的應(yīng)用價(jià)值[1]。對(duì)于標(biāo)準(zhǔn)知識(shí)關(guān)鍵信息的識(shí)取,構(gòu)建標(biāo)準(zhǔn)知識(shí)模型,并進(jìn)行可視化展示,解決了標(biāo)準(zhǔn)知識(shí)未成體系的問(wèn)題[1-2],有助于提高標(biāo)準(zhǔn)信息的可視化和互聯(lián)互通,增強(qiáng)標(biāo)準(zhǔn)內(nèi)容的理解和應(yīng)用。對(duì)于關(guān)聯(lián)分析能力的形成,該技術(shù)將關(guān)鍵信息以圖譜形式表達(dá),建立了各知識(shí)元之間的顯隱關(guān)聯(lián)關(guān)系[2-3],通過(guò)構(gòu)建標(biāo)準(zhǔn)中實(shí)體之間的關(guān)系網(wǎng)絡(luò),使得復(fù)雜的標(biāo)準(zhǔn)信息可以以圖的形式表達(dá),還可處理一些復(fù)雜要素信息,如表格數(shù)據(jù)和公式[4]。并且當(dāng)對(duì)信息單元進(jìn)一步擴(kuò)展應(yīng)用場(chǎng)景時(shí),可以支持標(biāo)準(zhǔn)知識(shí)的關(guān)聯(lián)分析、智能推薦和推理等高級(jí)功能[4]。
在特定行業(yè)中,如電力行業(yè),知識(shí)圖譜技術(shù)已經(jīng)實(shí)現(xiàn)了對(duì)領(lǐng)域知識(shí)的結(jié)構(gòu)化表達(dá),這極大地提高了相關(guān)知識(shí)的查詢效率和利用率[5]。同時(shí),在航空行業(yè),基于實(shí)際操作經(jīng)驗(yàn),已經(jīng)開(kāi)發(fā)出一種構(gòu)建標(biāo)準(zhǔn)知識(shí)圖譜的方法。該方法從原始的標(biāo)準(zhǔn)數(shù)據(jù)開(kāi)始,運(yùn)用一系列的自動(dòng)化或半自動(dòng)化技術(shù),支持知識(shí)圖譜的創(chuàng)建、輸出和輸入[6]。將標(biāo)準(zhǔn)內(nèi)容轉(zhuǎn)換為互聯(lián)的知識(shí)點(diǎn),知識(shí)圖譜技術(shù)構(gòu)筑了一個(gè)行業(yè)內(nèi)的知識(shí)網(wǎng)絡(luò)。這種轉(zhuǎn)換使得標(biāo)準(zhǔn)內(nèi)容變得更加系統(tǒng)化和結(jié)構(gòu)化,從而支持更復(fù)雜的查詢和決策流程,增強(qiáng)了標(biāo)準(zhǔn)應(yīng)用的靈活性和智能化[7]。
(3)技術(shù)優(yōu)缺點(diǎn)
綜合知識(shí)圖譜技術(shù)在標(biāo)準(zhǔn)領(lǐng)域的應(yīng)用情況,總結(jié)提煉標(biāo)準(zhǔn)知識(shí)圖譜技術(shù)優(yōu)缺點(diǎn)。其中,知識(shí)圖譜技術(shù)的優(yōu)點(diǎn),主要體現(xiàn)在:
一是標(biāo)準(zhǔn)知識(shí)結(jié)構(gòu)化表示。知識(shí)圖譜以圖形結(jié)構(gòu)的方式組織和表示知識(shí),能夠清晰地展示實(shí)體之間的關(guān)系和屬性,有助于知識(shí)的理解和推理。二是標(biāo)準(zhǔn)知識(shí)關(guān)聯(lián)性。知識(shí)圖譜能夠捕捉到不同實(shí)體之間的關(guān)聯(lián)性,包括層級(jí)關(guān)系、相似性、關(guān)聯(lián)屬性等,幫助用戶發(fā)現(xiàn)新的知識(shí)。三是標(biāo)準(zhǔn)知識(shí)擴(kuò)展性。知識(shí)圖譜可以不斷擴(kuò)展和更新,添加新的實(shí)體、關(guān)系和屬性,適應(yīng)不斷變化的知識(shí)和需求。四是標(biāo)準(zhǔn)多領(lǐng)域應(yīng)用。知識(shí)圖譜可以應(yīng)用于各個(gè)領(lǐng)域,實(shí)現(xiàn)跨領(lǐng)域的知識(shí)共享和應(yīng)用。
對(duì)應(yīng)缺點(diǎn)也比較明確:
一是標(biāo)準(zhǔn)知識(shí)獲取難度大。構(gòu)建完整和準(zhǔn)確的知識(shí)圖譜需要大量的人力和時(shí)間,進(jìn)行數(shù)據(jù)收集和整理時(shí)可能遇到數(shù)據(jù)不一致、缺失和錯(cuò)誤的問(wèn)題。二是標(biāo)準(zhǔn)知識(shí)表示限制。知識(shí)圖譜通常以實(shí)體、關(guān)系和屬性的方式表示,對(duì)于復(fù)雜和抽象的知識(shí)可能無(wú)法很好地表示,如主觀知識(shí)、情感信息和隱含知識(shí)。三是標(biāo)準(zhǔn)知識(shí)更新延遲。知識(shí)圖譜的更新可能存在延遲,無(wú)法及時(shí)反映最新的信息,尤其是在快速變化的領(lǐng)域。四是標(biāo)準(zhǔn)知識(shí)推理限制。知識(shí)圖譜提供基于關(guān)聯(lián)性的簡(jiǎn)單推理能力,但對(duì)于復(fù)雜的推理和推斷任務(wù)可能存在限制。
2.2 大數(shù)據(jù)技術(shù)
(1)概述
大數(shù)據(jù)技術(shù)是指從多源類型的數(shù)據(jù)中,快速挖掘獲取價(jià)值信息,即對(duì)大量數(shù)據(jù)進(jìn)行采集、存儲(chǔ)、處理和分析的技術(shù)手段。這一技術(shù)體系繁雜,涵蓋了從數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、分布式存儲(chǔ)到數(shù)據(jù)庫(kù)管理、機(jī)器學(xué)習(xí)、并行計(jì)算、數(shù)據(jù)可視化等多個(gè)技術(shù)領(lǐng)域和層面。在標(biāo)準(zhǔn)化領(lǐng)域,盡管標(biāo)準(zhǔn)文本的數(shù)量本身并未達(dá)到大數(shù)據(jù)的規(guī)模,但標(biāo)準(zhǔn)知識(shí)則是典型的大數(shù)據(jù)技術(shù)處理范疇。
(2)研究現(xiàn)狀
在標(biāo)準(zhǔn)數(shù)字化工作研究中,大數(shù)據(jù)技術(shù)的作用體現(xiàn)在對(duì)于標(biāo)準(zhǔn)數(shù)據(jù)信息的處理與分析。從大規(guī)模的標(biāo)準(zhǔn)數(shù)據(jù)集中挖掘價(jià)值和模式,支持標(biāo)準(zhǔn)的決策制定,提供精準(zhǔn)的標(biāo)準(zhǔn)制定和實(shí)施建議[1,8-9],更好地理解和預(yù)測(cè)標(biāo)準(zhǔn)的應(yīng)用效果和市場(chǎng)需求,優(yōu)化標(biāo)準(zhǔn)的設(shè)計(jì)和實(shí)施[10]。具體來(lái)說(shuō),大數(shù)據(jù)技術(shù)通過(guò)信息抽取、數(shù)據(jù)挖掘等手段,解決標(biāo)準(zhǔn)信息內(nèi)容零散的問(wèn)題,為標(biāo)準(zhǔn)知識(shí)主題、章節(jié)架構(gòu)、核心內(nèi)容的識(shí)別與應(yīng)用等提供支持[8],還支持復(fù)雜的數(shù)據(jù)分析,如趨勢(shì)分析、模式識(shí)別等[3,7]。此外,采用IEC62599用例方法學(xué)作為建模工具,有助于評(píng)析規(guī)范多源輸入,確保了標(biāo)準(zhǔn)開(kāi)發(fā)過(guò)程中用戶需求的準(zhǔn)確捕捉和實(shí)現(xiàn)[11]。
(3)技術(shù)優(yōu)缺點(diǎn)
綜合大數(shù)據(jù)技術(shù)在標(biāo)準(zhǔn)領(lǐng)域的應(yīng)用情況,總結(jié)提煉標(biāo)準(zhǔn)大數(shù)據(jù)技術(shù)優(yōu)缺點(diǎn)。其中,大數(shù)據(jù)技術(shù)的優(yōu)點(diǎn),主要體現(xiàn)在:一是數(shù)據(jù)驅(qū)動(dòng)決策。大數(shù)據(jù)可以提供額外的數(shù)據(jù)信息,幫助用戶做出更好的決策。二是實(shí)時(shí)性和即時(shí)性。大數(shù)據(jù)技術(shù)可以實(shí)時(shí)地收集、處理和分析數(shù)據(jù),提供即時(shí)的數(shù)據(jù)分析和反饋。三是高效的數(shù)據(jù)處理能力。大數(shù)據(jù)技術(shù)具有高效、快速的數(shù)據(jù)處理能力,能夠在短時(shí)間內(nèi)處理和分析大量的數(shù)據(jù)。
對(duì)應(yīng)缺點(diǎn)也比較明確:一是非結(jié)構(gòu)化數(shù)據(jù)處理難度大。大數(shù)據(jù)收集的數(shù)據(jù)可能以隨機(jī)信息的形式排列或呈現(xiàn),需要進(jìn)行有效的整理和處理。二是數(shù)據(jù)安全問(wèn)題。大數(shù)據(jù)存在安全問(wèn)題,對(duì)于高度安全的數(shù)據(jù)或機(jī)密信息,需要高度安全的網(wǎng)絡(luò)保護(hù)。三是隱私問(wèn)題。大數(shù)據(jù)涉及大量的個(gè)人和敏感信息,需要妥善處理和保護(hù),防止數(shù)據(jù)泄露和濫用。四是技術(shù)和人力成本高。處理和分析大數(shù)據(jù)需要先進(jìn)的技術(shù)和大量的計(jì)算資源,以及專業(yè)的數(shù)據(jù)科學(xué)家和分析師團(tuán)隊(duì),可能帶來(lái)較高的技術(shù)和人力成本。
2.3 機(jī)器學(xué)習(xí)技術(shù)
(1)概述
機(jī)器學(xué)習(xí)是人工智能領(lǐng)域的一個(gè)重要分支,它賦予計(jì)算機(jī)系統(tǒng)從經(jīng)驗(yàn)中學(xué)習(xí)并自我改進(jìn)的能力,而無(wú)需進(jìn)行明確的程序編碼。這個(gè)概念最早可以追溯到20世紀(jì)50年代,當(dāng)時(shí)由阿蘭·圖靈提出的“圖靈測(cè)試”首次探討了機(jī)器是否能展現(xiàn)出類似人類的智能行為。1959年,阿瑟·薩繆爾(Arthur Samuel)開(kāi)發(fā)了一款能自學(xué)玩跳棋的程序,這是機(jī)器學(xué)習(xí)早期應(yīng)用的一個(gè)例子。機(jī)器學(xué)習(xí)算法主要分為三類:監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí),各自適用于不同的數(shù)據(jù)集和應(yīng)用場(chǎng)景。這些算法使得機(jī)器能夠處理從簡(jiǎn)單的數(shù)據(jù)分類到復(fù)雜的決策制定等多種任務(wù)。在處理標(biāo)準(zhǔn)文本數(shù)據(jù)、推理標(biāo)準(zhǔn)知識(shí)、智能化決策和預(yù)測(cè)分析等方面,機(jī)器學(xué)習(xí)技術(shù)展示了廣泛的應(yīng)用潛力,這對(duì)提高標(biāo)準(zhǔn)制定的效率和服務(wù)的精確性具有顯著的意義。
(2)研究現(xiàn)狀
機(jī)器學(xué)習(xí),主要用于自動(dòng)化處理和解析標(biāo)準(zhǔn)文檔,提高標(biāo)準(zhǔn)文檔的智能查詢和應(yīng)用效率。通過(guò)人工智能,可以實(shí)現(xiàn)標(biāo)準(zhǔn)文檔的自動(dòng)分類、摘要生成、關(guān)鍵信息提取等功能,從而提升標(biāo)準(zhǔn)的易用性和訪問(wèn)速度[9],支持標(biāo)準(zhǔn)的智能應(yīng)用,如自動(dòng)化的標(biāo)準(zhǔn)合規(guī)檢查和標(biāo)準(zhǔn)推薦系統(tǒng)[10]。在航空行業(yè)中,AI可以幫助設(shè)計(jì)更加智能的標(biāo)準(zhǔn)使用工具,實(shí)現(xiàn)按需、智能的標(biāo)準(zhǔn)應(yīng)用[6]。
(3)技術(shù)優(yōu)缺點(diǎn)
綜合機(jī)器學(xué)習(xí)技術(shù)在各個(gè)垂直領(lǐng)域的應(yīng)用情況,總結(jié)提煉機(jī)器學(xué)習(xí)技術(shù)優(yōu)缺點(diǎn)。其優(yōu)點(diǎn)主要體現(xiàn)在:
一是自動(dòng)化和高效率。機(jī)器學(xué)習(xí)可自動(dòng)分析大規(guī)模數(shù)據(jù)集,顯著減少人工干預(yù),從而提升處理速度和結(jié)果的準(zhǔn)確性。二是模式識(shí)別和預(yù)測(cè)能力。通過(guò)訓(xùn)練模型識(shí)別數(shù)據(jù)中的規(guī)律和趨勢(shì),支持更精準(zhǔn)的決策和預(yù)測(cè)分析。三是處理復(fù)雜問(wèn)題。機(jī)器學(xué)習(xí)可以處理復(fù)雜的問(wèn)題和任務(wù),包括圖像識(shí)別、自然語(yǔ)言處理、推薦系統(tǒng)等,為解決現(xiàn)實(shí)世界中的多樣化挑戰(zhàn)提供支持。四是持續(xù)學(xué)習(xí)和改進(jìn)。機(jī)器學(xué)習(xí)模型可以通過(guò)不斷的學(xué)習(xí)和反饋來(lái)改進(jìn)自身的性能和準(zhǔn)確性,具有自我適應(yīng)和持續(xù)改進(jìn)的能力。
對(duì)應(yīng)缺點(diǎn)也比較明確:
一是數(shù)據(jù)依賴性強(qiáng)。機(jī)器學(xué)習(xí)的性能和準(zhǔn)確性很大程度上依賴于訓(xùn)練數(shù)據(jù)的質(zhì)量和數(shù)量,如果數(shù)據(jù)不充分或不具有代表性,可能導(dǎo)致模型的性能下降。二是解釋性問(wèn)題。某些機(jī)器學(xué)習(xí)模型(如深度學(xué)習(xí))可能具有較高的復(fù)雜性和黑盒特性,難以解釋模型的決策過(guò)程和推理邏輯,給人們帶來(lái)一定的困擾。三是需要大量的算力資源和時(shí)間。訓(xùn)練和優(yōu)化機(jī)器學(xué)習(xí)模型需要大量計(jì)算和時(shí)間資源,尤其是在處理大規(guī)模數(shù)據(jù)和復(fù)雜任務(wù)時(shí),可能需要昂貴的硬件和大量的時(shí)間。四是數(shù)據(jù)隱私和安全。機(jī)器學(xué)習(xí)需要大量的數(shù)據(jù)進(jìn)行訓(xùn)練和優(yōu)化,可能涉及個(gè)人和敏感信息,需要妥善處理和保護(hù),防止數(shù)據(jù)泄露和濫用。
2.4 標(biāo)準(zhǔn)大模型技術(shù)
(1)概述
自2022年底OpenAI發(fā)布ChatGP T 3.5之后,因其所表現(xiàn)出的卓越的自然語(yǔ)言理解能力與交互及推理能力,引起了全球范圍內(nèi)對(duì)于大模型的研究關(guān)注。大型語(yǔ)言模型,也稱大語(yǔ)言模型、大模型(Large Language Model,LLM;Large LanguageModels,LLMs),是一種深度學(xué)習(xí)模型,屬于自然語(yǔ)言處理(NLP)的領(lǐng)域,是指包含千億級(jí)別以上參數(shù)的語(yǔ)言模型,通過(guò)學(xué)習(xí)大量的文本數(shù)據(jù)來(lái)預(yù)測(cè)下一個(gè)詞或生成與給定文本相關(guān)的內(nèi)容。為了順利推進(jìn)標(biāo)準(zhǔn)領(lǐng)域大模型技術(shù)的廣泛應(yīng)用,需要全面借鑒典型行業(yè)(如醫(yī)療、金融等)開(kāi)源微調(diào)大模型項(xiàng)目調(diào)研的研究成果,以及相關(guān)具有可復(fù)用或者可參考價(jià)值的工具接口及數(shù)據(jù)集。
(2)研究現(xiàn)狀
自然語(yǔ)言處理技術(shù)主要用于處理和分析標(biāo)準(zhǔn)文本,使之能夠進(jìn)行智能檢索、智能問(wèn)答等,提高標(biāo)準(zhǔn)應(yīng)用的便利性??梢酝ㄟ^(guò)機(jī)器翻譯幫助實(shí)現(xiàn)國(guó)際標(biāo)準(zhǔn)的本地化和本地標(biāo)準(zhǔn)的國(guó)際化,同時(shí)也支持術(shù)語(yǔ)詞典的構(gòu)建和問(wèn)答系統(tǒng)的開(kāi)發(fā)[2]。自然語(yǔ)言處理技術(shù)在標(biāo)準(zhǔn)數(shù)字化中用于理解和處理轉(zhuǎn)換后的文本數(shù)據(jù),可以幫助分析文本內(nèi)容的語(yǔ)義,提取關(guān)鍵信息,并進(jìn)行內(nèi)容的分類和標(biāo)記[7]。ChatGPT等大模型逐漸通用,其發(fā)展到圖像、視頻等其他類型的數(shù)據(jù),對(duì)于標(biāo)準(zhǔn)文本中的曲線、圖形、照片、公式、表格等越發(fā)適配。
(3)技術(shù)優(yōu)缺點(diǎn)
綜合大模型技術(shù)在各個(gè)垂直領(lǐng)域的應(yīng)用情況,總結(jié)提煉機(jī)器學(xué)習(xí)技術(shù)優(yōu)缺點(diǎn)。其優(yōu)點(diǎn)主要體現(xiàn)在:一是訓(xùn)練數(shù)據(jù)規(guī)模更大,ChatGPT等大模型的訓(xùn)練數(shù)據(jù)規(guī)模是其他語(yǔ)言模型的數(shù)倍甚至數(shù)十倍,可以學(xué)習(xí)到更多的語(yǔ)言知識(shí)和語(yǔ)言規(guī)律,具備更強(qiáng)的用戶交互能力和語(yǔ)言生成能力。二是模型參數(shù)更多,算力要求更高:ChatGPT等大模型使用了大量的模型參數(shù),并基于極高的算力,通過(guò)不斷優(yōu)化算法和模型結(jié)構(gòu),使得它在語(yǔ)言模型的各項(xiàng)任務(wù)上表現(xiàn)優(yōu)異。三是語(yǔ)言生成能力更強(qiáng):ChatGPT等大模型可以自動(dòng)生成流暢、自然的文本,包括自然對(duì)話、見(jiàn)解文章,乃至于規(guī)范代碼等。四是自然語(yǔ)言理解能力更強(qiáng),對(duì)話交互性更好:ChatGPT等大模型可以進(jìn)行對(duì)話交互,能夠理解用戶提出的問(wèn)題并生成相應(yīng)的回答,且能生成長(zhǎng)文本密集型答案。
雖然大模型于多個(gè)產(chǎn)業(yè)研究領(lǐng)域都表現(xiàn)出了卓越的性能,但其仍然有著不可忽視的弊端:一是不及時(shí)性,以ChatGPT 3.5為例,其所使用的訓(xùn)練數(shù)據(jù)的截止日期為2021年底,也就是說(shuō)大模型并不能針對(duì)實(shí)時(shí)問(wèn)題進(jìn)行回答,并且由于其模型訓(xùn)練所需數(shù)據(jù)量極大,訓(xùn)練周期較長(zhǎng),所以模型更新速度較慢。二是不可靠性,由于語(yǔ)言生成模型生成文本的模型特征,大模型可能寫出看似合理但不正確的答案。這既源于生成模型的語(yǔ)言生成機(jī)制,也與訓(xùn)練時(shí)所用數(shù)據(jù)的專業(yè)性和真實(shí)性不夠有關(guān)。三是不可解釋性,大模型采用的依然是深度學(xué)習(xí)的訓(xùn)練策略,其訓(xùn)練過(guò)程依然是不可解釋的“黑盒”,那么也就導(dǎo)致在船舶工業(yè)制造領(lǐng)域,大模型生成的結(jié)果不敢用、不可用。四是不穩(wěn)定性,大模型對(duì)輸入文本的變化和相同的提示很敏感,前后兩次相同用戶輸入對(duì)應(yīng)的輸出不一樣。
3 標(biāo)準(zhǔn)數(shù)字化技術(shù)路徑
技術(shù)路線涵蓋標(biāo)準(zhǔn)數(shù)字化的各個(gè)方面,從數(shù)據(jù)資源建設(shè)、內(nèi)容處理、平臺(tái)開(kāi)發(fā)、服務(wù)應(yīng)用、智慧決策到基礎(chǔ)設(shè)施建設(shè)和質(zhì)量控制。它們相互關(guān)聯(lián),共同構(gòu)成了一個(gè)完整的標(biāo)準(zhǔn)數(shù)字化技術(shù)體系,旨在提高標(biāo)準(zhǔn)管理和應(yīng)用的效率,促進(jìn)標(biāo)準(zhǔn)的數(shù)字化轉(zhuǎn)型。
標(biāo)準(zhǔn)數(shù)字化的技術(shù)路線可以分為以下幾類:
(1)數(shù)據(jù)資源建設(shè)與管理。通過(guò)建立包括標(biāo)準(zhǔn)文本庫(kù)、元數(shù)據(jù)庫(kù)、章節(jié)庫(kù)、表格庫(kù)、圖片庫(kù)、公式庫(kù)、術(shù)語(yǔ)庫(kù)、指標(biāo)庫(kù)以及標(biāo)準(zhǔn)知識(shí)圖譜庫(kù)在內(nèi)的綜合標(biāo)準(zhǔn)數(shù)據(jù)資源庫(kù),實(shí)現(xiàn)對(duì)標(biāo)準(zhǔn)規(guī)范及相關(guān)資料的有效整合和管理。
(2)標(biāo)準(zhǔn)內(nèi)容的數(shù)字化處理。標(biāo)準(zhǔn)內(nèi)容結(jié)構(gòu)化,如使用XML技術(shù)對(duì)標(biāo)準(zhǔn)文檔進(jìn)行結(jié)構(gòu)化處理;標(biāo)準(zhǔn)題錄屬性抽取,從標(biāo)準(zhǔn)文獻(xiàn)中抽取關(guān)鍵屬性信息;標(biāo)準(zhǔn)條款(段落)抽取,精確抽取具體的條款或段落;主題詞生成,自動(dòng)抽取標(biāo)準(zhǔn)文獻(xiàn)的主題詞,將傳統(tǒng)的標(biāo)準(zhǔn)文本轉(zhuǎn)化為機(jī)器可識(shí)別的文檔類型。
(3)標(biāo)準(zhǔn)數(shù)字化平臺(tái)與工具開(kāi)發(fā)。搭建標(biāo)準(zhǔn)信息公共服務(wù)平臺(tái),實(shí)現(xiàn)標(biāo)準(zhǔn)全生命周期管理,開(kāi)發(fā)支持XML格式標(biāo)準(zhǔn)文檔的軟件工具,實(shí)現(xiàn)標(biāo)準(zhǔn)數(shù)據(jù)、技術(shù)、業(yè)務(wù)中臺(tái)的共享和共用。
(4)標(biāo)準(zhǔn)數(shù)字化服務(wù)與應(yīng)用。完善標(biāo)準(zhǔn)數(shù)字化服務(wù)能力,如標(biāo)準(zhǔn)知識(shí)語(yǔ)義搜索、語(yǔ)義問(wèn)答、場(chǎng)景推送、指標(biāo)比對(duì)與更新預(yù)警、即時(shí)翻譯等;根據(jù)具體場(chǎng)景需求,開(kāi)發(fā)應(yīng)用工具,實(shí)現(xiàn)標(biāo)準(zhǔn)與業(yè)務(wù)場(chǎng)景融合的服務(wù),規(guī)劃設(shè)計(jì)標(biāo)準(zhǔn)數(shù)字化應(yīng)用場(chǎng)景,確保標(biāo)準(zhǔn)數(shù)字化的有效實(shí)施,實(shí)現(xiàn)標(biāo)準(zhǔn)的自動(dòng)執(zhí)行和決策支持。
(5)標(biāo)準(zhǔn)數(shù)字化的智慧化決策。對(duì)標(biāo)準(zhǔn)管理、服務(wù)、實(shí)施的數(shù)據(jù)進(jìn)行自動(dòng)采集和監(jiān)測(cè),開(kāi)展標(biāo)準(zhǔn)大數(shù)據(jù)分析,實(shí)現(xiàn)對(duì)標(biāo)準(zhǔn)管理、服務(wù)、實(shí)施的評(píng)價(jià),形成基于數(shù)據(jù)驅(qū)動(dòng)的標(biāo)準(zhǔn)科學(xué)化決策能力。
(6)標(biāo)準(zhǔn)數(shù)字化的質(zhì)量控制。標(biāo)準(zhǔn)數(shù)字化結(jié)果審核標(biāo)注,通過(guò)人工審核確保準(zhǔn)確性和可靠性,修正不通過(guò)審核的數(shù)據(jù),并用于訓(xùn)練和優(yōu)化NLP模型。
基于以上研究,本文面向機(jī)器可讀標(biāo)準(zhǔn)分級(jí)模型設(shè)計(jì)了如圖2所示的標(biāo)準(zhǔn)數(shù)字化技術(shù)路線。
對(duì)標(biāo)國(guó)際公認(rèn)的標(biāo)準(zhǔn)數(shù)字化等級(jí)劃分方法,提出標(biāo)準(zhǔn)數(shù)字化關(guān)鍵技術(shù)路線,向信息單元和機(jī)器可控內(nèi)容等數(shù)字化形態(tài)轉(zhuǎn)型。標(biāo)準(zhǔn)每個(gè)階段所蘊(yùn)含的知識(shí)打散、解構(gòu)、分類、辨析、聚合,標(biāo)準(zhǔn)中統(tǒng)領(lǐng)知識(shí)的智慧被階段之間的技術(shù)手段層層釋放出來(lái),如當(dāng)下標(biāo)準(zhǔn)處于Level0~Level1層級(jí)間的核心技術(shù),包括成熟的光學(xué)識(shí)別技術(shù)、智能版面技術(shù)、三維掃描技術(shù)以及數(shù)據(jù)庫(kù)等,未來(lái)短時(shí)間內(nèi)布局的核心技術(shù)包括元數(shù)據(jù)、結(jié)構(gòu)化語(yǔ)言、自然語(yǔ)言處理以及CAD建模語(yǔ)言等。
4 結(jié) 語(yǔ)
隨著人工智能、大數(shù)據(jù)等新興技術(shù)的快速發(fā)展,構(gòu)建面向機(jī)器可讀的標(biāo)準(zhǔn)分級(jí)模型已成為標(biāo)準(zhǔn)化工作的重要發(fā)展方向。本文通過(guò)分析現(xiàn)有標(biāo)準(zhǔn)數(shù)字化技術(shù)的優(yōu)勢(shì)與不足,探討了未來(lái)標(biāo)準(zhǔn)數(shù)字化技術(shù)路線圖。未來(lái)標(biāo)準(zhǔn)數(shù)字化應(yīng)圍繞以下方面展開(kāi):建立統(tǒng)一的標(biāo)準(zhǔn)描述語(yǔ)言和元數(shù)據(jù)規(guī)范,提高不同領(lǐng)域標(biāo)準(zhǔn)的互操作性;開(kāi)發(fā)智能化的標(biāo)準(zhǔn)編制與管理工具,提升標(biāo)準(zhǔn)編制效率與質(zhì)量;構(gòu)建基于知識(shí)圖譜的標(biāo)準(zhǔn)語(yǔ)義關(guān)聯(lián)模型,實(shí)現(xiàn)標(biāo)準(zhǔn)內(nèi)容的智能檢索與推薦;探索區(qū)塊鏈等技術(shù)在標(biāo)準(zhǔn)版本管理、標(biāo)準(zhǔn)實(shí)施評(píng)估等方面的應(yīng)用。
總之,標(biāo)準(zhǔn)數(shù)字化轉(zhuǎn)型是大勢(shì)所趨,需要產(chǎn)學(xué)研各界通力合作,加快關(guān)鍵技術(shù)突破,助力我國(guó)標(biāo)準(zhǔn)化事業(yè)實(shí)現(xiàn)高質(zhì)量發(fā)展。只有不斷探索創(chuàng)新,建立完善、智能、開(kāi)放的標(biāo)準(zhǔn)數(shù)字化生態(tài),才能更好地服務(wù)經(jīng)濟(jì)社會(huì)發(fā)展,推動(dòng)形成全球統(tǒng)一、國(guó)內(nèi)外兼容的標(biāo)準(zhǔn)化新格局。
參考文獻(xiàn)
[1]王立璽,呂千千,牛艷茹.標(biāo)準(zhǔn)數(shù)字化工作關(guān)鍵路徑探究[J].信息技術(shù)與標(biāo)準(zhǔn)化,2022(10):27-30+42.
[2]王一禾,呂千千,祝賀.標(biāo)準(zhǔn)數(shù)字化轉(zhuǎn)型關(guān)鍵技術(shù)及其應(yīng)用分析[J].信息技術(shù)與標(biāo)準(zhǔn)化,2022(10):51-55+59.
[3]呂黔蘇,林正平,王昕,等.電力標(biāo)準(zhǔn)數(shù)字化轉(zhuǎn)型路徑與策略研究[J].品牌與標(biāo)準(zhǔn)化,2023(3):10-12.
[4]陳家賓,趙鑫,王琮,等.機(jī)器可讀標(biāo)準(zhǔn)表達(dá)方式探討[J].信息技術(shù)與標(biāo)準(zhǔn)化,2022(10):43-46.
[5]馬超,鄧桃,周勤勇,等.面向電力領(lǐng)域的標(biāo)準(zhǔn)數(shù)字化轉(zhuǎn)型工作研究——需求分析、轉(zhuǎn)型路徑與應(yīng)用場(chǎng)景[J].中國(guó)標(biāo)準(zhǔn)化,2022(23):87-92.
[6]李翔宇,傅田,潘鑫,等.標(biāo)準(zhǔn)數(shù)字化在航空行業(yè)應(yīng)用探索與實(shí)踐[J].信息技術(shù)與標(biāo)準(zhǔn)化,2022(10):68-72+78.
[7]陳心怡,張華,賈君君,等.數(shù)字經(jīng)濟(jì)下工業(yè)生產(chǎn)標(biāo)準(zhǔn)數(shù)字化轉(zhuǎn)型探索研究[J].中國(guó)標(biāo)準(zhǔn)化,2023(1):48-52.
[8]崔靜,王立璽.標(biāo)準(zhǔn)數(shù)字化工作路線圖探究[J].信息技術(shù)與標(biāo)準(zhǔn)化,2023(6):43-46.
[9]馬超,宋琛.電力標(biāo)準(zhǔn)數(shù)字化:概念、核心挑戰(zhàn)、治理路線圖及發(fā)展趨勢(shì)[J].電網(wǎng)技術(shù),2024,48(2):480-497.
[10]狄矢聰.標(biāo)準(zhǔn)數(shù)字化轉(zhuǎn)型發(fā)展趨勢(shì)與策略研究[J].標(biāo)準(zhǔn)科學(xué),2023(3):36-42.
[11]張寶林,侯常靚,鄔雨筍,等.國(guó)際標(biāo)準(zhǔn)化組織機(jī)器可讀標(biāo)準(zhǔn)工作動(dòng)態(tài)[J].信息技術(shù)與標(biāo)準(zhǔn)化,2022(10):18-22.
作者簡(jiǎn)介
王明皓,碩士,助理工程師,研究方向?yàn)榇皹?biāo)準(zhǔn)數(shù)字化。
殷濤,碩士,通信作者,助理工程師,研究方向?yàn)榇皹?biāo)準(zhǔn)數(shù)字驗(yàn)證。
胡杰鑫,博士,高級(jí)工程師,研究方向?yàn)闃?biāo)準(zhǔn)數(shù)字驗(yàn)證、船舶標(biāo)準(zhǔn)化理論研究。
楊玉婷,本科,工程師,研究方向?yàn)榇皹?biāo)準(zhǔn)化。
陳家賓,碩士,高級(jí)工程師,研究方向?yàn)榇皹?biāo)準(zhǔn)化與開(kāi)發(fā)。
高超,本科,工程師,研究方向?yàn)榇皹?biāo)準(zhǔn)化。
金建海,碩士,高級(jí)工程師,研究方向?yàn)榇皹?biāo)準(zhǔn)化。
(責(zé)任編輯:袁文靜)
中國(guó)標(biāo)準(zhǔn)化2024年15期