白旭飛 線江南 單強 孫圓
(國網(wǎng)冀北物資公司 北京市 100071)
2018年以來,國網(wǎng)公司開啟現(xiàn)代智慧供應(yīng)鏈建設(shè),構(gòu)建“五E一中心”供應(yīng)鏈平臺,全面支撐智能采購、數(shù)字物流、全景質(zhì)控三大業(yè)務(wù)鏈,內(nèi)外高效協(xié)同,智慧運營調(diào)配,實現(xiàn)傳統(tǒng)業(yè)務(wù)的數(shù)字化轉(zhuǎn)型。在大信用和大數(shù)據(jù)時代,如何加強大數(shù)據(jù)在環(huán)境信用評價領(lǐng)域的應(yīng)用[1]成為新的著重點。當(dāng)前對供應(yīng)商產(chǎn)品服務(wù)水平、質(zhì)量水平、軟硬件綜合實力等方面缺少科學(xué)劃分和客觀量化的手段,亟待加強電力物資供應(yīng)商信息采集與管理、能力及風(fēng)險智能化評估,利用人工智能技術(shù)建立供應(yīng)商全息畫像體系。借助新技術(shù),引入智能算法實現(xiàn)個性化、專業(yè)化生產(chǎn),實現(xiàn)精準(zhǔn)化管控成為大勢所趨[2]。
如圖1所示,知識圖譜構(gòu)建與智能應(yīng)用項目總體架構(gòu)包括數(shù)據(jù)采集、數(shù)據(jù)處理、圖譜構(gòu)建、應(yīng)用管理和保密安全五個部分,基于供應(yīng)商多維數(shù)據(jù)進(jìn)行統(tǒng)一的數(shù)據(jù)建模、分析和數(shù)據(jù)訪問和應(yīng)用,實現(xiàn)電網(wǎng)現(xiàn)代智慧供應(yīng)鏈管理的智能化、可視化[4]。
2.1.1 數(shù)據(jù)采集
包括業(yè)務(wù)中環(huán)節(jié)中的供應(yīng)商內(nèi)部信息,與供應(yīng)商輿情、企業(yè)關(guān)系、征信等供應(yīng)商的外部信息組成的供應(yīng)商全量信息采集。
2.1.2 數(shù)據(jù)處理將集成進(jìn)來的企業(yè)各個系統(tǒng)中的數(shù)據(jù)進(jìn)行清洗、標(biāo)注得到結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)以及半結(jié)構(gòu)化數(shù)據(jù)。
2.1.3 圖譜構(gòu)建
(1)梳理物資供應(yīng)相關(guān)數(shù)據(jù),完成基本知識圖譜構(gòu)建;
(2)確定畫像指標(biāo)/標(biāo)簽,基于知識圖譜進(jìn)行畫像;
(3)基于業(yè)務(wù)規(guī)則和目標(biāo),設(shè)計知識圖譜推理方法,圖譜推理自動/調(diào)度完成,指導(dǎo)業(yè)務(wù)應(yīng)用。
2.1.4 應(yīng)用管理對軟件的性能、可靠性、魯棒性、擴(kuò)展性、維護(hù)性、易用性、系統(tǒng)災(zāi)備設(shè)計等一系列要求進(jìn)行專項設(shè)計,提高系統(tǒng)應(yīng)用能力。
2.1.5 保密安全
遵循“分區(qū)分域、安全接入、動態(tài)感知、全面防護(hù)”的安全策略,根據(jù)業(yè)務(wù)系統(tǒng)的不斷完善加強對網(wǎng)站的防護(hù),最大限度的保障國家電網(wǎng)公司圖像智能分析應(yīng)用的安全、可靠和穩(wěn)定運行。實現(xiàn)企業(yè)內(nèi)部的高效協(xié)同與精細(xì)化管理[3]。
如圖2所示,本項目需要采集的數(shù)據(jù)信息主要包含業(yè)務(wù)系統(tǒng)內(nèi)的供應(yīng)商相關(guān)數(shù)據(jù)和第三方提供的供應(yīng)商數(shù)據(jù)(天眼查、企查查等)數(shù)據(jù)、文檔表格等外部數(shù)據(jù)。導(dǎo)入、導(dǎo)出數(shù)據(jù)支持批量操作,可同時錄入大量數(shù)據(jù)(最高單次10 萬條數(shù)據(jù))。
圖1
圖2
(1)業(yè)務(wù)系統(tǒng)數(shù)據(jù),指在供應(yīng)鏈管理過程中通過業(yè)務(wù)系統(tǒng)產(chǎn)生的各類業(yè)務(wù)數(shù)據(jù)(簡稱內(nèi)部數(shù)據(jù))。
(2)第三方提供的供應(yīng)商數(shù)據(jù),指通過第三方機(jī)構(gòu)采集的供應(yīng)商數(shù)據(jù),包括工商信息、稅務(wù)信息、股權(quán)結(jié)構(gòu)、注冊信息、資產(chǎn)負(fù)債率、司法信息等。
(3)文檔圖譜數(shù)據(jù),指在業(yè)務(wù)管理過程中產(chǎn)生的相關(guān)文本、圖片表格(如合同掃描件)等資料,其中包含供應(yīng)商相關(guān)信息。
做到以下要求:
數(shù)據(jù)源為負(fù)責(zé)數(shù)據(jù)實時采集和數(shù)據(jù)離線導(dǎo)入,通過采集工具和接口服務(wù)集成來自底層數(shù)據(jù)設(shè)備、業(yè)務(wù)系統(tǒng)、文本資料等多元化異構(gòu)系統(tǒng)的數(shù)據(jù),為項目系統(tǒng)提供統(tǒng)一的數(shù)據(jù)入口。
數(shù)據(jù)存儲與知識存儲層將處理過后的數(shù)據(jù)進(jìn)行統(tǒng)一存儲,了滿足供應(yīng)商畫像相關(guān)數(shù)據(jù)的存儲與計算需求,采用數(shù)據(jù)存儲相關(guān)技術(shù),根據(jù)數(shù)據(jù)的規(guī)模和存儲方式,分為Hadoop 文件存儲、Hbase 列式存儲、Oracle、MySQL 關(guān)系型存儲以及Neo4j 圖數(shù)據(jù)庫存儲;在圖計算技術(shù)中,采用Python iGraph、Spark GraphX、Neo4j GDS 等圖計算引擎,數(shù)據(jù)檢索方面,采用Neo4j 內(nèi)置的Cypher 以及關(guān)系型數(shù)據(jù)庫的SQL。
圖3:技術(shù)架構(gòu)圖
圖4
數(shù)據(jù)與知識處理層將集成進(jìn)來的企業(yè)各個系統(tǒng)中的數(shù)據(jù)進(jìn)行清洗、標(biāo)注得到結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)以及半結(jié)構(gòu)化數(shù)據(jù)。半結(jié)構(gòu)化數(shù)據(jù)通過包裝器(Wrapper),非結(jié)構(gòu)化數(shù)據(jù)通過實體命名識別(NER)、關(guān)系/屬性抽取等NLP 方法轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),再將所有結(jié)構(gòu)化數(shù)據(jù)按照預(yù)先建模的知識模型進(jìn)行映射。將生成的知識經(jīng)過實體對齊、更新、加工等環(huán)節(jié)轉(zhuǎn)化為成熟知識。
圖5
知識處理和知識計算層通過NLP 技術(shù)、圖計算、知識表示學(xué)習(xí)等手段,將非線性世界中的知識信息結(jié)構(gòu)化,以便機(jī)器計算、存儲和查詢。
智能應(yīng)用層主要是根據(jù)不同需求,充分應(yīng)用已有的數(shù)據(jù)及知識,為提供便捷、易用的客戶端接入方式,為用戶直觀的展示數(shù)據(jù),并支持用戶對數(shù)據(jù)進(jìn)行業(yè)務(wù)分析、應(yīng)用。
技術(shù)架構(gòu)圖如圖3所示。
2.3.1 數(shù)據(jù)源
數(shù)據(jù)源基于數(shù)據(jù)中臺及相關(guān)系統(tǒng)構(gòu)建,對外提供統(tǒng)一服務(wù)和支撐。
2.3.2 基礎(chǔ)資源層
基礎(chǔ)資源層主要包括計算資源、存儲資源、網(wǎng)絡(luò)資源、負(fù)載均衡資源等,采用統(tǒng)一的云平臺提供服務(wù),優(yōu)先項目單位現(xiàn)有設(shè)備利舊。
2.3.3 存儲層
提供結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)的存儲及服務(wù),可以按需供應(yīng)服務(wù)及橫向擴(kuò)展,主要技術(shù)涉及國網(wǎng)自主關(guān)系數(shù)據(jù)庫、圖數(shù)據(jù)庫、分布式文件系統(tǒng)等。
2.3.4 系統(tǒng)功能層
知識圖譜實現(xiàn),采用知識圖譜技術(shù),實現(xiàn)制度標(biāo)準(zhǔn)數(shù)據(jù)的實體識別、句子切分、事件單元抽取、事件關(guān)聯(lián)管理等;還包括圖計算、機(jī)器學(xué)習(xí)、算法模型訓(xùn)練、語音分析、NLP,提升制度標(biāo)準(zhǔn)知識圖譜標(biāo)注準(zhǔn)確性、智能性。算法引擎,搭建語音識別、圖像OCR 識別等基礎(chǔ)算法引擎,為服務(wù)與應(yīng)用提供支撐。
2.3.5 服務(wù)層
構(gòu)建智能搜索、多輪問答、關(guān)聯(lián)事件分析、語義分析、NLP 等算法引擎,支撐智能應(yīng)用的實現(xiàn),并提供統(tǒng)一的API 調(diào)用,為業(yè)務(wù)應(yīng)用提供支撐。同時提供服務(wù)治理框架、分布式消息隊列、實時服務(wù)監(jiān)控等能力。
2.3.6 界面展示層提供WEB、手機(jī)APP 兩種界面展示方式,技術(shù)包含HTML、CSS、HTML5、JS 等。
2.3.7 應(yīng)用層
應(yīng)用層主要包括管理各環(huán)節(jié)的業(yè)務(wù)處理能力,形成物資知識庫、智能搜索、智能問答等基礎(chǔ)應(yīng)用和供應(yīng)鏈全過程貫通、供應(yīng)商全方位評價、質(zhì)量全環(huán)節(jié)監(jiān)管、風(fēng)險全方位管控、成本全流程核算等專業(yè)應(yīng)用。
2.3.8 內(nèi)外網(wǎng)隔離裝置
處理內(nèi)外網(wǎng)的隔離交互,實現(xiàn)內(nèi)外網(wǎng)穿透、業(yè)務(wù)連接管理服務(wù)、運行日志采集服務(wù)等。
2.3.9 平臺支撐層
平臺支撐層包括開發(fā)平臺和安全管理兩部分。開發(fā)平臺包括UAP、APM、BPM 等開發(fā)套件及框架、功能組件等。安全管理包括安全控件、安全證書、DDOS 防護(hù)等。
應(yīng)用架構(gòu)如圖4所示。為提高系統(tǒng)的易用性,滿足頁面布局合理,通用操作規(guī)范,出錯處理、反饋與提示人性化等要求,可以從以下的方面來提升:
(1)在設(shè)計上借鑒采用具有良好用戶體驗的界面布局;
(2)對于復(fù)雜的用戶交互,采用界面工作流(或界面向?qū)В┑姆绞綄崿F(xiàn);
(3)對于程序錯誤和異常信息,提供用戶易于理解的響應(yīng);
(4)對于填充控件類長時間的任務(wù),采用使用異步技術(shù)實現(xiàn);
(5)提供有效的在線幫助和詳盡的用戶使用手冊;
(6)提高響應(yīng)時間,單條響應(yīng)不超過3 秒鐘;
(7)系統(tǒng)支持Windows7 及以上(含Windows10)版本的操作系統(tǒng),用戶前端針對IE 瀏覽器、谷歌瀏覽器、360 瀏覽器開發(fā)多個版本。
安全架構(gòu)如圖5所示,遵循“分區(qū)分域、安全接入、動態(tài)感知、全面防護(hù)”的安全策略,根據(jù)業(yè)務(wù)系統(tǒng)的不斷完善加強對網(wǎng)站的防護(hù),最大限度的保障國家電網(wǎng)公司圖像智能分析應(yīng)用的安全、可靠和穩(wěn)定運行。
防護(hù)標(biāo)準(zhǔn):
(1)國際標(biāo)準(zhǔn)和國家標(biāo)準(zhǔn):包括 ISO、ITU 等國際標(biāo)準(zhǔn),國家原信產(chǎn)部相關(guān)標(biāo)準(zhǔn),國家公安部相關(guān)標(biāo)準(zhǔn),以及電信行業(yè)相關(guān)標(biāo)準(zhǔn)等。
(2)機(jī)構(gòu)標(biāo)準(zhǔn)和策略:包括本機(jī)構(gòu)發(fā)展戰(zhàn)略相關(guān)的安全維護(hù)和發(fā)展策略,以及機(jī)構(gòu)內(nèi)部制定的相關(guān)安全標(biāo)準(zhǔn)。
(3)安全規(guī)定、流程和操作手冊:用于指導(dǎo)安全建設(shè)和安全運維的相關(guān)流程和規(guī)定,以及指導(dǎo)具體運維的操作手冊。
(4)其它安全資料:包括用戶安全服務(wù)協(xié)議、培訓(xùn)資料等。
加強安全策略體系的管理,確保機(jī)密信息不泄漏,落實相關(guān)策略,并加強對策略執(zhí)行情況的監(jiān)督。
防護(hù)目標(biāo):
(1)保障圖像智能分析應(yīng)用安全可靠運行。
(2)保障圖像智能分析應(yīng)用邊界和網(wǎng)絡(luò)傳輸通道安全。
(3)保障圖像智能分析應(yīng)用用戶身份真實可信,防止惡意用戶、非授權(quán)用戶訪問。
安全架構(gòu)的各區(qū)邏輯如下:
(1)外部網(wǎng)絡(luò),提供第三方服務(wù)器服務(wù)訪問網(wǎng)絡(luò)環(huán)境。
(2)互聯(lián)網(wǎng)接入?yún)^(qū),部署數(shù)據(jù)采集服務(wù)器,互聯(lián)網(wǎng)外網(wǎng)數(shù)據(jù)首先歸集到外部數(shù)據(jù)前置庫中,通過數(shù)據(jù)的一致性比對,數(shù)據(jù)匹配加工之后,再進(jìn)入內(nèi)網(wǎng)進(jìn)行管理。
(3)代理區(qū),部署訪問代理JMS 中間件,確保數(shù)據(jù)流單向訪問。
(4)應(yīng)用訪問支撐區(qū),屬于信息內(nèi)網(wǎng),負(fù)責(zé)數(shù)據(jù)導(dǎo)入業(yè)務(wù),通過外網(wǎng)數(shù)據(jù)接入流程完成數(shù)據(jù)存儲。
(5)電力內(nèi)網(wǎng)區(qū),屬于信息內(nèi)網(wǎng),部署應(yīng)用業(yè)務(wù)庫、圖數(shù)據(jù)庫。
基于知識圖譜的供應(yīng)商畫像將通過深挖數(shù)據(jù)價值,強化運營分析決策,提升資源優(yōu)化配置,完善風(fēng)險監(jiān)控預(yù)警,深化數(shù)據(jù)資產(chǎn)應(yīng)用,增強應(yīng)急調(diào)配指揮五大功能領(lǐng)域,持續(xù)優(yōu)化,規(guī)范運營管理,成為提質(zhì)增效的重要抓手。