馮俊池,安豐亮,肖巖平
(軍事科學(xué)院系統(tǒng)工程研究院后勤科學(xué)與技術(shù)研究所,北京 100071)
資產(chǎn)是一個單位完成生產(chǎn)任務(wù)和開展日常工作的物質(zhì)基礎(chǔ),也是單位生存和發(fā)展所依賴的重要資源,其管理成效直接影響單位資源能否合理配置。資產(chǎn)管理是單位日常管理的重要工作之一,科學(xué)有效地管理好資產(chǎn),能夠增強資產(chǎn)采購的科學(xué)性、資產(chǎn)配置的合理性,實現(xiàn)資產(chǎn)管理與預(yù)算管理、財務(wù)管理的緊密結(jié)合,發(fā)揮其最大使用效益,對保持和提高生產(chǎn)能力具有重要意義。
隨著信息化的發(fā)展,資產(chǎn)管理信息系統(tǒng)逐漸得到普及,資產(chǎn)申請、審核、購置、登記、處置等各項管理業(yè)務(wù)流程實現(xiàn)線上化操作處理,資產(chǎn)使用及運行狀態(tài)通過實時采集手段實現(xiàn)動態(tài)監(jiān)控。在線系統(tǒng)產(chǎn)生的資產(chǎn)數(shù)據(jù)逐漸匯聚,規(guī)模體量逐漸龐大,資產(chǎn)管理過程中的規(guī)律、態(tài)勢、風(fēng)險等有價值的數(shù)據(jù)潛藏其中。如何有效利用數(shù)據(jù)積累,發(fā)揮信息技術(shù)優(yōu)勢,實現(xiàn)資產(chǎn)整體態(tài)勢掌握、有效管控和統(tǒng)籌配置,受到了越來越多的重視。
數(shù)據(jù)可視化技術(shù)與數(shù)據(jù)挖掘分析技術(shù)是大數(shù)據(jù)利用中常用的關(guān)鍵技術(shù),能夠從規(guī)模巨大、類型繁多、產(chǎn)生迅速、價值密度低的數(shù)據(jù)中有效提取關(guān)鍵信息。通過在資產(chǎn)數(shù)據(jù)分析中應(yīng)用數(shù)據(jù)可視化與挖掘分析技術(shù),能夠分析資產(chǎn)規(guī)模、價值、質(zhì)量、使用狀況及分布情況,探索變化趨勢,發(fā)現(xiàn)存在問題,對掌握資產(chǎn)整體態(tài)勢,盤活存量資產(chǎn),優(yōu)化資源配置,提高資產(chǎn)利用率和經(jīng)營管理效能具有重要意義。
數(shù)據(jù)可視化是數(shù)據(jù)描述的圖形化表示,通過以直觀的方式呈現(xiàn)數(shù)據(jù),幫助用戶深入理解數(shù)據(jù)內(nèi)涵,有效獲取數(shù)據(jù)潛在的重要信息以及特征規(guī)律[1]。數(shù)據(jù)可視化能將枯燥繁多的數(shù)據(jù)轉(zhuǎn)化為生動形象的圖表,為錯綜復(fù)雜、看上去沒有關(guān)聯(lián)的數(shù)據(jù)建立聯(lián)系和關(guān)聯(lián)[2]。
數(shù)據(jù)可視化過程包括數(shù)據(jù)采集、數(shù)據(jù)處理變換、可視化映射和用戶感知4 個主要階段[2]。數(shù)據(jù)采集主要通過從業(yè)務(wù)信息系統(tǒng)、離線文件、物聯(lián)網(wǎng)采集設(shè)備等來源實現(xiàn)數(shù)據(jù)匯聚,通過自動化接口、人工處理等形式,將多源數(shù)據(jù)進行融合。數(shù)據(jù)處理變換將數(shù)據(jù)進行格式、形式上的轉(zhuǎn)換和特征提取等操作,為數(shù)據(jù)展現(xiàn)提供基礎(chǔ)??梢暬成鋭t將數(shù)據(jù)特征映射到不同類型的圖表,實現(xiàn)由數(shù)據(jù)值到形狀、大小、顏色等圖表特征的轉(zhuǎn)換,常用的統(tǒng)計圖表包括柱狀圖、折線圖、餅狀圖、散點圖、氣泡圖、雷達圖、直方圖、詞云圖、熱度圖、地圖等。用戶感知則是用戶借助圖表發(fā)現(xiàn)潛在信息和知識的過程,實現(xiàn)由數(shù)據(jù)到認識的最后轉(zhuǎn)換。
數(shù)據(jù)挖掘分析是通過特定的方法來發(fā)現(xiàn)隱藏在大量數(shù)據(jù)中的信息的過程,是大數(shù)據(jù)處理體系的核心。數(shù)據(jù)挖掘分析涵蓋了統(tǒng)計分析、機器學(xué)習(xí)、模式識別等多個領(lǐng)域的技術(shù)和方法[3],主要包括數(shù)據(jù)預(yù)處理、特征工程、建立模型和應(yīng)用模型4 個主要階段。(1)數(shù)據(jù)預(yù)處理。主要針對數(shù)據(jù)進行歸一化、標準化等操作,原始數(shù)據(jù)中通常存在各類問題,如:數(shù)據(jù)量綱不一致、數(shù)據(jù)項冗余、存在缺失值、類別特征不能直接使用等,需要進行處理后才能進行下一步。如在算法只接受數(shù)值特征的輸入、字符型類別特征不能直接使用的情況下,需要通過one-hot[4]將字符型數(shù)據(jù)轉(zhuǎn)換為數(shù)值型數(shù)據(jù)。(2)特征工程。指從數(shù)據(jù)中篩選與訓(xùn)練目標相關(guān)的特征,從而提高模型效果的過程。待挖掘分析的數(shù)據(jù)項一般很多,如果全部作為特征輸入模型進行訓(xùn)練,則會帶來噪聲,影響模型效果。通過可視化分析可以發(fā)現(xiàn)影響目標的相關(guān)變量,為特征選取提供參考。(3)建立模型。指選擇要使用的模型,利用數(shù)據(jù)進行訓(xùn)練,并不斷調(diào)整優(yōu)化的過程。常見的模型包括回歸、聚類、分類等。針對不同的分析任務(wù),要選取的模型也不同,需要根據(jù)任務(wù)特點和模型的適用性,選擇最優(yōu)模型。(4)應(yīng)用模型。在建立模型階段訓(xùn)練得到的模型在應(yīng)用模型階段使用,通過將待分析數(shù)據(jù)作為輸入運行模型,從而得到分析結(jié)果,為業(yè)務(wù)人員決策提供指導(dǎo)。
數(shù)據(jù)可視化技術(shù)能夠?qū)崿F(xiàn)資產(chǎn)態(tài)勢的掌握以及數(shù)據(jù)規(guī)律的發(fā)現(xiàn),還可用于資產(chǎn)數(shù)據(jù)的清洗[5],進行數(shù)據(jù)的檢查、糾錯和轉(zhuǎn)換。
資產(chǎn)分布主要指資產(chǎn)數(shù)量及價值在類別、所屬部門、所處位置等多個維度上的分布情況,可采用柱狀圖、南丁格爾圖、餅圖、雷達圖、詞云圖等形式表現(xiàn)。針對基礎(chǔ)設(shè)施類數(shù)據(jù)可采用地圖形式表現(xiàn)。(1)類別分布分析。通過資產(chǎn)價值在不同類別資產(chǎn)上的分布情況對比,可查看經(jīng)費投向投量,對比與整體戰(zhàn)略是否一致。(2)部門分布分析。通過資產(chǎn)數(shù)據(jù)及價值在不同單位或部門的分布情況對比,分析資產(chǎn)分布與單位職能、規(guī)模是否匹配。(3)位置分布分析。通過資產(chǎn)數(shù)量及價值在不同地理位置的分布情況對比,分析是否均衡,以及與業(yè)務(wù)區(qū)域重視程度是否相符。
(4)多維分布分析。結(jié)合類型、部門、位置等多種因素,綜合查看資產(chǎn)分布情況。在堆積柱形圖中可以實現(xiàn)不同子分類數(shù)據(jù)的堆積,從而在展現(xiàn)數(shù)據(jù)分類對比的同時查看子分類的占比情況。如在針對單位資產(chǎn)價值的分布圖中,可通過堆積不同類型資產(chǎn)的價值,實現(xiàn)查看不同單位資產(chǎn)價值分布情況的同時,對比同一單位不同類型資產(chǎn)的價值。
資產(chǎn)趨勢分析主要指分析資產(chǎn)數(shù)量及價值在時間維度上的變化情況,可采用折線圖、階梯圖等形式實現(xiàn)。通過觀察資產(chǎn)總量、規(guī)模和結(jié)構(gòu)在時間維度上的增減變動情況,可了解資產(chǎn)整體態(tài)勢及管理情況,并判斷其對單位生產(chǎn)效能的影響;通過觀察某類資產(chǎn)在時間維度上的增減情況,可發(fā)現(xiàn)該類資產(chǎn)購置、使用和退出規(guī)律,為采購、維修、報廢計劃提供參考。資產(chǎn)趨勢分析應(yīng)用場景還包括:
(1)資產(chǎn)購置新增趨勢分析,反映單位在特定領(lǐng)域建設(shè)的投入情況,檢查各領(lǐng)域方向投入是否均衡,以及是否與業(yè)務(wù)發(fā)展重點相一致。
(2)資產(chǎn)報廢退役趨勢分析,反映資產(chǎn)消耗情況,檢查資產(chǎn)消耗速度是否正常,是否存在消耗過快情況。
(3)資產(chǎn)使用時間趨勢分析,反映資產(chǎn)使用規(guī)律,檢查資產(chǎn)利用率是否合理,如利用率過低,則可能存在資產(chǎn)數(shù)量過多或配置不均等情況,需要根據(jù)具體原因調(diào)整資產(chǎn)配置。
資產(chǎn)損耗分析主要從質(zhì)量和使用情況角度分析資產(chǎn)狀況,發(fā)現(xiàn)資產(chǎn)使用和維護管理中存在的問題,為提升資產(chǎn)質(zhì)量和使用效益發(fā)現(xiàn)可改進之處。
2.3.1 資產(chǎn)質(zhì)量分析
資產(chǎn)以采購等各種形式新增,以報廢、權(quán)利轉(zhuǎn)移等各種形式減少,在其生命周期內(nèi),還需要關(guān)注運行(使用)、維護及處置情況,如果沒有完善的管理機制,資產(chǎn)會出現(xiàn)質(zhì)量問題,導(dǎo)致其無法發(fā)揮應(yīng)有的作用。針對以上情況,分析各類資產(chǎn)新品、堪用品、待修品、報廢品的數(shù)量及比例,可獲悉資產(chǎn)質(zhì)量分布情況,從而判斷質(zhì)量情況是否合理,并從以下角度分析有無問題以改進管理:①設(shè)施設(shè)備維修是否及時;②資產(chǎn)報廢率是否過高;③資產(chǎn)購置及處理是否及時;④可用資產(chǎn)規(guī)模是否滿足業(yè)務(wù)工作需求。
2.3.2 資產(chǎn)使用分析
如果采購時缺乏整體協(xié)調(diào)容易使得部分資產(chǎn)的重復(fù)購置率較高,從而造成使用效率低;部分設(shè)備類資產(chǎn)由于更新?lián)Q代頻繁、兼容性差等原因也有可能造成資產(chǎn)長期閑置。針對以上情況,分析每類資產(chǎn)以及其在不同部門的使用及閑置情況,判斷資產(chǎn)存量是否滿足需求、是否存在冗余,以及各部門間資產(chǎn)使用是否存在忙閑不均等情況,為資產(chǎn)合理配置提供數(shù)據(jù)依據(jù),充分挖掘資產(chǎn)潛能,避免設(shè)備空置、重復(fù)購置等浪費現(xiàn)象出現(xiàn)。
聚類分析目的是把大量數(shù)據(jù)點的集合分為若干類,使得每個類中的數(shù)據(jù)最大限度地相似,而不同類中的數(shù)據(jù)最大限度地不同。將各單位不同類型資產(chǎn)的數(shù)量作為特征向量,運用聚類分析方法,可挖掘具有相似資產(chǎn)分布特性的單位,通過與單位職能的對比分析,來輔助判斷資產(chǎn)配置是否合理。
資產(chǎn)數(shù)據(jù)分析中其他可以應(yīng)用聚類分析的場景還包括:
(1)根據(jù)資產(chǎn)使用壽命、維修周期等特征,建立聚類模型,挖掘具有相同維護特性的資產(chǎn)類型,以便于統(tǒng)一管理。
(2)針對某一類型設(shè)備,根據(jù)設(shè)備性能參數(shù)等進行聚類,如臺式計算機,根據(jù)處理器、內(nèi)存、硬盤、顯卡等參數(shù)進行聚類分析,結(jié)合用途功能,形成系列配置,可為下一步采購、編配、調(diào)劑提供參考。
關(guān)聯(lián)分析通過尋找最能夠解釋數(shù)據(jù)變量之間關(guān)系的規(guī)則,來找出大量多元數(shù)據(jù)集中有用的關(guān)聯(lián)規(guī)則,是從大量數(shù)據(jù)中發(fā)現(xiàn)多種數(shù)據(jù)之間關(guān)系的一種方法;另外,它也可以基于時間序列對多種數(shù)據(jù)間的關(guān)系進行挖掘。
關(guān)聯(lián)分析的對象包括不同類別員工數(shù)量與辦公設(shè)備數(shù)量之間的關(guān)系、不同類型資產(chǎn)之間的數(shù)量關(guān)系等,如臺式計算機數(shù)量與硬盤購置數(shù)量、辦公桌數(shù)量等之間的關(guān)系;還可以對各類資產(chǎn)數(shù)量之間進行關(guān)聯(lián)分析,發(fā)現(xiàn)其中隱藏的不同資產(chǎn)之間的潛在關(guān)聯(lián),為制定配置標準、科學(xué)規(guī)范配置相關(guān)資產(chǎn)提供參考。
回歸分析的核心是解決連續(xù)型變量的預(yù)測問題,通過對具有連續(xù)型標簽的數(shù)據(jù)進行學(xué)習(xí),建立機器學(xué)習(xí)模型,從而對其他有相同特征的數(shù)據(jù)集進行預(yù)測。常用模型包括線性模型、決策樹模型、生存回歸模型等。應(yīng)用回歸預(yù)測對單位資產(chǎn)總量隨時間變化情況進行分析,可發(fā)現(xiàn)資產(chǎn)變化趨勢規(guī)律,輔助后續(xù)規(guī)劃計劃;對比不同單位資產(chǎn)變化情況,根據(jù)差異尋找不同及原因,推動改進管理手段和方法。
針對大型儀器設(shè)備,通過回歸預(yù)測還可輔助進行運行狀態(tài)監(jiān)控管理。根據(jù)設(shè)備信息、維修情況以及運行特征狀態(tài)數(shù)據(jù)集,構(gòu)建預(yù)測模型,對設(shè)備進行使用壽命、檢修維修時間等數(shù)值預(yù)測,實現(xiàn)設(shè)備運行狀況預(yù)警,同時為采購計劃、備品備件庫存、維修檢修計劃等提供參考。
異常點檢測又稱離群點檢測,是找出明顯偏離其他數(shù)據(jù),不滿足一般模式或行為的數(shù)據(jù)點的檢測過程[6]。常見的檢測方法包括基于統(tǒng)計的模型、基于距離的模型等。異常點檢測試圖捕捉那些顯著偏離多數(shù)模式的異常情況,可用于發(fā)現(xiàn)大量資產(chǎn)中存在的異常個例。如果某類資產(chǎn)的報廢期限普遍為6~8 年,那么某個使用2 年便報廢的該類資產(chǎn)便是典型的異常點,需要進一步結(jié)合實際情況開展分析,確定是統(tǒng)計錯誤還是實際情況,如情況屬實,還可對其產(chǎn)生原因做進一步分析,為后期使用管理提供經(jīng)驗。此外,還可以針對資產(chǎn)數(shù)量、價值、質(zhì)量等多個指標在不同維度上進行異常點檢測,發(fā)現(xiàn)資產(chǎn)管理中存在的個別問題,有助于發(fā)現(xiàn)異常和違規(guī)情況,推動資產(chǎn)規(guī)范化管理。
在信息技術(shù)特別是大數(shù)據(jù)技術(shù)迅速發(fā)展的形勢下,資產(chǎn)數(shù)據(jù)在質(zhì)和量上逐漸提升。海量資產(chǎn)數(shù)據(jù)如果無法得到有效利用,則不能充分發(fā)揮信息化管理的優(yōu)勢,無法將數(shù)據(jù)優(yōu)勢轉(zhuǎn)化為決策優(yōu)勢,從而無法改進管理,提高效益。為解決這一問題,本文對數(shù)據(jù)可視化及挖掘分析技術(shù)在資產(chǎn)數(shù)據(jù)管理中的應(yīng)用進行了分析,針對典型場景提出了應(yīng)用方向和內(nèi)容。通過對資產(chǎn)數(shù)據(jù)的深入分析得出規(guī)律,指導(dǎo)資產(chǎn)采購、使用、調(diào)配、報廢等工作開展,有利于提高資產(chǎn)利用率,提升資產(chǎn)管理的科學(xué)性、準確性。