關(guān)鍵詞:智慧工地;工程智慧建設(shè);數(shù)據(jù)質(zhì)量評價;層次分析法
中圖分類號:X82 文獻標志碼:B
前言
中國十分重視數(shù)字經(jīng)濟、數(shù)字化轉(zhuǎn)型改革的深化發(fā)展與實施落地。智慧工地作為傳統(tǒng)工程建設(shè)方式的轉(zhuǎn)型升級方向,是通過物聯(lián)網(wǎng)、智慧管理平臺實現(xiàn)對于工程現(xiàn)場的數(shù)據(jù)和信息進行收集、分析及處理,實現(xiàn)作業(yè)現(xiàn)場的協(xié)同高效管理。隨著工程建設(shè)領(lǐng)域的信息化建設(shè)不斷深入,大量數(shù)據(jù)資源不斷積累,為數(shù)據(jù)分析、知識發(fā)現(xiàn)提供了大量的基礎(chǔ)數(shù)據(jù)資源。但數(shù)據(jù)異常、冗余與缺失等數(shù)據(jù)質(zhì)量問題也日益突出,嚴重影響數(shù)據(jù)的進一步應用與增值,是工程建設(shè)行業(yè)數(shù)字化升級的一大阻礙。
1研究現(xiàn)狀
通過數(shù)據(jù)質(zhì)量評價,可以發(fā)現(xiàn)數(shù)據(jù)中存在的問題,是提升數(shù)據(jù)質(zhì)量的動力和風向標。數(shù)據(jù)質(zhì)量評價研究由來已久,主要以通用數(shù)據(jù)質(zhì)量研究為主。科學評價一般涉及評價模型、評價指標、評價方法和評價應用等重要方面。
賀文嬌提出了基于數(shù)據(jù)質(zhì)量評價的目標估計方法。利用目標數(shù)據(jù)質(zhì)量評價方法,對不同傳感器得到的目標數(shù)據(jù)質(zhì)量進行科學、有效的測度和評價,并根據(jù)質(zhì)量得分動態(tài)調(diào)整各數(shù)據(jù)源在目標估計過程中所占的權(quán)重,從而減少人工干預,提高目標估計效能。郭莉等針對以能源大數(shù)據(jù)增值服務(wù)的商業(yè)模式研究不足的現(xiàn)狀為出發(fā)點,提出通過構(gòu)建多維度數(shù)據(jù)質(zhì)量評價指標體系,得出了影響能源大數(shù)據(jù)增值服務(wù)商業(yè)模式的關(guān)鍵因素,為統(tǒng)籌規(guī)劃和科學實施提供參考。劉桂鋒等通過文獻調(diào)研和分析,依據(jù)“3W原則”,評價對象、評價體系構(gòu)建視角、評價方法、評價技術(shù)等角度對相關(guān)研究進行系統(tǒng)梳理和內(nèi)容述評。曹文章基于當下數(shù)據(jù)質(zhì)量研究現(xiàn)狀,結(jié)合工程建設(shè)業(yè)務(wù)實際,構(gòu)建智慧工地揚塵監(jiān)測數(shù)據(jù)質(zhì)量評價體系,對智慧工地的揚塵監(jiān)測數(shù)據(jù)質(zhì)量進行評價。
2建設(shè)工程數(shù)據(jù)質(zhì)量評價指標體系構(gòu)建
2.1監(jiān)測數(shù)據(jù)特征分析
智慧工地系統(tǒng)采用物聯(lián)網(wǎng)技術(shù)自動采集工地現(xiàn)場的數(shù)據(jù),主要包括揚塵監(jiān)測、噪聲監(jiān)測、視頻監(jiān)控、車輛沖洗監(jiān)測等數(shù)據(jù)。其中,揚塵監(jiān)測每次采集的數(shù)據(jù)包括PM2.5、PM10、TSP(總懸浮顆粒物,空氣動力學當量直徑≤100μm的顆粒物)、天氣、風向、風力大小等數(shù)據(jù),該數(shù)據(jù)每分鐘一條記錄。揚塵監(jiān)測數(shù)據(jù)的采集容易受工地環(huán)境、設(shè)備電力供應的穩(wěn)定性、設(shè)備的安裝位置、人為因素等因素的影響。
2.2監(jiān)測數(shù)據(jù)質(zhì)量評價一級指標分析
為了保證評價指標體系建設(shè)的科學性,文章首先參考中國關(guān)于數(shù)據(jù)質(zhì)量評價指標的標準GB/T36344-2018,再根據(jù)各省市關(guān)于工程信息化制定的相關(guān)標準規(guī)范以及相關(guān)領(lǐng)域的數(shù)據(jù)質(zhì)量評價的研究,得到了數(shù)據(jù)質(zhì)量評價指標框架。
數(shù)據(jù)規(guī)范性:是指信息化工作需要具有統(tǒng)一的標準,能夠與相應的數(shù)據(jù)準則接軌。
數(shù)據(jù)完整性:描述在指定業(yè)務(wù)規(guī)則要求下,數(shù)據(jù)集中應被賦值的數(shù)據(jù)元素以及數(shù)據(jù)記錄的賦值程度。
數(shù)據(jù)準確性:描述屬于是否與相對應的客觀實體之間的特征一致。
數(shù)據(jù)一致性:描述同一數(shù)據(jù)在不同存儲位置以及與特定的關(guān)聯(lián)數(shù)據(jù)之間無矛盾的程度。
數(shù)據(jù)時效性:描述數(shù)據(jù)在時間變化中的正確程度。
數(shù)據(jù)可訪問性:描述數(shù)據(jù)在需要時的可獲取性以及有效生存周期的可使用性。
2.3監(jiān)測數(shù)據(jù)質(zhì)量評價二級指標分析
在相似的數(shù)據(jù)質(zhì)量評價過程中,針對實際應用場景的分析對這類因素均未納入到構(gòu)建的指標體系之中,而在實際的數(shù)據(jù)收集過程中,更能夠?qū)崿F(xiàn)數(shù)據(jù)的實際情況。所以文章在構(gòu)建智慧工地數(shù)據(jù)質(zhì)量體系過程中,剔除該方面因素。在構(gòu)建數(shù)據(jù)準確性的指標過程中,將數(shù)據(jù)的準確性轉(zhuǎn)化為影響工程建設(shè)數(shù)據(jù)質(zhì)量的異常類型的反向指標。最終構(gòu)建基礎(chǔ)評價體系見表1。
3智慧工地數(shù)據(jù)質(zhì)量評價模型構(gòu)建
對數(shù)據(jù)的基礎(chǔ)篩選,先提出從數(shù)據(jù)的完整性、準確性以及時效性等角度進行分析。根據(jù)上述建立的模型計算得到每個評價指標的權(quán)重,并得到具體數(shù)據(jù)的得分計算。
3.1基于AHP的評價指標權(quán)重計算
此次專家調(diào)研隨機抽取了本領(lǐng)域相關(guān)研究專家15名。問卷有效性判斷主要是根據(jù)問卷填寫的完整性、答案是否有明顯的連續(xù)重復等規(guī)則,并以此構(gòu)造判斷矩陣。
首先對于專家評價結(jié)果進行數(shù)據(jù)分析,得到的一級指標與二級指標的判斷矩陣一致性比率CR均小于0.1,認為判斷矩陣的一致性可以接受,專家的打分比較合理,自洽程度較好,通過了一致性檢驗,最終得到的權(quán)重見表2。
3.2評價指標的定量計算
建立以上工程數(shù)據(jù)綜合評價體系之后,選取了數(shù)據(jù)的完整性、準確性以及時序性三個層面的8個具體指標采用客觀統(tǒng)計計算每個指標的具體得分。
其中,P1a,P1b分別從數(shù)據(jù)元素存在固定值異常比重、數(shù)據(jù)記錄的完整性對數(shù)據(jù)的完整性評價。
P1a是通過遍歷數(shù)據(jù)集,計算出缺失值的數(shù)量,通過具體占比計算出得分。
P1b則是先以小時為單位,將項目中同一設(shè)備的數(shù)據(jù)按記錄時間進行升序排序并得到每小時的數(shù)據(jù)記錄完整性得分,再進行加權(quán)平均,求出統(tǒng)計時間內(nèi)數(shù)據(jù)記錄完整性的得分。
4實證分析
4.1數(shù)據(jù)來源
文章采用的數(shù)據(jù)集是來自于N市的13個行政區(qū)內(nèi)2022年9月16日00:00:00至2022年9月22日23:59:00之間工程建設(shè)項目上有效運行設(shè)備的實時監(jiān)測數(shù)據(jù)。項目類型包括房建工程、市政工程、軌道工程、交通工程、水利工程以及園林工程6種。
4.2評價過程
針對于揚塵監(jiān)測設(shè)備采集的數(shù)據(jù)質(zhì)量的分析,從上文中劃分的每個得分區(qū)間中隨機抽取一組數(shù)據(jù)進行進一步分析,具體抽取數(shù)據(jù)結(jié)果見表3。
在數(shù)據(jù)完整性中,該項數(shù)據(jù)指標的平均得分為95.66分。其中以在數(shù)據(jù)元素完整性的表現(xiàn)較好的設(shè)備1為例,在數(shù)據(jù)采集區(qū)間內(nèi)目標量為10080條,而實際采集的數(shù)據(jù)數(shù)量為10037條,達到了目標數(shù)據(jù)量的99.57%。由于施工單位工程建設(shè)現(xiàn)場的調(diào)整進行的設(shè)備更新,導致設(shè)備狀態(tài)未進行有效更新。數(shù)據(jù)記錄的完整性,則以小時為單位,考慮在每個時間段的數(shù)據(jù)量完整程度。以設(shè)備4例,其在數(shù)據(jù)采集區(qū)間內(nèi)同時出現(xiàn)了在部分時間段數(shù)據(jù)采集過頻,同時9月17日5時至9時之間未采集任何數(shù)據(jù)。因此數(shù)據(jù)元素的賦值程度較高,但是數(shù)據(jù)的記錄在部分時間段出現(xiàn)嚴重缺失的現(xiàn)象。
在數(shù)據(jù)正確性方面,該項數(shù)據(jù)指標的平均得分為69.55分。其中數(shù)據(jù)固定值異常描述的采集的數(shù)據(jù)集異常懸停在某個數(shù)據(jù)的時間窗長度在總的時間窗的比重。如圖1(b)所示,設(shè)備6采集的結(jié)果只在極小的數(shù)據(jù)范圍內(nèi)進行上下震蕩波動。數(shù)據(jù)的重復性異常是在相同的時間點上傳多次重復上傳數(shù)據(jù)的占總數(shù)據(jù)量的比重,該指標下,項目設(shè)備的整體表現(xiàn)較好。數(shù)據(jù)相關(guān)性異常則是考察采集數(shù)據(jù)集中各要素之間的相關(guān)性,主要由無效采集導致的相關(guān)性異常。如圖1(c)為設(shè)備3采集的實時采集揚塵記錄值,其中PM2.5與PM10之間的相關(guān)性異常率極低,但在TSP的數(shù)據(jù)采集上,采集數(shù)據(jù)值恒為0,因此設(shè)備3在相關(guān)性評分上明顯下降。數(shù)據(jù)參考性異常則是檢測設(shè)備的采集數(shù)據(jù)與N市中離該設(shè)備所在項目最近氣象監(jiān)測點的實際統(tǒng)計數(shù)據(jù)的比較。如圖1(d)所示,設(shè)備6的PM2.5的采集值在13左右上下波動,且在該時間段記錄值均未超過國標點記錄值。進行完整數(shù)據(jù)評價后,該項數(shù)據(jù)的恒值異常指標得分為0.6分,同時參考值異常得分為41.37分,該設(shè)備在統(tǒng)計期間盡管持續(xù)上傳數(shù)據(jù),但采集狀態(tài)大部分處于異常狀態(tài)。
在數(shù)據(jù)時序性方面,該項數(shù)據(jù)指標的平均得分為76.09分。主要描述的是持續(xù)變化的時間正確程度。盡管大多數(shù)的時間段內(nèi)數(shù)據(jù)采集出現(xiàn)缺失值的現(xiàn)象,但是總體取得數(shù)據(jù)量與目標量之間的差距并不大?;跁r間點的正確性,該指標的平均得分為84.75分。是通過判斷相鄰上傳數(shù)據(jù)頻率是否為1分鐘/次來表現(xiàn)設(shè)備上傳的頻率達到要求頻率的程度。
5結(jié)論
文章以智慧工地建設(shè)為背景,探索智慧工地新背景下數(shù)據(jù)質(zhì)量評價的關(guān)鍵因素,構(gòu)建基于領(lǐng)域知識的數(shù)據(jù)質(zhì)量評價體系。在理論層面,彌補了智慧建設(shè)領(lǐng)域數(shù)據(jù)質(zhì)量評價體系的空缺;在實踐層面,對海量時序數(shù)據(jù)的及時評分,實現(xiàn)了數(shù)據(jù)驅(qū)動的遠程項目監(jiān)管。工程建設(shè)數(shù)據(jù)質(zhì)量影響因素在傳統(tǒng)的分析模板中,主要受到數(shù)據(jù)的規(guī)范性、完整性、準確性、一致性、時序性以及可訪問性六個方面的影響。文章結(jié)合工程建設(shè)的實際情況,通過案例研究驗證傳統(tǒng)數(shù)據(jù)質(zhì)量影響因素的可靠性。結(jié)論得出數(shù)據(jù)的完整性、準確性和時序性三方面因素是工程建設(shè)中數(shù)據(jù)管理的關(guān)鍵控制因素。