陳康 王琳珠 陸君一 胡文華 / .上海市計量測試技術(shù)研究院;.上海市市場監(jiān)督管理局行政服務(wù)中心
在數(shù)字時代,計量工作需要充分運用數(shù)據(jù)分析技術(shù),探索建立新型計量監(jiān)督模式和標(biāo)準(zhǔn)。諸如:面向出租汽車計價器貿(mào)易結(jié)算用途的民生需求,圍繞計量供給不全面問題,發(fā)展計價器誤差預(yù)警標(biāo)準(zhǔn)的計量新模式,提升政府主管部門與企業(yè)質(zhì)量控制與智慧管理水平。
出租汽車計價器是列入《實施強制管理的計量器具目錄》的工作計量器具,根據(jù)JJG 517-2016《出租汽車計價器》檢定規(guī)程[1]要求,計價器檢定周期為1 a且計量性能必須滿足檢定規(guī)程要求。在周期檢定中,計程誤差是比較重要的檢定項目,如果其不滿足計程最大允許誤差要求-4%~+1%,則本次檢定為不合格。授權(quán)的計量技術(shù)機構(gòu)用適當(dāng)?shù)慕y(tǒng)計分析方法[2][3],對收集的大量計程誤差檢定數(shù)據(jù)進行詳細研究和概括總結(jié),從而提取有用信息,形成結(jié)論。例如,根據(jù)不同企業(yè)、地區(qū)以及器具型號等分類,挖掘檢定合格的計價器計程誤差分布情況,按照相應(yīng)標(biāo)準(zhǔn)對接近超差臨界的器具發(fā)出預(yù)警信息[4][5]。這樣不僅為行業(yè)主管部門非現(xiàn)場監(jiān)管提供技術(shù)支撐,同時協(xié)助企業(yè)提高計量器具的質(zhì)量管理。
由上海市政府主管部門授權(quán)檢定機構(gòu)統(tǒng)計,上海地區(qū)的巡游出租汽車近年來高峰總量達到5萬輛,安裝在巡游出租汽車上的計價器作為計算并顯示乘客應(yīng)付車費的工作計量器具,為保障乘客合法權(quán)益,保證貿(mào)易結(jié)算的公正準(zhǔn)確,每年都需要進行檢定。依據(jù)國家以及地方檢定規(guī)程[6]對計程誤差項目的要求,檢定點至少為3個,需要采樣3次并記錄計算,裝車后計價器計程誤差計算公式:
式中:Dw——計程誤差,%;
D——計價器示值,m;
C——輪胎修正值,%;
Jd——檢定裝置測量的計程值,m
每臺計價器的檢定數(shù)據(jù)可表示為集合A,其中Dw1,Dw2,Dw3為3個檢定點的計程誤差:
在上海地區(qū)每年巡游出租汽車因周期檢定產(chǎn)生的檢定數(shù)據(jù)高峰總量達到15萬條,授權(quán)檢定機構(gòu)在業(yè)務(wù)數(shù)據(jù)庫中存儲相關(guān)檢定數(shù)據(jù),這是計程誤差數(shù)據(jù)處理分析所需的重要資源庫。
數(shù)據(jù)處理分析需要對收集到的計程誤差檢定數(shù)據(jù)進行加工整理,形成合適的數(shù)據(jù)分析樣本,其目的是從大量的、繁瑣的數(shù)據(jù)中提取對政府主管部門和企業(yè)有價值、有意義的數(shù)據(jù)。數(shù)據(jù)處理常用步驟為數(shù)據(jù)清洗、數(shù)據(jù)變換、數(shù)據(jù)規(guī)約等[7]。
首先對每臺計價器的檢定數(shù)據(jù)集合A進行數(shù)據(jù)清洗,主要方法是數(shù)據(jù)去重。由于計程誤差涉及多條數(shù)據(jù)記錄,而這些數(shù)據(jù)記錄都在規(guī)程要求范圍內(nèi),因此,不會直接影響實際檢定結(jié)果,可通過取均值或者挑選特定值方法把多條記錄整合為一條數(shù)據(jù)記錄。考慮到乘客權(quán)益優(yōu)先,本文采用取集合A中最大值(最接近最大允許誤差上限)作為該臺計價器的計程誤差數(shù)據(jù)記錄,集合B為該分類下所有計價器的計程誤差數(shù)據(jù),An(n是自然數(shù))為單臺計價器檢定數(shù)據(jù)的集合:
其次,需要對集合B進行數(shù)據(jù)變換,使采集到的數(shù)據(jù)轉(zhuǎn)換為建模需要的特征形式。利用最小-最大規(guī)范化(又稱歸一化)方法,即把數(shù)據(jù)值縮放至最終范圍為0~1,再使用線性變換公式:
式中:B'——變換后的集合;
b——集合B中的任意數(shù)據(jù);
Dwmin——計價器最大允許誤差下限-4%;
Dwmax——計價器最大允許誤差上限+1%
該方法既保留原始數(shù)據(jù)值之間的聯(lián)系,也能降低授權(quán)機構(gòu)檢定數(shù)據(jù)外泄風(fēng)險。
最后需要通過數(shù)據(jù)規(guī)約降低數(shù)據(jù)集合規(guī)模,從龐大的原數(shù)據(jù)集中獲得一個精簡的數(shù)據(jù)集,既保證原數(shù)據(jù)集的完整性,也提高數(shù)據(jù)挖掘效率。利用直方圖這種無參數(shù)化數(shù)值規(guī)約方法可近似描述數(shù)據(jù)分布情況,通過分組方式把數(shù)據(jù)分布劃分為不相交的子集,每個子集表示計程誤差的一個連續(xù)區(qū)間,然后統(tǒng)計出各子集所含數(shù)據(jù)的個數(shù),即為頻數(shù)。頻數(shù)與數(shù)據(jù)總量之比,稱為頻率(%),其代表數(shù)據(jù)集具體分布情況。計價器最大允許計程誤差區(qū)間中值為-1.5%,規(guī)程要求檢定測得的計程誤差分布在中值附近,而誤差區(qū)間兩側(cè)極端數(shù)據(jù)較少,即直方圖數(shù)據(jù)集接近統(tǒng)計學(xué)正態(tài)分布情況最佳,因此,建議六等分誤差區(qū)間,即組數(shù)為6,組距為1/6,子集區(qū)間分組如表1所示。
表1 計價器最大允許計程誤差區(qū)間分組
展現(xiàn)分析結(jié)果數(shù)據(jù)時,優(yōu)先使用直觀生動的圖形可視化展示,有效地傳遞信息,幫助政府主管部門和企業(yè)從計價器檢定數(shù)據(jù)中發(fā)現(xiàn)規(guī)律和趨勢[8]。
通過直方圖方法獲得計程誤差數(shù)據(jù)集各區(qū)間的數(shù)據(jù)占比,并利用柱形圖的柱子長短差異進行判斷,清晰顯示各區(qū)間的頻率比較情況。圖1中X軸代表計程誤差數(shù)據(jù)集6個歸一化值的區(qū)間,不同區(qū)間之間用不同顏色加以區(qū)分,而Y軸代表頻率并在Y軸上標(biāo)注預(yù)警臨界線。政府主管部門及企業(yè)可對比歷年直方圖可視化圖形,總結(jié)該地區(qū)內(nèi)或各企業(yè)內(nèi)的計價器工作計量狀態(tài)變化情況,在預(yù)警信息出現(xiàn)后采取相應(yīng)措施。
圖1 計價器計量預(yù)警模擬
當(dāng)前適合數(shù)據(jù)分析以及可視化處理的編程語言主要有Python、R、Java等。Python是一種開放的自由軟件,可以閱讀并改動它的源代碼,在數(shù)據(jù)分析及可視化方面有非常成熟的開源代碼庫,能快速完成數(shù)據(jù)的可視化。圖1是使用Python語言完成的計價器計量預(yù)警模擬參考圖。
根據(jù)計價器計程誤差數(shù)據(jù)處理分析結(jié)果,計程誤差分布在區(qū)間兩側(cè)數(shù)據(jù)量越多,意味著該類別的計價器面臨超差風(fēng)險越大??拷鼌^(qū)間下限的類別有負超差風(fēng)險,會損害出租汽車駕駛員和運營企業(yè)相關(guān)利益,導(dǎo)致營業(yè)利潤下降。靠近區(qū)間上限的類別有正超差風(fēng)險,會損害乘客相關(guān)利益,同時造成出租汽車計程收費類投訴增加,導(dǎo)致政府主管部門和企業(yè)產(chǎn)生負面的民生形象。計程誤差分布集中在區(qū)間中值附近,既符合相關(guān)規(guī)程要求,也能維持企業(yè)和消費者計量方面的平衡。因此,將預(yù)警標(biāo)準(zhǔn)劃分為三個等級,分別為正常狀態(tài)、負超差預(yù)警、正超差預(yù)警,并給予不同顏色加以區(qū)分,如表2所示。
表2 計價器計量預(yù)警等級劃分
根據(jù)計價器最大允許計程誤差區(qū)間分組,第1區(qū)間的頻率大小是研判負超差預(yù)警的決定因素,而第6區(qū)間的頻率大小是研判正超差預(yù)警的決定因素,其余區(qū)間頻率之和是研判該類別計價器工作狀態(tài)是否處于正常狀態(tài)的標(biāo)準(zhǔn)。由于各區(qū)間組距相等,按統(tǒng)計學(xué)均勻分布假設(shè)以及相關(guān)質(zhì)量管理要求,計價器計量預(yù)警具體參考標(biāo)準(zhǔn)可設(shè)置為:1)正常狀態(tài)信號標(biāo)準(zhǔn)為第2至第4區(qū)間,頻率之和達到60%及以上;2)負偏差預(yù)警信號標(biāo)準(zhǔn)為第1區(qū)間,頻率達到20%及以上;3)正偏差預(yù)警信號標(biāo)準(zhǔn)為第6區(qū)間,頻率達到20%及以上。圖2是計價器計量預(yù)警各等級可視化的模擬圖。
圖2 計價器計量預(yù)警各等級模擬
政府主管部門和企業(yè)管理的計價器在當(dāng)年檢定后,利用授權(quán)機構(gòu)發(fā)布的計價器計量預(yù)警等級可采取相應(yīng)改善措施。對于正常狀態(tài)信號的類別,政府主管部門可在企業(yè)資質(zhì)考核中給予肯定,企業(yè)需注意第2至4區(qū)間計程誤差分布,避免向兩側(cè)滑動趨勢。對于負超差預(yù)警信號的類別,企業(yè)需及時維護保養(yǎng)車輛和計價器;對于正超差預(yù)警信號的類別,政府主管部門可督促企業(yè)維修更換使用年限較大的車輛和計價器,保障計量公平公正。
基于數(shù)據(jù)處理分析的應(yīng)用技術(shù),本文探究計價器這種強制檢定計量器具的計量預(yù)警標(biāo)準(zhǔn)與機制。授權(quán)機構(gòu)結(jié)合數(shù)據(jù)分析和統(tǒng)計學(xué)方法,對檢定數(shù)據(jù)進行二次分析。根據(jù)相應(yīng)的預(yù)警標(biāo)準(zhǔn),授權(quán)機構(gòu)利用數(shù)據(jù)可視化呈現(xiàn)直觀的計程誤差分布情況。在計價器計量法制管理方面,為政府主管部門和企業(yè)提供技術(shù)支撐和建議。本文總結(jié)的數(shù)據(jù)處理分析方法期望適用于其他具備量大面廣特點的工作計量器具的預(yù)警標(biāo)準(zhǔn)相關(guān)研究。