鄒文慧
(山東經(jīng)貿(mào)職業(yè)學(xué)院,山東 濰坊 261011)
數(shù)據(jù)化時代背景下,統(tǒng)計數(shù)據(jù)處理是數(shù)據(jù)分析全流程的基礎(chǔ)性環(huán)節(jié)。在眾多的數(shù)據(jù)類型中,時間序列數(shù)據(jù)在社會經(jīng)濟問題中最為廣泛存在,且每種細分類型下,對應(yīng)的數(shù)據(jù)處理方法區(qū)別較大。然而,一些研究者在對時間序列數(shù)據(jù)進行統(tǒng)計處理過程中仍采用“一刀切”策略,無論是何種類型時間序列數(shù)據(jù),均采用直接匯總得總值又或者加總?cè)【档姆绞剑雎粤藭r間序列細分類型之間的區(qū)別,導(dǎo)致不符合實際需求的數(shù)據(jù)處理結(jié)果。
針對上述問題,本文以統(tǒng)計數(shù)據(jù)處理過程中最為常見的時間序列數(shù)據(jù)為研究對象,區(qū)分各細分類型的基本概念,說明每種細分類型下的數(shù)據(jù)處理差異,旨在為數(shù)據(jù)分析者提高理論性認識和提供可操作性參考。
在統(tǒng)計學(xué)理論中,首先需進行數(shù)據(jù)處理才能開展隨后的統(tǒng)計分析,統(tǒng)計數(shù)據(jù)處理尤其以同一空間不同時間的時間序列數(shù)據(jù)為對象,可從動態(tài)角度反映目標(biāo)對象的發(fā)展水平和變化程度,因而要深入理解和把握時間序列數(shù)據(jù)的基本概念。當(dāng)今時代背景下,數(shù)據(jù)已滲透到生活的方方面面,小到菜市場買菜比價,大到政府宏觀調(diào)控的政策依據(jù);數(shù)據(jù)的形式也不僅限于1、2、3、4...這些數(shù)字,還有圖片、文字、音頻和視頻等都是數(shù)據(jù)的表現(xiàn)形式。而時間序列數(shù)據(jù)不是通常意義上的數(shù)據(jù),是目標(biāo)對象的數(shù)據(jù)表現(xiàn)與時間項T 的組合,換言之,給每一個數(shù)據(jù)賦予一定的時間意義,以時間繼起原則進行排序。例如菜市場的白菜,早市2 元,午市3 元,晚市1 元,那么就形成了一個,,的時間序列數(shù)據(jù)。以此為例,就可以理解生活中許多的數(shù)據(jù)現(xiàn)象都是時間序列。綜上,所謂時間序列指的就是同一經(jīng)濟現(xiàn)象在不同時間點上的數(shù)列組合。這一概念與截面數(shù)據(jù),即同一經(jīng)濟現(xiàn)象在不同空間上的數(shù)列組合是不同的。因而,時間序列數(shù)據(jù)需正確區(qū)分類型,針對不同類型的數(shù)據(jù)需采用不同的處理方式,否則會出現(xiàn)結(jié)果上的重大偏頗。在此強調(diào),處理和分析數(shù)據(jù)的第一步是正確識別它們的類型。
時間序列構(gòu)成的基礎(chǔ)是大大小小眾多的指標(biāo),其中最為常見的是總量指標(biāo),它是構(gòu)成平均指標(biāo)和相對指標(biāo)的基礎(chǔ)。總量指標(biāo)依據(jù)時間狀態(tài)的反映不同可以區(qū)分為時期指標(biāo)和時點指標(biāo),前者是指某一時間區(qū)間內(nèi)的流量,而后者是指某一時間節(jié)點上的存量。
將時間序列數(shù)據(jù)各細分類型整理如圖1所示。
圖1 時間序列數(shù)據(jù)類型
由于時期指標(biāo)和時點指標(biāo)在進行數(shù)據(jù)處理時有顯著的差別,因而需明確識別時間序列數(shù)據(jù)總量指標(biāo)中的時期指標(biāo)和時點指標(biāo)。下文對兩者在定義、可加性及數(shù)據(jù)處理中的差異進行詳細說明。
從該角度分析時期指標(biāo)和時點指標(biāo)的不同,首先要區(qū)分“時間長短”和“時間點”的概念。如果將兩者放在直尺等測量工具上進行描述,那么前者就是線段,即一段區(qū)間;而后者只是直尺上的某個點,又稱時刻。時期指標(biāo)反映研究對象在觀測的一段時間內(nèi)發(fā)展變化的總量,它與觀測的時期長短有著直接的關(guān)系,所以由于觀測時間段的不同也會導(dǎo)致時期指標(biāo)結(jié)果的不同;而時點指標(biāo)反映研究對象在某一時間點(瞬間或者時刻)狀態(tài)上的水平,它與觀測時間長短沒有直接的關(guān)系,只與所處的時間點有關(guān)系,所以不同時刻上的時點指標(biāo)也不同。舉例說明上述兩個概念:首先,“人口出生數(shù)”這一指標(biāo),反映的是一段時間內(nèi)某地區(qū)的出生人口總數(shù),與“時長”相關(guān),因此是時期指標(biāo),則2019 年和2020 年的人口出生數(shù)不一致可以理解為,兩者所觀測的時間段是不同的;其次,“年末總?cè)丝凇敝笜?biāo),反映的是某一時刻上的數(shù)值,不涉及變化量,因而它是一個時點指標(biāo),則2019 年和2020 年的年末總?cè)丝诓灰恢驴衫斫鉃?,兩者所處的時間點是不同的。綜上,時期指標(biāo)依賴于所丈量的時間段,而時點指標(biāo)則有賴于所處的時間點。
時期指標(biāo)在經(jīng)濟管理上被稱作流量,數(shù)學(xué)性質(zhì)和經(jīng)濟意義上具有可加性;而時點指標(biāo)被稱作存量,不具有可加性。這就好比是蓄水池某段時間內(nèi)的流量和容積問題:流水量的多少與時間有直接關(guān)系,把這一小時和前一小時的流水量相加代表兩個小時內(nèi)的流量,加總后具有實際意義,因此具有可加性;蓄水池的容積則是存量概念,把每個時間節(jié)點上的容積相加沒有任何意義,即存量不具有可加性。再比如,去超市購物得積分,會顯示新增積分和積分總額,其中每兩期或多期新增積分相加是有意義的,代表該段時期的總積分,因而新增積分是時期指標(biāo);而任意幾期的積分總額相加是不具有任何實際意義的,即不具有可加性的就是時點指標(biāo)。綜上,區(qū)分時期指標(biāo)和時點指標(biāo)的另一重要依據(jù),就是看指標(biāo)相加是否有意義。
3.3.1 計算序列平均發(fā)展水平
在數(shù)據(jù)處理中常用取平均以反映一般水平的情況,即計算序列平均發(fā)展水平。通常意義上的平均,即加總除以個數(shù),然而這在序列水平分析中是不能通用的,需要根據(jù)指標(biāo)類型選擇恰當(dāng)?shù)木涤嬎惴椒ā?/p>
對于時期指標(biāo)構(gòu)成的序列是具有可加性的,因而可直接使用簡便均值計算法。公式1 如下所示。
而對于時點序列,前文已述不可直接加總,那么如何進行平均呢?為計算某一時點指標(biāo)在一定時間段內(nèi)的平均水平,操作步驟如下所述:第一步計算各時間節(jié)點之間的平均值作為該段時間的代表值,第二步以時點間隔長度為權(quán)數(shù)進行加權(quán)平均。公式2 如下所示。
特別地,當(dāng)?shù)怯洉r點指標(biāo)的各時點間隔相等時,采用 “首尾折半法”,公式3 如下所示。
3.3.2 計算平均指標(biāo)和相對指標(biāo)的平均發(fā)展水平
前文已述,時期指標(biāo)和時點指標(biāo)是針對時間序列中總量指標(biāo)而言的,實際上,時間序列以總量指標(biāo)為基礎(chǔ),還衍生出相對指標(biāo)和平均指標(biāo),此上三者構(gòu)成時間序列全類型。因而,要將時期和時點指標(biāo)的概念擴展到平均指標(biāo)和相對指標(biāo)的平均發(fā)展水平計算和分析過程中。
在構(gòu)建由總量指標(biāo)衍生的眾多指標(biāo)時,要注意區(qū)分不同狀況。分析之,平均指標(biāo)和相對指標(biāo)的類型不外乎三種,第一,分子和分母都是時期指標(biāo);第二,分子和分母中其一是時期指標(biāo),另一是時點指標(biāo);第三,分子和分母都是時點指標(biāo)。針對第一種情況,例如“商品平均流通費用率”,處理方法是:首先拆解“流通費用率”的構(gòu)成,其分子“流通費用額”和分母“零售額”都是時期指標(biāo),進而對分子和分母分別使用簡單平均(公式1),再結(jié)合計算最終平均流通費用率的水平。第二種情況,例如“商品平均流轉(zhuǎn)次數(shù)”“人均GDP”等,無論分子、分母誰是時點誰又是時期指標(biāo),只需將時點指標(biāo)按首尾折半法處理(公式3),時期指標(biāo)簡單平均處理即可。第三種情況,分子和分母都是時點指標(biāo),在時間間隔相等的前提下,都運用首尾折半法處理,再結(jié)合為對應(yīng)的平均指標(biāo)或相對指標(biāo)即可。綜上,無論是平均指標(biāo)還是相對指標(biāo),計算其平均發(fā)展水平時,首先要對指標(biāo)進行拆解,例如,分析分子 和分母 的指標(biāo)類型,再根據(jù)其類型選擇相應(yīng)的平均數(shù)處理方法,最后結(jié)合為對應(yīng)的平均指標(biāo)或相對指標(biāo) 。需要強調(diào)的是,由于兩者都是分數(shù)類型的指標(biāo),在處理時注意不要混淆平均的概念,這里的平均是指分數(shù)線上下分別取平均,最后再結(jié)合分數(shù)形式。
為幫助研究者深入理解和把握時期和時點指標(biāo)的區(qū)別,設(shè)想下列情形:某人手里共有50 元錢,現(xiàn)在打算全部花出去,所以買衣服花20,剩30;買拖鞋花15,剩15;買糖果花9 元,剩6 元;最后6 元買了食品。綜上花的錢一共是50 元,可為什么剩余金額總計51 元了呢?上述過程如表1 所示。
表1 某人消費支出與剩余情況 單位:元
在深入理解上文關(guān)于時期指標(biāo)和時點指標(biāo)的區(qū)別之后,該問題就不再是難題,因為剩余的錢相加是沒有意義的。從數(shù)據(jù)可加性的角度,“剩余的錢”是不同時點上的數(shù)據(jù),代表的是一種存量,即不可相加。這就好比我們每次去銀行取錢,流水單會顯示支出和卡內(nèi)的余額,試想把幾次取款的卡余額相加并不能代表財富的多少,也沒有其他意義,所以諸如該類的時點指標(biāo)是不能相加的。
綜上所述,進行時間序列分析的必要前提是正確區(qū)分構(gòu)成時間序列各指標(biāo)的類型,切勿盲目進行一般化的處理,否則會造成結(jié)果有失。時間序列是目標(biāo)社會現(xiàn)象在不同時間點上的連續(xù)記錄,按時間先后原則順次排布,它是數(shù)據(jù)存在的主要形式之一,也是大數(shù)據(jù)時代數(shù)據(jù)生成并記錄的重要形式。正確識別時間序列的類型,掌握時期指標(biāo)和時點指標(biāo)序列差別化的數(shù)據(jù)處理方式,有助于后續(xù)數(shù)據(jù)分析過程順利開展,以準(zhǔn)確指導(dǎo)決策行為。