占暉
摘? ?要:RFID設(shè)備采集原始數(shù)據(jù)直接應(yīng)用于上層系統(tǒng),會(huì)造成系統(tǒng)業(yè)務(wù)邏輯設(shè)計(jì)困難,也會(huì)對(duì)系統(tǒng)資源造成浪費(fèi)。針對(duì)此問(wèn)題,文章對(duì)RFID數(shù)據(jù)傳輸于上層應(yīng)用時(shí)的流數(shù)據(jù)進(jìn)行清洗,處理其中存在的數(shù)據(jù)冗余問(wèn)題,為上層應(yīng)用提供高效、可靠的源數(shù)據(jù)。
關(guān)鍵詞:RFID;數(shù)據(jù)冗余;數(shù)據(jù)清洗
射頻識(shí)別(Radio Frequency IDentification,RFID)技術(shù)作為物聯(lián)網(wǎng)的關(guān)鍵技術(shù)之一,被廣泛用于物資識(shí)別、物資監(jiān)控、物資追蹤等領(lǐng)域[1]。RFID技術(shù)通過(guò)閱讀器識(shí)別黏附于物體表面的標(biāo)簽感知物體,將其行為轉(zhuǎn)換為數(shù)據(jù)支持各類服務(wù)及應(yīng)用程序。當(dāng)數(shù)據(jù)轉(zhuǎn)化為服務(wù)時(shí),由于數(shù)據(jù)處于復(fù)雜、動(dòng)態(tài)、易變的環(huán)境中,若直接將采集的流數(shù)據(jù)應(yīng)用會(huì)產(chǎn)生系統(tǒng)業(yè)務(wù)邏輯設(shè)計(jì)困難,也會(huì)對(duì)系統(tǒng)資源造成浪費(fèi)。
1? ? RFID原理
RFID系統(tǒng)一般包含閱讀器、標(biāo)簽及后臺(tái)服務(wù)系統(tǒng)。RFID系統(tǒng)工作時(shí),閱讀器周期性發(fā)出載波信號(hào),標(biāo)簽在閱讀器的載波信號(hào)覆蓋區(qū)內(nèi)域,RFID0標(biāo)簽通過(guò)耦合元件被激活,從中獲取能量后通過(guò)自身天線將標(biāo)簽的編碼等信息發(fā)送。閱讀器通過(guò)解碼電子標(biāo)簽傳輸?shù)男盘?hào),識(shí)別標(biāo)簽數(shù)據(jù)傳輸?shù)胶笈_(tái)服務(wù)系統(tǒng),后臺(tái)監(jiān)控系統(tǒng)對(duì)傳輸?shù)男畔⑦M(jìn)行處理并應(yīng)用于各種服務(wù)[2]。
2? ? 冗余數(shù)據(jù)清洗技術(shù)
RFID數(shù)據(jù)是具有順序性、連續(xù)性的大量有序流數(shù)據(jù),語(yǔ)義豐富,但在閱讀器讀取并傳輸數(shù)據(jù)中,既包含黏附于物體表面的有用數(shù)據(jù),也包含大量因數(shù)據(jù)重復(fù)、標(biāo)簽失效、標(biāo)簽多讀等帶來(lái)的冗余數(shù)據(jù)[3]。清理無(wú)效數(shù)據(jù),壓縮冗余數(shù)據(jù),對(duì)RFID系統(tǒng)減小數(shù)據(jù)傳輸誤差、節(jié)約通信能源具有非常重大的意義。
閱讀器對(duì)范圍內(nèi)的標(biāo)簽進(jìn)行周期性掃描,在一個(gè)閱讀周期內(nèi),標(biāo)簽會(huì)被閱讀器識(shí)別一次。以主動(dòng)式RFID系統(tǒng)為例,標(biāo)簽在進(jìn)行識(shí)別時(shí),首先需要根據(jù)其標(biāo)簽傳輸?shù)男畔⒏袷脚袛嗍欠駮?huì)被閱讀器識(shí)別。以有源標(biāo)簽為例,標(biāo)簽未被激活時(shí),標(biāo)簽數(shù)據(jù)格式為“00X…X”,激活后傳輸數(shù)據(jù)格式將為“0EX…X”。如果閱讀器多次處于同一位置,狀態(tài)并未發(fā)生改變,將一直傳輸相同的數(shù)據(jù),這樣將產(chǎn)生大量的冗余數(shù)據(jù)。對(duì)于此類冗余數(shù)據(jù),一般采取的措施是在一段時(shí)間內(nèi)統(tǒng)計(jì)若干次數(shù)據(jù),但只傳輸一次有效數(shù)據(jù),同時(shí),比對(duì)標(biāo)簽本次傳輸媒介狀態(tài)與上次傳輸狀態(tài)差異性,如果存在狀態(tài)不一致,就將不一致狀態(tài)進(jìn)行傳輸。
本文討論了對(duì)冗余數(shù)據(jù)的處理算法。對(duì)于數(shù)據(jù)流中的數(shù)據(jù),首先,根據(jù)標(biāo)簽編碼格式確認(rèn)標(biāo)簽是否為可識(shí)別標(biāo)簽,不符合要求的標(biāo)簽直接剔除。其次,根據(jù)歷史讀數(shù)判斷標(biāo)簽狀態(tài)是否發(fā)生變化,以判斷標(biāo)簽是否冗余。對(duì)其中狀態(tài)不變的數(shù)據(jù)只更新標(biāo)簽存在時(shí)間,不更新標(biāo)簽狀態(tài)。對(duì)于狀態(tài)發(fā)生變化的標(biāo)簽,更新其標(biāo)簽狀態(tài),并為前一狀態(tài)更新狀態(tài)結(jié)束時(shí)間,為新狀態(tài)增加狀態(tài)開始時(shí)間。RFID冗余數(shù)據(jù)清洗算法偽代碼算法如表1所示。
3? ? 實(shí)驗(yàn)
3.1? 實(shí)驗(yàn)?zāi)P图皩?shí)驗(yàn)定義
閱讀器在讀取標(biāo)簽時(shí),按照距離讀取概率不同,一般在主檢測(cè)區(qū)域標(biāo)簽讀取概率高達(dá)90%以上,次檢測(cè)區(qū)域隨著距離變化而使標(biāo)簽讀取概率逐漸下降,標(biāo)簽讀取概率如圖1所示。
根據(jù)數(shù)據(jù)清洗的內(nèi)容,定義以下數(shù)據(jù)清洗指標(biāo)。
數(shù)據(jù)壓縮率:一段時(shí)間原始數(shù)據(jù)與有效數(shù)據(jù)的比值,公式如下:
原始數(shù)據(jù)(RawData):在一個(gè)閱讀周期直接捕獲的標(biāo)簽數(shù)據(jù)。
有效數(shù)據(jù)(EffectiveData):當(dāng)標(biāo)簽的感應(yīng)狀態(tài)發(fā)生改變時(shí),獲取的數(shù)據(jù)才為有效數(shù)據(jù)。如圖2所示,標(biāo)簽在一段時(shí)間窗口內(nèi)確認(rèn)一次數(shù)據(jù),其余數(shù)據(jù)均為冗余數(shù)據(jù)。
3.2實(shí)驗(yàn)結(jié)果
在閱讀器周圍0~20 m內(nèi)隨機(jī)均勻放置10個(gè)已經(jīng)激活的RFID標(biāo)簽,沿著閱讀器的中軸移動(dòng),隨機(jī)速度進(jìn)行運(yùn)動(dòng),每100個(gè)閱讀周期由運(yùn)動(dòng)狀態(tài)切換到靜止?fàn)顟B(tài),標(biāo)簽由運(yùn)動(dòng)到靜止再由靜止到運(yùn)動(dòng)的速度均為2 m/s,并同時(shí)改變主要檢測(cè)區(qū)域的百分比,即主區(qū)百分比數(shù)值從0變化到1。采用冗余數(shù)據(jù)清洗算法清洗數(shù)據(jù),選取時(shí)間窗口為3 s,5 s,7 s,比較不同窗口內(nèi)的標(biāo)簽經(jīng)過(guò)清洗后平均錯(cuò)誤率,實(shí)驗(yàn)參數(shù)設(shè)置如表2所示。
冗余數(shù)據(jù)清洗實(shí)驗(yàn)結(jié)果如圖2所示。隨著時(shí)間窗口的增加,壓縮率較小增長(zhǎng),基本保持不變。時(shí)間窗口的個(gè)數(shù)與壓縮率無(wú)關(guān),總時(shí)間窗口越大,壓縮率越高,清洗后的數(shù)據(jù)更加高效。
4? ? 結(jié)語(yǔ)
在RFID應(yīng)用系統(tǒng)中應(yīng)用冗余數(shù)據(jù)清洗算法,通過(guò)判斷標(biāo)簽格式、去除媒介狀態(tài)重復(fù)的標(biāo)簽數(shù)據(jù),可有效降低數(shù)據(jù)的冗余性,提高數(shù)據(jù)的利用率。
[參考文獻(xiàn)]
[1]蔣皓石,張成,林嘉宇.無(wú)線射頻識(shí)別技術(shù)及其應(yīng)用和發(fā)展趨勢(shì)[J].電子技術(shù)應(yīng)用,2005(5):1-4.
[2]谷峪,李曉靜,呂雁飛,等.基于RFID應(yīng)用的綜合性數(shù)據(jù)清洗策略[J].東北大學(xué)學(xué)報(bào)(自然科學(xué)版),2009(1):34-37.
[3]柴文超,湯洪濤,吳光華.面向倉(cāng)儲(chǔ)的RFID數(shù)據(jù)清洗技術(shù)研究[J].機(jī)電工程,2017(12):1474-1479.
Abstract:The RFID device collects the original data and directly applies it to the upper layer system, which will cause difficulty in designing the system business logic and waste the system resources. To solve this problem, this paper cleans the stream data when the RFID data is transmitted to the upper layer, processes the data redundancy problem, and provides efficient and reliable source data for the upper layer application.
Key words:RFID; data redundancy; data cleaning