【摘 要】隨著科學(xué)技術(shù)的不斷發(fā)展,信息通信行業(yè)也進(jìn)行了快速的發(fā)展,其中基于云計(jì)算的物聯(lián)網(wǎng)發(fā)展越來(lái)越受到人們的重視。下面本文就對(duì)基于云計(jì)算的物聯(lián)網(wǎng)數(shù)據(jù)挖掘模式進(jìn)行分析,以能夠?yàn)槠浒l(fā)展提供一定的參考資料。
【關(guān)鍵詞】云計(jì)算;物聯(lián)網(wǎng);數(shù)據(jù)挖掘模式
隨著現(xiàn)代化科技的快速發(fā)展,信息的通信以進(jìn)入大容量快傳輸?shù)碾A段,基于云計(jì)算的物聯(lián)網(wǎng)也開(kāi)始備受科技人士的關(guān)注。物聯(lián)網(wǎng)就是一個(gè)物與物相連的網(wǎng)絡(luò),簡(jiǎn)單的說(shuō)是互聯(lián)網(wǎng)從人向物的一種延伸。物聯(lián)網(wǎng)中產(chǎn)生的大量數(shù)據(jù)是和時(shí)間與空間相關(guān)聯(lián)的,有著動(dòng)態(tài)、異構(gòu)和分布的特性,這些對(duì)于物聯(lián)網(wǎng)的數(shù)據(jù)挖掘工作來(lái)說(shuō)是很困難的,因此下面我們就給大家介紹:基于云計(jì)算的物聯(lián)網(wǎng)數(shù)據(jù)挖掘模式,這將對(duì)其數(shù)據(jù)的挖掘工作帶來(lái)很大的便利[1]。
一、基于云計(jì)算的物聯(lián)網(wǎng)特性
社會(huì)的發(fā)展必將挑戰(zhàn)科技的最大進(jìn)步,近幾年物聯(lián)網(wǎng)產(chǎn)業(yè)就在高科技的帶動(dòng)下迅猛發(fā)展。物聯(lián)網(wǎng)其實(shí)就是一個(gè)分布廣泛而且巨大的物與物相連的網(wǎng)絡(luò),可以用來(lái)監(jiān)控我們現(xiàn)實(shí)世界中的各種對(duì)象,許許多多的應(yīng)用終端也被接入物聯(lián)網(wǎng)中,包括交通設(shè)施和建筑物還有湖泊等等。但是隨著各種各樣的異構(gòu)終端設(shè)備的接入,我們的物聯(lián)網(wǎng)采集的數(shù)據(jù)量也就會(huì)越來(lái)越大,其數(shù)據(jù)類(lèi)型和數(shù)據(jù)格式也會(huì)越來(lái)越復(fù)雜,運(yùn)用傳統(tǒng)的數(shù)據(jù)挖掘方法已經(jīng)無(wú)法直接應(yīng)用于物聯(lián)網(wǎng)之中了,因此為了解決以上這些問(wèn)題,我們提出了一種關(guān)于物聯(lián)網(wǎng)數(shù)據(jù)挖掘的基于云計(jì)算的系統(tǒng)。
其實(shí)在現(xiàn)實(shí)網(wǎng)絡(luò)中,在物聯(lián)網(wǎng)中的數(shù)據(jù)有著高度的動(dòng)態(tài)性和異構(gòu)性,物聯(lián)網(wǎng)的數(shù)據(jù)還和時(shí)間與空間有密切的聯(lián)系,而這些恰恰會(huì)給物聯(lián)網(wǎng)的數(shù)據(jù)挖掘帶來(lái)了很大的困擾,要知道物聯(lián)網(wǎng)數(shù)據(jù)的挖掘很耗費(fèi)時(shí)間和內(nèi)存,且還效率低下。于是,云計(jì)算的物聯(lián)網(wǎng)數(shù)據(jù)挖掘模式就被提出來(lái)了[2]?;谠朴?jì)算的物聯(lián)網(wǎng)數(shù)據(jù)挖掘方法,就是在用云計(jì)算來(lái)作為支持的技術(shù)平臺(tái)上,再構(gòu)建可以面向物聯(lián)網(wǎng)的分布式時(shí)空數(shù)據(jù)庫(kù),再在這個(gè)數(shù)據(jù)庫(kù)的基礎(chǔ)上搭建可以面向擁有海量數(shù)據(jù)物聯(lián)網(wǎng)系統(tǒng)的數(shù)據(jù)挖掘模型。基于云計(jì)算的數(shù)據(jù)挖掘就是通過(guò)分析,表明該數(shù)據(jù)挖掘模型可以很有效的實(shí)現(xiàn)物聯(lián)網(wǎng)中的數(shù)據(jù)挖掘任務(wù)。
在物聯(lián)網(wǎng)的數(shù)據(jù)量大而且高度動(dòng)態(tài)性與異構(gòu)性,還有數(shù)據(jù)類(lèi)型復(fù)雜和復(fù)雜時(shí)空特性等特點(diǎn)的基礎(chǔ)上,都將會(huì)為以后數(shù)據(jù)挖掘帶來(lái)新的挑戰(zhàn),有了基于云計(jì)算的物聯(lián)網(wǎng)技術(shù),這些問(wèn)題就可以破刃而解了[3]。
二、基于云計(jì)算的數(shù)據(jù)挖掘模型
基于云計(jì)算的數(shù)據(jù)挖掘的平臺(tái)就是能夠提供動(dòng)態(tài)資源池和虛擬化跟高可用性的計(jì)算平臺(tái)。云計(jì)算的數(shù)據(jù)挖掘平臺(tái)可被用來(lái)開(kāi)發(fā)高性能的應(yīng)用程序,可以利用云計(jì)算來(lái)進(jìn)行數(shù)據(jù)挖掘。
物聯(lián)網(wǎng)中在基于云計(jì)算的數(shù)據(jù)挖掘系統(tǒng)設(shè)計(jì)的過(guò)程力,先由軟件的分層設(shè)計(jì)思想,將基于云計(jì)算的數(shù)據(jù)挖掘系統(tǒng)的層次自頂向下劃分為:用戶(hù)層、任務(wù)層和算法層。在這個(gè)平臺(tái)當(dāng)中,軟件的底層可以透明的為它的上層提供服務(wù),上層就可以通過(guò)其層間的開(kāi)放接口來(lái)調(diào)用下層的服務(wù),這樣就使得層與層之間的功能相對(duì)的做到獨(dú)立,這樣設(shè)計(jì)是易于對(duì)數(shù)據(jù)挖掘系統(tǒng)的二次開(kāi)發(fā),還在設(shè)計(jì)算法層的過(guò)程中設(shè)計(jì)了多層插件的框架結(jié)構(gòu),這樣增加了算法的實(shí)現(xiàn)和維護(hù)的靈活性[4]?;谠朴?jì)算的物聯(lián)網(wǎng)數(shù)據(jù)挖掘既要滿(mǎn)足物聯(lián)網(wǎng)數(shù)據(jù)的復(fù)雜類(lèi)型還要滿(mǎn)足物聯(lián)網(wǎng)數(shù)據(jù)的高動(dòng)態(tài)性,故此,這樣設(shè)計(jì)的基于云計(jì)算的物聯(lián)網(wǎng)數(shù)據(jù)挖掘模式最合適。
圖1 物聯(lián)網(wǎng)(IOT)多層數(shù)據(jù)挖掘模型
三、基于云計(jì)算的物聯(lián)網(wǎng)數(shù)據(jù)挖掘模式分析
物聯(lián)網(wǎng)的數(shù)據(jù)挖掘模式要依據(jù)物聯(lián)網(wǎng)環(huán)境而定,由于物聯(lián)網(wǎng)數(shù)據(jù)的復(fù)雜性和物物關(guān)聯(lián)等特性不同,這些都將導(dǎo)致物聯(lián)網(wǎng)的建模方式會(huì)和傳統(tǒng)方式有很大得差異。基于云計(jì)算的物聯(lián)網(wǎng)數(shù)據(jù)挖掘模式就是先分析物聯(lián)網(wǎng)的數(shù)據(jù)特性,然后再提出適合的解決方案跟正確的思路,再總結(jié)出合適的數(shù)學(xué)模型。物聯(lián)網(wǎng)的數(shù)據(jù)的特點(diǎn)如下:關(guān)聯(lián)性、信息量大(海量)、質(zhì)量差、時(shí)空性還有非結(jié)構(gòu)性,這和傳統(tǒng)的數(shù)據(jù)挖掘領(lǐng)域完全不同。
圖2 和時(shí)空相關(guān)的物聯(lián)網(wǎng)
物聯(lián)網(wǎng)數(shù)據(jù)的時(shí)空性,原始數(shù)據(jù)通常就是從一個(gè)四維空間中的時(shí)空網(wǎng)絡(luò)里收集出來(lái)的,其抽象示意圖如上所示,其中的每個(gè)點(diǎn)就可以代表物聯(lián)網(wǎng)中的一個(gè)個(gè)體,每一條邊就可以代表物聯(lián)網(wǎng)的物物相聯(lián)關(guān)系。
在物聯(lián)網(wǎng)的應(yīng)用中,物聯(lián)網(wǎng)的數(shù)據(jù)會(huì)發(fā)生成批成片的丟失和錯(cuò)誤,對(duì)于這種物聯(lián)網(wǎng)的數(shù)據(jù)出錯(cuò)與丟失的可能是隨機(jī)的也可能是系統(tǒng)的,基于云計(jì)算的物聯(lián)網(wǎng)數(shù)據(jù)挖掘模式應(yīng)考慮到數(shù)據(jù)的丟失和錯(cuò)誤的問(wèn)題,我們給出的解決方案應(yīng)該能夠容忍數(shù)據(jù)的錯(cuò)誤和丟失。在基于物聯(lián)網(wǎng)的數(shù)據(jù)挖掘應(yīng)用建模時(shí),我們還應(yīng)當(dāng)充分考慮如何表達(dá)物理的個(gè)體之間的關(guān)系,物理個(gè)體如果是間接的關(guān)系我們就可以通過(guò)拉普拉斯變換模型或SVD模型推導(dǎo)出來(lái)。其中直接的關(guān)系很重要,物聯(lián)網(wǎng)數(shù)據(jù)挖掘模式本身應(yīng)該有能力來(lái)充分表達(dá)出直接關(guān)系,這將會(huì)方便推理出間接關(guān)系[5]。
基于超圖的物聯(lián)網(wǎng)數(shù)據(jù)模型。超圖中一個(gè)邊可以和任意多的點(diǎn)聯(lián)結(jié),使用超邊可以來(lái)表示在物聯(lián)網(wǎng)中的錯(cuò)綜復(fù)雜的關(guān)聯(lián)關(guān)系。點(diǎn)集合X={v1,v2,v3,v4,v5,v6,v7}超邊集合E={e1,e2,e3,e4}={{v1,v2,v3},{v2,v3}。
基于馬爾可夫鏈的模型。就是在馬爾可夫鏈模型下,想要預(yù)測(cè)將來(lái)要發(fā)生的事情的幾率,只需要根據(jù)當(dāng)前的知識(shí)或信息,過(guò)去的知識(shí)或信息對(duì)于預(yù)測(cè)將來(lái)是無(wú)關(guān)的。在物聯(lián)網(wǎng)的數(shù)據(jù)應(yīng)用中很多都屬于這一類(lèi)問(wèn)題。
穩(wěn)定的可外推非參數(shù)模型。在物聯(lián)網(wǎng)數(shù)據(jù)的應(yīng)用中,物理建模需要先了解事物間的關(guān)系,再建立數(shù)學(xué)模型老描述數(shù)量上的關(guān)系,但是物聯(lián)網(wǎng)的數(shù)據(jù)丟失或出錯(cuò)、數(shù)據(jù)復(fù)雜度高的問(wèn)題,使用傳統(tǒng)的物理建模方法會(huì)有很大局限性。
四、隱馬爾科夫鏈的數(shù)據(jù)挖掘模式構(gòu)建
圖3 診斷系統(tǒng)的結(jié)構(gòu)圖
基于云計(jì)算的物聯(lián)網(wǎng)數(shù)據(jù)挖掘中,隱馬爾可夫模型(HMM)就是馬爾可夫鏈的一種,是一個(gè)雙重隨機(jī)過(guò)程,有一定狀態(tài)數(shù)的隱馬爾可夫鏈和顯示隨機(jī)函數(shù)集,它的狀態(tài)能通過(guò)觀(guān)測(cè)向量序列觀(guān)察到,其每一個(gè)觀(guān)測(cè)向量都是由一個(gè)具有相應(yīng)概率密度分布的狀態(tài)序列產(chǎn)生的。一個(gè)完整的隱馬爾可夫模型(HMM)包括先隱藏狀態(tài)集,再狀態(tài)轉(zhuǎn)移概率分布,然后觀(guān)察量集合和觀(guān)察量概率分布,最后初始狀態(tài)概率分布。
物聯(lián)網(wǎng)的數(shù)據(jù)在馬爾可夫鏈模型下,想要預(yù)測(cè)將來(lái)可以通過(guò)當(dāng)前的知識(shí)或信息來(lái)獲取。對(duì)于物聯(lián)網(wǎng)中的數(shù)據(jù)在理想的情況下,當(dāng)設(shè)備的所有動(dòng)力學(xué)特征跟測(cè)量過(guò)程中都可以建立準(zhǔn)確的模型描述,那么我們就可以根據(jù)系統(tǒng)的狀態(tài)估計(jì)和殘差信號(hào)的統(tǒng)計(jì)分析,采用各種方案實(shí)現(xiàn)故障分類(lèi)。對(duì)于大型的復(fù)雜系統(tǒng),系統(tǒng)面對(duì)的大部分分類(lèi)觀(guān)察量都會(huì)有隨機(jī)的因素,因此很難找到這樣一個(gè)可靠的系統(tǒng)模型,可以使用隱馬爾可夫鏈模型檢測(cè)。隱馬爾可夫模型是一種基于當(dāng)前信息和知識(shí)的預(yù)測(cè),它的結(jié)果對(duì)物聯(lián)網(wǎng)來(lái)說(shuō)有很重要的統(tǒng)計(jì)學(xué)意義,是一種實(shí)現(xiàn)數(shù)據(jù)挖掘的重要模式。
五、結(jié)論
物聯(lián)網(wǎng)的數(shù)據(jù)挖掘模式大大改觀(guān)了計(jì)算機(jī)中信息傳輸?shù)姆绞?,物?lián)網(wǎng)具有有改變世界的潛能。由上可知,隨著物聯(lián)網(wǎng)技術(shù)的發(fā)展,基于云計(jì)算的物聯(lián)網(wǎng)數(shù)據(jù)挖掘模式,可以解決物聯(lián)網(wǎng)在數(shù)據(jù)挖掘方面的問(wèn)題,不僅可以解決數(shù)據(jù)存儲(chǔ)中節(jié)點(diǎn)失效,還降低了數(shù)據(jù)傳輸?shù)臅r(shí)間,大大的提高了挖掘的效率,使物聯(lián)網(wǎng)系統(tǒng)能夠真正的面向商業(yè)運(yùn)用,為企業(yè)的商業(yè)決策服務(wù)。
參考文獻(xiàn):
[1]蔣智毅.基于管理學(xué)基礎(chǔ)理論的云計(jì)算應(yīng)用[J].中國(guó)管理信息化,2011(21):216-217.
[2]張海江,趙建民,朱信忠,等.基于云計(jì)算的物聯(lián)網(wǎng)數(shù)據(jù)挖掘[J].微型電腦應(yīng)用,2012(6):842-843.
[3]金龍.云計(jì)算環(huán)境中的數(shù)據(jù)挖掘存儲(chǔ)管理設(shè)計(jì)[J].軟件工程師,2012(12):183-184.
[4]李志宇.物聯(lián)網(wǎng)技術(shù)研究進(jìn)展[J].計(jì)算機(jī)測(cè)量與控制,2012(06):349-350.
[5]陳磊,王鵬,董靜宜,等.基于云計(jì)算架構(gòu)的分布式數(shù)據(jù)挖掘研究[J].成都信息工程學(xué)院學(xué)報(bào),2010(6):268-269.
作者簡(jiǎn)介:張旺軍(1981—),男,現(xiàn)供職于福建泰克通信有限公司,研究方向:移動(dòng)通信系統(tǒng)。