摘 要隨著科學(xué)技術(shù)的快速發(fā)展,各種新鮮的事物和理念得到了廣泛的應(yīng)用。其中機(jī)器學(xué)習(xí)算法就是一則典型案例——作為一種新型的算法,其廣泛應(yīng)用于各行各業(yè)之中。本篇論文旨在探討機(jī)器學(xué)習(xí)算法在數(shù)據(jù)挖掘中的具體應(yīng)用,我們利用龐大的移動終端數(shù)據(jù)網(wǎng)絡(luò),加強(qiáng)了基于GSM網(wǎng)絡(luò)的戶外終端定位,從而提出了3個(gè)階段的定位算法,有效提高了定位的精準(zhǔn)度和速度。
【關(guān)鍵詞】學(xué)習(xí)算法 GSM網(wǎng)絡(luò) 定位 數(shù)據(jù)
移動終端定位技術(shù)由來已久,其主要是利用各種科學(xué)技術(shù)手段定位移動物體的精準(zhǔn)位置以及高度。目前,移動終端定位技術(shù)主要應(yīng)用于軍事定位、緊急救援、網(wǎng)絡(luò)優(yōu)化、地圖導(dǎo)航等多個(gè)現(xiàn)代化的領(lǐng)域,由于移動終端定位技術(shù)可以提供精準(zhǔn)的位置服務(wù)信息,所以其在市場上還是有較大的需求的,這也為移動終端定位技術(shù)的優(yōu)化和發(fā)展,提供了推動力。隨著通信網(wǎng)絡(luò)普及,移動終端定位技術(shù)的發(fā)展也得到了一些幫助,使得其定位的精準(zhǔn)度和速度都得到了全面的優(yōu)化和提升。同時(shí),傳統(tǒng)的定位方法結(jié)合先進(jìn)的算法來進(jìn)行精準(zhǔn)定位,目前依舊還是有較大的進(jìn)步空間。在工作中我選取機(jī)器學(xué)習(xí)算法結(jié)合數(shù)據(jù)挖掘技術(shù)對傳統(tǒng)定位技術(shù)加以改進(jìn),取得了不錯(cuò)的效果,但也遇到了許多問題,例如:使用機(jī)器學(xué)習(xí)算法來進(jìn)行精準(zhǔn)定位暫時(shí)無法滿足更大的區(qū)域要求,還有想要利用較低的設(shè)備成本,實(shí)現(xiàn)得到更多的精準(zhǔn)定位的要求比較困難。所以本文對機(jī)器學(xué)習(xí)算法進(jìn)行了深入的研究,希望能夠幫助其更快速的定位、更精準(zhǔn)的定位,滿足市場的需要。
1 數(shù)據(jù)挖掘概述
數(shù)據(jù)挖掘又名數(shù)據(jù)探勘、信息挖掘。它是數(shù)據(jù)庫知識篩選中非常重要的一步。數(shù)據(jù)挖掘其實(shí)指的就是在大量的數(shù)據(jù)中通過算法找到有用信息的行為。一般情況下,數(shù)據(jù)挖掘都會和計(jì)算機(jī)科學(xué)緊密聯(lián)系在一起,通過統(tǒng)計(jì)集合、在線剖析、檢索篩選、機(jī)器學(xué)習(xí)、參數(shù)識別等多種方法來實(shí)現(xiàn)最初的目標(biāo)。統(tǒng)計(jì)算法和機(jī)器學(xué)習(xí)算法是數(shù)據(jù)挖掘算法里面應(yīng)用得比較廣泛的兩類。統(tǒng)計(jì)算法依賴于概率分析,然后進(jìn)行相關(guān)性判斷,由此來執(zhí)行運(yùn)算。
而機(jī)器學(xué)習(xí)算法主要依靠人工智能科技,通過大量的樣本收集、學(xué)習(xí)和訓(xùn)練,可以自動匹配運(yùn)算所需的相關(guān)參數(shù)及模式。它綜合了數(shù)學(xué)、物理學(xué)、自動化和計(jì)算機(jī)科學(xué)等多種學(xué)習(xí)理論,雖然能夠應(yīng)用的領(lǐng)域和目標(biāo)各不相同,但是這些算法都可以被獨(dú)立使用運(yùn)算,當(dāng)然也可以相互幫助,綜合應(yīng)用,可以說是一種可以“因時(shí)而變”、“因事而變”的算法。在機(jī)器學(xué)習(xí)算法的領(lǐng)域,人工神經(jīng)網(wǎng)絡(luò)是比較重要和常見的一種。因?yàn)樗膬?yōu)秀的數(shù)據(jù)處理和演練、學(xué)習(xí)的能力較強(qiáng)。
而且對于問題數(shù)據(jù)還可以進(jìn)行精準(zhǔn)的識別與處理分析,所以應(yīng)用的頻次更多。人工神經(jīng)網(wǎng)絡(luò)依賴于多種多樣的建模模型來進(jìn)行工作,由此來滿足不同的數(shù)據(jù)需求。綜合來看,人工神經(jīng)網(wǎng)絡(luò)的建模,它的精準(zhǔn)度比較高,綜合表述能力優(yōu)秀,而且在應(yīng)用的過程中,不需要依賴專家的輔助力量,雖然仍有缺陷,比如在訓(xùn)練數(shù)據(jù)的時(shí)候耗時(shí)較多,知識的理解能力還沒有達(dá)到智能化的標(biāo)準(zhǔn),但是,相對于其他方式而言,人工神經(jīng)網(wǎng)絡(luò)的優(yōu)勢依舊是比較突出的。
2 以機(jī)器學(xué)習(xí)算法為基礎(chǔ)的GSM網(wǎng)絡(luò)定位
2.1 定位問題的建模
建模的過程主要是以支持向量機(jī)定位方式作為基礎(chǔ),把定位的位置柵格化,面積較小的柵格位置就是獨(dú)立的一種類別,在定位的位置內(nèi),我們收集數(shù)目龐大的終端測量數(shù)據(jù),然后利用計(jì)算機(jī)對測量報(bào)告進(jìn)行分析處理,測量柵格的距離度量和精準(zhǔn)度,然后對移動終端柵格進(jìn)行預(yù)估判斷,最終利用機(jī)器學(xué)習(xí)進(jìn)行分析求解。
2.2 采集數(shù)據(jù)和預(yù)處理
本次研究,我們采用的模型對象是我國某一個(gè)周邊長達(dá)10千米的二線城市。在該城市區(qū)域內(nèi),我們測量了四個(gè)不同時(shí)間段內(nèi)的數(shù)據(jù),為了保證機(jī)器學(xué)習(xí)算法定位的精準(zhǔn)性和有效性,我們把其中的三批數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),最后一組數(shù)據(jù)作為定位數(shù)據(jù),然后把定位數(shù)據(jù)周邊十米內(nèi)的前三組訓(xùn)練數(shù)據(jù)的相關(guān)信息進(jìn)行清除。一旦確定某一待定位數(shù)據(jù),就要在不同的時(shí)間內(nèi)進(jìn)行測量,按照測量出的數(shù)據(jù)信息的經(jīng)緯度和平均值,再進(jìn)行換算,最終,得到真實(shí)的數(shù)據(jù)量,提升定位的速度以及有效程度。
2.3 以基站的經(jīng)緯度為基礎(chǔ)的初步定位
用機(jī)器學(xué)習(xí)算法來進(jìn)行移動終端定位,其復(fù)雜性也是比較大的,一旦區(qū)域面積增加,那么模型和分類也相應(yīng)增加,而且更加復(fù)雜,所以,利用機(jī)器學(xué)習(xí)算法來進(jìn)行移動終端定位的過程,會隨著定位區(qū)域面積的增大,而耗費(fèi)更多的時(shí)間。利用基站的經(jīng)緯度作為基礎(chǔ)來進(jìn)行早期的定位,則需要以下幾個(gè)步驟:要將邊長為十千米的正方形分割成一千米的小柵格,如果想要定位數(shù)據(jù)集內(nèi)的相關(guān)信息,就要選擇對邊長是一千米的小柵格進(jìn)行計(jì)算,而如果是想要獲得邊長一千米的大柵格,就要對邊長是一千米的柵格精心計(jì)算。
2.4 以向量機(jī)為基礎(chǔ)的二次定位
在完成初步定位工作后,要確定一個(gè)邊長為兩千米的正方形,由于第一級支持向量機(jī)定位的區(qū)域是四百米,定位輸出的是以一百米柵格作為中心點(diǎn)的經(jīng)緯度數(shù)據(jù)信息,相對于一級向量機(jī)的定位而言,二級向量機(jī)在定位計(jì)算的時(shí)候難度是較低的,更加簡便。后期的預(yù)算主要依賴決策函數(shù)計(jì)算和樣本向量機(jī)計(jì)算。隨著柵格的變小,定位的精準(zhǔn)度將越來越高,而由于增加分類的問題數(shù)量是上升的,所以,定位的復(fù)雜度也是相對增加的。
2.5 以K-近鄰法為基礎(chǔ)的三次定位
第一步要做的就是選定需要定位的區(qū)域面積,在二次輸出之后,確定其經(jīng)緯度,然后依賴經(jīng)緯度來確定邊長面積,這些都是進(jìn)行區(qū)域定位的基礎(chǔ)性工作,緊接著就是定位模型的訓(xùn)練。以K-近鄰法為基礎(chǔ)的三次定位需要的是綜合訓(xùn)練信息數(shù)據(jù),對于這些信息數(shù)據(jù),要以大小為選擇依據(jù)進(jìn)行篩選和合并,這樣就能夠減少計(jì)算的重復(fù)性。當(dāng)然了,選擇的區(qū)域面積越大,其定位的速度和精準(zhǔn)性也就越低。
3 結(jié)語
近年來,隨著我國科學(xué)技術(shù)的不斷發(fā)展和進(jìn)步,數(shù)據(jù)挖掘技術(shù)愈加重要。根據(jù)上面的研究,我們證明了,在數(shù)據(jù)挖掘的過程中,應(yīng)用機(jī)器學(xué)習(xí)算法具有舉足輕重的作用。作為一門多領(lǐng)域互相交叉的知識學(xué)科,它能夠幫助我們提升定位的精準(zhǔn)度以及定位速度,可以被廣泛的應(yīng)用于各行各業(yè)。所以,對于機(jī)器學(xué)習(xí)算法,相關(guān)人員要加以重視,不斷的進(jìn)行改良以及改善,切實(shí)的發(fā)揮其有利的方面,將其廣泛應(yīng)用于智能定位的各個(gè)領(lǐng)域,幫助我們解決關(guān)于戶外移動終端的定位的問題。
參考文獻(xiàn)
[1]陳小燕,CHENXiaoyan.機(jī)器學(xué)習(xí)算法在數(shù)據(jù)挖掘中的應(yīng)用[J].現(xiàn)代電子技術(shù),2015,v.38;No.451(20):11-14.
[2]李運(yùn).機(jī)器學(xué)習(xí)算法在數(shù)據(jù)挖掘中的應(yīng)用[D].北京郵電大學(xué),2014.
[3]莫雪峰.機(jī)器學(xué)習(xí)算法在數(shù)據(jù)挖掘中的應(yīng)用[J].科教文匯,2016(07):175-178.
作者簡介
楊金勞(1982-),女,山西省運(yùn)城市人。碩士學(xué)位?,F(xiàn)為山西運(yùn)城農(nóng)業(yè)職業(yè)技術(shù)學(xué)院講師。研究方向?yàn)閿?shù)據(jù)庫、數(shù)據(jù)挖掘、軟件開發(fā)。
作者單位
山西運(yùn)城農(nóng)業(yè)職業(yè)技術(shù)學(xué)院 山西省運(yùn)城市 044000