胡俊紅
【摘要】隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,數(shù)據(jù)庫技術(shù)的發(fā)展也隨之提高,而海量的數(shù)據(jù)系統(tǒng)使得大數(shù)據(jù)分類與處理顯得尤為重要,而現(xiàn)有的數(shù)據(jù)統(tǒng)計分類方法存在一些缺陷,準確度以及效率都達不到要求,本文簡要探討基于概率統(tǒng)計下的大數(shù)據(jù)分類方法,希望可以對讀者有一定的幫助.
【關(guān)鍵詞】概率統(tǒng)計;大數(shù)據(jù)分類方法;微分方程;二項-泊松模型
大數(shù)據(jù)分類方法目前主要應(yīng)用于故障診斷、情報檢索以及識別信息等領(lǐng)域,而基于概率統(tǒng)計下的大數(shù)據(jù)分析主要是運用泊松模型以及概率密度估計和泊松微分方程等進行分析數(shù)據(jù),通過特征值的計算,從而對大數(shù)據(jù)進行準確直接的分類,本文簡要從大數(shù)據(jù)分類泊松模型進行簡要敘述.
一、大數(shù)據(jù)分析二項-泊松模型
(一)二項-泊松模型概念及計算思路
進而通過柯西收斂性條件,求證大數(shù)據(jù)收斂性成立.
通過本文的介紹,可以看出基于概率統(tǒng)計下的大數(shù)據(jù)分類是一個較為復(fù)雜的過程,主要運用到二項-泊松模型以及各類微分方程以及行列式的計算統(tǒng)計方法,而模型的建立只是數(shù)據(jù)處理的步驟之一,概率統(tǒng)計下的大數(shù)據(jù)分類將是一件具有挑戰(zhàn)性的事情,相信在不久的未來,大數(shù)據(jù)分類將會更加便利、準確,為數(shù)據(jù)分析和人類發(fā)展做出一份貢獻.
【參考文獻】
[1]劉俊,劉瑜,何友,等.雜波環(huán)境下基于全鄰模糊聚類的聯(lián)合概率數(shù)據(jù)互聯(lián)算法[J].電子與信息學報,2016(7):1432-1438.
[2]于化龍,顧國昌,趙靖,等.基于微陣列數(shù)據(jù)的癌癥分類問題研究進展[J].計算機科學,2010(1):116-122.