• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      交互式話單數(shù)據(jù)的社會(huì)關(guān)系權(quán)值分析

      2017-11-03 08:27:29侯麗波
      關(guān)鍵詞:話單漫游通話

      侯麗波 王 冠

      (遼寧警察學(xué)院公安信息系 遼寧 大連 116036)

      交互式話單數(shù)據(jù)的社會(huì)關(guān)系權(quán)值分析

      侯麗波 王 冠

      (遼寧警察學(xué)院公安信息系 遼寧 大連 116036)

      如何通過(guò)話單數(shù)據(jù)來(lái)對(duì)目標(biāo)人員的社會(huì)關(guān)系進(jìn)行自動(dòng)合理的分析,是公安工作中面臨的重要問(wèn)題。為解決此問(wèn)題,提出一種基于神經(jīng)網(wǎng)絡(luò)模型的社會(huì)關(guān)系分析算法。通過(guò)評(píng)價(jià)參數(shù)與調(diào)整因子來(lái)計(jì)算社會(huì)關(guān)系權(quán)值。提出雙向通話頻率、雙向通話時(shí)長(zhǎng)、非正常時(shí)段通話與漫游通話4個(gè)評(píng)價(jià)參數(shù)來(lái)反應(yīng)不同的社會(huì)關(guān)系特征,并采用前饋神經(jīng)網(wǎng)絡(luò)思維來(lái)對(duì)輸出結(jié)果進(jìn)行誤差修正。實(shí)驗(yàn)結(jié)果表明,算法可以準(zhǔn)確地篩選出分析目標(biāo)在各種社會(huì)關(guān)系下的優(yōu)先聯(lián)系對(duì)象。對(duì)偵查與監(jiān)控工作有一定的實(shí)際意義。

      話單分析 社會(huì)關(guān)系 神經(jīng)網(wǎng)絡(luò) 評(píng)價(jià) 參數(shù)權(quán)值

      1 引言

      在公安偵查工作中,為了獲取重要的線索,需要對(duì)于一個(gè)目標(biāo)人員的社會(huì)關(guān)系進(jìn)行分析和監(jiān)控。所謂的社會(huì)關(guān)系,實(shí)際上就是一個(gè)人的關(guān)系網(wǎng),即由一群具有特定關(guān)系的人連接在一起的網(wǎng)絡(luò)。這個(gè)網(wǎng)絡(luò)中包含了很多的常見(jiàn)人物關(guān)系,如家人、朋友、同事等;也包含一些特殊社會(huì)關(guān)系,如情人、犯罪關(guān)系聯(lián)系人、犯罪保護(hù)傘等[1]。在社會(huì)關(guān)系網(wǎng)絡(luò)中,人物關(guān)系通常也是錯(cuò)綜復(fù)雜的,即相互間的身份并不唯一,如一個(gè)既是同事又是犯罪關(guān)系的聯(lián)系人。因此對(duì)于目標(biāo)人員社會(huì)關(guān)系的分析往往可以快速準(zhǔn)確的得到需要的監(jiān)控對(duì)象和案件偵查線索,對(duì)整個(gè)案件的偵破起到非常關(guān)鍵的作用。

      由于電話通話遍布每個(gè)人的日常生活,電信運(yùn)營(yíng)商處的通話記錄已經(jīng)成為公安工作中重要的情報(bào)數(shù)據(jù)。因此,對(duì)于目標(biāo)人員的話單進(jìn)行分析已經(jīng)成為對(duì)其社會(huì)關(guān)系分析的重要手段[2]。一條通話記錄包含通話雙方的號(hào)碼、通話時(shí)間、通話時(shí)長(zhǎng)、所在基站位置等信息,通過(guò)科學(xué)合理的數(shù)據(jù)分析,關(guān)聯(lián)出目標(biāo)人員的各種社會(huì)關(guān)系模式下的主要聯(lián)系對(duì)象,可以對(duì)于案件偵查線索的獲取和涉案人員的監(jiān)控起到至關(guān)重要的作用。

      然而,在現(xiàn)階段公安工作中,對(duì)于監(jiān)控和分析重點(diǎn)人員的相關(guān)話單數(shù)據(jù),缺乏科學(xué)合理的數(shù)據(jù)模型設(shè)計(jì)和快速自動(dòng)的數(shù)據(jù)分析算法。這就造成很多隱藏在話單數(shù)據(jù)中的有效線索并不能被快速準(zhǔn)確的發(fā)現(xiàn),并且過(guò)多的人工操作也使得偵查人員疲于應(yīng)對(duì)。依據(jù)傳統(tǒng)偵查思路的只采用通話頻率或通話時(shí)長(zhǎng)來(lái)過(guò)濾話單中重要關(guān)系人的方法,在現(xiàn)階段越來(lái)越復(fù)雜隱蔽的社會(huì)關(guān)系環(huán)境下,并不能準(zhǔn)確和全面的發(fā)掘一些隱藏的重要關(guān)系人。此外,當(dāng)目標(biāo)人員棄用原始手機(jī)號(hào)碼后,如何通過(guò)其話單分析其社會(huì)關(guān)系,快速準(zhǔn)確的對(duì)目標(biāo)人員更換號(hào)碼后優(yōu)先聯(lián)系人做出預(yù)判性監(jiān)控,也是在案件偵查中需要研究的重要方向。

      本文提出了一種采用前饋神經(jīng)網(wǎng)絡(luò)思想的基于話單的社會(huì)關(guān)系分析算法,首先對(duì)海量的話單數(shù)據(jù)進(jìn)行清洗和篩選,然后對(duì)提取到的有效數(shù)據(jù)進(jìn)行數(shù)學(xué)模型化,最后通過(guò)評(píng)價(jià)參數(shù)與不同調(diào)整因子來(lái)計(jì)算關(guān)系權(quán)值輸出。算法采用改進(jìn)的雙向通話頻率與通話時(shí)長(zhǎng)作為關(guān)系權(quán)值的評(píng)價(jià)參數(shù),并創(chuàng)新的提出非正常時(shí)段通話和漫游通話兩個(gè)評(píng)價(jià)參數(shù)。對(duì)于每個(gè)評(píng)價(jià)參數(shù)均引入調(diào)整因子,在強(qiáng)調(diào)各參數(shù)影響的公平性同時(shí)也根據(jù)不同的社會(huì)行為規(guī)律來(lái)判斷其相應(yīng)的社會(huì)關(guān)系權(quán)值。算法采用前饋神經(jīng)網(wǎng)絡(luò)思維進(jìn)行誤差修正,通過(guò)對(duì)一定時(shí)間內(nèi)目標(biāo)人員話單的歷史數(shù)據(jù)學(xué)習(xí),通過(guò)修正調(diào)整因子,給出在未來(lái)時(shí)間內(nèi)對(duì)于目標(biāo)人員將優(yōu)先聯(lián)系對(duì)象的合理預(yù)測(cè)結(jié)果,便于案件的偵查與監(jiān)控。

      2 模型設(shè)計(jì)

      通常由運(yùn)營(yíng)商處獲取的目標(biāo)人員的話單數(shù)據(jù)所包含的基本信息有機(jī)主號(hào)碼、對(duì)方號(hào)碼、呼叫類型、通話時(shí)間、通話時(shí)長(zhǎng)、通話地點(diǎn)、通話類型等字段。在這些通話數(shù)據(jù)中,合理快速的分析歸類出目標(biāo)人員的重要聯(lián)系對(duì)象,可以對(duì)案件的偵查與監(jiān)控起到很大的作用。

      通過(guò)對(duì)話單中每個(gè)聯(lián)系對(duì)象的通話次數(shù)、通話時(shí)長(zhǎng),非正常時(shí)段通話頻率以及漫游通話頻率進(jìn)行分析,可以迅速關(guān)聯(lián)出目標(biāo)人員的重要關(guān)系人與隱秘關(guān)系人,即需要監(jiān)控和偵查的重點(diǎn)人員。即使是非涉案的重要關(guān)系人,通常也可以通過(guò)詢問(wèn)得到有價(jià)值的偵查線索。對(duì)于關(guān)聯(lián)出的重要聯(lián)系人中,如果存在案發(fā)后其號(hào)碼停用,則需要重點(diǎn)關(guān)注,很可能有共同涉案。當(dāng)目標(biāo)人員棄用原號(hào)碼發(fā)生潛逃時(shí),通過(guò)對(duì)于其主要聯(lián)系人的通話記錄進(jìn)行分析比對(duì),如存在共同新增或共同消失的號(hào)碼,可以關(guān)聯(lián)出目標(biāo)人員的新號(hào)碼或不在使用但曾存在重要關(guān)系的號(hào)碼。當(dāng)多個(gè)主要聯(lián)系人都存在一個(gè)新出現(xiàn)的無(wú)法確定的共同聯(lián)系人時(shí),很可能就是需要鎖定的目標(biāo)人員。如果該號(hào)碼為外地號(hào)碼,往往可以確認(rèn)目標(biāo)人員的潛逃所在地。為了能夠從海量的話單數(shù)據(jù)中快速準(zhǔn)確的得到重要關(guān)系信息,需要引入神經(jīng)網(wǎng)絡(luò)的思想來(lái)解決這個(gè)問(wèn)題。通過(guò)神經(jīng)網(wǎng)絡(luò)模型,將目標(biāo)人員的重要關(guān)系人從海量數(shù)據(jù)中以自動(dòng)的方式篩選出來(lái),作為重點(diǎn)關(guān)注對(duì)象,可以極大減輕公安工作的負(fù)擔(dān),并發(fā)現(xiàn)潛在的偵查線索[3]。

      神經(jīng)網(wǎng)絡(luò)是通過(guò)模擬人腦的思維方式,將復(fù)雜的篩選分類問(wèn)題提供一個(gè)相對(duì)簡(jiǎn)單的解決方法。通過(guò)輸入的樣本,按照一定的學(xué)習(xí)算法調(diào)整各層的權(quán)值,當(dāng)收斂到一定值時(shí),即可以對(duì)于真實(shí)的數(shù)據(jù)進(jìn)行分類。BP(Back Propagation)網(wǎng)絡(luò)是一種按誤差反向傳播訓(xùn)練的多層前饋網(wǎng)絡(luò),是目前應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)模型之一。其原理即為通過(guò)反向傳播來(lái)不斷調(diào)整權(quán)值,使誤差最小。如果輸出層得不到理想的結(jié)果,向前一層反饋輸出誤差,依據(jù)預(yù)測(cè)的誤差修正隱含層的調(diào)整因子來(lái)改變權(quán)值,不斷接近期望的結(jié)果。前饋神經(jīng)網(wǎng)絡(luò)模型包括輸入層(Input)、隱藏層(Hide Layer)和輸出層(Output Layer)[4]。圖1即為參考BP神經(jīng)網(wǎng)絡(luò)思想設(shè)計(jì)的用于解決基于話單的社會(huì)關(guān)系分析的算法模型。

      圖1 基于話單的社會(huì)關(guān)系分析算法模型

      其中在輸入層負(fù)責(zé)對(duì)話單數(shù)據(jù)的各個(gè)字段進(jìn)行提取和輸入。機(jī)主號(hào)碼即為分析主體——目標(biāo)人員的號(hào)碼,對(duì)方號(hào)碼即為分析對(duì)象——聯(lián)系人的號(hào)碼,呼叫類型即為主叫或被叫,通話時(shí)間為發(fā)生通話的開(kāi)始時(shí)間,通話時(shí)長(zhǎng)為發(fā)生通話的時(shí)間長(zhǎng)度,通話地點(diǎn)為發(fā)生通話的所在地點(diǎn)(城市),通話類型分為本地通話、國(guó)內(nèi)長(zhǎng)途、漫游通話等。隱藏層中為本文算法用于社會(huì)關(guān)系權(quán)值計(jì)算的4個(gè)評(píng)價(jià)參數(shù)。在輸出層,可以給出本文算法輸出的4種社會(huì)關(guān)系的分類結(jié)果,即重要關(guān)系、工作關(guān)系、私密關(guān)系和漫游關(guān)系。重要關(guān)系是指同目標(biāo)人員在綜合判斷下有著高頻率交互的聯(lián)系人,工作關(guān)系是指工作時(shí)間聯(lián)系比較重但私下時(shí)間聯(lián)系較少的聯(lián)系人,私密關(guān)系是指在非正常工作時(shí)間具有高頻率交互的聯(lián)系人,漫游關(guān)系為在外地漫游通話時(shí)保持高頻率交互的聯(lián)系人。上述4類的輸出結(jié)果可以直觀地分析出目標(biāo)人員不同社會(huì)關(guān)系的優(yōu)先聯(lián)系對(duì)象。

      神經(jīng)網(wǎng)絡(luò)應(yīng)用于社會(huì)關(guān)系分析的研究,目前主要集中于社交網(wǎng)絡(luò)的結(jié)構(gòu)分析[5,6]以及社交網(wǎng)絡(luò)中安全關(guān)系方面[7]。在犯罪偵查與話單分析的結(jié)合方面,主要研究集中于針對(duì)犯罪網(wǎng)絡(luò)的分析[8],以及用戶通話行為對(duì)人物關(guān)系的分析[9,10]。結(jié)合上述文獻(xiàn)的研究現(xiàn)狀,本文將神經(jīng)網(wǎng)絡(luò)模型引入到話單分析中,針對(duì)公安工作中對(duì)目標(biāo)人員社會(huì)關(guān)系分析這一實(shí)際需求,提出一種神經(jīng)網(wǎng)絡(luò)模型的社會(huì)關(guān)系分析算法,用于對(duì)犯罪偵查目標(biāo)人員的話單數(shù)據(jù)整理和分析。算法通過(guò)話單數(shù)據(jù)的清洗和整理,將社會(huì)關(guān)系抽象為數(shù)據(jù)模型,并通過(guò)評(píng)價(jià)參數(shù)的運(yùn)算和調(diào)整因子的取值以得出理想的社會(huì)關(guān)系優(yōu)先權(quán)值輸出結(jié)果,最終將各分類結(jié)果以表單與圖像兩種可視化的形式輸出。

      3 數(shù)據(jù)準(zhǔn)備

      數(shù)據(jù)準(zhǔn)備階段是整個(gè)算法的基礎(chǔ),需要將獲取的話單數(shù)據(jù)進(jìn)行提取和轉(zhuǎn)換,便于接下來(lái)的參數(shù)計(jì)算和算法分析。數(shù)據(jù)準(zhǔn)備階段包括數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)集成和數(shù)據(jù)轉(zhuǎn)換4個(gè)工作部分。

      (1)數(shù)據(jù)采集,是對(duì)于分析的主體,即目標(biāo)人員的通話清單進(jìn)行采集。由于本文算法分析聯(lián)系人與目標(biāo)人員之間關(guān)系時(shí)采用雙向影響的評(píng)價(jià)參數(shù),所以需要在算法開(kāi)始時(shí)通過(guò)單向參數(shù)的結(jié)果篩選,確定出目標(biāo)人員主要聯(lián)系人的通話清單,一并進(jìn)行數(shù)據(jù)采集。

      (2)數(shù)據(jù)清洗,是指在對(duì)于目標(biāo)人員的通話清單進(jìn)行過(guò)濾,清除通話清單中與分析目標(biāo)明顯無(wú)關(guān)的通話數(shù)據(jù),如廣告電話、垃圾電話等。這一部分需要通過(guò)算法本身建立號(hào)碼篩選數(shù)據(jù)庫(kù),過(guò)濾所有已知的廣告電話、垃圾電話、公共服務(wù)電話以及一些無(wú)關(guān)的干擾數(shù)據(jù)等。

      (3)數(shù)據(jù)集成,是將清洗后有效的多個(gè)話單的相關(guān)數(shù)據(jù)按照統(tǒng)一的數(shù)據(jù)結(jié)構(gòu)組合在一起。由于獲取的話單數(shù)據(jù)通常存于多個(gè)不同的來(lái)源文件,通常文件的格式與數(shù)據(jù)的結(jié)構(gòu)均不統(tǒng)一,因此需要將所有清洗后的數(shù)據(jù)進(jìn)行整合,使其成為統(tǒng)一的按照時(shí)間順序進(jìn)行排序的話單數(shù)據(jù)。在數(shù)據(jù)集成過(guò)程中也會(huì)將每個(gè)關(guān)系人的通話數(shù)據(jù)進(jìn)行分類統(tǒng)計(jì),便于接下來(lái)的數(shù)據(jù)轉(zhuǎn)換。

      (4)數(shù)據(jù)轉(zhuǎn)換,就是對(duì)話單的各項(xiàng)數(shù)據(jù)進(jìn)行數(shù)學(xué)模式化轉(zhuǎn)換,提取算法所需的各種數(shù)據(jù)以便于參數(shù)的計(jì)算和算法的調(diào)用。本文算法主要的涉及轉(zhuǎn)換的數(shù)據(jù)有:①機(jī)主號(hào)碼,即目標(biāo)人員,在算法中虛擬為節(jié)點(diǎn)V0。②對(duì)方號(hào)碼,每一個(gè)目標(biāo)人員社會(huì)關(guān)系的分析對(duì)象,即與V0產(chǎn)生通信的節(jié)點(diǎn)Vi,其中i∈[1,p],p為所有篩選出的與V0發(fā)生交互關(guān)系的節(jié)點(diǎn)個(gè)數(shù)。具體的節(jié)點(diǎn)社會(huì)關(guān)系如圖2所示。③通話時(shí)間,取每個(gè)通話發(fā)生的所在的整點(diǎn)小時(shí)。④通話時(shí)長(zhǎng),將每次通話的時(shí)間長(zhǎng)度轉(zhuǎn)換為秒數(shù)。⑤通話地點(diǎn),分為本地和所有漫游通話所在的外地城市的信息,均單獨(dú)記錄。⑥通話類型,記為本地通話和漫游通話。

      此外,在數(shù)據(jù)轉(zhuǎn)換階段,應(yīng)該統(tǒng)計(jì)V0和每個(gè)Vi發(fā)生通話的次數(shù),通話時(shí)間的整點(diǎn),通話時(shí)長(zhǎng),具體以每天為單位進(jìn)行計(jì)數(shù)。對(duì)于通話次數(shù)還應(yīng)記錄每個(gè)整點(diǎn)小時(shí)的次數(shù)和每個(gè)不同漫游城市的次數(shù)。對(duì)于每一個(gè)分析對(duì)象Vi,也需要記錄上述數(shù)據(jù),便于算法的雙向關(guān)聯(lián)。

      圖2 基于話單分析的社會(huì)關(guān)系圖例

      4 評(píng)價(jià)參數(shù)

      本文算法在評(píng)價(jià)參數(shù)上分為單向影響參數(shù)與雙向影響參數(shù)兩種。單向影響參數(shù)是指分析目標(biāo)人員與聯(lián)系人之間的通話對(duì)于目標(biāo)人員自身通話的權(quán)重。雙向影響參數(shù)是指在考慮目標(biāo)人員自身權(quán)重的基礎(chǔ)上,同時(shí)考慮對(duì)方聯(lián)系人自身的通話權(quán)重。如一個(gè)很少與外界發(fā)生通話的聯(lián)系人號(hào)碼,即使與目標(biāo)人員只產(chǎn)生很少的通話次數(shù),但占聯(lián)系人其自身通話比重很大的情況。此種認(rèn)為是隱藏的重要關(guān)系人,通過(guò)雙向影響參數(shù)會(huì)做出更合理的篩選。

      由于通常每個(gè)目標(biāo)人員獲取的話單中聯(lián)系人數(shù)繁多,如果對(duì)所有的聯(lián)系人都進(jìn)行話單的調(diào)用和分析,會(huì)造成工作量過(guò)大,實(shí)際上操作并不現(xiàn)實(shí)。而且,對(duì)于大多數(shù)發(fā)生極少通話的聯(lián)系人,其本身對(duì)目標(biāo)人員主要的社會(huì)關(guān)系分析也并不起到太大作用。因此本文算法首先通過(guò)單向影響的通話頻率和通話時(shí)長(zhǎng)以及非正常時(shí)段和漫游通話四項(xiàng)參數(shù)中,任意一項(xiàng)比例達(dá)到5%的聯(lián)系人。將滿足條件的這些聯(lián)系人篩選出來(lái),做進(jìn)一步的雙向影響評(píng)價(jià)參數(shù)分析。具體每個(gè)評(píng)價(jià)參數(shù)的數(shù)學(xué)表達(dá)方法介紹如下:

      4.1 通話頻率評(píng)價(jià)參數(shù)(Frequency)

      通話頻率參數(shù)是話單分析中常見(jiàn)的評(píng)價(jià)參數(shù),用于確定目標(biāo)人員與聯(lián)系人之間在一段時(shí)間內(nèi)的通話次數(shù)占其所有通話次數(shù)的比例。該參數(shù)可以直觀反映出兩者間的通話聯(lián)系頻率,即社會(huì)關(guān)系的緊密度。本文算法對(duì)于通話頻率評(píng)價(jià)參數(shù)采用如下數(shù)學(xué)表達(dá):

      假定獲取話單數(shù)據(jù)的時(shí)間天數(shù)為n,設(shè)Ck(V0,Vi)表示在第k天時(shí)V0與Vi的通話次數(shù),(k∈n)。則可得V0與Vi平均每天的通話次數(shù)如公式(1)所示:

      設(shè)Ck(V0)為第k天V0自身的通話次數(shù),則平均每天V0的通話次數(shù)為公式(2)所示:

      由于算法需要篩選出單向影響評(píng)價(jià)參數(shù)比例大于等于5%的聯(lián)系人進(jìn)行雙向影響評(píng)價(jià)參數(shù)分析,所以先給出單向影響通話頻率參數(shù)如公式(3)所示:

      由公式(3)得到權(quán)值大于或等于0.05的Vi將作為篩選出來(lái)的重要聯(lián)系人,進(jìn)行雙向影響分析,需調(diào)用滿足此條件的Vi話單數(shù)據(jù),并由公式(4)進(jìn)行計(jì)算Vi平均每天的通話次數(shù)。其中Ck(Vi)為第k天Vi自身的通話次數(shù)。

      最終得出雙向影響的通話頻率參數(shù)公式為:

      由公式(5)可以看出,對(duì)于V0與Vi之間的通話頻率參數(shù),由V0與Vi通話次數(shù)所占V0自身的比例,加上其與V0與Vi通話次數(shù)占Vi自身通話比例的乘積得到。這樣可以更好的去考慮Vi自身通話的頻率對(duì)于V0的影響。如果Vi與V0通話次數(shù)占V0自身比例很少,但是所占Vi自身比例很高的情況下,可以更好的放大這一參數(shù)計(jì)算權(quán)值的影響。即一個(gè)與外界聯(lián)系很少的號(hào)碼,即便與目標(biāo)人員通話次數(shù)不多,但由于大部分通話都是同目標(biāo)人員產(chǎn)生,則該號(hào)碼更加可疑。反之,如果聯(lián)系對(duì)象Vi本身是一個(gè)和很多人都產(chǎn)生高通話頻率的情況,則通過(guò)公式(5)可以削弱其對(duì)V0社會(huì)關(guān)系權(quán)值的影響。這也保證算法得到的社會(huì)關(guān)系分析結(jié)果更加合理。

      4.2 通話時(shí)長(zhǎng)評(píng)價(jià)參數(shù)(Duration)

      通話時(shí)長(zhǎng)也是一個(gè)常見(jiàn)的用于話單分析社會(huì)關(guān)系的評(píng)價(jià)參數(shù),通過(guò)通話時(shí)間的長(zhǎng)短可以直觀的看出雙方的親密程度,即通常發(fā)生較長(zhǎng)時(shí)間的通話是較為親密或重要的通話。設(shè)Tk(V0,Vi)為第k天V0與Vi的通話時(shí)長(zhǎng),同樣(k∈n)。則可得V0和Vi平均每天的通話時(shí)長(zhǎng)T(V0,Vi)如式(6)所示:

      設(shè)Tk(V0)為V0第k天通話總時(shí)長(zhǎng),則由公式(7)可得V0平均每天通話時(shí)長(zhǎng)T(V0)為:

      單向影響的通話時(shí)長(zhǎng)參數(shù)如公式(8)所示:

      即V0與Vi每天通話時(shí)長(zhǎng)占V0每天通話時(shí)長(zhǎng)的比例,滿足單向通話時(shí)長(zhǎng)的權(quán)值大于等于0.05的Vi將作為篩選出的聯(lián)系人,調(diào)取其話單進(jìn)行雙向分析。由公式(9)計(jì)算Vi平均每天的通話時(shí)長(zhǎng)。其中Tk(Vi)為第k天Vi通話的總時(shí)長(zhǎng)。

      得到雙向影響的通話時(shí)長(zhǎng)的評(píng)價(jià)參數(shù)公式(10)如下:

      同雙向影響通話頻率參數(shù)一樣,雙向影響的通話時(shí)長(zhǎng)參數(shù),是由V0與Vi通話時(shí)長(zhǎng)所占V0自身的比例加上該比例與V0與Vi通話時(shí)長(zhǎng)占Vi自身通話時(shí)長(zhǎng)的比例的乘積得到的。采用公式(10)可以更好的考慮Vi自身通話時(shí)長(zhǎng)的比例對(duì)于V0的影響。即如果Vi跟所有人的通話時(shí)間都很長(zhǎng),則會(huì)削弱其對(duì)V0的社會(huì)關(guān)系優(yōu)先權(quán)值。反之,如Vi雖然通話時(shí)長(zhǎng)占V0的比例不高,但對(duì)Vi自身比例很高的情況,通過(guò)公式(10)可以將Vi對(duì)權(quán)值的影響放大。

      4.3 非正常時(shí)段通話評(píng)價(jià)參數(shù)(Non-normal)

      所謂的非正常時(shí)段通話,是指目標(biāo)人員在每日通話頻率相對(duì)很少的時(shí)間段內(nèi)發(fā)生的通話。將非正常通話時(shí)段內(nèi)發(fā)生通話的聯(lián)系人的通話頻率作為評(píng)價(jià)參數(shù),可以更好的發(fā)現(xiàn)目標(biāo)聯(lián)系人的一些私密關(guān)系人。通常將非正常時(shí)段的默認(rèn)設(shè)定都是在半夜至清晨,但本文算法將其改進(jìn)為以V0實(shí)際情況為準(zhǔn),選擇通話頻率相對(duì)較小的時(shí)段,可以更好的符合V0的通話習(xí)慣,避免由于目標(biāo)人員是夜晚活動(dòng)頻繁型這一情況造成非正常時(shí)間段的選擇失誤。首先給出選擇非正常時(shí)段的數(shù)學(xué)方法:

      設(shè)S={S1,S2,……,Sq}為對(duì)V0話單中統(tǒng)計(jì)出的所有的共q個(gè)非零次通話的時(shí)間段集合,每個(gè)時(shí)間段為整點(diǎn)1小時(shí),可知q<=24。設(shè)Sk(V0)為獲取的共計(jì)n天內(nèi)的V0話單數(shù)據(jù)中,在第k個(gè)非零通話時(shí)段內(nèi)V0的通話次數(shù),其中k∈q。則,可得V0平均每個(gè)非零次通話時(shí)段內(nèi)的通話次數(shù)S(V0)如公式(11):

      對(duì)于每個(gè)Sk(V0)來(lái)說(shuō),若滿足Sk(V0)<=1/3 *S(V0),則取該k時(shí)段為非正常通話時(shí)段,k∈q。即將通話次數(shù)不超過(guò)三分之一均值的時(shí)段認(rèn)為是非正常通話時(shí)段。由上述條件可以得到V0的所有非正常通話時(shí)段的集合FS={FS1,FS2,……,FSf},其中f為非正常通話時(shí)段個(gè)數(shù),f<q。

      設(shè)CFk(V0,Vi)為第k天內(nèi)V0與Vi在非正常時(shí)段通話的次數(shù),該值由第k天FS集合的各時(shí)段V0與Vi通話次數(shù)相加得到。則可得V0與Vi平均每天的非正常時(shí)段通話次數(shù)為:

      又設(shè)CFk(V0)為V0在第k天非正常時(shí)段內(nèi)所有通話次數(shù),則求得V0平均每天的非正常時(shí)段通話的次數(shù)為:

      最終得到非正常時(shí)段通話評(píng)價(jià)參數(shù),即V0與Vi在非正常時(shí)段內(nèi)通話與V0的比值,如公式(14):

      在非正常時(shí)段發(fā)生通話的聯(lián)系人,會(huì)對(duì)其與V0社會(huì)關(guān)系權(quán)值產(chǎn)生額外的加成,如一個(gè)聯(lián)系人沒(méi)有非正常時(shí)段的通話則不需要此額外加成,即判斷其同目標(biāo)聯(lián)系人不存在所謂的私密關(guān)系。同樣的,所有滿足非正常時(shí)段通話評(píng)價(jià)參數(shù)的權(quán)值大于等于0.05的Vi,將被篩選出來(lái)進(jìn)行雙向影響的通話頻率與通話時(shí)長(zhǎng)的評(píng)價(jià)參數(shù)運(yùn)算。

      4.4 漫游通話評(píng)價(jià)參數(shù)(Roaming)

      漫游通話評(píng)價(jià)參數(shù)即為目標(biāo)人員在外地漫游時(shí)與聯(lián)系人進(jìn)行通話頻率比的評(píng)價(jià)參數(shù),漫游高頻率的聯(lián)系人通常也是重要的關(guān)系對(duì)象,可以確定V0在異地的社會(huì)關(guān)系。便于分析當(dāng)目標(biāo)人員若發(fā)生在逃時(shí)的優(yōu)先聯(lián)系對(duì)象,以及一些隱蔽的私密聯(lián)系的關(guān)系人。設(shè)Y={Y1,Y2,……,Yj}為V0所有發(fā)生漫游通話城市的集合,其中j為所有發(fā)生漫游通話的外地城市個(gè)數(shù),又設(shè)m為V0與Vi產(chǎn)生漫游通話的外地城市個(gè)數(shù),可知m<=j。

      設(shè)CYk(V0,Vi)表示V0與Vi在第k個(gè)外地城市產(chǎn)生的漫游通話次數(shù),k∈m。則V0與Vi發(fā)生的漫游通話總次數(shù)為:

      又假設(shè)CYk(V0)表示V0在第k個(gè)外地城市共計(jì)發(fā)生的漫游通話次數(shù),k∈j。則V0在所有外地城市的漫游通話總次數(shù)為:

      由此得出V0與Vi漫游通話評(píng)價(jià)參數(shù),如公式(17)所示:

      即V0與Vi間的漫游通話所占V0所有漫游通話的比值,并乘以平衡調(diào)整參數(shù)m/j(即V0與Vi發(fā)生漫游通話的城市個(gè)數(shù)比上V0所有漫游城市個(gè)數(shù))。由于在所有漫游城市都產(chǎn)生通話的對(duì)象,其重要性一定高于在單一漫游城市發(fā)生通話的聯(lián)系人。因此,引入m/j這一平衡參數(shù)可以保證漫游通話評(píng)價(jià)參數(shù)的權(quán)值更合理。同樣,對(duì)于滿足該評(píng)價(jià)參數(shù)的權(quán)值大于等于0.05的Vi也將被篩選出來(lái)進(jìn)行雙向影響的通話頻率與通話時(shí)長(zhǎng)的評(píng)價(jià)參數(shù)運(yùn)算。

      5 本文算法

      對(duì)于分析對(duì)象V0的話單數(shù)據(jù),首先對(duì)所有的通話對(duì)象Vi計(jì)算由公式(3)單向影響通話頻率的權(quán)值,由公式(8)單向通話時(shí)長(zhǎng)的權(quán)值,由公式(14)非正常時(shí)段通話權(quán)值以及由公式(17)漫游通話權(quán)值。然后對(duì)所有滿足條件為至少一項(xiàng)權(quán)值大于等于0.05的Vi,根據(jù)如下公式(18)計(jì)算最終的V0與Vi之間的社會(huì)關(guān)系權(quán)值W(V0,Vi):

      在上述的權(quán)值計(jì)算公式(18)中,引入調(diào)整因子的概念作為輸出關(guān)系權(quán)值的修正,以便于更合理的調(diào)整輸出結(jié)果。其中α為通話頻率評(píng)價(jià)參數(shù)的調(diào)整因子,β為通話時(shí)長(zhǎng)的評(píng)價(jià)參數(shù)調(diào)整因子,γ為非正常時(shí)段通話評(píng)價(jià)參數(shù)的調(diào)整因子,θ為漫游通話評(píng)價(jià)參數(shù)的調(diào)整因子。4個(gè)調(diào)整因子初始值均默認(rèn)為1,可以通過(guò)前饋神經(jīng)網(wǎng)絡(luò)中誤差反饋的思想來(lái)對(duì)調(diào)整因子的取值做輸入調(diào)整。調(diào)整因子取值范圍設(shè)定在[0,2]之間,若某項(xiàng)調(diào)整因子取0即為忽略該項(xiàng)對(duì)應(yīng)的評(píng)價(jià)參數(shù)對(duì)社會(huì)關(guān)系權(quán)值的影響,亦可增大或減小調(diào)整因子的取值來(lái)放大或削弱某項(xiàng)評(píng)價(jià)參數(shù)的影響。

      本文算法給出4種輸出結(jié)果的社會(huì)關(guān)系權(quán)值的概念。重要關(guān)系為分析目標(biāo)人員產(chǎn)生高關(guān)系權(quán)值的聯(lián)系人,是一種基本的社會(huì)關(guān)系分析方式。在此模式下的輸出,將四項(xiàng)調(diào)整因子都默認(rèn)為1,即通話頻率,通話時(shí)長(zhǎng),非正常時(shí)段通話和漫游通話4項(xiàng)評(píng)價(jià)參數(shù)公平的疊加到一起,來(lái)進(jìn)行判斷關(guān)系權(quán)值。工作關(guān)系為分析與目標(biāo)人員發(fā)生通話的時(shí)間段為常規(guī)時(shí)段的通話頻率較高的聯(lián)系人。此輸出權(quán)值的公式將減小非正常時(shí)段的調(diào)整因子γ,因?yàn)楸旧砉ぷ麝P(guān)系的聯(lián)系人通常并不會(huì)在非正常時(shí)段與目標(biāo)人員產(chǎn)生通話。削弱非正常時(shí)段通話的影響會(huì)更加明顯的突出工作關(guān)系。私密關(guān)系是分析在非正常時(shí)段以及在漫游時(shí)發(fā)生較多通話的聯(lián)系人。在此模式下的權(quán)值公式,應(yīng)該放大非正常時(shí)段調(diào)整因子γ和漫游通話調(diào)整因子θ,使輸出結(jié)果更符合私密關(guān)系的情形。漫游關(guān)系為分析目標(biāo)人員在外地時(shí)發(fā)生較高聯(lián)系的對(duì)象,在此模式下,權(quán)值輸出公式中會(huì)放大漫游通話調(diào)整因子θ使漫游通話的影響更明顯。本文算法采用開(kāi)放式的調(diào)整因子輸入方式,并不局限于上述4種輸出模式,可以根據(jù)用戶的需要來(lái)自主進(jìn)行調(diào)整因子的修正,以便輸出合理的社會(huì)關(guān)系權(quán)值。

      對(duì)于分析目標(biāo)在n天內(nèi)的話單數(shù)據(jù),若含有符合篩選條件的p個(gè)聯(lián)系人,則本文算法的復(fù)雜度為O(p2,n),具體分析如下:當(dāng)計(jì)算單向影響通話頻率、單向影響通話時(shí)長(zhǎng)、非正常時(shí)段通話和漫游通話這四個(gè)參數(shù)權(quán)值時(shí),均需要對(duì)p個(gè)聯(lián)系人進(jìn)行n天的通話數(shù)據(jù)計(jì)算,因此復(fù)雜度為O(p,n)。針對(duì)雙向影響參數(shù)通話頻率與通話時(shí)長(zhǎng)參數(shù)的計(jì)算,由于要反向考慮每個(gè)聯(lián)系人自身的通話數(shù)據(jù),因此其算法復(fù)雜度O(p2,n)。綜上,整個(gè)算法的復(fù)雜度為O(p2*n +p2*n + p*n + p*n),即為O(p2,n)。

      6 實(shí)驗(yàn)評(píng)估

      通過(guò)獲取目標(biāo)人員90天內(nèi)的一組交互話單數(shù)據(jù)來(lái)進(jìn)行算法的社會(huì)關(guān)系分析實(shí)驗(yàn)評(píng)估。根據(jù)改變調(diào)整因子來(lái)給出4種模式的關(guān)系權(quán)值。即輸出重要關(guān)系權(quán)值、工作關(guān)系權(quán)值、私密關(guān)系權(quán)值和漫游關(guān)系權(quán)值等4組實(shí)驗(yàn)結(jié)果。首選通過(guò)由上文介紹的對(duì)話單數(shù)據(jù)的整理,并滿足4項(xiàng)結(jié)果有一項(xiàng)大于等于0.05這一條件,共篩選出與V0產(chǎn)生聯(lián)系的23個(gè)分析對(duì)象,將其編號(hào)為V1,V2,…V22,V23。各種社會(huì)關(guān)系下輸出的具體實(shí)驗(yàn)結(jié)果如下:

      6.1 重要關(guān)系

      在重要關(guān)系權(quán)值輸出時(shí),對(duì)于4個(gè)調(diào)整因子均取1,以求得最為平衡的關(guān)系權(quán)值。由23個(gè)分析對(duì)象的輸出權(quán)值降序排列,由實(shí)驗(yàn)結(jié)果可知對(duì)于V0的重要關(guān)系人輸出優(yōu)先的前5位對(duì)象為:V3,V19,V11,V2,V8。

      6.2 工作關(guān)系

      在工作關(guān)系的權(quán)值輸出中,由于要忽略在非常時(shí)段通話的影響,強(qiáng)調(diào)通話頻率與通話時(shí)長(zhǎng)的影響,因此將α與β取值2,γ取值0.2,θ仍取1。得到工作關(guān)系權(quán)值的降序排列,由結(jié)果可知對(duì)于V0的工作關(guān)系人輸出優(yōu)先的前5位對(duì)象為:V3,V8,V11,V19,V15。通過(guò)結(jié)果可以推斷出V8對(duì)于V0的社會(huì)關(guān)系更偏于工作關(guān)系,因?yàn)槠湓谥匾P(guān)系權(quán)值優(yōu)先級(jí)中排第五位,但在工作關(guān)系優(yōu)先級(jí)中排第2位。

      6.3 私密關(guān)系

      在私密關(guān)系的權(quán)值輸出中,強(qiáng)調(diào)非正常時(shí)段通話的影響,因此將α與β取值調(diào)為0.5,γ取值增加到2,θ仍然取1。得到私密關(guān)系權(quán)值的降序排列,由結(jié)果可以知對(duì)于V0的私密關(guān)系人輸出優(yōu)先的前5位對(duì)象為:V2,V3,V19,V11,V21??梢钥闯?,V2對(duì)于V0的社會(huì)關(guān)系更具偏于私密關(guān)系,因?yàn)槠湓谥匾P(guān)系權(quán)值優(yōu)先級(jí)中僅排第4位,但在私密關(guān)系排第1位。

      6.4 漫游關(guān)系

      漫游關(guān)系的權(quán)值輸出主要是強(qiáng)調(diào)漫游通話的影響,因此將α、β與γ取值均調(diào)整為0.5,θ的取值放大為2。得到漫游關(guān)系權(quán)值的優(yōu)先級(jí)降序排列,由結(jié)果可以知對(duì)于V0的重要關(guān)系人輸出優(yōu)先的前5位對(duì)象為:V2,V14,V19,V3,V21??梢钥闯觯琕14對(duì)于V0的社會(huì)關(guān)系更具偏于漫游關(guān)系,因?yàn)槠湓谥匾P(guān)系權(quán)值輸出中只排在第7位,但在漫游關(guān)系排第2位。

      6.5 實(shí)驗(yàn)分析

      從上述4組的實(shí)驗(yàn)結(jié)果可以看出,本文算法可以通過(guò)靈活的調(diào)整因子取值,得到各種關(guān)系下較合理的的輸出結(jié)果。實(shí)驗(yàn)通過(guò)一組真實(shí)的話單數(shù)據(jù)進(jìn)行分析后,準(zhǔn)確的篩選出各種社會(huì)關(guān)系下目標(biāo)人員優(yōu)先的聯(lián)系對(duì)象。

      針對(duì)評(píng)價(jià)參數(shù)調(diào)整因子的取值進(jìn)行進(jìn)一步分析可以得出如下結(jié)論:

      (1)對(duì)于通話頻率評(píng)價(jià)參數(shù)調(diào)整因子α的取值越大,越可以加重通話聯(lián)系頻率對(duì)于關(guān)系權(quán)值的影響,反之則會(huì)削弱通話頻率的影響,可以比較容易過(guò)濾掉類似于廣告或騷擾電話等無(wú)意義聯(lián)系人。

      (2)對(duì)于通話時(shí)長(zhǎng)評(píng)價(jià)參數(shù)調(diào)整因子β的取值越大,越可加重通話時(shí)長(zhǎng)對(duì)于關(guān)系權(quán)值的影響。這個(gè)參數(shù)的放大,可以更好的突顯出重要的聯(lián)系人。也符合現(xiàn)實(shí)的社會(huì)關(guān)系映射,聊天時(shí)間越長(zhǎng)的人越重要。

      (3)針對(duì)非正常時(shí)段通話評(píng)價(jià)參數(shù)調(diào)整因子γ,放大該參數(shù)可以迅速抓到分析目標(biāo)的私密關(guān)系,而且可以很好的屏蔽掉工作關(guān)系人。反之,削弱該參數(shù)會(huì)更好的凸顯出正常工作關(guān)系的聯(lián)系人。因此該參數(shù)的調(diào)整顯得尤為重要。

      (4)對(duì)于漫游通話評(píng)價(jià)參數(shù)的調(diào)整因子θ,主要是針對(duì)追逃分析中,對(duì)于目標(biāo)在異地聯(lián)系人的篩選,該參數(shù)的放大可以更好的抓到異地漫游下的重要聯(lián)系對(duì)象。并且,該參數(shù)對(duì)于私密關(guān)系的影響也較大,放大該參數(shù)可以幫助進(jìn)一步確定私密關(guān)系對(duì)象。這也是符合現(xiàn)實(shí)社會(huì)關(guān)系的映射,通常漫游狀態(tài)下會(huì)更頻繁聯(lián)系私密對(duì)象。

      綜上所述,本文算法的優(yōu)勢(shì)主要在于對(duì)于各評(píng)價(jià)參數(shù)精準(zhǔn)的數(shù)學(xué)設(shè)計(jì),以及對(duì)于算法最終的關(guān)系權(quán)值輸出公式中各參賽調(diào)整因子的合理修正以滿足各種社會(huì)關(guān)系人的準(zhǔn)確篩選。

      7 結(jié)束語(yǔ)

      本文針對(duì)話單社會(huì)關(guān)系分析這一公安應(yīng)用問(wèn)題,分析解決這一問(wèn)題的所需方法和算法的模型設(shè)計(jì),并且提出了雙向通話頻率、雙向通話時(shí)長(zhǎng)、非正常時(shí)段通話與漫游通話4個(gè)評(píng)價(jià)參數(shù)用于最終輸出的社會(huì)關(guān)系權(quán)值的計(jì)算。算法根據(jù)前饋神經(jīng)網(wǎng)絡(luò)中誤差反饋的思想來(lái)調(diào)整各評(píng)價(jià)參數(shù)的調(diào)整因子的取值。實(shí)驗(yàn)證明,算法可以得到各種關(guān)系下較合理的輸出結(jié)果,準(zhǔn)確的篩選出各種社會(huì)關(guān)系下分析目標(biāo)的優(yōu)先聯(lián)系對(duì)象。在后續(xù)的研究工作中,將對(duì)算法進(jìn)行改進(jìn),可根據(jù)多組話單數(shù)據(jù)進(jìn)行機(jī)器學(xué)習(xí)。進(jìn)一步深入研究神經(jīng)網(wǎng)絡(luò)模型的設(shè)計(jì)與調(diào)整因子的設(shè)定,使輸出結(jié)果更為合理。也將對(duì)各社會(huì)關(guān)系評(píng)價(jià)參數(shù)的數(shù)學(xué)模型進(jìn)一步的改進(jìn),使之更為合理和準(zhǔn)確的反應(yīng)社會(huì)關(guān)系的特征。

      [1]王鋼,劉猜.犯罪團(tuán)伙網(wǎng)絡(luò)關(guān)系模型及分析方法[J]. 中國(guó)人民公安大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2015(3):61-71.

      [2]劉為軍,張紹武.移動(dòng)互聯(lián)網(wǎng)犯罪偵查對(duì)策探析[J]. 中國(guó)人民公安大學(xué)學(xué)報(bào)(自然科學(xué)版),2016(3):47-51.

      [3]李建洋,倪志偉,劉慧婷.多層前饋神經(jīng)網(wǎng)絡(luò)在基于案例推理的應(yīng)用[J].計(jì)算機(jī)應(yīng)用,2005(11):2650-2652.

      [4]SIMON HAYKIN.神經(jīng)網(wǎng)絡(luò)原理:第2版[M]. 北京:機(jī)械工業(yè)出版社,2006:217-325.

      [5]竇炳琳,李澍淞,張世永.基于結(jié)構(gòu)的社會(huì)網(wǎng)絡(luò)分析[J].計(jì)算機(jī)學(xué)報(bào),2012(4):741-753.

      [6]陳克寒,韓盼盼,吳健.基于用戶聚類的異構(gòu)社交網(wǎng)絡(luò)推薦算法[J].計(jì)算機(jī)學(xué)報(bào),2013(2):349-359.

      [7]李陽(yáng),王曉巖,王昆,等.基于社交網(wǎng)絡(luò)的安全關(guān)系研究[J].計(jì)算機(jī)研究與發(fā)展,2012(S2):124-130.

      [8]李海波.基于通信行為挖掘的犯罪網(wǎng)絡(luò)分析技術(shù)研究與應(yīng)用[D].上海:上海交通大學(xué),2007:21-64.

      [9]張玉超.公安重點(diǎn)關(guān)注對(duì)象的聚類分析研究[D]. 濟(jì)南:山東大學(xué),2015:15-28.

      [10]許婷.基于話單挖掘的可視化人物關(guān)系分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].哈爾濱:哈爾濱工業(yè)大學(xué),2014:16-55.

      D918. 2

      A

      2095-7939(2017)05-0106-07

      10.14060/j.issn.2095-7939.2017.05.022

      2017-04-20

      遼寧省教育廳科學(xué)技術(shù)研究基金(編號(hào):L2014508)。

      侯麗波(1977-),女,遼寧大連人,遼寧警察學(xué)院公安信息系副教授,主要從事互聯(lián)網(wǎng)情報(bào)分析與信息網(wǎng)絡(luò)安全。

      (責(zé)任編輯:于 萍)

      猜你喜歡
      話單漫游通話
      河北大名話單元音韻母、單字調(diào)及雙音節(jié)非輕聲詞連調(diào)的實(shí)驗(yàn)語(yǔ)音學(xué)初探
      《戊戌元日與友人通話》
      霹靂漫游堂
      采用大數(shù)據(jù)技術(shù)的移動(dòng)DPI關(guān)聯(lián)算法探索及實(shí)現(xiàn)
      NASA漫游記
      低成本視頻通話APP
      2013年11月通信業(yè)主要指標(biāo)完成情況(一)
      GSM-R移動(dòng)交換機(jī)ASN.1話單的解碼
      GPRS按時(shí)長(zhǎng)計(jì)費(fèi)模塊的優(yōu)化與應(yīng)用
      2013年3月通信業(yè)主要指標(biāo)完成情況(一)
      微博| 郯城县| 重庆市| 宣威市| 女性| 永嘉县| 陕西省| 霸州市| 滦平县| 南澳县| 驻马店市| 梅州市| 开平市| 镇雄县| 新疆| 卢氏县| 石首市| 会同县| 越西县| 隆德县| 安乡县| 武山县| 宁明县| 商南县| 芦溪县| 墨玉县| 龙井市| 白朗县| 吴桥县| 广水市| 贵德县| 土默特右旗| 甘洛县| 琼结县| 虎林市| 邵阳市| 凤凰县| 康乐县| 临夏市| 西乌| 鄂托克旗|