陳睿,歐若風(fēng),凌力
網(wǎng)上交易,主要是指在網(wǎng)絡(luò)的虛擬環(huán)境上,利用電子商務(wù)等各種手段來達(dá)成虛擬交易的過程。網(wǎng)上交易具有方便、快捷的優(yōu)點,實現(xiàn)足不出戶即可完成商品的購買。但是在方便和快捷的背后,網(wǎng)上交易存在一定安全隱患。
由于交易在網(wǎng)上完成,商品的信息和描述,商議價格和訂單信息等都以電文的方式存在,要可靠安全的固化與保存交易的相關(guān)信息存在一定的難度,而這些數(shù)據(jù)恰恰是反映交易發(fā)生的重要證據(jù),對于解決交易完成后所發(fā)生的法律糾紛,有著非常重要的影響。
本文以網(wǎng)上交易電文固化系統(tǒng)中的數(shù)據(jù)保全算法為分析和研究的主要內(nèi)容。
整個系統(tǒng)設(shè)數(shù)據(jù)保全中心(Message Archiving Center,MAC),取證中心,另在交易平臺方(本地)設(shè)MAC代理網(wǎng)關(guān),并與MAC數(shù)據(jù)保全中心和取證中心通過Internet相連。電文固化系統(tǒng),其網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)如圖1所示。
圖1 電文固化系統(tǒng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)
用戶只與交易平臺和取證中心發(fā)生聯(lián)系:在交易的過程中,用戶向交易平臺發(fā)送保全請求;在解決交易糾紛的過程中,用戶向取證中心提出查看所保全的交易信息的請求。
交易平臺只與MAC網(wǎng)關(guān)發(fā)生聯(lián)系:當(dāng)交易平臺收到用戶發(fā)出的保全請求之后,組織相關(guān)交易數(shù)據(jù)后發(fā)送給MAC網(wǎng)關(guān)。
MAC網(wǎng)關(guān)連接交易平臺、MAC數(shù)據(jù)保全中心和取證中心,具有完成保全指令、緩存管理、時鐘同步和安全傳輸?shù)鹊墓δ埽瑢⒐袒H慕灰讛?shù)據(jù)傳輸?shù)組AC數(shù)據(jù)中心和保全中心。
MAC數(shù)據(jù)保全中,將收到的固化保全的交易數(shù)據(jù)進(jìn)行保存,取證中心對保全固化的交易數(shù)據(jù)進(jìn)行保存和司法認(rèn)證。
對于交易中所產(chǎn)生的交易數(shù)據(jù)信息,MAC網(wǎng)關(guān)將其固化保全之后,按照一定標(biāo)準(zhǔn)進(jìn)行分類和打包,形成兩類數(shù)據(jù):
(1)全量數(shù)據(jù)
全量數(shù)據(jù)包含兩個部分:分量數(shù)據(jù)和交易具體信息(包含二進(jìn)制數(shù)據(jù)/加密數(shù)據(jù)/電子郵件等),交易具體信息經(jīng)過交易平臺方進(jìn)行加密,保障數(shù)據(jù)完整性,防止交易信息被篡改,當(dāng)取證需要時,再由交易平臺方進(jìn)行解密和提取。
全量數(shù)據(jù)在傳輸前,MAC網(wǎng)關(guān)還會對其進(jìn)行加密和數(shù)字簽名,保證傳輸?shù)陌踩浴?/p>
(2)分量數(shù)據(jù)
對于分量數(shù)據(jù)中的具體信息,我們做如下定義:
transaction-id::交易編號
type::數(shù)據(jù)類型(訂貨單/付款單……)
title::名稱(商品名稱/金融機(jī)構(gòu)……)
sheet-id::數(shù)據(jù)編號(訂單號/付款單號……)
time::日期和時間
seller-id::賣家標(biāo)識
consumer-id::買家標(biāo)識
根據(jù)以上定義的數(shù)據(jù)具體信息,分量數(shù)據(jù)的數(shù)據(jù)格式如下:
<archiving information>
<transaction-id>xxxx</transaction-id>
<type>xxxx</type>
<title>xxxx</title>
<sheet-id>xxxxxx</sheet-id>
<time>xxxxx</time>
<seller-id>xxx</seller-id>
<consumer-id>xxx</consumer-id>
</ archiving information >
此外,這些信息將作為固化系統(tǒng)中的索引數(shù)據(jù),通過這些數(shù)據(jù)可以在系統(tǒng)中找到更為詳細(xì)的交易信息。
通過相關(guān)軟件進(jìn)行統(tǒng)計,附加上傳輸過程中需要增加的數(shù)據(jù)包額外開銷之后,分量數(shù)據(jù)約占全量數(shù)據(jù)的17%。
在電文固化系統(tǒng)中,大量數(shù)據(jù)的交互出現(xiàn)在設(shè)立在交易平臺處的MAC網(wǎng)關(guān)與MAC數(shù)據(jù)保全、取證中心之間。
我們將連接交易平臺和MAC數(shù)據(jù)保全中心、取證中心的接口定義為平臺中心接口(trading Platform to Center Interface,PCI),此接口為應(yīng)用層的接口,用于定義數(shù)據(jù)傳輸?shù)膬?nèi)容和結(jié)構(gòu)。
首先,我們定義某個用戶的單筆交易數(shù)據(jù)矢量Tn(c):
當(dāng)某個用戶有多筆交易數(shù)據(jù)的時候,我們可以得到與之相對應(yīng)的矢量矩陣s(c):
同時,我們定義數(shù)字簽名矢量K:
當(dāng)數(shù)據(jù)進(jìn)行傳輸前,矢量矩陣s(c)與數(shù)字簽名(有關(guān)數(shù)字簽名的設(shè)計方案由另外的人員完成)矢量K相乘,得到經(jīng)過數(shù)字簽名的交易數(shù)據(jù)I。
交易平臺方通過調(diào)用服務(wù)端的電文固化接口,對指定電文進(jìn)行保全,并存放到MAC數(shù)據(jù)保全中心服務(wù)器端和取證中心服務(wù)器端,作為“電子證據(jù)”。
由于在整個系統(tǒng)中,交易平臺、MAC數(shù)據(jù)保全中心服務(wù)器和取證中心服務(wù)器的物理位置并不在同一地點,相互之間在進(jìn)行數(shù)據(jù)電文傳輸?shù)倪^程中,需要考慮保全成本和傳輸效率。
同時作為一個數(shù)據(jù)保全系統(tǒng),應(yīng)該盡可能地記錄所有的來往信息,我們考慮在至少保證存儲一份全量數(shù)據(jù)的前提下,數(shù)據(jù)保全算法應(yīng)滿足的要求:
(1)保全成本
數(shù)據(jù)保全算法需保證服務(wù)器端盡可能的用最小的代價換取最大容量的數(shù)據(jù)保全。
我們定義數(shù)據(jù)保全算法的日保全成本為Cn:
(2)傳輸效率
數(shù)據(jù)保全算法需保證通信雙方在傳輸數(shù)據(jù)的時候盡可能達(dá)到效率最高,即盡可能減少傳輸相同信息的次數(shù)。
我們定義數(shù)據(jù)保全算法的傳輸效率為En:
其中Dn表示在系統(tǒng)中傳輸?shù)男畔⒘浚ㄔ谟嬎阈畔⒘繒r,如數(shù)據(jù)被多次傳送,信息量中只計入傳送一次的數(shù)據(jù)大?。珼表示在系統(tǒng)中總計傳輸過的數(shù)據(jù)量(在計算數(shù)據(jù)量時,如數(shù)據(jù)被傳送多次,數(shù)據(jù)量中就相應(yīng)增加每次傳送的數(shù)據(jù)大?。?。
(3)傳輸可靠性
數(shù)據(jù)保全算法需保證服務(wù)器端獲得的數(shù)據(jù)為可靠的,沒有遺漏和丟失。
由于網(wǎng)上交易電文固化系統(tǒng)是一個全新的概念,因此在數(shù)據(jù)保全算法研究的過程中,參考了有關(guān)數(shù)據(jù)備份的相關(guān)資料。
文獻(xiàn)[1]給出了“異地數(shù)據(jù)備份系統(tǒng)”的相關(guān)技術(shù)及實現(xiàn)方案;文獻(xiàn)[2]給出了由“本地數(shù)據(jù)中心、本地緩存網(wǎng)關(guān)和遠(yuǎn)程備份網(wǎng)關(guān)”所組成的數(shù)據(jù)備份系統(tǒng)的實現(xiàn)方案。
如果將這些數(shù)據(jù)備份系統(tǒng)的方案運用到電文固化系統(tǒng)中,我們可以得到“服務(wù)器全量并行式方法”。此方法的示意圖見圖2。
在此方法中,當(dāng)交易平臺方收到用戶的保全請求,通過調(diào)用服務(wù)端的MAC代理網(wǎng)關(guān),對指定交易電文進(jìn)行保全,將保存得到的全量數(shù)據(jù)通過網(wǎng)絡(luò)同時傳輸保存到MAC數(shù)據(jù)保全中心和取證中心。此方法的流程圖見圖3。
圖3 服務(wù)器全量并行式方法流程圖
根據(jù)以上所提出的設(shè)計需求,我們可以對于“服務(wù)器全量并行式方法”進(jìn)行各個方面的分析。
當(dāng)MAC網(wǎng)關(guān)向MAC保全中心和取證中心傳輸全量數(shù)據(jù)時,(1)中的每一筆交易的數(shù)據(jù)d為:
在此方法中,整個系統(tǒng)所需傳輸?shù)臄?shù)據(jù)總量D為:
D=2Dt
其中,Dt為全量數(shù)據(jù)。
我們可以看出,接收方接收的每筆交易的交易數(shù)據(jù)越小,則數(shù)據(jù)的保全成本相對越低。
在此方法中,
Dn=Dt
由(2)可得,傳輸效率En為:
此外,對于傳輸可靠性,在對等通信的過程中,雖然整個電文固化系統(tǒng)有比較完善的通信協(xié)議來保證傳輸?shù)陌踩?。但是由于取證中心的硬件設(shè)備可能無法達(dá)到非常高的配置,所以當(dāng)收到MAC代理網(wǎng)關(guān)發(fā)送過來的全量數(shù)據(jù)時,可能無法全部存儲下來,導(dǎo)致在傳輸?shù)倪^程中無法保存全部數(shù)據(jù),造成數(shù)據(jù)的丟失和遺漏,與MAC保全中心服務(wù)器上保全的信息無法形成一一對應(yīng),從而導(dǎo)致無法保證傳輸數(shù)據(jù)的可靠性。
隨著使用網(wǎng)上交易的用戶數(shù)量不斷增加,用戶的法制意識不斷加強(qiáng),會有越來越多的人使用電文固化系統(tǒng)來保全交易的電文,維護(hù)自己的合法權(quán)益。
電文固化系統(tǒng)為了保證所保全的交易電文的法律有效性,必須在取證中心這樣的司法機(jī)構(gòu)保存相關(guān)的數(shù)據(jù),但是由于取證中心這樣的司法機(jī)構(gòu)未必具有相關(guān)的設(shè)備和維護(hù)人員,所以系統(tǒng)必須改進(jìn)已有的保全方法來適應(yīng)實際的需求,從而達(dá)到取證的目的。
如果采用存儲相對較小的分量數(shù)據(jù),對于取證中心的服務(wù)器無疑是一個最佳的選擇,通過將分量數(shù)據(jù)整理成為查詢?nèi)繑?shù)據(jù)的索引目錄,一方面可以快速的找到所需要的交易信息,另一方面可以降低存儲的成本。
因此,我們提出了“服務(wù)器分量串行式方法”。此方法的示意圖見圖4。
圖4 服務(wù)器分量串行式方法示意圖
在此方法中,交易平臺方調(diào)用服務(wù)端的MAC代理網(wǎng)關(guān),對指定交易電文進(jìn)行保全,將保存得到的全量數(shù)據(jù)通過網(wǎng)絡(luò)傳輸保存到MAC數(shù)據(jù)保全中心,當(dāng)MAC數(shù)據(jù)保全中心收到全量數(shù)據(jù)之后,將全量數(shù)據(jù)中的摘要數(shù)據(jù)(分量數(shù)據(jù))通過網(wǎng)絡(luò)傳輸保存到取證中心。此方法的流程圖見圖5。
圖5 服務(wù)器分量串行式方法流程圖
對于此方法,我們依然從傳輸效率、存儲成本和傳輸可靠性這3個方面進(jìn)行分析。
當(dāng)MAC網(wǎng)關(guān)向MAC保全中心傳輸全量數(shù)據(jù)時,(1)中的每一筆交易的數(shù)據(jù)d為:
當(dāng)MAC保全中心向取證中心傳輸分量數(shù)據(jù)時,(1)中的每一筆交易的數(shù)據(jù)d為:
在此方法中,整個系統(tǒng)所需傳輸?shù)臄?shù)據(jù)總量D為:
其中,Dt為全量數(shù)據(jù)。Dp為分量數(shù)據(jù)。
在保全成本上,存儲分量數(shù)據(jù)的存儲成本僅為存儲全量數(shù)據(jù)的1/6,對于整個系統(tǒng),運用此方法,在保全的成本上降低了近40%。
因為Dt包含Dp,所以在此方法中,
Dn=Dt
由(2)可得,傳輸效率En為:
在傳輸可靠性上,由于所需要的存儲空間大幅度的下降,服務(wù)器在接收數(shù)據(jù)時基本能夠保證沒有數(shù)據(jù)的丟失和遺漏。
服務(wù)器分量串行式方法在傳輸效率、存儲成本和傳輸可靠性這3方面相比服務(wù)器全量并行式方法都有了一定的提高,但是取證中心所獲得的數(shù)據(jù)由MAC保全中心提供,缺乏和原始數(shù)據(jù)進(jìn)行相關(guān)的驗證與比對。
因此,我們提出了更進(jìn)一步的改進(jìn)方法,服務(wù)器分量分布式方法。此方法的示意圖見圖6。
圖6 服務(wù)器分量分布式方法示意圖
在此方法中,交易平臺方調(diào)用服務(wù)端的MAC代理網(wǎng)關(guān),對指定交易電文進(jìn)行保全,將保存得到的全量數(shù)據(jù)通過網(wǎng)絡(luò)傳輸保存到MAC數(shù)據(jù)保全中心,同時將分量數(shù)據(jù)通過網(wǎng)絡(luò)傳輸保存到交易平臺和取證中心。當(dāng)MAC數(shù)據(jù)保全中心收到全量數(shù)據(jù)之后,將全量數(shù)據(jù)中的分量數(shù)據(jù)通過網(wǎng)絡(luò)傳輸保存到取證中心。交易平臺和取證中心將獲得的數(shù)據(jù)與之前已有的數(shù)據(jù)進(jìn)行比對驗證。此方法的流程圖見圖7。
圖7 服務(wù)器分量分布式方法流程圖
在此方法中,整個系統(tǒng)所需傳輸?shù)臄?shù)據(jù)總量D為:
其中,Dt為全量數(shù)據(jù)。Dp為分量數(shù)據(jù)。
因為Dt包含Dp,所以在此方案中,
Dn=Dt
由公式2可得,傳輸效率En為:
此方法雖然在傳輸效率和存儲成本這兩方面稍遜色于之前的“服務(wù)器分量串行式方法”,但加入了交易數(shù)據(jù)的比對驗證,進(jìn)一步加強(qiáng)了數(shù)據(jù)的可靠性。
本文所列出的3種方法在傳輸效率、存儲成本、傳輸可靠性、數(shù)據(jù)驗證對比、服務(wù)器保全數(shù)據(jù)類型這5個方面的比較,詳見表1。
表1 分類對比
通過對比以上各個方面,我們可以得出:
在取證中心,或者說是司法部門的技術(shù)支持和服務(wù)器設(shè)備條件允許的情況下,建議選擇“服務(wù)器全量并行式方法”,在MAC保全中心和取證中心都保存一份詳盡的交易信息。
在取證中心的技術(shù)支持和服務(wù)器設(shè)備條件不允許的情況下,同時面向C2C的交易平臺,建議選擇“服務(wù)器分量串行式方法”,因為無論買家和賣家和交易平臺都沒有利益關(guān)系,可以省略數(shù)據(jù)對比驗證這一環(huán)節(jié)。
在取證中心的技術(shù)支持和服務(wù)器設(shè)備條件不允許的情況下,同時面向B2C的交易平臺,建議選擇“服務(wù)器分量分布式方法”,此時,賣家始終為交易平臺方,所以對于每一筆保全的交易信息,我們需要進(jìn)行再一次的對比驗證,以保證數(shù)據(jù)可靠性和不被篡改。
本文針對網(wǎng)上交易的特點,分析、比較研究了3種可行的數(shù)據(jù)保全方法,分別針對3種不同的情況,可以可靠安全地固化、保存和認(rèn)證網(wǎng)上交易的證據(jù),為解決網(wǎng)上交易證據(jù)認(rèn)證這一問題提出了新的解決方法。目前此系統(tǒng)正逐步得到一些網(wǎng)上交易平臺的應(yīng)用。
[1]沈曉彥,魯冰.異地數(shù)據(jù)備份系統(tǒng)技術(shù)應(yīng)用及分析[J].光盤技術(shù),2007(4).
[2]皮璐琳,劉曉潔,李濤,張洪亮.一種網(wǎng)絡(luò)多點備份系統(tǒng)的設(shè)計和實現(xiàn)[J].計算機(jī)安全,2008(5).
[3]徐偉,麥永浩.信息網(wǎng)絡(luò)取證的若干關(guān)鍵問題分析[J].信息網(wǎng)絡(luò)安全,2007(11).
[4]杭逸夫,張楚,阿拉木斯.網(wǎng)絡(luò)公證--解決網(wǎng)絡(luò)信用危機(jī)的新途徑[J].信息網(wǎng)絡(luò)安全,2002(5).
[5]秦曉明.基于網(wǎng)絡(luò)公證的電子商務(wù)認(rèn)證體系研究[J].商場現(xiàn)代化,2008(5).