摘要:數(shù)據(jù)分頁是基于數(shù)據(jù)庫的動(dòng)態(tài)Web系統(tǒng)所必需的技術(shù)。Microsoft公司的ADO(Active Data objecc)數(shù)據(jù)存取技術(shù)提供了一種基于Recordset的數(shù)據(jù)分頁方法,該方法簡單易用,卻由于效率原因,不適用大數(shù)據(jù)量的快速定位分頁。文章對(duì)該方法從根本上進(jìn)行了改進(jìn),獲得了非常明顯的效果,完全適用于企業(yè)級(jí)應(yīng)用的海量數(shù)據(jù)分頁定位。
關(guān)鍵詞:Web分頁技術(shù);ADO;Recordset;改進(jìn)
0引言
隨著信息技術(shù)的發(fā)展,人們?cè)絹碓蕉嗟亟柚谟?jì)算機(jī)和網(wǎng)絡(luò)獲取信息,但是面對(duì)浩如煙海的信息資源,查詢結(jié)果往往會(huì)有成千上萬條數(shù)據(jù)。數(shù)據(jù)分頁技術(shù)提供了一種有效的途徑,使我們可以像看書一樣,一頁一頁地瀏覽查詢結(jié)果。本文對(duì)廣泛應(yīng)用在動(dòng)態(tài)Web系統(tǒng)中的ADO Recordset數(shù)據(jù)分頁技術(shù),進(jìn)行了必要的改進(jìn)。
1數(shù)據(jù)分頁方法
所謂數(shù)據(jù)分頁方法,是將查詢結(jié)果分頁顯示的方法,是基于數(shù)據(jù)庫的動(dòng)態(tài)Web系統(tǒng)所必需的技術(shù)。因?yàn)閿?shù)據(jù)庫中需要顯示的數(shù)據(jù)可能有成千上萬條,大量的數(shù)據(jù)從數(shù)據(jù)庫服務(wù)器經(jīng)過網(wǎng)絡(luò)傳輸?shù)娇蛻舳藶g覽器,必須組織成便于瀏覽的方式顯示給用戶。如圖l所示Google搜索系統(tǒng)就應(yīng)用了數(shù)據(jù)分頁技術(shù)。
2 ADO Recordset分頁方法
ADO(Active Data Object)技術(shù)是Microsoft公司支持的一種主要的數(shù)據(jù)存取技術(shù),是Microsoft提出的各種數(shù)據(jù)存取技術(shù)的演化結(jié)果,目前是Windows平臺(tái)存取數(shù)據(jù)的標(biāo)準(zhǔn)。
ADO使用了集合對(duì)象的概念,其中Recordset對(duì)象是ADO的靈魂對(duì)象,它封裝了完善的數(shù)據(jù)處理功能。ADO提供了一種數(shù)據(jù)分頁技術(shù),是通過Recordset對(duì)象來實(shí)現(xiàn)的。Recordset對(duì)象有很多屬性和方法,其中與分頁有關(guān)的有以下屬性:
AbsolutePage:當(dāng)Recordset設(shè)置有分頁時(shí),返回當(dāng)前頁碼;
PageCount:當(dāng)Recordset設(shè)置有分頁時(shí),返回分頁總數(shù);
PageSize:當(dāng)Recordset設(shè)置有分頁時(shí),為每頁的記錄個(gè)數(shù);
RecordCount:返回當(dāng)前Recordset對(duì)象內(nèi)的記錄數(shù)。
使用Recordset對(duì)象來實(shí)現(xiàn)分頁顯示十分簡單:先建立一個(gè)Recordset對(duì)象,將查詢到的記錄封裝進(jìn)Recordset對(duì)象之中;然后引用RecordCount屬性值可以獲得記錄總數(shù),根據(jù)需要設(shè)置PageSize屬性,則可以得到分頁總數(shù)PageCount,其中PageCount取大于或者等于rRecordCount/PageSize]的最小整數(shù)。然后設(shè)置AbsolutePage屬性后,就可以返回某一分頁的記錄內(nèi)容。以下代碼實(shí)現(xiàn)了A_Table表中的第6頁(第5l一60條目錄)的數(shù)據(jù)顯示。
(1)Set rs=Server.CreateObiectCADODB.Recordset\")
(2)rs.ActiveConnection=Connection_String
(3)rs.Source=\"Select*From A_Table\"
(4)rs.CursorType=0
(5)rs.CursorLocation=2
(6)rs.LockType=l
(7)rs.Open()
(8)Recordset.PageSize=10
(9)Recordset.AbsolutePage=6
(10)ShowData
這種技術(shù)被廣泛應(yīng)用在基于Windows平臺(tái)的動(dòng)態(tài)Web數(shù)據(jù)庫系統(tǒng)中,尤其是基于ASP(Active Server Pages)的中小型Web系統(tǒng)中。
3 ADO Recordset分頁方法的弊端
利用ADO的Recordset對(duì)象可以簡單方便地實(shí)現(xiàn)數(shù)據(jù)分頁,可是必須將所有數(shù)據(jù)全部封裝進(jìn)Recordset對(duì)象后才能進(jìn)行分頁,如果數(shù)據(jù)量很大,比如超過上萬條,那么封裝數(shù)據(jù)就是一個(gè)相當(dāng)耗時(shí)、耗資源的過程,因此該技術(shù)只能適合小數(shù)據(jù)量的分頁顯示,對(duì)于設(shè)計(jì)企業(yè)級(jí)應(yīng)用系統(tǒng)沒有多大實(shí)用價(jià)值。
4 ADO Recordset分頁方法的改進(jìn)
為了提高ADO Recordset分頁方法的效率,就必須從減小Recordset封裝的記錄個(gè)數(shù)著手。分析上述代碼中第3行的SQL查詢語句Select*From A_Table可知,如果直接在SQL語句中限制返回的記錄數(shù),則可以限制Recordset的大小。最理想的情況是只返回所需要的記錄數(shù),做到精確存取,從根本上改變了Recordset分頁封裝所有記錄的“粗放式”存取。
以下是改良后的代碼,仍然生成Recordset,但是摒棄了Recordset的AbsolutePage等相關(guān)分頁屬性,Recordset封裝記錄時(shí)限制記錄個(gè)數(shù),直接取第51-60條記錄作為Recordset的數(shù)據(jù)集合。其中Rownum代表記錄在表中存儲(chǔ)所在行的序號(hào),是數(shù)據(jù)庫中的關(guān)鍵字,是被Oracle等數(shù)據(jù)庫支持的偽列。
(1)Set rs=Server.CreateObjectCADODB.Recordset\")
(2)rs.ActiveConnection=Connection_String
(3)rs.Souree=\"Select。From A_Table where Rownum<60and Rownum>50\"’
(4)rs.CursorType=0
(5)rs.CursorLocation=2
(6)rs.LockType=l
(7)rs.Open0
(8)ShowData
某些早期Oracle版本(如Oracle5)僅支持Rownum的“<”和“<=”操作,而不支持“>”和“>=”等操作??梢酝ㄟ^l臨時(shí)視圖將偽列轉(zhuǎn)化為可以實(shí)際比較的列進(jìn)行操作:Create V_Temp AsSelect Rownum RN,A_Table.From A_Table,然后將上面代碼中的第3行改為:rs.Source=”Select}From V_TempWhere RN<60 and RN>50\"。運(yùn)行完第8行顯示完數(shù)據(jù)再刪去臨時(shí)視圖:Drop View V_Temp。雖然改良后的方法引入了臨時(shí)視圖,增加了創(chuàng)建和刪除臨時(shí)視圖的開銷,但該方法卻控制了生成Recordset的數(shù)據(jù)集合的大小,在大數(shù)據(jù)量的情況下,就會(huì)顯示出明顯的效率優(yōu)勢(shì)。
5兩種分頁方法效率的對(duì)比測(cè)試
表1是A_Table中的記錄個(gè)數(shù)分別為100、200、1000、2000、10000、20000、100000和200000的情況下,瀏覽第51-60條記錄時(shí),采用兩種分頁方法完成分頁的時(shí)間T、運(yùn)行所耗資源(包括CPU時(shí)間u和內(nèi)存使用M)的對(duì)比情況。測(cè)試平臺(tái)是PIIl500,256M RAM,Windows 2000 Professional,某型Oracle數(shù)據(jù)庫,測(cè)試用表每記錄有33個(gè)字段,約500字節(jié)。其中第二種方法的實(shí)現(xiàn)引入了臨時(shí)視圖,效果數(shù)據(jù)中包括建立和刪除臨時(shí)視圖的開銷。圖2是兩種分頁方法執(zhí)行時(shí)間對(duì)比,圖3是兩種分頁方法運(yùn)行所需CPU時(shí)間對(duì)比,圖4是兩種分頁方法運(yùn)行所需內(nèi)存對(duì)比。
6結(jié)束語
從表l和圖2、3、4可以看出,直接使用Microsoft的ADORecordset分頁定位技術(shù),其所需的時(shí)間,所花的CPU時(shí)間和內(nèi)存空間的開銷,是隨著表的規(guī)模成線性增長的,當(dāng)表中記錄達(dá)到10000規(guī)模以后,定位到某頁就需要數(shù)分鐘時(shí)間,基本上已經(jīng)失去了在Web上的使用價(jià)值。而改良后的定位分頁方法,由于從根本上減少了大量封裝記錄的過程,因而其開銷非常小,其CPU時(shí)間和內(nèi)存不隨表的規(guī)模而變化,訪問時(shí)間也很快。在20萬條記錄的表中,改良后的方法即使包含了創(chuàng)建和刪除臨時(shí)視圖的開銷,其定位1頁的時(shí)間也僅為6秒,是改良前方法的0.16%,所耗CPU時(shí)間是改良前的0.12%,所耗內(nèi)存是改良前的11.3%,效率分別是改良前的625倍、830倍和8.84倍。
(注:本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文。)