• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      E-Science環(huán)境下科學(xué)數(shù)據(jù)的整合與共享

      2009-07-10 09:03:24姚松濤
      現(xiàn)代情報(bào) 2009年5期

      姚松濤

      〔摘 要〕E-Science環(huán)境下科學(xué)數(shù)據(jù)實(shí)現(xiàn)共享的關(guān)鍵在于標(biāo)準(zhǔn)化,共享的前提是制定標(biāo)準(zhǔn)的規(guī)范;實(shí)現(xiàn)有效的科學(xué)數(shù)據(jù)整合,使地理分布無關(guān)的計(jì)算資源、數(shù)據(jù)資源、存貯資源的全球自動(dòng)配置和共享。

      〔關(guān)鍵詞〕E-Science;科學(xué)數(shù)據(jù);整合與共享

      〔中圖分類號〕G255 〔文獻(xiàn)標(biāo)識碼〕B 〔文章編號〕1008-0821(2009)05-0128-03

      Integration and Resource Sharing of Scientific

      Data under E-science EnvironmentYao Songtao

      (Library,Henan University,Kaifeng 475000,China)

      〔Abstract〕The key of implementing scientific data sharing under e-science environment is standardization;scientific data should be integrated efficiently,so as to automatically allocate and share the computing resources,data resources,storage resource in the global range.

      〔Keywords〕e-science;scientific data;integration and sharing

      1 E-Science及其特點(diǎn)

      現(xiàn)代科學(xué)研究的問題空前復(fù)雜化,20世紀(jì)末產(chǎn)生了一種嶄新的科研協(xié)作模式和大科學(xué)工程——E-Science。E-Science中文譯法有“數(shù)字科研”、“電子科研”、“電子科學(xué)”、“科學(xué)研究信息化”,它是一種以網(wǎng)格為基礎(chǔ)的新的科學(xué)研究環(huán)境。

      “E-Science”的概念是英國人先提出來的,它是建立在新一代網(wǎng)絡(luò)技術(shù)(Internet)和廣域分布式高性能計(jì)算環(huán)境(Grid)基礎(chǔ)上的全新科學(xué)研究模式,以互聯(lián)網(wǎng)技術(shù)和網(wǎng)格計(jì)算技術(shù)為基礎(chǔ),實(shí)現(xiàn)跨越地理界限的全球大規(guī)模數(shù)據(jù)采集、T級高速計(jì)算和高性能可視化,并以此為基礎(chǔ)將互聯(lián)網(wǎng)的應(yīng)用、高性能科學(xué)計(jì)算及資源共享提高到一個(gè)全新的層次。在這種環(huán)境中,地理位置、分散的各種儀器設(shè)備、計(jì)算資源、數(shù)據(jù)資源等被虛擬的集成到一起,科研人員可以自由的使用各種資源,無需考慮資源的存儲(chǔ)地和提供者,這種使用突破了時(shí)間、物理空間、邏輯空間上的障礙。

      E-Science具有如下特點(diǎn):首先,E-Science是一種信息化的基礎(chǔ)設(shè)施,它提供了一種信息化的科學(xué)研究環(huán)境和平臺(tái),使得不同學(xué)科領(lǐng)域的科研活動(dòng)能夠有針對地開發(fā)特定的科學(xué)研究與應(yīng)用;其次,E-Science的建立應(yīng)以應(yīng)用需求為導(dǎo)向;另外,E-Science的實(shí)現(xiàn)需要大量的新技術(shù),事實(shí)上E-Science正是20世紀(jì)后半期IP技術(shù)尤其是20世紀(jì)后10年IP技術(shù)的產(chǎn)物[1]。它所需要的最具代表性的是網(wǎng)格技術(shù),正是通過網(wǎng)格才有可能將E-Science所需的眾多技術(shù)與資源,如分布式計(jì)算技術(shù)、網(wǎng)絡(luò)安全技術(shù)、協(xié)同工作技術(shù)、資源管理技術(shù)等等集成一體,構(gòu)成并實(shí)現(xiàn)了E-Science。

      2 中外科學(xué)數(shù)據(jù)共享的現(xiàn)狀

      2.1 國外科學(xué)數(shù)據(jù)共享的現(xiàn)狀

      隨著經(jīng)濟(jì)發(fā)展的全球化和全球性科技活動(dòng)的不斷增強(qiáng),導(dǎo)致全球范圍內(nèi)的科技人員對科學(xué)數(shù)據(jù)信息資源的交流、互通和深度使用有強(qiáng)烈需求和高度依賴。近20年來,美國、俄羅斯、英國、法國、加拿大、日本和新加坡等發(fā)達(dá)國家相繼頒布了有關(guān)科學(xué)數(shù)據(jù)信息共享的政策法規(guī),開始實(shí)施科學(xué)數(shù)據(jù)共享工程。目前國際上實(shí)施科學(xué)數(shù)據(jù)共享主要體現(xiàn)在3個(gè)方面:第一,政府投入大量資金支持科學(xué)數(shù)據(jù)的長期積累、高效流動(dòng)和低成本使用;第二,從法律、政策等多方面保障科學(xué)數(shù)據(jù)的管理與共享服務(wù);第三,科學(xué)數(shù)據(jù)共享主要采用國家調(diào)控下的事業(yè)性運(yùn)行模式。

      2.2 我國科學(xué)數(shù)據(jù)共享現(xiàn)狀

      科學(xué)數(shù)據(jù)是科技活動(dòng)的結(jié)晶,是科技發(fā)展與創(chuàng)新的基石,是國家安全和社會(huì)經(jīng)濟(jì)發(fā)展的重要保障。但科學(xué)數(shù)據(jù)共享卻在我國長期以來沒有得到應(yīng)有的重視。

      具體說,我國科學(xué)數(shù)據(jù)的共享現(xiàn)狀是:①目的單一,以自用、完成任務(wù)為主,只能為少數(shù)人使用,得不到及時(shí)的更新。②分散在各個(gè)單位、數(shù)據(jù)觀測點(diǎn)、科學(xué)家個(gè)人手中,許多珍貴數(shù)據(jù)記錄已因年久而損毀或散失。③無統(tǒng)一的數(shù)據(jù)規(guī)范標(biāo)準(zhǔn),標(biāo)準(zhǔn)化程度很低,從根本上降低了數(shù)據(jù)共享的可能。④重復(fù)建設(shè),浪費(fèi)大量人力、物力和經(jīng)費(fèi)。

      國內(nèi)雖然在科學(xué)數(shù)據(jù)共享方面的工作起步較晚,但是在國家科技部的領(lǐng)導(dǎo)下,近年來,在整合已有科學(xué)數(shù)據(jù)資源、推動(dòng)科學(xué)數(shù)據(jù)共享方面作了大量卓有成效的奠基性工作,1999年,國家科技部基礎(chǔ)司組織了“科學(xué)數(shù)據(jù)共享調(diào)研組”,并于2001年11月完成了“實(shí)施科學(xué)數(shù)據(jù)共享工程,增強(qiáng)國家科技創(chuàng)新能力”的調(diào)研報(bào)告。該報(bào)告在深入分析我國科學(xué)數(shù)據(jù)管理存在的問題和國際科學(xué)數(shù)據(jù)管理的經(jīng)驗(yàn)基礎(chǔ)上,提出了實(shí)施國有科學(xué)數(shù)據(jù)公益性共享的戰(zhàn)略國策和10年建成科學(xué)數(shù)據(jù)共享保障體系的總體思路。現(xiàn)已開展國家科學(xué)數(shù)據(jù)共享工程的試點(diǎn)建設(shè),這不僅為國家科學(xué)數(shù)據(jù)共享工程實(shí)施標(biāo)準(zhǔn)的制定和具體實(shí)施提供了技術(shù)基礎(chǔ),也為科學(xué)數(shù)據(jù)共享工程向其它領(lǐng)域延伸,向地方區(qū)域推廣提供了寶貴經(jīng)驗(yàn)。隨著我國計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的高速發(fā)展,網(wǎng)絡(luò)帶寬迅速擴(kuò)大,信息技術(shù)開發(fā)能力的不斷增強(qiáng),必將促進(jìn)我國科學(xué)數(shù)據(jù)共享的跨越式發(fā)展。

      3 E-Science環(huán)境下科學(xué)數(shù)據(jù)的整合與共享

      3.1 制定標(biāo)準(zhǔn)規(guī)范

      E-Science環(huán)境下從“全球數(shù)字圖書館”的角度來說,需要將眾多的力量協(xié)調(diào)組織起來,實(shí)現(xiàn)網(wǎng)絡(luò)的互聯(lián)互通、資源的共建共享、管理的井然有序,來滿足各個(gè)不同的科研團(tuán)隊(duì)的科研需要。實(shí)現(xiàn)共享的關(guān)鍵就在于標(biāo)準(zhǔn)化,共享的前提是制定標(biāo)準(zhǔn)的規(guī)范,統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)能實(shí)現(xiàn)資源的互操作性,統(tǒng)一的標(biāo)準(zhǔn)化協(xié)議能使異構(gòu)信息變同構(gòu)信息。

      元數(shù)據(jù)是數(shù)字圖書館的語義基礎(chǔ),為數(shù)字圖書館提供完整的數(shù)據(jù)描述形式,為分布的、由多種數(shù)字化資源有機(jī)構(gòu)成的信息體系提供規(guī)范、普遍的描述方法、整合工具和紐帶,使廣泛分布的數(shù)字圖書館資源站點(diǎn)具有充分的互操作性和可擴(kuò)展性,提供數(shù)字圖書館中的資源描述、資源發(fā)現(xiàn)、資源處理、資源評價(jià)與排序以及資源的人際交互和理解的基本準(zhǔn)則,它還承擔(dān)向數(shù)字圖書館中高層協(xié)議中間件提供標(biāo)準(zhǔn)數(shù)據(jù)訪問接口的功能。完整、全面的標(biāo)準(zhǔn)規(guī)范對于數(shù)字圖書館的建設(shè)是非常重要的。2007年度都柏林核心(DC)與元數(shù)據(jù)應(yīng)用國際研討會(huì)在新加坡舉行,在元數(shù)據(jù)的標(biāo)準(zhǔn)規(guī)范方面提出被稱為“新加坡框架”的元數(shù)據(jù)應(yīng)用規(guī)范,其規(guī)定了一整套元數(shù)據(jù)方案需要包含五類文檔,其中必備的“領(lǐng)域模型”和“元數(shù)據(jù)集描述”并要求以較為嚴(yán)格的機(jī)讀形式編碼(UML和XML/RDF),保證元數(shù)據(jù)應(yīng)用的各項(xiàng)形式化約束具有一致性和延續(xù)性[2]。

      系統(tǒng)的異構(gòu)性是構(gòu)建數(shù)字圖書館、實(shí)現(xiàn)信息資源全面整合的突出問題,異構(gòu)資源互操作問題主要解決平臺(tái)異構(gòu)、操作系統(tǒng)異構(gòu)、數(shù)據(jù)庫異構(gòu)問題,可采用CORBA、Z39.50等技術(shù)手段來解決異構(gòu)系統(tǒng)的互連互通。目前,比較典型的解決方案是利用XML作為數(shù)據(jù)的傳送格式,允許服務(wù)提供者和服務(wù)客戶經(jīng)過防火墻Internet上進(jìn)行通信,基于HTTP、XML、RPC的SOAP實(shí)現(xiàn)平臺(tái)與環(huán)境的無關(guān)性和獨(dú)立性。提供開放式鏈接,以實(shí)現(xiàn)系統(tǒng)間的互操作:開放式鏈接基于正在出現(xiàn)的、OpenURL、CrossRef標(biāo)準(zhǔn),能夠無縫地鏈接所有數(shù)字圖書館資源,而不論這些資源使用什么樣的軟件系統(tǒng)[3]。

      基于Web的服務(wù)在不同的系統(tǒng)之間實(shí)現(xiàn)“軟件——軟件調(diào)用”,存儲(chǔ)設(shè)備等軟硬件資源,在作為操作系統(tǒng)的網(wǎng)格中間件的作用下,形成虛擬計(jì)算組織,使用戶可以在全球任何地方訪問所需的資源,從而使計(jì)算資源得到充分的共享,這種Web服務(wù)是基于網(wǎng)格之上的,同時(shí)網(wǎng)格為Web服務(wù)提供了一個(gè)與硬件無關(guān)的虛擬計(jì)算機(jī),Web服務(wù)構(gòu)架在虛擬計(jì)算機(jī)平臺(tái)之上,與平臺(tái)/語言無關(guān)的應(yīng)用交互集成平臺(tái)。同時(shí)要遵循WebService中的幾個(gè)重要協(xié)議標(biāo)準(zhǔn):XML/SOAP/WSDL/UDDI等,這些協(xié)議提供了標(biāo)準(zhǔn)化、透明的機(jī)制和完善的信息源標(biāo)識功能。所謂標(biāo)準(zhǔn)化協(xié)議是指此協(xié)議定義了與檢索相關(guān)的標(biāo)準(zhǔn)檢索語法、檢索結(jié)果的表示以及對信息源接口和基本特征的描述?;谶@個(gè)標(biāo)準(zhǔn)檢索服務(wù)框架,各個(gè)數(shù)據(jù)庫可以通過轉(zhuǎn)換封裝成標(biāo)準(zhǔn)檢索服務(wù)。所謂透明性機(jī)制是指網(wǎng)格系統(tǒng)支持對異構(gòu)數(shù)據(jù)資源的訪問,為用戶提供統(tǒng)一的訪問接口,并自動(dòng)選擇適當(dāng)?shù)脑L問協(xié)議來實(shí)現(xiàn)用戶提出的數(shù)據(jù)訪問請求。所謂完善的信息源標(biāo)識功能是指在數(shù)據(jù)源很多,統(tǒng)一檢索系統(tǒng)一次只能向有限個(gè)數(shù)據(jù)源提交檢索請求情況下,網(wǎng)格系統(tǒng)能通過檢索服務(wù)發(fā)現(xiàn)和描述協(xié)議并精確定位用戶所需的數(shù)據(jù)集,并對各個(gè)數(shù)據(jù)庫返回?cái)?shù)據(jù)進(jìn)行統(tǒng)一處理的一種快速反應(yīng)機(jī)制[4]。

      3.2 整合分布式數(shù)據(jù)

      E-Science環(huán)境下實(shí)現(xiàn)有效的科學(xué)數(shù)據(jù)整合,要以用戶需求為導(dǎo)向進(jìn)行數(shù)字信息資源開發(fā),根據(jù)科研人員的需要自動(dòng)地提供所需要的知識,并把所有的信息動(dòng)態(tài)的集成到一起,最終形成以科研人員信息活動(dòng)為基礎(chǔ)的數(shù)字信息環(huán)境,并進(jìn)行日常的知識管理工作,實(shí)現(xiàn)外部知識系統(tǒng)與用戶的個(gè)體知識系統(tǒng)、團(tuán)隊(duì)知識系統(tǒng)的融合,以達(dá)到更高效的利用知識和創(chuàng)造知識的目的。

      E-Science環(huán)境下全球數(shù)字圖書館對數(shù)據(jù)的收集分為兩種:物理上的集中,即建立數(shù)據(jù)存儲(chǔ)和處理中心,如數(shù)據(jù)庫、機(jī)構(gòu)庫等;邏輯上的集成,即建立一種鏈接機(jī)制,把由相關(guān)聯(lián)的數(shù)據(jù)進(jìn)行整合、集成和鏈接,針對不同的用戶需求實(shí)現(xiàn)不同個(gè)性化信息推送。

      E-Science環(huán)境下用戶面對多介質(zhì)、多格式、多類型、多傳輸渠道的數(shù)據(jù)資源,用戶希望以更快更好的方式得到自己需要的數(shù)據(jù)。數(shù)字圖書館作為E-Science環(huán)境下支持研究的平臺(tái),是用戶獲取數(shù)據(jù)的主要來源,從用戶的角度來說,不論圖書館收集了多少資源、收集了什么樣的資源,對用戶而言都是屏蔽的。用戶只關(guān)心他能否在數(shù)字圖書館這個(gè)平臺(tái)上獲得其所需要的信息。所以數(shù)字圖書館必須把分布式的數(shù)據(jù)建設(shè)朝著整合化的方向發(fā)展。整合的數(shù)據(jù)對象包括:不同載體、不同類型的數(shù)據(jù)之間的整合;異質(zhì)信息資源的整合;本地資源和遠(yuǎn)程資源的整合等。通過整合滿足用戶全方位、多渠道地獲取要求,并提供更加豐富的信息資源,建立分布式信息資源保障體系,實(shí)現(xiàn)信息的無縫鏈接和集成,從而實(shí)現(xiàn)更大范圍、更有深度的資源共享,提高為用戶服務(wù)的能力,促進(jìn)形成以用戶為中心,以資源為基礎(chǔ)學(xué)習(xí)環(huán)境和研究環(huán)境。

      E-Science環(huán)境下數(shù)字圖書館的鏈接是在E-Science環(huán)境下全球數(shù)字圖書館的范圍內(nèi)進(jìn)行的,鏈接的技術(shù)基礎(chǔ)是知識網(wǎng)格。通過知識網(wǎng)格使數(shù)字圖書館由信息服務(wù)轉(zhuǎn)變成知識服務(wù),利用節(jié)點(diǎn)豐富、交織縱橫的知識網(wǎng)絡(luò)系統(tǒng)實(shí)現(xiàn)了數(shù)據(jù)庫的全息關(guān)聯(lián),把數(shù)據(jù)庫信息資源的整合深度推進(jìn)到知識元層次,根據(jù)不同的用戶和用戶群的需求提供不同的知識鏈接方式,使數(shù)字圖書館所擁有的數(shù)據(jù)庫資源組織成一張循環(huán)互動(dòng)的知識網(wǎng)絡(luò),并與外界的信息資源有機(jī)鏈接起來,使用戶有效的收集到自己所需要的數(shù)據(jù)。

      科學(xué)數(shù)據(jù)中蘊(yùn)涵著大量的事實(shí)和規(guī)律,而這種事實(shí)和規(guī)律的揭示是通過對大量數(shù)據(jù)的分析和處理實(shí)現(xiàn)的。E-Science環(huán)境下數(shù)字圖書館對科學(xué)數(shù)據(jù)整合的基礎(chǔ)上進(jìn)行分析和處理,能夠從不同的需要出發(fā)對數(shù)據(jù)集進(jìn)行各種角度的統(tǒng)計(jì)、計(jì)算、分析和處理,幫助科研人員進(jìn)行數(shù)據(jù)的預(yù)處理和后處理工作。

      3.3 共享科學(xué)數(shù)據(jù)

      E-Science環(huán)境下科學(xué)數(shù)據(jù)的共享難度加大,數(shù)字圖書館能夠?qū)?shù)據(jù)的共享起重要的作用,共享的對象包括顯性知識和隱性知識。

      E-Science環(huán)境下知識共享的難度加大的主要原因是:①非正式交流增多,且方式多樣,電子郵件、BBS、討論組、網(wǎng)絡(luò)會(huì)議、信息共享室、個(gè)人主頁……,這就產(chǎn)生了大量形態(tài)各異、質(zhì)量參差不齊的資源,良莠混雜使得對這些資源的篩選和甄別變得異常困難,如何有效存儲(chǔ)和利用這些資源的問題將日趨尖銳;②交流的隨意性強(qiáng),用戶可以自由的發(fā)布信息,缺少嚴(yán)格的審核機(jī)制,缺乏有效的控制機(jī)制,其質(zhì)量、時(shí)效、穩(wěn)定性難以得到有效保證;③非正式交流的組織性差,許多非正式交流是科研人員自發(fā)形成的,這使得交流的過程和結(jié)果極不規(guī)范,不易記錄和保存。

      E-Science環(huán)境下數(shù)字圖書館為顯性數(shù)據(jù)的有效共享提供條件,E-Science環(huán)境下,數(shù)字化的數(shù)據(jù)生產(chǎn)和傳遞將有利于它的存儲(chǔ)和轉(zhuǎn)換,也使得對它的保存和重用成為可能。例如,在動(dòng)物和微生物基因組研究方面,美國科學(xué)家首次繪制出了黑猩猩的基因組序列草圖,所獲得的全部數(shù)據(jù)存入公共數(shù)據(jù)庫,免費(fèi)供各國科學(xué)家調(diào)用。科學(xué)家們通過比較分析發(fā)現(xiàn),黑猩猩與人類的基因組之間存在著關(guān)鍵性差異,說明二者的共同祖先在500萬年前分開之后,自然選擇壓力的差異導(dǎo)致了兩種生物進(jìn)化過程的不同。正是這種對數(shù)據(jù)的重用推進(jìn)了科學(xué)研究的進(jìn)程。

      E-Science為隱性知識的顯性化提供了更強(qiáng)大、更方便的工具,模擬和仿真技術(shù)能夠更真實(shí)、更準(zhǔn)確、更直觀的重現(xiàn)科研人員頭腦中的景象,在一定程度上解決了隱性知識難以用語言描述的問題。例如,利用多媒體、超媒體等多種形式的載體,可以更形象的表達(dá)隱性知識[5]。

      3.4 長期保存數(shù)據(jù)

      E-Science環(huán)境下數(shù)字圖書館利用先進(jìn)的技術(shù),使信息的長期保存成為可能,基于數(shù)字對象識別符DOI(Digital Object Identifier)的永久性保存與利用機(jī)制為確保網(wǎng)絡(luò)學(xué)術(shù)資源的穩(wěn)定鏈接提供了一個(gè)強(qiáng)大的工具。針對不同類型的數(shù)據(jù)進(jìn)行長期保存的研究,制定數(shù)據(jù)資源長期保存的策略,制定相應(yīng)得措施。支持開放獲取形式下的長期保存機(jī)制和網(wǎng)絡(luò)信息資源的長期保存機(jī)制。充分利用合作、聯(lián)合和公共的長期保存機(jī)制,在精細(xì)研究相應(yīng)的保存可靠性、服務(wù)可靠性、法律可靠性、經(jīng)濟(jì)效率的基礎(chǔ)上,更加經(jīng)濟(jì)地實(shí)現(xiàn)數(shù)字資源的長期保存,并對委托長期保存過程進(jìn)行管理。

      參考文獻(xiàn)

      [1]徐冠華.實(shí)施科學(xué)數(shù)據(jù)共享 增強(qiáng)國家科技競爭力[J].中國基礎(chǔ)科學(xué),2003,(1):5-9.

      [2]劉煒.DC元數(shù)據(jù)年度進(jìn)展(2007)[J].?dāng)?shù)字圖書館論壇,2007,(11):19-22.

      [3]初景利.國際一流圖書館的若干特征[J].圖書情報(bào)工作動(dòng)態(tài),2003,(3):2-6.

      [4]李彥坤,于忠,李惠安,等.網(wǎng)格計(jì)算在數(shù)字圖書館中的應(yīng)用[J].中國信息導(dǎo)報(bào),2005,(8):19-22.

      [5]張曉林.開放數(shù)字圖書館的設(shè)計(jì)和實(shí)現(xiàn):CSDL的實(shí)踐[J].情報(bào)學(xué)報(bào),2003,(10):520-525.

      枞阳县| 寿光市| 宜都市| 文安县| 天柱县| 兴仁县| 崇明县| 湟源县| 石台县| 陆川县| 西盟| 虎林市| 云浮市| 塘沽区| 福贡县| 侯马市| 赤水市| 昭平县| 浪卡子县| 日喀则市| 云阳县| 绩溪县| 高碑店市| 阿尔山市| 遵义市| 兴化市| 那坡县| 哈巴河县| 康乐县| 和田县| 改则县| 通州区| 临潭县| 和政县| 太原市| 浙江省| 简阳市| 宁化县| 平阳县| 通辽市| 井研县|