在幾次會議中, 大家都提到由于數(shù)字出版物的文本格式的不統(tǒng)一,導致讀者在閱讀不同公司的數(shù)字出版物的時候,要購買支持不同出版物格式的閱讀器或下載不同的閱讀器軟件,這給讀者造成了很大不便,同時也阻礙了我國數(shù)字出版的健康發(fā)展。為此,筆者專門對這一問題進行了調(diào)研,并對調(diào)研情況進行了初步的分析。
我國數(shù)字出版物格式標準現(xiàn)狀
目前,國際上使用最廣泛的數(shù)字出版物的格式是Adobe公司的PDF格式,專用閱讀工具是Adobe Acrobat Reader軟件。在我國,除了使用PDF格式外,還有一些比較常用的數(shù)字出版格式,如方正阿帕比公司的CEB電子圖書格式、清華同方公司的CAJ電子期刊格式、超星公司的PDG電子書格式、書生公司的SEP格式、華康公司的WDL電子書格式等。
目前我國市場上存在的多種數(shù)字出版的文本格式彼此各不兼容。顯然,格式的多樣影響了數(shù)字出版的發(fā)展,從而使人們過分依賴于閱讀器。而無論是何種出版,其主要任務是提供內(nèi)容,而非開發(fā)閱讀器,后者充其量只是數(shù)字出版的一項附屬內(nèi)容。統(tǒng)一數(shù)字出版的文本格式亦即標準問題逐漸提上了日程。
格式標準化過程中存在的問題
當前,實力雄厚的大公司擔心數(shù)字出版物格式標準的制定,會影響其市場地位,而沒有研發(fā)數(shù)字出版物格式技術的公司,如萬方數(shù)據(jù)公司等卻歡迎數(shù)字出版物格式的統(tǒng)一。其中最主要原因是實力雄厚的大公司依靠自己的技術優(yōu)勢研發(fā)了自己的一套數(shù)字出版物格式,并以此作為占領市場的手段之一。方正阿帕比公司科研人員認為CEB電子書格式是他們花費大量心血研發(fā)的具有知識產(chǎn)權的成果,不愿意開放其技術。依靠排版技術優(yōu)勢,方正阿帕比公司在與出版社合作出版電子書方面占有較大的市場。該格式的主要特點是高保真性,相對于其他電子書格式,CEB電子書格式確實在顯示效果等方面具有一定的優(yōu)勢。
清華同方公司也存在這樣的問題,他們認為電子書的格式一旦重新建立一套新的標準,將意味著不僅他們在出版物格式研發(fā)方面和維護方面的投資將付之東流,而且將面臨新的投資。目前該公司在此方面的投資每年大概需要100~200萬元, 以10年累計已投資1000~2000萬元人民幣。而且目前中國市場幾大技術提供商分割市場的格局有可能被打破,他們的地位將受到挑戰(zhàn)。他們認為這將影響具有技術優(yōu)勢企業(yè)的創(chuàng)新精神。
此外,版權問題也是影響電子書格式統(tǒng)一的因素之一,這些企業(yè)擔心一旦數(shù)字出版物格式統(tǒng)一了,他們的版權將得不到相應的保護。由此可見,數(shù)字出版物格式標準制定的關鍵的問題在于如何協(xié)調(diào)各公司的利益。
國外數(shù)字出版物格式標準化之路
在國外,也存在由于數(shù)字出版物格式不同,用戶需要使用不同閱讀器或下載不同閱讀器軟件的問題。那么國外是怎樣解決這個問題的呢?
在歐美國家,電子書的發(fā)展正在逐步走向規(guī)范化。在電子書統(tǒng)一標準方面,雖然目前尚沒有能夠形成統(tǒng)一的格式,但OEB的建立為格式統(tǒng)一提供了可能。該標準是一個開放的、公共的、基于XML的數(shù)字出版內(nèi)容格式規(guī)范。目的是給內(nèi)容提供商(如出版商和作者等)和技術提供商提供最簡單和最通用的指南,以便數(shù)字內(nèi)容通過多種閱讀系統(tǒng)能真實、準確和方便地表達出來。目前該標準已經(jīng)得到了一些軟件公司如索尼公司、Adobe公司以及閱讀設備廠商的支持。雖然該標準目的是要統(tǒng)一數(shù)字出版物的文件格式,讓作者、出版商所生成的數(shù)字出版物文檔在所有的數(shù)字出版物閱讀器上都可以正確顯示,但目前該標準還是寬泛的數(shù)字出版物格式的規(guī)范,還沒有實現(xiàn)對數(shù)字出版物格式進行真正的統(tǒng)一。
在韓國,使用最廣泛的電子書格式是Adobe公司的PDF格式以及Adobe Acrobat 閱讀器。但考慮該格式一經(jīng)制作就不能修改,且該格式是Adobe公司的獨家格式,不容易擴展,所以韓國將基于XML的EBKS(即KSX6100)的電子書格式定為國家標準,主要是考慮其兼容性、公開性、應用性以及可擴展性,此外該格式還可以對文件進行結(jié)構調(diào)整, 具有獨立的平臺。該韓國國家標準也是一個寬泛的電子書格式規(guī)范,還不能達到完全統(tǒng)一電子書格式和閱讀器的問題。
在我國,電子書的格式標準問題引起了出版機構、圖書館、數(shù)字出版技術提供商、信息產(chǎn)業(yè)部和新聞出版總署等機構的廣泛關注。2007年以書生公司牽頭的行業(yè)標準項目——非結(jié)構化操作標記語言第一部分:文檔操作接口規(guī)范正式在信息產(chǎn)業(yè)部立項,目前該標準已經(jīng)完成報批稿。該項目通過各技術提供商按照該文檔操作結(jié)構標準,在各自的閱讀軟件上建立一個開放接口,讀者便可以實現(xiàn)對不同格式的數(shù)字出版物的閱讀。