劉俊宇
(中國傳媒大學,北京 100024)
在國家三網融合政策與迅猛發(fā)展的 IP 互動技術的共同推動下,廣電新媒體公司、廣電網絡運營商、電信運營商、互聯(lián)網視頻公司紛紛加大資源投入,積極開展 IPTV、互動電視、互聯(lián)網電視等各種新媒體業(yè)務的運營與探索,搶占全媒體運營制高點,使新媒體行業(yè)呈現(xiàn)出前所未有的強勁發(fā)展勢頭。新媒體的發(fā)展已經經歷了很長時間,其主要包括網頁、博客、播客、手機、各種門戶網站、網站論壇、網絡電視、IPTV 等等,其內容形式的展現(xiàn)也由傳統(tǒng)的音視頻和紙張向網頁瀏覽器、終端設備等方向變化,其內容的采集方式更是擺脫了傳統(tǒng)的采訪、攝像等手段,如手機拍攝、作者自己制作的作品和編寫的文字,所以現(xiàn)在幾乎人人都是新媒體的參與者,在表現(xiàn)內容上也包含了傳統(tǒng)的音視頻,并且有了像網頁互動、圖片、FLASH 動畫等等可以在互聯(lián)網上迅速傳輸?shù)膬热?。總的來說,由于內容形式的復雜零亂,新媒體在資源管理方面的難度并不比傳統(tǒng)媒體小,對于新媒體來說,需要一種可靠、高效的資源管理手段,因此研究新媒體內容用元數(shù)據(jù)進行標識的方法,建立新媒體內容元數(shù)據(jù)使用規(guī)范,實現(xiàn)元數(shù)據(jù)和內容的交換,從而保證基礎支撐平臺以最簡單的方式,與多個可能出現(xiàn)的異構業(yè)務系統(tǒng)進行良好的業(yè)務信息與內容包交互,就顯得愈發(fā)重要[1]。
另外,隨著計算機網絡技術的不斷發(fā)展,網絡資源越來越受到人們的重視,它對視聽新媒體的發(fā)展的影響也日漸凸現(xiàn),其中最重要的一個標志是對視頻音頻網站的信息資源檢索的影響。視聽新媒體是基于網絡發(fā)展起來的,與傳統(tǒng)媒體相比有其獨有的特征,比如信息來源更豐富,信息容量更大。面對如此龐大的信息資源,如何進行高效的管理,從而方便用戶對所需資源進行準確無誤的選擇,是網絡視聽新媒體面臨的緊迫的問題。為了解決這一迫在眉睫的問題,各個視頻網站服務廠商采用不同的元數(shù)據(jù)分類方式對自己的視頻音頻信息資源進行組織管理,同時對于相同的視頻音頻信息資源不同的視頻網站采用的元數(shù)據(jù)定義也不盡相同,這樣用戶在不同的視頻網站檢索信息的效率也會大大不同,同樣地,不同的視頻網站進行信息資源共享和對各自的視頻音頻信息資源進行互操作的難度就會大大增加,所以制定適合于視聽新媒體的內容元數(shù)據(jù)的統(tǒng)一標準將更加方便于用戶的檢索和各視頻網站服務廠商之間進行資源的共享與互操作。
傳統(tǒng)的廣播電視視頻點播系統(tǒng)元數(shù)據(jù)是專門針對廣播電視內容的,分為消息層元數(shù)據(jù)和內容層元數(shù)據(jù);內容層元數(shù)據(jù)又分為內容對象信息和內容實體信息;內容對像元數(shù)據(jù)分為內容對像基本信息元素以及內容對象特性信息如視頻特性信息、音頻特性信息、直播流特性信息;內容實體元數(shù)據(jù)包含內容實體屬性描述、內容實體基本信息、內容實體版權信息、視頻內容實體信息、音頻內容實體信息、圖像內容實體信息、直播流內容實體信息和內容實體字段等九級編目,不僅結構比較復雜,而且有其特定的應用場景。所以制定屬于互聯(lián)網視聽新媒體內容的元數(shù)據(jù)分類方式,也會便于用戶對所需視頻音頻信息資源的檢索,特定的元數(shù)據(jù)標簽如時間/年代、地區(qū)/國家也會有利于視頻音頻資源檢索與存儲。
元數(shù)據(jù)的通常定義為:關于數(shù)據(jù)的數(shù)據(jù)(data about data)。它與傳統(tǒng)圖書館編目標準的不同之處在于:它除了具有描述功能外,還具有控制、管理信息資源的能力。元數(shù)據(jù)適用于描述任何網絡數(shù)據(jù)和資源,促進網絡信息資源的組織和信息的獲取,它是用來標識、描述和定位網絡電子資源的數(shù)據(jù)。其描述對象主要是網絡環(huán)境下的電子資源,它是關于最廣泛意義上的數(shù)據(jù),包括數(shù)據(jù)集、文本信息、圖像、音樂和其它任何電子化事物的數(shù)據(jù)信息。依據(jù)其功能可分為:描述型元數(shù)據(jù)、管理型元數(shù)據(jù)、保存型元數(shù)據(jù)、技術型元數(shù)據(jù)以及使用型元數(shù)據(jù)[2]。
都柏林核心元素集(Dublin Core Element Set),簡稱為都柏林核心元數(shù)據(jù)(DC),具有結構簡單、語意互通和可擴展性特點,所以使用廣泛,同樣也被視聽新媒體行業(yè)所使用。它由15個數(shù)據(jù)單元(element)組成,其中包括:
1.內容7個元素:題名(Title)、主題詞和關鍵詞(Subject)、內容描述(Description)、資源(Source)、類型(Type)、關系(Relation)、范圍(Coverage)
2.知識產權4個元素:作者或創(chuàng)造者(Creator)、出版者(Publisher)、其他責任者(Contributor)、權限管理(Rights)
3.例示4個元素:日期(Data)、格式(Format)、資源標識(Identifier)、語言(Language)
在實際應用中,DC的十五個基本元素的描述能力是有限的,因而必須加以限定和進行若干子元素的規(guī)范描述。為了保證互操作性,在進行限定或子元素規(guī)范的時候,不能改變元素本身的定義,不能重新對基本元素作出解釋,而只能根據(jù)自己團體和行業(yè)的需要對DC元素進行限定和規(guī)范[3]。
最初Dublin Core應用目的是為了網絡資源的著錄與挖掘,由于DC元素簡單易用,加之OCLC的大力推廣和網絡資源著錄的巨大需求,DC發(fā)展為可用于任何媒體。
面對收藏量日益豐富的視頻、音頻資源和用戶需求的多樣化,收藏機構必須采取有效的方法來組織和管理視頻、音頻信息資源,以滿足用戶的多層次的需求,使視頻、音頻信息資源真正成為收藏機構的資產,充分發(fā)揮價值。視頻、音頻元數(shù)據(jù)提供了一扇進入視頻、音頻信息資源的窗戶。目前,我國互聯(lián)網視聽新媒體所使用的元數(shù)據(jù)分類也是在都柏林核心(DC)元數(shù)據(jù)作為信息資源描述格式的基礎上形成的,主要目的是方便檢索、儲存以及交換。其中包括優(yōu)酷、土豆等視頻網站的在線分類方式,NGB的元數(shù)據(jù)分類方式以及用戶默認的點擊率高的分類方式等。
目前國內的一些視頻音頻網站管理其信息所使用的元數(shù)據(jù)描述方式都是基于DC而發(fā)展起來的,除了使用DC原有的15個基本元素描述之外,還加入了都某些子元素的限定和規(guī)范。
視聽新媒體元數(shù)據(jù)分為通用標簽組和專用標簽組(用于節(jié)目買賣和交換)采用的封裝方式為XML封裝,具體參照GB/T24639-2009元數(shù)據(jù)的XML Schema置標規(guī)則。而對于原有廣播電視元數(shù)據(jù)封裝數(shù)據(jù)的情況,整體封裝后保存在新元數(shù)據(jù)文件里[4]。
以下的元數(shù)據(jù)元素表是通過對國內的一些視頻音頻網站(包括土豆、優(yōu)酷、愛奇藝、迅雷、新浪、veryCD、風行等一系列網站)的元數(shù)據(jù)標識方式的研究進行歸納總結得出來的,具體內容如下表:
視頻音頻元數(shù)據(jù)元素表
續(xù)表
續(xù)表
元數(shù)據(jù)在視聽新媒體資源檢索中的主要功能為側重于對信息資源的描述、整合、控制、組織和檢索,這與現(xiàn)行的用于廣播電視資源檢索的元數(shù)據(jù)相比架構簡單,將大大提高檢索效率。而且有特定的元數(shù)據(jù)標簽如“年代”和“地區(qū)”等,這有助于對視頻音頻資源很好的描述、存儲和檢索,同時統(tǒng)一的元數(shù)據(jù)分類方式也會有助于各個視頻音頻網站對各自的視頻音頻資源進行有效的共享與互操作。
總之,這種視聽新媒體元數(shù)據(jù)的分類方式將為用戶以及工作人員提供一種更高效、準確的信息資源組織與檢索手段。
[1]章菊廣,李艷志,王曉東. 三網融合環(huán)境下數(shù)字內容服務元數(shù)據(jù)規(guī)范研究[J]. 網絡新媒體技術,2012( 01) :10 -17.
[2]張曉林.管理元數(shù)據(jù)的原理與應用[J].圖書情報工作.2003(10):12- 17.
[3]劉嘉.元數(shù)據(jù)導論[M].北京:華藝出版社,2002.
[4]何峰.下一代廣播電視網(NGB)視頻點播系統(tǒng)元數(shù)據(jù)規(guī)范[J].廣播與電視技術,2012.
[5]王汝言,代琦,吳大鵬.中國下一代廣播電視網[J].重慶郵電大學光互聯(lián)網及無線信息網絡研究中心.