• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      淺談多媒體數(shù)據(jù)庫管理系統(tǒng)及應(yīng)用

      2010-08-23 06:15:02
      科學(xué)之友 2010年6期
      關(guān)鍵詞:全文檢索數(shù)據(jù)模型新華社

      莫 雪

      (新華通訊社廣西分社,廣西 南寧 530022)

      1 多媒體數(shù)據(jù)庫

      1.1 多媒體數(shù)據(jù)

      多媒體數(shù)據(jù)是指多種媒體,如數(shù)字、正文、圖形、圖像和聲音的有機集成。其中數(shù)字、字符等是格式化數(shù)據(jù),文本、圖形、圖像、聲音、視頻等是非格式化數(shù)據(jù)。多媒體數(shù)據(jù)的數(shù)據(jù)量十分龐大,各種數(shù)據(jù)之間的語義聯(lián)系非常復(fù)雜,表達形式多樣。

      1.2 多媒體數(shù)據(jù)庫及其數(shù)據(jù)模型

      隨著多媒體技術(shù)及其支撐技術(shù)的飛速發(fā)展,多媒體應(yīng)用領(lǐng)域越來越廣,所以,對多媒體信息進行快速高效的處理顯得非常迫切。由于多媒體數(shù)據(jù)種類繁多,傳統(tǒng)的數(shù)據(jù)庫難以對這些媒體信息進行處理和管理,因而,產(chǎn)生了一種全新的數(shù)據(jù)庫——多媒體數(shù)據(jù)庫。

      多媒體數(shù)據(jù)庫(MMDB, Multimedia Database)是一個由若干多媒體對象所構(gòu)成的集合,這些數(shù)據(jù)對象按一定的方式被組織在一起,可為其他應(yīng)用所共享。

      多媒體數(shù)據(jù)庫是能夠有效實現(xiàn)多媒體數(shù)據(jù)的存儲、讀取、檢索等功能的數(shù)據(jù)庫系統(tǒng),它繼承了傳統(tǒng)數(shù)據(jù)庫的一些優(yōu)點,并能對具有時空關(guān)系的數(shù)據(jù)進行同步和管理。

      數(shù)據(jù)模型是數(shù)據(jù)庫系統(tǒng)的核心,從總體發(fā)展上看,多媒體數(shù)據(jù)庫的數(shù)據(jù)模型可分為如下3類:①關(guān)系數(shù)據(jù)模型;②面向?qū)ο髷?shù)據(jù)模型;③擴充的關(guān)系數(shù)據(jù)模型。

      關(guān)系數(shù)據(jù)模型以關(guān)系代數(shù)作為其理論基礎(chǔ),發(fā)展至今已能夠非常完善的處理傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)。但是多媒體數(shù)據(jù)庫里包含了大量的圖形、圖像、聲音和視頻等非結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)結(jié)構(gòu)異常復(fù)雜,且大部分不能用關(guān)系模型表示。因此關(guān)系數(shù)據(jù)模型在處理這些數(shù)據(jù)時就難以適用了。

      面向?qū)ο髷?shù)據(jù)模型對非結(jié)構(gòu)化數(shù)據(jù)進行表示和操作非常方便,但是其技術(shù)沒有關(guān)系數(shù)據(jù)模型那樣成熟,理論研究和應(yīng)用開發(fā)中還有很多問題需要解決。并且需要從底層重寫代碼,開發(fā)工作量大、周期長,由于這些問題的局限,當(dāng)前使用面向?qū)ο髷?shù)據(jù)模型開發(fā)多媒體數(shù)據(jù)庫系統(tǒng)還主要應(yīng)用在大公司指定開發(fā)的專用項目上,對于一般多媒體數(shù)據(jù)庫系統(tǒng)開發(fā)項目來說,應(yīng)用面向?qū)ο髷?shù)據(jù)庫模型來進行開發(fā),從技術(shù)和經(jīng)濟條件上來講都是不適用的。

      使用擴充的關(guān)系數(shù)據(jù)模型來進行多媒體數(shù)據(jù)庫系統(tǒng)的開發(fā)是當(dāng)前最常用也是最成熟的方法。在傳統(tǒng)的關(guān)系數(shù)據(jù)模型中引入了面向?qū)ο蟮乃枷?、超文本(hypertex1)模型或超媒體方法,就解決了圖形、圖像、聲音和視頻等非結(jié)構(gòu)化數(shù)據(jù)不能用關(guān)系模型表示的問題。

      2 多媒體數(shù)據(jù)庫管理系統(tǒng)(MMDBMS)

      多媒體數(shù)據(jù)庫管理系統(tǒng) MMDBMS(MultiMedia DataBase Management System)是一個以多媒體數(shù)據(jù)庫為基礎(chǔ)的多媒體應(yīng)用。該應(yīng)用能夠完成對多媒體數(shù)據(jù)庫的各種操作及管理功能,如對MMDB的定義、創(chuàng)建、查詢、訪問、刪除等。

      2.1 MMDBMS的查詢方式

      針對多媒體應(yīng)用的靈話性,人們希望MMBBMS能提供多種方式的“模糊”查詢手段,具體描述如下:

      2.1.1 基于元數(shù)據(jù)的查詢

      元數(shù)據(jù)在這里是指數(shù)據(jù)庫條目的外在屬性,比如作者姓名、創(chuàng)建時間以及標題等。在VOD(點播視頻)應(yīng)用中,這種方式的查詢可以是:“請列出由×××在2007年出席的重要會議”這種類型的查詢可以用傳統(tǒng)的DBMS技術(shù)來實現(xiàn)。

      2.1.2 基于注釋的查詢

      注釋是指對數(shù)據(jù)庫條目內(nèi)容的文字描述。查詢時一般給出關(guān)鍵字或一些自由文本,而檢索是基于查詢與內(nèi)容注釋的相似性。這種方式的查詢實例是這樣的:“請放映一下東盟自由貿(mào)易區(qū)成立時的視頻片段?!边@種類型的查詢要求事先對所有數(shù)據(jù)庫條目都恰當(dāng)?shù)剡M行注釋,然后用傳統(tǒng)的IR技術(shù)進行處理。視頻數(shù)據(jù)、腳本和字幕均可作為注釋。

      2.1.3 基于特征的查詢

      特征是指多媒體數(shù)據(jù)的統(tǒng)計信息,如音量、顏色分布及紋理等。這種方式的查詢實例可以是這樣:“請放映一個音量分貝在××至××的視頻幀?!逼渲小痢量梢允悄硞€給定的聲音分貝分布的直方圖。處理這類查詢,傳統(tǒng)的DBMS已無能為力了,數(shù)據(jù)庫條目的有關(guān)統(tǒng)計信息必須事先收集、整理并存儲。

      2.1.4 用實例查詢

      用多媒體數(shù)據(jù)對象來進行查詢,這個對象可以是一個靜止圖像、一張草圖或一個聲音片段。這種方式的查詢實例可以是這樣的:“請放映一段視頻,其中有類似×××的場景。”這種類型的查詢中如果包含有數(shù)據(jù)對象的空間和時間關(guān)系,處理時可能會非常復(fù)雜,要支持這么多種復(fù)雜的查詢方式,多媒體數(shù)據(jù)庫引擎需要有全新的體系結(jié)構(gòu)。

      2.2 MMDBMS的體系結(jié)構(gòu)

      根據(jù)上一節(jié)描述的MMDBMS所支持的查詢方式,本文給出圖1所示的MMDBMS體系結(jié)構(gòu)。其中主要的組成都分有:

      2.2.1 用戶圖形接口

      MMDBMS的用戶接口可以通過Internet或圖形界面訪問。網(wǎng)頁登陸界面可以用Java applets來構(gòu)造。這個用戶接口支持用戶用圖形方式進行基于內(nèi)容的查詢,同時也支持傳統(tǒng)的文本方式的查詢。

      2.2.2 索引子系統(tǒng)

      索引子系統(tǒng)以多媒體數(shù)據(jù)及相關(guān)文本注釋作為輸入,通過數(shù)據(jù)分析子系統(tǒng),提取低層多媒體特征信息(如顏色、紋理、形狀等),加上一些重要的文本描述信息(如作者姓名、類屬、主題等),并將這些內(nèi)容存儲在特征數(shù)據(jù)庫中。

      2.2.3 數(shù)據(jù)分析子系統(tǒng)

      數(shù)據(jù)分析子系統(tǒng)的功能是提取重要的低層多媒體數(shù)據(jù)特征,如音量、顏色、紋理、形狀等。

      2.2.4 特征數(shù)據(jù)庫

      特征數(shù)據(jù)庫中的條目內(nèi)容包括低層特征數(shù)據(jù)及高層的文字描述數(shù)據(jù)。

      2.2.5 查詢處理器

      查詢處理器從圖形用戶界面接受查詢語言,通過特征數(shù)據(jù)庫進行計算評估,然后向用戶返回匹配最好的多媒體數(shù)據(jù)。這里所指的查詢語言必須能利用低層特征數(shù)據(jù)及文字描述來表達復(fù)雜的查詢方式,傳統(tǒng)的SQL肯定不能勝任。

      2.2.6 存儲子系統(tǒng)

      存儲子系統(tǒng)完成對文本、視頻、音頻、圖像等數(shù)據(jù)庫數(shù)據(jù)的定義、創(chuàng)建、查詢、訪問、刪除等管理功能與操作。

      圖1 MMDBMS的體系結(jié)構(gòu)圖

      3 MMDBMS在新聞媒體行業(yè)的應(yīng)用

      我所在的工作單位——新華通訊社,作為國內(nèi)最權(quán)威的新聞媒體單位、黨和人民的耳目喉舌和國家、世界性的通訊社,每天都擔(dān)負著采集、發(fā)布、管理各類多媒體新聞數(shù)據(jù)信息的重大任務(wù)。新華社采集的信息包含文字、圖片、聲音、視頻等多種媒體數(shù)據(jù),涉及政治、外交、經(jīng)濟、文教、科技、法律等各個領(lǐng)域,并具有信息量大、權(quán)威、準確、及時、豐富等特點。

      新華社多媒體數(shù)據(jù)庫始建于1999年,采用TRS全文檢索的核心技術(shù),2002年,TRS公司與新華社技術(shù)局再次合作實施了新華社多媒體數(shù)據(jù)庫英文檢索引擎的提速改造,提速后的系統(tǒng)對于多媒體數(shù)據(jù)庫的全文檢索能夠達到3 s~5 s左右響應(yīng)。目前,多媒體數(shù)據(jù)庫中已經(jīng)存儲了數(shù)千萬條多媒體信息,數(shù)據(jù)容量接近8 T,內(nèi)容涵蓋中、英、法、西、阿、俄等九大主流語種,以文字信息為主,包含圖片、圖表和音視頻信息能,真正實現(xiàn)多媒體互動、數(shù)據(jù)準確、傳輸高效、檢索便捷。

      新華社多媒體數(shù)據(jù)庫底層采用TRS和Oracle協(xié)同工作的解決方式,由TRS完成千萬級數(shù)據(jù)的索引檢索服務(wù),由Oracle 完成信息制作流程,檢索方式分為本地聯(lián)機檢索和遠程網(wǎng)絡(luò)檢索兩種方式,可進行精確檢索、模糊檢索、全文檢索、對各檢索入口項實行任意聯(lián)合組配檢索;可實現(xiàn)多級檢索,逐級細化檢索條件,直至命中滿意的檢索結(jié)果;能夠?qū)z索結(jié)果排序;提供中英文全文檢索功能,中文按詞進行全文檢索,具有智能詞庫機制;對圖片可按分類號、作者、拍攝時間、拍攝地點、照片文字說明等項檢索,其中文字說明項可實現(xiàn)中文按詞全文檢索,支持邏輯庫功能,支持跨庫檢索,支持文字資料和圖片資料的系統(tǒng)鏈接。

      新華社多媒體數(shù)據(jù)庫作為新華社核心存儲的地位也在不斷加強,從以前分散的存儲逐步向統(tǒng)一存儲、統(tǒng)一管理、統(tǒng)一服務(wù)方向發(fā)展。在這個過程中,新建設(shè)的其他應(yīng)用系統(tǒng)中,TRS也積極的參與了廣泛的應(yīng)用研究,并在很多系統(tǒng)中直接集成了TRS全文檢索的核心功能,以保證數(shù)據(jù)的檢索性能和統(tǒng)一數(shù)據(jù)的要求。

      新華社的多媒體數(shù)據(jù)庫管理分內(nèi)外兩個庫?!皟?nèi)庫”,即待編稿庫,與各分社的地方子庫連接,新華社所有記者采集的稿件、素材都要進入待編稿庫。我們從國內(nèi)外搜集到的有價值的圖片資源、歷史資料、網(wǎng)上和外報外刊的新聞信息、音視頻資料等數(shù)據(jù)資源,也要分類、整理入庫,并以待編稿庫為依托建立起全社統(tǒng)一的采編平臺,使文字、圖片、圖表、音頻、視頻新聞信息可在同一界面上顯示、編輯、互動,供各編輯部和所有編輯選擇、編輯、加工和利用;“外庫”,即成品稿庫,新華社所有新聞信息產(chǎn)品都要進入成品稿庫,并以成品稿庫為依托建立起全社統(tǒng)一的營銷平臺,通過分社營銷平臺與用戶連接,供廣大用戶選擇、采用,成為新華社新聞信息產(chǎn)品營銷的總出口。記者采寫、搜集的新聞信息素材要源源不斷地進入待編稿庫,經(jīng)過編輯部門的編輯、加工變成產(chǎn)品后源源不斷地進入成品稿庫,再經(jīng)過營銷人員的工作將數(shù)據(jù)庫新聞信息產(chǎn)品源源不斷地進入市場,提供給用戶;同時,及時反饋用戶意見,采編人員再根據(jù)用戶意見不斷改進,提高多媒體數(shù)據(jù)庫各類新聞信息產(chǎn)品的質(zhì)量。

      1 馬新娜、樊金生.嵌入式實時數(shù)據(jù)庫系統(tǒng)的研究與設(shè)計[J].微計算機信息,2006(8):3~4

      2 馮玉才.多媒體數(shù)據(jù)庫研究動態(tài)[J].計算機世界報,1997(3):12~13

      3 鐘玉、蔡蓮紅.多媒體計算機基礎(chǔ)及應(yīng)用[M].北京:高等教育出版社,1999

      4 王森、肖健宇.MODB的對象數(shù)據(jù)模型[C].全國第五屆多媒體學(xué)術(shù)年會論文集,1996.9:1~5

      5 王森、肖健宇.多媒體MIS對MDBMS的功能需求及OODBMS對多媒體MIS的支持[J].計算機工程與應(yīng)用,1997.33(10):5l~54

      6 張彬.與時俱進 實現(xiàn)新聞信息服務(wù)模式創(chuàng)新[J].新聞業(yè)務(wù)研究,2002(2):15~16

      猜你喜歡
      全文檢索數(shù)據(jù)模型新華社
      再創(chuàng)新高
      視界
      遵義(2019年20期)2019-10-24 01:41:32
      應(yīng)用“8K+5G”技術(shù)創(chuàng)新國慶閱兵報道——新華社的實踐與思考
      傳媒評論(2019年10期)2019-06-05 09:25:46
      面板數(shù)據(jù)模型截面相關(guān)檢驗方法綜述
      加熱爐爐內(nèi)跟蹤數(shù)據(jù)模型優(yōu)化
      電子測試(2017年12期)2017-12-18 06:35:36
      “剛剛體”走紅,新華社“小編”如何專業(yè)賣萌
      傳媒評論(2017年7期)2017-11-08 03:10:56
      Oracle數(shù)據(jù)庫全文檢索性能研究
      基于KySou的全文檢索系統(tǒng)的分析與優(yōu)化
      特色數(shù)據(jù)庫全文檢索系統(tǒng)的設(shè)計
      面向集成管理的出版原圖數(shù)據(jù)模型
      青州市| 布尔津县| 芜湖市| 乌兰县| 敦化市| 灵武市| 和田县| 平顺县| 松原市| 浙江省| 泰和县| 威海市| 嵊泗县| 龙山县| 灌阳县| 达州市| 高青县| 栾川县| 忻城县| 蕲春县| 株洲市| 潍坊市| 山西省| 富宁县| 贺州市| 诏安县| 石家庄市| 张掖市| 广安市| 金门县| 武胜县| 道真| 安图县| 阳朔县| 黑龙江省| 耒阳市| 巢湖市| 嘉黎县| 诸城市| 石首市| 屏东县|