陳正峰
(中國航空綜合技術(shù)研究所,北京 100028)
基于S 1000D的IETM閱讀器設(shè)計(jì)與實(shí)現(xiàn)
陳正峰
(中國航空綜合技術(shù)研究所,北京 100028)
對某型裝備交互式電子手冊閱讀器系統(tǒng)進(jìn)行了分析、設(shè)計(jì)和實(shí)現(xiàn),為裝備交互式電子手冊的開發(fā)交付積累了經(jīng)驗(yàn),對推進(jìn)裝備維修信息化建設(shè)具有重大推進(jìn)作用。
S1000D;IETM;閱讀器
交互式電子手冊(IETM),是近年來為解決產(chǎn)品基層級維修孕育而生的一種電子交付物,它利用計(jì)算機(jī)多媒體、數(shù)據(jù)庫和網(wǎng)絡(luò)等技術(shù),將內(nèi)容繁雜的操作手冊、維修手冊等信息有機(jī)組織管理起來,以最優(yōu)化的方式將文字、表格、圖像、工程圖形、聲音、視頻、動畫等多種信息形式進(jìn)行展示,并以交互的方式進(jìn)行查詢,將維修技術(shù)人員或系統(tǒng)操作人員所需的信息,精確地展現(xiàn)在使用者面前。
IETM手冊集成了產(chǎn)品功能、性能、組成、原理、操作使用、維護(hù)保養(yǎng)、故障維修、備件供應(yīng)等多方面的內(nèi)容,作為一種先進(jìn)的裝備技術(shù)保障輔助手段,通過交互方式為使用人員提供詳盡的技術(shù)信息支持,顯著提高裝備的維修保障能力[1]。
1 S1000D簡介
ASD S1000D《基于公共源數(shù)據(jù)庫的技術(shù)出版物國際規(guī)范》(以下簡稱S1000D)是歐洲航天和國防工業(yè)協(xié)會(ASD)發(fā)布的一個(gè)關(guān)于技術(shù)資料數(shù)字化的規(guī)范,包括技術(shù)資料數(shù)據(jù)的組織生成、格式要求、管理更新、發(fā)布程序等方面的內(nèi)容[2]。
S1000D提出了兩個(gè)核心概念,用來保證IETM信息共享與交換,這兩個(gè)核心概念是數(shù)據(jù)模塊(DM)和公共源數(shù)據(jù)庫(Common Source Database)。數(shù)據(jù)模塊是S1000D中的一個(gè)核心概念,數(shù)據(jù)模塊是一個(gè)自我包含、包含裝備一部分信息的數(shù)據(jù)單元,由標(biāo)識狀態(tài)段(IDStatus)和內(nèi)容(Content)兩部分組成。公共源數(shù)據(jù)庫用于信息管理,用來創(chuàng)建技術(shù)文檔,可以用它對任何軍用或民用的裝備制作IETM。S1000D采用了多項(xiàng)ISO國際規(guī)范持續(xù)采辦和全壽命支持(CALS)以及萬維網(wǎng)聯(lián)盟(W3C)規(guī)范,支持規(guī)范廣義標(biāo)記語言(SGML)、可擴(kuò)展標(biāo)記語言(XML)和計(jì)算機(jī)圖元文件(CGM)。
IETM閱讀器選用基于ASP.NET和SQL Server的解決方案,采用B/S架構(gòu)、基于ADO.NET實(shí)體數(shù)據(jù)訪問技術(shù),用面向?qū)ο驝#語言進(jìn)行開發(fā)。
S1000D從布局、顯示樣式、對話框、警告、注意、注、鏈接、表格、插圖等方面對閱讀系統(tǒng)進(jìn)行了規(guī)范,標(biāo)準(zhǔn)同時(shí)在鏈接、導(dǎo)航、注釋等方面對IETM閱讀系統(tǒng)提出了用戶交互相關(guān)要求。
基于S1000D的閱讀器的數(shù)據(jù)來源于DDN數(shù)據(jù)包,DDN數(shù)據(jù)包中包括出版物手冊(PM)、數(shù)據(jù)模塊(DM)和插圖(ICN)等文件內(nèi)容,其中PM、DM為XML文件,ICN為圖片二進(jìn)制文件。技術(shù)出版物手冊使用PM的形式組織,通過定義PM的結(jié)構(gòu)和層級內(nèi)容,引用DM和下級層級節(jié)點(diǎn),組織手冊章節(jié)內(nèi)容。在手冊中,DM是最小的內(nèi)容組成部分,包括文字、插圖、表格、鏈接等內(nèi)容。
通過導(dǎo)入DDN數(shù)據(jù)包,將手冊、DM、插圖等內(nèi)容導(dǎo)入到閱讀器數(shù)據(jù)庫。用戶通過手冊結(jié)構(gòu)樹或SNS結(jié)構(gòu)樹導(dǎo)航定位并打開相應(yīng)的數(shù)據(jù)模塊DM,根據(jù)S1000D對手冊內(nèi)容展現(xiàn)的樣式和功能要求,需要把DM內(nèi)容從XML字符串轉(zhuǎn)成HTML格式,以網(wǎng)頁方式將手冊資料展現(xiàn)給用戶。為了使轉(zhuǎn)換后的HTML頁面具備交互能力,根據(jù)S1000D對鏈接、插圖、熱點(diǎn)導(dǎo)航等內(nèi)容的交互要求,從DM轉(zhuǎn)成的網(wǎng)頁時(shí),把DM中的數(shù)據(jù)模塊引用、插圖引用、內(nèi)部鏈接等轉(zhuǎn)化成網(wǎng)頁中的超鏈接,并實(shí)現(xiàn)超鏈接的目標(biāo)內(nèi)容,當(dāng)用戶在閱讀資料時(shí),可以點(diǎn)擊鏈接打開引用的數(shù)據(jù)模塊、插圖、熱點(diǎn)等內(nèi)容。
IETM閱讀器包括手冊數(shù)據(jù)包管理、手冊閱讀兩大塊,這兩類操作的用戶群體不一樣,為了便于手冊版本升級,確保手冊使用人員所閱讀的手冊內(nèi)容版本一致,閱讀器采用了B/S架構(gòu)的網(wǎng)絡(luò)協(xié)作工作平臺,其物理架構(gòu)見圖1。
根據(jù)圖1所示,閱讀器系統(tǒng)部署在IIS服務(wù)器上,數(shù)據(jù)庫部署在數(shù)據(jù)庫服務(wù)器上。在閱讀器中,使用全文檢索服務(wù)進(jìn)行查找資料,為了獲取最佳響應(yīng)速度和足夠的磁盤空間,全文索引服務(wù)單獨(dú)部署在一臺專用服務(wù)器上,以便有足夠的磁盤空間用于保存手冊資料。
閱讀器系統(tǒng)采用B/S架構(gòu)比C/S架構(gòu)的優(yōu)勢體現(xiàn)在系統(tǒng)升級、客戶端部署、用戶使用等方面,不論是系統(tǒng)部署還是系統(tǒng)新版本升級,只需要在IIS應(yīng)用服務(wù)器上更新部署系統(tǒng)即可,使用用戶只需在客戶端使用IE瀏覽器進(jìn)入閱讀器系統(tǒng)。
系統(tǒng)管理人員同樣是通過IE瀏覽器打開并進(jìn)入系統(tǒng)管理端,導(dǎo)入閱讀器手冊數(shù)據(jù)包,導(dǎo)入后手冊數(shù)據(jù)分別保存在數(shù)據(jù)庫服務(wù)器、全文索引服務(wù)器中,管理員再將手冊授權(quán)給有權(quán)打開使用的用戶,從而實(shí)現(xiàn)手冊授權(quán)訪問。當(dāng)手冊使用用戶進(jìn)入閱讀器后,打開有權(quán)查閱的手冊,查看手冊資料、插圖,同時(shí)可以在手冊之間進(jìn)行內(nèi)容鏈接跳轉(zhuǎn)、熱點(diǎn)導(dǎo)航跳轉(zhuǎn)、圖形化故障排故等操作。
IETM 閱讀器是一個(gè)以S1000D 4.0數(shù)據(jù)包為數(shù)據(jù)源,利用先進(jìn)的信息、網(wǎng)絡(luò)以及計(jì)算機(jī)技術(shù),實(shí)現(xiàn)裝備IETM 電子手冊分派、管理、查看閱讀訪問的集成化軟件系統(tǒng),它以提高IETM 資料準(zhǔn)確性和資料查找效率為目的,功能架構(gòu)如圖2所示。
從圖2中可以看出,整個(gè)模型從上到下分為用戶界面層、業(yè)務(wù)邏輯層、數(shù)據(jù)訪問層和服務(wù)端,為了保證系統(tǒng)的穩(wěn)定運(yùn)作,提高服務(wù)端的運(yùn)行性能,服務(wù)端可分成數(shù)據(jù)庫服務(wù)器、WEB服務(wù)器、文件服務(wù)器3部分。
手冊結(jié)構(gòu)樹(見圖3)中包括兩類節(jié)點(diǎn),一類是目錄節(jié)點(diǎn),一類是數(shù)據(jù)模塊內(nèi)容節(jié)點(diǎn)。用戶打開手冊后,系統(tǒng)加載手冊的結(jié)構(gòu)樹,用戶可以通過導(dǎo)航按鈕在手冊結(jié)構(gòu)樹上切換選中的節(jié)點(diǎn),也可以在通過單擊手冊結(jié)構(gòu)樹中的節(jié)點(diǎn)選中并打開手冊資料。
SNS結(jié)構(gòu)樹(見圖4)是一種層級結(jié)構(gòu)樹,默認(rèn)加載裝備的完整SNS結(jié)構(gòu)樹數(shù)據(jù),用戶可以通過SNS編碼過濾,將符合條件的SNS顯示在結(jié)構(gòu)樹上。在SNS結(jié)構(gòu)樹中,數(shù)據(jù)模塊將掛在結(jié)構(gòu)樹的SNS節(jié)點(diǎn)下,用戶可通過點(diǎn)擊數(shù)據(jù)模塊節(jié)點(diǎn),打開相應(yīng)的數(shù)據(jù)模塊網(wǎng)面。
用戶在手冊結(jié)構(gòu)樹或SNS結(jié)構(gòu)樹上點(diǎn)擊數(shù)據(jù)模塊節(jié)點(diǎn),系統(tǒng)將數(shù)據(jù)模塊XML內(nèi)容按設(shè)定的樣式轉(zhuǎn)換成網(wǎng)頁顯示在內(nèi)容展現(xiàn)區(qū)域,并根據(jù)當(dāng)前操作用戶所設(shè)置的適用性過濾條件去除不符合適用性條件的數(shù)據(jù)。用戶可以在內(nèi)容頁面中添加書簽、備注等內(nèi)容,還可查看數(shù)據(jù)模塊元數(shù)據(jù)、相關(guān)引用、表格和插圖等內(nèi)容。通過頁面內(nèi)容中的鏈接,用戶可以打開其它數(shù)據(jù)模塊或定位到文檔中的某個(gè)指定位置(見圖5)。
可以在插圖預(yù)覽界面通過前圖、后圖功能切換當(dāng)前數(shù)據(jù)模塊文檔中的前后圖,也可通過分離窗口在新的窗口中顯示插圖,對于有熱點(diǎn)的CGM圖片,可以點(diǎn)擊文檔中通過文字鏈接高亮圖片中的熱點(diǎn)(見圖6)。
通過全文檢索功能模塊用戶可以根據(jù)關(guān)鍵詞在指定的手冊中查找數(shù)據(jù)模塊資料數(shù)據(jù),在查找出的結(jié)果中,將關(guān)鍵詞命中率高的記錄行顯示在列表最前面,顯示出抽取的部分內(nèi)容,并在顯示的內(nèi)容中將關(guān)鍵詞高亮顯示(見圖7)。
基于S1000D4.0 發(fā)布手冊數(shù)據(jù)包括兩部分:XML數(shù)據(jù)文件、圖片等多媒體資源文件,其中前者是結(jié)構(gòu)化數(shù)據(jù),后者為非結(jié)構(gòu)化數(shù)據(jù)。對于結(jié)構(gòu)化XML數(shù)據(jù),我們可以壓縮成二進(jìn)制數(shù)據(jù)保存到Sql Server數(shù)據(jù)庫中,但對于非結(jié)構(gòu)化數(shù)據(jù)文件則上傳到文件服務(wù)器,保存到文件服務(wù)器上。
對于CGM圖片,為了實(shí)現(xiàn)CGM圖片與手冊資料內(nèi)容之間的導(dǎo)航,需要將CGM圖片中的熱點(diǎn)數(shù)據(jù)讀出來并保存到Sql Server數(shù)據(jù)庫表中,在熱點(diǎn)導(dǎo)航中,可根據(jù)熱點(diǎn)APSName的值,實(shí)現(xiàn)通過文字高亮CGM圖上熱點(diǎn)、通過點(diǎn)擊CGM圖上熱點(diǎn)定位到資料文本內(nèi)容的雙向?qū)Ш健?/p>
為了方便用戶閱讀,閱讀器中使用兩種導(dǎo)航樹:手冊結(jié)構(gòu)樹和SNS結(jié)構(gòu)樹。手冊結(jié)構(gòu)樹是根據(jù)出版物模塊PM數(shù)據(jù)組成結(jié)構(gòu)特點(diǎn),解析PM的嵌套層級結(jié)構(gòu)作為手冊的目錄結(jié)構(gòu),手冊目錄結(jié)構(gòu)包括手冊節(jié)點(diǎn)、手冊目錄節(jié)點(diǎn)、數(shù)據(jù)模塊DM節(jié)點(diǎn)。SNS結(jié)構(gòu)樹則來自于IETM內(nèi)容編制平臺上的SNS結(jié)構(gòu)樹數(shù)據(jù)。通常用戶打開手冊后,加載的是手冊目錄樹,通過手冊目錄打開相應(yīng)的數(shù)據(jù)模塊資料。
在系統(tǒng)中,手冊數(shù)據(jù)包中包含的數(shù)據(jù)模塊是以XML字符串形式保存到數(shù)據(jù)庫服務(wù)器上,該XML字符串符合S1000D4.0 Schema要求,分別包括IDStatus和Content兩部分,對于大多數(shù)普通手冊用戶對S1000D不熟,無法讀懂這些XML字符所代表的意思,因此,需要將數(shù)據(jù)模塊的XML內(nèi)容轉(zhuǎn)換成可供普通用戶閱讀的數(shù)據(jù)格式。
閱讀器數(shù)據(jù)模塊XML內(nèi)容翻譯器實(shí)現(xiàn)了將XML字符串轉(zhuǎn)化成網(wǎng)頁HTML的功能,將數(shù)據(jù)模塊對應(yīng)的內(nèi)容轉(zhuǎn)變?yōu)橐跃W(wǎng)頁形式展現(xiàn)給普通用戶,同時(shí)提供網(wǎng)頁頁面內(nèi)容交互功能(如鏈接跳轉(zhuǎn)、插圖展現(xiàn)等)。
數(shù)據(jù)模塊X M L內(nèi)容字符串完全符合S1000D4.0Schema,因此可以通過編寫程序?qū)ML內(nèi)容中的S1000D4.0元素標(biāo)簽轉(zhuǎn)成Html元素標(biāo)簽,即可將一份XML字符串轉(zhuǎn)成Html元素組成的字符串。轉(zhuǎn)換Html內(nèi)容的方法包括直接將XML元素改名成Html元素(如數(shù)據(jù)模塊中的元素)、將XML中的某元素翻譯成一段網(wǎng)頁字符串(如比 傳統(tǒng)的故障隔離采用分步操作、回答問題以及跳轉(zhuǎn)等方式,引導(dǎo)用戶一步步完成故障診斷,這種方式最大的問題在于無法向用戶展現(xiàn)故障隔離操作的全貌,另外用戶也不能跳過不想執(zhí)行的操作環(huán)節(jié)。IETM閱讀器有效地解決了這些問題,根據(jù)操作步驟間的跳轉(zhuǎn)關(guān)系自動生成故障隔離流程圖,當(dāng)用戶選中圖中某個(gè)環(huán)節(jié)時(shí),系統(tǒng)自動顯示當(dāng)前環(huán)節(jié)的操作內(nèi)容,在排故過程中和排故完成后,用戶均可以看到整個(gè)排故過程內(nèi)容。 閱讀器數(shù)據(jù)庫中存儲著大量的技術(shù)資料,使用全文檢索技術(shù)可以從技術(shù)資料庫中快速篩選并獲得所需的資料內(nèi)容。全文檢索需要對被檢索的數(shù)據(jù)根據(jù)關(guān)鍵詞分詞方法建立索引,通過索引可以達(dá)到快速查詢到目標(biāo)資料所在的位置及對應(yīng)的詳細(xì)資料。 全文檢索的執(zhí)行過程如圖8所示。 全文檢索的關(guān)鍵是對原始數(shù)據(jù)進(jìn)行索引和查詢,全文檢索有3個(gè)關(guān)鍵技術(shù):分詞技術(shù);索引技術(shù);查詢檢索。 4.4.1 分詞技術(shù) 分詞就是對被索引內(nèi)容進(jìn)行內(nèi)容分割,切分成最小單元,并且這些最小單元是有意義的,而不是單獨(dú)的文字,有可能是一個(gè)詞組。根據(jù)語言的特點(diǎn),不同的語言也有不同的分詞技術(shù),中文分詞不同于英文,有其獨(dú)特的分詞方法。 中文分詞一般采取預(yù)定義詞匯集合,通過遍歷文檔內(nèi)容,以正向最大匹配的方法對比詞匯集合,完成對源文檔的內(nèi)容分割。 4.4.2 索引技術(shù) 索引技術(shù)分為兩類,一類是文檔索引,另一類則是查詢索引。 文檔索引就是為系統(tǒng)中內(nèi)容HTML文檔中的文本建立索引數(shù)據(jù),以便加速查詢。為了加快索引的查詢速度,采用倒排鏈表方法存儲索引數(shù)據(jù),所謂的倒排鏈表方法,是以詞組作為鏈表的鏈表頭,索引信息(索引信息包含索引所在文檔位置、詞匯頻率等信息)作為后續(xù)節(jié)點(diǎn),多個(gè)索引信息組成一個(gè)索引信息鏈表。 查詢索引就是對用戶的查詢文件進(jìn)行分析,劃分出詞組,并得到詞組的邏輯關(guān)系,用戶可以通過使用查詢關(guān)鍵字提高查詢結(jié)果準(zhǔn)確度。 建立索引文件是相當(dāng)緩慢的過程,所以可以在系統(tǒng)中將創(chuàng)建索引作為一個(gè)專門的功能,對于閱讀器數(shù)據(jù)庫中的那些數(shù)據(jù)模塊,在整個(gè)閱讀器使用過程中將不會再發(fā)生變更,因此,索引只需創(chuàng)建一次,索引一旦創(chuàng)建完畢將可以一直使用。 4.4.3 查詢檢索 查詢檢索就是根據(jù)查詢文本檢索出匹配內(nèi)容的過程。在全文檢索中,查詢結(jié)果的匹配度、準(zhǔn)確度是衡量全文檢索技術(shù)優(yōu)劣的關(guān)鍵因素,為了提供更為準(zhǔn)確、匹配度更高的查詢結(jié)果,使用查詢結(jié)果權(quán)重的方法,通過該方法對查詢結(jié)果進(jìn)行排序,權(quán)重高的結(jié)果排在前面,反之則排在后面。查詢結(jié)果權(quán)重的組成有兩個(gè)重要因素,分別為詞組出現(xiàn)頻率、文檔頻率。 詞組出現(xiàn)頻率,即查詢詞組在文檔中出現(xiàn)的次數(shù),次數(shù)越大則權(quán)重越高。 文檔頻率,即有多少文檔包含了該詞組,文檔越多則權(quán)重越大,文檔頻率主要在查詢文本中出現(xiàn)多個(gè)詞組時(shí)使用到,用于和其它詞組的權(quán)重作比較。 通過設(shè)置查詢結(jié)果權(quán)重信息,可把權(quán)重大的記錄放置在前面,提高用戶關(guān)注度。 本文針對用戶在閱讀裝備IETM 手冊時(shí)存在的問題與不便,提出開發(fā)基于S1000D的IETM閱讀器。在對系統(tǒng)物理架構(gòu)、功能架構(gòu)、關(guān)鍵技術(shù)等進(jìn)行深入的研究和分析之后,利用Asp.Net 技術(shù)實(shí)現(xiàn)了IETM閱讀器,并將其應(yīng)用于某型號裝備的電子手冊交付閱讀中,項(xiàng)目應(yīng)用的效果表明,該閱讀器能夠同時(shí)裝載和管理多種電子手冊,且手冊內(nèi)容的展示效果和交互能力較強(qiáng),完全滿足裝備操作培訓(xùn)和維修需要。 [1] 梁偉杰,于永利,張磊等. 裝備交互式電子技術(shù)手冊發(fā)展綜述[J]. 國防技術(shù)基礎(chǔ),2009(5):9~l5. [2] S1000D International Specification for Technical Publications Utilizing A Common Source Data Base[S]. Issue 4.0,2008. T-65 [文獻(xiàn)標(biāo)識碼] C [文章編號] 1003-6660(2017)04-0052-05 10.13237/j.cnki.asq.2017.04.013 2017-02-21 (編輯:勞邊)元素轉(zhuǎn)化成網(wǎng)頁上的圖像對象,同時(shí)生成圖像的熱點(diǎn)數(shù)據(jù))等方法。
4.3 圖形化故障隔離技術(shù)
4.4 全文檢索技術(shù)
5 結(jié)束語