厲 毅,鄭 煒
(浙江廣播電視大學,浙江 杭州 310030)
微格式是近年來信息技術研究與應用領域出現(xiàn)的新概念,盡管出現(xiàn)才四五年時間,但受到了Yahoo、YouTube、Twitter、Google等著名網(wǎng)站的支持。它所體現(xiàn)的在網(wǎng)絡信息操作上語法、語義和語用一體化的原則,在不同網(wǎng)頁之間架起了對應數(shù)據(jù)無縫化集成的標準橋梁。[1]由于微格式推崇松散組合微內(nèi)容的理念,使其在數(shù)字學習網(wǎng)站資源的整合、重用、共享以及語義化組織上存在著廣闊的應用前景,同時也為現(xiàn)有學習資源在微型移動學習領域的推行、應用和擴展提供了新的解決思路。
微格式是指建立在已有的、被廣泛采用的標準基礎之上的一組簡單的、開放的數(shù)據(jù)格式(microformats.org官方定義)。它依托于標準的Web頁面寫作技術,在HTML文檔中給標簽(Tag)增加屬性(attribute),把語義嵌入到HTML語言中。通過語義相關,讓網(wǎng)頁內(nèi)容人機可讀,實現(xiàn)的是兼顧人機可讀性的數(shù)據(jù)表達方式。網(wǎng)頁上的微格式數(shù)據(jù)如事件、人物、地點等容易被其他的工具軟件檢測并進行提取,便于實施信息的索引、搜索和跨平臺共享。
微格式分為基本微格式和復合微格式,其技術體系如圖1所示。[2]基本微格式是解決單一問題的最小解決方案,包含XMDP、XFN、XOXO等。復合微格式由基本微格式和XHTML元素組成,包含hCard、hCalendar等。
根據(jù)應用需求和作用的不同,微格式可以抽象成以下幾種類型:定義和標記結構化數(shù)據(jù),描述個人和組織信息,描述超鏈接屬性,描述評論機制,描述其他具體應用。[3]
圖1 微格式技術體系
(1)標記和定義結構化數(shù)據(jù)的微格式
XMDP(XHTML Meta Data Profiles),用于定義 HTML元數(shù)據(jù)配置,可解釋和共享某個微格式的約定,包含格式相關的屬性、屬性定義、簡短描述等信息。在Web上引用XMDP配置文件需提供關于微格式用法的聲明,使用者必須在實例文檔中使用此類鏈接。對于XHTML而言,宿主語言配置文件引用通常作為head元素的一個屬性。
XOXO(eXtensible Open XHTML Outlines),是拓展型開放XHTML規(guī)范的簡稱,用來描述文檔的大綱或者類似博客提要的訂閱列表。XOXO格式大綱與普通的有序列表或者無序列表的唯一差別只在于頂部使用了類別名xoxo。
(2)描述個人和組織信息的微格式
hCard,用來發(fā)布個人、公司、組織、地點等詳細的聯(lián)系信息,可以包含在XHTML、Atom、RSS等可擴展標記語言中。它建立在vCard標準的基礎上,使用vCard(RFC 2426)的屬性和值來實現(xiàn)相關功能,以XHTML具有語義化的標簽屬性表征個人和組織機構的聯(lián)系信息,將非結構化的數(shù)據(jù)轉變成結構化的數(shù)據(jù)。
hCanlendar,可以為事件和基于時間或地點的活動提供語義和結構化信息。通過分享嵌入到網(wǎng)頁中的日歷數(shù)據(jù)標準 iCalendar數(shù)據(jù),提供對“組織者”、“時間”、“地點”等項目的標記和描述,并在互聯(lián)網(wǎng)上發(fā)布 “會議日程”、“課程安排”等與日程安排密切相關的非結構化信息。hCalendar微格式描述的是在日歷中使用的事件或者任何基于時間的活動信息,包括概述、日期和時間、地點、詳細描述、重復發(fā)生等。
XFN(XHTML Friends Network),用來描述網(wǎng)頁所有者與所鏈接的人之間的網(wǎng)絡關系。伴隨著在線社會化網(wǎng)絡的發(fā)展,XFN不是簡單呈現(xiàn)“誰鏈接到誰”,而是對好友、家庭、同事等社交關系進行描述,可以賦予超鏈接“Friendship (朋友)”、“Professional (工作關系)”、“Geographic(地緣關系)”、“Family(家庭關系)”、“Identify(其他所有的關系)”等7種關系和約束條件。
hResume,是一種發(fā)布簡歷的復合微格式。它具有語義的結構化信息,使用純文本對簡歷進行一般性的描述。在可能的情況下,可以重用原有微格式字段名稱rel-tag,hCard和hCalendar等,比如用hCard描述個人和機構信息,用hCalendar描述工作經(jīng)歷,用rel-tag描述個人技能等。
(3)描述超鏈接屬性的微格式
(4)描述評論機制的微格式
hReview,描述的是對產(chǎn)品、事件、商業(yè)、地點等的評論。hReview鼓勵將評論標準化,讓各種評論的共享、發(fā)布、整合、聚合變得更加便捷。它有兩個不可少的組成部分:根類別名(hreview),項目信息(item)。當前的 hReview規(guī)范要求評論至少提供被評論項目的全稱(fn),還有其他的 item 以外的可選屬性 version、summary、type、reviewer、dtreviewed、rating、description、tags、permalink 和 license等。
VoteLinks,是用于諸如博客流行度測評、現(xiàn)實生活選舉等評選的基本微格式。它使用rev屬性,帶有3個值:vote-for、vote-abstain和 vote-against,分別用來表示贊同、中立和反對。用戶按照微格式的要求進行標記,其意見就會被相關的識別和聚合軟件獲取。
(5)描述其他應用的微格式
除了以上幾類微格式外,還有其他側重具體應用的微格式。比如用于書簽發(fā)布的hFolk,用于物理測量的hMeasure,用于貨幣格式的hMoney,用于電子商務的rel-payment,用于地理經(jīng)緯度標注的geo,用于酒評論的wine等。[4]
“語義化”是指機器在盡可能少的人類干預下能夠研究和收集信息,讓網(wǎng)頁能夠被機器理解,最終讓人類受益。利用微格式改造HTML頁面,增加HTML頁面的語義化處理能力,可以在網(wǎng)頁內(nèi)容、樣式等不變的情況下,使數(shù)據(jù)仍然便于人類閱讀,而且能夠為機器解析提供友好性,便于數(shù)據(jù)的共享。微格式的實現(xiàn)不存在很高的技術門檻,具有很強的實用性。運用微格式語義化組織和編寫的網(wǎng)頁,容易使該頁面對外暴露的數(shù)據(jù)輕松納入到搜索引擎的索引中去,便于在互聯(lián)網(wǎng)上的傳播與擴散。
如果從泛在學習、移動學習的角度看,微格式語義化組織最吸引人的是其“可松散組合”的特性。[5]利用微格式規(guī)范改造的數(shù)字學習網(wǎng)站,可以在網(wǎng)頁中使用微格式設計和呈現(xiàn)數(shù)字學習資源,不但方便師生運用軟硬件工具或者簡單程序篩選和抽取學習資源,還可以實現(xiàn)系統(tǒng)向用戶自動發(fā)送學習資源,不同用戶端設備會根據(jù)語義標記讀取適合的課程內(nèi)容。即使網(wǎng)站樣式表出錯,仍能夠呈現(xiàn)清晰的網(wǎng)頁結構。對樣式表支持較弱的手機、PDA等移動終端,可根據(jù)顯示屏大小合理地呈現(xiàn)界面。因此,微格式的出現(xiàn),很大程度上改善了利用微型終端訪問網(wǎng)絡的用戶體驗。[6]
數(shù)字學習網(wǎng)站上教學教務信息主要包括:學校地址、課程聯(lián)系人、聯(lián)系電話、電子郵件等通訊信息;學校歷史沿革、辦學網(wǎng)絡、教學服務點等介紹信息;實踐課程安排、課程時間變更、作業(yè)發(fā)布等通知和消息;專家講座、實驗專題、學術會議等公告信息;相關院系、相關高校、相關研究院所的網(wǎng)絡鏈接列表等。這些與網(wǎng)站和師生相關的信息所包含內(nèi)容和格式比較相近,具備語義化結構化的特點,可以優(yōu)先考慮微格式化。
微格式技術體系中描述組織和個人信息的部分微格式可以用于這部分資源的微格式化。通訊信息采用hCard微格式化,授課通知、課程變更內(nèi)容可以采用hNews微格式化,教學進度表、日程安排表采用hCalander微格式化,專題講座、課程介紹、師資介紹借助hResume等微格式化,院系鏈接、研究院所鏈接列表借助XFN描述鏈接關系。各類微格式都有詳細規(guī)定的必選和可選項目,可以根據(jù)需要進行選擇和使用。
數(shù)字學習網(wǎng)站利用超鏈接將課程網(wǎng)頁、知識概念圖、IP課程、流媒體課程、評論等整合在一起為學生提供學習支持服務。這些超鏈接是非結構化的,學生可能并不知道鏈接的內(nèi)容,或者學生可以通過鏈接的載體知曉但是機器卻不能識別,不能夠?qū)崿F(xiàn)預定任務的自動抽取。
微格式技術體系中描述超鏈接屬性的微格式,可以用于數(shù)字學習網(wǎng)站超鏈接的微格式化改造。返回到網(wǎng)站首頁的鏈接可以用rel-home指明鏈接的目的地址,該標簽為了導航使用,同時可以為頁面提供站點結構的描述信息。學生虛擬社交頁面、在線交流頁面、小組協(xié)作學習頁面如 Blog、Flickr、Twitter、LinkedIn 等資料頁的鏈接可以添加rel="me",使得在任何網(wǎng)站上尋找共同學習者變成一件非常容易的事情。微格式規(guī)范要求鏈接的目的地址URL中最后一部分要包含“tag”的實際賦值,這種鏈接的組織方式也被稱作“標簽空間(tagspace)”??梢栽谡n程網(wǎng)頁中添加rel="tag"屬性,表明該課程知識是什么學科、什么類別的,從而實現(xiàn)課程內(nèi)容的有效組織和分類。對于網(wǎng)頁內(nèi)容的版權問題,可以用rel-license進行描述,使鏈接所指向資源的版權信息在鏈接中有清晰的表述。
數(shù)字學習資源是數(shù)字化學習支持服務的主要載體,借助微格式進行數(shù)字資源語義化組織有利于資源的整合,也有利于學習網(wǎng)站之間的資源共享。
對于靜態(tài)頁面形式的學習資源,采用現(xiàn)有載體類型的微格式進行數(shù)字資源描述的改造。借助hAudio描述授課音頻資源,借助hMedia描述流媒體課件、虛擬動畫、教學演示圖片相關信息,借助figure描述各類圖表,借助hAtom描述網(wǎng)志摘要,借助citation描述文章的引文信息,借助xFolk描述網(wǎng)絡標簽,等等。當然,靜態(tài)學習資源還可以借助前面提及的其他微格式hCalander、hReview等共同描述。對于一些特殊的資源,比如地理知識可以利用Geo微格式描述和傳遞數(shù)據(jù),對課程內(nèi)容的評價可用hReview描述,對思想交流和學習辯論中的贊成與否可用VoteLinks描述。
對于從數(shù)據(jù)庫中獲取并動態(tài)更新的元數(shù)據(jù)學習資源,也可以進行微格式化改造。在通用元數(shù)據(jù)標準DC的微格式化方面,已經(jīng)有了較為成熟的研究成果。西班牙卡羅三世大學的研究人員創(chuàng)建了DCMF格式;耶魯醫(yī)療信息中心開發(fā)的unAPI網(wǎng)絡API,可以利用微格式URI的編碼格式在HTML網(wǎng)站上發(fā)布含語義信息的對象。[7]
微格式是一種網(wǎng)絡信息標記語言,借助網(wǎng)頁代碼中添加的相應標簽和屬性對各種信息進行標注。它的代碼仍然是XML代碼,在平常瀏覽的網(wǎng)頁上表現(xiàn)為XHTML代碼。正是通過 id、title、rel、rev、class等屬性的添加,實現(xiàn)了Web頁面元素的語義化存在。在使用微格式時,可以根據(jù)需要選擇使用不同的微格式子集。
下文所示代碼就是添加了微格式的語句:
那么,程序就可以憑借class屬性快捷地聚合和共享這些內(nèi)容。
為便于微格式的編寫,微格式網(wǎng)站http://microformats.org/code提供有專門的在線自動生成工具hCard creator、hCalendar creator、hReview creator等。只要按照語義提示要求輸入需要描述的信息,就可以生成HTML代碼并進行預覽。另外,實現(xiàn)微格式還有其他一些工具:pnh_mf插件和JMC_Event_Manager允許簡單的微格式內(nèi)容添加,包括hCalendar。WordPress也擁有很多可以添加微格式內(nèi)容的插件如WP-Microformats、Structured Blogging和Movable Type等。Conference Schedule Creator可以使用hCalendar生成所有的會議時刻表。
要讀取網(wǎng)頁中的微格式數(shù)據(jù),可以先通過PHP代碼的HTTP_Client()函數(shù)讀取頁面,再將返回的HTML編碼轉換成DOM(XML Document Object Model)。部分代碼如下:
首先調(diào)用get_page()函數(shù)檢索頁面內(nèi)容,然后創(chuàng)建并加載DomDocument()函數(shù),再使用XPath獲取 vevent類所在頁面上的所有
因此,經(jīng)過微格式語義化組織后的課程內(nèi)容、教師信息、學習評價等可以通過程序代碼實現(xiàn)自動抽取和顯示,不需要多次地重復發(fā)布。如果網(wǎng)站和課程的統(tǒng)計數(shù)據(jù)有經(jīng)常性的更新,也可以從按照微格式標準進行編碼的網(wǎng)頁中直接抽取數(shù)據(jù),不需要額外征集相關數(shù)據(jù)和資料。
微格式是包含結構化數(shù)據(jù)的開放標準,既適合人類閱讀,又容易被機器處理。使用微格式定義和標記數(shù)字學習網(wǎng)站,能夠促進頁面信息的結構化,優(yōu)化學習資源的分類和索引,方便其他的網(wǎng)站和應用程序?qū)?shù)據(jù)的讀取。微格式語義化的網(wǎng)頁還可以在移動學習終端呈現(xiàn)靈活的、適合手持設備的顯示效果,提供令人滿意的學習交互體驗。[8]因此,微格式在瀏覽器擴展、跨平臺服務和網(wǎng)站建設等方面存在著廣闊的發(fā)展前景。
[1]楊九龍,熊偉.“微格式”申論[J].圖書館雜志,2009,3(29):59-63.
[2]About Microformats[EB/OL].http://microformats.org/about.2011.12
[3]李書寧.基于微格式的信息組織與處理框架[J].圖書情報工作,2007,8(51):35-37.
[4]Michael,M.,Mohanad,A-J.,Philippe,T.Using Microformats to Personalize Web Experience.Proceedings of 7th Int.Workshop on Web- Oriented Software Technologies(IWW OST 2008):57-62.
[5]顧小清.終身學習視野下的微型移動學習資源建設[M].上海:華東師范大學出版社,2011.5:36-39.
[6]Leventhal,A.Structure benefits all.Proceedings of the 2006 international cross-disciplinary workshop on web accessibility(W4A):33-37.
[7]李書寧,賈繼娥.圖書館網(wǎng)站基于微格式的語義化組織研究[J].圖書館雜志,2010,12(26):54-58.
[8]謝明穎,顧小清.微型內(nèi)容:微格式的解決思路[J].現(xiàn)代教育技術,2011(3):95-99.