劉 爽,楊 輝,李佳宜,譚楠楠
(大連民族大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院,遼寧 大連 116600)
中國(guó)是一個(gè)由多民族組成的國(guó)家,在漫長(zhǎng)的歷史發(fā)展過(guò)程中,中華民族文化一直連綿不斷,生生不息,各少數(shù)民族形成了不同的文化特征和文化體系[1]。民族文化是各民族在其歷史發(fā)展過(guò)程中創(chuàng)造和發(fā)展起來(lái)的具有本民族特點(diǎn)的文化。中國(guó)的少數(shù)民族以“大雜居、小聚居、相互交錯(cuò)居住”的特點(diǎn)分布在全國(guó)各地。55個(gè)少數(shù)民族的不同文化和特有習(xí)俗隨著地點(diǎn)的遷移和生活的交流彼此交融,形成了具有各民族特色的少數(shù)民族文化。但是,面對(duì)不同民族及其文化之間的聯(lián)系,如何進(jìn)行梳理成為研究者們面臨的難題。
知識(shí)圖譜技術(shù)的出現(xiàn)為廣大研究者們提供了一套解決數(shù)據(jù)之間關(guān)聯(lián)性的方案。知識(shí)圖譜本質(zhì)上是語(yǔ)義網(wǎng)絡(luò),是一種基于圖的數(shù)據(jù)結(jié)構(gòu),由節(jié)點(diǎn)和邊組成。在知識(shí)圖譜里,每個(gè)節(jié)點(diǎn)表示現(xiàn)實(shí)世界中存在的“實(shí)體”,每條邊為實(shí)體與實(shí)體之間的“關(guān)系”[2]。目前,國(guó)內(nèi)很多企業(yè)和高校開(kāi)始構(gòu)建知識(shí)圖譜,如復(fù)旦大學(xué)構(gòu)建的CN-DBpedia[3]、清華大學(xué)構(gòu)建的XLore[4]等。知識(shí)圖譜作為一種知識(shí)表示工具,在各行業(yè)中都有著重要的應(yīng)用,未來(lái)也具有極大的發(fā)展空間和廣闊的應(yīng)用前景[5]。
少數(shù)民族文化作為中國(guó)特有的文化產(chǎn)物,政府近年來(lái)針對(duì)這些獨(dú)具特色的少數(shù)民族文化采取一定的措施來(lái)進(jìn)行保護(hù)。隨著互聯(lián)網(wǎng)的快速發(fā)展,很多地區(qū)開(kāi)始建立自己的少數(shù)民族文化資源庫(kù),如四川特色文化資源數(shù)據(jù)庫(kù)、西湖文化資源庫(kù)等。這些地方建立的數(shù)據(jù)資源庫(kù)在一定程度上保護(hù)了民族文化,但是這些僅停留在數(shù)據(jù)存儲(chǔ)方面,其數(shù)據(jù)的結(jié)構(gòu)化程度相對(duì)來(lái)說(shuō)還是較差。知識(shí)圖譜這一技術(shù)手段在少數(shù)民族文化資源整合的研究中并沒(méi)有得到廣泛的應(yīng)用。因此,該文通過(guò)采集不同來(lái)源的非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù),對(duì)其進(jìn)入深入挖掘,進(jìn)而構(gòu)建出少數(shù)民族文化知識(shí)圖譜。從而將少數(shù)民族文化以更加直觀(guān)、清晰的形式呈現(xiàn)給廣大用戶(hù)。
近年來(lái)關(guān)于文化傳播的研究非常多,與少數(shù)民族文化相關(guān)的資料收集和整理也成為學(xué)術(shù)界研究的熱門(mén)方向。但是,國(guó)內(nèi)大多數(shù)學(xué)者主要是通過(guò)在中國(guó)知網(wǎng)和Web of science網(wǎng)站上收集相關(guān)方面的期刊論文,然后利用Citespace等軟件對(duì)獲取的文獻(xiàn)數(shù)據(jù)進(jìn)行可視化分析,從而進(jìn)一步探討少數(shù)民族文化領(lǐng)域的研究熱點(diǎn)以及預(yù)測(cè)廣大學(xué)者們未來(lái)可能會(huì)從事的研究方向。此類(lèi)研究中所提及的知識(shí)圖譜和文中所研究的知識(shí)圖譜存在較大的差異[6]。文中所構(gòu)建的少數(shù)民族文化知識(shí)圖譜是立足于少數(shù)民族現(xiàn)實(shí)情況,構(gòu)建出的知識(shí)圖譜能夠真實(shí)地反映各民族之間的文化習(xí)俗,節(jié)日風(fēng)情之間的關(guān)系。而利用Citespace等可視化軟件構(gòu)建的知識(shí)圖譜主要是以文獻(xiàn)中的關(guān)鍵字、作者信息、所屬領(lǐng)域等信息來(lái)構(gòu)建出相應(yīng)的可視化圖譜,該知識(shí)圖譜不能清晰明了地顯示各實(shí)體之間的關(guān)系。
在少數(shù)民族文化知識(shí)圖譜研究中,余波[7]利用知識(shí)圖譜相關(guān)知識(shí)和Gephi軟件對(duì)收集的廣西文化民族文化信息資源數(shù)據(jù)進(jìn)行分析和探究。其中主要對(duì)廣西的民族建筑、民族語(yǔ)言、民族音樂(lè)、民族習(xí)俗等內(nèi)容構(gòu)建了民族文化知識(shí)圖譜并對(duì)圖譜進(jìn)行了詳細(xì)的分析。麻友[8]通過(guò)對(duì)社會(huì)媒體數(shù)據(jù)中與少數(shù)民族有關(guān)的主題數(shù)據(jù)進(jìn)行抽取,搭建了與少數(shù)民族有關(guān)的知識(shí)圖譜。并利用該知識(shí)圖譜實(shí)現(xiàn)了民族輿情的分析系統(tǒng)。王蕾等人[9]基于知識(shí)圖譜的研究方法,對(duì)貴州少數(shù)民族文化影像資源的數(shù)據(jù)進(jìn)行采集、數(shù)據(jù)分析、知識(shí)抽取等操作,構(gòu)建了貴州少數(shù)民族影像知識(shí)圖譜,利用科技手段保護(hù)和傳承了貴州少數(shù)民族文化。楊媛媛[10]在整理少數(shù)民族語(yǔ)言文字的研究成果的基礎(chǔ)上,構(gòu)建了中國(guó)少數(shù)民族語(yǔ)言文字研究領(lǐng)域知識(shí)圖譜,為保護(hù)民族語(yǔ)言做出重要貢獻(xiàn)。甘健侯等人[11]通過(guò)收集少數(shù)民族辭條數(shù)據(jù)進(jìn)行分詞、詞性標(biāo)注以及實(shí)體屬性值抽取,構(gòu)建了少數(shù)民族信息資源知識(shí)圖譜。
在大數(shù)據(jù)環(huán)境下,以往用來(lái)表示少數(shù)民族文化的網(wǎng)絡(luò)結(jié)構(gòu)圖現(xiàn)已無(wú)法滿(mǎn)足要求,而知識(shí)圖譜可以有效地解決這一問(wèn)題。因此,文中采用知識(shí)圖譜技術(shù)來(lái)構(gòu)建以民族為核心的少數(shù)民族文化知識(shí)圖譜,在該圖譜中以少數(shù)民族為中心節(jié)點(diǎn),少數(shù)民族節(jié)日、人口數(shù)量、分布地區(qū)、風(fēng)俗習(xí)慣等作為分支節(jié)點(diǎn)。節(jié)點(diǎn)之間的關(guān)系以擁有關(guān)系為主,其余節(jié)點(diǎn)之間的關(guān)系根據(jù)其屬性的不同設(shè)置。節(jié)點(diǎn)之間關(guān)系的多樣性彌補(bǔ)了在通用知識(shí)圖譜中含有的民族文化節(jié)點(diǎn)間關(guān)系單一性的缺點(diǎn)。
少數(shù)民族文化是中華文化的重要組成部分,是中華民族共有的精神財(cái)富。因此,弘揚(yáng)、保護(hù)和傳承少數(shù)民族的優(yōu)秀傳統(tǒng)文化有利于增強(qiáng)中華民族的凝聚力和生命力。知識(shí)圖譜實(shí)質(zhì)上是以圖結(jié)構(gòu)的形式來(lái)表達(dá)客觀(guān)世界中的實(shí)體、屬性和關(guān)系,其中圖的節(jié)點(diǎn)表示實(shí)體,圖中的邊則用來(lái)表示實(shí)體間的關(guān)系[15]。知識(shí)圖譜的構(gòu)建方法有三種:自頂向下、自底向上和二者混合的方法[16]。自頂向下構(gòu)建是指通過(guò)獲取百科類(lèi)網(wǎng)站等結(jié)構(gòu)化數(shù)據(jù),從較高質(zhì)量的數(shù)據(jù)中來(lái)獲取本體和模式信息,加入到知識(shí)庫(kù)中[17]。自底向上構(gòu)建是借助技術(shù)手段先從語(yǔ)料庫(kù)或數(shù)據(jù)集中抽取出實(shí)體、屬性和關(guān)系,加入到知識(shí)圖譜的數(shù)據(jù)層;然后將同類(lèi)型的要素進(jìn)行重新歸納組織,將其抽象成概念,最后形成模式層[5,16-18]。
文中是采用二者相結(jié)合的方法來(lái)構(gòu)建少數(shù)民族文化知識(shí)圖譜。由于網(wǎng)絡(luò)上現(xiàn)有的關(guān)于少數(shù)民族文化數(shù)據(jù)較為繁雜多樣,有結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)。為了更好地構(gòu)建出質(zhì)量較高的少數(shù)民族文化知識(shí)圖譜,文中首先通過(guò)前期調(diào)研確定所構(gòu)建的少數(shù)民族文化知識(shí)圖譜數(shù)據(jù)來(lái)源,確定需要哪部分具體數(shù)據(jù)。然后通過(guò)編寫(xiě)爬蟲(chóng)程序、手工采集等方式從中華民族文化資源庫(kù)(http://www.k.minzunet.cn/)、民族網(wǎng)(http://www.minzu56.net/)、百科類(lèi)網(wǎng)站、公開(kāi)數(shù)據(jù)集等多種數(shù)據(jù)源中獲取構(gòu)建少數(shù)民族文化知識(shí)圖譜所需要的數(shù)據(jù)。其中,民族類(lèi)網(wǎng)站主要獲取非結(jié)構(gòu)化數(shù)據(jù),百科類(lèi)網(wǎng)站是半結(jié)構(gòu)化數(shù)據(jù)的來(lái)源,公開(kāi)數(shù)據(jù)集是結(jié)構(gòu)化數(shù)據(jù)的來(lái)源。其次,通過(guò)分析獲取的少數(shù)民族文化數(shù)據(jù)來(lái)設(shè)計(jì)概念、關(guān)系、屬性,利用Protégé本體構(gòu)建工具來(lái)構(gòu)建本體庫(kù),從而完成少數(shù)民族文化知識(shí)建模。然后,根據(jù)設(shè)計(jì)好的本體庫(kù)和抓取的不同類(lèi)型的數(shù)據(jù)形式進(jìn)行實(shí)體、關(guān)系和屬性的抽取工作。最后,將抽取得到的實(shí)體、關(guān)系、屬性進(jìn)行整合處理,并將得到的知識(shí)圖譜三元組數(shù)據(jù)存儲(chǔ)到圖數(shù)據(jù)庫(kù)Neo4j中,利用Neo4j圖數(shù)據(jù)庫(kù)進(jìn)行可視化展示,從而完成少數(shù)民族文化知識(shí)圖譜的構(gòu)建,整體構(gòu)建流程如圖1所示。
圖1 少數(shù)民族文化知識(shí)圖譜構(gòu)建流程
本體構(gòu)建是少數(shù)民族文化知識(shí)圖譜構(gòu)建過(guò)程中較為重要的一環(huán),通過(guò)本體構(gòu)建能夠?qū)⒅R(shí)圖譜中包含的實(shí)體屬性及其聯(lián)系進(jìn)行充分的描述。本體作為人工智能中一種知識(shí)的表現(xiàn)方法,是對(duì)特定領(lǐng)域之中某些概念及其相互之間關(guān)系的形式化表達(dá)。在本體的構(gòu)建過(guò)程中,為了保證規(guī)范性,構(gòu)建本體時(shí)需要按照一定的規(guī)范和標(biāo)準(zhǔn)[19]。隨著技術(shù)的發(fā)展,國(guó)內(nèi)外研究機(jī)構(gòu)和學(xué)者們提出了多種本體構(gòu)建方法,主要有骨架法、METHONTOLOGY方法、七步法、TOVE法和IDEF5法等等[20-21]。其中以斯坦福大學(xué)開(kāi)發(fā)的七步法構(gòu)建領(lǐng)域本體最為成熟[22]。所以文中結(jié)合數(shù)據(jù)本身的特點(diǎn),選用七步法來(lái)構(gòu)建少數(shù)民族文化本體庫(kù)。
少數(shù)民族文化作為中國(guó)獨(dú)有的文化資源,研究者們根據(jù)自己研究?jī)?nèi)容的不同對(duì)其分類(lèi)的方法也不同。構(gòu)建少數(shù)民族文化本體庫(kù)時(shí)需要對(duì)概念、屬性和關(guān)系等多個(gè)方面進(jìn)行考慮。對(duì)于少數(shù)民族文化來(lái)說(shuō),核心是“民族”,因此首先需要確定“民族”這一概念,與“民族”相關(guān)聯(lián)的必然是“民族地區(qū)”、“民族節(jié)日”、“民族人物”及“民族建筑”等概念信息,所以將“民族地區(qū)”、“民族節(jié)日”、“民族人物”和“民族建筑”等信息也加入到概念中。然后,根據(jù)“民族節(jié)日”和“民族人物”相關(guān)聯(lián)的情況分析后,發(fā)現(xiàn)與“民族節(jié)日”和“民族人物”關(guān)系較為密切的是“民族藝術(shù)”、“民族文學(xué)”,故將“民族藝術(shù)”和“民族文學(xué)”也加入到概念中。然而,在“民族藝術(shù)”中又包含“民族音樂(lè)”、“民族舞蹈”、“民族美術(shù)”、“民族戲劇”等較為重要的概念。因此,文中根據(jù)數(shù)據(jù)的分類(lèi)情況對(duì)“民族藝術(shù)”進(jìn)行子類(lèi)劃分,劃分為“民族音樂(lè)”、“民族舞蹈”和“民族戲劇”等5個(gè)子概念。除此之外,“飲食”、“服飾”、“醫(yī)藥”、“體育”、“民族工藝”和“民族非遺”等信息也是較為重要的概念。因此,把以上信息也加入到概念中。最后,由于考慮到一些特殊情況,文中新增了一個(gè)“其他”的概念,該部分主要包含除上述提到的五個(gè)概念之外的其他概念,增加這一概念保證了本體庫(kù)的完整性和可擴(kuò)展性。
綜上所述,文中將少數(shù)民族文化分為少數(shù)民族、民族節(jié)日、民族建筑、民族風(fēng)俗、民族人物、民族藝術(shù)、民族工藝等16個(gè)大類(lèi),然后在民族風(fēng)俗類(lèi)別中細(xì)分為5個(gè)小類(lèi),分別是成長(zhǎng)風(fēng)俗、婚戀風(fēng)俗、喪嫁風(fēng)俗、崇敬風(fēng)俗和禁忌風(fēng)俗。在民族藝術(shù)中劃分5個(gè)小類(lèi),分別是民族音樂(lè)、民族舞蹈、民族器樂(lè)、民族美術(shù)和民族戲劇。在民族工藝中劃分3個(gè)小類(lèi),分別是服飾工藝、編織工藝和雕刻工藝。對(duì)于劃分的每個(gè)類(lèi)別詳細(xì)分析后發(fā)現(xiàn)每個(gè)概念又具有不同的特征,根據(jù)不同的特征對(duì)屬性進(jìn)行定義。本體庫(kù)的概念和屬性如表1所示。
表1 本體庫(kù)部分概念和屬性
在表1中的本體庫(kù)中,每個(gè)子概念所包含的實(shí)體和實(shí)體之間存在不同的語(yǔ)義關(guān)系,如民族和節(jié)日之間存在“擁有”的關(guān)系,人物和文學(xué)/藝術(shù)之間存在“創(chuàng)作”的關(guān)系等。根據(jù)前文所述的本體概念設(shè)計(jì),確定了最終的9種本體概念間的關(guān)系,具體如表2所示。
表2 本體概念間部分關(guān)系
文中利用本體構(gòu)建工具Protégé對(duì)少數(shù)民族文化進(jìn)行本體構(gòu)建,構(gòu)建過(guò)程主要分為類(lèi)的構(gòu)建、對(duì)象屬性和數(shù)據(jù)屬性的構(gòu)建。通過(guò)本體的構(gòu)建展示少數(shù)民族文化知識(shí)及其相關(guān)關(guān)系[23],設(shè)計(jì)的本體概念如圖2所示。
圖2 少數(shù)民族文化本體模型
少數(shù)民族文化數(shù)據(jù)資源見(jiàn)證了中華民族從古到今的整個(gè)發(fā)展過(guò)程,其發(fā)展時(shí)間周期長(zhǎng),過(guò)程艱辛,所以整個(gè)少數(shù)民族文化資源數(shù)據(jù)類(lèi)型較為多樣化。為了更好地采集構(gòu)建少數(shù)民族文化知識(shí)圖譜所需要的數(shù)據(jù),文中根據(jù)其數(shù)據(jù)類(lèi)型的不同采取了不同的采集方式、數(shù)據(jù)處理方式。
高情度日非無(wú)事,自是高情不覺(jué)喧。海氣暗蒸蓮葉沼,山光晴逗葦花村。吟時(shí)勝概題詩(shī)板,靜處繁華付酒尊。閑伴白云收桂子,每尋流水劚桐孫。猶憑律呂傳心曲,豈慮星霜到鬢根。多少清風(fēng)歸此地,十年虛打五侯門(mén)。
構(gòu)建少數(shù)民族文化知識(shí)圖譜所需要的結(jié)構(gòu)化數(shù)據(jù)主要是存儲(chǔ)在公開(kāi)的數(shù)據(jù)集中,文中是通過(guò)公開(kāi)數(shù)據(jù)集提供的下載鏈接進(jìn)行下載。
非結(jié)構(gòu)化數(shù)據(jù)是最豐富的知識(shí)來(lái)源[5]。在少數(shù)民族文化相關(guān)的網(wǎng)頁(yè),民族地區(qū)旅游網(wǎng)站中含有大量的非結(jié)構(gòu)化文本數(shù)據(jù)。文中對(duì)于利用網(wǎng)絡(luò)爬蟲(chóng)技術(shù)獲取到的非結(jié)構(gòu)化文本數(shù)據(jù)采用自然語(yǔ)言處理方法、基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)、深度學(xué)習(xí)的方法來(lái)實(shí)現(xiàn)實(shí)體識(shí)別。
少數(shù)民族文化知識(shí)圖譜實(shí)體屬性獲取的數(shù)據(jù)來(lái)源是百科類(lèi)網(wǎng)站中的詞條信息框(InfoBox)中的內(nèi)容。InfoBox中的數(shù)據(jù)一般為半結(jié)構(gòu)化數(shù)據(jù),該部分?jǐn)?shù)據(jù)具有較高的完整性和一致性[5]。圖3所示為“土家族”百科InfoBox。想要獲取信息框中的內(nèi)容,首先需要分析信息框部分的網(wǎng)頁(yè)代碼結(jié)構(gòu),在人工分析的基礎(chǔ)上,手工編寫(xiě)出適合抓取百科網(wǎng)站信息框內(nèi)容的抽取表達(dá)式。
圖3 “土家族”InfoBox
當(dāng)前,存儲(chǔ)知識(shí)圖譜最常用的非關(guān)系型數(shù)據(jù)庫(kù)是Neo4j圖數(shù)據(jù)庫(kù),它可以將結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)在網(wǎng)絡(luò)上而不是表中。Neo4j圖數(shù)據(jù)庫(kù)自帶可視化功能,通過(guò)Neo4j圖數(shù)據(jù)庫(kù)存儲(chǔ)知識(shí)圖譜能夠直接將知識(shí)圖譜進(jìn)行可視化展示。
文中將上述經(jīng)過(guò)知識(shí)抽取得到的(實(shí)體,關(guān)系,實(shí)體)和(實(shí)體,屬性,屬性值)這樣的知識(shí)圖譜三元組存儲(chǔ)在Neo4j圖數(shù)據(jù)庫(kù)中,其中節(jié)點(diǎn)表示少數(shù)民族文化中的實(shí)體,邊表示實(shí)體間的關(guān)系。Neo4j存儲(chǔ)的數(shù)據(jù)是通過(guò)使用Cypher語(yǔ)句來(lái)進(jìn)行管理。因此,文中使用Cypher語(yǔ)句將少數(shù)民族文化數(shù)據(jù)導(dǎo)入到Neo4j圖數(shù)據(jù)庫(kù)。使用的部分語(yǔ)句如下所示:
批量導(dǎo)入實(shí)體(以民族為例):LOAD CSV FROM "file:/// Minzu.csv" AS line MERGE (:Minzu{id:line[0],name:line[1],name2:line[2],location:line[3],culture:line[4]});
導(dǎo)入實(shí)體屬性:MATCH(e: Minzu), (cc:Attribute) WHERE e.Name='%s' AND cc.Name='%s' CREATE(e)-[r:%s{relation: '%s'}]->(cc) RETURN r
利用上述Cypher語(yǔ)句將處理完成的數(shù)據(jù)導(dǎo)入Neo4j圖數(shù)據(jù)庫(kù)后形成少數(shù)民族文化知識(shí)圖譜,結(jié)果如圖4所示(以白族為例),圓圈表示實(shí)體或者實(shí)體屬性,圓圈之間連線(xiàn)上的文字表示兩實(shí)體間的關(guān)系。
圖4 知識(shí)圖譜展示(以白族為例)
基于上述所構(gòu)建的少數(shù)民族文化知識(shí)圖譜,廣大用戶(hù)還不能便捷、快速地獲取想要的信息。因此,文中利用深度學(xué)習(xí)技術(shù),結(jié)合構(gòu)建的少數(shù)民族文化知識(shí)圖譜搭建了基于少數(shù)民族文化知識(shí)圖譜的可視化查詢(xún)系統(tǒng),該系統(tǒng)允許用戶(hù)自助輸入問(wèn)句進(jìn)行查詢(xún)??梢暬樵?xún)系統(tǒng)在收到用戶(hù)搜索的關(guān)鍵字時(shí),能夠準(zhǔn)確地分析用戶(hù)想要搜索的內(nèi)容并返回答案,從而幫助用戶(hù)快速、便捷、高效地獲取信息。基于少數(shù)民族文化知識(shí)圖譜可視化查詢(xún)系統(tǒng)架構(gòu)如圖5所示。
圖5 少數(shù)民族文化可視化查詢(xún)系統(tǒng)架構(gòu)
文中所搭建的少數(shù)民族文化知識(shí)圖譜可視化查詢(xún)系統(tǒng)是利用Python語(yǔ)言、Flask框架、Echarts框架以及Cypher查詢(xún)語(yǔ)句實(shí)現(xiàn)對(duì)查詢(xún)結(jié)果的可視化展示。搭建的少數(shù)民族文化可視化查詢(xún)系統(tǒng)主要功能有:
(1)為想要了解少數(shù)民族文化知識(shí)的廣大用戶(hù)提供基礎(chǔ)信息查詢(xún)服務(wù);
(2)可以實(shí)現(xiàn)遞歸查詢(xún)各個(gè)少數(shù)民族文化的實(shí)體。
少數(shù)民族文化可視化查詢(xún)系統(tǒng)界面如圖6所示。
圖6 景頗族可視化查詢(xún)效果展示
近年來(lái)知識(shí)圖譜逐漸受到廣大研究學(xué)者們的關(guān)注,在學(xué)術(shù)界和工業(yè)界掀起一股研究熱潮,但國(guó)內(nèi)在知識(shí)圖譜構(gòu)建方面的研究還處于起步階段,存在著許多問(wèn)題和挑戰(zhàn)。
文中基于海量的少數(shù)民族文化數(shù)據(jù)以及利用知識(shí)圖譜技術(shù)構(gòu)建了少數(shù)民族、民族節(jié)日、民族建筑、民族舞蹈、民族歌曲、民族人物等實(shí)體關(guān)系的復(fù)雜知識(shí)網(wǎng)絡(luò),實(shí)現(xiàn)了民族文化與知識(shí)圖譜的碰撞,并以知識(shí)圖譜技術(shù)為核心,完成了少數(shù)民族文化可視化查詢(xún)系統(tǒng)平臺(tái)的搭建。所開(kāi)發(fā)的少數(shù)民族文化可視化查詢(xún)系統(tǒng)達(dá)到了實(shí)用的水準(zhǔn),系統(tǒng)可以實(shí)現(xiàn)少數(shù)民族文化相關(guān)信息的查詢(xún),能夠滿(mǎn)足廣大少數(shù)民族文化愛(ài)好者、研究者們的檢索需求。
該研究將為少數(shù)民族文化知識(shí)圖譜的構(gòu)建提供一定的參考價(jià)值和借鑒意義,但是依然有改進(jìn)的空間,未來(lái)將在以下兩個(gè)方向進(jìn)行研究:
(1)目前所構(gòu)建的知識(shí)圖譜不能實(shí)現(xiàn)數(shù)據(jù)的自動(dòng)更新,未來(lái)將實(shí)現(xiàn)知識(shí)圖譜的動(dòng)態(tài)更新;
(2)開(kāi)發(fā)的可視化查詢(xún)系統(tǒng)功能尚未完善,未來(lái)將引入少數(shù)民族文化智能問(wèn)答模塊,可以根據(jù)用戶(hù)提出的問(wèn)題返回幾個(gè)置信度較高的答案供用戶(hù)選擇,這將是未來(lái)研究的重點(diǎn)。