吉永軍,蔣祖華+,黃詠文,劉建峰
(1.上海交通大學(xué) 機(jī)械與動(dòng)力工程學(xué)院,上海 200240;2.上海外高橋造船有限公司,上海 200137)
試航是船舶在交付使用前至關(guān)重要的環(huán)節(jié)。新船試航前,很多系統(tǒng)和設(shè)備沒有進(jìn)行調(diào)試,無(wú)法保證它們處于正常工作狀態(tài),存在大量的事故隱患[1]。在試航過程中,這些具有事故隱患的問題一旦出現(xiàn),需要及時(shí)地找相關(guān)專家解決問題,保證船舶試航的安全性。因此,研究面向船舶試航問題的專家推薦方法,并及時(shí)、準(zhǔn)確地推薦合適的專家來解決試航過程中的特定問題,是極為必要的。
目前,專家推薦技術(shù)已經(jīng)廣泛應(yīng)用于企業(yè)組織和在線社區(qū),包括MediaWiki平臺(tái)下知識(shí)審閱的專家推薦[2]、Q&A論壇用戶推薦系統(tǒng)[3]、學(xué)術(shù)文章審稿人查詢系統(tǒng)[4]、特定疾病醫(yī)生查詢系統(tǒng)[5]等。根據(jù)專家推薦技術(shù)種類的不同,可以將專家推薦技術(shù)分為基于知識(shí)內(nèi)容的專家推薦方法、基于社交網(wǎng)絡(luò)分析的專家推薦方法、混合專家推薦方法3類。研究早期,專家推薦技術(shù)是在企業(yè)組織內(nèi)部結(jié)構(gòu)化、規(guī)范化基礎(chǔ)上對(duì)高質(zhì)量知識(shí)庫(kù)進(jìn)行研究,大多數(shù)學(xué)者均基于知識(shí)內(nèi)容評(píng)估專家在特定領(lǐng)域的技術(shù)能力[6-9],主要通過文本挖掘技術(shù)從專家關(guān)聯(lián)文檔中提取特征來定義用戶的專業(yè)能力,利用相關(guān)方法如模糊邏輯[10]和向量空間模型[11]計(jì)算用戶需求與專家技術(shù)能力的相關(guān)性,并根據(jù)相關(guān)性對(duì)專家進(jìn)行排名,向目標(biāo)用戶推薦最佳候選專家。隨著社交網(wǎng)絡(luò)分析技術(shù)的發(fā)展,相關(guān)研究發(fā)現(xiàn)社會(huì)網(wǎng)絡(luò)分析有助于專家推薦技術(shù)研究[12],專家推薦技術(shù)研究的范圍從企業(yè)組織擴(kuò)展到在線社區(qū)[13]。ZHANG等[14]基于Java在線論壇構(gòu)建了社交網(wǎng)絡(luò)模型,提出基于社交網(wǎng)絡(luò)模型的PageRank用戶推薦算法,并驗(yàn)證了該算法在知識(shí)論壇的優(yōu)越性;ALAM等[15]考慮用戶的評(píng)級(jí)和社交網(wǎng)絡(luò)分析方法,開發(fā)用戶動(dòng)態(tài)信譽(yù)模型,在社區(qū)問答平臺(tái)中推薦合適的專家。但是,這些基于社交網(wǎng)絡(luò)的算法只能應(yīng)用于在線社區(qū)中查找專家,無(wú)法找到特定主題的專家。近年來,專家推薦研究逐漸趨向于知識(shí)內(nèi)容、社交網(wǎng)絡(luò)信息等多方面特征信息融合研究。ZHOU等[16]設(shè)計(jì)了一個(gè)主題概率模型,將用戶之間的社交關(guān)系和主題相似性融合到統(tǒng)一框架下進(jìn)行專家查找;LIU等[17]綜合考慮用戶主題相關(guān)性、聲譽(yù)、權(quán)威度進(jìn)行專家查找;NESHATI等[18]綜合考慮主題相似性、新興主題、用戶行為和主題轉(zhuǎn)換4個(gè)特征,提出一個(gè)學(xué)習(xí)框架來預(yù)測(cè)在線社區(qū)未來的專家排名;XU等[19]通過用戶的專業(yè)知識(shí)和社會(huì)信息融合構(gòu)成復(fù)雜的異構(gòu)網(wǎng)絡(luò),提出一種基于異構(gòu)網(wǎng)絡(luò)的方法來推薦相關(guān)學(xué)者。
3類方法在企業(yè)組織和在線社區(qū)的應(yīng)用中各有所長(zhǎng),企業(yè)組織中的專家推薦研究主要基于知識(shí)文檔相關(guān)性等方面進(jìn)行專家推薦,大多數(shù)專家推薦方法適用于信息質(zhì)量高且知識(shí)層次分明的組織[19]。由于在線社區(qū)的信息質(zhì)量遠(yuǎn)低于組織中的信息質(zhì)量,在線社區(qū)的專家推薦研究主要基于知識(shí)主題相關(guān)性、社會(huì)網(wǎng)絡(luò)結(jié)構(gòu)特征等方面[2,12]。大多數(shù)專家推薦技術(shù)都依賴于知識(shí)相關(guān)性來評(píng)估專家在特定問題的專業(yè)水平[12,19,20]。
然而,船舶試航問題的專家推薦涉及不同實(shí)體(如,技術(shù)專家、問題對(duì)象、技術(shù)問題、問題情境等)以及實(shí)體之間的各種關(guān)系(如,技術(shù)專家與問題對(duì)象之間的關(guān)系、技術(shù)專家與技術(shù)問題之間的關(guān)系等),實(shí)體之間的關(guān)系能夠反映技術(shù)人員的專家專業(yè)知識(shí)或社會(huì)關(guān)系,例如:滑油日用系統(tǒng)和主滑油泵兩個(gè)對(duì)象存在一定的關(guān)聯(lián)性,則解決滑油日用系統(tǒng)的專家具有一定的可能性來解決主滑油泵出現(xiàn)的問題。但在船舶試航問題中,這些已有的專家推薦方法難以將不同屬性以及屬性之間的各種關(guān)系整合到統(tǒng)一框架中,無(wú)法深層次地刻畫各知識(shí)屬性與技術(shù)專家之間關(guān)系,從而導(dǎo)致船舶試航問題中的專家推薦準(zhǔn)確率不高,無(wú)法滿足船舶試航問題解決過程中專家查找的高精度要求。
因此,本文在綜合考慮已有專家推薦方法優(yōu)缺點(diǎn)的基礎(chǔ)上,針對(duì)船舶試航問題解決過程的特點(diǎn),利用超網(wǎng)絡(luò)搭建各知識(shí)屬性與技術(shù)專家之間的關(guān)聯(lián)關(guān)系,將船舶試航問題涉及的技術(shù)專家、技術(shù)對(duì)象、專業(yè)知識(shí)等信息整合到統(tǒng)一框架中,提出一種基于技術(shù)知識(shí)超網(wǎng)絡(luò)模型的專家推薦方法,降低船舶試航問題的專家查找難度,提高專家推薦的準(zhǔn)確率,及時(shí)、準(zhǔn)確地推薦最合適的專家列表,解決船舶試航過程中出現(xiàn)的問題,以保證船舶試航的安全性。
船舶試航問題的解決過程是技術(shù)知識(shí)形成的過程。為解決船舶試航中出現(xiàn)的問題,工程師會(huì)對(duì)發(fā)生的問題信息及問題情境信息進(jìn)行詳細(xì)地描述記錄;造船企業(yè)會(huì)依據(jù)試航問題中的技術(shù)對(duì)象、問題信息及問題情境信息在企業(yè)中查找相關(guān)的技術(shù)專家;在解決試航問題的技術(shù)活動(dòng)中,技術(shù)專家會(huì)針對(duì)技術(shù)對(duì)象、技術(shù)問題信息以及問題情境信息進(jìn)行分析,提出詳細(xì)的解決方案,并形成一則技術(shù)知識(shí)文檔存入到造船企業(yè)知識(shí)庫(kù)中。如圖1所示為從某造船企業(yè)獲取的一則技術(shù)知識(shí)文本,該文本中存在大量與試航問題相關(guān)的描述性信息,這些信息以自然語(yǔ)言的形式分布在技術(shù)知識(shí)文本中,如“燃油澄清艙的油不斷溢流”、“溢流至燃油泄放艙”等。此外,技術(shù)知識(shí)文本也包含大量問題解決方案的信息和一些無(wú)意義的信息。
船舶類型158K COT問題編號(hào)M3-1025關(guān)鍵字燃油澄清艙 預(yù)壓閥技術(shù)人員王傳明 楊 勇 周 海問題名稱:燃油澄清艙的油不斷溢流。簡(jiǎn)述:試航前燃油大艙加油800 t,高度8 m,燃油澄清艙在機(jī)艙二甲板,倉(cāng)高5.8 m,溢流管高度5 m。試航過程中,轉(zhuǎn)油結(jié)束后出現(xiàn)燃油澄清艙的油不斷溢流至燃油泄放艙。解決措施:將燃油輸送泵出口的閥更換為預(yù)壓閥,壓力設(shè)定略大于燃油大艙與燃油澄清艙的高度差,使得燃油澄清艙的油位只能通過輸送泵補(bǔ)給。相關(guān)圖紙: 修改前修改后啟示:對(duì)油艙布置要考慮使用情況,深入分析系統(tǒng)使用的功能性,試航過程中,重點(diǎn)關(guān)注燃柴油系統(tǒng)。
考慮技術(shù)知識(shí)文本中船舶試航問題解決過程所需的信息及先前工作[22-24]中的技術(shù)知識(shí)(TK)元素,船舶試航問題解決過程中形成的TK通常采用5個(gè)基本屬性來描述技術(shù)知識(shí)的核心特征,包括技術(shù)專家(TE)、技術(shù)對(duì)象(TO)、技術(shù)問題(TP)、問題情境(PC)、解決方案(TS)。其中:TO、TP、PC構(gòu)成試航問題的詳細(xì)信息,TP、PC、TS是技術(shù)知識(shí)的核心內(nèi)容(Main Content, MC)。因此,以TK=〈TO,TP,PC,TS,TE〉的形式對(duì)TK進(jìn)行結(jié)構(gòu)化描述,各屬性的內(nèi)涵如下:
(1)技術(shù)對(duì)象(TO):發(fā)生技術(shù)問題的具體對(duì)象,如燃油澄清艙;
除了這些哺乳動(dòng)物之外,還有一種神奇動(dòng)物多次在紐特身陷囹圄時(shí)幫上大忙。那就是外型看起來像植物的“護(hù)樹羅鍋”。在魔法世界,護(hù)樹羅鍋是一種守護(hù)樹木的動(dòng)物,長(zhǎng)著兩只褐色的小眼睛,性情平和、極其害羞,但是如果它所棲身的那棵樹受到威脅,它就會(huì)一躍而下,奮起反抗。
(2)技術(shù)問題(TP):描述出現(xiàn)的特定技術(shù)問題;
(3)問題情境(PC):描述技術(shù)問題所發(fā)生的具體環(huán)境、原因、過程等信息;
(4)技術(shù)方案(TS):解決技術(shù)問題的措施、操作步驟和難點(diǎn);
(5)技術(shù)專家(TE):所有參與解決問題的技術(shù)人員。
可以看出,船舶試航問題是由技術(shù)對(duì)象、技術(shù)問題、問題情境3個(gè)屬性構(gòu)成,造船企業(yè)若能夠依據(jù)技術(shù)對(duì)象、技術(shù)問題以及問題情境信息,在企業(yè)知識(shí)庫(kù)中快速、精確地查找到解決問題的技術(shù)專家,將具有很大的價(jià)值。
(2)基于技術(shù)知識(shí)超網(wǎng)絡(luò)的專家推薦 提取試航問題的技術(shù)對(duì)象、技術(shù)問題和問題情境3個(gè)屬性特征,利用超網(wǎng)絡(luò)中貝葉斯(Bayesian)推理方法計(jì)算技術(shù)專家與試航問題的相關(guān)度,并向用戶推薦相關(guān)度高的技術(shù)專家,以滿足解決試航問題的專家需求。
為了避免在TP,PC,TS屬性中提取到“試航”、“現(xiàn)象”等常見但刻畫技術(shù)知識(shí)無(wú)明顯意義的詞,本文對(duì)技術(shù)知識(shí)文檔進(jìn)行文本預(yù)處理,計(jì)算技術(shù)知識(shí)文本中每個(gè)詞的TF-IDF權(quán)重,保留不超過10個(gè)權(quán)重最大的名詞[21],填入TP,PC,TS屬性中,技術(shù)專家、技術(shù)對(duì)象中的信息直接填寫到TE、TO屬性中,形成TK=〈TO,TP,PC,TS,TE〉規(guī)范化表示形式,如表1所示。
表1 抽取的技術(shù)知識(shí)
續(xù)表1
經(jīng)過技術(shù)知識(shí)的規(guī)范化表征,過濾掉大量無(wú)關(guān)信息,仍然能夠保留技術(shù)知識(shí)文本中的關(guān)鍵概念,如圖1的原始文本和表1的規(guī)范化表示結(jié)果中,燃油澄清艙、機(jī)艙、溢流管等關(guān)鍵概念仍然保留在對(duì)應(yīng)的屬性中。
本文提出的專家推薦方法包括技術(shù)知識(shí)超網(wǎng)絡(luò)模型構(gòu)建和專家推薦兩部分,如圖2所示。
(1)技術(shù)知識(shí)超網(wǎng)絡(luò)模型構(gòu)建 基于規(guī)范化表征的技術(shù)知識(shí)和計(jì)算技術(shù)問題解決過程中技術(shù)專家之間的關(guān)聯(lián)度、技術(shù)對(duì)象之間的關(guān)聯(lián)度、知識(shí)核心內(nèi)容之間的關(guān)聯(lián)度,構(gòu)建專家子網(wǎng)、對(duì)象子網(wǎng)和知識(shí)子網(wǎng);利用TO,TP,PC,TS,TE共同作用形成的超邊構(gòu)建技術(shù)專家、技術(shù)對(duì)象、知識(shí)核心內(nèi)容之間的關(guān)聯(lián)關(guān)系,計(jì)算子網(wǎng)之間的超邊關(guān)聯(lián)度,從而形成技術(shù)知識(shí)的超網(wǎng)絡(luò)模型。
從企業(yè)技術(shù)部門收集相關(guān)的技術(shù)文檔,將包含技術(shù)問題、技術(shù)對(duì)象、問題情境、技術(shù)方案、技術(shù)專家屬性的文本和其他不需要的文本信息分離開,形成多屬性結(jié)構(gòu)化的技術(shù)知識(shí)文本。這種技術(shù)知識(shí)文本依然存在大量無(wú)意義的信息,不便于計(jì)算機(jī)的自動(dòng)處理。為過濾掉文本中對(duì)刻畫技術(shù)知識(shí)無(wú)意義的信息,便于計(jì)算技術(shù)知識(shí)超網(wǎng)絡(luò)中不同知識(shí)屬性之間的關(guān)聯(lián)性,對(duì)技術(shù)知識(shí)屬性信息進(jìn)一步精煉。
面向船舶試航問題的專家推薦是基于試航問題的技術(shù)對(duì)象、技術(shù)問題、問題情境3個(gè)屬性進(jìn)行的技術(shù)專家推薦,而傳統(tǒng)的專家推薦方法沒有綜合考慮問題對(duì)象、技術(shù)問題、問題情境與技術(shù)專家的相關(guān)性,導(dǎo)致船舶試航問題中的專家推薦準(zhǔn)確率不高。超網(wǎng)絡(luò)建模能夠描述同質(zhì)網(wǎng)絡(luò)節(jié)點(diǎn)之間的關(guān)聯(lián)關(guān)系和異構(gòu)網(wǎng)絡(luò)節(jié)點(diǎn)間的映射關(guān)系[26]。因此,通過利用技術(shù)知識(shí)超網(wǎng)絡(luò)模型構(gòu)建船舶試航問題解決過程中的知識(shí)屬性之間的關(guān)系,刻畫各知識(shí)屬性與技術(shù)專家之間的相關(guān)性來提高船舶試航問題中專家推薦的準(zhǔn)確率。
技術(shù)知識(shí)超網(wǎng)絡(luò)模型構(gòu)成屬性主要包括TE、TO、MC,其中MC=〈TP,PC,TS〉,各屬性之間的關(guān)系通過TE、TO、MC共同作用形成超邊進(jìn)行連接。超邊(HE)表示一個(gè)技術(shù)問題解決的技術(shù)活動(dòng),即一則技術(shù)知識(shí)表示一條超邊。3種屬性構(gòu)成關(guān)聯(lián)關(guān)系:在技術(shù)活動(dòng)中,技術(shù)專家在處理技術(shù)對(duì)象問題的技術(shù)活動(dòng)中產(chǎn)生了技術(shù)知識(shí)的核心內(nèi)容。由以上3種屬性構(gòu)成技術(shù)知識(shí)超網(wǎng)絡(luò)模型的3層子網(wǎng)絡(luò),分別是專家子網(wǎng)、對(duì)象子網(wǎng)、知識(shí)子網(wǎng)。
(2)對(duì)象子網(wǎng)No是由技術(shù)問題中各技術(shù)對(duì)象Vo及其關(guān)聯(lián)關(guān)系Eo組成的有向加權(quán)網(wǎng)絡(luò),連接兩個(gè)節(jié)點(diǎn)的邊表示技術(shù)活動(dòng)中解決兩個(gè)對(duì)象問題的專家之間關(guān)聯(lián)度。例如:滑油日用系統(tǒng)→主滑油泵兩個(gè)對(duì)象的關(guān)聯(lián)度為0.9,表示解決滑油日用系統(tǒng)問題的專家與解決主滑油泵問題的專家存在一定關(guān)聯(lián)性,其關(guān)聯(lián)度為0.9。換句話說,解決滑油日用系統(tǒng)的專家具有90%的可能性能夠解決主滑油泵出現(xiàn)的問題。
(3)知識(shí)子網(wǎng)Nk是由知識(shí)核心內(nèi)容Vk及其關(guān)聯(lián)關(guān)系Ek組成的無(wú)向加權(quán)網(wǎng)絡(luò),知識(shí)核心內(nèi)容Vk是由技術(shù)知識(shí)屬性TP、PC、TS構(gòu)成,其關(guān)聯(lián)關(guān)系Ek反映技術(shù)活動(dòng)中產(chǎn)生兩條技術(shù)知識(shí)內(nèi)容的技術(shù)專家之間關(guān)聯(lián)性。
現(xiàn)存資料中,呂溫的文和賦并不多,但是其文體范圍很廣泛。呂溫的文學(xué)思想,深受其師古文家梁肅“文本于道”“經(jīng)世致用”等觀點(diǎn)的影響,又與中唐文學(xué)運(yùn)動(dòng)中韓愈、柳宗元提出的“文以明道”觀點(diǎn)緊密相連。呂溫在二十幾歲時(shí),寫下《送薛大信歸臨晉序》一文,提出自己的文學(xué)觀點(diǎn):
背景的解讀是幫助學(xué)生理解作者的寫作用意、理解作者所表達(dá)的中心思想的一項(xiàng)重要內(nèi)容,也是鍛煉學(xué)生文本解讀能力的關(guān)鍵。但是,從目前的教學(xué)現(xiàn)狀來看,很多學(xué)生常常忽略這一部分內(nèi)容的解讀,導(dǎo)致在分析作者借助文本所傳達(dá)的意思時(shí)會(huì)有所偏離。所以,為了改變這一現(xiàn)狀,也為了真正提高學(xué)生的文本解讀能力,在教學(xué)時(shí),教師可以嘗試著讓學(xué)生借助課外資料或者是網(wǎng)絡(luò)資料來了解“背景”,進(jìn)而為學(xué)生解讀能力的提高夯實(shí)基礎(chǔ)。
知識(shí)超網(wǎng)絡(luò)模型中3層網(wǎng)絡(luò)之間的關(guān)聯(lián)關(guān)系通過超邊HE進(jìn)行連接,HE由一個(gè)技術(shù)活動(dòng)中多個(gè)專家、對(duì)象、知識(shí)核心內(nèi)容構(gòu)成,技術(shù)知識(shí)超網(wǎng)絡(luò)模型H=(V,E),其中V=(Vs,Vo,Vk),E=(Es,Eo,Ek,HE)。專家子網(wǎng)Ns=(Vs,Es),對(duì)象子網(wǎng)No=(Vo,Eo),知識(shí)子網(wǎng)Nk=(Vk,Ek)。
工程勘探工作是建筑工程施行之前所必須要進(jìn)行的工作,但是當(dāng)前相關(guān)人員大多忽視了工程勘探的重要性,僅僅在勘探的過程中做表面工作,或者在勘探的過程中忽視了對(duì)土質(zhì)的物理和化學(xué)指標(biāo)的勘察,另外,在地質(zhì)勘探過程中,布孔過于稀少或者深度不夠都會(huì)造成勘探不準(zhǔn)確的問題。
2.1.1 對(duì)象關(guān)聯(lián)度計(jì)算
對(duì)象子網(wǎng)No的構(gòu)建需要評(píng)估各技術(shù)對(duì)象概念之間的關(guān)聯(lián)關(guān)系。領(lǐng)域本體能夠較好地描述技術(shù)對(duì)象概念之間的關(guān)系[26],技術(shù)對(duì)象間的關(guān)聯(lián)關(guān)系Eo蘊(yùn)含在本體概念關(guān)系中,通過利用對(duì)象關(guān)聯(lián)系數(shù)(ORC)和對(duì)象關(guān)聯(lián)路徑(ORP)計(jì)算對(duì)象Vo的關(guān)聯(lián)度(OCD)。
定義1對(duì)象關(guān)聯(lián)系數(shù)(ORC)。ORC反映了船舶試航過程中對(duì)象概念之間的關(guān)聯(lián)關(guān)系,其關(guān)聯(lián)關(guān)系反映解決不同對(duì)象問題的專家之間的關(guān)聯(lián)度,取值范圍是0~1。若是相同關(guān)系,則兩個(gè)技術(shù)對(duì)象概念間的關(guān)系系數(shù)為1;若完全不相關(guān),則為0。關(guān)聯(lián)系數(shù)值越大,表明技術(shù)對(duì)象概念之間的關(guān)聯(lián)關(guān)系越高,即解決前一個(gè)對(duì)象問題的專家具有更高的可能性能夠解決另一個(gè)技術(shù)對(duì)象出現(xiàn)的問題。
根據(jù)技術(shù)專家和知識(shí)工程師調(diào)整試航問題的技術(shù)對(duì)象本體概念間的關(guān)聯(lián)關(guān)系和關(guān)聯(lián)系數(shù),船舶試航問題的技術(shù)本體概念之間的關(guān)系包括相同關(guān)系(Same-as)、相似關(guān)系(Similar-with)、繼承關(guān)系(Kind-of)、整體與部分關(guān)系(Part-of)等,其值如表2所示。如圖3所示為“滑油日用系統(tǒng)”技術(shù)對(duì)象本體片段。
表2 對(duì)象本體間的關(guān)聯(lián)系數(shù)
OCD(滑油日用系統(tǒng),主滑油泵)=0.9;
(1)
定義3對(duì)象關(guān)聯(lián)度(OCD)。設(shè)Oi和Oj是試航過程中的兩個(gè)對(duì)象,從Oi到Oj之間存在ω條對(duì)象關(guān)聯(lián)路徑,即可能存在ω個(gè)關(guān)聯(lián)關(guān)系系數(shù)乘積,其中最大的關(guān)聯(lián)路徑乘積稱為對(duì)象關(guān)聯(lián)度,即為Eo,
Eo(O1,On)=OCD(O1,On)=maxk=1,2…,ω
[RNumk(O1,On)]。
(2)
基于圖3“滑油日用系統(tǒng)”本體片段,計(jì)算一些對(duì)象之間的關(guān)聯(lián)度,例如:
菊芋生長(zhǎng)高度在1~3 m不等,秋季開花,花如菊,黃色。葉子是橢圓形,多毛。根莖系統(tǒng)深埋于地下并且比較結(jié)實(shí)粗壯,葉子互生于莖的頂端,較低的葉子能夠長(zhǎng)30 cm,長(zhǎng)而寬,中央是花頭,5.0~7.5 cm,被莖分支下單獨(dú)生出的側(cè)花包圍。多瘤的塊莖在地下不均勻生長(zhǎng),其顏色有淺褐色、白色、紅色等[1]。
OCD(主滑油泵,滑油日用系統(tǒng))=0.7;
OCD(滑油系統(tǒng),主滑油泵)=0.9×0.9=0.81;
OCD(滑油泄放系統(tǒng),主滑油泵)=0.7×0.9×0.9=0.567。
2.1.2 知識(shí)核心內(nèi)容關(guān)聯(lián)度計(jì)算
TSSim計(jì)算兩則TK中TS屬性相似度,反映提出兩個(gè)TS的專家之間的關(guān)聯(lián)性。由于TS是概念集,可直接利用語(yǔ)義相似度進(jìn)行屬性關(guān)聯(lián)計(jì)算。
基于技術(shù)知識(shí)網(wǎng)絡(luò)需要評(píng)估各Vk節(jié)點(diǎn)間的關(guān)聯(lián)強(qiáng)度。對(duì)兩則規(guī)范化TK的屬性TP、PC、TS進(jìn)行關(guān)聯(lián)性評(píng)估,通過線性加權(quán)求和的方式得到Vk間的關(guān)聯(lián)強(qiáng)度。
(1)KACSim計(jì)算
由于TP,PC是概念集,可直接利用語(yǔ)義相似度進(jìn)行屬性關(guān)聯(lián)計(jì)算。情境關(guān)聯(lián)側(cè)重于面向不同知識(shí)應(yīng)用情境之間的專家關(guān)聯(lián)關(guān)系,對(duì)此,采用式(3)進(jìn)行計(jì)算,即:
KAC是描述技術(shù)知識(shí)中技術(shù)方案所應(yīng)用的情境,包括技術(shù)知識(shí)的技術(shù)問題(TP)和問題情境(PC)。KACSim反映了根據(jù)兩個(gè)KAC產(chǎn)生技術(shù)方案的技術(shù)專家之間存在一定的關(guān)聯(lián)關(guān)系,即解決一個(gè)KAC問題的技術(shù)專家具有一定可能性解決另一個(gè)KAC的問題。對(duì)于KACSim,存在3種假設(shè)關(guān)系,具體如下:
(3)
(4)
(5)
(6)
(2)TSSim計(jì)算
知識(shí)核心內(nèi)容Vk由技術(shù)知識(shí)屬性TP、PC、TS構(gòu)成,其關(guān)聯(lián)關(guān)系Ek反映了產(chǎn)生兩條技術(shù)知識(shí)內(nèi)容的技術(shù)專家之間的關(guān)聯(lián)性,其中TP、PC組成了技術(shù)知識(shí)的知識(shí)應(yīng)用情境(KAC)[27],即KAC=〈TP,PC〉。
(7)
計(jì)算式(4)~式(7)中的技術(shù)知識(shí)屬性KA(KA表示一個(gè)TP,PC,TS)的相似度,技術(shù)知識(shí)屬性KA是由一組工程概念組成的概念集,即屬性KA1={XS1,XS2,…,XSm},屬性KA2={YS1,YS2,…,YSn},屬性關(guān)聯(lián)度
4.技術(shù)創(chuàng)新是系統(tǒng)發(fā)展的動(dòng)力。長(zhǎng)遠(yuǎn)來看,隨著大數(shù)據(jù)、云計(jì)算、3S、自動(dòng)駕駛、人工智能等新興技術(shù)的快速發(fā)展與其在城市智能交通管理中的應(yīng)用,我國(guó)必須重點(diǎn)發(fā)展本土創(chuàng)新技術(shù)。當(dāng)前,我國(guó)智能交通管理系統(tǒng)的發(fā)展仍在依賴于國(guó)際成熟系統(tǒng),如智能交通控制系統(tǒng),我國(guó)主要應(yīng)用英國(guó)SCOOT系統(tǒng)和澳大利亞SCAT系統(tǒng)。在發(fā)展創(chuàng)新技術(shù)中,不僅要重視軟件系統(tǒng)的開發(fā),也要重視基礎(chǔ)設(shè)備的開發(fā)和創(chuàng)新性應(yīng)用。選準(zhǔn)突破口進(jìn)行產(chǎn)業(yè)化,形成自己的技術(shù)創(chuàng)新力量,才能保持我國(guó)智能交通產(chǎn)業(yè)的健康可持續(xù)發(fā)展。
但是隨著與菲莉斯戀愛關(guān)系的推進(jìn),卡夫卡對(duì)于婚姻帶來的倫理關(guān)系和肉體關(guān)系的恐懼逐漸增加。在日記中他剖析自己“恐懼結(jié)合,恐懼失落于對(duì)方”[13]117-137,用他自己的說法,除寫作之外,他幾乎恐懼一切。
Rel(KA1,KA2)=
(8)
式(8)中的工程概念語(yǔ)義相似度
第三,大數(shù)據(jù)保護(hù)是財(cái)產(chǎn)權(quán)利和道德權(quán)利的結(jié)合。盡管美國(guó)法一直秉承實(shí)用主義,但在數(shù)據(jù)保護(hù)的研究中,學(xué)者們也廣泛意識(shí)到道德權(quán)利的重要性。對(duì)道德權(quán)利的關(guān)照,大陸法系國(guó)家是具有法治傳統(tǒng)的。大數(shù)據(jù)領(lǐng)域涉及海量個(gè)人信息,這些信息往往與個(gè)人身份有關(guān),而大數(shù)據(jù)收集、共享、使用等過程都在個(gè)人不可控的情況下隱匿進(jìn)行,倘若在大數(shù)據(jù)保護(hù)中不關(guān)照道德權(quán)利,個(gè)人身份利益保護(hù)將成為無(wú)稽之談,因?yàn)榇髷?shù)據(jù)完全突破了傳統(tǒng)民法保護(hù)的藩籬。因此,大數(shù)據(jù)保護(hù)立法必須體現(xiàn)道德權(quán)利與財(cái)產(chǎn)權(quán)利的結(jié)合。
CSSim(XSi,YSj)=
(9)
式(9)中,采用詞語(yǔ)的標(biāo)準(zhǔn)化互信息(NMI)[21,28]計(jì)算技術(shù)知識(shí)文本庫(kù)D中兩個(gè)不相同且詞義不同的詞語(yǔ)word1和word2間的語(yǔ)義關(guān)聯(lián)度
NMI(word1,word2)=
(10)
式中:p(word1)表示含有詞語(yǔ)word1的技術(shù)知識(shí)文本在技術(shù)知識(shí)文本庫(kù)D中所占的比例;p(word1,word2)表示同時(shí)含有word1和word2的文本在文本庫(kù)D中所占比例;|D|為文本庫(kù)中文本數(shù)量。
(3)Vk之間的關(guān)聯(lián)度計(jì)算
問題設(shè)計(jì):談?wù)劦谌龁卧n文中讓你印象深刻的一位父親或母親;誦讀文中父母讓你動(dòng)情的語(yǔ)句;說說這些語(yǔ)句讓你感動(dòng)的原因。然后由學(xué)生總結(jié)細(xì)節(jié)描寫的作用(可以全面展示人物性格,使人物形象更豐滿,使作者情感流露得更真實(shí)細(xì)膩)。
(11)
對(duì)知識(shí)應(yīng)用情境關(guān)聯(lián)度賦權(quán)重α,技術(shù)方案關(guān)聯(lián)度賦權(quán)重(1-α),α∈[0,1]。α值用來區(qū)分KAC和TS的重要性,由于船舶試航問題的屬性僅包含TO和KAC,與TS無(wú)關(guān),因此α賦值為1。
在中國(guó)傳統(tǒng)文化中,牲畜是被認(rèn)為很低賤的,常用來罵人,《資治通鑒·隋文帝仁壽四年》:“上恚,抵床曰:‘畜生何足付大事!”胡三省注曰:“今人詈人猶曰畜生。言其無(wú)識(shí)無(wú)禮,若馬牛犬豕然,待畜養(yǎng)而生者也?!痹诒姸嗌笾?,驢被認(rèn)為比其他牲畜更為低賤,也常用來罵人,例如蠢驢、犟驢等。
2.1.3 超邊關(guān)聯(lián)度計(jì)算
為利用技術(shù)知識(shí)超網(wǎng)絡(luò)模型推薦相關(guān)專家,本文提出技術(shù)知識(shí)超網(wǎng)絡(luò)中兩項(xiàng)統(tǒng)計(jì)特征指標(biāo):
(1)節(jié)點(diǎn)超度dV(Vi)
ELISA實(shí)驗(yàn)用來檢測(cè)MH7A細(xì)胞上清中炎癥細(xì)胞因子IL-1β和IL-6水平,具體實(shí)驗(yàn)方案如下:收集處理好的MH7A細(xì)胞培養(yǎng)上清,12 000 r/min離心10 min,收集上清,按照GenStar ELISA試劑盒說明進(jìn)行試驗(yàn)。
(12)
(13)
2.2.1 船舶試航問題的特征信息抽取
面對(duì)船舶試航過程出現(xiàn)的問題,試航人員將試航問題按照“技術(shù)對(duì)象—技術(shù)問題—問題情境”形式進(jìn)行表示,然后對(duì)試航問題文本進(jìn)行分詞并計(jì)算TF-IDF權(quán)重,抽取技術(shù)問題和問題情境屬性不超過10個(gè)權(quán)重最大的名詞作為對(duì)應(yīng)屬性的特征,從而過濾掉文本中對(duì)刻畫試航問題無(wú)意義的信息,而對(duì)于技術(shù)對(duì)象的內(nèi)容直接作為該問題屬性的特征信息。
2.2.2 基于技術(shù)知識(shí)超網(wǎng)絡(luò)模型的專家相關(guān)度計(jì)算
(14)
2.2.3 基于技術(shù)知識(shí)超網(wǎng)絡(luò)模型的專家推薦方法
第三個(gè)項(xiàng)目體現(xiàn)了醫(yī)院各部門間的良好協(xié)同性,促進(jìn)了節(jié)能項(xiàng)目的順利開展。連續(xù)數(shù)月的數(shù)據(jù)顯示鍋爐運(yùn)行時(shí)間延時(shí)之后,能源管理平臺(tái)及時(shí)分析原因,發(fā)現(xiàn)是由于供應(yīng)室任務(wù)量大、加班所致,對(duì)此擬定了數(shù)條解決方案。經(jīng)過與相關(guān)部門的反復(fù)溝通,確定由總務(wù)處配合供應(yīng)室進(jìn)行清洗、蒸汽消毒設(shè)備增容改造,使得供應(yīng)室工作流程得到優(yōu)化,工作效率獲得提高,鍋爐供汽時(shí)間縮短2小時(shí)/天,蒸汽損失減少約159立方米/月。
如何利用技術(shù)知識(shí)文本構(gòu)建的超網(wǎng)絡(luò)模型準(zhǔn)確地推薦與試航問題匹配的技術(shù)專家,是實(shí)現(xiàn)本文提出的專家推薦方法的關(guān)鍵。本文通過利用技術(shù)知識(shí)超網(wǎng)絡(luò)模型進(jìn)行專家推薦,其方法流程圖如圖5所示。具體步驟如下:
圖8 為總氮的分析結(jié)果,由圖8可以看出降雨開始時(shí)總氮為0.8mg/L,為Ⅲ類水體;降雨開始4小時(shí)后污染物濃度達(dá)到峰值1.4mg/L,為Ⅳ類水體;降雨開始6小時(shí)后,由于稀釋作用,基本恢復(fù)為Ⅲ類水體。之后隨著第二次降雨峰值的出現(xiàn),水質(zhì)有一定的惡化。總體而言,降雨徑流對(duì)總氮的影響較小,一天中超過Ⅲ類水質(zhì)時(shí)間約為6小時(shí),降雨徑流對(duì)總氮的濃度變化存在一定影響,但在可接受范圍內(nèi)。
輸入:船舶試航過程中某條試航問題的技術(shù)對(duì)象O、技術(shù)問題屬性特征集合TP、問題情境屬性特征集合PC,以及船舶技術(shù)知識(shí)超網(wǎng)絡(luò)H(根據(jù)造船企業(yè)中的知識(shí)文檔庫(kù)構(gòu)建)。
輸出:j個(gè)最匹配的設(shè)計(jì)專家s1,s2,…,sj。
步驟5按最終得分對(duì)技術(shù)專家降序排序,輸出排名最高j個(gè)技術(shù)專家。
本文的案例分析數(shù)據(jù)來自上海某大型造船企業(yè),為保證上述方法的推薦效果和驗(yàn)證方法的有效性,在Core i7 CPU(3.6 GHz)、8 G內(nèi)存、Windows10操作系統(tǒng)的計(jì)算機(jī)配置環(huán)境下,以Python語(yǔ)言執(zhí)行專家推薦算法進(jìn)行了兩組實(shí)驗(yàn)。造船企業(yè)中資深工程師對(duì)專家推薦結(jié)果進(jìn)行了評(píng)判和統(tǒng)計(jì)分析,對(duì)比分析不同參數(shù)下的專家推薦的準(zhǔn)確率,以確定基于技術(shù)知識(shí)超網(wǎng)絡(luò)模型的專家推薦(Supernetwork-based)方法中最優(yōu)參數(shù)值(β,j);對(duì)比分析Supernetwork-based專家推薦方法與僅考慮文本內(nèi)容相關(guān)度的專家推薦方法(Content-based)、知識(shí)相關(guān)度和專家權(quán)威度融合的專家推薦方法(REAU-based)的效果,以評(píng)估方法有效性。
在企業(yè)技術(shù)知識(shí)文本庫(kù)中抽取實(shí)驗(yàn)所用的技術(shù)案例,按照技術(shù)知識(shí)的屬性內(nèi)容并進(jìn)行規(guī)范化表征,計(jì)算技術(shù)問題解決過程中知識(shí)屬性之間的關(guān)聯(lián)度,構(gòu)建用于專家推薦實(shí)驗(yàn)的技術(shù)知識(shí)超網(wǎng)絡(luò)模型,以船舶試航過程中10組試航問題作為輸入進(jìn)行實(shí)驗(yàn)分析驗(yàn)證。如表3所示為試航過程中出現(xiàn)的試航問題。
表3 試航過程中部分問題
續(xù)表3
實(shí)驗(yàn)1確定Supernetwork-based算法中的最優(yōu)參數(shù)值,即閾值β值和推薦數(shù)量j值。準(zhǔn)確率precision評(píng)估推薦結(jié)果的精確性,是衡量專家推薦性能的最常用指標(biāo)之一。precision=TP/(TP+FP),對(duì)于給定的試航問題,TP表示被正確分到這個(gè)問題的專家數(shù)量,F(xiàn)P表示被錯(cuò)誤分到這個(gè)問題的專家數(shù)量。
測(cè)試本文所提方法在不同閾值β值和j值的專家推薦效果,不同閾值β值和j值專家推薦的準(zhǔn)確率對(duì)比采用P@j(前j項(xiàng)結(jié)果中的準(zhǔn)確率)在10組專家查詢實(shí)驗(yàn)中專家推薦準(zhǔn)確率的平均值。測(cè)試實(shí)驗(yàn)結(jié)果如圖6所示。
在圖6的實(shí)驗(yàn)中,當(dāng)β值逐漸增大時(shí),Supernetwork-based方法能夠推薦與問題更加匹配的專家;當(dāng)專家推薦的準(zhǔn)確率持續(xù)上升,Supernetwork-based方法能夠推薦與試航問題更加匹配的專家,在β=0.6時(shí)達(dá)到較高的準(zhǔn)確率。但當(dāng)β值不變時(shí),j值過高時(shí),很難推薦足夠數(shù)量與問題匹配的專家,從而影響用戶的體驗(yàn)結(jié)果。閾值β值和推薦數(shù)量j值在某種程度上影響試航問題中的專家推薦效果,當(dāng)β=0.6,j=10時(shí),算法效果較佳。
實(shí)驗(yàn)2Supernetwork-based專家推薦方法與知識(shí)相關(guān)度和專家權(quán)威度融合的專家推薦方法(REAU-based)[3]、僅考慮文檔內(nèi)容相關(guān)度的專家推薦方法(content-based)[9]的推薦效果比較。REAU-based是一種面向MediaWiki平臺(tái)的專家推薦方法,實(shí)驗(yàn)過程中對(duì)該造船企業(yè)MediaWiki平臺(tái)數(shù)據(jù)進(jìn)行篩選,保證與Supernetwork-based方法中的技術(shù)知識(shí)集一致,然后計(jì)算技術(shù)專家的知識(shí)水平與特定試航問題關(guān)鍵詞的相關(guān)度以及專家在專家網(wǎng)絡(luò)中的權(quán)威度并進(jìn)行專家排序;Content-based是計(jì)算試航問題關(guān)鍵詞與專家創(chuàng)建的技術(shù)知識(shí)文檔主題的相關(guān)度并推薦相關(guān)度高的專家。
Supernetwork-based專家推薦方法的主要目的是提高專家推薦的準(zhǔn)確率,因此設(shè)定Supernetwork-based專家推薦方法中問題相似度閾值β值為0.6,分別對(duì)3種專家推薦方法進(jìn)行10組專家查詢實(shí)驗(yàn),選取前10位專家的準(zhǔn)確度作為實(shí)驗(yàn)結(jié)果,測(cè)試實(shí)驗(yàn)結(jié)果如圖7所示。
通過實(shí)驗(yàn)發(fā)現(xiàn),技術(shù)知識(shí)超網(wǎng)絡(luò)模型的專家推薦方法推薦準(zhǔn)確率高于其他方法。另外,在實(shí)驗(yàn)過程中發(fā)現(xiàn)試航問題Q7、Q9、Q10利用Content-based方法幾乎很難準(zhǔn)確查詢到相關(guān)專家,REAU-based方法查詢專家的準(zhǔn)確率較低,產(chǎn)生這一現(xiàn)象的原因是試航問題Q7、Q9、Q10在以往的試航過程中沒有或者很少發(fā)生,很難在技術(shù)知識(shí)庫(kù)中匹配到相關(guān)的技術(shù)知識(shí)文檔或主題,無(wú)法搭建技術(shù)專家與特定問題的關(guān)聯(lián)關(guān)系,使得Content-based和REAU-based方法在這一類試航問題中很難快速有效地查找到足夠數(shù)量的相關(guān)專家;而Supernetwork-based方法在這一類試航問題中依然能夠根據(jù)試航問題中的技術(shù)對(duì)象屬性對(duì)專家相關(guān)度進(jìn)行計(jì)算,其推薦準(zhǔn)確率高于其他方法的推薦準(zhǔn)確率。因此,從圖7可以看出,Supernetwork-based方法在面向船舶試航問題的專家推薦中具有更好的推薦效果。
針對(duì)傳統(tǒng)專家推薦方法的不足,本文綜合考慮船舶試航問題解決過程中的信息需求及企業(yè)知識(shí)庫(kù)中技術(shù)知識(shí)文本的結(jié)構(gòu)特點(diǎn),提出一種基于技術(shù)知識(shí)超網(wǎng)絡(luò)模型的專家推薦方法,其特點(diǎn)為:①針對(duì)船舶試航問題的特殊性,利用5個(gè)屬性來描述試航問題解決過程中形成的技術(shù)知識(shí)核心特征,抽取技術(shù)知識(shí)的屬性內(nèi)容并進(jìn)行規(guī)范化表征,有效避免專家推薦過程中存在大量無(wú)關(guān)信息;②采用本體構(gòu)建技術(shù)和語(yǔ)義相似度計(jì)算方法構(gòu)建技術(shù)知識(shí)超網(wǎng)絡(luò)模型,將船舶試航問題中的不同屬性以及屬性之間的各種關(guān)系整合到統(tǒng)一框架中,刻畫各知識(shí)屬性與技術(shù)專家之間關(guān)系,提高了船舶試航問題的專家推薦精確度;③通過利用超網(wǎng)絡(luò)中貝葉斯推理方法計(jì)算試航問題中問題對(duì)象與技術(shù)專家之間關(guān)聯(lián)度,有效降低船舶試航問題的專家查找難度。不失一般性,本文提出的方法也可用于其他復(fù)雜工程問題解決的專家查找,但存在一定先決條件:工程問題需要具有明確的問題對(duì)象,且在領(lǐng)域內(nèi)建立了較為完善的對(duì)象本體概念間的關(guān)聯(lián)關(guān)系。
因?yàn)榧夹g(shù)專家網(wǎng)絡(luò)具有無(wú)標(biāo)度和小世界特性,這可能導(dǎo)致某些技術(shù)實(shí)力較強(qiáng)的專家會(huì)在多個(gè)問題中被同時(shí)推薦,但在實(shí)際問題解決過程中技術(shù)專家很難有大量的精力同時(shí)解決多個(gè)技術(shù)問題,所以實(shí)際應(yīng)用中會(huì)影響問題的解決效率。下一步,將通過不同的船舶試航場(chǎng)景進(jìn)行方法的應(yīng)用驗(yàn)證,根據(jù)實(shí)際應(yīng)用的場(chǎng)景調(diào)整超網(wǎng)絡(luò)模型結(jié)構(gòu)和參數(shù),同時(shí)設(shè)置問題難度等級(jí)、專家水平等級(jí)以及擴(kuò)充專家?guī)欤贡疚奶岢龅幕诩夹g(shù)知識(shí)超網(wǎng)絡(luò)模型的專家推薦方法能夠考慮實(shí)際應(yīng)用特點(diǎn),更好地適應(yīng)不同場(chǎng)景的專家推薦要求。