(深圳中廣核工程設計有限公司,深圳 518100)
隨著核電的快速發(fā)展,核安全越來越受到人們的關注[1]。作為保障核安全的一項管理工具,經驗反饋體系在國內外核電行業(yè)中得到了廣泛地應用。所謂經驗反饋,就是對項目建設過程、經營管理活動中產生的經驗教訓進行收集、分析、改進和應用,進而避免同類事件重復發(fā)生的閉環(huán)管理過程,以及對項目建設過程、經營管理活動中的良好實踐及經驗總結進行收集和應用的過程。經驗反饋的有效開展確保了核電的安全、可靠、穩(wěn)定運行。在核電設計中,經驗反饋為設計人員提供了必要的參考信息,讓他們從設計角度查看發(fā)生過的缺陷,并針對缺陷采取改進行動,防止歷史事件的重復發(fā)生。隨著核電站建設從大亞灣到紅沿河、陽江、寧德等的陸續(xù)開展,技術從引進消化吸收到自主研發(fā),中廣核工程有限公司積累了大量的經驗反饋信息。在后續(xù)發(fā)展中,經驗反饋信息的規(guī)模還將繼續(xù)增大。隨著數(shù)據(jù)量的日益龐大,如何充分利用這些寶貴的知識數(shù)據(jù),高效地提供給設計人員,逐漸成為后續(xù)核電信息化研究的重點。
在互聯(lián)網迅速發(fā)展的今天,信息超載問題早已成為一個重要的研究熱點。為了幫助用戶快速查找有價值的信息資源,分類目錄、搜索引擎和推薦系統(tǒng)陸續(xù)誕生。分類目錄是將網站按照特定屬性進行分類整理,通過提供網站目錄供用戶查找信息資源,典型的網站有Yahoo、hao123等。搜索引擎是通過關鍵字來查找自己需要的信息,Google、Baidu等主流的搜索引擎已逐漸成為人們日常生活中訪問網絡資源的入口。個性化推薦系統(tǒng)技術[2]是另一種信息過濾的重要手段,能夠根據(jù)用戶的興趣愛好為用戶推薦感興趣信息。該技術最典型的應用是在電子商務領域,網上購物時,網站將根據(jù)用戶的注冊信息、瀏覽或交易記錄等推薦顧客可能感興趣或滿意的商品,幫助顧客在龐大信息面前發(fā)現(xiàn)對自己有價值的產品,同時也提高了網站的銷售量,為顧客用戶和網站之間搭建了橋梁,實現(xiàn)彼此雙贏。目前,幾乎所有的大型電子商務系統(tǒng),如國外的Amazon、eBay,國內的淘寶、京東、當當?shù)龋疾煌潭鹊厥褂昧烁鞣N形式的推薦系統(tǒng)。此外,在電影、音樂、旅游、新聞等多種類型網站中,推薦系統(tǒng)同樣得到了廣泛的應用研究。與分類目錄、搜索引擎相比,推薦系統(tǒng)能夠通過研究用戶的興趣愛好,發(fā)現(xiàn)用戶的興趣點,進行個性化推薦,引導用戶發(fā)現(xiàn)自己的信息需求[3]。作為解決信息超載問題的新興工具,個性化推薦技術具有廣泛的研究前景和應用空間。
本文通過研究互聯(lián)網行業(yè)中個性化推薦系統(tǒng)技術,研發(fā)出工程經驗反饋推薦系統(tǒng)。該系統(tǒng)實現(xiàn)了在核電設備設計過程中的經驗反饋智能化推薦,為設計人員主動推送他們所需要的知識信息,有效地滿足了不同設計人員的需求,實現(xiàn)了經驗知識的智能化、自動化和個性化,提高了核電設備設計的效率。
20世紀90年代,Resnick[2]首次提出了在新聞協(xié)同過濾方面應用的個性化推薦技術。個性化推薦系統(tǒng)[4]通過分析用戶的興趣愛好、個人信息、操作行為以及社會關系等信息,主動推薦用戶感興趣的內容。通用的推薦系統(tǒng)主要包括三個模塊:用戶建模模塊、推薦算法模塊、推薦對象模塊[5]。推薦系統(tǒng)首先根據(jù)獲取到的用戶信息創(chuàng)建用戶模型,然后利用該用戶模型采用特定的推薦算法對推薦對象進行篩選,找到用戶可能感興趣的對象并推薦給用戶。
目前常用的推薦技術主要有:基于內容的推薦、協(xié)同過濾推薦、基于關聯(lián)規(guī)則的推薦、混合推薦等。
基于內容的推薦(content-based recommendation)是信息檢索方法的延續(xù)和發(fā)展[6]。該方法通過計算推薦對象與用戶已選擇或收藏對象之間的相似度,將相似度較高的對象作為推薦結果?;趦热莸耐扑]方法首先對用戶的興趣偏好建模創(chuàng)建用戶興趣特征,然后提取推薦對象的內容特征,與用戶模型的興趣特征匹配,最后將匹配度較高的推薦對象推薦給用戶[3]。
協(xié)同過濾推薦(collaborative filtering recommendation)是目前推薦系統(tǒng)中研究最早[7~9],應用最成功的技術之一。該技術被大量應用于電子商務、新聞、電影、音樂等各類推薦網站中。根據(jù)協(xié)同對象,協(xié)同過濾推薦分為基于用戶、基于物品和混合三種協(xié)同推薦方法。
基于用戶協(xié)同過濾推薦方法首先通過最近鄰算法,根據(jù)用戶的歷史興趣偏好得到用戶之間的相似性,然后利用待推薦用戶的最近鄰居用戶對物品評價的加權評價值來預測待推薦用戶對某未知物品的喜好程度,最后系統(tǒng)根據(jù)這一喜好程度進行物品推薦?;谖锲穮f(xié)同過濾推薦方法建立物品的相似近鄰,利用待推薦用戶對某物品相似近鄰評價的加權評價值來得到用戶對該物品的喜好程度,從而進行物品推薦。所謂混合協(xié)同推薦方法,主體思路還是基于用戶協(xié)同過濾推薦方法,但在計算兩個用戶相似性時嵌套了基于物品協(xié)同思想。
基于關聯(lián)規(guī)則的推薦(association rule-based recommendation)是通過數(shù)據(jù)挖掘得到某種關聯(lián)規(guī)則,以此完成推薦的一種技術[10]。該技術首先對推薦對象進行數(shù)據(jù)分析,找到對象之間的關聯(lián)關系,最后利用該規(guī)則根據(jù)用戶已選擇對象將有價值的信息推薦給用戶。比如,買了牛奶的人大多會購買面包,牛奶和面包并不是同類物品,但它們之間卻存在著特定的關系。顯然,該推薦技術中關聯(lián)規(guī)則的確定尤為關鍵,而且該規(guī)則的分析可在推薦前的離線模式下完成,能夠滿足實時推薦的要求。
各種推薦技術均有優(yōu)缺點,混合推薦(hybrid recommendation)通過組合多種推薦方法揚長避短,在實際中經常被采用。其中,研究和應用最多的是基于協(xié)同過濾和基于內容的組合[11~13]。文獻[5]根據(jù)組合的思路,將混合推薦分為了三類:后融合、中融合和前融合。后融合通過某種策略比如加權等方式直接融合各推薦方法的推薦結果作為最后的推薦對象。中融合以某種推薦方法作為框架,融合其他推薦方法,比如在一種推薦方法產生的結果中進一步采用第二種推薦方法來完成更精確的推薦。前融合則是直接融合各種推薦方法,比如特征的組合擴充。
在實際應用中,推薦系統(tǒng)主要有兩種模式存在:一種是作為系統(tǒng)模塊依附于某類資源網站,比如購物類網站淘寶和京東,其商品推薦系統(tǒng)只是購物時提供幫助的模塊;另一種是作為獨立的網站,比如豆瓣音樂,其界面簡潔,整個網站是一套完整的音樂推薦系統(tǒng)。本文的工程經驗反饋推薦系統(tǒng)則采用第一種模式,集成在中廣核設計院自主研發(fā)的設備專業(yè)協(xié)同設計平臺(以下簡稱設備設計平臺)中,以實現(xiàn)設計人員在設備設計過程中自動獲取有價值的經驗知識信息。
本文的工程經驗反饋推薦系統(tǒng)涉及兩個平臺:設備設計平臺和經驗反饋平臺。設備設計平臺是設備專業(yè)在設計過程中從業(yè)務到設計流程規(guī)范化的管理平臺。該平臺實現(xiàn)了設計流程的規(guī)范統(tǒng)一,設計工具的集成調用,設計數(shù)據(jù)的結構化組織。設計人員可以通過設備設計平臺上的相關設計流程來完成自己的設計分析任務,包括任務接收、開展和提交。經驗反饋平臺是經公司質保部門認可,保存公司核電經驗反饋的信息管理平臺。所有正式的經驗反饋均需要在此平臺上進行編校審批流程并存檔。
在以往的設計過程中,設計人員往往需要登錄公司經驗反饋平臺不斷地查找對設計有幫助的經驗知識數(shù)據(jù)。設計人員根據(jù)自己的設計內容和經驗確定自己的需求信息,通過關鍵字在經驗反饋系統(tǒng)中去查找相關數(shù)據(jù),每次搜索都是從所有數(shù)據(jù)中進行查找,整個過程消耗了大量的時間。此外,個人語言組織能力、需求不明確和經驗不足也影響著搜索關鍵字的確定,進而制約了數(shù)據(jù)查找的效率。這種情況下,設備設計過程和經驗反饋查找是兩個彼此獨立的活動,中間缺少必要的關聯(lián)耦合。工程經驗反饋推薦系統(tǒng)則作為兩者的橋梁,從經驗反饋平臺中獲取數(shù)據(jù),根據(jù)用戶的需求篩選出對設計有價值的信息,主動推送到設備設計平臺中,減少了設計人員自己查找的中間環(huán)節(jié),提高了設計的效率。
工程經驗反饋推薦系統(tǒng)通過建立用戶與經驗反饋之間的二元關系,從用戶的人員信息、設計信息等方面研究,利用與經驗反饋的特定相似關系,挖掘用戶潛在感興趣的經驗反饋內容,進行有針對性的推薦。
圖1 工程經驗反饋推薦系統(tǒng)流程圖
依據(jù)背景特點,工程經驗反饋推薦系統(tǒng)被分為四個模塊:數(shù)據(jù)收集模塊、數(shù)據(jù)分析模塊、用戶分類模塊、信息篩選模塊。各模塊的關系如圖1所示,其中虛線框內為工程經驗反饋推薦系統(tǒng)范疇。該推薦系統(tǒng)首先從外部經驗反饋平臺中獲取經驗反饋的所有數(shù)據(jù)信息,并保存到設備設計平臺的數(shù)據(jù)庫中。然后,在離線狀態(tài)下利用預先定義的規(guī)則對數(shù)據(jù)進行聚類分析。此外,該系統(tǒng)根據(jù)用戶的人員信息(部門、專業(yè)等)和設計信息(設計的內容和所屬項目機組設備等)將用戶分類。最后,在設計過程中,根據(jù)設計人員所屬類別,按照預先定義的規(guī)則從經驗反饋中篩選出相似性較高的數(shù)據(jù)并呈現(xiàn)到設計界面上,實現(xiàn)智能推送的目的。
正如前面提到的,本文推薦系統(tǒng)的數(shù)據(jù)來源于公司的經驗反饋平臺。該平臺為外部系統(tǒng)提供了統(tǒng)一的數(shù)據(jù)訪問接口。系統(tǒng)連接采用了標準的xml數(shù)據(jù)接口方式,由經驗反饋平臺提供的webservice接口實現(xiàn)??紤]到經驗反饋的標題通常呈現(xiàn)了正文的關鍵信息,在保證推薦效果的前提下為了減少分析時間,本推薦系統(tǒng)獲取了經驗反饋數(shù)據(jù)除正文外的其他關鍵字段,如圖2所示。最后,解析獲取到的xml數(shù)據(jù),并保存到設備設計平臺數(shù)據(jù)庫中進行分析。
圖2 獲取的數(shù)據(jù)內容
得到數(shù)據(jù)后,對數(shù)據(jù)進行分析,在離線狀態(tài)下提前確定好數(shù)據(jù)之間的關系,能夠為信息篩選模塊減少大量時間。本文推薦系統(tǒng)的數(shù)據(jù)分析是利用預先定義的規(guī)則建立經驗反饋數(shù)據(jù)之間的關聯(lián)關系。數(shù)據(jù)規(guī)則的定義則是通過與設計人員溝通根據(jù)數(shù)據(jù)的應用情況確定的,具體內容如表1所示。
表1 數(shù)據(jù)處理規(guī)則
數(shù)據(jù)處理方法:首先按照項目和機組信息將經驗反饋進行聚類,相同核電技術路線的經驗反饋定為同類,接著根據(jù)標題內容,同類核電技術路線的相同設備的相似事件的經驗反饋數(shù)據(jù)劃分在同一數(shù)據(jù)集合。在集合內,依次按照重要性分級、是否反饋、事件類別等屬性將數(shù)據(jù)進行排序。
在設備設計平臺中,當管理員為設計人員創(chuàng)建用戶并分配許可時,會將該人員的部門、專業(yè)等信息錄入到系統(tǒng)中。若無這些信息,設計人員將無法在平臺內的項目中開展工作。此外,除了用戶的個人信息外,設計人員已開展或將開展的任務信息也對用戶分類至關重要。利用這些信息對用戶進行分類,相似用戶分為同組。事實上,近似用戶表示了他們是在同一個部門下的相同專業(yè)并做相同設備設計工作的同事,他們的工作內容基本相同。比如,用戶A和B均是核島設備所力學專業(yè)從事管道力學分析的同事,則他們通過該模塊將被分為相同組。
當設計人員在設備設計平臺中開展工作時,工程經驗反饋推薦系統(tǒng)將獲取到該設計工作的主要內容以及所屬項目、機組和設備信息。結合該設計人員的用戶類別,推薦系統(tǒng)能夠基本確定設計人員在該設計工作中所需經驗反饋的關鍵信息:某種核電技術路線、某設計階段、某類設備、某種設計工作等。根據(jù)這些關鍵信息,按照表1的數(shù)據(jù)處理規(guī)則,對離線已分析處理過的數(shù)據(jù)集合進行排序(集合內部按照原順序)。相似性越高,越有價值的經驗反饋數(shù)據(jù)排名就越靠前。最后,選擇相似性較高的前50條數(shù)據(jù)留在界面中。這樣,對該設計工作有幫助的經驗知識將被留下,實現(xiàn)信息推薦。
任何推薦系統(tǒng)都不能保證推薦內容完全滿足用戶的興趣,尤其在用戶需求明確時,推薦列表中并沒有相關項,此時主動搜索是必須的。針對這種情況,本系統(tǒng)集成了全局搜索框來彌補此問題。當設計人員對工程經驗反饋推薦系統(tǒng)所推薦的知識數(shù)據(jù)不滿意時,他們可以通過該搜索框主動地、有目的地去搜索自己需要的經驗反饋,流程圖如圖3所示。
圖3 主動搜索的流程圖
設備設計平臺是基于達索公司的ENOVIA平臺配置開發(fā)的,該平臺基于Java語言和oracle數(shù)據(jù)庫技術實現(xiàn)。因此,本文的工程經驗反饋推薦系統(tǒng)是按照第2部分介紹的思路方法采用與設備設計平臺相同的語言數(shù)據(jù)庫技術完成的。
圖4 工程經驗反饋推薦系統(tǒng)應用界面
圖4展示了某用戶在陽江核電項目5/6號機組換熱器力學分析流程中的推薦實例。工程經驗反饋推薦系統(tǒng)根據(jù)用戶的人員和設計流程信息,推薦了同樣采用CPR1000技術的換熱器相關經驗反饋知識數(shù)據(jù)。
在未得到有價值的推薦內容或目標較明確的情況下,用戶可點擊搜索按鈕,啟動主動搜索界面,如圖5所示。在該界面中通過填寫相關信息來完成在全局經驗反饋數(shù)據(jù)中的定向搜索。
圖5 主動搜索界面
當用戶查看感興趣的經驗反饋時,系統(tǒng)將通過標題鏈接跳轉到對應的公司經驗反饋平臺的頁面。然而,經驗反饋平臺提供的數(shù)據(jù)訪問接口有限,無法直接從該平臺中獲取用戶查看記錄,因此很難對推薦效果進行直接評估。經過研究,本文采用了兩種特別的方法來驗證工程經驗反饋推薦系統(tǒng)的有效性。
評價方法一是對設計人員進行線下問卷調查。通過設計人員的反饋,了解本文推薦系統(tǒng)是否對他們的設計提供了幫助,能否提高設計效率。調查結果顯示,設計人員對經驗反饋推薦系統(tǒng)的推薦內容比較滿意,一致認為該系統(tǒng)為設計活動提供了便利,肯定了該系統(tǒng)的研發(fā)。該評價方法存在主觀性和隨意性,為了更加客觀地評估該系統(tǒng),本文又提出另外一種評價方法。
第二種評價方法是在標題鏈接和搜索按鈕中設置觸發(fā)器,通過統(tǒng)計平臺一段時間內某設計流程中標題鏈接和搜索按鈕的點擊次數(shù)來評估。當推薦系統(tǒng)所推薦的內容無法滿足設計需求時,設計人員將利用搜索功能完成經驗反饋的查找,通過統(tǒng)計直接查看和搜索查詢的次數(shù)可有效地評估系統(tǒng)的推薦效果。如表2所示,以一周時間為限,對正在開展的陽江核電項目5/6號機組兩個典型設備的五個設計流程進行統(tǒng)計,結果表明,無論設備設計復雜與否,該系統(tǒng)均能夠為設計工作主動推送有價值的經驗反饋數(shù)據(jù)。
表2 經驗反饋查看次數(shù)統(tǒng)計
通過以上兩種評價方法的粗略評估,驗證了該工程經驗反饋推薦系統(tǒng)的有效性,主動推送設計人員所需要的經驗反饋數(shù)據(jù),減少了直接在經驗反饋系統(tǒng)中查找數(shù)據(jù)的中間環(huán)節(jié),節(jié)省了查找的時間,提高了核電設備設計的效率。
個性化推薦系統(tǒng)是互聯(lián)網應用技術中解決信息量大實現(xiàn)個性化服務的一項新興技術,本文通過對個性化推薦系統(tǒng)技術的深入研究,研發(fā)了適應于核電設備設計的工程經驗反饋系統(tǒng)。通過效果驗證,該系統(tǒng)能夠在設備設計過程中為設計人員主動推送有價值的經驗反饋信息,縮短設計周期,提高設備設計效率,得到了設計人員的肯定。此外,該系統(tǒng)的研發(fā)也為個性化推薦理念在核電其他系統(tǒng)的推廣奠定了基礎,為核電發(fā)展過程中信息量激增所帶來的問題提供了一種有效的解決方案。
[1]楊湘山,呂焱,李冰,等.新形勢下的核安全與輻射安全對策[J].中國安全科學學報,2005,15(7):44-47.
[2]Resnick P.Grouplens: An Open Architecture for Collaborative Filtering of NetNews[A].Proceedings of CSCW 94.Chaple Hill:NC[C],1994:175-186.
[3]王國霞,劉賀平.個性化推薦系統(tǒng)綜述[J].計算機工程與應用,2012,48(7):66-76.
[4]盧志翔.網絡學習系統(tǒng)個性化實時推薦策略研究[J].重慶科技學院學報:自然科學版,2015,17(3):80-84.
[5]許海玲,吳瀟,李曉東,等.互聯(lián)網推薦系統(tǒng)比較研究[J].軟件學報,2009,20(2):350-362.
[6]RicardoBaeza-Yates,BerthierRibeiro-Neto, Baeza-Yates, et al.Modern Information Retrieval[M].機械工業(yè)出版社,2006.
[7]Rich E. User modeling via stereotypes[J].Cognitive Science, 1979,3(4):329-354.
[8]Goldberg D, Nichols D, Oki B M, et al.Using collaborative filtering to weave an information tapestry[J].Communications of the Acm,1992,35(12):61-70.
[9]Konstan J A,Miller B N, Maltz D, et al. GroupLens: applying collaborative filtering to Usenet news[J].Communications of the Acm,1997,40(3):77-87.
[10]Fu X, Budzik J, Hammond K J. Mining Navigation History for Recommendation[A].International Conference on Intelligent User Interfaces[C].2000:106-112.
[11]Balabanovi, Marko,Shoham Y. Fab: content-based, collaborative recommendation[J].Communications of the Acm,1997,40(3):66-72.
[12]Basu C,Hirsh H, Cohen W. Recommendation as classification:using social and content-based information in recommendation[A].Fifteenth National/tenth Conference on Artificial Intelligence/innovative Applications of Artificial Intelligence. American Association for Artificial Intelligence[C],2000:714-720.
[13]Pazzani M J. A Framework for Collaborative,Content-Based and Demographic Filtering[J].Artificial Intelligence Review,1999,13(5):393-408.