關鍵詞:智能制造;云平臺;Bubble-Skyline;數據割裂
0 引言(Introduction)
在當今工業(yè)互聯網快速發(fā)展的時代,GE Predix、SiemensMindSphere、IBM Watson IoT、Microsoft Azure IoT、AlibabaCloud IoT等大型企業(yè)都部署了智能云平臺[1]。由于數據具有隱私性,所以企業(yè)的物料需求計劃[2](MRP)系統(tǒng)、高級計劃和調度(APS)系統(tǒng)、企業(yè)資源計劃[3](ERP)系統(tǒng)等專業(yè)子系統(tǒng)雖然能各自實現功能,但是造成了不同系統(tǒng)之間的數據割裂問題。在內部網絡環(huán)境下,企業(yè)可以通過放棄一定程度的隱私權緩解數據割裂問題,但在云平臺上,企業(yè)的數據直接暴露給第三方,存在數據泄露和安全風險。如何在保護數據隱私的同時實現系統(tǒng)間數據的流通和整合,已成為當下工業(yè)界必須認真考慮的重要問題[4]。針對上述背景,本文提出了一種基于Bubble-Skyline算法的解決方案,旨在解決工業(yè)互聯網中的數據割裂問題,實現精確的數據分析,并以智能制造的排產優(yōu)化為例,驗證該方案的可行性和實用性。
1 數據割裂問題與隱私保護(Data fragmentationand privacy protection)
1.1 數據割裂問題
企業(yè)的MRP系統(tǒng)、APS系統(tǒng)、ERP系統(tǒng)等涵蓋了生產計劃、物料管理、供應鏈協調等關鍵功能,在工業(yè)互聯網中發(fā)揮了至關重要的作用。MRP系統(tǒng)主要關注物料需求計劃,包括原材料、零部件的采購計劃和庫存管理;APS系統(tǒng)負責高級計劃和調度,用于優(yōu)化生產計劃和資源分配;ERP系統(tǒng)是一個綜合性的企業(yè)資源管理系統(tǒng),涵蓋了財務、人力資源、采購、銷售等多個方面的數據。系統(tǒng)各自的獨立性運行,導致不同系統(tǒng)中的數據無法直接交換和共享,造成信息的孤立和分散,加劇了數據割裂問題。
1.2 隱私保護
隨著數字化和互聯網技術的普及,數據隱私保護變得至關重要,特別是涉及企業(yè)商業(yè)機密、生產工藝等方面的數據。由于MRP系統(tǒng)、APS系統(tǒng)、ERP系統(tǒng)等中的數據格式和結構存在差異,導致其數據的共享和整合非常困難。此外,由于涉及敏感信息,例如客戶數據和產品設計數據等,因此保證數據的安全性和隱私性尤為重要。
為了保證數據的安全性和隱私性,數據收集模塊使用微服務架構收集不同云平臺中的數據,同時在傳輸數據階段采用了協議加密和哈希映射轉化表等技術,實現不同系統(tǒng)之間數據的安全共享和整合。采用協議加密可以確保數據在各系統(tǒng)間傳輸的安全性,防止出現未經授權的訪問行為。同時,通過哈希映射轉化表,可以將不同系統(tǒng)的數據進行轉化和映射,使其具備一致的格式和結構,從而實現數據的整合和共享。
2Bubble-Skyline算法(Bubble-Skyline algorithm)
2.1Skyline算法
Skyline[5]算法是一種被廣泛應用于解決多目標查詢問題的多目標優(yōu)化技術,它在數據挖掘和數據庫查詢等領域得到了較好的應用,對實際場景中的多目標決策有顯著影響。Skyline算法的核心思想是根據多個目標函數對數據進行篩選,選擇出那些在所有目標上優(yōu)于其他數據的數據點,形成Skyline集合。這些數據點在多個目標上都具有優(yōu)勢,因此可以作為決策的候選解。
以如表1所示的生產任務執(zhí)行時間和成本數據為例,某制造廠希望找到執(zhí)行時間較短且成本較低的任務進行優(yōu)先排產。圖1展示了這些任務在二維空間中的分布情況。在執(zhí)行時間的選擇中,任務T4用時最短,因此它是最合適的選擇;而在成本的選擇中,任務T6具有較低的成本,因此它是最合適的選擇。
2.2Bubble-Skyline算法
基于Bubble的Skyline算法是一種高效的多目標優(yōu)化方法,它結合了分支定界技術與效用搜索[6]的特點,能夠在具有多個屬性的數據集中找出不被其他數據點支配的點,即Pareto優(yōu)勢點。為了進一步優(yōu)化Skyline 集合的生成,Bubble-Skyline[7]算法引入了冒泡排序和索引ID列表的思想。如表2所示,Bubble-Skyline算法在執(zhí)行Skyline計算時,使用的是數據索引ID列表,而不是真實數據,從而在保護數據隱私的前提下執(zhí)行算法和比較數據。通過冒泡操作,較好的數據點逐步上移,排除次優(yōu)的數據點,從而使最終的Skyline集合更具優(yōu)化效果。使用基于Bubble的Skyline算法,可以在保護數據隱私的同時,找到多目標優(yōu)化問題中的最優(yōu)解。該算法的應用可以幫助決策者在面對多個目標和約束時,做出更準確、更全面的決策,同時該算法也為數據挖掘和決策支持系統(tǒng)等領域提供了一種高效的解決方案。
3 設計方案(Design scheme)
本方案包括數據收集模塊、數據預處理模塊和數據分析建模模塊,方案架構如圖2所示。
3.1 數據收集模塊
數據收集模塊的主要職責是從多個源頭,包括不同的云平臺讀取MRP系統(tǒng)、APS系統(tǒng)、ERP系統(tǒng)等,采集與生產排產相關的數據,包括原材料采購、生產計劃、物流配送等關鍵環(huán)節(jié)產生的數據。但是,這些數據包含商業(yè)機密和生產設計等敏感內容,因此在數據收集過程中必須重點考慮數據隱私保護的問題。本文采用傳輸層的安全性協議,如安全套接層(SSL)和傳輸層安全性(TLS)對數據進行加密[8],防止數據在傳輸過程中被截取、竊聽或篡改。安全協議使用加密算法和證書確保數據在傳輸過程中的機密性和完整性,只有被授權的接收方能夠解密和訪問數據內容,確保了數據的安全性。此外,為了確保數據的合規(guī)性,數據收集模塊采用權限校驗機制。每次發(fā)起數據訪問請求時,系統(tǒng)都會進行嚴格的權限檢查,確保只有被授權的人員才能訪問特定數據。
3.2 數據預處理模塊
數據預處理模塊負責對從各系統(tǒng)收集到的數據進行凈化、轉化和規(guī)范化,方便后續(xù)的數據分析和建模步驟。數據預處理主要聚焦于兩個關鍵任務:異常值清除和單位標準化。
異常值清除:異常值通常指那些明顯與其他觀測值有差異或超出正常數據范圍的數據點。在生產排產過程中,可能由于機器故障、備料不及時、數據采集誤差或其他未知因素而產生異常數據。異常值需要被識別并清除,以防止它們對后續(xù)分析和建模產生負面影響。
單位標準化:在工業(yè)互聯網中,不同的設備和傳感器可能使用不同的單位和量綱表示數據,導致數據的不一致性,因此需要將數據轉換為相同的單位和量綱,以便于后續(xù)的數據分析和建模。本文建立一個單位轉換的映射表標準化單位(圖3),該表包含了不同單位之間的轉換關系,并且易于更新和維護。
3.3 數據分析建模模塊
數據分析建模模塊旨在利用收集到的數據進行深入分析,并構建合適的模型解決排產問題。通過對數據進行統(tǒng)計分析和可視化展示,揭示數據中存在的模式、趨勢和關聯性。同時,模型可以通過調整生產參數和資源分配實現最佳的排產,制訂合理的生產計劃和調整資源分配,以應對生產過程中的變化。在工業(yè)互聯網中,系統(tǒng)的獨立性導致不同系統(tǒng)之間的數據無法直接交換和共享,造成信息的孤立和分散。Bubble-Skyline算法是一種數據分析方法,它能從大量數據中篩選出最優(yōu)的數據子集,同時滿足數據保密性的要求。
基于Bubble的Skyline算法,能在保護數據隱私的同時,為生產部門優(yōu)化排產方案。該算法的基本步驟如圖4所示。
步驟1:初始化。首先初始化一個空的Skyline集合(S),用于存儲最終的Skyline數據點。
步驟2:建立搜索空間。使用多維數據的屬性建立搜索空間,其中每個維度對應一個屬性。為每個搜索空間節(jié)點分配一個ID列表,用于存儲與該節(jié)點相關的數據點ID。
步驟3:分支定界搜索。利用Bubble算法的分支定界搜索技術,從搜索空間的根節(jié)點開始搜索。在搜索過程中,每次訪問一個節(jié)點時,根據該節(jié)點的ID列表與當前Skyline集合中的所有數據點進行比較。若該節(jié)點不被Skyline集合中的任何點支配,則繼續(xù)搜索該節(jié)點的子節(jié)點;否則,該節(jié)點及其所有子節(jié)點都將被剪枝,并從搜索空間中被刪除。
步驟4:更新Skyline集合。當找到一個不被其他節(jié)點支配的數據點時,將其添加到Skyline集合中。同時,從Skyline集合中移除所有被新數據點支配的點。
步驟5:終止條件。當搜索空間中的所有節(jié)點都被訪問或剪枝時,搜索過程結束。此時,Skyline集合S 包含了所有不被其他數據點支配的點,即最終的Skyline結果。
4 方案驗證(Scheme validation)
本文建立訂單信息ID表(表3),用來保存訂單在不同系統(tǒng)中產生的信息,包括訂購的產品信息、交付日期等,構建ID列表,基于Bubble的Skyline算法計算排產方案。通過與實際使用的歷史排產計劃[9]進行對比,評估新的排產[10]方案在交貨期限、最大產量等方面的表現。
利用基于Bubble的Skyline算法對歷史訂單數據進行分析,生成新的排產計劃數據,將這個新的排產計劃與實際使用的歷史排產計劃進行對比分析。圖6展示了通過基于Bubble 的Skyline算法生成的排產計劃(虛線)與實際使用的歷史排產計劃(實線)中不同訂單的生產時間對比。從圖中可以觀察到,新生成的排產計劃在時間點上低于歷史排產計劃,生產時間明顯減少。通過原排產計劃所需總天數與新排產計劃所需總天數的差值,再除以原排產計劃的總天數,計算出平均生產時間減少了17.15%,證明了通過采用基于Bubble的Skyline算法,在保護數據隱私的同時能更好地優(yōu)化排產方案,減少了生產時間,提高了生產效率。
5 結論(Conclusion)
本文分析了在工業(yè)互聯網中,由于不同系統(tǒng)之間的數據無法直接交換和共享導致的數據孤立和分散問題。針對智能云平臺的數據隱私保護和數據割裂問題,設計基于Bubble-Skyline算法的方案,該方案使用協議加密和哈希映射轉化表實現了不同系統(tǒng)之間數據的安全共享與整合。使用Bubble-Skyline算法,可以從大量的數據中篩選出最優(yōu)的數據子集。采用歷史訂單數據對方案進行驗證,并與實際使用的歷史排產計劃進行對比分析,結果表明該方案在保護數據隱私的同時能更好地優(yōu)化排產方案,平均生產時間減少了17.15%,證明了該方案具有可行性和實用性。