王 宇,王 挺,宋純賀,崔 勇,王懷震,祝景陽
(1.中國科學院 網(wǎng)絡化控制系統(tǒng)重點實驗室,遼寧 沈陽 110016; 2.中國科學院 沈陽自動化研究所,遼寧 沈陽 110016; 3.中國科學院 機器人與智能制造創(chuàng)新研究院,遼寧 沈陽 110169; 4.沈陽中科博微科技股份有限公司,遼寧 沈陽 110179; 5.上海波士內(nèi)智能科技有限公司,上海 201600)
離散制造業(yè)是制造業(yè)的重心,是我國制造業(yè)由大轉(zhuǎn)強進化過程中的首要目標。當前離散制造業(yè)發(fā)展的制約因素很多,如離散制造企業(yè)缺少統(tǒng)一的數(shù)據(jù)標準、特殊工藝占比較多不易數(shù)字化、數(shù)據(jù)開放程度低、工業(yè)現(xiàn)場網(wǎng)絡協(xié)議多樣等[1]。近年來,深度學習的技術體系快速發(fā)展,成為解決離散制造業(yè)的制約因素、使離散制造業(yè)由數(shù)字化和網(wǎng)絡化階段向智能化全面轉(zhuǎn)型的有力支撐手段。
與流程制造相比,離散制造業(yè)有其獨有的架構(gòu)和特征。深度學習技術要因地制宜,從離散制造業(yè)的應用場景和數(shù)據(jù)特性出發(fā),在產(chǎn)品設計、生產(chǎn)、制造、運維等多個環(huán)節(jié)融合落地,引領制造業(yè)向高端化發(fā)展[2]。
然而,深度學習是一門對專業(yè)知識要求很高的技術體系,如果想面向離散制造業(yè)開發(fā)出具有實用價值的場景化深度學習功能,不僅需要開發(fā)人員具備嫻熟的編程能力,還需要深度掌握深度學習的專業(yè)知識,這讓離散制造業(yè)的從業(yè)人員望而生畏。
本文對現(xiàn)代離散制造業(yè)從體系架構(gòu)和數(shù)據(jù)特征兩個角度進行了研究;對于人工智能技術在工業(yè)領域的應用和開發(fā)模式進行研究;基于這幾方面的研究結(jié)果,提出了面向離散制造業(yè)的工業(yè)人工智能無代碼開發(fā)平臺構(gòu)建方案,該方案能夠無代碼級別地實現(xiàn)工業(yè)人工智能的功能;最后按照軟件工程流程對平臺進行了建設,以某球墨鑄管砂芯刻字字符識別項目的開發(fā)為例,進行了應用效果對比,證實了該平臺的優(yōu)異性。
離散制造業(yè)以其產(chǎn)品形態(tài)和工藝形態(tài)作為主要的劃分依據(jù),產(chǎn)品一般具有多品種、小批量的特點,它們往往經(jīng)過一系列不連續(xù)的工序并最終裝配而成。典型的離散制造業(yè)企業(yè)包括機械加工與制造、汽車零配件制造、電子器件組裝、裝備設備制造等。離散制造業(yè)的升級進化是將新一代信息通信、信息計算、人工智能等技術與先進制造工藝深度融合,貫穿到設計、生產(chǎn)、管理、服務等制造流程的各個環(huán)節(jié)中,從融合效果的角度可以將離散制造業(yè)的進化分為數(shù)字化、網(wǎng)絡化和智能化3個標志性階段[3-4]。其中數(shù)字化階段針對的是單設備、單系統(tǒng)、單業(yè)務的信息化;網(wǎng)絡化階段則是實現(xiàn)多臺設備、多個系統(tǒng)和多種業(yè)務的數(shù)據(jù)融合、功能集成和作業(yè)任務協(xié)同;而在智能化階段,人工智能技術將全面深度介入到企業(yè)生產(chǎn)活動的各個層次和各個方面,它具備像人一樣的認知、思考、學習和適應能力,將極大提升生產(chǎn)的靈活性,并最終將人類從繁重具體的生產(chǎn)活動中解放出來。
與流程制造相比,離散制造業(yè)的生產(chǎn)環(huán)節(jié)更加分散,生產(chǎn)設備更加多樣,產(chǎn)品加工的工藝路線和設備使用非常靈活,生產(chǎn)計劃會根據(jù)供需、物料、工藝甚至是人員而變動。離散制造業(yè)的這些特點導致制造過程中產(chǎn)生的各種信息和數(shù)據(jù)種類豐富[5],數(shù)量特別龐大。
面對這種情況,我國的離散制造業(yè)在產(chǎn)品規(guī)劃、設計、制造和運營生產(chǎn)等過程已經(jīng)逐步實現(xiàn)了數(shù)字化和網(wǎng)絡化,當前處于從網(wǎng)絡化向智能化飛躍的過程。智能化的現(xiàn)代離散制造業(yè)體系架構(gòu)如圖1所示。
在智能化的離散制造業(yè)體系架構(gòu)中,智能生產(chǎn)體系是核心,技術賦能體系是支撐,其他系統(tǒng)或體系是基礎,它們共同推動離散制造業(yè)向高端化發(fā)展[6-8]。以深度學習技術為代表的人工智能技術家族是現(xiàn)代離散制造業(yè)體系架構(gòu)中技術賦能體系中的重要一員。
隨著全球市場競爭的加劇,離散制造業(yè)產(chǎn)品呈現(xiàn)出種類繁多、定制變化多樣、工藝生產(chǎn)過程組織復雜等趨勢,產(chǎn)品的生產(chǎn)會被分解成多個異步的子任務,每項子任務都會利用不同的硬件設備和物料物件,并產(chǎn)生不同形式的數(shù)據(jù)。根據(jù)工業(yè)和信息化部辦公廳印發(fā)的《工業(yè)數(shù)據(jù)分類分級指南(試行)》,生產(chǎn)數(shù)據(jù)域的數(shù)據(jù)包括控制信息、工況狀態(tài)、工藝參數(shù)、系統(tǒng)日志等,它們具有不同的形式、格式和類別。對這些多源異構(gòu)數(shù)據(jù)的有效處理和深度挖掘是離散制造轉(zhuǎn)型升級的重要支撐[9-10]。此外,隨著制造業(yè)從數(shù)字化向智能化的發(fā)展進化,工業(yè)現(xiàn)場越來越豐富的傳感器和涵蓋各個環(huán)節(jié)的信息系統(tǒng)也加快了同源異構(gòu)數(shù)據(jù)的生成。
典型的離散制造流程包括研發(fā)設計、物料采購、生產(chǎn)制造、產(chǎn)品銷售及產(chǎn)品售后5個階段,每個階段的數(shù)據(jù)都具有數(shù)據(jù)來源多樣、數(shù)據(jù)噪音多、數(shù)據(jù)蘊含信息分散等特點[11]。以球墨鑄管行業(yè)為例,在制造過程中的部分多源異構(gòu)數(shù)據(jù)劃分如表1所示。
表1 球磨鑄管生產(chǎn)過程中的部分多源異構(gòu)數(shù)據(jù)
離散制造業(yè)的產(chǎn)能不像連續(xù)型生產(chǎn)主要由硬件決定,而主要由生產(chǎn)要素的配置合理性決定。在第四次工業(yè)革命的背景下,數(shù)據(jù)作為新型生產(chǎn)要素,其高效、安全的利用,成為推動離散制造業(yè)生產(chǎn)力發(fā)展的重要引擎。數(shù)據(jù)的重要性體現(xiàn)在其信息和知識的屬性上,從海量數(shù)據(jù)中不斷提取出信息,通過信息解讀轉(zhuǎn)化為創(chuàng)造性的知識,從而支撐經(jīng)濟主體實現(xiàn)高質(zhì)量發(fā)展[12]。
在制造業(yè)領域,數(shù)字化建模技術的應用已經(jīng)有幾十年的歷史,但是其效率低下一直困撓著制造企業(yè),尤其是離散制造業(yè)的企業(yè)。隨著算法理論、數(shù)據(jù)集基礎、計算平臺與芯片等方面各種條件的提升,深度學習在離散制造業(yè)的場景應用能力在逐步提高,以高可用、高效率、高適應性的特性滲透到離散制造業(yè)各個細分領域。深度學習以構(gòu)建于卷積神經(jīng)網(wǎng)絡的特征提取器為基礎,從大量生產(chǎn)數(shù)據(jù)中攫取有價值的信息應用到生產(chǎn)環(huán)節(jié)和生產(chǎn)決策中,強力促進自動化、智能化制造與服務,大幅提高勞動生產(chǎn)率和經(jīng)濟效益,是離散制造業(yè)技術創(chuàng)新發(fā)展的重要方向[13]。
以深度學習為代表的人工智能技術近年來迅速發(fā)展,并深刻影響和改變了制造業(yè)的產(chǎn)業(yè)格局。在離散制造領域,深度學習取得了現(xiàn)象級的全景應用,在3C、汽車、電力、裝備制造、材料、鋼鐵等離散制造業(yè)細分領域[14],頭部的工業(yè)企業(yè)已經(jīng)落地了一批具有代表性的深度學習應用場景。例如在大型裝配線的質(zhì)量控制方面,深度學習能夠發(fā)現(xiàn)并檢測大規(guī)模裝配過程中制成品和零件的質(zhì)量問題;在質(zhì)量檢測方面,基于深度學習的計算機視覺缺陷檢測方案能夠提供實時的部件或產(chǎn)品的復雜缺陷檢測和定位。
面對現(xiàn)代離散制造業(yè)越來越多的多源異構(gòu)數(shù)據(jù),深度學習卷積神經(jīng)網(wǎng)絡的特征提取能力是處理海量數(shù)據(jù),構(gòu)建與應用場景深度綁定的智能引擎的最高效、最具可行性的方法。
深度學習是包含多隱藏層、多感知器的多層網(wǎng)絡結(jié)構(gòu),能更抽象、更深層次地描述物體的屬性和特征[15]。由于深度學習依賴于大量的矩陣運算,對于算力要求較高,在前些年受限于計算機的性能,從而發(fā)展有限。隨著計算機性能尤其是圖形處理單元(Graphic Processing Units, GPU)算力的大幅度提升,深度學習的算法和模型越來越豐富,性能越來越強,在制造業(yè)圍繞“定位、檢測、測量、識別”4大功能場景大范圍落地。深度學習在離散制造業(yè)的應用架構(gòu)如圖2所示。
在該架構(gòu)中,從離散制造的核心生產(chǎn)要素匯集而成的工業(yè)大數(shù)據(jù)經(jīng)過數(shù)據(jù)處理技術、數(shù)據(jù)增強技術、數(shù)據(jù)展現(xiàn)技術及數(shù)據(jù)遷移技術提取后,成為深度學習的原料,形成了深度學習的基礎能力;面向離散制造業(yè)應用場景,對深度學習的基礎能力組合后,形成深度學習在具體場景的應用能力支持。
制造業(yè)的核心是原材料、零件的變化和移動?,F(xiàn)代制造業(yè)的智能化對信息處理能力的需求已經(jīng)遠超人腦的極限,只有在基于深度學習的信息處理引擎的輔助下,才能夠精確地控制制造業(yè)核心元素的運動軌跡,使其效率達到最優(yōu)。比較典型的深度學習在離散制造業(yè)中的應用有以下幾個方面:
(1)缺陷檢測
基于深度學習原理的機器視覺技術的缺陷檢測已經(jīng)大量應用于離散制造業(yè)。通過機器視覺技術可以在檢測環(huán)境多變的條件下,以毫秒為單位及時地識別出產(chǎn)品表面細微、復雜的缺陷,甚至是隱藏在花紋或圖案中的不規(guī)則異常,如檢測產(chǎn)品表面是否有污染物、表面損傷、裂縫等。目前,已有企業(yè)將深度學習與3D顯微鏡結(jié)合,在納米級別尺度上進行缺陷檢測。對于產(chǎn)品的缺陷還能進行分類和分級,通過設定閾值讓系統(tǒng)規(guī)劃出修復的路徑及方法[16]。
(2)路徑規(guī)劃
以AGV(automated guided vehicle)機器人為核心的自動物流運轉(zhuǎn)解決方案是對倉儲、物流強依賴行業(yè)縮短運轉(zhuǎn)周期、節(jié)約成本的首要發(fā)力點[17],而智能路徑規(guī)劃技術是生產(chǎn)場景中AGV機器人的大腦。加拿大學者HAYKIN[18]提出一種新的生物啟發(fā)動態(tài)神經(jīng)網(wǎng)絡模型,將神經(jīng)網(wǎng)絡的神經(jīng)元與二維規(guī)劃空間的離散坐標對應起來,通過規(guī)定障礙物和非障礙物對神經(jīng)元輸入激勵和抑制的不同,直接計算相關神經(jīng)元的輸出,由此判定機器人的運行方向,由于該神經(jīng)網(wǎng)絡不需要學習訓練過程,路徑規(guī)劃實時性好,同時利用神經(jīng)網(wǎng)絡本身的快速衰減特性,較好地解決了機器人路徑規(guī)劃的死區(qū)問題。
(3)預測性維護
在離散制造業(yè)中,設備維護是重要環(huán)節(jié),直接影響生產(chǎn)節(jié)奏和生產(chǎn)效率。為了避免設備在生產(chǎn)過程中的意外停機,需要盡可能地評估設備損耗情況、預測剩余壽命,進而根據(jù)維護策略采取措施[19]。
深度學習的模型在處理時間序列數(shù)據(jù)時比較有效,隨著時間的推移收集設備運行過程中產(chǎn)生的設備退化數(shù)據(jù),根據(jù)需要對數(shù)據(jù)集進行預處理,然后構(gòu)建預測性維護模型,以設備傳感器采集的運行狀態(tài)作為輸入,將模型輸出結(jié)果與可靠度、可用度和維修費用屬性做加權求值,用以分析不用維護周期的綜合效用值,作為維修實施的決策依據(jù)[20-22]。
深度學習的開發(fā)模式是通過數(shù)據(jù)集標注、模型選取、模型訓練和效果測試等流程,完成深度學習任務的實現(xiàn)方式。
深度學習功能的實現(xiàn)可以劃分為數(shù)據(jù)集整理階段、模型構(gòu)建階段、訓練及測試階段3個階段。
(1)數(shù)據(jù)集整理階段是以數(shù)據(jù)為中心,根據(jù)任務目標,收集針對性的數(shù)據(jù),并對數(shù)據(jù)進行預處理,形成高質(zhì)量的數(shù)據(jù)集。數(shù)據(jù)集是深度學習任務執(zhí)行流程中至關重要的步驟,它不僅基本決定了任務效果的層次,還在相當程度上體現(xiàn)了解決問題的思路。高質(zhì)量是指數(shù)據(jù)集的數(shù)量要充足,要能夠涵蓋所有特征,而且各個特征數(shù)據(jù)的數(shù)量要均衡,盡量不包含無效數(shù)據(jù),尤其是錯誤數(shù)據(jù)。
(2)模型構(gòu)建階段是指根據(jù)任務目標以及數(shù)據(jù)集的特點,選取合適的模型,并實現(xiàn)網(wǎng)絡結(jié)構(gòu),形成一個能夠讀取數(shù)據(jù)集數(shù)據(jù),進行自我學習和迭代的訓練模塊。
(3)訓練及測試階段是深度學習的執(zhí)行階段,使用構(gòu)建的模型訓練模塊,結(jié)合整理好的數(shù)據(jù)集,不斷地讓模型自我學習,豐富其對特征的掌握,并不斷使用測試數(shù)據(jù)測試訓練的效果,直到達到可用狀態(tài)。
根據(jù)實現(xiàn)的手段,深度學習的開發(fā)模式分為傳統(tǒng)開發(fā)模式和無代碼開發(fā)模式兩種。
2.3.1 傳統(tǒng)深度學習開發(fā)模式
在數(shù)據(jù)集整理階段,傳統(tǒng)的開發(fā)模式通常使用離線的數(shù)據(jù)處理工具,例如使用開源的標注工具進行以圖像為典型代表的非格式化數(shù)據(jù)的標注,包括圖像分類、目標檢測和語義分割等任務。
在模型的構(gòu)建階段和訓練及測試階段,傳統(tǒng)的深度學習開發(fā)模式通常有兩條路線:①自力更生,由開發(fā)人員完成模型的封裝以及訓練測試模塊的實現(xiàn),需要有較為扎實的開發(fā)能力,并且要對相關領域的模型有相當?shù)牧私庥靡赃M行選型。該路線開發(fā)周期長,模型質(zhì)量可控性差,最致命的缺點是復用度很低。②基于已有的人工智能算法開源平臺來完成深度學習任務的開發(fā),如百度PaddlePaddle和商湯OpenMMLab,它們將前沿、主流的模型及算法進行封裝,并在一些通用數(shù)據(jù)集上做了測試并公布出結(jié)果數(shù)據(jù),便于開發(fā)人員進行模型的選型。開發(fā)人員根據(jù)任務場景的需要,結(jié)合開源平臺發(fā)布的測試結(jié)果數(shù)據(jù)選擇封裝的模型,按照開源平臺要求的方式關聯(lián)數(shù)據(jù)集,即可進行任務的執(zhí)行。該路線對于開發(fā)人員的開發(fā)能力要求相對較低,復用程度較高,模型的穩(wěn)定性較好,但還是需要不小的學習成本,而且數(shù)據(jù)集整理階段是孤立的,不能與后面的階段關聯(lián)起來。
2.3.2 人工智能無代碼開發(fā)模式和現(xiàn)狀
人工智能的無代碼開發(fā)模式是最近兩年來很熱的概念,它是將人工智能任務開發(fā)3個階段中的全部或部分進行黑盒式封裝,讓開發(fā)人員通過填寫文本、選擇選項等方式完成模型或算法構(gòu)建階段以及訓練及測試階段。無代碼開發(fā)模式能夠大幅度降低對開發(fā)人員編程能力和人工智能領域?qū)I(yè)知識的要求,甚至能夠讓零開發(fā)經(jīng)驗和零AI專業(yè)知識的人輕松玩轉(zhuǎn)人工智能。
目前,涉足人工智能領域的主流企業(yè)都推出了自己的無代碼開發(fā)平臺,如百度的EasyDL零門檻AI開發(fā)平臺,阿里的阿里云AI平臺,以及微軟的Azure人工智能服務平臺,但是它們存在著如下問題:
(1)數(shù)據(jù)標注模式單一
數(shù)據(jù)的標注實際操作中需要多人多次標注和核驗才能夠形成質(zhì)量可靠的數(shù)據(jù)集,單純在線的數(shù)據(jù)標注模式很難區(qū)分標注任務和核驗任務,且在大數(shù)據(jù)集需要團隊協(xié)作時,不同人員的任務很難進行質(zhì)量追溯和進度跟蹤。
(2)智能標注功能弱
智能標注是指為了解決數(shù)據(jù)標注工作的勞動密集問題而誕生的半自動化標注解決方案,通過既有的模型,預先對待標注數(shù)據(jù)進行AI標注,由人工進行數(shù)據(jù)復核。智能標注能夠減輕數(shù)據(jù)標注工作50%~90%的工作量。目前,已有智能標注功能的無代碼開發(fā)平臺僅能支持面向通用數(shù)據(jù)的智能標注模型。
(3)模型選型不直觀
模型在選型時使用文字描述或引導式的選型,對于模型的結(jié)構(gòu)和特征不能直觀展示。
(4)應用場景偏通用
當前的無代碼開發(fā)平臺面對的是廣泛的AI開發(fā)人員,應用場景傾向于人臉識別、文本識別、語音識別等日常生活場景,數(shù)據(jù)處理和模型選型未能針對離散制造業(yè)的特點調(diào)優(yōu),對離散制造業(yè)人工智能應用場景不聚焦。
通過以上對離散制造業(yè)行業(yè)的特性分析以及對工業(yè)人工智能開發(fā)模式的研究,本文構(gòu)建了面向離散制造業(yè)的工業(yè)人工智能無代碼開發(fā)平臺。該平臺的整體架構(gòu)設計如圖3所示。
對于深度學習任務,采用拖拽的方式在活動操作界面上完成數(shù)據(jù)集的選取、數(shù)據(jù)集拆分和網(wǎng)絡模型搭建等流程,直觀地展現(xiàn)任務流程。任務引導流程如圖4所示。
每種模型都有其獨有的結(jié)構(gòu)。從模型本身來說,其具體結(jié)構(gòu)是屬于較深的專業(yè)知識,但是從用戶的感官角度,能夠充分體現(xiàn)模型結(jié)構(gòu)特征的可視化展示方式具有很強的視覺沖擊和感染力,結(jié)合充分的流程引導說明,非常有利于用戶辨識不同的網(wǎng)絡結(jié)構(gòu),潛移默化地增進用戶對深度學習知識的掌握度。本平臺根據(jù)模型的結(jié)構(gòu)設計了獨具特色的二維圖形,為模型選型應用了引導式流程,讓模型網(wǎng)絡結(jié)構(gòu)可視化。
為了展現(xiàn)數(shù)據(jù)集數(shù)據(jù)的特性,平臺集成了基于Matplotlib的數(shù)據(jù)集可視化組件,并以跨平臺能力強、兼容性好的Web形式進行展現(xiàn)。例如以直方圖的形式展示某字符數(shù)據(jù)集的字符次序特征,如圖5所示。
當前面向通用場景的人工智能開發(fā)平臺的深度學習模型創(chuàng)建與任務功能綁定,如面向圖像數(shù)據(jù)時,按照“分類”與“檢測”進行整體網(wǎng)絡結(jié)構(gòu)的選擇,這種模型創(chuàng)建方式有兩個問題:①模型的定制化程度太低,將模型的網(wǎng)絡結(jié)構(gòu)完全固化,在具體離散制造業(yè)場景中需要調(diào)整模型局部結(jié)構(gòu)時失去了可操作性,導致在通用場景效果很好的模型在離散制造業(yè)場景里效果較差;②與任務功能綁定的模型創(chuàng)建增加了特定場景應用開發(fā)時的學習成本,例如在開發(fā)球墨鑄管砂芯刻字字符識別項目時,字符識別過程需要拆解為分類和檢測兩種任務,需要掌握這兩種任務的應用場景才能知道對應兩種模型的選型。
平臺將深度學習的模型劃分為平臺級和用戶級,平臺級為預置開箱即用的通用型模型結(jié)構(gòu),用戶級模型由開發(fā)人員在關聯(lián)應用場景的引導下自定義創(chuàng)建,創(chuàng)建的素材為聚焦離散制造業(yè)應用場景封裝的模型組件,涵蓋了Backbone(骨干網(wǎng)絡)、Neck(特征利用優(yōu)化)、Head(檢測頭)和損失函數(shù),結(jié)合拖拽式的可視化操作界面,開發(fā)人員可以很方便地創(chuàng)建出具體應用場景下自定義結(jié)構(gòu)的模型。
在離散制造業(yè)生產(chǎn)過程中產(chǎn)生的數(shù)據(jù)來源豐富、類型多樣、結(jié)構(gòu)復雜,既包括數(shù)字、關系型數(shù)據(jù)等結(jié)構(gòu)化數(shù)據(jù),也包括圖像、音頻等非結(jié)構(gòu)化數(shù)據(jù)[23]。為了提高深度學習神經(jīng)網(wǎng)絡對數(shù)據(jù)特征的辨識度,離散制造業(yè)的各種類型的數(shù)據(jù)經(jīng)常不能直接納入數(shù)據(jù)集,需要預先進行數(shù)據(jù)處理。本文設計的平臺對于離散制造業(yè)應用場景中主要的數(shù)據(jù)處理工具進行封裝,包括可用性校驗、無效數(shù)據(jù)清洗、格式轉(zhuǎn)換、值域轉(zhuǎn)換、特征強化等。
面向通用場景的深度學習模型在離散制造業(yè)具體場景的應用效果會很差,以鑄管內(nèi)壁字符識別為例,基于PyTorch框架的通用字符數(shù)據(jù)集上訓練獲取的準確度超過85%的STARNet模型,對鑄管內(nèi)壁字符測試集的識別準確率低于1%。
用戶通過平臺的單人/團隊標注,或通過本地上傳數(shù)量和質(zhì)量滿足條件的數(shù)據(jù)集后,可以通過拖拽式的引導操作選擇模型進行模型訓練,并獲得跟應用場景關聯(lián)的人工智能模型,之后用戶可以選擇個人訓練的AI模型作為針對特定數(shù)據(jù)集的智能標注引擎。對于自定義模型的支持能夠很好地讓智能標注功能聚焦于離散制造業(yè)具體的應用場景。
領域驅(qū)動設計是處理復雜領域的設計思想,是將業(yè)務復雜性和技術復雜性分離,運用業(yè)務概念構(gòu)建領域模型來控制業(yè)務復雜度。微服務架構(gòu)可以看作是領域驅(qū)動設計的一種落地實踐,將平臺在縱向進行模塊化服務封裝和分層,各層之間保持高內(nèi)聚低耦合,不同層之間通過Restful接口或中間件進行通信,上層的服務實現(xiàn)只能依賴于下層的子服務。平臺各層級的內(nèi)容如表2所示。
表2 平臺架構(gòu)的層級劃分
標注任務是指對數(shù)據(jù)集中的數(shù)據(jù)進行類別劃分或者對數(shù)據(jù)內(nèi)容進行歸類,為其綁定對應的數(shù)據(jù)標簽。平臺將標注任務分為數(shù)據(jù)標注和數(shù)據(jù)核驗兩種,并將用戶構(gòu)建成樹狀層級結(jié)構(gòu),用戶可以向同級別及更低級別的人員分發(fā)不用的標注任務。收到標注任務的人員在進行標注工作時,平臺會即時回寫標注進度,這樣任務發(fā)起人員能隨時查看團隊標注任務的執(zhí)行進展,還能將標注質(zhì)量問題追溯到個人。團隊標注數(shù)據(jù)流程如圖6所示。
模型迭代是指在既有數(shù)據(jù)集的基礎上訓練出可用模型的條件下,向數(shù)據(jù)集添加具備新特征的新數(shù)據(jù)形成新數(shù)據(jù)集,再使用新數(shù)據(jù)集訓練具備更好的評價指標的模型的過程,該過程如圖7所示。
平臺在支持自定義模型的智能標注功能的支撐下,將該流程設計成可配置式的自動化流程:當新數(shù)據(jù)集的增補數(shù)量達到閾值時,平臺會根據(jù)參數(shù)配置自動劃分訓練集和驗證集并發(fā)起訓練任務,最后將評價指標達到預期的新模型更新到模型庫中。
本文設計的平臺的核心頁面如圖8~圖10所示,包括某鑄管項目在平臺應用的“砂芯刻字在線標注界面”,對“貓狗大戰(zhàn)”通用數(shù)據(jù)集進行智能標注的“貓狗大戰(zhàn)數(shù)據(jù)集智能標注界面”,以及在模型訓練流程中選擇已有網(wǎng)絡的“深度學習訓練流程已有網(wǎng)絡選取界面”。
EasyDL零門檻AI開發(fā)平臺是百度推出的以深度學習為主的人工智能無代碼開發(fā)平臺,在國內(nèi)人工智能領域處于領先地位。以某球墨鑄管內(nèi)壁陽文刻字目標檢測任務的實現(xiàn)為例,與EasyDL進行流程對比。對比內(nèi)容如表3所示。
表3 EasyDL與本平臺任務流程對比
可以看到,在離散制造業(yè)的應用場景里,本平臺相比于主流的AI無代碼開發(fā)平臺,在多個環(huán)節(jié)具有優(yōu)勢。在這些優(yōu)勢的加持下,本平臺最終訓練獲得模型的評價指標也比EasyDL高出將近10個百分點。
為了能夠體現(xiàn)本無代碼開發(fā)平臺的效率提升,選取了某球墨鑄管砂芯刻字字符識別項目的模型迭代流程進行應用效果測試,測試方法如下:將從現(xiàn)場采集的5 000張圖片打亂順序后劃分為A、B兩組,每組2 500張圖片,A組使用原來的方式進行模型迭代,B組使用本平臺進行模型迭代,在團隊標注方面都由5個相同的人員進行標注。A、B組在模型迭代的各個環(huán)節(jié)的耗時(小時)統(tǒng)計如表4所示。
表4 A、B兩組各個環(huán)節(jié)耗時統(tǒng)計表
在數(shù)據(jù)標注部分,A組由5個人員每人500張進行標注;B組直接使用原有模型進行智能標注后,進入復核階段;在數(shù)據(jù)核驗部分,A、B兩組都由相同的5個人員交換核驗2遍,即同一個500張的子數(shù)據(jù)集不能由同一個人員核驗;在模型訓練部分,A、B兩組都使用增補后數(shù)量一致的(65 000張)數(shù)據(jù)集在英偉達RTX2070 GPU上進行訓練。
通過耗時統(tǒng)計可以看到,在某球墨鑄管砂芯刻字識別項目的模型訓練中,在數(shù)據(jù)集整理環(huán)節(jié)(從數(shù)據(jù)拆分到數(shù)據(jù)合并),使用傳統(tǒng)迭代方式的A組用時10.5 h,使用平臺進行模型迭代的B組用了2.35 h,節(jié)省了77.62%的時間,極大地提高了該環(huán)節(jié)的效率;從流程整體來看,使用傳統(tǒng)迭代方式的A組用時27 h,使用平臺進行模型迭代的B組用了18.45 h,能夠節(jié)省31.67%的時間,是非??捎^的效率提升。
針對離散制造業(yè)深度學習開發(fā)的痛點,本文提出了無代碼模式的深度學習開發(fā)平臺建設方案,分析了離散制造業(yè)的架構(gòu)和數(shù)據(jù)的特征,用來進行有針對性的數(shù)據(jù)集標注方案設計、智能標注流程設計和團隊標注任務分發(fā)機制的設計;研究了深度學習在離散制造業(yè)的應用狀況,分析了深度學習當前的發(fā)展趨勢、應用場景和開發(fā)模式,為平臺的核心功能設計提供了依據(jù)。平臺最后依據(jù)軟件工程流程,應用基于領域驅(qū)動設計的微服務架構(gòu)進行了建設,并應用實際的工程項目進行了應用和效果對比,證實了本平臺的穩(wěn)定性、可用性和高效性。
本平臺在當前建設階段覆蓋了深度學習在離散制造業(yè)的主要應用場景,進一步要設計和完善平臺的應用場景擴展能力,使平臺在橫向和縱向兩個方向上擴展:在縱向上增加平臺對數(shù)據(jù)處理工具、模型的廣度,涵蓋更多的應用場景;在橫向上向機器學習領域延伸,將機器學習在離散制造業(yè)的應用場景也集成進來,使平臺更好地服務于面向離散制造業(yè)的人工智能應用開發(fā)。
目前,不斷發(fā)展的5G、AR、VR等技術將在離散制造業(yè)落地應用,后續(xù)研究將聚焦于5G工業(yè)互聯(lián)網(wǎng)技術與數(shù)字孿生等虛擬現(xiàn)實技術對工業(yè)無代碼開發(fā)平臺的影響,包括人機交互方式、可視化展示、分布式數(shù)據(jù)網(wǎng)關等方面。