唐文輝 劉國(guó)華 王國(guó)棟
摘 要:隨著“工業(yè)4.0”概念的提出和實(shí)施以及C2M互聯(lián)網(wǎng)商業(yè)模式的興起,傳統(tǒng)紡織行業(yè)正面臨著向智能化、服務(wù)化轉(zhuǎn)型的難題。本文將傳統(tǒng)紡織印染行業(yè)與網(wǎng)絡(luò)信息技術(shù)相結(jié)合,以報(bào)價(jià)服務(wù)為切入點(diǎn),應(yīng)用深度學(xué)習(xí)以及有限狀態(tài)自動(dòng)機(jī)理論,基于微服務(wù)架構(gòu),設(shè)計(jì)了一套印染需求智能分析系統(tǒng)。為紡織企業(yè)的印染報(bào)價(jià)服務(wù)提供了一套高效、智能的解決方案。
關(guān)鍵詞: 工業(yè)4.0;C2M模式;結(jié)構(gòu)化數(shù)據(jù)提取;深度學(xué)習(xí);有限狀態(tài)自動(dòng)機(jī)
文章編號(hào): 2095-2163(2019)03-0103-04 中圖分類號(hào): TP311.5 文獻(xiàn)標(biāo)志碼: A
0 引 言
隨著“工業(yè)4.0”概念的提出與實(shí)施,全球制造業(yè)開(kāi)始了新一輪的改革。在這樣的時(shí)代背景下,越來(lái)越多的企業(yè)陸續(xù)采用C2M(Customer-to-Manufactory)商業(yè)模式。印染行業(yè)作為中國(guó)傳統(tǒng)制造業(yè),已然進(jìn)入了新的發(fā)展階段,其面臨的困擾正日益突顯,諸如企業(yè)運(yùn)營(yíng)成本的不斷提高,以及客戶的個(gè)性化、小批量、多品種的新需求,企業(yè)的生存壯大也不可避免地會(huì)受到?jīng)_擊與挑戰(zhàn)。當(dāng)前,互聯(lián)網(wǎng)技術(shù)、智能技術(shù)的進(jìn)步,為企業(yè)的轉(zhuǎn)型升級(jí)帶來(lái)了有利契機(jī)。
客戶需求的結(jié)構(gòu)化、規(guī)范化,是印染企業(yè)營(yíng)銷過(guò)程中實(shí)現(xiàn)快速準(zhǔn)確報(bào)價(jià)的前提。傳統(tǒng)的報(bào)價(jià)形式普遍存在處理效率低下、信息數(shù)據(jù)不規(guī)范、詢價(jià)過(guò)程記錄缺失等問(wèn)題。所以,提升和保證報(bào)價(jià)功能的效率及規(guī)范性已然成為印染行業(yè)在結(jié)構(gòu)轉(zhuǎn)型中亟需解決的重要問(wèn)題。由此,本文設(shè)計(jì)開(kāi)發(fā)了印染需求智能分析系統(tǒng)。本系統(tǒng)將深度學(xué)習(xí)、文本預(yù)處理以及有限狀態(tài)自動(dòng)機(jī)理論等計(jì)算機(jī)理論和技術(shù)與業(yè)務(wù)實(shí)踐相結(jié)合,并基于微服務(wù)架構(gòu),為用戶搭建了需求分析服務(wù)平臺(tái),實(shí)現(xiàn)了對(duì)用戶需求的快速精確獲取。
1 相關(guān)技術(shù)
1.1 Seq2Seq
Seq2Seq的研發(fā)主要是為了解決傳統(tǒng)RNN結(jié)構(gòu)的輸入和輸出必須要等長(zhǎng),無(wú)法實(shí)現(xiàn)翻譯功能及聊天機(jī)器人等服務(wù)。Seq2Seq 是一個(gè)Encoder-Decoder結(jié)構(gòu)的網(wǎng)絡(luò),其輸入和輸出都是序列,Encoder 中將一個(gè)可變長(zhǎng)度的信號(hào)序列變?yōu)楣潭ㄩL(zhǎng)度的向量表達(dá),Decoder 將這個(gè)固定長(zhǎng)度的向量變成可變長(zhǎng)度的目標(biāo)的信號(hào)序列。
Seq2Seq模型的基本思想是通過(guò)使用一個(gè)循環(huán)神經(jīng)網(wǎng)絡(luò)讀取輸入句子,將整個(gè)句子的信息壓縮到一個(gè)固定維度的編碼中;再使用另一個(gè)循環(huán)神經(jīng)網(wǎng)絡(luò)讀取這個(gè)編碼,將其解壓為目標(biāo)語(yǔ)言的一個(gè)句子。
1.2 有限狀態(tài)自動(dòng)機(jī)
有限狀態(tài)自動(dòng)機(jī)是為研究有限內(nèi)存的計(jì)算過(guò)程和某些語(yǔ)言類而抽象出的一種計(jì)算模型。模型中擁有有限數(shù)量的狀態(tài),每個(gè)狀態(tài)可以遷移到零個(gè)或多個(gè)狀態(tài),輸入字串決定執(zhí)行哪個(gè)狀態(tài)的遷移。用形式化的語(yǔ)言表示,有限狀態(tài)自動(dòng)機(jī)可以被表示為一個(gè)5-元組(Q,Σ,δ,q0,F(xiàn)),設(shè)計(jì)構(gòu)成為:狀態(tài)的有限集合Q、輸入符號(hào)的有限集合Σ、轉(zhuǎn)移函數(shù)δ:Q×Σ→P(Q)、初始狀態(tài)q0,q0∈Q、接受狀態(tài)的集合F,F(xiàn) Q。
1.3 微服務(wù)架構(gòu)
微服務(wù)架構(gòu)是一種架構(gòu)概念,其主要作用是將功能分解到離散的各個(gè)服務(wù)當(dāng)中,從而降低系統(tǒng)的耦合性,并提供更加靈活的服務(wù)支持。究其本質(zhì)而言,就是用一些功能比較明確、業(yè)務(wù)比較精煉的服務(wù),去解決更大、更實(shí)際的問(wèn)題。
2 系統(tǒng)設(shè)計(jì)
根據(jù)對(duì)印染行業(yè)用戶報(bào)價(jià)的需求分析,將印染需求智能分析系統(tǒng)分為三大模塊,研究得到的功能模塊設(shè)計(jì)如圖1所示。在此,關(guān)于各模塊主要功能可分述如下。
(1)資訊瀏覽模塊。該模塊分為最新動(dòng)態(tài)和文章瀏覽,用戶可以在最新動(dòng)態(tài)子模塊下瀏覽企業(yè)動(dòng)態(tài)、新推出的產(chǎn)品、咨詢企業(yè)文化等,在文章瀏覽子模塊中,通過(guò)技術(shù)、咨詢、發(fā)展等標(biāo)簽將印染領(lǐng)域相關(guān)文章做出分類,以隨機(jī)推薦的形式展示給用戶進(jìn)行閱讀。
(2)用戶模塊。該模塊主要管理用戶的基本操作,包括用戶登錄注冊(cè)、修改個(gè)人信息及密碼等,同時(shí)對(duì)用戶進(jìn)行身份權(quán)限管理,對(duì)不同身份權(quán)限的用戶開(kāi)放不同的功能模塊。
(3)報(bào)價(jià)模塊。通過(guò)新技術(shù)與傳統(tǒng)報(bào)價(jià)流程相結(jié)合,為用戶創(chuàng)建智能化的報(bào)價(jià)體驗(yàn)??杉?xì)分為如下4個(gè)功能:通過(guò)深度學(xué)習(xí)Seq2Seq模型訓(xùn)練的智能機(jī)器人客服為用戶提供24 h印染領(lǐng)域問(wèn)答服務(wù);基于WebSocket搭建的人工客服交流平臺(tái),用戶可以與人工客服在此平臺(tái)實(shí)時(shí)交流,進(jìn)行產(chǎn)品答疑、需求描述、訂單確認(rèn)等操作;基于有限狀態(tài)自動(dòng)機(jī)的報(bào)價(jià)需求提取服務(wù),配合文本預(yù)處理等技術(shù),為用戶提供了智能、高效的自動(dòng)化需求提取流程;最后將提取出的用戶結(jié)構(gòu)化需求列表以及客服報(bào)價(jià)結(jié)果整理成表單,以可視化形式反饋給用戶。
3 數(shù)據(jù)庫(kù)設(shè)計(jì)
本系統(tǒng)采用MongoDB數(shù)據(jù)庫(kù)。MongoDB是一個(gè)基于分布式文件存儲(chǔ)的開(kāi)源數(shù)據(jù)庫(kù)系統(tǒng),在高負(fù)載的情況下,添加更多的節(jié)點(diǎn),可以保證服務(wù)器性能。MongoDB旨在為Web應(yīng)用提供可擴(kuò)展的高性能數(shù)據(jù)存儲(chǔ)解決方案。關(guān)于重要數(shù)據(jù)表功能,研究中可做概述如下。
(1) 用戶信息表。主要用來(lái)記錄用戶個(gè)人信息,包括用戶名、密碼、手機(jī)號(hào)、電子郵箱等信息,其中用戶名為主鍵。
(2) 最新動(dòng)態(tài)表。主要用來(lái)保存企業(yè)相關(guān)的最新動(dòng)態(tài),涉及企業(yè)新聞、最新產(chǎn)品、企業(yè)文化等內(nèi)容。包括動(dòng)態(tài)的標(biāo)題、內(nèi)容、附圖URI路徑、發(fā)布時(shí)間等字段。
(3) 文章信息表。主要用來(lái)保存印染行業(yè)的一些相關(guān)文章,供用戶瀏覽。包括文章的標(biāo)題、內(nèi)容、發(fā)布時(shí)間、作者以及文章標(biāo)簽類型等字段。
(4) 報(bào)價(jià)信息表。主要用來(lái)記錄每個(gè)用戶的歷史報(bào)價(jià)信息及報(bào)價(jià)結(jié)果。包括用戶編號(hào)、報(bào)價(jià)產(chǎn)品的型號(hào)、外觀及內(nèi)在質(zhì)量要求、執(zhí)行標(biāo)準(zhǔn)、包裝要求等產(chǎn)品需求信息、報(bào)價(jià)結(jié)果、處理客服編號(hào)等字段。
4 系統(tǒng)架構(gòu)與功能實(shí)現(xiàn)
4.1 系統(tǒng)架構(gòu)
系統(tǒng)基于微服務(wù)架構(gòu),通過(guò)前后端分離模式進(jìn)行開(kāi)發(fā)。與傳統(tǒng)的MVC開(kāi)發(fā)模式不同,前后端分離模式大大降低了前端和后端的耦合性,把后端根據(jù)業(yè)務(wù)劃分成若干個(gè)服務(wù)組件,前、后端之間通過(guò)API網(wǎng)絡(luò)通信進(jìn)行數(shù)據(jù)交互,提升了系統(tǒng)的可維護(hù)性、開(kāi)發(fā)效率、以及綜合性能等。
4.2 智能機(jī)器人客服
系統(tǒng)報(bào)價(jià)模塊中,智能機(jī)器人客服為用戶提供24 h印染領(lǐng)域?qū)I(yè)問(wèn)答服務(wù)。主要以2種方式配合實(shí)現(xiàn),對(duì)此可得闡釋解析如下。
(1)通過(guò)深度學(xué)習(xí)Seq2Seq模型訓(xùn)練的基于生成的聊天機(jī)器人。首先進(jìn)行數(shù)據(jù)預(yù)處理,目前網(wǎng)絡(luò)上流行的中文問(wèn)答語(yǔ)料庫(kù)在質(zhì)量上參差不齊,且對(duì)話也存在噪音等,需要引入文本預(yù)處理,去除一些聊天噪音以及無(wú)意義對(duì)話等,對(duì)處理后的問(wèn)答數(shù)據(jù)進(jìn)行中文分詞,并以統(tǒng)一的格式整理成所需的語(yǔ)料庫(kù)。使用Keras初始化Seq2Seq模型并設(shè)定模型參數(shù)。再將預(yù)期準(zhǔn)備的語(yǔ)料庫(kù)送入模型中進(jìn)行訓(xùn)練。最終實(shí)驗(yàn)結(jié)果由語(yǔ)料庫(kù)質(zhì)量以及訓(xùn)練時(shí)間而定。通過(guò)該聊天機(jī)器人可以實(shí)現(xiàn)基礎(chǔ)對(duì)話的問(wèn)答交流。
(2)鑒于訓(xùn)練后的機(jī)器人并不能保證回答內(nèi)容的專業(yè)性,因而需要預(yù)先設(shè)定印染專業(yè)領(lǐng)域問(wèn)答庫(kù),根據(jù)閾值匹配問(wèn)句,繼而反饋對(duì)應(yīng)的答句。研究中,需整理出印染專業(yè)領(lǐng)域問(wèn)答,將問(wèn)句和答句一一對(duì)應(yīng)保存起來(lái),當(dāng)智能客服獲取用戶輸入時(shí),就會(huì)將用戶輸入與預(yù)設(shè)的問(wèn)句進(jìn)行相似度匹配,當(dāng)相似度到達(dá)所設(shè)的閾值時(shí),即向用戶反饋問(wèn)答庫(kù)中與該問(wèn)句對(duì)應(yīng)的答句。從而實(shí)現(xiàn)印染領(lǐng)域的專業(yè)問(wèn)答。
4.3 人工客服交流平臺(tái)
系統(tǒng)除了配備智能機(jī)器人客服進(jìn)行專業(yè)問(wèn)答之外,也為用戶提供了人工客服交流平臺(tái)。該平臺(tái)基于WebSocket進(jìn)行通信。WebSocket是一種在單個(gè)TCP連接上進(jìn)行全雙工通信的協(xié)議,可使得客戶端和服務(wù)器之間的數(shù)據(jù)交換變得更加簡(jiǎn)單,允許服務(wù)端主動(dòng)向客戶端推送數(shù)據(jù)。在WebSocket API中,瀏覽器和服務(wù)器只需要完成一次握手,兩者之間就直接可以創(chuàng)建持久性的連接,并進(jìn)行雙向數(shù)據(jù)傳輸。
本系統(tǒng)通過(guò)服務(wù)器同時(shí)與用戶端和客服端進(jìn)行WebSocket通信,當(dāng)用戶請(qǐng)求人工客服服務(wù)時(shí),會(huì)通過(guò)調(diào)度算法為該用戶實(shí)時(shí)分配當(dāng)前最空閑的客服,并在服務(wù)器中保存該用戶和客服的連接,由服務(wù)器來(lái)處理用戶和客服的交流。
4.4 報(bào)價(jià)需求提取流程
本文通過(guò)有限狀態(tài)自動(dòng)機(jī)作為報(bào)價(jià)需求提取流程的理論基礎(chǔ),通過(guò)模擬真實(shí)報(bào)價(jià)需求提取流程,定義出對(duì)應(yīng)的有限狀態(tài)自動(dòng)機(jī),該自動(dòng)機(jī)及其形式化定義如圖2、圖3所示。
在本方法中,用戶的合理需求是一個(gè)正則語(yǔ)言,需要解決的理論問(wèn)題為:用戶的輸入串是否屬于這個(gè)正則語(yǔ)言。該自動(dòng)機(jī)一開(kāi)始運(yùn)行即進(jìn)入初始狀態(tài),等待用戶輸入串,每次讀入輸入串就會(huì)根據(jù)狀態(tài)轉(zhuǎn)移函數(shù)得出下一個(gè)狀態(tài),直到進(jìn)入接受狀態(tài),則代表準(zhǔn)確的結(jié)構(gòu)化需求數(shù)據(jù)采集完畢,退出采集流程。
4.5 系統(tǒng)實(shí)現(xiàn)
印染需求智能分析系統(tǒng)通過(guò)前后端分離模式進(jìn)行開(kāi)發(fā)。其中,前端由React Native來(lái)操控視圖展示,由Mobx來(lái)管理前端狀態(tài);后端基礎(chǔ)模塊通過(guò)基于Node.js的Express框架進(jìn)行開(kāi)發(fā)并封裝成接口供前端調(diào)用;深度學(xué)習(xí)部分通過(guò)Keras進(jìn)行聊天機(jī)器人模型的訓(xùn)練。前端視圖捕獲到用戶的輸入后會(huì)進(jìn)行對(duì)應(yīng)的邏輯處理,如果需要與后端發(fā)生交互,則通過(guò)Ajax調(diào)用Express以及Keras封裝好的Restful API進(jìn)行數(shù)據(jù)交互,獲取到后端返回的數(shù)據(jù)后,再通過(guò)可視化的形式展示給用戶。
5 結(jié)束語(yǔ)
在新的時(shí)代背景下,隨著數(shù)據(jù)量的不斷擴(kuò)大以及移動(dòng)化聯(lián)網(wǎng)技術(shù)不斷走向成熟,新的電子互聯(lián)網(wǎng)商業(yè)模式必將興起,作為中國(guó)的傳統(tǒng)制造業(yè),紡織行業(yè)也必須隨之進(jìn)行技術(shù)改造來(lái)推動(dòng)自身向高端化、智能化、綠色化、服務(wù)化的轉(zhuǎn)型。本文通過(guò)需求分析、系統(tǒng)設(shè)計(jì)、數(shù)據(jù)庫(kù)設(shè)計(jì)以及對(duì)有限狀態(tài)自動(dòng)機(jī)理論的研究等,將技術(shù)與理論相融合,實(shí)現(xiàn)了印染需求智能分析系統(tǒng)。通過(guò)本系統(tǒng),用戶可以簡(jiǎn)潔方便地滿足產(chǎn)品報(bào)價(jià)需求,同時(shí)還可以瀏覽印染行業(yè)資訊文章;有了智能機(jī)器人客服以及自動(dòng)化采集報(bào)價(jià)需求流程,可以大大提升人工客服的工作效率,為用戶高效準(zhǔn)確地做出報(bào)價(jià);用戶的歷史報(bào)價(jià)信息也可以被規(guī)范統(tǒng)一地加以整理,便于后續(xù)查詢或分析。為印染行業(yè)報(bào)價(jià)服務(wù)提供了一套智能、高效的解決方案。
參考文獻(xiàn)
[1]SIPSER M. Introduction to the theory of computation[M]. 3rd ed. USA:Cengage Learning,2012.
[2]FAMILIAR B. Microservice architecture[M]//Microservices, IoT, and Azure. Berkeley, CA:Apress,2015:21-31 .
[3]SRIRAM A, JUN H, SATHEESH S, et al. Cold fusion:Training Seq2Seq models together with language models[J].arXiv preprint arXiv:1708.06426,2017.
[4]LIU Tianyu, WANG Kexiang, SHA Lei, et al. table-to-text generation by structure-aware Seq2seq learning[J]. arXiv preprint arXiv:1711.09724,2017.
[5]DENG Li, YU Dong. Deep learning: Methods and applications[J]. Hanover, MA, USA:Now Publishers Inc., 2014.
[6]張曙. 工業(yè)4.0和智能制造[J]. 機(jī)械設(shè)計(jì)與制造工程, 2014,43(8):1-5.
[7]GERS F A, SCHMIDHUBER J, CUMMINS F. Learning to forget: Continual prediction with LSTM[J]. Neural Computation,2000,12(10):2451-2471.
[8]GRISHMAN R. Information extraction[M]//MITKOV R. The Oxford Handbook of Computational Linguistics . New York: Oxford University Press,2003:545-559.
[9]李向陽(yáng), 苗壯. 自由文本信息抽取技術(shù)[J]. 情報(bào)科學(xué), 2004, 22(7):815-821.
[10]HOLTGRAVES T, HAN Tailin. A procedure for studying online conversational processing using a chat bot[J]. Behavior Research Methods, 2007, 39(1):156-163.
[11]BRAND D, ZAFIROPULO P. On communicating finite-state machines[J]. Journal of the ACM, 1983, 30(2):323-342.
[12]劉曉慧, 鄭廣澤. C2M模式下服裝智能個(gè)性化定制的優(yōu)勢(shì)及發(fā)展[J]. 服裝學(xué)報(bào), 2016, 1(5):477-481.
[13]李晗. 面向個(gè)性化定制的智慧服裝生態(tài)系統(tǒng)若干問(wèn)題研究[D].? 北京: 北京交通大學(xué),2017.
[14]賈艷玲, 郭偉, 李瑞華. 紡織企業(yè)實(shí)施大規(guī)模定制生產(chǎn)模式的研究[J]. 紡織科學(xué)研究, 2005(4):36-40.
[15]曾婷婷, 李輝. 面向電子商務(wù)的產(chǎn)品報(bào)價(jià)系統(tǒng)研究與設(shè)計(jì)[J]. 微計(jì)算機(jī)信息, 2008, 24(30):137-138, 136.
[16]徐廣林, 林貢欽. 工業(yè)4.0背景下傳統(tǒng)制造業(yè)轉(zhuǎn)型升級(jí)的新思維研究[J]. 上海經(jīng)濟(jì)研究, 2015(10):107-113.