郭朝暉
(優(yōu)也信息科技有限公司,上海 201209)
隨著數(shù)字化技術(shù)的推進,我們逐步走入了工業(yè)大數(shù)據(jù)時代。對這個概念,人們往往既熟悉又陌生,既對未來滿懷期待,又對現(xiàn)實充滿困惑。
全文結(jié)構(gòu)安排如下。第一部分討論工業(yè)大數(shù)據(jù)的背景與意義,必須跳出大數(shù)據(jù)技術(shù)本身,從智能化的視野看問題,才能看到完整的意義。第二部分闡述工業(yè)大數(shù)據(jù)的概念,不僅要看到工業(yè)大數(shù)據(jù)“新”在何處,更要與推進智能化的意義和工業(yè)的特點相結(jié)合。第三部分分析工業(yè)大數(shù)據(jù)的優(yōu)勢,也就是通過工業(yè)大數(shù)據(jù)促進知識獲取、推動智能化。第四部分采用工業(yè)大數(shù)據(jù)推進業(yè)務(wù)創(chuàng)新時的定位與策略。第五部分闡述工業(yè)大數(shù)據(jù)的價值創(chuàng)造與企業(yè)管理之間的關(guān)系。
很多工業(yè)大數(shù)據(jù)的文章介紹的是數(shù)據(jù)分析。但是,如果只是從這個視角看問題,就會是管中窺豹,看不到它對人類未來的意義和價值。
摩爾定律延續(xù)了50年,成就了今天的大數(shù)據(jù)。但數(shù)據(jù)量本身并沒有多大的意義,它的作用在于推動人類走向智能社會,改變著人類認(rèn)識世界、改造世界的方式[1-4],甚至把人類帶入新的文明階段[5]。
從數(shù)據(jù)、信息、知識、智慧(data、information、knowledge、wisdom,DIKW)體系理論中,我們可以看到從數(shù)據(jù)到智能的邏輯關(guān)系。這個理論的基本思想是:數(shù)據(jù)之間的關(guān)聯(lián)形成信息,信息中的關(guān)聯(lián)蘊含知識,知識的綜合運用形成智慧??梢哉f,大數(shù)據(jù)是走向智能社會的基礎(chǔ)。
智能制造成為當(dāng)今的熱點,體現(xiàn)了這個理論的預(yù)見性。目前階段,漢語中的智能制造一般對應(yīng)英文中的Smart Manufacture。它強調(diào)的是通過信息感知、基于知識的決策和執(zhí)行過程的統(tǒng)一,實現(xiàn)對系統(tǒng)內(nèi)外部變化的快速響應(yīng)。智能制造的主流流派,幾乎都體現(xiàn)這種思想[6-9]。在筆者看來,智能的本質(zhì)就是感知、決策、執(zhí)行的統(tǒng)一[10]。
人工智能(artificail intelligent,AI)是近期的科技熱點之一。大數(shù)據(jù)對推動人工智能起到了關(guān)鍵作用。但是,當(dāng)前主流的智能制造一般不能理解為人工智能技術(shù)在工業(yè)界的應(yīng)用(即intelligent manufacture)。智能制造目前的重點是感知和處理信息能力的提高,未必涉及到特殊的認(rèn)知過程或復(fù)雜的邏輯推理,因此未必與AI技術(shù)相關(guān)。比如,有些所謂的“智能家電”,只不過是有了遠(yuǎn)程遙控能力。從這個角度理解智能制造,能夠看到的機會要比AI的應(yīng)用廣泛得多[6]、也更容易落地。
智能決策的邏輯可能很簡單,但卻能讓決策的精確性上升,實時性更強、成本也更低,讓智能化具有真正的價值。智能制造的時代機會首先應(yīng)該歸結(jié)于信息獲取和傳播能力的增強,而不是某些學(xué)術(shù)理論的產(chǎn)生。其中,互聯(lián)網(wǎng)能夠成為工業(yè)智能化的重要推手,就是因為它能促進信息感知能力的提升。
理解智能制造的關(guān)鍵之一是理解人機關(guān)系。通用電氣的工業(yè)互聯(lián)網(wǎng)白皮書[8],強調(diào)了重構(gòu)人和機器的邊界——在數(shù)字化、網(wǎng)絡(luò)化的背景下,重新思考人和機器如何分工、促進業(yè)務(wù)活動的創(chuàng)新。從這個角度看,“智能化”的操作性很好,在信息獲取、知識獲取、決策、執(zhí)行等環(huán)節(jié)都可以有新的人機界面和業(yè)務(wù)模式。比如,尋找信息或知識時,可以讓機器自動去找,也可以人機協(xié)同去找。利用知識或信息時,可以是機器自動地應(yīng)用,也可以讓機器處理后推送給人類[11]。只要能夠充分發(fā)揮信息、通信和技術(shù) (information communication technology,ICT),ICT帶來的優(yōu)勢就是值得鼓勵的。
在業(yè)務(wù)創(chuàng)新方面,需要有豐富的想象力。既不要將大數(shù)據(jù)工作局限于從數(shù)據(jù)中發(fā)現(xiàn)知識,也不要將智能化理解為機器代替人類工作或決策??傊?,要避免因眼光的局限而漠視創(chuàng)新的機會。
用數(shù)據(jù)幫助人類決策的意義非常巨大:不僅可以提高決策質(zhì)量,還能借助互聯(lián)網(wǎng)讓決策者遠(yuǎn)離現(xiàn)場,讓決策的效率大大提升。這不僅能促進人類智力的共享,更能有效地提升企業(yè)的管理能力。而管理能力提升帶來的價值,是不可估量的。總之,工業(yè)的智能制造是ICT技術(shù)發(fā)展帶來的機遇。
智能決策可能不需要復(fù)雜的邏輯,但卻一定需要專業(yè)化的知識。大數(shù)據(jù)的本質(zhì)優(yōu)勢是其有利于知識和信息的獲取。從這個邏輯,我們可以看到工業(yè)大數(shù)據(jù)對于工業(yè)的價值。為此,應(yīng)該從知識的角度,討論工業(yè)大數(shù)據(jù)的特點和要求。
事實上,大數(shù)據(jù)在獲取知識和信息獲取方面具有天然的優(yōu)勢:人類的一切知識來源于歷史,大數(shù)據(jù)有條件更加完整全面地記錄歷史。我們需要從這個方面去分析大數(shù)據(jù)在知識產(chǎn)生和應(yīng)用方面的特點[11]。
在互聯(lián)網(wǎng)領(lǐng)域,“大數(shù)據(jù)”一般指PT級別以上的數(shù)據(jù)。這個定義的依據(jù)是:數(shù)據(jù)規(guī)模大到一定程度,針對存儲、檢索等過程的傳統(tǒng)處理方法就困難了。人們經(jīng)常提到大數(shù)據(jù)具有價值(value)、大量(volume)、高速(velocity)、多樣(variety)“4V”特征,就是針對數(shù)據(jù)處理困難提出的。這些特征,讓大數(shù)據(jù)區(qū)別于以往。
在工業(yè)界,數(shù)據(jù)的結(jié)構(gòu)和相互關(guān)系特別復(fù)雜。在數(shù)據(jù)規(guī)模遠(yuǎn)遠(yuǎn)不到PT級別時,很多數(shù)據(jù)處理方法就不合適了。針對這種情況,國外有學(xué)者提出,大數(shù)據(jù)的概念不必糾結(jié)于數(shù)據(jù)規(guī)模。凡是遇到傳統(tǒng)數(shù)據(jù)分析方法無效的數(shù)據(jù)集合,都可稱為“大數(shù)據(jù)”。根據(jù)這種思想,文獻[12]將工業(yè)大數(shù)據(jù)定義為“工業(yè)數(shù)據(jù)的總和”。
然而,對應(yīng)用大數(shù)據(jù)的企業(yè)來講,人們關(guān)心的是大數(shù)據(jù)能為企業(yè)帶來什么價值,而不是數(shù)據(jù)處理時遇到什么困難。所以,我們需要換個角度理解大數(shù)據(jù)。有人指出:在大數(shù)據(jù)時代,研究的是相關(guān)關(guān)系而非因果關(guān)系,簡單算法勝過復(fù)雜算法[2-4]。從這個角度我們可以看到:大數(shù)據(jù)時代更容易獲得知識或者模型。這個角度對企業(yè)是有吸引力的。
然而,對于這種說法,工業(yè)界卻傳出了不同的聲音。工業(yè)界對分析結(jié)果的可靠性要求往往很高。大數(shù)據(jù)必須能夠幫助人們獲得可靠的信息或者知識。僅憑相關(guān)性是不夠的,而是必須有因果性的支撐。
事實上,工業(yè)對象或過程往往可以看成復(fù)雜的系統(tǒng)。要素眾多、控制回路眾多、相互關(guān)系復(fù)雜。這時,相關(guān)性與因果性往往并不等價、甚至趨勢相反。
為此,在分析工業(yè)數(shù)據(jù)時,膚淺和片面的分析往往是有害的。為避免這種現(xiàn)象,數(shù)據(jù)本身必須準(zhǔn)確記錄系統(tǒng)中諸要素的關(guān)聯(lián)關(guān)系,完整地記錄系統(tǒng)的狀態(tài)和運行軌跡。例如,進行產(chǎn)品質(zhì)量分析時,需要把各個生產(chǎn)工序中的人員、物料、工藝、設(shè)備、質(zhì)量等信息與對應(yīng)的產(chǎn)品關(guān)聯(lián)起來,并記錄準(zhǔn)確的時間參數(shù),以便追溯事件之間的因果關(guān)系。要做到這一點,自然會對數(shù)據(jù)的采集和存儲能力產(chǎn)生較高的要求。
過去,由于數(shù)據(jù)存儲成本高,企業(yè)往往只能挑重要的記錄、不得不丟失一些數(shù)據(jù)。由于網(wǎng)絡(luò)的應(yīng)用不普及,數(shù)據(jù)的記錄往往是碎片化的。由于這方面的原因,數(shù)據(jù)的完整性往往不夠,導(dǎo)致數(shù)據(jù)的分析價值不大。在大數(shù)據(jù)時代,數(shù)據(jù)采集和記錄的完整性、實時性顯著加強;在推進智能制造的過程中,信息集成的能力大大加強,也為數(shù)據(jù)質(zhì)量和數(shù)量的提升創(chuàng)造了很好的條件。這應(yīng)該是工業(yè)進入大數(shù)據(jù)時代區(qū)別于以往的一個重要特征。
DIKW體系啟發(fā)我們:大數(shù)據(jù)的劃時代意義在于促進知識的獲取。本文在參照有關(guān)觀點的基礎(chǔ)上[3-4],將工業(yè)大數(shù)據(jù)的相關(guān)優(yōu)勢歸結(jié)為以下三個方面。
第一個優(yōu)勢是“不糾結(jié)于因果”。本文的這種提法區(qū)別于互聯(lián)網(wǎng)領(lǐng)域的“是相關(guān),不是因果”,以及工業(yè)工程師強調(diào)的“必須是因果”。其具體含義是:從大數(shù)據(jù)中提煉的工業(yè)知識,要以因果關(guān)系存在為基礎(chǔ);但應(yīng)用知識時,不必按照科學(xué)機理的邏輯去計算。這個邏輯并不奇怪:工業(yè)界常用的試驗結(jié)果符合因果關(guān)系,但試驗的具體數(shù)值卻不是按照因果邏輯計算得到的。同樣,通過規(guī)范數(shù)據(jù)分析邏輯,可以讓工業(yè)大數(shù)據(jù)像“試驗數(shù)據(jù)”一樣有用。“不糾結(jié)于因果”讓知識獲取變得簡單,也能讓知識獲取的范疇拓展到“感性知識”和“經(jīng)驗知識”。
第二個優(yōu)勢是“樣本=全體”。具有這個優(yōu)勢時,當(dāng)前發(fā)生的問題,可以從歷史中找到答案,只要找到并模仿過去成功的做法就可以了,而不必建立復(fù)雜的模型。故而,大數(shù)據(jù)背景下,簡單的算法可以解決復(fù)雜的問題。筆者認(rèn)為,從應(yīng)用的角度看,大數(shù)據(jù)的優(yōu)勢不在“大”,而在“全”。“大”會增加計算機處理的復(fù)雜性,而“全”則保證了知識的存在性。
第三個優(yōu)勢是“混雜性”。如前所述,可靠性是工業(yè)界追求的一個重要目標(biāo)。具體到建模過程中,就是對“泛化性”的要求高。數(shù)據(jù)的“混雜性”強時,可以找到多個角度的印證邏輯,提高分析結(jié)果的可靠性,也為“不糾結(jié)于因果”提供了條件。當(dāng)前,做到這一點的前提,是前面提到的數(shù)據(jù)完整性。
由此可見,以上三個優(yōu)勢都體現(xiàn)在知識獲取。而這個優(yōu)勢的價值,又進一步體現(xiàn)在對智能化的推動。然而,大數(shù)據(jù)的這些優(yōu)勢并不是天生存在,而是要人去創(chuàng)造。
“世界上沒有兩片完全一樣的葉子”。世界上每個具體問題都是獨特的。談到“樣本=全體”時,必然涉及到個性與共性的關(guān)系。所以,要借鑒過往的經(jīng)驗,前提是要進行抽象、歸納、總結(jié)。但這往往是人類才能做的事情,至少需要人類告訴計算機怎么做。從這個角度講,大數(shù)據(jù)的應(yīng)用也需要人機界面的創(chuàng)新。
大數(shù)據(jù)記錄的數(shù)據(jù)畢竟屬于過去,未來可能是不同的。具體應(yīng)用時,不能過度依賴于“樣本=全體”的假設(shè)。在可靠度要求較高的場景,業(yè)務(wù)系統(tǒng)有后備的辦法來應(yīng)對新問題??傊?,要發(fā)揮大數(shù)據(jù)的優(yōu)勢,又要避免可能帶來的風(fēng)險。
再如“不糾結(jié)于因果”的前提是能夠保證因果。但是,單憑數(shù)據(jù)的分析結(jié)果是無法保證因果的。因果關(guān)系一般只能是具有專業(yè)知識的人用自己的領(lǐng)域知識去保證。
另外,大量工業(yè)數(shù)據(jù)常常來自個別的“工作點”附近。數(shù)據(jù)量雖然很大,但相似度大、信息含量低而噪聲干擾相對大。要解決這個問題,不僅要綜合分析各個工作點的特點,而且還要把生產(chǎn)數(shù)據(jù)和試驗數(shù)據(jù)結(jié)合起來,而不局限于生產(chǎn)數(shù)據(jù)本身。
從企業(yè)的角度看,大數(shù)據(jù)重要的用途是促進企業(yè)的業(yè)務(wù)創(chuàng)新[13]。為此,需要思考大數(shù)據(jù)技術(shù)與業(yè)務(wù)對接的問題和方法。
建立大數(shù)據(jù)系統(tǒng)時,其功能定位往往與傳統(tǒng)的信息或控制系統(tǒng)有所不同。在過去的系統(tǒng)中,數(shù)據(jù)是用來支撐基本的業(yè)務(wù)活動的。業(yè)務(wù)活動結(jié)束后,數(shù)據(jù)也就基本沒用了。而大數(shù)據(jù)往往是在產(chǎn)生數(shù)據(jù)的相關(guān)業(yè)務(wù)場景結(jié)束之后才被使用的。故而有人稱之為“二次應(yīng)用”。
二次應(yīng)用當(dāng)然也要服務(wù)于現(xiàn)實的業(yè)務(wù)。但是,二次應(yīng)用一般不是業(yè)務(wù)運行所必須的,而是為了讓業(yè)務(wù)做得更好——可以發(fā)現(xiàn)過去業(yè)務(wù)中的問題和缺陷,也可以從過去的業(yè)務(wù)中找到好的標(biāo)桿,還可以從過去的業(yè)務(wù)中發(fā)現(xiàn)規(guī)律、進行進一步的優(yōu)化。所以,大數(shù)據(jù)與“優(yōu)化”工作有著不解之緣,能讓優(yōu)化成為一種常態(tài)。
很多文章只強調(diào)從大數(shù)據(jù)中發(fā)現(xiàn)信息或知識。事實上,大數(shù)據(jù)還可以用來直接承載知識本身。換句話說:有些知識的承載也需要大數(shù)據(jù)才能做到。
復(fù)雜產(chǎn)品的設(shè)計數(shù)據(jù)、指導(dǎo)工作的操作動畫、設(shè)備的標(biāo)準(zhǔn)狀態(tài)等都可能需要很大的數(shù)據(jù)量來存儲和處理,都需要大數(shù)據(jù)技術(shù)。例如,有家廣告設(shè)計企業(yè),為了處理產(chǎn)品的設(shè)計數(shù)據(jù),每天用電量就高達(dá)10萬元。用大數(shù)據(jù)承載這樣的知識,便于知識的重復(fù)使用,進而促進業(yè)務(wù)活動的創(chuàng)新和再造。
大數(shù)據(jù)技術(shù)常被用來進行業(yè)務(wù)的創(chuàng)新。這時會遇到一個矛盾:業(yè)務(wù)創(chuàng)新的邏輯是“先做成、后做好”,然而,前面強調(diào)二次應(yīng)用,指的是大數(shù)據(jù)主要用于“做好”的優(yōu)化階段。為了解決這個矛盾,新的業(yè)務(wù)邏輯必須提前考慮清楚,必須考慮大數(shù)據(jù)條件不成熟時的托底辦法,逐步過度到“做好”的階段。當(dāng)然,理想的情況是:原有業(yè)務(wù)的需求升級,自然地將數(shù)據(jù)處理技術(shù)推進到大數(shù)據(jù)階段。石家莊的天遠(yuǎn)公司就是這樣。
另外,所謂的“做好”包括多個方面:質(zhì)量更好、速度更快、成本更優(yōu),而不僅僅是決策質(zhì)量更好。比如,知識和信息的重用,就可幫助人們做得更快、成本更低。不要一味地強調(diào)“決策質(zhì)量更優(yōu)”。如果僅僅局限于優(yōu)化決策質(zhì)量,就可能會失去很多創(chuàng)新機會。
理解了智能制造和大數(shù)據(jù)的原理和意義,具體應(yīng)用中也會遭遇各種困惑。典型的困惑往往是如何為企業(yè)創(chuàng)造價值。任何技術(shù)都是需要成本的,很多技術(shù)帶來的價值不足以抵消成本的付出。只有將技術(shù)應(yīng)用在合適的場景、解決合適的問題,經(jīng)濟性才會好。所以,人們在技術(shù)經(jīng)濟性的困惑,本質(zhì)上就是找不到合適的場景。
經(jīng)過筆者的調(diào)查,通過智能化、大數(shù)據(jù)的手段提升企業(yè)的管理水平,價值潛力是非常巨大的。管理不當(dāng)造成的損失,一般占到企業(yè)成本的10%~20%。這些就是管理水平提升的潛力所在。在我國,管理水平低常常是制約企業(yè)產(chǎn)品質(zhì)量提升和技術(shù)發(fā)展的瓶頸。
恩格斯說:“何一門科學(xué)的真正完善,在于數(shù)學(xué)工具的廣泛應(yīng)用?!睋Q個角度看:如果企業(yè)的管理不能完善到一定的程度,數(shù)學(xué)的用處就不會太大。所以,并非所有的企業(yè)和部門都適合推進大數(shù)據(jù),選擇用戶和場景是非常重要的。
要對管理進行“優(yōu)化”,就要找到管理中的漏洞和不足。但是,管理漏洞往往是“隱藏的”。所以,我們需要進一步能分析:什么原因?qū)е逻@些問題被隱藏起來。在筆者看來,問題隱藏的原因大體上可以分成以下三類。
①沒有量化的數(shù)據(jù)、更不能實時地得到數(shù)據(jù)。
②問題涉及到多個部門,信息沒有集成起來。
③涉及到局部利益或責(zé)任,有意無意地掩蓋問題。
ICT的機遇在于解決這些問題、實現(xiàn)透明化,以提高管理水平。具體地說,廣泛地推動數(shù)字化,可以幫助人們解決第一類問題;推進互聯(lián)網(wǎng)的應(yīng)用,可以解決第二類問題;用數(shù)字化實現(xiàn)業(yè)務(wù)過程和價值損失的透明化,可以用來解決第三類問題。
解決這些問題時可能涉及復(fù)雜的邏輯。但是,只要人類能把問題和邏輯說清楚,機器就不嫌麻煩。這其實就是智能化的優(yōu)勢。而用數(shù)據(jù)幫助人類實現(xiàn)知識的數(shù)字化,又讓我們看到了人機界面的創(chuàng)新和大數(shù)據(jù)的優(yōu)勢。
大數(shù)據(jù)應(yīng)用的效果關(guān)鍵在經(jīng)濟性。而經(jīng)濟性的關(guān)鍵,首先在于業(yè)務(wù)問題本身的價值,其次是技術(shù)線路是否可行。為此,推進大數(shù)據(jù)應(yīng)用的時候,建議用“以終為始”的工程方法。
所謂“以終為始”就是在項目開始時,先找出有價值的問題、確定解決問題的基本思路。也就是先明確業(yè)務(wù)目標(biāo)和技術(shù)線路、確定技術(shù)和經(jīng)濟的可行性,并在此基礎(chǔ)上探索數(shù)據(jù)處理的方法。這時,探索數(shù)據(jù)處理方法的目的,是為了得到更好的效果,而不是去驗證技術(shù)線路是否可行。這樣做可以把最大的風(fēng)險放在前面進行研究,避免項目做完后的功虧一簣。
要做到這一點,首先要充分理解業(yè)務(wù)需求,其次要研究專業(yè)技術(shù)人員分析問題、解決問題的邏輯。這個邏輯通順之后,再把它轉(zhuǎn)化成數(shù)據(jù)處理問題。經(jīng)驗表明:絕大多數(shù)的管理問題,人類是能夠找到可行的思路的;同時,如果把這些思路轉(zhuǎn)化成計算機處理的問題時,效果往往會更好。
最后需要指出的是:采用計算機處理數(shù)據(jù)的目的之一,是降低人類處理信息的復(fù)雜程度、提高勞動效率和質(zhì)量。所以,人類關(guān)心的不是原始數(shù)據(jù),而是重點的業(yè)務(wù)信息。比如,不是看壓力、溫度、流量,而是設(shè)備是否正常、操作是否規(guī)范。只有提高了管理者的勞動效率,才能有效地提高管理水平。
概念的提出不是為了標(biāo)新立異或者追趕潮流,而是為了幫助我們發(fā)現(xiàn)新機會、解決新問題、創(chuàng)造新價值。為此,我們不僅要看到大數(shù)據(jù)時代的麻煩和挑戰(zhàn),更要看到大數(shù)據(jù)帶來的機會。要善于發(fā)現(xiàn)機會,還要善于抓住機會、創(chuàng)造機會。
從未來看現(xiàn)在,大數(shù)據(jù)的機會來自于智能化的推進。大數(shù)據(jù)的概念和優(yōu)勢也要圍繞著這個要點來考慮。
具體應(yīng)用時必須明白:技術(shù)的應(yīng)用效果不是技術(shù)本身所決定的,而是要結(jié)合實際的應(yīng)用場景。抓住機會的前提是理解企業(yè)的文化、管理現(xiàn)狀和業(yè)務(wù)痛點,不要單純從技術(shù)層面看問題。