李晶偉王毅
(1.中國人民大學(xué),北京 100872;2.遼寧大學(xué),遼寧沈陽 110136)
企業(yè)檔案大數(shù)據(jù)分析方法與技術(shù)創(chuàng)新雙向決策模型
李晶偉1王毅2
(1.中國人民大學(xué),北京 100872;2.遼寧大學(xué),遼寧沈陽 110136)
大數(shù)據(jù)分析方法可以幫助企業(yè)從檔案數(shù)據(jù)中發(fā)現(xiàn)規(guī)律和問題,推動企業(yè)科學(xué)決策與技術(shù)創(chuàng)新。基于目標(biāo)驅(qū)動的“技術(shù)評估與預(yù)測模型”與基于數(shù)據(jù)驅(qū)動的“技術(shù)監(jiān)測與預(yù)警模型”雙向決策模型本質(zhì)上是企業(yè)管理決策的一種科學(xué)工具,有利于企業(yè)技術(shù)知識的可視化累積和知識發(fā)現(xiàn),有利于企業(yè)流程重造、質(zhì)量控制以及合作模式創(chuàng)新,有利于企業(yè)風(fēng)險管理、偏差檢測、預(yù)警響應(yīng)等。應(yīng)注意模型應(yīng)用策略,及時建立失效預(yù)警機(jī)制,自覺維護(hù)客戶隱私,確定數(shù)據(jù)存儲期限。
企業(yè)檔案;大數(shù)據(jù)分析方法;技術(shù)創(chuàng)新;決策模型
大數(shù)據(jù)分析方法是企業(yè)技術(shù)創(chuàng)新的方法之一,可以幫助企業(yè)從大量復(fù)雜數(shù)據(jù)中發(fā)現(xiàn)規(guī)律和問題,實(shí)現(xiàn)從“數(shù)據(jù)分析能力”向“數(shù)據(jù)決策能力與優(yōu)勢”的轉(zhuǎn)化。企業(yè)檔案是企業(yè)知識資產(chǎn)和信息資源的重要組成部分,具有知識創(chuàng)新性、不可替代性,為企業(yè)技術(shù)創(chuàng)新提供數(shù)據(jù)基礎(chǔ)。對于企業(yè)而言,抓住大數(shù)據(jù)時代帶來的技術(shù)機(jī)遇,將大數(shù)據(jù)分析方法運(yùn)用在企業(yè)檔案信息資源分析挖掘上,可推動企業(yè)科學(xué)決策和技術(shù)創(chuàng)新。
“技術(shù)創(chuàng)新的本質(zhì)就是組織利用知識創(chuàng)造出新知識的過程”[1],拓寬“技術(shù)創(chuàng)新”的外延,將企業(yè)技術(shù)創(chuàng)新界定為“企業(yè)管理決策思維創(chuàng)新”。根據(jù)朱東華等提出的大數(shù)據(jù)環(huán)境下面向技術(shù)創(chuàng)新管理的雙向決策模型[2],即從“技術(shù)評估與預(yù)測”“技術(shù)監(jiān)測與預(yù)警”兩個方面構(gòu)建適用于企業(yè)技術(shù)創(chuàng)新管理的新方案,以及王毅等提出的“國有企業(yè)檔案大數(shù)據(jù)管理與技術(shù)創(chuàng)新模型”[3]理論基礎(chǔ),探討檔案大數(shù)據(jù)分析方法與企業(yè)技術(shù)創(chuàng)新的關(guān)系,結(jié)合大數(shù)據(jù)分析方法,構(gòu)建企業(yè)檔案大數(shù)據(jù)分析方法與技術(shù)創(chuàng)新雙向決策模型。該模型本質(zhì)上是企業(yè)運(yùn)用大數(shù)據(jù)分析方法的管理決策思維外化而成的科學(xué)決策工具。
雙向決策模型主要由兩部分組成(如圖1所示):右側(cè)部分顯示該模型遵循“數(shù)據(jù)采集——數(shù)據(jù)預(yù)處理及存儲——數(shù)據(jù)分析挖掘——數(shù)據(jù)應(yīng)用”的數(shù)據(jù)生命周期,主要功能是為模型構(gòu)造提供思維依據(jù);左側(cè)顯示模型主體部分,主要由兩部分——技術(shù)評估與預(yù)測模型和技術(shù)監(jiān)測與預(yù)警模型構(gòu)成。左側(cè)主體雙向決策模型建立的基礎(chǔ)是“企業(yè)檔案信息資源”板塊和“大數(shù)據(jù)環(huán)境下云計算平臺”板塊,前者為雙向決策模型提供數(shù)據(jù)來源,后者為雙向決策模型提供存儲和運(yùn)行平臺。主體第一部分為目標(biāo)驅(qū)動技術(shù)評估與預(yù)測模型,主要功能是以傳統(tǒng)大數(shù)據(jù)分析方法和技術(shù)為手段分析挖掘企業(yè)內(nèi)部檔案信息資源,達(dá)到技術(shù)評估與預(yù)測目的;主體第二部分為數(shù)據(jù)驅(qū)動技術(shù)監(jiān)測與預(yù)警模型,主要功能是以自組織動態(tài)實(shí)時監(jiān)測大數(shù)據(jù)分析方法和技術(shù)為手段分析挖掘企業(yè)外部有價值的檔案信息資源,預(yù)
警突發(fā)情況,達(dá)到技術(shù)監(jiān)測與預(yù)警目的。需要說明的是,技術(shù)監(jiān)測與預(yù)警模型、技術(shù)評估與預(yù)測模型中各自運(yùn)用的大數(shù)據(jù)分析方法與技術(shù)是相通的,在實(shí)際分析中可根據(jù)需要選擇。
圖1 企業(yè)檔案大數(shù)據(jù)分析方法與技術(shù)創(chuàng)新雙向決策模型
(一)目標(biāo)驅(qū)動的技術(shù)評估與預(yù)測模型
技術(shù)評估與預(yù)測模型著眼于企業(yè)內(nèi)部檔案信息資源,以“目標(biāo)驅(qū)動決策”展開。對于企業(yè)管理者而言,首先需要弄清楚目標(biāo)需求?;谀繕?biāo)驅(qū)動,通常采取傳統(tǒng)意義上的大數(shù)據(jù)分析挖掘方法,經(jīng)過數(shù)據(jù)采集、預(yù)處理、分析挖掘,從企業(yè)檔案信息資源中獲取推動企業(yè)技術(shù)創(chuàng)新知識、觀點(diǎn)或者管理思維。然而對于傳統(tǒng)意義上十大類企業(yè)檔案信息資源,企業(yè)管理者的目標(biāo)需求不同,分析挖掘的企業(yè)檔案信息資源種類也不同。因此,企業(yè)管理者在運(yùn)用技術(shù)評估與預(yù)測模型時,應(yīng)當(dāng)具體問題具體分析。
對于企業(yè)科研開發(fā)、儀器設(shè)備等技術(shù)類檔案而言,通過分析挖掘,實(shí)現(xiàn)對潛在技術(shù)信息的發(fā)現(xiàn)與可視化,企業(yè)管理者可以評估技術(shù)發(fā)展?fàn)顟B(tài)并預(yù)測技術(shù)發(fā)展趨勢。美國佐治亞理工大學(xué)Alan
Porter教授提出以“技術(shù)機(jī)會分析”方法為核心的“技術(shù)挖掘”理論[4],可以為企業(yè)管理者針對技術(shù)類檔案分析挖掘提供借鑒。通過整合專家知識和文獻(xiàn)計量方法,將與某特定新興技術(shù)相關(guān)領(lǐng)域的科技文獻(xiàn)采集、處理、分析挖掘,進(jìn)而發(fā)掘該技術(shù)領(lǐng)域內(nèi)的核心企業(yè)、技術(shù)的實(shí)時變化和與該技術(shù)企業(yè)聯(lián)系密切的相關(guān)技術(shù)參與者間的關(guān)系并可視化展示,從而掌握技術(shù)競爭情報,預(yù)測創(chuàng)新路徑。在利用文獻(xiàn)計量法時采用“自然語言處理技術(shù)”“主題詞簇技術(shù)”等,實(shí)現(xiàn)對噪聲數(shù)據(jù)的清洗與合并。
對于經(jīng)營管理類、生產(chǎn)管理類檔案,企業(yè)管理者可以運(yùn)用關(guān)聯(lián)規(guī)則、聚類分析、分類回歸分析、時序分析等方法,實(shí)現(xiàn)企業(yè)檔案潛在規(guī)律模式的發(fā)現(xiàn)與可視化,形成新的管理思維,做出精確的市場趨勢預(yù)測和企業(yè)管理模式的轉(zhuǎn)變,進(jìn)而實(shí)施更加有效的市場營銷戰(zhàn)略,提升企業(yè)競爭力。以樂購公司經(jīng)營管理中會員卡顧客數(shù)據(jù)為例。樂購公司的會員卡中記錄顧客購物商品信息,樂購公司通過顧客信息挖掘并分類,得出顧客購買商品間的相關(guān)關(guān)系,進(jìn)而調(diào)整策略,使樂購的非食品類產(chǎn)品和服務(wù)類產(chǎn)品銷售大大增加;同時樂購公司通過精確的實(shí)驗(yàn)分析,將會員卡用戶細(xì)分,針對不同用戶提供不同的優(yōu)惠促銷活動。優(yōu)惠券的答復(fù)率在直銷業(yè)一般為2%,樂購公司在匯率支付的年度大型樂購700萬優(yōu)惠券中答復(fù)率高達(dá)20%。通過精確的用戶細(xì)分,樂購公司不僅提升客戶的忠誠度,更在業(yè)績方面居于市場領(lǐng)先地位。
(二)數(shù)據(jù)驅(qū)動的技術(shù)監(jiān)測與預(yù)警模型
數(shù)據(jù)時代,任何一種信息都可能為企業(yè)技術(shù)創(chuàng)新帶來新思維。對于企業(yè)而言,不僅應(yīng)該關(guān)注自身擁有的數(shù)據(jù)資產(chǎn),更應(yīng)關(guān)注企業(yè)外部與企業(yè)相關(guān)的有價值信息。企業(yè)應(yīng)通過實(shí)時建檔,利用最新的大數(shù)據(jù)分析方法和技術(shù),充分掌握新興技術(shù)和競爭對手態(tài)勢、市場最新動態(tài),并對一切可能的情況及時做出反應(yīng)與預(yù)警,這正是技術(shù)監(jiān)測與預(yù)警模型要解決的問題。
與目標(biāo)驅(qū)動的技術(shù)評估和預(yù)測模型不同,數(shù)據(jù)驅(qū)動技術(shù)監(jiān)測與預(yù)警模型更能體現(xiàn)出自組織動態(tài)實(shí)時監(jiān)測的特點(diǎn)。通過在線實(shí)時監(jiān)測技術(shù)與主動爬蟲技術(shù),自動獲取和收集散落在互聯(lián)網(wǎng)上有價值的社交數(shù)據(jù)、網(wǎng)絡(luò)輿情數(shù)據(jù)、政府政策、市場動態(tài)數(shù)據(jù)以及金融交易數(shù)據(jù)等,經(jīng)過機(jī)器的算法訓(xùn)練和網(wǎng)絡(luò)輿情、偏差檢測分析,能夠追蹤輿情的最新動態(tài),分析挖掘新興技術(shù)及競爭對手的最新動態(tài),做出及時有效反應(yīng),達(dá)到監(jiān)測與預(yù)警目的。以因百威啤酒而名揚(yáng)世界的安海斯——布希公司為例,該公司通過大數(shù)據(jù)分析系統(tǒng),自組織實(shí)時動態(tài)監(jiān)測與公司相關(guān)的競爭對手和分銷商數(shù)據(jù),不僅了解競爭對手產(chǎn)品的陳列、定價及貨架空間等情況,同時還從大量分銷商銷售數(shù)據(jù)中獲得本公司產(chǎn)品在零售環(huán)節(jié)的詳細(xì)情況,掌握市場最新動態(tài),從而開展效果更佳的營銷活動。
(一)基于“大檔案觀”多元化的數(shù)據(jù)來源
企業(yè)檔案呈現(xiàn)4V特征:Variety(模態(tài)繁多但不便于存儲)、Volume(體量浩大但分析周期長)、Velocity(生成快速但難以捕捉)和Value(價值巨大但密度很低,較難控制)[3]。在這種情況下如果企業(yè)檔案管理者依然把企業(yè)檔案視為傳統(tǒng)意義上的十大類企業(yè)檔案,那么企業(yè)檔案工作不僅會在社會分工中越來越邊緣化,而且不利于企業(yè)知識管理與企業(yè)檔案價值的實(shí)現(xiàn)。該模型從“大檔案觀”視角研究企業(yè)檔案信息資源,既包括傳統(tǒng)意義上十大類檔案信息資源,也包括與企業(yè)相關(guān)的網(wǎng)絡(luò)輿情數(shù)據(jù)和社交網(wǎng)絡(luò)數(shù)據(jù),后者利用網(wǎng)絡(luò)輿情進(jìn)行預(yù)警與監(jiān)測,同時把政府政策、市場動態(tài)以及金融交易等數(shù)據(jù)納入其中,提升企業(yè)情報分析的全面性。
(二)數(shù)據(jù)生命周期貫穿始終,云計算平臺為基礎(chǔ)
大數(shù)據(jù)分析方法貫穿企業(yè)檔案信息資源處理的整個生命周期,因此在構(gòu)建雙向決策模型時將“數(shù)據(jù)采集——數(shù)據(jù)預(yù)處理——數(shù)據(jù)存儲——數(shù)據(jù)分析挖掘——數(shù)據(jù)應(yīng)用”數(shù)據(jù)生命周期貫穿模型始終。此外,在大數(shù)據(jù)時代由于企業(yè)檔案信息資源呈現(xiàn)4V特征,傳統(tǒng)數(shù)據(jù)庫和處理方法已經(jīng)不再適應(yīng)大數(shù)據(jù)環(huán)境,因此該模型建立在云計算平臺基礎(chǔ)之上,通過采用目前常用的MapReduce并行處理系統(tǒng)運(yùn)行算法、基于Hadoop開源的分布式文件系統(tǒng)(HDFS)及谷歌的BigTable等非關(guān)系型數(shù)據(jù)庫,實(shí)現(xiàn)數(shù)據(jù)有效采集、預(yù)處理、存儲和質(zhì)量管理。
(三)多種大數(shù)據(jù)分析方法與技術(shù)的有效結(jié)合
分析企業(yè)檔案信息資源時,可視化分析、數(shù)據(jù)挖掘、預(yù)測分析、語義引擎、數(shù)據(jù)質(zhì)量管理等大數(shù)據(jù)分析方法不僅單獨(dú)運(yùn)用,也可相輔相成地綜合運(yùn)用,因此該模型充分吸納這幾種常見的大數(shù)據(jù)分析方法。具體來說,基于目標(biāo)驅(qū)動的傳統(tǒng)大數(shù)據(jù)分析方法有文獻(xiàn)計量法、關(guān)聯(lián)規(guī)則、聚類分析、分類回歸分析、時序分析、可視化分析、語義引擎等,運(yùn)用具體技術(shù)包括文本萃取、自然語言處理、主體詞簇等;基于數(shù)據(jù)驅(qū)動的大數(shù)據(jù)分析方法有網(wǎng)絡(luò)輿情法、偏差監(jiān)測法,常用的技術(shù)主動爬蟲、機(jī)器學(xué)習(xí)等。
(四)雙向決策模型的本質(zhì)特點(diǎn)——企業(yè)管理決策的有效工具
目前對于企業(yè)管理者而言,“企業(yè)高層越來越依靠基于數(shù)據(jù)分析的企業(yè)管理決策,而不是靠直覺的經(jīng)驗(yàn)管理決策。”[5]大數(shù)據(jù)分析方法作為定量分析方法的工具,勢必會對企業(yè)運(yùn)行管理、生產(chǎn)業(yè)務(wù)流程、管理決策產(chǎn)生影響。為促進(jìn)企業(yè)管理決策科學(xué),雙向決策模型的構(gòu)造將大數(shù)據(jù)分析方法運(yùn)用在企業(yè)檔案信息資源挖掘上。而“任何一個管理活動都會有管理工具,任何管理工具都有物質(zhì)與意識兩種不同的表現(xiàn)形式。”[6]根據(jù)管理工具的不同,檔案管理可以分為檔案物理管理和檔案邏輯管理。企業(yè)經(jīng)營者運(yùn)用大數(shù)據(jù)分析方法管理企業(yè)檔案信息資源實(shí)質(zhì)是一個邏輯管理過程。企業(yè)經(jīng)營者在決策前,首先要擁有運(yùn)用大數(shù)據(jù)分析企業(yè)檔案信息資源的思維,然后將該思維外化為規(guī)則符號構(gòu)成企業(yè)決策模型,成為企業(yè)決策的有效工具。
因此,可以說雙向決策模型由大數(shù)據(jù)分析方法外化而成,其本質(zhì)是企業(yè)管理決策的有效工具。
雙向決策模型的本質(zhì)是企業(yè)管理決策的有效工具,對模型的優(yōu)勢性分析需要結(jié)合企業(yè)管理中的具體理論與實(shí)踐。近年來出現(xiàn)企業(yè)知識管理、集成管理、風(fēng)險管理等專門研究領(lǐng)域?!肮芾砭褪侵贫Q策。”[7]企業(yè)知識管理、集成管理、風(fēng)險管理的實(shí)質(zhì)是決策過程。因此本文主要從企業(yè)知識管理、集成管理、風(fēng)險管理三個層次結(jié)合案例分析雙向決策模型,雙向決策模型優(yōu)勢分析如圖2所示。
圖2 雙向決策模型優(yōu)勢分析
(一)雙向決策模型驅(qū)動下的企業(yè)知識管理與技術(shù)創(chuàng)新
1.有利于企業(yè)隱性技術(shù)知識的可視化累積。在大數(shù)據(jù)時代,一切都可以量化,類似于企業(yè)員工的經(jīng)驗(yàn)等隱性知識可以數(shù)據(jù)化,企業(yè)隱性知識可視化展現(xiàn)已經(jīng)具備技術(shù)基礎(chǔ)。例如,對于即將退休的技術(shù)人員,通過口述訪談形式將其多年工作經(jīng)驗(yàn)標(biāo)準(zhǔn)化、規(guī)范化,形成企業(yè)的業(yè)務(wù)指南或者員工技術(shù)手冊,有助于提升企業(yè)技術(shù)創(chuàng)新水平。
2.有利于企業(yè)的知識發(fā)現(xiàn)。使用雙向決策模型,企業(yè)管理者可以迅速掌握企業(yè)內(nèi)部信息和外部競爭情報,掌握市場發(fā)展趨勢,精準(zhǔn)營銷。利用基于目標(biāo)驅(qū)動技術(shù)評估與預(yù)測模型,企業(yè)可以采取與顧客交流方式,將顧客隱性需求顯性化,
滿足顧客需求;利用基于數(shù)據(jù)驅(qū)動技術(shù)監(jiān)測與預(yù)警模型,企業(yè)可以獲取網(wǎng)絡(luò)、新聞、報紙等不同媒介上的信息,及時建檔,分析消費(fèi)者觀念變化、價值取向、市場發(fā)展趨勢等。
(二)雙向決策模型驅(qū)動下的企業(yè)集成管理與技術(shù)創(chuàng)新
1.有利于流程重造,質(zhì)量控制。以雙向決策模型為工具,能夠幫助企業(yè)重新審視自身結(jié)構(gòu),加強(qiáng)質(zhì)量控制,推動企業(yè)業(yè)務(wù)流程的優(yōu)化重造。
2.有利于企業(yè)合作模式創(chuàng)新。雙向決策模型可以使企業(yè)管理者掌握企業(yè)內(nèi)外有價值的檔案數(shù)據(jù),通過分析挖掘發(fā)現(xiàn)潛在的合作伙伴,促進(jìn)企業(yè)合作模式創(chuàng)新。
(三)雙向決策模型驅(qū)動下的企業(yè)風(fēng)險管理與技術(shù)創(chuàng)新
雙向決策模型為企業(yè)風(fēng)險管理提供工具。通過及時建檔,對企業(yè)實(shí)現(xiàn)內(nèi)外部控制,從企業(yè)檔案大數(shù)據(jù)中發(fā)現(xiàn)有價值的競爭情報,發(fā)現(xiàn)企業(yè)運(yùn)行過程中的潛在問題,把企業(yè)運(yùn)行管理過程的風(fēng)險降低到最低,并對風(fēng)險進(jìn)行預(yù)測、評估、監(jiān)控,實(shí)現(xiàn)企業(yè)對風(fēng)險的主動控制。具體來說,企業(yè)可以使用該模型中的偏差檢測技術(shù),從眾多檔案數(shù)據(jù)中發(fā)現(xiàn)異常情況,并參照給定模型預(yù)警響應(yīng),達(dá)到風(fēng)險控制目的,減少企業(yè)損失。
雙向決策模型作為科學(xué)管理決策工具,幫助企業(yè)管理者做出科學(xué)決策,推動企業(yè)技術(shù)創(chuàng)新,但該模型并不是萬能的。谷歌在2009年預(yù)測禽流感案例被視為大數(shù)據(jù)分析預(yù)測的典型成功案例,然而谷歌的禽流感預(yù)測在最近兩年顯示不準(zhǔn)確。大數(shù)據(jù)時代下企業(yè)檔案信息資源的4V特征使得很多時候收集到的檔案數(shù)據(jù)存在“變量遺漏”和“樣本偏差”,以這樣的數(shù)據(jù)為依據(jù),得到結(jié)果可能是低效甚至是錯誤的。
大數(shù)據(jù)分析方法只是一種工具,只能提供參考,并不能盲從,應(yīng)建立失效預(yù)警防御機(jī)制。同時由于企業(yè)檔案中包含大量個人隱私信息,要求企業(yè)管理者在分析挖掘這些檔案信息時應(yīng)正確處理商業(yè)利益與客戶隱私的關(guān)系,保護(hù)客戶個人隱私。此外,雙向決策模型運(yùn)用實(shí)時建檔方法,將使企業(yè)檔案大量增加,給企業(yè)檔案管理帶來較大壓力,因此應(yīng)設(shè)定數(shù)據(jù)合理存儲期限。
[1]Drucker.Post-capitalist Society[M].New York:Butterworth Heineman, 1993.
[2]朱東華.大數(shù)據(jù)環(huán)境下技術(shù)創(chuàng)新管理方法研究[J].科學(xué)學(xué)與科學(xué)技術(shù)管理,2013(4).
[3]王毅,趙淑梅.國有企業(yè)技術(shù)創(chuàng)新與檔案大數(shù)據(jù)管理安全戰(zhàn)略研究[J].檔案學(xué)通訊,2014(2).
[4]Porter A,Cunningham S.Tech Mining:Exploiting New Technologies for Competitive Advantage[M].New York:Wiley,2005.
[5]Akella,Janaki,Timo Kubach,et al.Data-driven Management: Bringing more Science into Management[R].McKinsey Technology Initiative Perspective,2008.
[6]丁海斌.論檔案的邏輯管理[J].檔案管理,2013(5).
[7]赫伯特·A·西蒙.管理決策新科學(xué)[M].李柱流,譯.北京:中國社會科學(xué)出版社,1982.
F272
A
1672-3805(2016)05-0001-05
2016-08-08
遼寧省經(jīng)濟(jì)社會發(fā)展課題“遼寧省企業(yè)技術(shù)創(chuàng)新與檔案大數(shù)據(jù)分析方法研究”(2016lslktzdian-30)
李晶偉(1991-),男,中國人民大學(xué)信息資源管理學(xué)院碩士研究生,研究方向?yàn)闄n案管理。