鄧慧君 ,宋 君 ,朱 琳
(1.寧波大學(xué) 信息科學(xué)與工程學(xué)院,浙江 寧波 315211;2.寧波大學(xué) 機械工程與力學(xué)學(xué)院,浙江 寧波 315211)
隨著數(shù)字經(jīng)濟的發(fā)展,網(wǎng)絡(luò)數(shù)據(jù)信息越來越豐富,數(shù)據(jù)驅(qū)動的業(yè)務(wù)崗位賦能的研究越來越受到產(chǎn)業(yè)和學(xué)者的重視,大數(shù)據(jù)分析的技術(shù)與方法成為科學(xué)研究與技術(shù)應(yīng)用的熱點。同時,基于互聯(lián)大數(shù)據(jù)的社會新生態(tài)系統(tǒng)也正在逐步形成。國內(nèi)外學(xué)者已經(jīng)進行了較多的研究工作。Tony H(2009)[1]博士提出人類科學(xué)研究的“第四種范式”,即“數(shù)據(jù)探索”,用以指導(dǎo)和更新科學(xué)領(lǐng)域的研究。Boying Li等(2016)[2]便運用大數(shù)據(jù)技術(shù)對Amazon 網(wǎng)站的數(shù)據(jù)進行相關(guān)性分析,建立產(chǎn)品的評論數(shù)量、增長比率和產(chǎn)品銷售量的相關(guān)關(guān)系。Gema Bello-Orgza 等(2016)[3]針對社會媒體大數(shù)據(jù)的快速增長,提出從數(shù)據(jù)融合和數(shù)據(jù)可視化兩個方面來對其進行分析。Max Nathan 等(2015)[4]通過觀測和模擬變量的組合,開發(fā)出了一種新型的文本挖掘技術(shù)。Hye-Chung Kum 等(2015)[5]引入了數(shù)據(jù)庫知識發(fā)現(xiàn)和數(shù)據(jù)挖掘過程的概念,提出新型的知識發(fā)現(xiàn)和數(shù)據(jù)挖掘體系結(jié)構(gòu)。Mohamed Abouelela 等(2015)[6]提出了迭代調(diào)度算法和K-short 路徑算法,處理在數(shù)據(jù)密集型應(yīng)用中出現(xiàn)的大型數(shù)據(jù)傳輸延遲現(xiàn)象。顧復(fù)等(2018)[7]針對產(chǎn)品生命周期評價難的問題,提出了透明公平的產(chǎn)品生命周期評價方法。張衛(wèi)等(2019)[8]對制造服務(wù)的研究分析,提出了一種智能服務(wù)的模塊化設(shè)計方法。任杉等(2018)[9]針對復(fù)雜產(chǎn)品生命周期數(shù)據(jù)呈現(xiàn)的大數(shù)據(jù)特性,提出一種生命周期大數(shù)據(jù)驅(qū)動的復(fù)雜產(chǎn)品智能制造服務(wù)新模式。李浩等(2018)[10]提出面向MC 的產(chǎn)品服務(wù)系統(tǒng)模塊化設(shè)計框架,實現(xiàn)用戶需求獲取的規(guī)模化、快捷化及低成本。陶飛和戚慶林(2018)[11]提出在新一代信息技術(shù)與制造融合的環(huán)境下,面向服務(wù)的智能制造的實施框架。陳美(2012)[12]利用大數(shù)據(jù)技術(shù)實現(xiàn)交通數(shù)據(jù)的采集和處理,構(gòu)建了城市公共交通管理體系。王雅瓊等(2015)[13]學(xué)者提出將大數(shù)據(jù)技術(shù)應(yīng)用到智慧化交通服務(wù)中,從而利用智能化交通為人們提供優(yōu)質(zhì)的出行服務(wù)。黃曉斌和鐘輝新(2013)[14]建立了由核心功能層、支撐功能層以及表現(xiàn)功能層組成的企業(yè)競爭情報系統(tǒng)模型。唐曉波等(2018)[15]提出了基于大數(shù)據(jù)智能的競爭情報系統(tǒng)模型。
從學(xué)者們的研究也可以看出,由于數(shù)據(jù)源的廣泛性及數(shù)據(jù)生產(chǎn)方式的多樣性,未來數(shù)據(jù)的規(guī)模將越來越大,而且數(shù)據(jù)結(jié)構(gòu)也越來越趨于復(fù)雜。因此,不同領(lǐng)域下大數(shù)據(jù)技術(shù)的應(yīng)用將越來越能體現(xiàn)出它的優(yōu)勢與價值。另一方面,企業(yè)轉(zhuǎn)型升級的壓力使企業(yè)家也越來越垂涎基于大數(shù)據(jù)的企業(yè)問題解決方案,迫切需要有實踐意義的大數(shù)據(jù)應(yīng)用的技術(shù)與方法。
本文提出數(shù)據(jù)驅(qū)動的產(chǎn)品綜合評價的構(gòu)思,從企業(yè)內(nèi)外環(huán)境中獲取產(chǎn)品相關(guān)的數(shù)據(jù),應(yīng)用大數(shù)據(jù)分析處理技術(shù)與方法,挖掘數(shù)據(jù)背后隱藏的信息,并融入到產(chǎn)品綜合評價過程中,建立數(shù)據(jù)驅(qū)動的產(chǎn)品綜合評價模型,對企業(yè)產(chǎn)品進行綜合性的量化評價。本文的研究,有助于發(fā)揮數(shù)據(jù)資源在企業(yè)業(yè)務(wù)執(zhí)行中的賦能作用,提高企業(yè)產(chǎn)品評價的準(zhǔn)確性與科學(xué)性,為企業(yè)轉(zhuǎn)型升級及績效提升提供參考,推動企業(yè)大數(shù)據(jù)應(yīng)用的實踐。
所謂數(shù)據(jù)驅(qū)動的產(chǎn)品綜合評價主要是指在產(chǎn)品與外界相互作用過程中產(chǎn)生一些可以表現(xiàn)產(chǎn)品與外界關(guān)聯(lián)特征的數(shù)據(jù),通過對這些數(shù)據(jù)進行挖掘,發(fā)現(xiàn)其中的事物關(guān)聯(lián)性和隱藏模式,對產(chǎn)品的市場表現(xiàn)、市場潛力等進行量化評價,用以輔助產(chǎn)品優(yōu)化與創(chuàng)新等業(yè)務(wù)活動[16-17]。
通過對收集的產(chǎn)品相關(guān)數(shù)據(jù)的分析研究,本文將產(chǎn)品綜合評價分為兩大維度:一是產(chǎn)品市場表現(xiàn)力的評價,二是產(chǎn)品技術(shù)潛力的評價,該維度是從技術(shù)角度作為前一維度的補充。綜合兩個維度的產(chǎn)品表現(xiàn),可以分析和預(yù)測產(chǎn)品在當(dāng)下及未來可能的發(fā)展走向,為企業(yè)業(yè)務(wù)決策提供參考。本文提出的數(shù)據(jù)驅(qū)動的產(chǎn)品綜合評價服務(wù)模型如圖1 所示,包括數(shù)據(jù)驅(qū)動層、數(shù)據(jù)處理與分析層、企業(yè)業(yè)務(wù)應(yīng)用層、知識服務(wù)層。
數(shù)據(jù)資源是提供產(chǎn)品綜合評價的基礎(chǔ)。不僅企業(yè)的管理信息系統(tǒng)、產(chǎn)品結(jié)構(gòu)數(shù)據(jù)平臺系統(tǒng)中包括著大量的有價值的數(shù)據(jù),大數(shù)據(jù)技術(shù)的應(yīng)用使電子商務(wù)平臺、專利期刊文獻數(shù)據(jù)、網(wǎng)絡(luò)論壇社區(qū)的短文都成為對企業(yè)業(yè)務(wù)有支撐作用的重要資源。本文通過網(wǎng)絡(luò)爬蟲等信息技術(shù),將不同來源的數(shù)據(jù)信息匯聚,成為本研究框架的數(shù)據(jù)資源池,為產(chǎn)品綜合評價提供數(shù)據(jù)基礎(chǔ)。這些數(shù)據(jù)是動態(tài)的,按照系統(tǒng)規(guī)則的定義,系統(tǒng)可自主地進行數(shù)據(jù)的積累,以便實施基于時間維度的歷史性趨勢分析等。
該層主要面向企業(yè)的業(yè)務(wù)應(yīng)用,從數(shù)據(jù)資源層提取相關(guān)數(shù)據(jù)并進行分析處理。因為底層的數(shù)據(jù)資源是多源、多樣、無序和大量的。因而需進行常規(guī)的數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)的結(jié)構(gòu)化和有序化處理,同時根據(jù)業(yè)務(wù)需要進行數(shù)據(jù)的集成及數(shù)據(jù)規(guī)則的構(gòu)建。
本文從產(chǎn)品的市場表現(xiàn)及產(chǎn)品的技術(shù)潛力兩大維度分別展開產(chǎn)品的評價。首先市場表現(xiàn)力的維度分析,需要從用戶評價的語料庫中,通過大數(shù)據(jù)解析分析、主題模型研究等方法,提煉構(gòu)成評價的特征維度,這個維度會隨著時間及群體的變化而動態(tài)波動。特征維度建立后,需要計算統(tǒng)計特征維度的評價結(jié)果,之后建立各特征維度在總體評價中的權(quán)重系數(shù),各特征維度加權(quán)求和即可獲得產(chǎn)品的綜合評價參數(shù)。研究的關(guān)鍵點在于權(quán)重系數(shù)的確定,本文通過特征維度所屬的評價語料的總體占比的方法,確定特征維度的權(quán)重,相對于人為裁定的方法會更為科學(xué)。
產(chǎn)品技術(shù)潛力的評價主要是基于產(chǎn)品相關(guān)的技術(shù)專利及科研文獻數(shù)據(jù),探討當(dāng)前已有技術(shù)的儲備水平,形成對產(chǎn)品更新與優(yōu)化的輔助決策參考。主要是通過技術(shù)熱點與空白點等專題的解析,利用技術(shù)功效矩陣方法,對產(chǎn)品相關(guān)的創(chuàng)新技術(shù)水平及產(chǎn)品發(fā)展?jié)摿M行量化度量,輔助于產(chǎn)品綜合評價。
本文提出的產(chǎn)品綜合評價服務(wù)的初衷是利用開放的數(shù)據(jù)資源及企業(yè)的產(chǎn)品數(shù)據(jù)信息,通過一套方法體系實現(xiàn)計算機系統(tǒng)的自動化處理,通過內(nèi)置服務(wù)的方法,由軟件平臺系統(tǒng)直接為產(chǎn)品設(shè)計人員等提供產(chǎn)品優(yōu)化及技術(shù)創(chuàng)新的輔助參考。因而需要將企業(yè)業(yè)務(wù)應(yīng)用層的產(chǎn)品綜合評價方法,通過聚合封裝或功能細分,轉(zhuǎn)化為平臺系統(tǒng)的功能服務(wù),包括產(chǎn)品專利保護的建議服務(wù)、產(chǎn)品優(yōu)化與技術(shù)創(chuàng)新決策服務(wù)、知識體系維護與監(jiān)控服務(wù)、知識推送與技術(shù)風(fēng)險預(yù)警服務(wù)等。
本文提出的產(chǎn)品綜合評價模型,首先是對產(chǎn)品市場表現(xiàn)力的評價。產(chǎn)品價值最終是由市場來檢驗的,因而用戶的評論數(shù)據(jù)在一定程度上反映了產(chǎn)品在市場上的生存能力。本文提出的數(shù)據(jù)驅(qū)動的產(chǎn)品市場表現(xiàn)力評價服務(wù)模型,如圖2 所示。
圖2 數(shù)據(jù)驅(qū)動的產(chǎn)品市場表現(xiàn)力的評價的服務(wù)模型
產(chǎn)品市場表現(xiàn)力評價的數(shù)據(jù)資源基礎(chǔ)主要是包含用戶評價信息的數(shù)據(jù)源,如電子商務(wù)平臺、網(wǎng)絡(luò)論壇社區(qū)系統(tǒng)等。當(dāng)研究某類產(chǎn)品在市場上的總體表現(xiàn)時,篩選的是該類別產(chǎn)品的評論數(shù)據(jù),可以通過設(shè)置篩選規(guī)則來確定,比如價格區(qū)間,或性能參數(shù)指標(biāo)等。如果研究的是某一產(chǎn)品的市場表現(xiàn)時,那只需要選擇與該產(chǎn)品相關(guān)的評論數(shù)據(jù)即可,之后的統(tǒng)計計量方法是一致的。數(shù)據(jù)資源準(zhǔn)備完成后進入數(shù)據(jù)的處理階段,包括評論數(shù)據(jù)的解詞、詞頻統(tǒng)計與特征詞的提取等。
核心之一是進行LDA 的主題分析,并通過與產(chǎn)品結(jié)構(gòu)數(shù)據(jù)等信息的結(jié)合,形成用戶評價語料與產(chǎn)品功能特征的映射關(guān)系,利用專利信息及期刊論文中包含的功能特征與描述語料的映射規(guī)則,提取建立這種映射關(guān)系,建立本研究的產(chǎn)品評價維度模型。該評價維度模型可以根據(jù)需要分解為兩個層面,一是頂層評價特征維度,通常包括產(chǎn)品外觀相關(guān)的特征維度、價格或性價比相關(guān)的特征維度等。頂層特征維度通常又從操作的角度細化為二層次評價特征維度,即評價特征要素集,通常語料信息中評價的都是二層次評價特征維度要素。
該部分研究的另一項核心工作,需要對語料的情感特性進行統(tǒng)計分析,并量化評價的結(jié)果。首先是進行評價語料的情感極性的判斷,正面評價得分為正,負面評價得分為負,中性評價得分為零。本文引入了“知網(wǎng)情感分析用詞語集”開展評價詞性的判斷。然而,具體評價的得分還與評語極性的強弱有關(guān),同時還與評價人的用詞習(xí)慣及評價人的權(quán)威性相關(guān)。這是本文的難點之一。
在現(xiàn)行的電子商務(wù)系統(tǒng)中,用戶對產(chǎn)品的評價通常采用“五分制”的方式來表達的。本文通過對特定評價人的所有的評價數(shù)據(jù)進行專項統(tǒng)計(不僅限于某類產(chǎn)品),統(tǒng)計其評價的用詞習(xí)慣、用詞與評價級別的相關(guān)性,構(gòu)建評價人私有的五分制“評語用詞賦分表”。賦分表可由計算機系統(tǒng)進行自動的跟蹤分析,進行不斷地豐富完善。在產(chǎn)品評價過程中,分析評價人的評價分值( Pi)時,首先依據(jù)該評價人的“評語用詞賦分表”確定,如果配對失敗,從其他人的“評語用詞賦分表”中進行參考,如果也沒有相對應(yīng)的詞條,那么可作為無效評價處理。
不同的評價人的意見對產(chǎn)品的市場表現(xiàn)力的展示作用是不同的,比如常客的意見可能更準(zhǔn)確。因而,本文提出對評價人的評價準(zhǔn)確性,用權(quán)威性修正系數(shù)( ai)來表征。
首先,統(tǒng)計所有評價人采購的同類產(chǎn)品的數(shù)量,并按從多到少進行排序,依排序情況,按五段制形式,依次確定修正系數(shù),即采購數(shù)量最多的前20%的人,ai=1,采購數(shù)量在前20%~40%之間的,ai=0.8,依次類推。權(quán)重系數(shù)按從大到小的次序確定。
綜上的分析,某一產(chǎn)品特征要素的得分( Skj,k為頂層特征維度序號,j 為細分特征要素集的序號)表示為公式1 所示。
式(1)中m 為評價條目的數(shù)量,akji為第i 條評論的評價人權(quán)威性修正系數(shù),Pkji為該評價的賦分。
依據(jù)以上的數(shù)據(jù)分析處理即可量化產(chǎn)品各評價維度上的評價結(jié)果。然后,如何綜合確定產(chǎn)品最終的市場表現(xiàn)能力,需要對多維度特征要素的評價結(jié)果進行綜合。常規(guī)的解決方案是各維度加權(quán)求和的方法。然而,權(quán)重系統(tǒng)的確定是科學(xué)性的關(guān)鍵,本文提出基于各維度統(tǒng)計占比的方法來解決這一問題,計算方法如公式(2)所示。
式(2)中wkj為特征要素的綜合評價權(quán)重系數(shù),vkji為特征要素的評價結(jié)果,m 為對特征要素的評價總數(shù),n 為該產(chǎn)品或該類產(chǎn)品的所有特征要素評價的總條目數(shù)。
對各特征要素維度進行加權(quán)求和,即可獲得該產(chǎn)品或該類產(chǎn)品的綜合評價量化參數(shù)p,如公式(3)所示。
式(3)中r 為一級特征維度總數(shù),t 為特征維度下的二級特征要素的總數(shù)。
通過計算不同產(chǎn)品的綜合評價參數(shù),即可了解不同產(chǎn)品的市場表現(xiàn),也可進行不同產(chǎn)品間的橫向比較,為企業(yè)決策提供參考。
從產(chǎn)品的技術(shù)創(chuàng)新角度來講,市場是推動技術(shù)進步的重要力量。同時,產(chǎn)品技術(shù)的潛力也是影響產(chǎn)品生命周期的重要因素。據(jù)學(xué)者研究,專利記載80%以上的技術(shù)知識[18]。而期刊論文的文獻資源與專利知識間形成一種互補,因而本文基于專利及期刊文獻數(shù)據(jù),將功效圖的技術(shù)方法引入到產(chǎn)品的技術(shù)潛力的評價過程,旨在用于發(fā)現(xiàn)當(dāng)前產(chǎn)品相關(guān)的技術(shù)的熱點及空白點,指導(dǎo)企業(yè)技術(shù)研發(fā),并輔助決策[19-20]。本文提出的數(shù)據(jù)驅(qū)動的產(chǎn)品技術(shù)潛力評價的業(yè)務(wù)流程如圖3 所示。
圖3 數(shù)據(jù)驅(qū)動的產(chǎn)品技術(shù)潛力評價的業(yè)務(wù)流程
驅(qū)動技術(shù)潛力評價的數(shù)據(jù)源,主要是公開的專利數(shù)據(jù)及科研文獻數(shù)據(jù),同時企業(yè)管理信息系統(tǒng)中記載的產(chǎn)品結(jié)構(gòu)、功能等數(shù)據(jù)也是進行技術(shù)潛力評價不可缺少的。另外,前面提及的用詞評價語料數(shù)據(jù)庫也是該部分研究的重要基礎(chǔ)。除企業(yè)管理信息系統(tǒng)的數(shù)據(jù)外,其他數(shù)據(jù)資源都可以通過網(wǎng)絡(luò)爬蟲等較成熟的數(shù)據(jù)獲取技術(shù)來完成。
為構(gòu)建技術(shù)功效矩陣,首先需要明確矩陣的行與列的維度。
本文以用戶評論數(shù)據(jù)的產(chǎn)品評價分析作為基礎(chǔ),將評價的特征維度,按功能、成本、質(zhì)量、價格、體驗等不同類型進行歸并、排序。也就是確定產(chǎn)品相關(guān)的功效表述有哪些。這里提及的功效表述,并不是從設(shè)計人員的角度,而是從用戶的角度來闡釋的,即從用戶角度來說,他們更關(guān)注什么樣的功效需求。這一任務(wù)采用類似前面產(chǎn)品特征要素提取的方法,將特征要素映射為產(chǎn)品的功效表達。為便于分析,功效表達按前述產(chǎn)品市場評價的結(jié)果為依據(jù),進行降序排列,作為功效矩陣的列。
因為科技文獻及專利數(shù)據(jù)等資源中,對于產(chǎn)品技術(shù)相關(guān)的表述通常體現(xiàn)為原理、技術(shù)、工藝、方法、工具、材料、結(jié)構(gòu)等,本文將技術(shù)的表述字段,按企業(yè)擅長的次序排列,作為矩陣的行,并根據(jù)文獻與專利的分析可進一步細化為二層次技術(shù)的表達。
明確了舉證的行與列,采用類似前述的數(shù)據(jù)處理方法,進行語料分析、LDA 主題模型分析、聚類分析等,確定某產(chǎn)品相關(guān)的技術(shù)主題及功效主題,并提取技術(shù)詞語料及功效詞語料信息。所謂技術(shù)詞語料信息表現(xiàn)為原理、結(jié)構(gòu)、材料、理論、方法等,功效詞語料信息是指技術(shù)實施后可能達到的效果。這在信息科研文獻及專利數(shù)據(jù)中有比較規(guī)范的表述,因而語料信息較容易提取,可基于語義規(guī)則的方法,由計算機自動完成。根據(jù)相對應(yīng)的語料坐標(biāo),可以把相關(guān)的科技文獻與專利統(tǒng)計到矩陣的相關(guān)節(jié)點,節(jié)點的數(shù)據(jù)即為累積的科技文獻及專利資源的數(shù)量。如果以各節(jié)點的累計數(shù)據(jù)的大小作半徑作圓,即可得到圖4 所示的老板說功效矩陣。
圖4 基于科技文獻與專利數(shù)據(jù)的技術(shù)功效矩陣
在這個矩陣中展示了各功效需求方面的技術(shù)儲備情況,展示當(dāng)前該類產(chǎn)品的技術(shù)領(lǐng)域的先進性與不足,也可以較容易地發(fā)現(xiàn)技術(shù)研發(fā)的熱點(半徑大的單元節(jié)點)及研究的空白點(半徑小或沒有圓點的節(jié)點)。
如前所述的分析,已經(jīng)可心獲得行業(yè)全貌的技術(shù)能力矩陣圖,利用類似的做法也可以獲得企業(yè)當(dāng)前的技術(shù)功效的分布情況,與前述基于科技文獻與專利分析的不同在于各節(jié)點的數(shù)據(jù)如果是企業(yè)當(dāng)前正采用的相關(guān)技術(shù)、原理、方法等則當(dāng)前的節(jié)點數(shù)據(jù)并保留,沒有采用的節(jié)點為空白。
通過全局技術(shù)功效矩陣與企業(yè)當(dāng)前技術(shù)功效矩陣的對比,可以幫助企業(yè)選擇創(chuàng)新的機會與方向。在理論、技術(shù)、方法、工藝等不同層面所具有的先進性可以用企業(yè)當(dāng)前技術(shù)水平的總體與行業(yè)總體情況的比值來評估(技術(shù)進行性指標(biāo)t),即:
式(4)中tij表示企業(yè)現(xiàn)行技術(shù)在技術(shù)功效矩陣第i 行第j 列的技術(shù)功效方面的先進性指標(biāo),dij為第i 行第j 列的單元值(企業(yè)當(dāng)前在使用技術(shù)的水平),m 與n 分別為矩陣的行數(shù)與列數(shù)。
如果企業(yè)在用戶關(guān)切的功能需求上,有較豐富的技術(shù)儲備,則企業(yè)對產(chǎn)品市場表現(xiàn)的預(yù)期必將得到提升,評價結(jié)果的可信度將會增強。因而,本文從技術(shù)儲備的角度,企業(yè)擁有的技術(shù)的先進性指標(biāo)(t)作為產(chǎn)品市場表現(xiàn)力評價的修正,得出產(chǎn)品的綜合評價參數(shù)(P),如公式5 所示。
本文提出了數(shù)據(jù)驅(qū)動的產(chǎn)品綜合評價的技術(shù)與方法,試圖從產(chǎn)品的市場表現(xiàn)及技術(shù)能力等多個層面進行產(chǎn)品的綜合評價,進行了量化參數(shù)的設(shè)計和原型系統(tǒng)的設(shè)計開發(fā)。本研究有益于企業(yè)對產(chǎn)品的市場表現(xiàn)、技術(shù)布局等情況進行分析和判斷,為產(chǎn)品優(yōu)化更新提供重要的參考。另外,通過量化參數(shù)的方法,支持企業(yè)的快速、科學(xué)決策。同時本研究也有助于推動大數(shù)據(jù)技術(shù)方法發(fā)揮大數(shù)據(jù)的企業(yè)賦能作用。