單曉紅,王春穩(wěn),劉曉燕,楊 娟
(北京工業(yè)大學(xué)經(jīng)濟與管理學(xué)院,北京 100124)
科技和信息化的發(fā)展使得企業(yè)邊界重塑,突破邊界的開放式創(chuàng)新模式逐步被企業(yè)認(rèn)可。開放式創(chuàng)新社區(qū)基于群體智能等信息技術(shù)發(fā)展起來,為企業(yè)開放式創(chuàng)新提供了智能服務(wù)平臺[1],主要開展基于互聯(lián)網(wǎng)的大眾協(xié)同、大規(guī)模協(xié)作的知識資源管理與開放式創(chuàng)新共享活動。企業(yè)構(gòu)建開放式創(chuàng)新社區(qū)的根本目的是鼓勵用戶參與企業(yè)產(chǎn)品創(chuàng)新與研發(fā)活動,并從中獲取創(chuàng)新資源[2]。隨著社區(qū)和用戶的增多,信息超載導(dǎo)致企業(yè)無法有效全面獲取用戶創(chuàng)新知識。由于開放式創(chuàng)新社區(qū)用戶和知識的獨特性,如何挖掘用戶生成內(nèi)容為創(chuàng)新提供幫助成為企業(yè)面臨的瓶頸問題。現(xiàn)有研究主要從用戶關(guān)注點和知識模式角度對用戶創(chuàng)新知識進行分析,大多數(shù)僅從用戶需求角度開展研究,鮮有從企業(yè)創(chuàng)新迫切需要的外部用戶、用戶需求和解決方案角度綜合地分析開放式創(chuàng)新社區(qū)知識,從而為企業(yè)創(chuàng)新提供更加全面和有效的支持。因此,本文提出基于知識網(wǎng)絡(luò)的知識發(fā)現(xiàn)方法,從創(chuàng)新需求、創(chuàng)新方案、創(chuàng)新主體角度對開放式創(chuàng)新社區(qū)知識資源進行整合,緩解企業(yè)知識發(fā)現(xiàn)的復(fù)雜性問題。
目前開放式創(chuàng)新社區(qū)知識發(fā)現(xiàn)主要從用戶需求角度進行研究,學(xué)者們提出不同知識發(fā)現(xiàn)方法分別從需求指標(biāo)[3]、知識模型[4]、需求知識網(wǎng)絡(luò)[5-6]等角度挖掘社區(qū)中核心知識和熱點知識[7-9],主要將高頻詞和熱點詞看作是創(chuàng)新知識。然而,簡單地將知識以高頻詞等形式進行表達無法真正滿足企業(yè)創(chuàng)新對大量原創(chuàng)性、專業(yè)性、多維性和復(fù)雜性知識的需要。因此如何從更加全面的角度發(fā)現(xiàn)和分析開放式創(chuàng)新社區(qū)知識成為企業(yè)迫切需要解決的問題。
知識發(fā)現(xiàn)是獲取知識的有效手段,知識網(wǎng)絡(luò)是目前開放式創(chuàng)新社區(qū)進行知識發(fā)現(xiàn)的常用方法,它是一種由知識節(jié)點及關(guān)聯(lián)關(guān)系組成的網(wǎng)狀結(jié)構(gòu)[10],通過知識網(wǎng)絡(luò)將機器難以理解的文本以知識的形式表現(xiàn)出來。知識網(wǎng)絡(luò)主要通過社會網(wǎng)絡(luò)、加權(quán)網(wǎng)絡(luò)、超網(wǎng)絡(luò)和本體4種方式進行構(gòu)建,每種方式的特點和適用性各不相同。社會網(wǎng)絡(luò)側(cè)重通過中心性、中心度指標(biāo),研究知識與社會行動者[11]之間的相互關(guān)系,分析網(wǎng)絡(luò)結(jié)構(gòu)對關(guān)系形成的影響,主要用于發(fā)現(xiàn)領(lǐng)域知識。加權(quán)知識網(wǎng)絡(luò)WKN模型[5,12]側(cè)重度量知識點的重要程度和知識間關(guān)系強度,能夠直觀地分析知識結(jié)構(gòu)和聯(lián)系特征,一般用于熱點知識和關(guān)聯(lián)模式的發(fā)現(xiàn)。超網(wǎng)絡(luò)主要從異質(zhì)性的角度將知識劃分為用戶主體、文本和知識元3種要素[4],主要特點是將知識主體引入網(wǎng)絡(luò)以發(fā)現(xiàn)專家用戶[13]。本體為知識網(wǎng)絡(luò)的可視化提供了工具[14-15],可以使用多種語言以機器可讀的方式描述知識領(lǐng)域內(nèi)概念、關(guān)系、屬性[16-17],將異質(zhì)性知識以結(jié)構(gòu)化方式進行表示,具有可操作性強的特點,本體中特有“類”的概念使得將不同類型知識結(jié)合成為可能,多應(yīng)用于產(chǎn)品設(shè)計和創(chuàng)新知識的管理。
綜上所述,目前對于開放式創(chuàng)新社區(qū)知識發(fā)現(xiàn)的研究存在以下不足:第一,知識發(fā)現(xiàn)僅片面地關(guān)注用戶需求,但是有效的創(chuàng)新不僅需要來自于用戶對產(chǎn)品偏好和期望需求的拉動,而且需要用戶靈感和創(chuàng)意的推動,以及創(chuàng)新主體的能動性和潛力,只有將三者有效整合才能實現(xiàn)對社區(qū)創(chuàng)新知識的充分利用。第二,現(xiàn)有的開放式創(chuàng)新社區(qū)知識發(fā)現(xiàn)方法,如社會網(wǎng)絡(luò)、超網(wǎng)絡(luò)、加權(quán)網(wǎng)絡(luò),其知識表達方式難以將不同維度的知識有機整合到同一框架,不利于創(chuàng)新社區(qū)中碎片化知識的集成和分析。本文從知識類型的角度出發(fā),基于開放式創(chuàng)新社區(qū)的用戶生成內(nèi)容提出利用本體構(gòu)建知識網(wǎng)絡(luò)的方法,將創(chuàng)新需求、創(chuàng)新方案和創(chuàng)新主體知識進行多維分析和整合,幫助企業(yè)發(fā)現(xiàn)用戶產(chǎn)品需求,突破解決方案瓶頸,篩選外部創(chuàng)新人才,對企業(yè)開展開放式創(chuàng)新和知識管理具有重要意義。
與一般在線虛擬社區(qū)不同,開放式創(chuàng)新社區(qū)在知識主體、知識和知識發(fā)現(xiàn)過程上具有特殊性,為其知識發(fā)現(xiàn)和應(yīng)用帶來了挑戰(zhàn)。
1)開放式創(chuàng)新社區(qū)知識主體是外部用戶:根據(jù)知識創(chuàng)造理論,在新產(chǎn)品開發(fā)過程中開放式創(chuàng)新社區(qū)內(nèi)的知識主體是企業(yè)外部用戶[11],用戶在參與開放式創(chuàng)新社區(qū)活動時所創(chuàng)造的用戶生成內(nèi)容是企業(yè)重要的資源輸入。創(chuàng)新社區(qū)中用戶行業(yè)專業(yè)背景廣泛,很多用戶是相關(guān)領(lǐng)域的專家,擁有豐富的隱性創(chuàng)新知識,能夠為不同領(lǐng)域的產(chǎn)品研發(fā)提供創(chuàng)意,具有較強的創(chuàng)新性和專業(yè)性。將用戶進行分類管理能夠最大化知識主體的集體智慧以增加企業(yè)創(chuàng)新的預(yù)期收益。
2)知識具有內(nèi)隱性、原創(chuàng)性、專業(yè)性和多維性[8-9,18-19]:(1)內(nèi)隱性,基于長期經(jīng)驗高度個人化的社區(qū)知識難以編碼、儲存和表達,造成知識發(fā)現(xiàn)困難;(2)原創(chuàng)性,用戶通過公開方式進行獨立思考后真實地發(fā)布分享創(chuàng)新觀點,因此社區(qū)知識具有較強的原創(chuàng)性;(3)專業(yè)性,用戶擁有專業(yè)知識背景,在認(rèn)知和技術(shù)層面擁有專業(yè)知識表達能力,因此社區(qū)知識具有專業(yè)性;(4)多維性,開放式創(chuàng)新社區(qū)知識具有多種類型。創(chuàng)新需求反映了用戶產(chǎn)品特征期望、產(chǎn)品偏好以及產(chǎn)品功能推薦等信息[20],用戶根據(jù)觀察、感知、使用產(chǎn)品提出的建議,是企業(yè)產(chǎn)品創(chuàng)新人員了解產(chǎn)品反饋,改善新產(chǎn)品設(shè)計和開發(fā)的主要依據(jù)[8],因此可以看作是事實知識;用戶在參與企業(yè)創(chuàng)新活動過程中,不僅表達需求,而且會提出有價值的解決方案,這些解決方案往往涉及專業(yè)技能、技巧等方法,在企業(yè)以“問題導(dǎo)向”的開放式創(chuàng)新過程中,會遇到很多問題,用戶創(chuàng)新方案可以幫助企業(yè)突破創(chuàng)新各階段技術(shù)瓶頸和障礙[21],因此,創(chuàng)新方案可以看作是技能知識;開放式創(chuàng)新社區(qū)中用戶是創(chuàng)新主體和知識的來源,創(chuàng)新主體擁有豐富的產(chǎn)品使用經(jīng)驗以及相關(guān)的專業(yè)知識,從事不同領(lǐng)域的工作,并且致力于參與到企業(yè)創(chuàng)新過程中。創(chuàng)新主體是驅(qū)動開放式創(chuàng)新社區(qū)運行的動力,是企業(yè)汲取創(chuàng)新知識的來源,因此可以看作是人際知識。
3)知識發(fā)現(xiàn)具有復(fù)雜性:社區(qū)內(nèi)用戶數(shù)量劇增,涉及領(lǐng)域復(fù)雜多樣,知識主體的知識儲備不同,創(chuàng)新能力具有較大差距,使得識別高價值有創(chuàng)新能力的用戶的過程具有復(fù)雜性。社區(qū)中用戶生成內(nèi)容具有較強的隨意性、模糊性和不確定性,從海量、碎片化、高度非結(jié)構(gòu)化的用戶生成內(nèi)容中挖掘企業(yè)創(chuàng)新需求和解決方案進一步增加了知識發(fā)現(xiàn)的難度。因此企業(yè)對創(chuàng)新主體、創(chuàng)新需求和創(chuàng)新方案的多方面的需求導(dǎo)致企業(yè)從社區(qū)中進行知識發(fā)現(xiàn)的過程具有復(fù)雜性。
開放式創(chuàng)新社區(qū)知識的特征決定了企業(yè)利用簡單的詞頻、分類、聚類等挖掘方法不能有效地為企業(yè)提供具有創(chuàng)造性的知識。企業(yè)產(chǎn)品創(chuàng)新過程實際上就是新知識創(chuàng)造過程,新知識是隱性和顯性知識交互的產(chǎn)物,同時也是各種類型知識整合的結(jié)果。根據(jù)開放式創(chuàng)新社區(qū)中用戶和知識的特征,基于本體構(gòu)建開放式創(chuàng)新社區(qū)知識網(wǎng)絡(luò),其概念圖如圖1所示。知識網(wǎng)絡(luò)由創(chuàng)新需求、創(chuàng)新方案和創(chuàng)新主體構(gòu)成。從知識的內(nèi)隱性、多維性角度來說,本體工具可以將異質(zhì)性的創(chuàng)新主體、創(chuàng)新需求和創(chuàng)新方案進行結(jié)構(gòu)化表達,使模糊知識清晰化,易于企業(yè)產(chǎn)品開發(fā)使用。
圖1 知識網(wǎng)絡(luò)概念圖Fig.1 Concept diagram of Knowledge network
用戶生成內(nèi)容(帖子)是創(chuàng)新主體、創(chuàng)新需求和創(chuàng)新方案的基礎(chǔ),帖子具有瀏覽數(shù)、回復(fù)數(shù)、貢獻值和積分等屬性,根據(jù)瀏覽數(shù)和回復(fù)數(shù)等屬性能夠?qū)崿F(xiàn)帖子知識質(zhì)量的評估。創(chuàng)新主體包括行業(yè)和用戶,注重從不同行業(yè)的角度分析創(chuàng)新主體知識。其中用戶包括積分和貢獻值等屬性,由于用戶行為數(shù)據(jù)[13]可以量化創(chuàng)新能力,因此利用積分和貢獻值等用戶屬性能夠?qū)崿F(xiàn)對創(chuàng)新主體的創(chuàng)新能力評估和用戶分類。行業(yè)從用戶生成內(nèi)容中提取,體現(xiàn)了用戶的領(lǐng)域特點和行業(yè)中的創(chuàng)新需求。創(chuàng)新需求真實地描述了目前存在的產(chǎn)品需求問題以及期待未來企業(yè)創(chuàng)新的產(chǎn)品和服務(wù)。創(chuàng)新方案由方案和場景組成,主要關(guān)注不同場景下,創(chuàng)新方案的可行性以及適用性,是企業(yè)解決瓶頸問題,探索不同創(chuàng)新手段和方法的參考依據(jù)。
從知識間關(guān)聯(lián)關(guān)系角度來看,創(chuàng)新需求來自于創(chuàng)新主體,反映了知識的需求關(guān)系;創(chuàng)新主體為企業(yè)或其他用戶提供創(chuàng)新方案,反映知識的供給關(guān)系;創(chuàng)新方案可以解決創(chuàng)新需求,反映知識的供需匹配關(guān)系。
開放式創(chuàng)新社區(qū)知識發(fā)現(xiàn)流程主要包括數(shù)據(jù)采集與預(yù)處理、創(chuàng)新需求和創(chuàng)新方案提取、帖子質(zhì)量和創(chuàng)新主體能力評價、知識網(wǎng)絡(luò)構(gòu)建4個步驟。如圖2所示,首先,用戶通過開放式創(chuàng)新平臺參與企業(yè)創(chuàng)新,產(chǎn)生的用戶生成內(nèi)容含有大量的內(nèi)隱性知識,采集社區(qū)中用戶發(fā)表的帖子,主要對帖子內(nèi)容碎片化后再整合,對用戶行為信息進行處理。其次,針對知識集合,利用本體建模方法構(gòu)建知識網(wǎng)絡(luò),實現(xiàn)創(chuàng)新知識可視化分析。最后,利用知識網(wǎng)絡(luò),從創(chuàng)新主體、創(chuàng)新需求和創(chuàng)新方案3個知識類型維度對企業(yè)知識進行發(fā)現(xiàn)整合分析,為企業(yè)在創(chuàng)新過程中建立企業(yè)產(chǎn)品方案庫、產(chǎn)品創(chuàng)新需求庫和外部創(chuàng)新人才庫完成新產(chǎn)品創(chuàng)新提供知識基礎(chǔ)。具體詳細(xì)建模步驟如下:
圖2 基于本體的開放式創(chuàng)新社區(qū)知識網(wǎng)絡(luò)構(gòu)建Fig.2 Knowledge network of open innovation community based on ontology
1.3.1 數(shù)據(jù)采集與預(yù)處理
通過Python爬蟲程序,從開放式創(chuàng)新社區(qū)中獲取文本數(shù)據(jù)和用戶數(shù)據(jù),采集的數(shù)據(jù)包括帖子內(nèi)容、帖子評論數(shù)、帖子瀏覽數(shù)、用戶貢獻值、用戶積分等。
1)對帖子篩選去重、刪除空缺值。
2)分句。很多優(yōu)秀的開放式創(chuàng)新社區(qū)對用戶發(fā)帖有一定格式要求,以華為產(chǎn)品自定義社區(qū)為例,“問鼎專家”帖子要求按照以下特征詞的格式進行編輯:<行業(yè)領(lǐng)域>、<場景描述>、<需求/困難/挑戰(zhàn)>、<解決方案>。為了獲取不同維度的知識,將用戶的每個帖子按照行業(yè)、需求、場景和方案切分成不同的句子。文本分句目前主要通過正則表達式匹配進行分割,使用的分句標(biāo)識是標(biāo)點符號。但通過標(biāo)點符號進行分句時,不能根據(jù)文本語義內(nèi)容進行分割,因此本文借助帖子的格式特征詞作為分句標(biāo)識根據(jù)內(nèi)容進行分句。
3)應(yīng)用場景屬性化處理。目前,應(yīng)用場景的定義和界定沒有統(tǒng)一的標(biāo)準(zhǔn)。在社區(qū)中包含場景的句子表達復(fù)雜多樣,利用現(xiàn)有的自然語言處理技術(shù)無法有效地提取場景知識,因此通過本體建模時將場景作為帖子的屬性處理,通過觀察該屬性可以更清晰地分析社區(qū)知識。
1.3.2 創(chuàng)新需求和創(chuàng)新方案提取
用戶對同一需求的表達各不相同,因此為了識別相同含義的需求,使企業(yè)更快速過濾模糊信息從而準(zhǔn)確地獲取創(chuàng)新需求,將包含需求/困難/挑戰(zhàn)的句子利用TF-IDF算法和TextRank算法相結(jié)合的方式分別提取Top-5需求文本關(guān)鍵詞,并采用K-means方法進行文本聚類。
通過數(shù)據(jù)分析,很多帖子題目包含建立、開發(fā)、建議等特征詞,是解決方案相關(guān)知識點的高度總結(jié)概括,因此從兩方面對創(chuàng)新方案進行提取。1)通過開發(fā)、構(gòu)建、系統(tǒng)、基于、建設(shè)、建立、研發(fā)等特征詞對帖子題目進行處理,若題目中含有以上關(guān)鍵詞則將帖子題目進行去停用詞后作為方案知識。2)若不包含上述特征詞,則對其包含解決方案的句子進行處理,與創(chuàng)新需求提取過程類似。
1.3.3 帖子質(zhì)量和創(chuàng)新主體能力評價
社區(qū)用戶發(fā)布的帖子知識含量與質(zhì)量各不相同,可以用帖子評論數(shù)和瀏覽數(shù)進行質(zhì)量評估[23],如式(1)所示。由于評論所付出的人力成本更大,所以w1 Ps=w1B+w2C (1) 其中,Ps為帖子得分;B為瀏覽數(shù);C為評論數(shù);w1,w2分別表示對應(yīng)的權(quán)重。 通過統(tǒng)計帖子得分,將排名前30%[7]的帖子確定為高質(zhì)量帖子,并確定高質(zhì)量帖子的閾值A(chǔ),企業(yè)可以通過該閾值能夠快速發(fā)現(xiàn)知識網(wǎng)絡(luò)中高質(zhì)量的帖子,方便企業(yè)對其進一步地挖掘和提取知識。 為了準(zhǔn)確地評價用戶創(chuàng)新能力,根據(jù)用戶行為信息,選擇貢獻值和積分作為用戶評估指標(biāo)[13],利用k-means算法對用戶聚類分析,將創(chuàng)新主體分為4類[1]:核心創(chuàng)新用戶、核心活躍用戶、普通創(chuàng)新用戶、普通活躍用戶。使企業(yè)能夠有針對性地挖掘社區(qū)創(chuàng)新知識,更好地對企業(yè)外部用戶進行管理。 1.3.4 知識網(wǎng)絡(luò)構(gòu)建 知識網(wǎng)絡(luò)構(gòu)建是實現(xiàn)開放式創(chuàng)新社區(qū)知識發(fā)現(xiàn)和多維分析的基礎(chǔ),基于本體的知識網(wǎng)絡(luò)構(gòu)建包括4種概念的定義,部分如表1所示,根據(jù)數(shù)據(jù)信息和研究目的定義5種基本類和對象屬性,為進一步體現(xiàn)知識的專業(yè)性定義數(shù)據(jù)屬性和知識間約束條件。 表1 本體知識概念定義 基于構(gòu)建的知識網(wǎng)絡(luò)能夠?qū)崿F(xiàn)概括性和全局性的知識發(fā)現(xiàn),較好地呈現(xiàn)創(chuàng)新社區(qū)的創(chuàng)新主體、創(chuàng)新需求、創(chuàng)新方案,以及創(chuàng)新知識的供給、需求和匹配關(guān)系,是企業(yè)全面準(zhǔn)確把握社區(qū)知識特征,挖掘創(chuàng)新知識的基礎(chǔ),實現(xiàn)了全面地刻畫知識的原創(chuàng)性、專業(yè)性和多維性,幫助企業(yè)挖掘創(chuàng)新需求、提供產(chǎn)品研發(fā)方案和尋找領(lǐng)域?qū)<业哪康摹?/p> 隨著電商互聯(lián)網(wǎng)的發(fā)展,用戶的需求呈現(xiàn)快速多變的特點[8],新產(chǎn)品創(chuàng)新的基本前提是在產(chǎn)品開發(fā)之前需要充分了解用戶需求,根據(jù)用戶需求才能夠開發(fā)用戶滿意、具有市場潛力、符合市場趨勢的產(chǎn)品。 用戶通過開放式創(chuàng)新社區(qū)參與企業(yè)創(chuàng)新活動,根據(jù)產(chǎn)品使用體驗提出針對性改進意見,為了滿足自身更高的產(chǎn)品使用體驗提出新產(chǎn)品的創(chuàng)新需求,因此企業(yè)能夠通過知識發(fā)現(xiàn)挖掘用戶生成內(nèi)容,發(fā)現(xiàn)用戶創(chuàng)新需求。行業(yè)領(lǐng)域中需求數(shù)量越多,表明目前用戶越關(guān)注該行業(yè),該行業(yè)中亟待解決的問題越多,用戶更有興趣參與到該領(lǐng)域的知識創(chuàng)造過程中。同類需求提出的用戶越多,表明該需求越迫切,該類需求則為企業(yè)產(chǎn)品研發(fā)指明了方向。因此企業(yè)應(yīng)該注重從產(chǎn)品行業(yè)領(lǐng)域的角度增加更多創(chuàng)新活動,從而獲取更多體現(xiàn)未來市場發(fā)展趨勢的創(chuàng)新需求。 創(chuàng)新方案幫助企業(yè)解決迫切需要突破的瓶頸問題,可以為企業(yè)創(chuàng)新提供方向和思路?;诒倔w的知識網(wǎng)絡(luò)建模方法可以將創(chuàng)新方案和創(chuàng)新需求聯(lián)系起來,實現(xiàn)知識的供需匹配。 首先,通過搜索創(chuàng)新需求關(guān)鍵詞,可以發(fā)現(xiàn)與特定創(chuàng)新需求有關(guān)的創(chuàng)新方案,一般一個創(chuàng)新需求會對應(yīng)多個創(chuàng)新方案,問題的解決往往是多種創(chuàng)新方案知識間相互融合的結(jié)果。其次,創(chuàng)新方案知識可以為企業(yè)快速提供創(chuàng)新思路,減少了企業(yè)制定后備方案的時間成本,這是企業(yè)整合外部資源最直接的價值體現(xiàn)。最后,企業(yè)創(chuàng)新是一種持續(xù)性活動,因此對外部用戶提出的創(chuàng)新方案知識加以總結(jié)歸納,形成企業(yè)創(chuàng)新方案知識庫,縮短企業(yè)內(nèi)部員工方案搜索的時間,是一種減少知識浪費的有效方法。 用戶作為開放式創(chuàng)新社區(qū)的創(chuàng)新主體,是企業(yè)外部重要的創(chuàng)意來源。用戶作為社區(qū)內(nèi)的知識主體,識別擁有豐富知識的創(chuàng)新主體有助于企業(yè)選擇創(chuàng)新伙伴,儲備創(chuàng)新人才。核心創(chuàng)新用戶和核心活躍用戶是兩類高價值創(chuàng)新主體,核心創(chuàng)新用戶是企業(yè)獲取創(chuàng)新知識的關(guān)鍵用戶,企業(yè)應(yīng)該高度重視對他們創(chuàng)新知識的挖掘與管理。核心活躍用戶具有較強的創(chuàng)新積極性,在社區(qū)中屬于比較活躍的用戶,企業(yè)可以將管理員或者版主的職務(wù)分派給核心活躍用戶,讓他們帶領(lǐng)其他非活躍用戶積極參與到企業(yè)創(chuàng)新過程中。通過知識網(wǎng)絡(luò)可以獲取相關(guān)行業(yè)領(lǐng)域的創(chuàng)新主體,并進一步分析不同創(chuàng)新主體的數(shù)量,以及該領(lǐng)域的創(chuàng)新主體特征。行業(yè)領(lǐng)域中的核心創(chuàng)新用戶,是該領(lǐng)域的專家用戶,企業(yè)應(yīng)該注重與核心創(chuàng)新用戶的互動,實現(xiàn)產(chǎn)品創(chuàng)新的高效研發(fā)。 本文選取華為產(chǎn)品定義社區(qū)作為數(shù)據(jù)來源,采集社區(qū)中交通行業(yè)圈2017年3月-2018年12月所有問鼎專家帖子作為本文的實證數(shù)據(jù)。通過數(shù)據(jù)采集及清洗、知識提取和本體建模3個步驟構(gòu)建知識網(wǎng)絡(luò)。 將評論數(shù)的權(quán)重設(shè)置為0.67,將瀏覽數(shù)的權(quán)重設(shè)置為0.33[7]計算帖子質(zhì)量,通過分析高質(zhì)量帖的閾值設(shè)置為6.95。選取貢獻值和積分這兩個指標(biāo)對創(chuàng)新主體進行分類,貢獻值側(cè)重于創(chuàng)新主體的創(chuàng)新能力,而積分更側(cè)重于創(chuàng)新主體的創(chuàng)新參與積極性。利用自然語言處理技術(shù)對帖子依次經(jīng)過分句、分詞、去停用詞提取關(guān)鍵詞/句,挖掘需求、方案、場景、行業(yè)、用戶多維知識,形成創(chuàng)新需求、方案和主體知識集合。利用本體工具Protégé定義知識類、知識對象屬性和知識數(shù)據(jù)屬性完成整個知識網(wǎng)絡(luò)框架的搭建。分別設(shè)置類、對象屬性和數(shù)據(jù)屬性的約束條件細(xì)化知識網(wǎng)絡(luò)中各知識點之間的關(guān)聯(lián)關(guān)系。如圖3所示,利用OWL語言和Eclipse平臺導(dǎo)入知識實例,最終整個華為產(chǎn)品定義社區(qū)交通圈知識網(wǎng)絡(luò)中共包含2 794個創(chuàng)新方案,112個創(chuàng)新主體,59種創(chuàng)新需求。 圖3 華為社區(qū)交通圈知識網(wǎng)絡(luò)Fig.3 Huawei community traffic knowledge network 通過知識網(wǎng)絡(luò)呈現(xiàn)的方式挖掘用戶意見和創(chuàng)新需求,將華為社區(qū)中用戶生成內(nèi)容從知識的角度剖析出來,共發(fā)現(xiàn)交通圈59種創(chuàng)新需求,如圖4所示。分析可知,社區(qū)創(chuàng)新需求基本涵蓋了日常生活中交通領(lǐng)域的所有產(chǎn)品需求,可以歸納為交通工具、支付方式、智能設(shè)備、交通安全4大類。華為社區(qū)交通領(lǐng)域中需求數(shù)量較多,表明目前用戶在出行過程中遇到很多問題,存在較多的迫切需求。比如,刷卡支付仍然是目前主流的交通支付方式,然而手機支付漸漸取而代之。社區(qū)不少用戶提出能否利用人臉識別技術(shù)實現(xiàn)交通支付,顯然這是一個創(chuàng)新需求。從應(yīng)用價值上來看,刷臉支付可以有效解決上下車擁堵問題,尤其可以大大減少乘坐地鐵進出站時間,具有較高的應(yīng)用價值。從技術(shù)層面上來看,人臉識別技術(shù)已經(jīng)在很多領(lǐng)域?qū)崿F(xiàn)應(yīng)用,諸如高校圖書館,說明已經(jīng)擁有核心研發(fā)技術(shù)基礎(chǔ)。因此,華為可以抓住此類創(chuàng)新需求研發(fā)適用于交通行業(yè)的人臉識別系統(tǒng),在創(chuàng)新過程中,由于創(chuàng)新主體對于此類產(chǎn)品的需求比較迫切,用戶更有興趣參與到該領(lǐng)域的創(chuàng)新活動中,企業(yè)應(yīng)該注重從產(chǎn)品行業(yè)領(lǐng)域的角度發(fā)現(xiàn)創(chuàng)新需求,從而獲取更多有價值的知識。 選取提出創(chuàng)新方案較多的“闖紅燈”問題,如圖5所示,有較多用戶提出如何解決闖紅燈問題的創(chuàng)新需求,說明闖紅燈問題已經(jīng)在交通圈引起了廣泛的關(guān)注,并且涉及多個行業(yè)領(lǐng)域,是華為亟待解決的問題。華為會針對此問題給出解決方案,此時最快捷的方式就是通過知識網(wǎng)絡(luò)獲取解決思路和方向。分析可知,用戶給出了多種創(chuàng)新方案來解決闖紅燈問題,如建立智能信號燈、設(shè)計智能斑馬線、開發(fā)交通燈定時器融合系統(tǒng)、安裝人行橫道語音提示裝置等,企業(yè)將這些創(chuàng)新方案知識進行歸納整理,制定企業(yè)創(chuàng)新方案,形成企業(yè)創(chuàng)新方案知識庫,這些創(chuàng)新方案知識將是企業(yè)研發(fā)產(chǎn)品解決問題的理論基礎(chǔ),是突破創(chuàng)新瓶頸的有力保障。為了解決“中國式過馬路”問題目前上海已經(jīng)在主要路口安裝了類似語音提示的裝置,行人過馬路的時候通過語音提醒行人要遵守交通規(guī)則,這說明用戶的創(chuàng)新方案有較高的參考價值,華為可以從中獲取具有創(chuàng)新性的啟發(fā)。同樣地,同一個創(chuàng)新方案也可以解決其他相似的需求。隨著技術(shù)的發(fā)展和知識的積累,華為可以通過不斷創(chuàng)新實現(xiàn)創(chuàng)新主體所提出的創(chuàng)新方案。 圖4 交通圈創(chuàng)新需求Fig.4 Traffic circle innovation demand 圖5 闖紅燈創(chuàng)新方案(部分)Fig.5 Innovative solutions for running red lights(partial) 高價值的創(chuàng)新主體可以從知識質(zhì)量和用戶行為兩個角度分析,如圖6所示,圓圈的大小表示帖子得分的高低,圓圈內(nèi)數(shù)字表示帖子分?jǐn)?shù)。首先,分析可知核心創(chuàng)新主體知識質(zhì)量呈現(xiàn)兩極化分布,這是由于創(chuàng)新主體參與華為產(chǎn)品創(chuàng)新時側(cè)重點不同,知識含量豐富的創(chuàng)新主體主要從知識輸出的角度參與創(chuàng)新,而其他用戶通過提高參與次數(shù)積累活躍度,因此忽略了創(chuàng)新知識的表達。其次,如圖7所示,通過分析用戶行為數(shù)據(jù)發(fā)現(xiàn)華為社區(qū)兩類高價值創(chuàng)新主體:核心創(chuàng)新用戶和核心活躍用戶。核心創(chuàng)新用戶主要從事人臉識別、手機NFC、物聯(lián)網(wǎng)等領(lǐng)域的創(chuàng)新活動,這些行業(yè)都需要較多的專業(yè)性知識,因此華為在有關(guān)產(chǎn)品開發(fā)時,可以增加與核心創(chuàng)新用戶的互動次數(shù),提高創(chuàng)新效率的同時降低了專家獲取成本。核心活躍用戶則主要從事交通等這些貼近生活的行業(yè),他們的知識原創(chuàng)性和專業(yè)性不足,但從行為數(shù)據(jù)可知他們在參與企業(yè)活動過程中相當(dāng)活躍。華為在建立圈子、總結(jié)歸納圈子信息、發(fā)布創(chuàng)新公告時,可以招募核心活躍用戶作為管理員,輔助華為激發(fā)高價值用戶的活力。 圖6 帖子質(zhì)量Fig.6 Post quality 其他類型知識分析過程類似,篇幅原因,不再進行一一贅述。通過創(chuàng)新需求、創(chuàng)新方案、創(chuàng)新主體以及它們之間的關(guān)聯(lián)關(guān)系對華為社區(qū)中的用戶生成內(nèi)容構(gòu)建創(chuàng)新知識網(wǎng)絡(luò),從而將社區(qū)中碎片化的知識進行了整合,為華為提供了全面和直觀的用戶知識分析,為華為有效利用開放式創(chuàng)新資源提供了可靠的研究思路。 圖7 核心創(chuàng)新主體(部分)Fig.7 Core innovation subject(partial) 本文提出一種基于知識網(wǎng)絡(luò)的開放式創(chuàng)新社區(qū)知識發(fā)現(xiàn)方法,可以有效挖掘和整合開放式創(chuàng)新社區(qū)不同類型知識,為企業(yè)產(chǎn)品創(chuàng)新提供知識供給,得出如下研究結(jié)論: 1)企業(yè)在進行開放式創(chuàng)新時,應(yīng)結(jié)合產(chǎn)品創(chuàng)新的不同階段,明確創(chuàng)新需求、創(chuàng)新方案、創(chuàng)新主體,整合不同類型知識,細(xì)化知識的提取,實現(xiàn)對用戶及其創(chuàng)新知識的深入分析,增加知識發(fā)現(xiàn)在產(chǎn)品創(chuàng)新過程中為企業(yè)帶來的預(yù)期收益。 2)知識網(wǎng)絡(luò)能夠有效地將創(chuàng)新需求、創(chuàng)新方案和創(chuàng)新主體三者結(jié)合起來,發(fā)揮用戶知識的內(nèi)在價值,體現(xiàn)知識的專業(yè)性和多維性。首先,企業(yè)從中可以發(fā)現(xiàn)用戶產(chǎn)品需求,把握市場趨勢,將產(chǎn)品供需相結(jié)合,為用戶提供更具創(chuàng)新性的產(chǎn)品和服務(wù)。其次,企業(yè)在創(chuàng)新過程遇到問題時,可以在社區(qū)發(fā)布需求公告,尋求用戶創(chuàng)新方案,激發(fā)企業(yè)創(chuàng)新靈感,幫助企業(yè)突破瓶頸。最后,企業(yè)應(yīng)該注重穩(wěn)固核心創(chuàng)新主體,通過增加創(chuàng)新活動和參與機會,引導(dǎo)和促進用戶共享知識行為,在此基礎(chǔ)上,企業(yè)構(gòu)建外部用戶人才庫,維護長期創(chuàng)新伙伴關(guān)系,持續(xù)為企業(yè)新產(chǎn)品開發(fā)創(chuàng)造新的知識。 3)通過華為的實證研究不僅驗證了構(gòu)建知識網(wǎng)絡(luò)進行知識發(fā)現(xiàn)的有效性,還可以發(fā)現(xiàn)華為交通領(lǐng)域的創(chuàng)新需求:主要是研發(fā)相關(guān)智能設(shè)備,如人臉識別支付系統(tǒng)、交通APP開發(fā),在滿足用戶個性化需求的同時提升用戶出行體驗;創(chuàng)新方案:信號燈控制,斑馬線設(shè)計以及車載系統(tǒng)可以為企業(yè)解決闖紅燈問題提供參考,結(jié)合現(xiàn)有方法和工具制定企業(yè)解決方案;創(chuàng)新主體:“風(fēng)之力”、“雪兔”等是企業(yè)核心創(chuàng)新主體,在導(dǎo)航、APP等領(lǐng)域具有較多的知識儲備,華為可以組織這些用戶參與到相關(guān)領(lǐng)域產(chǎn)品研發(fā)過程中,幫助企業(yè)克服產(chǎn)品創(chuàng)新問題。 本文局限在于僅采用了華為交通圈數(shù)據(jù),未來通過整合華為產(chǎn)品定義社區(qū)的知識建立完整的知識網(wǎng)絡(luò),為華為產(chǎn)品創(chuàng)新提供更有效的指導(dǎo)。研究不同企業(yè)開放式創(chuàng)新社區(qū),根據(jù)社區(qū)知識特征,整合不同類型知識,使研究結(jié)論更具普適性和說服力。2 創(chuàng)新社區(qū)知識發(fā)現(xiàn)
2.1 創(chuàng)新需求發(fā)現(xiàn)
2.2 創(chuàng)新方案發(fā)現(xiàn)
2.3 創(chuàng)新主體發(fā)現(xiàn)
3 實證研究:華為產(chǎn)品定義社區(qū)知識發(fā)現(xiàn)
3.1 交通行業(yè)圈知識網(wǎng)絡(luò)構(gòu)建
3.2 華為社區(qū)創(chuàng)新需求知識發(fā)現(xiàn)分析
3.3 華為社區(qū)創(chuàng)新方案知識發(fā)現(xiàn)分析
3.4 華為社區(qū)創(chuàng)新主體知識發(fā)現(xiàn)分析
4 結(jié)論