戚桂杰 李娜 王凱平 徐琳越
收稿日期:2020-04-13
基金項目:國家自然科學(xué)基金項目“企業(yè)開放式創(chuàng)新平臺模式與組織特質(zhì)動態(tài)匹配研究”(項目編號:71572097)。
作者簡介:戚桂杰(1963-),男,教授,博士生導(dǎo)師,研究方向:企業(yè)信息化、開放式創(chuàng)新平臺。李娜(1995-),女,碩士研究生,研究方向:開放式創(chuàng)新平臺、大數(shù)據(jù)分析。王凱平(1972-),男,副教授,博士,研究方向:信息系統(tǒng)與電子商務(wù)、大數(shù)據(jù)分析、商務(wù)智能。徐琳越(1996-),女,碩士研究生,研究方向:數(shù)據(jù)挖掘。
摘? 要:[目的/意義]對于一個創(chuàng)新平臺的繁榮與發(fā)展來說,用戶間進行社交互動并為平臺做出貢獻是至關(guān)重要的。因此,本文研究用戶交互中的內(nèi)容特征(信息冗余)對用戶知識貢獻的影響。[方法/過程]爬取典型開放式創(chuàng)新平臺(LEGO IDEAS)的數(shù)據(jù),使用Python NLTK包挖掘創(chuàng)意文本內(nèi)容,并結(jié)合信息論中的冗余度計算方法和零膨脹負二項回歸模型進行實證分析。[結(jié)果/結(jié)論]結(jié)果表明,用戶交互過程中獲取的信息量正向影響用戶知識貢獻,促進用戶發(fā)布更多創(chuàng)意,但當(dāng)獲取的創(chuàng)意之間存在冗余信息時,信息冗余會調(diào)節(jié)獲取信息量對用戶知識貢獻的影響。
關(guān)鍵詞:開放式創(chuàng)新平臺;用戶交互;信息冗余;用戶知識貢獻
DOI:10.3969/j.issn.1008-0821.2020.12.005
〔中圖分類號〕G203? 〔文獻標(biāo)識碼〕A? 〔文章編號〕1008-0821(2020)12-0045-10
Research on User Interaction,Information Redundancy and
Knowledge Contribution of Open Innovation Platform
Qi Guijie? Li Na? Wang Kaiping? Xu Linyue
(School of Management,Shandong University,Jinan 250100,China)
Abstract:[Purpose/Significance]For the prosperity and development of an innovative platform,it is very important for users to have social interaction and contribute to the platform.In OIP environment,information interaction between users is frequent and the amount of information is increasing day by day.A large number of repeated and similar information makes information redundancy a problem that cannot be ignored gradually.Therefore,this paper studies the influence of content characteristics(information redundancy)in user interaction on user knowledge contribution.[Method/Process]The paper crawled the data of typical open innovation platform(LEGO IDEAS),used Python NLTK package to mine creative text content,and combined redundancy calculation method in information theory and zero inflated negative binomial regression model to make empirical analysis.[Result/Conclusion]The results showed that the amount of information acquired during user interaction positively affected the users knowledge contribution and promoted users to publish more ideas.However,when there was redundant information between the acquired ideas,information redundancy would adjust the influence of the acquired amount of information on the users knowledge contribution.In the process of user innovation,the content characteristics of user interaction are more important than quantity.Enterprises that build open innovation platforms should encourage users to actively participate in the interaction,and at the same time guide users to participate in the exchange and learning of low redundant ideas.
Key words:open innovation platform;user interaction;information redundancy;user knowledge contribution
開放式創(chuàng)新平臺(Open Innovation Platform,以下簡稱OIP)是允許個人共享用戶生成內(nèi)容的交互式在線平臺,它使擁有不同知識、專長、技能和資源的企業(yè)外用戶和合作伙伴等自愿聚集在這個虛擬環(huán)境中,打破企業(yè)界線,推動企業(yè)從封閉式創(chuàng)新走向開放[1],為企業(yè)改進或開發(fā)新的產(chǎn)品和服務(wù)提供更多的參與意見和新的創(chuàng)意[2]。目前,很多企業(yè)自建的OIP已經(jīng)成為創(chuàng)新產(chǎn)品開發(fā)的重要知識來源[3]。例如,Dell、Lego、Salesforce、Treadless以及海爾和美的等企業(yè)已經(jīng)搭建OIP,Dell的IdeaStorm.com獲得將近600個新產(chǎn)品修改意見;到2019年底,Lego的LEGO IDEAS擁有將近110萬用戶和3萬多項創(chuàng)意作品。越來越多的企業(yè)搭建OIP,希望從中獲得更多新產(chǎn)品開發(fā)的創(chuàng)意,并進一步結(jié)合企業(yè)內(nèi)部實際情況考慮產(chǎn)品或者服務(wù)的創(chuàng)新實施過程,推進創(chuàng)新項目的開發(fā),提高企業(yè)在產(chǎn)品或者服務(wù)市場中的后續(xù)開發(fā)效率。
在OIP中,用戶交互是用戶獲取信息的主要途徑,通過公司內(nèi)外部用戶之間的互動交流可以創(chuàng)造和共享知識,維持用戶的活躍度,激勵用戶持續(xù)貢獻。用戶與用戶之間的交互不斷增加[4],用戶可以從更多的創(chuàng)意中學(xué)習(xí),獲取更多的知識,促進用戶產(chǎn)生更多的新創(chuàng)意,為平臺做出更多的貢獻。但同一個社會網(wǎng)絡(luò)群體中每個鄰居通過連接進行通信時提供的信息都是帶有冗余的。在OIP環(huán)境中,用戶之間信息交互頻繁,信息量日益增多,大量重復(fù)信息和相似信息使得信息冗余逐漸成為一個不可忽視的問題。信息冗余指在交互環(huán)境中收到相似或重復(fù)的信息[5]。在OIP中用戶通過與他人的互動交流受到其他創(chuàng)意的“啟發(fā)”,激發(fā)用戶思考,從而創(chuàng)造出新的創(chuàng)意。但如果用戶選擇發(fā)布相似主題的來源,將會導(dǎo)致個人行為中的信息冗余[6]。當(dāng)靈感來源高度互聯(lián)或聚集時,靈感更有可能是相似或多余的[7]。這種冗余降低了信息的新穎性(信息冗余的對立面),并進一步影響信息擴散[5]。低冗余的內(nèi)容更容易傳遞有價值的信息,影響用戶之間的信息溝通。而目前關(guān)于用戶知識貢獻的相關(guān)研究主要集中于開放式創(chuàng)新的用戶、社區(qū)環(huán)境等,關(guān)于創(chuàng)意內(nèi)容特征的影響研究尚缺乏。
因此,在OIP中,信息冗余將產(chǎn)生什么作用,它是否會影響用戶創(chuàng)造和貢獻知識的效果,是值得探討的問題。本文從信息冗余角度,探究OIP用戶交互中創(chuàng)意內(nèi)容特征如何影響他們的知識貢獻行為。選取樂高開放式創(chuàng)新平臺作為研究對象,通過Python爬取平臺數(shù)據(jù),利用文本挖掘方法對創(chuàng)意文本內(nèi)容提取唯一性關(guān)鍵詞,計算詞頻,并結(jié)合信息論中的信息冗余度計算方法,實證檢驗OIP中交互對用戶知識貢獻的影響,對信息冗余度的調(diào)節(jié)作用進行深入探討。
1? 文獻綜述
1.1? 用戶交互與知識貢獻研究
在線用戶貢獻行為在知識交流、知識創(chuàng)造和創(chuàng)意生成等過程中起著重要的作用。國內(nèi)相關(guān)研究從用戶、用戶間和社區(qū)環(huán)境3個方面探究在線用戶貢獻創(chuàng)意行為的影響因素,認為治理機制、社區(qū)影響、社會認同、社會學(xué)習(xí)、自我展示意愿以及用戶交互反饋的數(shù)量和質(zhì)量等因素對用戶貢獻行為產(chǎn)生顯著影響[8-9]。其中用戶通過平臺直接或間接地參與平臺互動,能夠最大限度地激發(fā)用戶的創(chuàng)新能動性[10],促進用戶積極貢獻創(chuàng)意或想法。用戶交互是OIP中重要的參與方式,是創(chuàng)新成功的重要因素[11]。在OIP中用戶通過發(fā)布創(chuàng)意、評論創(chuàng)意等交互行為激發(fā)其他用戶的興趣,或者引起討論時,用戶的活動就會受到鼓勵[12],從而做出更多知識貢獻。
先前有研究分析了用戶交互對用戶貢獻的影響,其中郭偉等認為,用戶交互的數(shù)量和質(zhì)量(內(nèi)容長度)顯著影響個體創(chuàng)新貢獻度;Hwang E H等發(fā)現(xiàn),用戶在支持眾包社區(qū)中通過交互積累的信息會影響他們在創(chuàng)新眾包社區(qū)中產(chǎn)生新穎、流行和可行的創(chuàng)意[13]。此外,很多研究更傾向于從社會網(wǎng)絡(luò)角度分析交互對用戶創(chuàng)意行為的影響。Chan K W等區(qū)分了用戶交互的方向,認為用戶外向交互(評論他人)的頻率和規(guī)模(數(shù)量)與用戶后續(xù)創(chuàng)意產(chǎn)生正相關(guān),并受到用戶過去創(chuàng)意參與的負向調(diào)節(jié)作用,而內(nèi)向交互(收到他人評論)的頻率和規(guī)模與用戶后續(xù)創(chuàng)意產(chǎn)生的影響不顯著[14]。這說明不同的交互方向會有不同的影響。Chen L等通過對Dell IdeaStorm的研究發(fā)現(xiàn),在交互過程中,用戶與用戶的反饋積極地影響用戶參與創(chuàng)意的貢獻,而公司的反饋對用戶參與創(chuàng)意貢獻的影響不顯著。用戶交互在創(chuàng)新過程中扮演重要角色[15]。因此,本文主要考察OIP中用戶交互對創(chuàng)意貢獻行為的影響。
目前,對于用戶交互的研究主要從交互的頻率、規(guī)模、方向、形式等多個角度分析了用戶交互的影響,而忽略了交互中信息自身的特征。在野中郁次郎的組織知識創(chuàng)造理論中強調(diào)了信息內(nèi)容與創(chuàng)新過程相關(guān),認為就創(chuàng)新而言,知識的內(nèi)容比知識體現(xiàn)的形式更相關(guān)[16]。知識創(chuàng)造理論強調(diào),在個人創(chuàng)新過程中互動的內(nèi)容起著相對關(guān)鍵的作用,而不是互動的形式(如投票和評論)[3]。并且有研究還發(fā)現(xiàn)交互并不總是有利的,當(dāng)人們互動時,他們會更加相似[17],是冗余的。因而,交互的內(nèi)容特征可能會對用戶創(chuàng)新過程中的知識貢獻產(chǎn)生影響。但目前對于用戶交互中內(nèi)容特征(冗余信息和新穎信息)的研究多在于利用創(chuàng)意標(biāo)簽分析內(nèi)容的類別多樣性[3],而缺少對文本內(nèi)容的深入分析。因此,我們對創(chuàng)意文本內(nèi)容進行文本挖掘,重點分析用戶交互中的內(nèi)容特征對于用戶知識貢獻的影響。
1.2? 信息冗余的影響研究
信息論認為,“如果信息系統(tǒng)中的一個信號所載有的信息可以從該系統(tǒng)其他信號中再次獲得,那么這個信號所載的信息即為冗余信息”[18]?!叭哂唷北举|(zhì)就是重復(fù),“信息冗余”指信息源傳遞的信息存在重復(fù)。當(dāng)用戶關(guān)注許多內(nèi)容相似的信息,或者收到許多重復(fù)的信息時,會產(chǎn)生信息冗余[19]。在同一個社會網(wǎng)絡(luò)群體中鄰居的意見通常是相似的、冗余的,每個鄰居通過連接進行通信時提供的信息都是帶有冗余[20]。在網(wǎng)絡(luò)通信環(huán)境中,基于信息相似性選擇信息源會導(dǎo)致個人行為中的信息冗余。如果用戶一致地選擇發(fā)布相似主題的來源(使用相似的標(biāo)簽),他們將會收到大量的冗余信息[6]。同樣,我們推測在OIP中創(chuàng)意內(nèi)容大量的重復(fù),會使用戶在交互過程中接收到冗余信息。
對信息自身而言,信息冗余過于嚴(yán)重會導(dǎo)致信息傳播效率低,使信息喪失原有價值[21]。劉魯川等通過用戶心理實驗,證明在社交媒體使用過程中,用戶感知到信息冗余與虛假信息時用戶的焦慮水平顯著提高[22]。Rishika R等對在線貢獻內(nèi)容的研究中發(fā)現(xiàn),當(dāng)互惠關(guān)系和關(guān)注關(guān)系為焦點用戶提供新穎信息(低冗余)時,對用戶貢獻的影響更大[23]。Muller E等從社會網(wǎng)絡(luò)結(jié)構(gòu)角度指出,如果網(wǎng)絡(luò)的重復(fù)程度低,每個連接傳遞的信息都是有價值的[24]。
信息冗余影響用戶獲取信息的效率和體驗,并且與社交網(wǎng)絡(luò)平臺的活躍度及未來發(fā)展趨勢息息相關(guān)[21]。OIP是獲取創(chuàng)意的重要渠道,更是一種信息傳播方式。OIP是企業(yè)收集廣泛范圍內(nèi)創(chuàng)意的一種方式,平臺中聚集了大量用戶和創(chuàng)意,信息冗余是在當(dāng)前信息積聚的交互式平臺中不可避免的問題。因此,有必要從信息冗余角度,研究用戶交互中內(nèi)容特征對用戶知識貢獻行為的影響。
2? 研究假設(shè)
2.1? 用戶交互與信息獲取
用戶通過發(fā)布、評論創(chuàng)意等交互活動可以進行社會學(xué)習(xí)[12],用戶之間可以交流知識與信息,并能夠從他人的創(chuàng)意中獲取有價值信息,促進用戶進行知識創(chuàng)造與貢獻。但有的研究還指出,個人很難獲取相關(guān)知識,在進行創(chuàng)造性工作時,首先會搜索自己的現(xiàn)有知識,通過與他人知識的碰撞,激活已存知識[25]。新的創(chuàng)意通常建立在現(xiàn)有知識的基礎(chǔ)上[26],根據(jù)當(dāng)前的問題,通過類比推理等新方式調(diào)整、重組已存知識,以創(chuàng)造新的創(chuàng)意[27]。類比推理方式通過識別不同知識領(lǐng)域中的共同關(guān)系結(jié)構(gòu),可以將知識從一個問題應(yīng)用到另一個問題[13]。因此,為了產(chǎn)生新的創(chuàng)意,發(fā)現(xiàn)足夠價值的信息,必須訪問來自不同知識庫的相關(guān)信息。通過交互從更多不同的原始信息中重組,激活不同的知識領(lǐng)域有助于創(chuàng)意的新穎性。目前,大多數(shù)對于交互與創(chuàng)新貢獻之間關(guān)系的研究,也認為交互有益于用戶貢獻[15]??梢?,增加用戶交互過程中對信息的獲取量可以幫助用戶重新定義問題并激發(fā)新創(chuàng)意的產(chǎn)生。
在OIP環(huán)境中,用戶之間可以通過交互獲取信息。用戶通過提供評論產(chǎn)生新創(chuàng)意和共同促進其他用戶發(fā)布創(chuàng)意的行為,是參與平臺交互活動的主要方式[2]。通過評論他人創(chuàng)意積極互動的用戶通常能獲得更多的好處[28]。因此,本研究重點關(guān)注用戶交互中的評論行為。在OIP中用戶通過評論創(chuàng)意信息而相互交流,向他人傳播或?qū)W習(xí)創(chuàng)新、感興趣或有價值的信息,而這些創(chuàng)意信息可以作為用戶創(chuàng)意靈感的來源。用戶通過學(xué)習(xí)這些創(chuàng)意信息來激活、調(diào)整、重組現(xiàn)有知識,產(chǎn)生新的創(chuàng)意,從而能有更多的知識貢獻。因此,用戶應(yīng)該積極參與OIP中的社交互動,從更多的創(chuàng)意中進行學(xué)習(xí),獲取更多的知識,才能為自己提供更多的創(chuàng)意貢獻機會。
因此,提出以下假設(shè):
H1:在OIP中,用戶交互過程中的信息獲取量正向影響用戶知識貢獻。
2.2? 信息冗余與用戶知識貢獻
在OIP中,用戶通過交互可以學(xué)習(xí)、分享感興趣的知識,更為企業(yè)提供大量有價值的可參考創(chuàng)意。但OIP的創(chuàng)意信息中存在大量重復(fù)的內(nèi)容,可能會出現(xiàn)信息過載、信息冗余的現(xiàn)象,進而影響用戶通過發(fā)布創(chuàng)意進行知識貢獻。因為用戶在發(fā)表創(chuàng)意之前不可能把平臺中存在的所有創(chuàng)意進行對比后再發(fā)表不同的創(chuàng)意,用戶之間可能有相似的創(chuàng)意想法,因此會存在重復(fù)的信息。這意味著,用戶在交互過程獲取的不同創(chuàng)意中蘊含的信息存在冗余。不同創(chuàng)意信息中相同內(nèi)容越多,信息冗余度越大,這不僅會增加用戶處理信息的負擔(dān),而且會阻礙用戶從他人的創(chuàng)意信息中學(xué)習(xí)創(chuàng)新性知識。
根據(jù)在不同背景下的先前研究發(fā)現(xiàn),當(dāng)創(chuàng)意相似、重復(fù)或冗余時,個人的創(chuàng)造力會降低[7,29]。而當(dāng)作為用戶創(chuàng)意來源的創(chuàng)意擁有更多不同的內(nèi)容時,可以使用戶受到更多不同知識的啟發(fā),為用戶提供處理(激活、調(diào)整、重組)所學(xué)習(xí)知識的機會,并建立新的知識聯(lián)系,從而促進創(chuàng)意的產(chǎn)生[3]。因此我們推斷,OIP中用戶在通過交互主動對其他用戶及其創(chuàng)意進行學(xué)習(xí)的過程中,會受到他人創(chuàng)意信息的啟發(fā),但用戶獲取的作為創(chuàng)意靈感內(nèi)容中信息冗余會干擾用戶對不同新知識的學(xué)習(xí)。低冗余信息比高冗余信息蘊含更多價值,可以使用戶學(xué)習(xí)到不同的知識而不是重復(fù)學(xué)習(xí)相同的內(nèi)容。我們認為,創(chuàng)意內(nèi)容特征調(diào)節(jié)用戶獲取信息量對于其知識貢獻的影響,并且相對于信息冗余度高的創(chuàng)意內(nèi)容,在信息冗余度低時用戶獲取創(chuàng)意的信息量對知識貢獻的影響更大。
因此,提出以下假設(shè):
H2:在OIP中,用戶交互中的信息冗余度負向調(diào)節(jié)信息獲取量對用戶知識貢獻的影響。
基于以上分析,提出在OIP用戶交互中信息冗余對用戶知識貢獻的影響研究模型,如圖1所示。
3? 研究設(shè)計
3.1 ?數(shù)據(jù)來源
我們使用從樂高開放式創(chuàng)新平臺LEGO IDEAS
中收集到的數(shù)據(jù)來檢驗假設(shè)。LEGO IDEAS(ideas.lego.com)是一個以樂高創(chuàng)意為主題的開放式創(chuàng)新平臺,13歲以上的樂高玩家都可以注冊并將自己的樂高作品上傳到網(wǎng)站,通過用戶和樂高官方的層層篩選,最終作品有機會被實際投入生產(chǎn)并銷售。LEGO Ideas平臺于2014年4月正式上線,至2019年底已經(jīng)擁有110多萬注冊用戶,以及3萬多項創(chuàng)意作品,并且已有28個創(chuàng)意作品上架銷售,其中有18個作品售空,此外還有144個創(chuàng)意贏得競賽并獲得相應(yīng)獎勵。
樂高開放式創(chuàng)新平臺中的創(chuàng)意都公開展示在平臺中,用戶可以瀏覽已發(fā)布的創(chuàng)意,還可以對感興趣的創(chuàng)意支持和評論等。樂高開放式創(chuàng)新平臺中用戶交互較為活躍,擁有良好的用戶基礎(chǔ),并且可以清楚地觀察到所有的創(chuàng)意特征、用戶特征及創(chuàng)意評估過程等。因此,選擇LEGO Ideas中2019年在平臺發(fā)布過評論的創(chuàng)新活躍用戶(共12 976位)為研究樣本具有可行性。
編寫Python爬蟲程序爬取這些創(chuàng)新用戶的相關(guān)數(shù)據(jù)。數(shù)據(jù)收集分為3步:首先,選擇2019年被評論的創(chuàng)意相關(guān)信息,包括用戶評論時間、評論內(nèi)容、評論的創(chuàng)意、評論創(chuàng)意標(biāo)簽以及評論創(chuàng)意詳情;其次,爬取樣本用戶的詳細信息,用戶加入平臺時間、用戶評論數(shù)、用戶關(guān)注數(shù)等;最后,爬取樣本用戶發(fā)布的創(chuàng)意數(shù)、創(chuàng)意標(biāo)簽、創(chuàng)意詳情、創(chuàng)意發(fā)布時間等創(chuàng)意信息。使用Python對數(shù)據(jù)進行清洗及規(guī)范化處理,獲得最終的樣本數(shù)據(jù)。
3.2? 變量定義及測量
3.2.1? 被解釋變量
綜合前人對用戶知識貢獻的衡量,本研究使用2019年用戶在參與OIP交互過程中提交的創(chuàng)意數(shù)量(IdeaNumber)來衡量[8,15]。
3.2.2? 解釋變量
本文選擇用戶評論的創(chuàng)意數(shù)量(ComNumber)來衡量在OIP用戶交互過程中獲取的創(chuàng)意信息量。
在OIP中,用戶評論創(chuàng)意,這意味著用戶愿意花費更多的時間和精力對創(chuàng)意進行閱讀和理解,可推理用戶已經(jīng)對創(chuàng)意所包含的創(chuàng)新知識進行了吸收和學(xué)習(xí)。此外,很多關(guān)于在線社區(qū)中用戶交互行為的研究,都從用戶的評論行為角度進行研究[3,14-15],認為通過評論他人創(chuàng)意可以進行社會學(xué)習(xí)[8],評論是在線知識貢獻的重要動力[2]。因此,本文選擇用戶評論的創(chuàng)意數(shù)量來衡量在OIP用戶交互中獲取的信息量,認為用戶通過評論他人創(chuàng)意會獲得靈感,可以促進自己創(chuàng)意的形成。
3.2.3? 調(diào)節(jié)變量
本文使用信息冗余度來衡量用戶交互過程中的信息冗余程度。
Shannon指出,任何信息都存在冗余,且冗余度與信息熵成反比[18]?;谖谋局械脑~頻,一個文本中不同詞出現(xiàn)的概率大,則該文本不確定性大,信息熵大,冗余度低;反之,信息熵小,冗余度高。在OIP環(huán)境中,創(chuàng)意是用戶獲得新知識的來源。用戶在評論他人的創(chuàng)意時,會仔細閱讀并進行思考,從而從他人的創(chuàng)意信息中學(xué)習(xí)到相關(guān)的知識,文本內(nèi)容是傳遞信息的主要載體。因此,本文使用創(chuàng)意文本內(nèi)容來計算信息冗余度。
本文旨在衡量作為創(chuàng)意來源的不同創(chuàng)意中存在的信息冗余,而同一個創(chuàng)意中往往包含大量重復(fù)、無價值的干擾信息影響冗余度的計算。因此,首先對每一個創(chuàng)意進行文本處理,再以此為基礎(chǔ)計算用戶評論不同創(chuàng)意中的信息冗余度。創(chuàng)意文本信息冗余度的計算過程如下:
第一步:對于用戶評論過的每一個創(chuàng)意進行文本挖掘處理。將每一個創(chuàng)意的詳情內(nèi)容作為一個文本文檔,進行分詞處理,使用NLTK內(nèi)嵌的停用詞表刪除停用詞,提取詞干,去除詞綴得到詞根。再去掉重復(fù)詞,使最終獲得文檔中每個創(chuàng)意的不同關(guān)鍵詞只包含1個。
第二步:將在第一步中提取的用戶評論的所有創(chuàng)意唯一性關(guān)鍵詞合并,組成新文本。每一個用戶對應(yīng)一個組合文本集,計算其總詞數(shù)為N。根據(jù)Shannon對于信息熵的定義,假設(shè)文本中包含的信息互不重復(fù),每個詞僅出現(xiàn)1次,則該文本的最大信息熵H0為:
H0=log2N
第三步:根據(jù)第二步中合并的新文本集,計算每個新文本中實際存在的不同單詞數(shù)n以及每一個詞的詞頻pi。來源于不同創(chuàng)意的信息之間會存在重復(fù)的單詞,降低信息的不確定性,因此計算不重復(fù)單詞的信息熵H∞:
H∞=-∑nipilog2pi
其中,i為新組合文本集合中第i個單詞;pi表示第i個單詞在組合文本中出現(xiàn)的詞頻。
第四步:計算冗余度R,公式如下:
R=1-H∞/H0
信息冗余度的計算是通過Python的NLTK包實現(xiàn)的,詳細的算法流程如圖2所示。
3.2.4? 控制變量
根據(jù)先前的研究發(fā)現(xiàn),用戶的自身特征和創(chuàng)意項目特征都是影響用戶參與創(chuàng)新過程中知識貢獻的重要因素。因此,本研究從用戶自身特征和創(chuàng)意項目特征兩方面選取控制變量[30]。
在用戶自身特征方面,包括用戶創(chuàng)新經(jīng)驗(history_entries)、用戶創(chuàng)新水平(highluser)、用戶的平臺資歷(age)。首先,以用戶歷史發(fā)布創(chuàng)意數(shù)量來衡量用戶的創(chuàng)新經(jīng)驗[13]。第二,用是否為高水平創(chuàng)新用戶衡量用戶的創(chuàng)新水平差異[31]。平臺會對贏得1萬個支持的創(chuàng)意進行官方評審,進入官方評審意味著創(chuàng)意具有高的質(zhì)量和價值,具有被商業(yè)化的可能。因此,選取曾發(fā)布過贏得1萬個支持標(biāo)簽的創(chuàng)意來衡量用戶是否為高水平創(chuàng)新用戶。第三,用戶在平臺中的資歷會影響其在平臺中的參與體驗以及與其他用戶和主辦公司的交互。因此,以用戶加入平臺天數(shù)來衡量用戶的平臺資歷差異[32]。
在創(chuàng)意項目特征方面,包括用戶創(chuàng)意收到的總評論數(shù)(ReceiveComment)、用戶評論創(chuàng)意的圖片總數(shù)(Image)、評論的創(chuàng)意平均長度(Idealen)。創(chuàng)意收到他人評論意味著更多人對該創(chuàng)意內(nèi)容感興趣,收到的評論數(shù)更多的用戶與其他用戶聯(lián)系更強,有更強的在線平臺歸屬感[12,14],會影響用戶后續(xù)創(chuàng)意發(fā)布[14]和用戶社區(qū)貢獻水平[15]。文本是信息的主要載體,創(chuàng)意文本內(nèi)容的字數(shù)越多,說明用戶創(chuàng)意有更多的信息,用戶可以更好地對創(chuàng)意進行學(xué)習(xí),從而獲取更多的有價值信息。使用圖片描述創(chuàng)意會更直觀、更有說服力,創(chuàng)意中包含的圖片越多,就會使創(chuàng)意信息表示得更加生動、更容易被他人理解[3]。
所有變量的測量和描述性統(tǒng)計分析分別如表1和表2所示。
3.3? 回歸模型構(gòu)建
構(gòu)建實證回歸模型,如式(1)所示。主要考察用戶交互過程中向他人創(chuàng)意信息的學(xué)習(xí)對用戶知識貢獻的影響,被解釋變量是創(chuàng)意數(shù)量(IdeaNumber),解釋變量是用戶評論的創(chuàng)意數(shù)(ComNumber),調(diào)節(jié)變量是信息冗余度(Redundancy),控制變量是用戶歷史發(fā)布創(chuàng)意數(shù)量(HistoryEntries)、用戶創(chuàng)新水平(HighUser)、用戶的平臺資歷(Age)、用戶創(chuàng)意收到的總評論數(shù)(ReceiveComment)、用戶評論創(chuàng)意平均長度(Idealen)和用戶評論創(chuàng)意的圖片平均數(shù)(Img)。此外,εi為誤差項。
IdeaNumberi=α0+α1ComNumberi+α2Redundancyi+α3ComNumberi*Redundancyi+α4Agei+α5HighUseri+α6HistoryEntriesi+α7ReceiveCommenti+α8IdeaLeni+α9Imgi+εi(1)
模型(1)中使用創(chuàng)意數(shù)量(評論用戶在2019年發(fā)布的創(chuàng)意總數(shù))作為被解釋變量,因此,模型是計數(shù)數(shù)據(jù)模型。計數(shù)數(shù)據(jù)分析通常選擇泊松回歸或負二項回歸模型,但由表2可知,在我們的數(shù)據(jù)集中被解釋變量的方差為5.636,均值為0.489,不滿足均值和方差相等的假設(shè),模型結(jié)果是過度離散的,因此不能使用泊松回歸模型。此外,被解釋變量的分布情況如表3所示,被解釋變量中有84.53%是零,說明存在過多零的問題,可以用零膨脹模型來解決。因此,本文選擇零膨脹負二項回歸(ZINB)模型,并且發(fā)現(xiàn)ZINB模型的檢驗統(tǒng)計值是一個較大的正值,并且p值遠小于0.05,所以,在0.05的顯著水平上適合選擇ZINB模型。本文使用Stata做零膨脹負二項回歸進行模型估計。
4? 實證結(jié)果及分析
4.1? 基本檢驗
表4展示了回歸結(jié)果?;貧w(1)(2)是對總體樣本的零膨脹負二項回歸結(jié)果。回歸(1)只考慮用戶評論創(chuàng)意數(shù)(ComNumber)對用戶發(fā)布創(chuàng)意數(shù)量的影響,結(jié)果顯示,用戶評論創(chuàng)意數(shù)的系數(shù)(α1=0.001,p<0.01)是正向且顯著的。這說明用戶之間基于創(chuàng)意評論的交互越多,越能激發(fā)用戶通過發(fā)布新創(chuàng)意來貢獻知識,支持假設(shè)1?;貧w(2)中加入了評論創(chuàng)意數(shù)與信息冗余度的交互項,結(jié)果顯示,交互項系數(shù)(α3=-0.145,p<0.01)是負向且顯著的。表明信息冗余度負向調(diào)節(jié)了用戶的創(chuàng)意信息獲取量對用戶知識貢獻的正向影響,假設(shè)2得到支持。因此,用戶創(chuàng)意信息獲取量對用戶知識貢獻的影響在低信息冗余度的交互中比在高信息冗余度的交互中更好。
由于本文重點在檢驗創(chuàng)意中的信息冗余度,并對每一個創(chuàng)意都進行了文本挖掘處理,使得每個創(chuàng)意中只包含唯一性的關(guān)鍵詞。當(dāng)用戶只評論一個創(chuàng)意時,用戶所學(xué)習(xí)的創(chuàng)意的信息冗余度為零,但與用戶評論的不同創(chuàng)意之間的零冗余度不同。為探究不同創(chuàng)意之間的內(nèi)容差別,更好的方式是分析用戶評論兩個及以上的創(chuàng)意文本內(nèi)容。因此,提取子樣本,刪除總樣本中用戶評論創(chuàng)意數(shù)為1的用戶(共9 289人),對剩下的樣本(3 697個)再次進行回歸,結(jié)果如表4中回歸(3)(4)所示。回歸(3)只是用戶評論創(chuàng)意數(shù)對于用戶知識貢獻的影響,該結(jié)果與表4中回歸(1)一致?;貧w(4)中增加了用戶評論創(chuàng)意數(shù)與信息冗余度的交互項,該結(jié)果與表4中回歸(2)同樣說明了信息冗余度對于獲取創(chuàng)意信息量對用戶知識貢獻影響的負向調(diào)節(jié)作用。
以上結(jié)果說明,在OIP中用戶之間的交互和創(chuàng)意交流可以促進用戶知識貢獻。與他人的互動交流有助于用戶對創(chuàng)意進行學(xué)習(xí)、理解,從大量相關(guān)創(chuàng)意中發(fā)現(xiàn)足夠的價值,并修改、整合、重組現(xiàn)有知識,從而促進用戶產(chǎn)生新的創(chuàng)意,對用戶貢獻有積極影響(假設(shè)1)。當(dāng)用戶學(xué)習(xí)的創(chuàng)意之間相似或者存在重復(fù)時,即使用戶評論了較多的創(chuàng)意,實際上學(xué)習(xí)到的知識卻很少。一個人對于信息的處理能力是限度的,創(chuàng)意之間冗余的信息不僅增大了用戶學(xué)習(xí)難度,還干擾了用戶對不同知識的獲取。在OIP用戶交互過程中信息冗余度越大,用戶學(xué)習(xí)的創(chuàng)意信息量對用戶知識貢獻的影響越小,信息冗余度減弱了創(chuàng)意信息獲取量對用戶知識貢獻的影響(假設(shè)2)。
4.2? 穩(wěn)健性檢驗
如前文所述,由于總樣本中被解釋變量包含大量的0,占總數(shù)的84.53%,因此選擇了零膨脹負二項回歸模型。但有研究表明,數(shù)據(jù)集中有過度0值并不意味著需要一個零膨脹模型。因此,本文使用負二項回歸(NB2)重新估計以上兩個樣本,來評估我們結(jié)果的穩(wěn)健性和一致性,結(jié)果如表5。其中,回歸(1)(2)是對總樣本進行的負二項回歸結(jié)果,回歸(3)(4)是對子樣本進行的負二項回歸結(jié)果。結(jié)果與前面基本一致,用戶通過評論創(chuàng)意進行的交互越多,用戶貢獻的知識數(shù)量越多;同時,證明了信息冗余度的調(diào)節(jié)作用,當(dāng)用戶獲取的創(chuàng)意中信息冗余度低時,用戶獲取更多的創(chuàng)意信息有可能做出更多知識貢獻。表明了回歸結(jié)果的穩(wěn)健性。
5? 研究結(jié)論與啟示
5.1? 研究結(jié)論
本研究通過使用文本挖掘方法對創(chuàng)意文本進行處理,獲得關(guān)鍵詞的詞頻,并結(jié)合信息論中的方法計算信息冗余度,探究了在用戶交互過程中內(nèi)容特征如何影響用戶知識貢獻。使用爬取的樂高開放式創(chuàng)新平臺的數(shù)據(jù),建立回歸模型進行實證分析,得出以下結(jié)論。
第一,用戶交互過程中獲取的創(chuàng)意信息量正向影響用戶知識貢獻。用戶通過交互獲取的相關(guān)信息是用戶構(gòu)思創(chuàng)意的知識來源。他人的創(chuàng)意能夠啟發(fā)用戶,激勵用戶思考、創(chuàng)造,促進用戶積極貢獻創(chuàng)意。因此,在開放式創(chuàng)新平臺中用戶交互機制是必要的,交互可以使用戶更好地進行創(chuàng)意的分享與學(xué)習(xí),并保證平臺的活躍度。
第二,用戶交互的信息冗余度負向調(diào)節(jié)創(chuàng)意信息獲取量對于用戶知識貢獻的影響。在OIP中,低信息冗余能夠促進交互對用戶知識貢獻的正向影響。這說明用戶在進行交互時不能只關(guān)注獲取創(chuàng)意的數(shù)量,更要區(qū)別不同的創(chuàng)意內(nèi)容。對于用戶創(chuàng)新活動,交互的內(nèi)容往往比數(shù)量更重要,而當(dāng)前有關(guān)的研究正缺少有關(guān)創(chuàng)意內(nèi)容特征的詳細分析。這一發(fā)現(xiàn)補充了當(dāng)前對用戶交互的研究,在OIP中并不是交互的數(shù)量越多越好,企業(yè)在關(guān)注用戶交互的同時更要關(guān)注創(chuàng)意的內(nèi)容特征。
企業(yè)建立OIP并采取措施激勵用戶參與,最終目的是能夠通過OIP收集更好的創(chuàng)意內(nèi)容,因此,內(nèi)容特征的研究是有必要的,也是用戶創(chuàng)新研究中關(guān)鍵的一部分。本文從信息冗余角度,深入分析了用戶交互中創(chuàng)意內(nèi)容特征對用戶知識貢獻的影響,為創(chuàng)新研究提供了一個新的角度,補充了當(dāng)前用戶交互的相關(guān)研究,同時對用戶促進貢獻,提高貢獻創(chuàng)意內(nèi)容質(zhì)量有重要的意義。
5.2? 管理啟示
本文的結(jié)論指出,創(chuàng)新平臺中活躍的交互活動可以促進用戶積極貢獻,但企業(yè)在為用戶提供交互功能并鼓勵用戶參與的同時,要考慮如何讓用戶在交互過程中做到高效學(xué)習(xí),而不是在相同或相似的高冗余創(chuàng)意中做無用功。因此,本文得出如下啟示:第一,平臺應(yīng)該監(jiān)控用戶貢獻的創(chuàng)意,更加關(guān)注內(nèi)容質(zhì)量,對主要創(chuàng)意類別進行識別和初步篩選,減少重復(fù)創(chuàng)意的發(fā)布;第二,鼓勵用戶評論更多的創(chuàng)意,特別是跨類別的創(chuàng)意,可以根據(jù)用戶在不同類別中的評論設(shè)置徽章獎勵,以此激勵用戶學(xué)習(xí)并分享更多樣化的創(chuàng)意,促進用戶間的知識交流與學(xué)習(xí);第三,平臺要不斷吸引新用戶加入平臺,為平臺注入新的血液,帶來新的知識和思維;第四,值得注意的是,樂高開放式創(chuàng)新平臺在允許用戶自行發(fā)布創(chuàng)意的同時,還擁有“Contest”板塊以及新推出的“Activity”板塊,這兩個板塊會使創(chuàng)意集中在一個特定的主題上,并且持續(xù)時間相對較短,這些板塊有可能使用戶減少自己固定的思維而去接觸一種新穎類別的主題,這些主題往往能使用戶學(xué)習(xí)到信息冗余度低的創(chuàng)意,輔助激發(fā)用戶的創(chuàng)新思維。
5.3? 局限與未來研究方向
本研究從信息冗余度的角度證明了用戶交互中內(nèi)容特征的重要性,為企業(yè)更多關(guān)注內(nèi)容信息提供了可行建議。但本研究仍然存在一定的局限性和可待研究的未來方向。首先,雖然樂高開放式創(chuàng)新平臺是比較有代表性的平臺,但每一個平臺都有其自身不同的特點,本研究特定結(jié)果的普遍性有待驗證。因此,未來的研究可能會嘗試研究在其他背景中信息冗余度的作用;其次,雖然評論活動是衡量用戶交互較為普遍的方式,也有研究證明,用戶只有對某個創(chuàng)意感興趣才會進行評論,并且有后續(xù)的其他社交互動行為[33]。未來的研究也會考慮更多的用戶交互形式是否會有不同影響。
參考文獻
[1]Pellizzoni E,Trabucchi D,Buganza T.Platform Strategies:How the Position in the Network Drives Success[J].Technology Analysis & Strategic Management,2018,31(5):579-592.
[2]Chen L,Baird A,Straub D.Why Do Participants Continue to Contribute?Evaluation of Usefulness Voting and Commenting Motivational Affordances Within an Online Knowledge Community[J].Decision Support Systems,2019,118(2019):21-32.
[3]Yan J,Leidner D E,Benbya A H,et al.Differential Innovativeness Outcomes of User and Employee Participation in an Online User Innovation Community[J].Journal of Management Information Systems,2018,35(3):900-9337.
[4]Bayus B L.Crowdsourcing New Product Ideas Over Time:An Analysis of the Dell IdeaStorm Community[J].Management Science,2013,59(1):226-244.
[5]Liang H,F(xiàn)u K W.Network Redundancy and Information Diffusion:The Impacts of Information Redundancy,Similarity,and Tie Strength[J].Communication Research,2019,46(2):250-272.
[6]Liang H,F(xiàn)u K W.Information Overload,Similarity,and Redundancy:Unsubscribing Information Sources on Twitter[J].Journal of Computer Mediated Communication,2016,22(1):1-17.
[7]Stephen A T,Zubcsek P P,Goldenberg J.Lower Connectivity Is Better:The Effects of Network Structure on Redundancy of Ideas and Customer Innovativeness in Interdependent Ideation Tasks[J].Journal of Marketing Research,2016,53(2):263-279.
[8]王婷婷,戚桂杰,張雅琳,等.開放式創(chuàng)新社區(qū)用戶持續(xù)性知識共享行為研究[J].情報科學(xué),2018,36(2):139-145.
[9]周濤,何蓮子,鄧勝利.開放式創(chuàng)新社區(qū)用戶知識分享的影響因素研究[J].現(xiàn)代情報,2020,40(3):58-64.
[10]任亮,張海濤,劉雅姝,等.開放式創(chuàng)新社區(qū)知識協(xié)同創(chuàng)新研究綜述[J].情報資料工作,2019,40(5):31-37.
[11]賈理群,劉旭.新熊彼特主義學(xué)派關(guān)于技術(shù)創(chuàng)新理論的研究進展[J].中國科技論壇,1995,(5):38-41.
[12]Martínez-Torres R.Analysis of Open Innovation Communities from the Perspective of Social Network Analysis[J].Technology Analysis & Strategic Management,2013,26(4):435-451.
[13]Hwang E H,Singh P V,Argote L.Jack of All,Master of Some:Information Network and Innovation in Crowdsourcing Communities[J].Information Systems Research,2019,30(2):389-410.
[14]Chan K W,Li S Y,Zhu J J.Fostering Customer Ideation in Crowdsourcing Community:The Role of Peer-to-Peer and Peer-to-Firm Interactions[J].Journal of Interactive Marketing,2015,31:42-62.
[15]Chen L,Marsden J R,Zhang Z.Theory and Analysis of Company-Sponsored Value Co-Creation[J].Journal of Management Information Systems,2014,29(2):141-172.
[16]Nonaka I.A Dynamic Theory of Organizational Knowledge Creation[J].Organization Science,1994,5(1):14-37.
[17]Levine S S,Prietula M.The Hazards of Interaction:When Isolation Benefits Performance[J].Social Science Electronic Publishing,2013,2013(1):10736-10736.
[18]賈世樓.信息論理論基礎(chǔ)[M].哈爾濱:哈爾濱工業(yè)大學(xué)出版社,2001.
[19]Harrigan N,Achananuparp P,Lim E P.Influentials,Novelty,and Social Contagion:The Viral Power of Average Friends,Close Communities,and Old News[J].Social Networks,2012,34(4):470-480.
[20]Bao Q,Cheung W K,Zhang Y,et al.A Component-Based Diffusion Model With Structural Diversity for Social Networks[J].IEEE Transactions on Cybernetics,2017,47(4):1078-1089.
[21]秦爍,呂欣,孟凡輝,等.在線社交媒體信息冗余現(xiàn)象建模與實證研究[J].大數(shù)據(jù),2018,4(5):53-64.
[22]劉魯川,張冰倩,李旭.社交媒體信息過載、功能過載與用戶焦慮情緒的關(guān)系:一項實驗研究[J].信息資源管理學(xué)報,2019,(2):66-76.
[23]Rishika R,Ramaprasad J.The Effects of Asymmetric Social Ties,Structural Embeddedness,and Tie Strength on Online Content Contribution Behavior[J].Management Science,2019,65(7):3398-3422.
[24]Muller E,Peres R.The Effect of Social Networks Structure on Innovation Performance:A Review and Directions for Research[J].International Journal of Research in Marketing,2019,36(1):3-19.
[25]Higgins E T.Knowledge Activation:Accessibility,Applicability,and Salience[J].Social Psychology:Handbook of Basic Principles,1996:133-168.
[26]Croitoru A.The Theory of Economic Development:An Inquiry into Profits,Capital,Credit,Interest and the Business Cycle[J].Journal of Comparative Research in Anthropology and Sociology,2012,3(1):90-91.
[27]Gentner D.Structure-Mapping:A Theoretical Framework for Analogy[J].Cognitive Science,1983,7(2):155-170.
[28]Preece J,Nonnecke B,Andrews D.The Top Five Reasons for Lurking:Improving Community Experiences for Everyone[J].Computers in Human Behavior,2004,20(2):201-223.
[29]Pan W,Altshuler Y,Alex.Decoding Social Influence and the Wisdom of the Crowd in Financial Trading Network[C]//Privacy,Security,Risk & Trust.IEEE,2013.
[30]陳佳麗,呂玉霞,戚桂杰,等.開放式創(chuàng)新平臺中創(chuàng)新用戶的互惠行為研究——以樂高創(chuàng)意平臺為例[J].軟科學(xué),2019,33(3):96-100.
[31]Yang X,Li G.Factors Influencing the Popularity of Customer-Generated Content in a Company-Hosted Online Co-Creation Community:A Social Capital Perspective[J].Computers in Human Behavior,2016,64:760-768.
[32]Li M,Kankanhalli A,Kim S H.Which Ideas Are More Likely to Be Implemented in Online User Innovation Communities?An Empirical Analysis[J].Decision Support Systems,2016,84:28-40.
[33]楊光,汪立.思維定勢如何影響創(chuàng)意質(zhì)量——基于“眾包”平臺的實證研究[J].管理世界,2017,33(12):109-124.
(責(zé)任編輯:陳? 媛)