伍國飛 王和勇 * 曾斌
(1.華南理工大學(xué) 廣東廣州 510641; 2.廣州科技貿(mào)易職業(yè)學(xué)院 廣東廣州 511442)
隨著短視頻用戶規(guī)??焖僭鲩L,形成了用戶黏性 大、獲客成本低的短視頻平臺,為直播電商的高速發(fā)展?fàn)I造了良好的外部環(huán)境[1]。在以短視頻平臺為基礎(chǔ)的直播電商產(chǎn)業(yè)鏈中,品牌企業(yè)、工廠等為產(chǎn)業(yè)鏈上游,主播達(dá)人、MCN機(jī)構(gòu)為產(chǎn)業(yè)鏈中游,粉絲用戶為下游,位于中游的主播達(dá)人重構(gòu)了當(dāng)前交易模式的“人貨場”,以其個人魅力、信魅力、高度互動性、信任因素影響著粉絲群體的購買行為[2],進(jìn)而提升了交易效率和品牌認(rèn)知度。因此,在當(dāng)前流量紅利逐漸見頂、消費需求放緩、企業(yè)競爭日益激烈的背景下,直播帶貨已成為企業(yè)在降低營銷成本、維持用戶增長,促進(jìn)交易和維護(hù)品牌忠誠度等營銷管理上亟須開拓和探索的新模式。企業(yè)在直播帶貨營銷方面面臨著兩大問題:首先,面對短視頻平臺上海量的直播達(dá)人,企業(yè)如何篩選契合企業(yè)目標(biāo)消費群體的優(yōu)質(zhì)達(dá)人,以獲取有效的用戶;其次,對于提供多品類的企業(yè),如何圍繞客戶特點制訂跨產(chǎn)品線的產(chǎn)品組合營銷方案,向優(yōu)質(zhì)的達(dá)人投放合適的廣告,以促進(jìn)用戶達(dá)成交易。
市場細(xì)分是實現(xiàn)精細(xì)化營銷活動中較為流行的策略模型。市場細(xì)分根據(jù)客戶的需求、行為、或某種特征將他們分類到相似的群體中,其過程有5個活動:細(xì)分市場、描述細(xì)分市場、評估細(xì)分市場的吸引力、選擇目標(biāo)細(xì)分市場并將資源分配給細(xì)分市場以及尋找目標(biāo)客戶。
目標(biāo)群體指數(shù)(Target Group Index,TGI)是一種應(yīng)用在媒體投放、覆蓋廣大目標(biāo)群體的細(xì)分技術(shù),反映某個目標(biāo)群體在某項研究特征(如地理區(qū)域、人口統(tǒng)計、媒體受眾等)中偏好強(qiáng)弱程度,用來衡量某種品牌、產(chǎn)品或服務(wù)在特定目標(biāo)群體中的知名度和吸引程度,例如:吳文瀚[3]基于搜索引擎數(shù)據(jù),結(jié)合使用TGI 和關(guān)聯(lián)規(guī)則來發(fā)現(xiàn)年輕用戶的汽車需求。自組織映射(Self-Organizing Map,SOM)算法是一種聚類和高維可視化的無監(jiān)督神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法,由芬蘭赫爾辛基大學(xué)教授Teuvo Kohonen 提出,SOM 是一個兩層前饋網(wǎng)絡(luò),每個神經(jīng)元學(xué)習(xí)識別一個特定的輸入模式。具有保持拓?fù)浣Y(jié)構(gòu)、自適應(yīng)以及可視化上的特點,廣泛應(yīng)用于分類聚類、數(shù)據(jù)降維,組合優(yōu)化等眾多信息處理領(lǐng)域。例如:宋新平等人[4]基于SOM構(gòu)建競爭對手識別模型,并根據(jù)模型結(jié)果識別酒店企業(yè)的競爭對手。
基于上述分析,考慮到短視頻平臺開放的直播達(dá)人粉絲群體畫像包括人口統(tǒng)計屬性(如性別、地理位置、使用手機(jī)品牌、年齡等),本文以市場細(xì)分為理論基礎(chǔ),以人口統(tǒng)計屬性為細(xì)分維度,融合TGI和SOM細(xì)分技術(shù),構(gòu)建兩層的細(xì)分用戶群體,進(jìn)而使?fàn)I銷人員在主播達(dá)人篩選和產(chǎn)品投放過程中實現(xiàn)精細(xì)化管理。
TGI-SOM模型的構(gòu)建流程共3步:首先,采集Q公司會員數(shù)據(jù)及訂單數(shù)據(jù)為原始數(shù)據(jù),以人口統(tǒng)計屬性的細(xì)分維度構(gòu)建用戶群體-產(chǎn)品服務(wù)的TGI矩陣M;其次,以TGI矩陣M作為SOM的輸入層,通過迭代更新每個樣本與神經(jīng)元的權(quán)重,輸出競爭獲勝者,并映射在二維的拓?fù)潢P(guān)系平面陣;最后,使用KMean算法對用戶群體進(jìn)行二次聚類,生成分組人群。
2.1.1 TGI矩陣
設(shè)A為相同特征(如購買某類產(chǎn)品的行為),B(B∈T)為目標(biāo)群體(如使用某個手機(jī)品牌的人群),其中T表示總體人群,TGI計算公式[5]如下:
根據(jù)公式(1)構(gòu)造一個TGI矩陣M,其中每一行代表一個人群分組,每一列代表產(chǎn)品服務(wù)類型。設(shè)矩陣M有m行及n列,其中元素cij(i=1,2,…,m;j=1,2,…,n)為第i個人群分組對第j個的產(chǎn)品服務(wù)類別的TGI值,如式(2)所示:
2.1.2 SOM算法過程
設(shè)TGI矩陣M為輸入層,c=(c1,c2,…,cn)是一個n維樣本,輸出層是有N個節(jié)點的二維網(wǎng)絡(luò),wij是第i個輸入神經(jīng)元節(jié)點與第j個輸出神經(jīng)元節(jié)點之間的權(quán)值,該算法的訓(xùn)練過程如下。
(1)將連接權(quán)重、學(xué)習(xí)效率以及鄰域初始化,wij選擇[0,1]之間數(shù)值作為隨機(jī)值,且隨機(jī)值互不相同。
(2)對樣本和連接向量進(jìn)行歸一化,計算歸一化后輸入向量在到輸出節(jié)點的距離d(c,w),公式如下:
(3)選擇最小距離節(jié)點中的d(c,w)為最佳匹配節(jié)點,即神經(jīng)元i為獲勝神經(jīng)元。
(4)使用式(4)調(diào)整權(quán)值向量值:
式(4)中:η(t)是學(xué)習(xí)效率,0<η(t)<1,且隨著時間t而減少;h(t)是鄰域內(nèi)第i個神經(jīng)元和獲勝神經(jīng)元j之間的拓?fù)渚嚯x的函數(shù)。
重復(fù)上述步驟,直到對M所有樣本學(xué)習(xí)后,學(xué)習(xí)效率α(t)<αmin時結(jié)束,最終將數(shù)據(jù)映射一個二維拓?fù)鋱D上。
在TGI指標(biāo)分析中,當(dāng)TGI=100時表示群體B對于特征A的傾向性正好為平均水平;當(dāng)TGI>100 時表示傾向性高于平均水平;反之傾向性則低于平均水平。且通常當(dāng)TGI>120 時表示某項特征具有正向顯著性;當(dāng)TGI<80時表示某項特征具有負(fù)向顯著性。
在SOM算法中,組件平面圖(Component Plane Diagram)是常用分析聚類結(jié)果的可視化工具,展示了聚類結(jié)果中每個神經(jīng)元在不同的特征維度上的分布情況,如果兩個特征在相同的神經(jīng)元上有較強(qiáng)的響應(yīng),則它們之間可能存在較強(qiáng)的相似性。TAO X 等人[6]通過應(yīng)用SOM 組件平面圖更好地理解不同形態(tài)的礫石在自組織映射模型中的分布情況,并進(jìn)一步探索不同類型之間的相似性和差異性。
TGI-SOM 模型構(gòu)建所需要的數(shù)據(jù)來自于Q 公司(一家會員制特權(quán)電商平臺企業(yè),為消費者提供出行、美容、餐飲、住宿、購物、玩樂等多項產(chǎn)品服務(wù))。原始數(shù)據(jù)包括該平臺企業(yè)2019—2021 年間注冊用戶數(shù)據(jù)及其用戶在2022年前平臺上消費的訂單數(shù)據(jù),其中注冊用戶數(shù)據(jù)包括其注冊地省份、注冊地所在城市等級、使用手機(jī)品牌,以及性別等用戶屬性,訂單數(shù)據(jù)包含十二大產(chǎn)品服務(wù)類型。該模型采用MATLAB R2022b 軟件下的SOM Toolbox 2.0工具包來訓(xùn)練SOM。
考慮到TGI 為比例類型數(shù)據(jù),為避免少量的數(shù)據(jù)對實驗效果的影響,因此剔除掉注冊用戶數(shù)匯總后不足25 000的分組數(shù)據(jù),最終生成TGI矩陣,如表1所示。
表1 用戶人群屬性-產(chǎn)品服務(wù)的TGI矩陣表(部分?jǐn)?shù)據(jù))
3.3.1 選擇SOM訓(xùn)練算法
SOM 有兩種訓(xùn)練算法:序列訓(xùn)練算法(Sequential training)和批訓(xùn)練算法(Batch training),其區(qū)別在于更新權(quán)向量時前者是每當(dāng)處理完一個輸入樣本后就更新而后者則是等到所有的輸入樣本都處理完后才更新。考慮到批訓(xùn)練算法訓(xùn)練的SOM 具有較好的一致性和更快的訓(xùn)練速度,因此采用批訓(xùn)練算法訓(xùn)練SOM。
3.3.2 確定SOM數(shù)據(jù)標(biāo)準(zhǔn)化方法及網(wǎng)絡(luò)結(jié)構(gòu)大小
SOM 網(wǎng)絡(luò)采用歐幾里得距離來度量矢量的距離,為避免SOM 訓(xùn)練結(jié)果的影響,加快模型訓(xùn)練速度,需要對輸入數(shù)據(jù)進(jìn)行規(guī)范化處理,常用的SOM規(guī)范化處理的方法有4 種:正態(tài)標(biāo)準(zhǔn)化、線性標(biāo)準(zhǔn)化、邏輯回歸標(biāo)準(zhǔn)化和對數(shù)標(biāo)準(zhǔn)化。
評估SOM 訓(xùn)練結(jié)果有3 個重要的評估指標(biāo):量化誤差(Quantization Error)、拓?fù)湔`差(Topographic Error)和綜合誤差(Combined Error)。其中,量化誤差表示聚類中心和最近的數(shù)據(jù)點之間的距離誤差,即樣本點到其所屬聚類中心的歐幾里得距離,量化誤差越小,表示聚類效果越好;拓?fù)湔`差表示聚類結(jié)果在拓?fù)浣Y(jié)構(gòu)上的誤差,即相鄰聚類之間在輸入空間中的距離,拓?fù)湔`差越小,表示聚類結(jié)果在輸入空間中的拓?fù)浣Y(jié)構(gòu)越好;綜合誤差則是量化誤差和拓?fù)湔`差的加權(quán)和,值越小越好。
最后,參考Vesanto 建議的公式S=m×5 對SOM的二維網(wǎng)絡(luò)結(jié)構(gòu)大小進(jìn)行估計,得S= 353×5≈94。
根據(jù)表2可以看出,當(dāng)采用線性化標(biāo)準(zhǔn)化方法、二維網(wǎng)絡(luò)結(jié)構(gòu)大小取值為12×8=96時,拓?fù)湔`差和綜合誤差值最小,分別為0.389和0.006,量化誤差值(0.253)也較小,表明訓(xùn)練輸出的SOM 網(wǎng)絡(luò)結(jié)構(gòu)是可靠且較優(yōu)的[7]。
表2 不同標(biāo)準(zhǔn)化方法、不同網(wǎng)絡(luò)結(jié)構(gòu)大小所對應(yīng)的SOM的量化誤差、拓?fù)湔`差和綜合誤差
3.3.3 確定SOM聚類數(shù)目
由于SOM 算法本身只能將數(shù)據(jù)點映射到二維網(wǎng)格結(jié)構(gòu)中,無法對數(shù)據(jù)點進(jìn)行實際的聚類操作,需要使用K-Means 算法對SOM 算法得到的聚類結(jié)果進(jìn)行二次聚類。同時,確定聚類結(jié)果的最佳的分類數(shù)目需要引入聚類效果的評估指標(biāo),最佳的聚類效果是使得分類后的類內(nèi)數(shù)據(jù)間的距離最小而類間的距離最大。常用的聚類評估指標(biāo)有輪廓系數(shù)、Calinski-Harabaz 指數(shù)和Davies-Bouldin Index(戴維森堡丁指數(shù))等,本文采用戴維森堡丁指數(shù)來確定最佳分類數(shù)。由圖1 來看,當(dāng)數(shù)據(jù)聚類成6類時,戴維森堡丁指數(shù)值最小,聚類效果最優(yōu)。
圖1 不同聚類數(shù)目對應(yīng)戴維森堡丁指數(shù)
3.4.1 細(xì)分人群屬性特征-產(chǎn)品服務(wù)偏好分析
以細(xì)分人群的標(biāo)簽為維度,統(tǒng)計6 個細(xì)分人群下人口屬性特征,考慮到每個樣本數(shù)據(jù)數(shù)量級不一致的問題,如一線城市只有4 個,但新一線城市有15 個,單純統(tǒng)計其出現(xiàn)的次數(shù)會出現(xiàn)數(shù)據(jù)偏差問題,因此以每個樣本的激活數(shù)為計算指標(biāo),匯總其每個樣本對應(yīng)的數(shù)量并生成詞云圖見圖2。對6大細(xì)分人群在12個產(chǎn)品服務(wù)TGI偏好值進(jìn)行描述性統(tǒng)計,生成箱線圖,具體見圖3。結(jié)合圖2 與圖3,匯總各細(xì)分群組對應(yīng)的產(chǎn)品服務(wù)的偏好結(jié)果如表3所示。
圖2 細(xì)分人群屬性特征的詞云圖
從表3可以得出以下內(nèi)容。
(1)產(chǎn)品服務(wù)4和產(chǎn)品服務(wù)6呈現(xiàn)明顯的性別差異特征,且6個細(xì)分群組明顯劃分了性別屬性,其中男性標(biāo)簽人群(分群2、分群3、分群4)對產(chǎn)品服務(wù)4顯著正向偏好,同時對產(chǎn)品服務(wù)6 顯著弱偏好;而女性(分群1、分群2、分群6)標(biāo)簽人群則與之相反。
(2)分析分群5的偏好產(chǎn)品服務(wù),其不存在任何正向偏好的產(chǎn)品服務(wù),且存在較多負(fù)向偏產(chǎn)品服務(wù),同時結(jié)合其他具有三線以上的細(xì)分人群的產(chǎn)品偏好,結(jié)果顯示Q 公司所銷售的產(chǎn)品服務(wù),其目標(biāo)消費群體主要集中在一線、新一線、二線以及三線城市。
3.4.2 產(chǎn)品服務(wù)相似性分析
將TGI 矩陣M 映射在SOM 的組件平面圖上(見圖4),可以清晰地分析各個產(chǎn)品類別間的相似性。其中黑色表示TGI 偏好值越高,白色的表示TGI 偏好值越低。從圖4發(fā)現(xiàn):產(chǎn)品服務(wù)1、產(chǎn)品服務(wù)6、產(chǎn)品服務(wù)10在左下角區(qū)域有較強(qiáng)的響應(yīng),它們具有較強(qiáng)的相似性;產(chǎn)品服務(wù)2、產(chǎn)品服務(wù)5、產(chǎn)品服務(wù)7、產(chǎn)品服務(wù)9 和產(chǎn)品服務(wù)11在下部中間區(qū)域有較強(qiáng)的相似性;同時產(chǎn)品服務(wù)3集中在偏右下角區(qū)域,與之有部分相似;產(chǎn)品服務(wù)4、產(chǎn)品服務(wù)12在右側(cè)中部位置有較強(qiáng)的相似性;產(chǎn)品服務(wù)8集中在左側(cè)中上區(qū)域,相對獨立。
圖4 由SOM生成的各產(chǎn)品服務(wù)TGI偏好值組件平面圖
根據(jù)以上的結(jié)果,將12類產(chǎn)品服務(wù)按相似性劃分成4類,制訂標(biāo)準(zhǔn)的產(chǎn)品組合營銷方案,同時為企業(yè)建立科學(xué)合理的管理組織結(jié)構(gòu)。
基于TGI-SOM構(gòu)建的細(xì)分群體模型,為企業(yè)在直播帶貨中實現(xiàn)精細(xì)化營銷提供了數(shù)據(jù)決策支持。首先,在匹配企業(yè)的優(yōu)質(zhì)達(dá)人選擇上,營銷人員可以根據(jù)模型輸出各細(xì)分人群下不同產(chǎn)品類型消費偏好的分析結(jié)果,了解企業(yè)的目標(biāo)消費群體的特點和潛在需求,聚焦企業(yè)核心目標(biāo)群體(三線城市以上),結(jié)合短視頻平臺開放的直播達(dá)人粉絲群體畫像,將廣告和有限的資源投放到合適的達(dá)人,進(jìn)而為企業(yè)獲取有效的用戶群體;其次,在優(yōu)質(zhì)的達(dá)人投放合適的產(chǎn)品組合營銷方案上,營銷人員可以根據(jù)模型輸出四類產(chǎn)品型相似性結(jié)果,為合適的用戶群體提供切實所需的產(chǎn)品服務(wù),以增加平臺的吸引力和用戶黏性,更好地滿足不同用戶群體的需求,實現(xiàn)管理和運營的分離,提高經(jīng)營策略以及提升服務(wù)體驗。