黎坤
不知道大家有沒有這樣的感覺:如果你在抖音里經(jīng)??从螒蚪庹f,系統(tǒng)就會給你推薦各類游戲解說視頻,電商也是如此,搜索了幾次“游戲手柄”,然后在主頁的推薦列表里就會出現(xiàn)大量的游戲手柄及其周邊設(shè)備的內(nèi)容,而這也就是傳說中的“個性化推薦算法”。在當(dāng)今這個信息爆炸的時代,如何從海量的信息中快速地過濾掉無用信息,篩選出用戶最感興趣的內(nèi)容是當(dāng)前亟待解決的問題之一,而目前來看,國內(nèi)在智能推薦算法領(lǐng)域,字節(jié)跳動旗下的火山引擎無疑最具代表性。
火山引擎是字節(jié)跳動旗下的云服務(wù)平臺,把字節(jié)跳動快速發(fā)展過程中積累的增長方法、技術(shù)能力和工具,開放給外部企業(yè),提供云基礎(chǔ)、視頻與內(nèi)容分發(fā)、大數(shù)據(jù)、人工智能、開發(fā)與運維等服務(wù),幫助企業(yè)在數(shù)字化升級中實現(xiàn)持續(xù)增長,所以你可以簡單粗暴地將火山引擎和阿里云、華為云、AWS等云計算服務(wù)列為同一類型。
智能推薦平臺是火山引擎多個特色功能的其中之一,來源于字節(jié)跳動推薦中臺,有成百上千算法工程師專門在優(yōu)化推薦算法。從可靠性來看,火山引擎支撐著字節(jié)跳動旗下包括今日頭條、抖音、飛書等應(yīng)用,結(jié)果是毋庸置疑的成熟,而且通過火山引擎對外輸出給B端客戶時,用的是跟抖音今日頭條同一套引擎和同一套架構(gòu)。
以跨境電商為例,考慮到出海企業(yè)都要做本地化運營,不同國家或地區(qū)的用戶偏好非常大。同樣一個產(chǎn)品,賣給歐美用戶可能更注重品牌,賣給東南亞用戶可能更注重性價比,如果商家通過人工分類的方式來進(jìn)行推薦,效率無疑會非常低,并且很難做到長時間的維系,但是通過智能推薦算法就能很好地解決精細(xì)化運營的問題。
而且海外買量和拉新的成本明顯比國內(nèi)高,如果沒一個好的推薦算法為客戶匹配相關(guān)產(chǎn)品,可能他買一件就不會再回頭了,無法實現(xiàn)客戶留存和復(fù)購的目的。并且電商也同樣會遭遇“二八效應(yīng)”,也就是店鋪里八成的流量都會被兩成的產(chǎn)品帶走,對中長尾商品和新品的友好度較低,智能推薦算法就能在保持熱度產(chǎn)品推薦力度的同時,適當(dāng)增加新品的曝光度,提升用戶的新鮮感。
智能推薦功能其實有不少云服務(wù)供應(yīng)商在做,除了火山引擎之外還有華為云、騰訊云、阿里云等。從操作邏輯來看,用戶需要先將用戶信息、商品信息和用戶行為接入到火山引擎之中,相對于其他云服務(wù)來說,火山引擎支持歷史/增量數(shù)據(jù)質(zhì)量校驗,支持指標(biāo)為數(shù)據(jù)統(tǒng)計信息、分布信息、拼接率統(tǒng)計、歸因率統(tǒng)計、業(yè)務(wù)指標(biāo)統(tǒng)計,以及支持?jǐn)?shù)據(jù)質(zhì)量閾值配置與告警,靈活性很高。
推薦服務(wù)包含召回、排序、業(yè)務(wù)干預(yù)三個主要流程。首先是召回,通常分為基于內(nèi)容召回、基于協(xié)同過濾召回、基于模型召回,也就是火山引擎在接入數(shù)據(jù)后會把相關(guān)的數(shù)據(jù)回收,為下一步排序做準(zhǔn)備。一般情況下會同時使用多種召回方式,并通過加權(quán)整合結(jié)果,并配合業(yè)務(wù)規(guī)則對召回結(jié)果集進(jìn)行篩選、去重等操作。
排序可以分為粗排、精排兩種類型。當(dāng)排序候選集數(shù)量較大,比如達(dá)到數(shù)千甚至數(shù)萬條目時,通常先通過粗排,降低候選集數(shù)量,再通過精排進(jìn)一步優(yōu)化候選集。
如果候選集數(shù)量不大時就可以直接使用精排。這個排序的方式可以自定義,也可以根據(jù)火山引擎的黑盒模型來自動排,以視頻內(nèi)容為例,可以選擇評論率和點擊率的乘數(shù)作為系數(shù),火山推薦服務(wù)排序策略支持粗排/精排分別配置,且均支持多路組合。
業(yè)務(wù)干預(yù)就是對結(jié)果集提出篩選、去重、打散、置頂、降權(quán)等干預(yù)需求,也就是可以按用戶的實際需求來自定義化。而推薦系統(tǒng)的最終效果要在實際落地應(yīng)用里進(jìn)行驗證,推薦系統(tǒng)常見的業(yè)務(wù)指標(biāo)以電商為例,有CTR(點擊通過率)、CVR(轉(zhuǎn)化率)、GMV(成交金額)等,以內(nèi)容為例就是CTR(點擊通過率)、閱讀時長、點贊率、收藏率、分享率、評論率等。一般客戶會使用AB實驗,也就是將流量按是否通過智能推薦區(qū)分來進(jìn)行對比,火山引擎就支持自動AB實驗功能,不需要用戶單獨再創(chuàng)建實例來進(jìn)行對比。
總體來說,火山引擎在開放性、行業(yè)定制、數(shù)據(jù)安全和隱私問題方面都有相關(guān)部署,在業(yè)內(nèi)已算是相當(dāng)成熟的方案。
AB對照測試是火山引擎的一大特點