□ 文/湯代祿 理志強(qiáng) 向小平 袁 然
·國(guó)家新聞出版廣電總局研究項(xiàng)目·
傳媒大數(shù)據(jù)應(yīng)用中的問(wèn)題及思考
□ 文/湯代祿 理志強(qiáng) 向小平 袁 然
近兩年,大數(shù)據(jù)應(yīng)用正在傳媒行業(yè)逐步展開(kāi),從學(xué)界到業(yè)界都在研究和建設(shè)傳媒大數(shù)據(jù),以期作為媒體融合和轉(zhuǎn)型的奠基石。本文基于大眾報(bào)業(yè)集團(tuán)統(tǒng)一大數(shù)據(jù)運(yùn)營(yíng)平臺(tái)的建設(shè)應(yīng)用實(shí)際以及業(yè)界觀察,嘗試找出傳媒大數(shù)據(jù)應(yīng)用模式的突破點(diǎn),并以此思考探索傳媒大數(shù)據(jù)的應(yīng)用模式。
傳媒大數(shù)據(jù) 媒體融合 智能推薦
目前,來(lái)自學(xué)界業(yè)界的觀點(diǎn)和實(shí)踐表明傳媒行業(yè)對(duì)大數(shù)據(jù)重要性的認(rèn)識(shí)已經(jīng)基本達(dá)成共識(shí),并開(kāi)始逐步落地。但如何匯集、挖掘和利用這些大數(shù)據(jù),如何將大數(shù)據(jù)變現(xiàn)等現(xiàn)實(shí)問(wèn)題,都處在探索階段。當(dāng)前大數(shù)據(jù)變現(xiàn)主要有八種商業(yè)模式:大數(shù)據(jù)交易、大數(shù)據(jù)營(yíng)銷、行業(yè)大數(shù)據(jù)運(yùn)營(yíng)、大數(shù)據(jù)征信評(píng)價(jià)、共享經(jīng)濟(jì)、大數(shù)據(jù)咨詢、大數(shù)據(jù)軟件工具開(kāi)發(fā)、數(shù)據(jù)開(kāi)放平臺(tái),但都不是很理想.。[1]為此,筆者希望在建設(shè)大眾報(bào)業(yè)集團(tuán)統(tǒng)一大數(shù)據(jù)運(yùn)營(yíng)平臺(tái)的基礎(chǔ)上,探索研究傳媒大數(shù)據(jù)的應(yīng)用模式。
2015年11月,大眾報(bào)業(yè)集團(tuán)統(tǒng)一大數(shù)據(jù)運(yùn)營(yíng)平臺(tái)建設(shè)啟動(dòng)。平臺(tái)對(duì)接了20多個(gè)管理系統(tǒng),動(dòng)態(tài)匯集各系統(tǒng)中的用戶數(shù)據(jù),包括各媒體的廣告管理系統(tǒng)、發(fā)行管理系統(tǒng)、呼叫中心客戶關(guān)系管理系統(tǒng)等;同時(shí)試點(diǎn)了O2O營(yíng)銷活動(dòng),包括:春節(jié)年貨大集、自媒體峰會(huì)、高考咨詢會(huì)、醫(yī)改高端論壇等。試點(diǎn)中的數(shù)據(jù)匯集方式主要包括:自動(dòng)收集經(jīng)營(yíng)系統(tǒng)的管理數(shù)據(jù);用戶自主提交活動(dòng)報(bào)名數(shù)據(jù);人工錄入收集的傳統(tǒng)數(shù)據(jù)。經(jīng)過(guò)上述嘗試,匯集用戶數(shù)據(jù)近300萬(wàn)條。但這樣的試點(diǎn)推進(jìn)比較緩慢,應(yīng)用效果一直不夠明顯,由此也帶來(lái)越來(lái)越多的困境:
(一)數(shù)據(jù)相關(guān)的責(zé)權(quán)利還沒(méi)有理順。目前眾多數(shù)據(jù)都分布在各媒體的不同部門(mén),大家都認(rèn)識(shí)到各自數(shù)據(jù)的重要性,也有很好的數(shù)據(jù)保護(hù)意識(shí)。當(dāng)面對(duì)一個(gè)新平臺(tái),需要把數(shù)據(jù)匯集到平臺(tái)上時(shí)就產(chǎn)生了顧慮,也就是說(shuō)如何提供數(shù)據(jù),如何利用數(shù)據(jù),如何計(jì)算數(shù)據(jù)貢獻(xiàn),數(shù)據(jù)相關(guān)的責(zé)、權(quán)、利如何落實(shí)到部門(mén)、人員,目前還處于空白狀態(tài),缺乏相關(guān)的制度約束和保證。
(二)有使用數(shù)據(jù)的意識(shí),但沒(méi)有貢獻(xiàn)數(shù)據(jù)的意識(shí)。從幾次O2O的營(yíng)銷活動(dòng)中體會(huì)到,各業(yè)務(wù)部門(mén),希望借助統(tǒng)一大數(shù)據(jù)運(yùn)營(yíng)平臺(tái),吸引更多的用戶參與到營(yíng)銷活動(dòng)中來(lái)。比如在春節(jié)年貨大集營(yíng)銷活動(dòng)前夕,通過(guò)平臺(tái)給選定的5000目標(biāo)用戶發(fā)送邀請(qǐng)信息。但在希望各營(yíng)銷活動(dòng)收集數(shù)據(jù)匯入大數(shù)據(jù)平臺(tái)時(shí),卻沒(méi)有積極性。
(三)還沒(méi)有在營(yíng)銷活動(dòng)中嫁接大數(shù)據(jù)平臺(tái)的意識(shí)?,F(xiàn)在的營(yíng)銷活動(dòng),還主要采用傳統(tǒng)的運(yùn)營(yíng)方式,不太了解如何使用大數(shù)據(jù)平臺(tái),不知道如何將大數(shù)據(jù)平臺(tái)融入營(yíng)銷活動(dòng)。理想的方式是在營(yíng)銷活動(dòng)前期策劃階段,設(shè)計(jì)使用大數(shù)據(jù)平臺(tái)的相關(guān)環(huán)節(jié),收集營(yíng)銷活動(dòng)相關(guān)數(shù)據(jù)。如果能實(shí)現(xiàn)營(yíng)銷活動(dòng)與統(tǒng)一大數(shù)據(jù)平臺(tái)良性對(duì)接,這樣各媒體的營(yíng)銷數(shù)據(jù)會(huì)源源不斷的匯入,反過(guò)來(lái)又會(huì)支撐營(yíng)銷活動(dòng)找到更精準(zhǔn)的用戶群。
為此,不得不另尋他路。我們嘗試把大數(shù)據(jù)平臺(tái)對(duì)接集團(tuán)所屬媒體的手機(jī)客戶端,以便獲取用戶行為數(shù)據(jù),再根據(jù)對(duì)行為數(shù)據(jù)的計(jì)算分析,為用戶提供智能推薦。[2]這樣大數(shù)據(jù)的支撐效果就可以在手機(jī)客戶端上即時(shí)呈現(xiàn)出來(lái)。2016年3月-8月,在大眾日?qǐng)?bào)客戶端“新銳大眾”上開(kāi)發(fā)了“智能推薦”,實(shí)現(xiàn)了用戶行為與后臺(tái)大數(shù)據(jù)平臺(tái)的互動(dòng)。媒體終于找到了自己的用戶,也找到了傳媒大數(shù)據(jù)應(yīng)用的突破點(diǎn)。
目前,“新銳大眾”的智能推薦算法經(jīng)過(guò)多次迭代后為:“推薦”頻道中,以45篇稿件為一組,每次顯示一組,刷新時(shí)顯示另外一組。每組稿件中,21篇稿件是用戶興趣相關(guān)的近3天稿件,9篇是最熱門(mén)的近3天稿件,15篇是最新的稿件?!巴扑]”最上面的稿件可人工干預(yù)設(shè)置,還可以自定義哪些頻道里的稿件可以用于推薦。在實(shí)現(xiàn)這樣的推薦算法中,還采用了稿件內(nèi)容相似度比對(duì)的算法,通過(guò)對(duì)稿件標(biāo)題、摘要、內(nèi)容的關(guān)鍵字進(jìn)行匹配比對(duì),計(jì)算出每篇稿件與用戶興趣稿件的相似度,然后依據(jù)相似度向用戶進(jìn)行推薦。在進(jìn)行關(guān)鍵字匹配過(guò)程中,系統(tǒng)還采用了根據(jù)語(yǔ)義自動(dòng)提取文章關(guān)鍵詞的相關(guān)技術(shù)。
2016年9月-12月,山東省互聯(lián)網(wǎng)傳媒集團(tuán)的“山東24小時(shí)”,《半島都市報(bào)》的“半島”,《生活日?qǐng)?bào)》的“愛(ài)生活”客戶端產(chǎn)品都逐步接入了統(tǒng)一大數(shù)據(jù)運(yùn)營(yíng)平臺(tái)。這樣千余萬(wàn)用戶每天超過(guò)百萬(wàn)條的行為數(shù)據(jù)源源不斷地匯入大數(shù)據(jù)平臺(tái),截至2017年3月,已經(jīng)匯集近1.4億用戶行為數(shù)據(jù)。智能推薦系統(tǒng)再基于這些大數(shù)據(jù)進(jìn)行計(jì)算和推薦,逐步實(shí)現(xiàn)內(nèi)容、電商、服務(wù)、生活等方面的推薦。借助統(tǒng)一大數(shù)據(jù)平臺(tái),各客戶端產(chǎn)品之間就可以優(yōu)勢(shì)互補(bǔ),形成合力,大大提升傳媒集團(tuán)整個(gè)新媒體陣營(yíng)的影響力和競(jìng)爭(zhēng)力。
□ 本文作者(前排右二)帶領(lǐng)的技術(shù)團(tuán)隊(duì)在傳媒大數(shù)據(jù)線下?tīng)I(yíng)銷活動(dòng)試點(diǎn)現(xiàn)場(chǎng)。
有了大數(shù)據(jù)的匯集與積淀,傳媒大數(shù)據(jù)的挖掘利用是接下來(lái)的重要工作。目前國(guó)內(nèi)從學(xué)界到業(yè)界也都在探索大數(shù)據(jù)的應(yīng)用模式。在找到突破口之后,接下來(lái)就是應(yīng)用模式的探索。
(一)構(gòu)建傳媒大數(shù)據(jù)資產(chǎn)。這里說(shuō)的大數(shù)據(jù)資產(chǎn),指的是通過(guò)匯集傳媒集團(tuán)范圍內(nèi)各媒體的內(nèi)容數(shù)據(jù)、用戶數(shù)據(jù)、行為數(shù)據(jù),形成一個(gè)統(tǒng)一的數(shù)據(jù)資源池,進(jìn)而為后面大數(shù)據(jù)的分析挖掘提供基礎(chǔ)。同時(shí),將這些數(shù)據(jù),以資產(chǎn)的方式構(gòu)建、管理,形成數(shù)據(jù)資產(chǎn)。這些資產(chǎn)相當(dāng)于數(shù)字化的生產(chǎn)原料,可以用于生產(chǎn)各式各樣的數(shù)字產(chǎn)品,派生各種各樣的服務(wù)。傳媒大數(shù)據(jù)資產(chǎn)構(gòu)建起來(lái)之后,則會(huì)豐富傳媒集團(tuán)的資產(chǎn)形態(tài)。
(二)提供大數(shù)據(jù)服務(wù)。為用戶提供新聞信息,是一種服務(wù)。而現(xiàn)實(shí)生活中,服務(wù)的需求無(wú)處不在。大數(shù)據(jù)的價(jià)值之一就是通過(guò)數(shù)據(jù)分析,把海量用戶的真實(shí)需求,分門(mén)別類地挖掘出來(lái)。然后,針對(duì)這些需求提供精準(zhǔn)服務(wù),滿足用戶需求,解決用戶痛點(diǎn),讓用戶愿意為服務(wù)買(mǎi)單,通過(guò)服務(wù)實(shí)現(xiàn)大數(shù)據(jù)的變現(xiàn)。另一方面,通過(guò)大數(shù)據(jù)的分析挖掘,為用戶提供專業(yè)的大數(shù)據(jù)成果信息,為用戶的生產(chǎn)經(jīng)營(yíng)、學(xué)習(xí)研究等提供決策依據(jù)。
(三)打造大數(shù)據(jù)產(chǎn)品。在傳媒集團(tuán)統(tǒng)一大數(shù)據(jù)平臺(tái)提取用戶數(shù)據(jù)和行為數(shù)據(jù),通過(guò)行為數(shù)據(jù)繪制用戶畫(huà)像,通過(guò)用戶畫(huà)像提取特定用戶群,形成具有同類興趣愛(ài)好的用戶數(shù)據(jù)產(chǎn)品;提取內(nèi)容數(shù)據(jù),通過(guò)環(huán)比時(shí)段、同比時(shí)段、垂直領(lǐng)域、不同媒體等多維度匯集分析,形成內(nèi)容數(shù)據(jù)產(chǎn)品。將這些大數(shù)據(jù)產(chǎn)品用于傳媒集團(tuán)各媒體的運(yùn)營(yíng),提升營(yíng)銷的精準(zhǔn)率。比如設(shè)計(jì)生產(chǎn)“健康用戶大數(shù)據(jù)產(chǎn)品”“旅游用戶大數(shù)據(jù)產(chǎn)品”“教育用戶大數(shù)據(jù)產(chǎn)品”。大數(shù)據(jù)產(chǎn)品在各媒體單位不斷使用過(guò)程中,再不斷匯集新的數(shù)據(jù),進(jìn)而形成良性循環(huán)。
(四)打磨大數(shù)據(jù)新聞。統(tǒng)一大數(shù)據(jù)平臺(tái)可以匯集傳媒集團(tuán)自采新聞稿件以及互聯(lián)網(wǎng)中主要新聞來(lái)源的稿件,形成海量新聞信息匯集庫(kù)。基于這些海量新聞數(shù)據(jù),可以對(duì)內(nèi)容進(jìn)行動(dòng)態(tài)監(jiān)測(cè)和挖掘,形成新聞熱點(diǎn),用戶興趣點(diǎn)等,一方面輔助新聞選題,另一方面根據(jù)挖掘結(jié)果形成大數(shù)據(jù)新聞。
(五)對(duì)接政務(wù)大數(shù)據(jù)。2015年9月國(guó)務(wù)院發(fā)布了《關(guān)于印發(fā)促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要的通知》(國(guó)發(fā)[2015]50號(hào)),隨后各省陸續(xù)出臺(tái)相關(guān)配套政策,各政府部門(mén)將在大數(shù)據(jù)的建設(shè)、應(yīng)用等方面逐步推開(kāi)。2016年9月,廣東省大數(shù)據(jù)管理局與南方報(bào)業(yè)傳媒集團(tuán)簽訂了促進(jìn)大數(shù)據(jù)發(fā)展的合作協(xié)議,致力于促進(jìn)大數(shù)據(jù)領(lǐng)域的宣傳、應(yīng)用和產(chǎn)業(yè)研究,共同落實(shí)4月份廣東省出臺(tái)的《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)計(jì)劃(2016-2020年)》(粵府辦[2016]29號(hào))。[3]2016年10月,山東省政府印發(fā)了《關(guān)于促進(jìn)大數(shù)據(jù)發(fā)展的意見(jiàn)》(魯政發(fā)[2016]25號(hào)),指出要“強(qiáng)化大數(shù)據(jù)對(duì)政府治理、經(jīng)濟(jì)轉(zhuǎn)型、社會(huì)服務(wù)的支撐”。為此,作為信息內(nèi)容的生產(chǎn)商和服務(wù)提供商,傳媒集團(tuán)應(yīng)該抓住這樣的發(fā)展機(jī)遇,積極與各政府部門(mén)對(duì)接,實(shí)現(xiàn)權(quán)威政務(wù)大數(shù)據(jù)的接入,進(jìn)一步鞏固傳媒集團(tuán)作為黨媒、作為信息內(nèi)容生產(chǎn)者的主流地位。
(六)構(gòu)建智慧城市信息服務(wù)平臺(tái)。大數(shù)據(jù)的匯集,是智能服務(wù)的基礎(chǔ)。傳媒集團(tuán)統(tǒng)一大數(shù)據(jù)平臺(tái)上有了傳媒集團(tuán)各媒體的內(nèi)容數(shù)據(jù)、用戶數(shù)據(jù)、行為數(shù)據(jù),再匯集權(quán)威政務(wù)大數(shù)據(jù),對(duì)下一步的智慧城市的智能服務(wù),就奠定了基礎(chǔ)。通過(guò)結(jié)合政務(wù)大數(shù)據(jù)的聯(lián)合分析挖掘,對(duì)傳媒集團(tuán)用戶提供更加精準(zhǔn)的智能服務(wù)將成為可能。智能服務(wù)會(huì)不斷提升用戶使用體驗(yàn),進(jìn)而不斷吸引用戶,穩(wěn)固用戶。由此,基于傳媒大數(shù)據(jù),通過(guò)不斷完善智慧城市服務(wù)功能,建設(shè)完善智慧城市信息服務(wù)平臺(tái)成為可能,由此也可以實(shí)現(xiàn)傳媒集團(tuán)經(jīng)營(yíng)的轉(zhuǎn)變。
(七)構(gòu)建用戶個(gè)人信用服務(wù)平臺(tái)。用戶行為大數(shù)據(jù)的一個(gè)熱點(diǎn)應(yīng)用領(lǐng)域,就是用戶個(gè)人信用評(píng)價(jià)。簡(jiǎn)而言之就是通過(guò)用戶的行為數(shù)據(jù)分析,了解該用戶的信用情況,并將其作為提供服務(wù)的依據(jù)。比如信用好的用戶,可以提供更高額度的貸款,可以放心錄用為企業(yè)員工等。目前,有業(yè)內(nèi)人士預(yù)測(cè)國(guó)內(nèi)該領(lǐng)域市場(chǎng)規(guī)模將達(dá)千億元。眾多互聯(lián)網(wǎng)企業(yè)都紛紛涉足其中,但央行一直在不斷完善監(jiān)管規(guī)則,由此可以看出央行的顧慮。在這樣的情況下,對(duì)黨媒集團(tuán)來(lái)說(shuō)應(yīng)該是個(gè)好機(jī)會(huì)。
(八)構(gòu)建大數(shù)據(jù)交易平臺(tái)。2016年9月,浙報(bào)傳媒投資建設(shè)的浙江大數(shù)據(jù)交易中心上線。該中心是浙江省唯一由省政府批準(zhǔn)的大數(shù)據(jù)交易中心,致力于打造具有公信力、開(kāi)放、客觀、獨(dú)立的全國(guó)第三方數(shù)據(jù)交易中心。[4]這也是落實(shí)浙江省3月發(fā)布的《浙江省促進(jìn)大數(shù)據(jù)發(fā)展實(shí)施計(jì)劃》的重要舉措。浙報(bào)的這種做法,是為大數(shù)據(jù)交易各方搭平臺(tái),按照平臺(tái)經(jīng)濟(jì)的思維在大數(shù)據(jù)中淘金。
(一)設(shè)計(jì)大數(shù)據(jù)制度。傳媒大數(shù)據(jù)在傳媒集團(tuán)的應(yīng)用過(guò)程中,所涉及的責(zé)權(quán)利理順,需要有相關(guān)的制度保障,以解決各部門(mén)、單位在數(shù)據(jù)的安全、貢獻(xiàn)、使用等方面的內(nèi)在訴求。在進(jìn)行制度設(shè)計(jì)時(shí),考慮借助量化的方法實(shí)現(xiàn)各部門(mén)單位對(duì)數(shù)據(jù)的貢獻(xiàn)和使用的計(jì)量,考慮通過(guò)不同權(quán)限的設(shè)定和審批流程來(lái)解決數(shù)據(jù)安全問(wèn)題,考慮使用脫敏技術(shù)來(lái)解決敏感數(shù)據(jù)和數(shù)據(jù)用戶隱私問(wèn)題。因此制度的設(shè)計(jì)充分考慮各方訴求和平臺(tái)的技術(shù)功能,形成傳媒大數(shù)據(jù)可行有效的管理制度。
(二)融入采編業(yè)務(wù)。傳媒大數(shù)據(jù)的提出和應(yīng)用,是傳媒產(chǎn)業(yè)發(fā)展到現(xiàn)階段的自然內(nèi)在需求,也是傳統(tǒng)媒體與新興網(wǎng)絡(luò)媒體的重要差異所在。因此,傳媒大數(shù)據(jù)在應(yīng)用上,需要與傳媒的核心采編業(yè)務(wù)進(jìn)行深度融合,才能實(shí)現(xiàn)發(fā)揮傳媒大數(shù)據(jù)中的傳媒屬性,也可以促使傳統(tǒng)媒體實(shí)現(xiàn)轉(zhuǎn)變轉(zhuǎn)型。
(三)設(shè)立研究實(shí)驗(yàn)室。傳媒大數(shù)據(jù)是伴隨著媒體融合的發(fā)展和國(guó)家大數(shù)據(jù)戰(zhàn)略的提出而逐步產(chǎn)生的新領(lǐng)域。因此,需要傳媒領(lǐng)域的產(chǎn)學(xué)研相關(guān)人員以及大數(shù)據(jù)相關(guān)領(lǐng)域的產(chǎn)學(xué)研相關(guān)人員,共同組建產(chǎn)學(xué)研的相關(guān)團(tuán)隊(duì)和組織,進(jìn)行聯(lián)合研究攻關(guān),聯(lián)合推廣應(yīng)用。因此,組建傳媒大數(shù)據(jù)聯(lián)合實(shí)驗(yàn)室是一個(gè)不錯(cuò)的組織選擇。誰(shuí)的需求更迫切,誰(shuí)就可以出面來(lái)組織這樣的組織。國(guó)家業(yè)務(wù)主管部門(mén)、產(chǎn)業(yè)中的媒體集團(tuán),更有這樣的迫切性。
在不久的將來(lái),可以將來(lái)自于各處的傳感器、智能終端、監(jiān)控?cái)z像頭、無(wú)人機(jī)拍攝的信息接入大數(shù)據(jù)平臺(tái),實(shí)現(xiàn)更加全面的數(shù)據(jù)分析,形成更加智能的分析結(jié)果。有了傳媒大數(shù)據(jù)的積淀和挖掘,再整合各類行政資源、社會(huì)資源,傳統(tǒng)的傳媒集團(tuán)將逐漸從信息服務(wù)提供者逐步向智能服務(wù)提供者轉(zhuǎn)變。傳媒大數(shù)據(jù),是媒體融合轉(zhuǎn)型的基石,也是智慧媒體的必由之路。傳媒大數(shù)據(jù)的深度應(yīng)用,或許就是傳統(tǒng)媒體獲取新生的制勝法寶。(作者單位:大眾報(bào)業(yè)集團(tuán)(大眾日?qǐng)?bào)社);本文是國(guó)家新聞出版廣電總局重大工程《國(guó)家數(shù)字復(fù)合出版系統(tǒng)工程應(yīng)用試點(diǎn)》項(xiàng)目<項(xiàng)目編號(hào)XWCB-ZDKJ-FHCB/ SD-47>的階段性研究成果。)
【注釋】
[1]孫奇茹.人類正從IT時(shí)代走向DT時(shí)代[N].北京日?qǐng)?bào),2014-3-3:11.
[2]趙新樂(lè).人民日?qǐng)?bào)“中央廚房”:探秘?cái)?shù)據(jù)新聞大餐“烹制”之法[N].中國(guó)新聞出版廣電報(bào),2016-8-9:5.
[3]宮魁,湯代祿,賈立平.做媒體融合的“千里眼”和“順風(fēng)耳”[N].青年記者.2016(2)
[4]國(guó)家信息中心,南海大數(shù)據(jù)應(yīng)用研究院.中國(guó)大數(shù)據(jù)發(fā)展報(bào)告(2017).2017-2-26.
[5]湯代祿.大眾報(bào)業(yè)集團(tuán)的移動(dòng)互聯(lián)網(wǎng)實(shí)踐與思考[N].中國(guó)記者.2015(11).
[6]余元鋒 吳偉洪.廣東省大數(shù)據(jù)管理局與南方報(bào)業(yè)簽訂戰(zhàn)略合作協(xié)議[N].南方網(wǎng).2016-10-21.
[7]袁華明 張潘麗.浙江大數(shù)據(jù)交易中心上線首日迎來(lái)首批4筆交易[N].浙江在線-浙江日?qǐng)?bào).2016-9-27.
編 輯 梁益暢 46266875@qq.com