摘要:在數(shù)字技術(shù)變革的背景下,商業(yè)銀行數(shù)字化經(jīng)營逐漸擴大應(yīng)用范圍,競爭進入深水區(qū)。用好大數(shù)據(jù)資源,成為贏得經(jīng)營競爭的關(guān)鍵。本文以非結(jié)構(gòu)化數(shù)據(jù)分析為切入點,通過焦點問題發(fā)現(xiàn)、商機洞察挖掘等方法,分析非結(jié)構(gòu)化數(shù)據(jù)分析應(yīng)用中存在問題,提出非結(jié)構(gòu)化數(shù)據(jù)分析應(yīng)用建議,為后續(xù)非結(jié)構(gòu)化數(shù)據(jù)的全面運用提供可行模式。
關(guān)鍵詞:大數(shù)據(jù);非結(jié)構(gòu)化數(shù)據(jù);案例分析
DOI:10.12433/zgkjtz.20241518
2015年,國務(wù)院印發(fā)《促進大數(shù)據(jù)發(fā)展行動綱要》,系統(tǒng)部署大數(shù)據(jù)發(fā)展工作。2022年,中國人民銀行印發(fā)《金融科技發(fā)展規(guī)劃(2022—2025年)》,提出強化金融科技治理,全面塑造數(shù)字化能力;深化數(shù)字技術(shù)金融應(yīng)用等八個方面的重點任務(wù),銀行業(yè)數(shù)字技術(shù)應(yīng)用已經(jīng)被提升到金融供給側(cè)結(jié)構(gòu)性改革抓手的政治高度。能否用好大數(shù)據(jù),實現(xiàn)經(jīng)營、管理和服務(wù)的創(chuàng)新,將影響未來銀行的可持續(xù)發(fā)展。商業(yè)銀行大數(shù)據(jù)分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。以客戶基本信息、交易流水信息等為主要內(nèi)容的結(jié)構(gòu)化數(shù)據(jù)在商業(yè)銀行數(shù)字化經(jīng)營中已經(jīng)得到廣泛的應(yīng)用,而非結(jié)構(gòu)化數(shù)據(jù)還處于應(yīng)用階段。
一、非結(jié)構(gòu)化數(shù)據(jù)概述
(一)非結(jié)構(gòu)化數(shù)據(jù)的內(nèi)涵
非結(jié)構(gòu)化數(shù)據(jù)是數(shù)據(jù)結(jié)構(gòu)不規(guī)則或不完整,沒有預(yù)定義的數(shù)據(jù)模型,不便用數(shù)據(jù)庫二維邏輯來表現(xiàn)的數(shù)據(jù)。包括所有格式的辦公文檔、文本、圖片、HTML、各類報表、圖像和音頻/視頻信息等。根據(jù)IDC的一項調(diào)查報告,企業(yè)中80%的數(shù)據(jù)都是非結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)每年都以指數(shù)增長60%,使得非結(jié)構(gòu)化數(shù)據(jù)成為商業(yè)銀行重要的數(shù)據(jù)資源,用好非結(jié)構(gòu)化數(shù)據(jù),找準客戶痛點、流程斷點,推動產(chǎn)品、服務(wù)和系統(tǒng)針對性改進,改善客戶體驗,進一步提升數(shù)字化經(jīng)營精準度,將有效增強商業(yè)銀行數(shù)字化經(jīng)營的競爭優(yōu)勢。商業(yè)銀行的非結(jié)構(gòu)化數(shù)據(jù)主要來源于客戶動態(tài)瀏覽路徑、社交網(wǎng)絡(luò)留言和客服交互數(shù)據(jù)等。其中,客服交互數(shù)據(jù)由客服數(shù)據(jù)(包括智能客服數(shù)據(jù)、在線人工客服數(shù)據(jù)、電話客服數(shù)據(jù)和短信交互數(shù)據(jù)等)和工單數(shù)據(jù)構(gòu)成。本文選擇客服交互數(shù)據(jù)探索商業(yè)銀行非結(jié)構(gòu)化數(shù)據(jù)分析應(yīng)用路徑。
(二)非結(jié)構(gòu)化數(shù)據(jù)的特點
1.形式多樣性
非結(jié)構(gòu)化數(shù)據(jù)可以采取多種形式,包括文本、圖像、音頻、視頻和其他。這些形式具有高度多樣性,例如,文本包含各種語言和主題,圖像包含各種物體和場景,音頻包含各種聲音。
2.缺乏表格結(jié)構(gòu)
與結(jié)構(gòu)化數(shù)據(jù)(如數(shù)據(jù)庫中的表格)不同,非結(jié)構(gòu)化數(shù)據(jù)不容易以行和列的結(jié)構(gòu)進行組織。例如,在文本數(shù)據(jù)中,句子和段落沒有明確的字段,圖像中的像素不以表格形式存在,這使得數(shù)據(jù)的組織和管理更為復(fù)雜。
3.大容量
非結(jié)構(gòu)化數(shù)據(jù)通常以大量的方式存在。社交媒體上的用戶生成內(nèi)容、衛(wèi)星圖像、傳感器數(shù)據(jù)、醫(yī)療記錄、音頻記錄等都可以是非結(jié)構(gòu)化數(shù)據(jù)。這些數(shù)據(jù)快速積累,因此需要強大的存儲和處理能力。
4.信息隱藏
非結(jié)構(gòu)化數(shù)據(jù)中包含著豐富的信息,但信息通常散布在大量數(shù)據(jù)中。例如,一篇文章中包含重要事實和觀點,但它們不一定以明顯的方式呈現(xiàn)。因此,從非結(jié)構(gòu)化數(shù)據(jù)中提取信息需要高級的數(shù)據(jù)分析和挖掘技術(shù)。
二、選擇客服交互數(shù)據(jù)作為分析對象的原因
一是涉及的問題較為復(fù)雜。一般情況下,客戶的咨詢問題首先會交由智能客服,簡單問題由智能客服解答,智能客服無法解答的問題會轉(zhuǎn)為人工客服處理,而人工客服也無法處理的問題會生成工單。在線人工客服和工單涉及的問題大部分較為復(fù)雜。
二是問題定位準確??蛻糇稍冊诰€客服時,在線客服通常會與客戶產(chǎn)生多輪交互,能夠準確了解客戶有哪些問題,存在哪些需求,工單也詳細描述了客戶的問題和訴求。
三是隱藏的價值較高??蛻粼谟龅綇?fù)雜問題時,是隱藏著深入需求的,對這方面需求的分析,可以從中獲得有用的信息資源,帶來額外的價值。
三、非結(jié)構(gòu)化數(shù)據(jù)應(yīng)用案例
非結(jié)構(gòu)化數(shù)據(jù)分析應(yīng)用是系統(tǒng)性工程,如何全面、深入、妥當(dāng)?shù)姆治鲞\用,需要長期探索,形成完善的方法論和實踐模式,也需要目標(biāo)明確的試點推進。在探索試點階段,中國建設(shè)銀行采取焦點問題發(fā)現(xiàn)、商機洞察挖掘等分析方法,旨在與結(jié)構(gòu)化數(shù)據(jù)分析相融合,將分析結(jié)果應(yīng)用于數(shù)字化經(jīng)營實踐,進一步改善用戶體驗,增強銀行的競爭力。
(一)焦點問題發(fā)現(xiàn)
1.信用卡產(chǎn)品功能優(yōu)化分析
銀行遠銀中心客戶來電咨詢信息顯示各類業(yè)務(wù)中,客戶咨詢信用卡業(yè)務(wù)占比最高(如圖1所示),涉及內(nèi)容包含信用卡申請、信用卡賬單、每月還款、調(diào)整額度、信用卡分期等方面。
一是將在線人工客服數(shù)據(jù)和工單數(shù)據(jù)接入大數(shù)據(jù)工作平臺,通過系統(tǒng)分析,生成熱詞表,根據(jù)熱度挑選與業(yè)務(wù)相關(guān)且熱度較高的詞,如還款、申請、額度、辦理、賬單、查詢等進行人工分析,對文本進行回溯,查找問題,歸納總結(jié)形成熱點問題表,從熱點問題表中發(fā)現(xiàn)焦點問題包括信用卡賬單看不懂、對賬單有異議、信用卡消費后無短信通知、信用卡額度調(diào)整等。
二是將焦點問題進行定位、分析、驗證、判斷。
三是對于用戶咨詢量大但是沒有明確原因或者解決方案的問題,采取可行性研究的方法深入分析原因,推動問題解決。例如,客戶反饋忘記手機銀行密碼不知道怎么辦,用可用性研究發(fā)現(xiàn)手機銀行端已經(jīng)部署了這一功能,但是因為部署位置不明顯影響客戶使用,優(yōu)化忘記密碼的顯示位置后問題得到解決。
四是通過銀行內(nèi)部相關(guān)部門專題會議的方式,協(xié)同多部門資源,共同推動焦點問題的解決。
五是對上線產(chǎn)品和功能的客戶反饋進行監(jiān)測,發(fā)現(xiàn)改進機會,進行產(chǎn)品和流程優(yōu)化,解決焦點問題。經(jīng)過數(shù)據(jù)分析,業(yè)務(wù)部門進一步優(yōu)化產(chǎn)品功能,增加信用卡交易提醒、還款短信提醒、客戶主動調(diào)整永久額度等功能,問題的有效解決使客戶咨詢量下降40%。通過問題發(fā)現(xiàn)、驗證判斷、可用性研究、問題解決和持續(xù)監(jiān)測,打造用戶體驗閉環(huán)流程,客戶從優(yōu)化后的服務(wù)中滿足需求,客戶體驗得到改善??蛻魜黼娮稍儤I(yè)務(wù)分類如圖1所示。
2.存量首套住房貸款利率調(diào)整
2023年8月31日,國家金融監(jiān)督管理總局發(fā)布《關(guān)于降低存量首套住房貸款利率有關(guān)事項的通知》,9月25日起,銀行下調(diào)存量首套住房商業(yè)性個人住房貸款利率水平。9月7日,工、農(nóng)、中、建四大國有銀行分別發(fā)布公告,明確存量首套住房貸款利率調(diào)整有關(guān)事項,對調(diào)整范圍、調(diào)整后的利率水平、調(diào)整方式等進行解答。9月4日至9月17日期間,存量房貸利率下調(diào)成為全行咨詢熱點。
9月7日當(dāng)日,在線人工客服渠道存量首套住房貸款利率調(diào)整客戶咨詢量在綜合銀行業(yè)務(wù)中占比達到20%,客戶咨詢的熱點問題包括:利率將調(diào)整至什么水平、利率調(diào)整是否需客戶提交申請、客戶房貸是否滿足首套住房政策等。
中國建設(shè)銀行遠銀中心協(xié)同業(yè)務(wù)部門打通全國一級分行個人住房貸款“快處”智聯(lián)通道,新增存量房貸利率調(diào)整“快處”場景,明確受理范圍,推動客戶問題及時解決。持續(xù)通過“中國建設(shè)銀行客戶服務(wù)”微信公眾號答疑解惑,發(fā)布《存量住房貸款利率調(diào)整客戶問答》,七天閱讀量近125萬人次,分享16.8萬次,得到客戶廣泛關(guān)注。運用智能服務(wù)工具,在線客服渠道新增11個存量房貸利率調(diào)整微場景,將客戶公告、“建行客服”客戶問答圖文發(fā)布在智能機器人答案中,相關(guān)場景日均出發(fā)量約7萬次;同時在電話客服渠道新增“存量首套住房貸款利率調(diào)整政策咨詢”等智能導(dǎo)航場景問答,同步優(yōu)化“個人貸款”“商業(yè)貸款利率查詢”等存量導(dǎo)航場景答案,提升服務(wù)效率,觸發(fā)量約20萬次。
(二)商機洞察挖掘
以客戶營銷為例,結(jié)合非結(jié)構(gòu)化數(shù)據(jù)的特點,引入數(shù)據(jù)分析挖掘工具,分析客戶應(yīng)用場景,挖掘客戶在特定應(yīng)用場景下的需求,融合客戶基本信息、客戶交易流水、客戶風(fēng)險評分等結(jié)構(gòu)化數(shù)據(jù)對客戶360°畫像,運用數(shù)據(jù)分析模型,及時預(yù)測客戶需求,精準識別營銷機會,疊加現(xiàn)有的營銷資源產(chǎn)生話術(shù),通過合適的渠道推送給客戶,完成商機洞察和營銷推送的過程。目前,銀行已經(jīng)構(gòu)建熱點問題分析、來電原因分類分析、投訴升級預(yù)測分析、智能推薦一系列挖掘分析模型,從而洞悉客戶心聲、預(yù)測客戶需求,為優(yōu)化業(yè)務(wù)運營、提升業(yè)務(wù)效益服務(wù)。
在選擇12家分行試點應(yīng)用期間,通過商機洞察挖掘,營銷客戶251萬人次,其中響應(yīng)客戶49萬人次,客戶響應(yīng)率達到20%,試點應(yīng)用推廣效果良好。同時,商機洞察挖掘也開拓了線上獲客新渠道,試點期間累計獲新客戶1439人,客戶自助簽約率達到75%;有效激活喚醒零登錄客戶,成功營銷客戶7795人,客戶累計響應(yīng)登錄次數(shù)達43921次;有效促進非活躍客戶向活躍轉(zhuǎn)化,3844名客戶轉(zhuǎn)化為手機銀行活躍客戶,轉(zhuǎn)化率達30%。同時以打標(biāo)簽的方式將客戶商機按照不同的頻率精準推送給網(wǎng)點,成功營銷客戶31.59萬人,整體營銷成功率達30%,有效提升客戶黏性。
例如,ETC業(yè)務(wù)中將咨詢客戶標(biāo)注為車主客群,通過細化客戶在賬單查詢、注銷環(huán)節(jié)、使用環(huán)節(jié)、開通環(huán)節(jié)等階段反饋的問題,分析產(chǎn)品和流程優(yōu)化策略,進一步挖掘客戶在洗車、養(yǎng)護、購車、保險等方面的商機。同樣針對車主客群,運用深度機器學(xué)習(xí)技術(shù),對客戶行駛證圖像數(shù)據(jù)進行自動識別分析,獲取客戶的購車日期、車型等信息,精準定位客戶車型續(xù)保時點,預(yù)測客戶換車需求,驅(qū)動車險、購車分期等信用卡產(chǎn)品精準化營銷。
(三)客戶風(fēng)險控制分析
以信用卡業(yè)務(wù)為例,選取6期內(nèi)有連續(xù)3期以上逾期記錄為目標(biāo)風(fēng)險客戶,綜合多種客戶認知標(biāo)簽,結(jié)合客戶資質(zhì)、信用情況、消費行為等多維度表現(xiàn),采用大數(shù)據(jù)算法,挖掘風(fēng)險客戶特征,批量化識別篩選出風(fēng)險客戶進行排查,對高風(fēng)險客戶采取降額、??ǖ裙芸卮胧行Э刂骑L(fēng)險敞口,減少不良損失。在非結(jié)構(gòu)化數(shù)據(jù)分析的基礎(chǔ)上,融合客戶交易流水等結(jié)構(gòu)化數(shù)據(jù),建立并改進客戶的信用評價和風(fēng)險預(yù)警模型,判斷客戶風(fēng)險程度,實現(xiàn)風(fēng)險客戶的“早發(fā)現(xiàn)、早排查、早管控”。
中國建設(shè)銀行建立外部數(shù)據(jù)資源統(tǒng)一引入和共享機制,數(shù)據(jù)倉庫在集成行內(nèi)125個系統(tǒng)數(shù)據(jù)的基礎(chǔ)上,引入業(yè)務(wù)場景需要的工商、法律、海關(guān)、中經(jīng)網(wǎng)等外部數(shù)據(jù),實現(xiàn)企業(yè)級數(shù)據(jù)全面共享。以客戶開戶為例,在開戶信息核查環(huán)節(jié),新一代核心系統(tǒng)開戶組件聯(lián)動外部數(shù)據(jù),對客戶手機號碼信息進行驗證,提示是否實名、是否在網(wǎng)等信息;同時展示風(fēng)險信息,提示當(dāng)月開銷戶情況、司法凍結(jié)情況、是否命中風(fēng)險客戶名單等,協(xié)助網(wǎng)點在開戶時判斷風(fēng)險,從開戶前端有效防控。
四、非結(jié)構(gòu)化數(shù)據(jù)分析難點
(一)分析成本高
一是非結(jié)構(gòu)化數(shù)據(jù)體量大且形式多樣,從海量數(shù)據(jù)中篩選并處理重要信息的難度較大;二是在新興業(yè)務(wù)、小眾業(yè)務(wù)、復(fù)雜業(yè)務(wù),以及方言表達、客戶情緒化表達等方面,語音轉(zhuǎn)譯準確度還存在明顯短板,亟需進一步提升;三是目前來電無法實現(xiàn)全量實時轉(zhuǎn)譯,平均轉(zhuǎn)譯率不足50%。
(二)智能化自學(xué)習(xí)不足
一是在識別準確度方面,客戶問題洞察識別準確性不足;二是在智能細分時效性方面,對新業(yè)務(wù)或者其他未分類業(yè)務(wù)快速細分的時效性不足。
(三)數(shù)據(jù)質(zhì)量問題
金融業(yè)在缺乏統(tǒng)一的金融數(shù)據(jù)治理體系下,部分金融機構(gòu)面臨著數(shù)據(jù)質(zhì)量不高,采集或者整理數(shù)據(jù)時存在操作不科學(xué)、不規(guī)范等問題,會導(dǎo)致分析結(jié)果不準確,需要進行數(shù)據(jù)清洗和校準。
(四)數(shù)據(jù)隱私和安全
銀行儲存著大量客戶數(shù)據(jù),包括個人身份信息、交易記錄、資產(chǎn)情況等敏感信息,數(shù)據(jù)容易成為黑客攻擊和惡意操作的目標(biāo)。數(shù)據(jù)安全問題不僅會對客戶造成重大影響,還會損害銀行的聲譽和信譽。
(五)多源數(shù)據(jù)整合
銀行通常有多個數(shù)據(jù)源,包括核心銀行系統(tǒng)、互聯(lián)網(wǎng)銀行、移動應(yīng)用、社交媒體等。將這些不同源頭的數(shù)據(jù)整合起來以獲取全面的信息是一個復(fù)雜的任務(wù)。
(六)實時處理
銀行需要及時響應(yīng)市場變化和客戶需求,因此能夠?qū)崟r分析非結(jié)構(gòu)化數(shù)據(jù)以支持決策和風(fēng)險管理。
五、非結(jié)構(gòu)化數(shù)據(jù)分析建議
(一)升級文本數(shù)據(jù)分析工具,提升數(shù)據(jù)分析能力
一是全面運用自然語言處理和機器深度學(xué)習(xí)技術(shù),實現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)的建模分析,以及模型的自我調(diào)優(yōu);探索將大模型應(yīng)用于客服交互場景,準確理解和獲取關(guān)鍵信息,并根據(jù)任務(wù)需求進行分析和處理。
二是以自然語言模型為基礎(chǔ),構(gòu)建起包括客戶標(biāo)簽、渠道標(biāo)簽、產(chǎn)品標(biāo)簽、業(yè)務(wù)行為標(biāo)簽等在內(nèi)的全維度標(biāo)簽體系,并支持標(biāo)簽多維分析和交叉分析,全面提升客戶分析的精細度。
三是打通個人客戶信息組件相關(guān)數(shù)據(jù)的運用壁壘,通過對個人客戶標(biāo)簽的聯(lián)動運用,全面提升客戶分析的針對性。
(二)突破語音轉(zhuǎn)譯能力瓶頸,夯實分析工作基礎(chǔ)
一是突破目前不足50%的語音轉(zhuǎn)譯比例瓶頸,實現(xiàn)客戶來電的全量轉(zhuǎn)譯和實時轉(zhuǎn)譯,夯實分析基礎(chǔ)。
二是研發(fā)語音轉(zhuǎn)譯文本的自主、實時調(diào)優(yōu)校準工具,不斷提升系統(tǒng)的語音轉(zhuǎn)譯準確率。
三是融合客戶問題資源管理平臺和語音分析平臺,實現(xiàn)語音轉(zhuǎn)譯數(shù)據(jù)的復(fù)用;進一步接入官方網(wǎng)站、企業(yè)微信號、手機銀行等渠道的在線客服服務(wù)記錄,提升數(shù)據(jù)的全面性。
(三)打造客戶分析人才梯隊,聚焦數(shù)字化經(jīng)營賦能
一是加大分析人才培育力度,加強有大數(shù)據(jù)相關(guān)專業(yè)背景、數(shù)字化工作經(jīng)驗的人才儲備。
二是聚焦手機APP、數(shù)字人民幣等重點工具或產(chǎn)品,建立適應(yīng)“敏捷”和“全面”兩個報告維度的分析師、建模師隊伍,實現(xiàn)數(shù)字化經(jīng)營賦能的“軟件”升級。
(四)明確數(shù)據(jù)的權(quán)利界定,保持數(shù)據(jù)分析合規(guī)性
一是尊重客戶數(shù)據(jù)權(quán)利,規(guī)定數(shù)據(jù)采集、使用和保護的寬度和深度,并對數(shù)據(jù)采取適當(dāng)?shù)臄?shù)據(jù)脫敏和保護措施。二是與法律和合規(guī)團隊密切合作,以確保數(shù)據(jù)分析活動合法合規(guī)。
(五)推動數(shù)據(jù)資源共享,提升金融服務(wù)效率
通過技術(shù)手段解決數(shù)據(jù)共享的安全問題,實現(xiàn)信息的可追溯和不可篡改,打通多渠道的信息交互通道,將數(shù)據(jù)分析成果對接到應(yīng)用組件、短信平臺、微信公眾號,推動數(shù)據(jù)共享,減少資源浪費。
(六)增加數(shù)據(jù)可視化分析工具,助力決策快速敏捷
使用數(shù)據(jù)可視化工具和儀表板,將非結(jié)構(gòu)化數(shù)據(jù)的洞察以可理解的方式呈現(xiàn)給決策者,幫助其快速作出決策。
參考文獻:
[1]中國人民銀行.金融科技發(fā)展規(guī)劃(2022—2025年)[EB/OL].[2022-01-05](2022-01-05).https://www.gov.cn/xinwen/2022-01/05/content_5666525.htm?eqid=89843e7e0017530900000004646f0174.
[2]侯本忠,張永強,等.基于自然語言的云數(shù)據(jù)庫非結(jié)構(gòu)化數(shù)據(jù)提取[J].信息技術(shù),2023(3):57-63.
[3]尹正,周圣文,張剛.基于非結(jié)構(gòu)化的數(shù)據(jù)管理探究[J].信息通信技術(shù)與政策,2022(3):92-96.
[4]張莫,劉鴻秀. AI大模型助力金融業(yè)數(shù)字化轉(zhuǎn)型[N].經(jīng)濟參考報,2023-09-01.
[5]胡萍.金融大模型應(yīng)具備三大關(guān)鍵核心能力[N].金融時報,2023-08-07.