吳永飛 等
2020年10月16日,習近平總書記強調(diào),“要加強量子科技發(fā)展戰(zhàn)略謀劃和系統(tǒng)布局,把握大趨勢,下好先手棋”。實際上,在眾多新興精尖技術中,量子計算由于其在機器學習建模應用方面表現(xiàn)出超越經(jīng)典計算的模型準確性優(yōu)勢,在商業(yè)銀行應用領域前景廣闊。商業(yè)銀行智慧運營場景為量子機器學習算法模型的應用提供了天然土壤,商業(yè)銀行運營管理業(yè)務迎來了“換道超車”的發(fā)展機遇;將量子科技與銀行智慧運營相結合,具有重要的社會價值和經(jīng)濟價值。當前社會已經(jīng)從互聯(lián)網(wǎng)、大數(shù)據(jù)時代邁向人工智能、量子科技時代,金融生態(tài)環(huán)境和客戶交易習慣發(fā)生著深刻變化。在此背景下,銀行需要以金融科技創(chuàng)新為驅(qū)動,全面推進運營管理數(shù)字化轉(zhuǎn)型,在客戶體驗升級和資源配置優(yōu)化等方面予以體現(xiàn)。本文將量子科技與機器學習相結合,立足我國商業(yè)銀行應用實踐,聚焦銀行智慧運營場景,運用量子聚類技術為銀行提供決策方案。
商業(yè)銀行運營管理迎來智能化轉(zhuǎn)型新機遇
銀行物理網(wǎng)點作為銀行服務客戶的重要場所,其運營管理的效能優(yōu)化對商業(yè)銀行具有重要意義。如何在激烈的市場競爭中科學合理地配置資源,獲得更長遠的發(fā)展和更有效的競爭力,對每家銀行而言尤為關鍵。雖然隨著移動支付的普及,客戶現(xiàn)金需求量減少,導致自動柜員機(ATM)的使用率下降,然而非現(xiàn)金業(yè)務離柜辦理促進智能設備使用率上升,功能更多的機柜——智能柜臺也在網(wǎng)點轉(zhuǎn)型、融入新時代金融發(fā)展的背景下應運而生,越來越多的交易可在智能柜臺上實現(xiàn),它將銀行零散瑣碎的業(yè)務予以集中,原本需要大量人工的柜臺業(yè)務成本得到了削減,效率也得到了提升,通過對硬件設備和業(yè)務流程的集成以及對交易憑證的整合,借助視頻、影像、工作流、人臉識別等技術手段,智能柜臺能將大部分的非現(xiàn)金業(yè)務都交由客戶自助辦理,這實現(xiàn)了業(yè)務遷移,緩釋了柜面服務壓力,進行客戶分流,消解資源占用,延伸了智慧銀行的發(fā)展方向。然而,在設備資源優(yōu)化配置上,如何根據(jù)各網(wǎng)點的業(yè)務情況、運營情況來合理配置智柜設備數(shù)量,減少設備浪費和空閑情況,實現(xiàn)動態(tài)的設備數(shù)量配置管理,仍屬于當前國內(nèi)商業(yè)銀行運營管理領域需要解決的問題。銀行智能柜臺設備管理的難點在于其分布范圍廣、數(shù)量多,所在地區(qū)客戶和環(huán)境情況復雜等。為解決智能設備高效運營、精準布放的問題,可借助K-means聚類無監(jiān)督學習方法,縮小對網(wǎng)點智柜設備業(yè)務的關注范圍,直接聚焦到表現(xiàn)優(yōu)異的網(wǎng)點集群和表現(xiàn)不理想的網(wǎng)點集群,有助于定期評估和掌握各網(wǎng)點智柜設備的運營管理情況,為進一步調(diào)整資源配置提供決策依據(jù)。
經(jīng)典聚類與量子聚類算法模型
量子論誕生于20世紀初,作為現(xiàn)代物理學兩大基石之一,改變了人們認識自然、解釋自然的邏輯方法。但在量子論誕生的前大半個世紀,人們很少將其與計算、信息理論聯(lián)系在一起,并沒有看到量子論與其他學科進行交叉的巨大潛能。1986年,費曼(Feynman,1986)闡述了量子物理可對計算機算力的傳統(tǒng)物理限制進行突破,一定程度上開啟了量子計算的大門。量子計算與傳統(tǒng)計算的最大不同主要是由于量子的疊加、糾纏以及相干等性質(zhì),對于經(jīng)典算法有巨大的改進和提升。秀爾(Shor,1994)針對在經(jīng)典計算機上難以求解的整數(shù)分解和離散對數(shù)問題,提出了大整數(shù)質(zhì)因子分解的Shor算法。格羅弗(Grover,1996)提出了能夠?qū)⒃诮?jīng)典計算機上查詢數(shù)據(jù)需要O(N)復雜度縮減至量子計算機上O()復雜度的量子搜索算法。
經(jīng)典聚類分析
聚類分析是機器學習的主要任務之一。由于聚類是一種無監(jiān)督的學習過程,即使是在沒有先驗知識標簽的情況下也能夠合理地按照數(shù)據(jù)自身的特征來進行樣本歸類,即“物以類聚,人以群分”。目前聚類算法大體上可以分為五類:一是劃分方法,代表算法有K-means、K-medoids等;二是層次方法,代表算法有BIRCH、CURE等;三是密度方法,代表算法有DBSCAN、OPTICS等;四是網(wǎng)格方法,代表算法有STING、CLIQUE等;五是模型方法,代表算法有EM等。
K-means算法是劃分聚類的典型代表之一,它具有算法簡潔、運行速度快等優(yōu)點;由于其無監(jiān)督的屬性,被廣泛應用于在海量無標簽數(shù)據(jù)集中尋找樣本的相似性場景中。聚類不僅可以作為一個單獨的過程來發(fā)現(xiàn)數(shù)據(jù)的內(nèi)部分布結構,還可以作為有監(jiān)督分類問題的預處理過程。例如,在一些商業(yè)應用中,可以先對沒有標簽的數(shù)據(jù)樣本進行聚類,根據(jù)聚類結果進行樣本標記,而后再利用有監(jiān)督學習模型對分類樣本進行訓練和測試。
量子K-means算法
量子K-means算法是將量子特有的性質(zhì)與傳統(tǒng)K-means算法相結合,并對聚類精度有較大提升的一種量子機器學習算法。2012年,葉安新等人提出了一種量子粒子群算法的聚類方法,在一定程度上解決了聚類效果對初始質(zhì)心敏感的問題;2013年,勞埃德(Lloyd)等人提出了量子版本的最近中心算法,該算法為量子K-means算法的子過程,主要是將量子態(tài)的內(nèi)積轉(zhuǎn)化到一個量子態(tài)的振幅上,進而可以計算出量子態(tài)之間的相似度;2015年,潘建偉團隊在小型光量子計算機上首次實現(xiàn)了Lloyd提出的量子K-means算法;2017年,劉雪娟等人通過量子并行方案和量子搜索算法來提高K-means算法的效率,并證明了在一定條件下,量子K-means算法在時間和空間復雜度方面都存在明顯優(yōu)勢;2021年,李玥等人利用量子粒子群優(yōu)化算法的全局搜索能力強、收斂速度快等優(yōu)勢,提出了改進量子粒子群的K-means聚類算法,該改進算法在精度、速度和穩(wěn)定性上都有顯著提升,同時也在一定程度上解決了聚類效果對初始質(zhì)心敏感的問題。
量子聚類算法模型在銀行智慧運營場景的應用
本文運用量子K-means聚類算法,對商業(yè)銀行支行網(wǎng)點的智能柜臺運營情況進行聚類分析。聚類分析的過程:首先根據(jù)智能設備的各類描述性特征指標情況,對設備所屬支行網(wǎng)點開展數(shù)據(jù)樣本的無監(jiān)督聚類;再根據(jù)聚類結果中每一類的類核質(zhì)心特征開展對該類別的業(yè)務描述和定義,這里需要人為對各類別進行標簽化定義,如“設備繁忙且人工維護及時的優(yōu)異支行”“設備繁忙但人工維護差的需加強人工維護支行”“設備空閑而人工維護情況好的需減少設備支行”等。根據(jù)類別標簽定義,最終尋找出在智能設備管理中表現(xiàn)優(yōu)秀的機構群體和待優(yōu)化的機構群體。
數(shù)據(jù)來源與特征工程
本文選取國內(nèi)某股份制商業(yè)銀行744家支行網(wǎng)點的智能設備運營數(shù)據(jù)作為樣本,范圍覆蓋全國31個省、直轄市、自治區(qū),數(shù)據(jù)來源為智能設備監(jiān)控報表數(shù)據(jù)和流水日志,數(shù)據(jù)時間范圍跨度為兩年,其中使用不足兩年的設備,按其實際使用時間內(nèi)的數(shù)據(jù)進行建模。為構建量子K-means算法模型,本文選定特征參數(shù),通過取均值、中位數(shù)、方差等統(tǒng)計學方法對報表數(shù)據(jù)進行計算加工,最終降維至兩個特征參數(shù),分別為代表設備維護情況的維護指標和代表設備業(yè)務量情況的業(yè)務指標。
構建量子K-means算法模型
本文的量子K-means算法模型是在量子最近中心算法的基礎上構建的,主要是通過將樣本特征和聚類中心的特征壓縮到兩個量子態(tài)|Φ>和|ψ>中,運用Controlled-SWAP門和Hadamard門將兩個量子態(tài)的距離轉(zhuǎn)移到第一個控制比特上,可以通過計算得到:
其中為兩個量子態(tài)之間的距離,其線路圖如圖1所示。
通過上述量子最近中心算法可以對傳統(tǒng)K-means算法進行量子化改進,設計出如下的量子K-means算法:
輸入:樣本集D={x1,x2,…,xm},聚類個數(shù)K,量子K-means線路,迭代次數(shù)m。
過程:
1.從D中隨機選擇K個樣本作為初始質(zhì)心{μ1,μ2,…,μk}
2.repeat m
3. 令Ci=Φ(i=1,2,…,k)
4. for j=1,2,…,m do
5. 將xj和聚類中心的特征壓縮后作為參數(shù)嵌入至量子K-means算法的U門;
6. 根據(jù)量子最近中心算法得到距離樣本j最近的質(zhì)心,假設為μT;
7. 將xj劃入對應的類CT;
8. end for
9. for i=1,2,…,K do
10. 計算新的均值向量
11.end for
輸出:聚類C={C1,C2,…,Ck}
圖2展示了某個樣本i完整的量子K-means算法的線路圖。
量子K-means算法模型結果
基于IBM Quantum Experience量子計算實驗環(huán)境,量子K-means算法模型將744家支行網(wǎng)點聚為三類,根據(jù)質(zhì)心結果可以得出,第0類支行為智能柜臺業(yè)務量大且設備維護情況良好的優(yōu)異支行,第1類支行為智能柜臺業(yè)務量大但是維護情況欠佳的支行,第2類支行為智能柜臺業(yè)務量小而維護情況良好的支行。根據(jù)這三類支行情況,建議分別采取措施對網(wǎng)點智能設備進行優(yōu)化,對于第1類支行可以加強人工維護頻率和及時性,而對于第2類支行可以進行設備裁撤。為說明量子K-means算法的有效性,將基于智能設備運營數(shù)據(jù)得到的量子K-means模型結果和經(jīng)典K-means模型結果進行對比,如圖3所示。
從圖3可以看出,量子K-means結果為236家支行屬于第0類,251家支行為第1類,257家支行為第2類。表明量子K-means模型和經(jīng)典K-means模型的聚類結果基本一致。為了驗證量子K-means模型的聚類結果有效性,圖4給出了量子K-means模型和經(jīng)典K-means模型聚類結果的混淆矩陣。
從圖4可以看出,對于88%的樣本而言,量子K-means模型和經(jīng)典K-means模型的聚類結果完全一致,這進一步說明使用量子線路轉(zhuǎn)化得到的量子態(tài)內(nèi)積作為“距離”和經(jīng)典的歐幾里得距離是等價的;同時,我們對剩余12%的聚類不一致樣本(91個)進行了專家經(jīng)驗判斷,其中經(jīng)典K-means模型與專家經(jīng)驗有5/91的樣本保持一致,而量子K-means模型與專家經(jīng)驗有68/91的樣本保持一致,因此以專家經(jīng)驗為參照來看,量子K-means模型的準確性更高,同時這也展現(xiàn)了量子K-means算法模型的有效性,由此實證了量子K-means算法在無監(jiān)督學習方面的優(yōu)越性。
結語
本文針對銀行運營管理中的智能柜臺布局優(yōu)化場景,運用前沿的量子K-means算法模型,給出聚類分析結果和資源配置優(yōu)化建議方案,為商業(yè)銀行運營管理數(shù)字化轉(zhuǎn)型提供了科學的決策依據(jù),符合數(shù)字經(jīng)濟時代商業(yè)銀行數(shù)字化轉(zhuǎn)型的整體戰(zhàn)略要求。未來我們將進一步聚焦以量子技術優(yōu)化傳統(tǒng)智能算法領域,并將算法深入應用在商業(yè)銀行風險管理、營銷管理等方面,擴大量子機器學習算法模型在銀行和金融領域的應用價值。
(本文合作作者有王濤、王彥博、張立偉、關杏元、項金根、史杰、徐奇、楊璇和高新凱,其中王彥博〔wangyanbo@lyzdfintech.com〕為本文通訊作者。)
(作者單位:華夏銀行股份有限公司,龍盈智達〔北京〕科技有限公司,
責任編輯:孫 爽