Gerard Francis
數(shù)據(jù)、機器學(xué)習(xí)和自然語言處理這三大因素正在相互融合,從根本上改變?nèi)蛸Y本市場投資者獲取、使用和分析可用信息的方式。
● 在數(shù)據(jù)更加易于獲取、更加多樣化但也更缺乏關(guān)聯(lián)的背景下,金融信息正在重塑投資策略
● 機器學(xué)習(xí)成為引領(lǐng)金融業(yè)未來發(fā)展的力量,為投資者提供更快、更明智、更精確的市場分析
● 通過即用數(shù)據(jù)可以實現(xiàn)流程自動化、制定新的交易策略和捕捉投資信號
金融業(yè)正在經(jīng)歷前所未見的科技突破,而數(shù)據(jù)是支撐行業(yè)快速轉(zhuǎn)型的基礎(chǔ)。如今,決策者可獲取的數(shù)據(jù)無論在數(shù)量、復(fù)雜程度和多樣性方面都呈指數(shù)級增長,但這些數(shù)據(jù)也變得更缺乏關(guān)聯(lián)性。根據(jù)IBM統(tǒng)計,當(dāng)今世界90%數(shù)據(jù)是在過去兩年中生成的。
數(shù)據(jù)(與另類數(shù)據(jù))、機器學(xué)習(xí)與自然語言處理這三大因素正在相互融合,這一趨勢從根本上改變了全球資本市場投資者獲取、使用和分析可用信息的方式,也正在重塑投資機構(gòu)的交易策略以及他們辨別商業(yè)信息的方法。
處理數(shù)據(jù)的挑戰(zhàn)——更加多樣化但更欠關(guān)聯(lián)性
金融機構(gòu)的數(shù)據(jù)池十分龐大但同時很零碎,它不僅僅包括大多數(shù)人熟悉的財報、證券價格等基本面數(shù)據(jù),還包括業(yè)務(wù)流程生成的數(shù)據(jù)(如:商業(yè)交易)、機器生成的數(shù)據(jù)(如:衛(wèi)星信息)以及非傳統(tǒng)來源的數(shù)據(jù)(如:社交媒體)。
越來越多投資者選擇采用另類數(shù)據(jù)集,借助創(chuàng)新技術(shù)專注于發(fā)現(xiàn)有用的投資信號以捕捉超額收益。如今,投資者不但要了解證券定價與財務(wù)表現(xiàn),還要分析外部圖像、供應(yīng)鏈信息、ESG因素乃至社交媒體輿情。
金融業(yè)不斷產(chǎn)生海量數(shù)據(jù),彭博每天收到的市場數(shù)據(jù)信息多達1千億條,另外還從12.5萬個新聞來源接收200萬篇新聞報道。我們通過機器學(xué)習(xí)算法和自然語言處理打造的預(yù)測分析工具,可以快速檢閱所有信息,篩選出對投資者最為重要的信息。
今天,市場參與者與金融機構(gòu)面臨的最大挑戰(zhàn)是如何識別有用的數(shù)據(jù)、如何確保收集的數(shù)據(jù)具有高質(zhì)量、連貫性、關(guān)聯(lián)性和即用性,以及如何快速分析這些數(shù)據(jù)從而做出正確的關(guān)鍵決策。
即用數(shù)據(jù)賦能自動化
數(shù)據(jù)的爆發(fā)性增長僅僅是變革與復(fù)雜性的基礎(chǔ)驅(qū)動力??紤]到所面臨任務(wù)的艱巨程度,毫不意外地許多金融機構(gòu)都借助科技將處理流程自動化,以更高效地管理好數(shù)據(jù),并借此生成超額收益。
機器學(xué)習(xí)在這些技術(shù)之中快速脫穎而出。自然語言處理和數(shù)據(jù)采集的進步正在推動電子交易執(zhí)行平臺的交易自動化;多家機構(gòu)選擇借助大數(shù)據(jù)與機器學(xué)習(xí)預(yù)測客戶需求與價格波動。
以買方機構(gòu)為例,對沖基金與資產(chǎn)管理公司可使用預(yù)測分析工具,基于市場流動性評估風(fēng)險。隨著更多的工作流程自動化,專業(yè)金融人士將更多的注意力放在注重認知能力的工作上,包括策略和投資組合篩選以及投資理論制定。他們試圖通過這樣的方式解決金融領(lǐng)域的眾多問題,打造更優(yōu)良的信息系統(tǒng)支持交易和客戶溝通工作。
彭博最近在悉尼、新加坡、東京和孟買舉行了以“解碼機器學(xué)習(xí)”為主題的研討會,發(fā)現(xiàn)多數(shù)專業(yè)人士已經(jīng)開始利用機器學(xué)習(xí)發(fā)現(xiàn)投資信號和因子,優(yōu)化執(zhí)行策略以提高交易效率。在上述四個亞太市場當(dāng)中,日本在將機器學(xué)習(xí)應(yīng)用于交易模型方面最為先進,在投資策略中利用的數(shù)據(jù)也是最為多樣化。有鑒于此,我們正在加速投入以發(fā)掘機器學(xué)習(xí)的潛力。
高質(zhì)量數(shù)據(jù)在機器學(xué)習(xí)時代至關(guān)重要
15年前,金融信息與數(shù)據(jù)行業(yè)向電子交易轉(zhuǎn)型,隨后又發(fā)展出了高頻交易和算法交易。今天,我們正在步入機器學(xué)習(xí)與人工智能的信息時代,數(shù)據(jù)賦能自動化、創(chuàng)新交易策略,并發(fā)掘前所未有的洞察。
在機器學(xué)習(xí)時代,金融數(shù)據(jù)與信息將更加豐富,而且也更加可測和更具條理。彭博作為領(lǐng)先的金融信息公司,將數(shù)據(jù)標準化為“整潔格式”(tidy formats),通過提供標準化歷史數(shù)據(jù)使分析變得更加容易,從而提升效率也更便于互相參考。
我們新推出的數(shù)據(jù)接入平臺網(wǎng)站——彭博企業(yè)數(shù)據(jù)接入站點(BEAP)通過便于操作、易于建模和可視化的方式,幫助客戶探索大批量數(shù)據(jù)集并與之互動。最近,我們還向BEAP增加了20多套另類數(shù)據(jù)集,來源同時包括彭博和市場領(lǐng)先的另類數(shù)據(jù)提供商,內(nèi)容涵蓋金屬存貨洞察、股票相關(guān)博客情緒、藥品審批、消費人流量和停車場數(shù)據(jù)、建筑許可、地緣政治風(fēng)險以及APP使用率等。 投資機構(gòu)希望可以靈活應(yīng)用這些數(shù)據(jù),所以我們正努力做到何時何地都能夠遞送數(shù)據(jù)。數(shù)據(jù)將成為一種服務(wù),而未來的平臺會更加輕量化且具有移動性。
機器學(xué)習(xí)從本質(zhì)上說是由數(shù)據(jù)驅(qū)動的,投資者應(yīng)用機器學(xué)習(xí)可以快速掌握紛繁復(fù)雜的關(guān)系;從而應(yīng)對之前因為受制于數(shù)據(jù)之間的復(fù)雜關(guān)系、問題的復(fù)雜性,以及數(shù)據(jù)或計算資源的可獲得性而無從入手的問題。
科技日益進步的今天,讓機器學(xué)習(xí)發(fā)揮更大價值需要高質(zhì)量、互相關(guān)聯(lián)并可付諸應(yīng)用的數(shù)據(jù)。在機器學(xué)習(xí)時代,能夠領(lǐng)悟這一點,并有效執(zhí)行數(shù)據(jù)驅(qū)動策略的機構(gòu)將成為最終贏家。
(作者Gerard Francis是彭博企業(yè)數(shù)據(jù)業(yè)務(wù)全球負責(zé)人)