處于數據和分析位置的領導人必須審視這些趨勢對業(yè)務帶來的潛在影響,并相應調整業(yè)務模式和運營,否則就有可能失去競爭優(yōu)勢。
增強型數據分析、增強型數據管理、持續(xù)型智能、可解釋的AI、數據結構、NLP/對話式分析、商業(yè)AI和ML、區(qū)塊鏈和持久性內存服務器共同構成了Gartner2019年十大數據和分析技術趨勢。
近日,在悉尼舉行的Gartner數據與分析峰會上,增強型數據分析和可解釋的人工智能成為焦點。Gartner稱,增強型數據分析、持續(xù)型智能和可解釋的人工智能(AI)是數據和分析技術的主要趨勢之一,并在未來三到五年內具有顯著的顛覆性潛力。Gartner副總裁兼杰出分析師Donald Feinberg認為,數字化顛覆帶來的挑戰(zhàn)——數據太多也創(chuàng)造了前所未有的機遇。大量數據和由云實現的日益強大的處理能力意味著現在可以大規(guī)模地訓練和執(zhí)行必要的算法,以最終兌現出AI的全部潛力。Donald表示:“任何企業(yè)的持續(xù)生存都將取決于靈活的,以數據為中心的架構,以響應不斷變化的速度。數字化業(yè)務需要大量復雜且分布式的數據、迅速行動以及持續(xù)型智能,這意味著僵化且集中式的架構和工具分崩離析?!?/p>
Gartner研究副總裁Rita Sallam則認為,數據和分析領導者必須審視這些趨勢對業(yè)務帶來的潛在影響,并相應調整業(yè)務模式和運營,否則就有可能失去競爭優(yōu)勢。
“數據和分析的形勢不斷發(fā)展,從支持內部決策到持續(xù)型智能,信息產品和任命首席數據官,”Rita說道,“深入了解它們對于推動這種不斷變化的技術趨勢,并根據業(yè)務價值對它們進行優(yōu)先排序至關重要?!?/p>
Gartner建議數據和分析領導者與高級業(yè)務負責人討論他們的關鍵業(yè)務優(yōu)先級,并探索以下主要趨勢如何實現這些優(yōu)先級。
趨勢1? 增強型數據分析(AugmentedAnalytics)
作為數據分析的高級增強階段,增強分析能為分析計劃帶來更多自動化動能以及創(chuàng)新洞察力。因為在正式進入數據分析之前,都需要對數據進行抽取、清洗、融合等準備工作,以提高數據分析的效率和準確性,更利于決策。而增強分析則能夠幫助普通用戶在沒有數據科學專家或IT人員協助的情況下,訪問有效數據,并對理論和假設情況展開測試與驗證。
增強型數據分析側重于增強智能的特定領域,利用機器學習(machinelearning)轉變分析內容的開發(fā)、使用與共享方式。目前國內正在加強這一技術突破,包括幾大數據計算廠商,如阿里云、百度云、華為云等,通過對百萬數據的計算與匯聚,實現對現實算力的優(yōu)化,以在未來如智慧大腦領域實現更多突破。
Gartner預測,到2020年,增強分析將成為分析和商業(yè)智能解決方案的主要賣點,相關業(yè)務負責人應該在平臺功能趨于成熟時率先采用增強型分析。機器學習和人工智能、增強型分析將為數據和分析市場帶來顛覆,因為它將徹底改變開發(fā)、消費和共享分析內容的方式,可使數據準備、洞察力獲取和洞察力可視化這個過程實現自動化,在許多情況下無需專業(yè)的數據科學家。
趨勢2? 增強型數據管理(AugmenteddataManagement)
增強型數據管理利用機器學習功能和AI引擎來制作數據管理類別,包括數據質量、元數據管理、主數據管理、數據集成以及數據庫管理系統(tǒng)(DBMS)的自我配置和自我調整。
增強型數據管理將元數據由僅用于審計、沿襲和報告變成支持動態(tài)系統(tǒng)。元數據正在從被動變?yōu)橹鲃?,并且正在成為所有AI/ML的主要驅動因素。它可以自動執(zhí)行許多手動任務,為技術水平較低的用戶提供使用數據的機會。它還有助于高技能的技術資源專注于更多的增值任務。
趨勢3? 持續(xù)型智能(ContinuousIntelligence)
持續(xù)性數據不僅僅是一種實時數據的新方式;相反,它是一種設計模式,其中實時分析與業(yè)務運營相結合,處理當前和歷史數據以規(guī)定響應事件的行動。它提供決策自動化或決策支持。持續(xù)型智能利用多種技術,比如增強型分析、事件流處理、優(yōu)化、業(yè)務規(guī)則管理和機器學習。
“持續(xù)型智能代表了數據和分析團隊工作的重大變化,”Gartner研究副總裁麗Sallam認為,“分析和BI(商業(yè)智能)團隊在2019年幫助企業(yè)做出更明智的實時決策,這是一個巨大的挑戰(zhàn),也是一個巨大的機會。它可以被看做是運營商業(yè)智能的終極目標?!钡?022年,超過一半的重要新業(yè)務系統(tǒng)將采用持續(xù)性智能,使用實時上下文數據來改善決策。
趨勢4? 可解釋的AI(ExplainableAI)
人工智能模型越來越多地用于增強和取代人類決策。但AI解決方案如何解釋為什么他們得出某些結論?
大多數這些先進的AI模型都是復雜的黑盒子,無法解釋他們?yōu)楹芜_到特定的推薦或決定。這是可解釋的人工智能的用武之地。比如說,數據科學和機器學習平臺中的可解釋型AI可自動生成模型的解釋,用自然語言從準確性、屬性、模型統(tǒng)計和特征等方面解釋模型。
趨勢5? 圖形分析(Graph)
圖形分析是一組分析技術,可幫助企業(yè)探索交易、流程和員工等實體之間的關系。到2022年,圖形處理和圖形數據庫管理系統(tǒng)的應用將以每年100%的速度增長。
根據Gartner的說法,圖形數據存儲可以跨數據孤島有效地建模、探索和查詢數據,但是對專業(yè)技能的需求限制了它們的采用。由于需要在復雜數據中提出復雜問題,圖形分析將在未來幾年內增長,這在使用SQL查詢時并不總是切實可行。
趨勢6? 數據結構(DataFabric)
數據結構都是關于單一且一致的數據管理框架。它著眼于在分布式數據環(huán)境中實現無摩擦訪問和數據共享,而不是孤立存儲。
到2022年,定制數據結構配置將主要用作靜態(tài)基礎架構,迫使組織進入新一波的成本控制浪潮,以完全重新設計更動態(tài)的數據網格方法。
趨勢7? NLP/會話分析(NLP/ConversationalAnalytics)
到2020年,50%的分析查詢將通過搜索、自然語言處理(NLP)或語音生成,或者將自動生成。
分析復雜的數據組合并使組織中的每個人都可以訪問分析的需求將推動更廣泛的采用,使分析工具將如同搜索界面或與虛擬助手的對話一樣簡單。根據另一項單獨研究,NLP用例非常龐大,預計到2020年NLP市場價值將達到134億美元。
趨勢8? 商用的人工智能和機器學習(CommercialAIandML)
到2022年,利用ML和AI技術的75%的新終端用戶解決方案將采用商業(yè)解決方案,而非開源平臺的方式構建。商業(yè)供應商已經在開源生態(tài)系統(tǒng)中創(chuàng)建了連接器,它們?yōu)榻M織提供了擴展AI和所需的功能,例如項目和模型管理、透明度、復用、數據沿襲、平臺凝聚力以及開源技術所缺乏的集成。
趨勢9? 區(qū)塊鏈(Blockchain)
企業(yè)可以使用區(qū)塊鏈來解決數據管理問題嗎?數據管理對CTO來說是一個持續(xù)不斷的挑戰(zhàn),但Bluzelle首席執(zhí)行官Pavel Bains認為區(qū)塊鏈技術可以提供解決方案。
區(qū)塊鏈和分布式賬本技術的核心價值主張是在不受信任的參與者網絡中提供去中心化的信任。區(qū)塊鏈對于數據分析的潛在影響很大,尤其是對利用參與者關系和交互的那些企業(yè)的影響。然而,在四到五個主要區(qū)塊鏈技術成為主導之前,還需要幾年時間。但是,區(qū)塊鏈是數據源,而不是數據庫,不會取代現有的數據管理技術。
趨勢10? 持久性內存服務器(PersistentMemoryServers)
持久存儲器技術旨在降低采用內存計算(IMC)架構的成本和復雜性。持久性內存代表DRAM和NAND閃存之間的新內存層,可為高性能工作負載提供經濟高效的大容量內存?!皵祿空诩ぴ?,實時將數據轉化為價值的緊迫性正以同樣快的速度增長,”Donald表示,“新的服務器工作負載不僅要求更快的CPU性能,還要求大容量內存和更快的存儲系統(tǒng)?!?/p>