在2019年杭州云棲大會上,阿里巴巴集團首席技術官兼阿里云智能總裁張建鋒發(fā)布了阿里的首款AI芯片含光800,該芯片是一款云端AI芯片,也是全球最高性能的AI推理芯片。含光800主要應用于視覺場景,已經在阿里巴巴集團內多個場景大規(guī)模應用,其它企業(yè)可以通過阿里云獲得含光NPU的算力。
含光800性能的突破得益于軟硬件的協同創(chuàng)新,芯片架構方面,含光800采用創(chuàng)新的架構,針對深度學習中使用的大量權重參數和張量數據,在支持稀疏壓縮與量化處理的基礎上,通過獨特設計的數據訪存與流水線處理技術,大大減低了I/O需求和數據的搬移。NPU同時深度優(yōu)化了卷積、矩陣乘、向量計算和各種激活函數,通過高有效的硬件資源調度和全并行的數據流處理,把AI運算的性能和能效都推向極致。
根據阿里云展示的杭州城市大腦的業(yè)務測試,1顆含光800的算力相當于10顆GPU。實際應用上,含光800目前已開始應用在阿里巴巴內部核心業(yè)務中。根據云棲大會的現場演示,在城市大腦中實時處理杭州主城區(qū)交通視頻,需要40顆傳統(tǒng)GPU,延時為300ms,使用含光800僅需4顆,延時降至150ms。拍立淘商品庫每天新增10億商品圖片,使用傳統(tǒng)GPU算力識別需要1小時,使用含光800后可縮減至5分鐘。
未來,含光800將通過阿里云對外輸出AI算力。張劍鋒宣布,基于含光800的AI云服務從9月25日起正式上線,而且相比傳統(tǒng)GPU算力,起性價比將會有100%的提升。
而隨著玄鐵910、無劍SoC平臺、含光800的發(fā)布,張劍鋒表示,平頭哥端云一體全棧產品系列初步成型,已經涵蓋處理器IP、一站式芯片設計平臺和AI芯片,實現了芯片設計鏈路的全覆蓋。