李欣妍
不過,穩(wěn)定的流通就要確定數據的權利歸屬,才有可能產生交易的價值,并且保證安全可追溯。當前,國家層面正在加速這一方向的發(fā)展,數據相關的上市公司有持續(xù)關注的價值。
從二級市場看,截至6 月15 日收盤,人工智能板塊指數連續(xù)第三個交易日創(chuàng)年內新高。從中期維度看,AI板塊的投資人氣仍可能維持較高熱度。在整個AI 領域中,市場非常關注算力和算法,AI 芯片、光模塊、服務器、PCB 龍頭股在6 月以來的上漲中率先反彈。隨著行情不斷演繹,數據確權相關板塊股價出現異動,截至6月15 日,相關板塊指數過去一個月漲幅11.02%。
通過國有企業(yè)搭建的平臺,國內的數據確權服務得到推動和支持。隨著數字經濟快速發(fā)展,這些平臺有望在數據確權領域發(fā)揮更重要的作用,推動數據產業(yè)繁榮和創(chuàng)新。而以ChatGPT 為代表的人工智能加速發(fā)展,數據要素市場需求爆發(fā)。
拆分來看,數據要素產業(yè)鏈包括數據生產、流通和使用三大環(huán)節(jié)。數據是以ChatGPT 為代表的人工智能進一步發(fā)展不可或缺的基礎。數據相當于AI 算法的“飼料”,用于AI 的數據越多,AI 的算法能力則越強。作為數據的一大需求方,未來人工智能領域的加速發(fā)展,有望驅動數據需求的爆發(fā),同時有望增加數據要素交易,促進數據要素市場建設。
據國家工信安全中心測算數據,2020 年我國數據要素市場規(guī)模達到545億元,“十四五”期間,這一數值將突破1749億元,整體進入高速發(fā)展階段。隨著數據要素相關政策進一步落地,技術發(fā)展使得數據要素交易易于實現,數據要素相關公司將迎來較大的機會。
從投資細分的角度來看,數據要素產業(yè)鏈及數據交易所,數據存儲、采集、處理、運營、確權及安全環(huán)節(jié),數據所有者等幾類參與者。
例如浙數文化位于經濟及信息發(fā)達省份,目前持有浙江大數據交易中心48.2% 股份。易華錄經營重點由數據湖建設轉向數據要素運營;云賽智聯(lián)以云服務與大數據、行業(yè)解決方案及智能化產品三大板塊為核心業(yè)務,布局數據要素產業(yè)鏈多個環(huán)節(jié)。上海鋼聯(lián)植根大宗商品數據服務業(yè)23 年,對大宗商品幾乎全覆蓋,目前公司已在上海數據交易所掛牌相關數據產品。深桑達中國電子云為中國電子旗下惟一云平臺。
實際上,高質量數據對模型性能提升至關重要,預計大模型廠商將加大高質量數據需求,擁有高質量數據庫的相關公司,價值有望提升。當前時點,就AI 驅動下的數據要素而言,短期有望迎來做多窗口,但對結構牛市來說,勝負手的關鍵在于主線選擇和篤定追隨。
從ChatGPT 面世以來,AIGC 產業(yè)迎來爆發(fā)式發(fā)展,國內企業(yè)加快擁抱大模型時代,百度、360、阿里等互聯(lián)網公司以及商湯、科大訊飛等人工智能企業(yè)相繼發(fā)布自研大模型,大模型軍備競賽拉開序幕。
今年4 月,國家互聯(lián)網信息辦公室發(fā)布了《生成式人工智能服務管理辦法(征求意見稿)》,公開征詢管理建議,這是國家首次向生成式人工智能領域發(fā)布產業(yè)規(guī)范性政策文件,其把數據安全、數據確權、數據隱私等數據有關內容放在較為重要的篇幅。由此,我們能明確看到其利好數據確權細分賽道。從文件發(fā)布以來,截至6月14 日,AIGC 指數漲幅達到10.28%。
實際上,對于AI 大模型而言,數據為貫穿其全身的血脈,對AI 發(fā)展影響重大;除通用數據外,行業(yè)數據也是各垂類模型的關鍵。在整個AI 貫穿的領域里面,算力和算法關注度最高。毋庸置疑,單純比拼算力,我國尚且存在一定差距,但是投資者不應忽視我國的數據資源優(yōu)勢,這是我們的長板所在。
關于數據,坊間有一種觀點認為AI文本生成較高質量的數據來源于學術論文、專業(yè)書籍、專業(yè)新聞、專業(yè)的全球數據庫、各細分領域龍頭數據庫以及高質量的論壇,而目前高質量數據庫仍以英文為主,給中文大模型訓練提升了難度。其實這是狹義的定義數據,中國互聯(lián)網數據龐大,沉積下來全球最大的數據量,海量優(yōu)勢無可比擬。
根據《國家數據資源調查報告(2021)》,我國2021 年數據產量6.6ZB,同比增加29.4%,其中個人數據產量為1.4ZB,各類行業(yè)機構產生數據5.2ZB。從行業(yè)分布看,數據產量排名前五位的行業(yè)分別為政府、互聯(lián)網、媒體、公眾服務及專業(yè)服務、交通,前五大行業(yè)數據產量占全國行業(yè)機構數據總產量的65%。
從具體架構來看的話,不僅有頂層制度設計,各地也紛紛成立數據交易所。面對各級政府在數據大開發(fā)上面的發(fā)力,未來或許有可能先于其他國家挖掘出更深的數據價值。
從邏輯關系上看,AI 訓練的核心資源是數據,AIGC 想要取得好的生成結果,離不開基于海量數據的訓練,而數據確權應該是人工智能能夠持續(xù)發(fā)展的基石之一。嚴格意義上講,確定數據的權利屬性即做好數據確權,一方面可解決AIGC 作品的知識產權保護或規(guī)避侵權等問題;另一層面其不僅影響和制約著數據流通環(huán)節(jié),還涉及到數據資產的入表問題。
結合二級市場看,從事數據確權的相關公司并不多,目前國內的數據確權服務工作主要由一些國有企業(yè)搭建的平臺承擔,比較典型的平臺包括人民網旗下的人民數據確權流通平臺和人民數保平臺,自2019 年起,人民網就開始積極研究和創(chuàng)新應用區(qū)塊鏈技術,并將其運用于數據確權業(yè)務的探索中。
具體說來,人民數據資產服務平臺是我國首個數據確權平臺。它作為國家隊具有先發(fā)優(yōu)勢,不過數據確權目前尚屬較新的數字產業(yè),我們能看出相關業(yè)務自2019 年布局后,2020 年在財報中已經有所體現,但具體能給公司帶來多少產出目前還無法得知。從年報數據及信息服務相關財務指標中,可以看到相關營收過去三年均有下降,分別為3.31 億元、2.82 億元、2.56 億元;然而毛利率有所攀升,分別為47.03%、47.44%、49.02%。
無獨有偶,新華網通過持有新華智云(與阿里合資)39% 的股份來推動數字資產中心的建設,并利用區(qū)塊鏈技術提供數據確權服務。對此有券商預計2022-2023 年,公司歸母凈利潤分別為2.52 億元/2.90 億元,同比增長19.61%/15.02%,6 月15 日收盤價對應PE 分別為78.71/67.31x。(作者為深圳某基金公司基金經理。文中觀點僅代表作者個人,不代表《紅周刊》立場。本文提及個股僅做分析,不做投資建議。)