姜紅德
影響人工智能發(fā)展的三大要素分別是數(shù)據(jù)、算法、算力,在經(jīng)歷了算法研究、技術(shù)擴張和商業(yè)落地的發(fā)展之后,AI對數(shù)據(jù)提出了更高要求。未來3~5年,更加精細(xì)化、場景化、專業(yè)化的數(shù)據(jù)采集標(biāo)注才能滿足日益增長的人工智能細(xì)分場景、專業(yè)垂直的賦能需求。
2021年AI數(shù)據(jù)服務(wù)行業(yè)發(fā)展趨勢顯示,高精度數(shù)據(jù)將成人工智能訓(xùn)練階段追逐熱點,人工智能對長尾場景的數(shù)據(jù)需求進(jìn)一步擴大,場景化數(shù)據(jù)將擁有更廣闊的增量空間,底層技術(shù)+服務(wù)能力將愈發(fā)重要直至成為核心競爭點,人工智能更需要能提供一體化數(shù)據(jù)解決方案的服務(wù)商。
在算法訓(xùn)練階段,需要通過更高質(zhì)量的數(shù)據(jù)對已有算法的準(zhǔn)確率、魯棒性等能力進(jìn)行優(yōu)化。從產(chǎn)品終端體驗來看,在人工智能概念熱度和巨大的市場前景背后,國內(nèi)消費者對AI應(yīng)用的期待值大幅提升,但AI應(yīng)用卻出現(xiàn)同質(zhì)化嚴(yán)重等問題。當(dāng)前,人工智能算法模型經(jīng)過多年的打磨,基本達(dá)到階段性成熟,一個成功的AI應(yīng)用與其他應(yīng)用的差異化對比,更多的來自于精準(zhǔn)大量的訓(xùn)練數(shù)據(jù)。
隨著人們對人工智能算法識別準(zhǔn)確的要求更上一個臺階,具有更高精準(zhǔn)度的數(shù)據(jù)也將成為訓(xùn)練階段的主流需求。云測數(shù)據(jù)在數(shù)據(jù)采集標(biāo)注領(lǐng)域的重要優(yōu)勢之一,就是能提供足夠精準(zhǔn)的訓(xùn)練數(shù)據(jù),因此其最高99.99%的精準(zhǔn)度可較好的應(yīng)對人工智能數(shù)據(jù)精準(zhǔn)度提升的情況,行成企業(yè)護(hù)城河。對于人工智能數(shù)據(jù)采集標(biāo)注服務(wù)商來講,將提高數(shù)據(jù)標(biāo)注精準(zhǔn)度作為業(yè)務(wù)追求,才能用存量市場和增量市場“兩條腿”穩(wěn)健前行,而那些低質(zhì)量的AI數(shù)據(jù)服務(wù)商在未來將面臨淘汰或轉(zhuǎn)型其他業(yè)務(wù)。
在算法落地階段,經(jīng)過研發(fā)與訓(xùn)練之后,人工智能應(yīng)用從理論走向市場,對細(xì)分場景化的數(shù)據(jù)準(zhǔn)確度提出了更高要求。從細(xì)分結(jié)構(gòu)來看,隨著人工智能技術(shù)的不斷成熟,更多的場景和行業(yè)開始嵌入使用人工智能技術(shù),AI行業(yè)應(yīng)用場景逐漸趨于長尾和碎片化,產(chǎn)生了大量新興垂直領(lǐng)域的數(shù)據(jù)需求,如疫情期間的口罩識別應(yīng)用等;同時,從AI應(yīng)用迭代、用戶體驗完善的角度來看,AI應(yīng)用需要更加貼合具體使用場景的數(shù)據(jù)進(jìn)行迭代更新。
這些數(shù)據(jù)采集需求相對復(fù)雜、聚焦,難度較大,對AI數(shù)據(jù)服務(wù)商的場景化采集能力提出了很高的要求。隨著人工智能對長尾場景的數(shù)據(jù)需求進(jìn)一步擴大,未來,場景數(shù)據(jù)將擁有更廣闊的增量空間,具有相關(guān)采集工具、資源、能力的數(shù)據(jù)采集標(biāo)注服務(wù)商將擁有極大的競爭優(yōu)勢。以云測數(shù)據(jù)為例,為進(jìn)一步滿足場景化數(shù)據(jù)的需求,首創(chuàng)了“數(shù)據(jù)場景實驗室”進(jìn)行相應(yīng)的場景化數(shù)據(jù)生產(chǎn)。
隨著“底層技術(shù)+服務(wù)能力” 更受數(shù)據(jù)需求方重視,數(shù)據(jù)服務(wù)商應(yīng)提前布局。縱觀國內(nèi)外人工智能數(shù)據(jù)服務(wù)廠商,各家企業(yè)在模式、技術(shù)、服務(wù)等方面各有差異,但綜合人工智能發(fā)展需求和服務(wù)廠商的情況來看,“技術(shù)+服務(wù)”將成為重要競爭核心。
技術(shù)層面來講,隨著AI訓(xùn)練數(shù)據(jù)需求多樣化,以及復(fù)雜程度的提升,客戶類型豐富、數(shù)據(jù)需求多樣、并發(fā)項目眾多等因素對廠商的能力和效率提出了更高要求。如云測數(shù)據(jù)就擁有一套自主研發(fā)貫通創(chuàng)建任務(wù)、分配任務(wù)、數(shù)據(jù)處理、質(zhì)檢/抽檢和數(shù)據(jù)安全管理等各環(huán)節(jié)于一體,并且能對圖像、文本、語音、視頻以及點云數(shù)據(jù)做到一站式加工處理的管理和執(zhí)行一體化平臺。這是AI數(shù)據(jù)服務(wù)商技術(shù)實力的集中體現(xiàn),也是快速確立行業(yè)地位的關(guān)鍵一步。
其中,由于部分行業(yè)領(lǐng)域具有較高的數(shù)據(jù)敏感性,那些自主研發(fā)能力強、技術(shù)水平高、可向需求方提供私有化部署服務(wù),或?qū)⒆陨砥脚_與需求方系統(tǒng)兼容,來保證數(shù)據(jù)的隱私安全等能力,將成為人工智能數(shù)據(jù)服務(wù)商形成差異化競爭的關(guān)鍵。
服務(wù)能力屬于數(shù)據(jù)服務(wù)商的一項軟實力,具體表現(xiàn)為能夠積極配合、快速響應(yīng)需求方的數(shù)據(jù)要求。通過對數(shù)據(jù)需求方的調(diào)查研究,除了對精細(xì)化、質(zhì)量、安全性、效率等業(yè)務(wù)層面的核心關(guān)注點之外,具備更深刻的行業(yè)領(lǐng)域知識、更懂場景、更懂技術(shù)、更具行業(yè)前瞻性,甚至為需求方提出采標(biāo)優(yōu)化建議的服務(wù)能力,將成為未來數(shù)據(jù)需求方選擇合作企業(yè)的重要參考指標(biāo)。
尤其在人工智能應(yīng)用場景落地階段,常規(guī)的數(shù)據(jù)采集或者數(shù)據(jù)標(biāo)注已經(jīng)不具備競爭優(yōu)勢??梢蕴峁┘{(diào)研、咨詢、設(shè)計、采集、標(biāo)注于一體的人工智能訓(xùn)練數(shù)據(jù)解決方案的服務(wù)商,在擴大人工智能數(shù)據(jù)服務(wù)的業(yè)務(wù)邊界的同時,還將在開拓業(yè)務(wù)市場、行業(yè)地位的確立上具備更多的主動性。人工智能對數(shù)據(jù)提出更高需求,展現(xiàn)了在人工智能產(chǎn)業(yè)化落地進(jìn)程中,數(shù)據(jù)發(fā)揮的重要作用。場景化、高精度的數(shù)據(jù)和專業(yè)化、技術(shù)化的服務(wù),將成為未來3~5年人工智能全速發(fā)展的重要突破口,驅(qū)動人工智能深化發(fā)展。人工智能的發(fā)展加速各領(lǐng)域智能化的到來,而中國龐大的數(shù)據(jù)量又為人工智能技術(shù)在各個場景落地生長提供了肥沃土壤。疊加向好的政策、大力的技術(shù)研發(fā)投入和積極擁抱新技術(shù)的消費者,人工智能產(chǎn)業(yè)未來發(fā)展強勁,數(shù)據(jù)采集標(biāo)注服務(wù)將成為主要拉力,并持續(xù)處于上升期,行業(yè)前景良好。