崔宏禹
隨著智能設(shè)備的發(fā)展,預(yù)計(jì)在2020年,全球的物聯(lián)網(wǎng)設(shè)備所產(chǎn)生的數(shù)據(jù)將達(dá)到20B。那么這些設(shè)備所產(chǎn)生的數(shù)據(jù)應(yīng)當(dāng)如何處理?這是一個(gè)非常棘手的問題。
微軟的世界觀將我們的智能云平臺的某些能力,延伸到邊緣設(shè)備中,形成我們所倡導(dǎo)的智能云業(yè)務(wù)。因?yàn)槿绻麑⑺袛?shù)據(jù)處理都放到云端,那么云端的計(jì)算將無法承受。所以我們盡可能將云端的計(jì)算能力與人工智能遷移到邊緣。
我們將這一觀點(diǎn)分為三個(gè)層面:第一,AI開發(fā)者。針對AI開發(fā)者我們運(yùn)用的方法非常簡單,只需要開發(fā)者運(yùn)用人工智能和數(shù)據(jù)背后的能力即可。第二,AI數(shù)據(jù)科學(xué)家。目前每個(gè)企業(yè)都存儲了大量數(shù)據(jù),而數(shù)據(jù)科學(xué)家掌握數(shù)據(jù)算法,所以我們將數(shù)據(jù)科學(xué)家所掌握的算法,運(yùn)用到我們的數(shù)據(jù)中。第三,AI公司。目前,運(yùn)用深度學(xué)習(xí)技術(shù)的成本較高,所以我們建立了基于數(shù)據(jù)的開源平臺,來深入到某些特定的行業(yè)中,來解決成本問題。
如何打造云計(jì)算的智能平臺?我們將其分為三個(gè)階段:第一,認(rèn)知;第二,開放的機(jī)器學(xué)習(xí)與深度學(xué)習(xí)平臺;第三,邊緣計(jì)算。
在第一個(gè)部分,我們把與認(rèn)知相關(guān)的服務(wù)開放出來,包括人臉識別、情緒識別、年齡識別等,我們在三年前就已經(jīng)將認(rèn)知服務(wù)開放出來并形成認(rèn)知圖譜,如今該圖譜已積累了100萬個(gè)使用者。
如果有些服務(wù)無法滿足用戶需求,那么客戶可以自行制定機(jī)器所需要學(xué)習(xí)的場景,包括圖片、視頻、語音、CV等。此外,該圖譜的所有能力,都可以部署到公有云與私有云平臺,以及移動(dòng)和物聯(lián)網(wǎng)設(shè)備中。
什么是對話式人工智能?當(dāng)語音數(shù)據(jù)產(chǎn)生時(shí),我們可能會利用知識圖譜或者人機(jī)對話以及工具等方式將其展現(xiàn)。
為什么我們會強(qiáng)調(diào)對話式人工智能服務(wù)?因?yàn)槲覀兿胭x予機(jī)器與人交流的能力。怎么樣構(gòu)建簡單的對話式人工智能服務(wù)?我們在兩年前開發(fā)了Bot Services,目前全球有30萬開發(fā)者在使用該項(xiàng)技術(shù)。
Bot Services具備規(guī)劃、部署和體驗(yàn)以及端到端的能力?,F(xiàn)今要打造機(jī)器人客服,可直接使用知識圖譜和人機(jī)交互技術(shù),便可以迅速構(gòu)建。
介紹一下我們的Azure平臺,微軟如何構(gòu)建機(jī)器學(xué)習(xí)和深度學(xué)習(xí)?
第一,最佳數(shù)據(jù)資產(chǎn)。目前,微軟已經(jīng)將自己用來進(jìn)行機(jī)器訓(xùn)練的數(shù)據(jù),全部貢獻(xiàn)出來與大家共享,用戶可以直接將這些數(shù)據(jù)下載后加以利用。
第二,我們提供大量的工具鏈。人們在運(yùn)用機(jī)器學(xué)習(xí)時(shí),需要分析數(shù)據(jù)背后的規(guī)律,而尋找數(shù)據(jù)規(guī)律最重要的環(huán)節(jié)就是算法,算法的編寫十分困難,而且開發(fā)該項(xiàng)技術(shù)的人工成本也相對較高,所以我們就要降低人工使用機(jī)器學(xué)習(xí)算法的難度。
我們的平臺是一個(gè)開放的平臺,所以解決這一問題我們運(yùn)用了托拉拽的方式來實(shí)現(xiàn)機(jī)器學(xué)習(xí),包括參數(shù)調(diào)整、算法選擇和訓(xùn)練集與教練集的分類等。
第三,最優(yōu)算法。什么是最優(yōu)算法?因?yàn)樵诖蠖鄶?shù)機(jī)器學(xué)習(xí)算法中,在開源的算法社區(qū)里,總會找到適合的場景算法。而在我們的平臺中,微軟的工程師已經(jīng)將業(yè)界最優(yōu)的算法放置在平臺中,用戶可以自行選擇是否使用該算法。通過拖拉拽的方式實(shí)現(xiàn)機(jī)器學(xué)習(xí)過程后,便可以實(shí)現(xiàn)分布式部署,最終形成規(guī)律和算法。
為什么我們要在開源中開放數(shù)據(jù)?微軟已經(jīng)將業(yè)界最新型的深度學(xué)習(xí)算法整合到我們的平臺中,并建立了開放的人工智能模型,可提高微軟云計(jì)算平臺的計(jì)算能力。
通過計(jì)算,用戶可以將算法部署到任何想部署的環(huán)節(jié)當(dāng)中。同時(shí)我們也提供高效的算力平臺,該平臺可以解決GPU的硬件設(shè)備算法和GPU的調(diào)度問題,并提供完整的端到端的解決方案。
我說過不能將所有工作放到平臺的后端,因?yàn)榇罅繑?shù)據(jù)處理需要在后端完成,在數(shù)據(jù)處理后就需要將它們遷移到前移的邊緣設(shè)備中。微軟有一個(gè)IoT Hub平臺,在這個(gè)系統(tǒng)中所有操作系統(tǒng)的傳感器全部是開源的。該系統(tǒng)可以通過我們最典型的安全協(xié)議,每秒可向云端上傳1000萬的數(shù)據(jù)量。
目前有很多汽車企業(yè)與共享單車企業(yè),都在利用IoT Hub快速收集數(shù)據(jù)的能力。比如當(dāng)一輛共享單車要解鎖時(shí),如果沒有網(wǎng)絡(luò),用戶的解鎖請求就無法傳遞到后端。但當(dāng)我們把云端的處理能力遷移到設(shè)備端時(shí),共享單車就可以不需要網(wǎng)絡(luò)進(jìn)行解鎖。
IoT Hub也是一個(gè)開源的平臺,用戶可以把程序運(yùn)行放入在設(shè)備端,并在后臺進(jìn)行訓(xùn)練。無論是人臉識別模型、聲音識別模型,還是設(shè)備開關(guān)的處理能力,都可以在這個(gè)平臺中進(jìn)行使用。
從最簡單的AI能力,一直到機(jī)器學(xué)習(xí)和深度學(xué)習(xí)平臺以及邊緣設(shè)備上的智能能力,就形成了微軟的云平臺,與此同時(shí),微軟也希望與更多的合作伙伴進(jìn)行合作,共同擴(kuò)展云與人工智能的能力。
(根據(jù)演講內(nèi)容整理,未經(jīng)本人審核)