胡 建,吳銳清
(西南民族大學計算機科學與技術學院,四川成都 610041)
基于人工智能技術的廣闊發(fā)展前景,眾多企業(yè)紛紛瞄準新興人工智能技術應用,不少高校也緊跟時代脈搏,新增人工智能、機器人工程、數(shù)據科學與大數(shù)據技術等專業(yè),以滿足國家和社會對新興產業(yè)發(fā)展的人才需求.在人工智能技術創(chuàng)新活躍、人工智能業(yè)態(tài)繁榮的大環(huán)境下,人工智能技術實驗教學也迅速發(fā)展以滿足巨大的行業(yè)人才需求,例如,在物理平臺類的實驗教學中,文獻[1]自制了冰壺機器人實驗教學設備,進行了人工智能實驗教學設計與實踐;文獻[2]打造了信息化、智能化與醫(yī)學教育高度融合的醫(yī)學智慧信息化實驗實訓教學平臺,強化醫(yī)學生臨床思維和臨床實踐能力訓練;文獻[3]研制了牧草撿拾堆垛機器人協(xié)作實驗平臺,探索了學生完成多個撿拾堆垛目標、多種路徑控制等綜合實驗;文獻[4]構建了農業(yè)機器人實驗平臺,探索了“人工智能+農業(yè)”方向的純理論教學和實踐應用的結合.這些研究雖然為人工智能人才培養(yǎng)研發(fā)了實驗教學平臺,但是也因當前國情和高?,F(xiàn)狀而存在著如下挑戰(zhàn):
1)大數(shù)據是人工智能技術應用得到大力發(fā)展的重要推動力,然而這些數(shù)據資源大多集中在大型互聯(lián)網公司,高校一般只能獲取有限的、甚至過時的公開數(shù)據集,這極大地限制了人工智能技術實驗教學活動的開展.
2)以深度學習技術為代表的新興人工智能技術,普遍需要巨大的算力,對設備要求比較高,單臺設備一般少則數(shù)萬.高校因設備昂貴而難以開展面向新興人工智能技術應用的、較大規(guī)模的人工智能技術實驗教學.
3)市場經濟環(huán)境下,用戶和企業(yè)的需求是促進各項技術發(fā)展的重要動力,人工智能技術也不例外.在人工智能技術領域,產業(yè)界憑借其強大財力和從市場獲得的大量一手數(shù)據資源,有能力對人工智能技術應用的市場需求做出迅速響應,從而引領人工智能技術的發(fā)展.而高校的人工智能技術實驗教學往往需要長時間的使用檢驗和技術積淀才“吹盡狂沙始到金”地選擇穩(wěn)定成熟的部分傳授給學生,雖然篩選出了經得起考驗和最有價值的部分,但同時不可避免地帶來脫離前沿,落后于產業(yè)界,不占時間先機的后果.
近兩年,隨著中臺概念的日益興起,國內大型互聯(lián)網公司逐步以人工智能中臺的面貌開放了部分人工智能平臺,提供人工智能賦能產業(yè)的一站式解決方案,實現(xiàn)人工智能生態(tài)全面布局,如百度[6]、阿里[7]、騰訊[8]等人工智能開放平臺.這些公司處于各自行業(yè)領域的前沿,擁有其行業(yè)領域最新的、最齊全的大數(shù)據資源,強大的云計算能力和面向產業(yè)界的人工智能應用.它們?yōu)榱颂岣咂溟_放平臺的競爭優(yōu)勢和滿足自身發(fā)展需求,其開放平臺以免費、少費、收費等多種方式,把數(shù)據資源、云計算能力面向不同用戶需求、不同程度地開放了開發(fā)接口和學習資源.
這些人工智能開放平臺的優(yōu)勢恰好可以用以破解上述實驗教學的困境,可以為發(fā)展實驗教學提供新的思路:借力互聯(lián)網,充分發(fā)掘和利用人工智能開放平臺資源作為實驗教學平臺.
為了選取較適合實驗教學的人工智能開放平臺,下面將調研百度[6]、阿里[7]、騰訊[8]、京東[9]、訊飛[10]、曠視[11]等六個人工智能開放平臺(下面簡稱百度、阿里、騰訊、京東、訊飛、曠視),對其在價格、功能數(shù)、開源軟件數(shù)、論文數(shù)等四方面作對比.
價格是實驗教學考慮的一個重要因素,不僅關系到課堂教學成本,而且涉及學生課后練習的積極性.本文選取在人臉識別和通用文字識別這兩個常用功能上的價格進行對比.
表1為通過共有云API調用人臉識別功能和通用文字識別功能的價格對比結果,數(shù)據來源于2020年5月下旬的各平臺官網,其中QPS表示每秒請求數(shù).由圖可見,除了少數(shù)幾個未見公開價格外,其余多數(shù)平臺有免費使用量,其中百度、騰訊、曠視沒有免費時間限制,它們在價格方面是實驗教學的優(yōu)選項.
表1 人臉識別和通用文字識別價格對比Table 1 Price of face recognition and general character recognition
功能數(shù)在一定程度上代表了平臺在人工智能應用的細化和可選范圍,功能越多的平臺越有利于在人工智能應用層面上的實驗教學內容擴大范圍.在人工智能技術的細分領域中,計算機視覺、自然語言處理是應用最廣、近幾年發(fā)展最快的技術.本文對六個平臺在這兩個細分領域的功能數(shù)進行了對比.
圖1是對比結果.由圖可見,功能數(shù)從多到少的順序依次為百度、京東、訊飛、阿里、騰訊和曠視,其中百度優(yōu)勢明顯,可作為在人工智能應用層面上實驗教學的優(yōu)選項.
圖1 人工智能開放平臺間功能數(shù)對比Fig.1 Number of functions in AI open platforms
開源軟件數(shù)在很大程度上代表了人工智能開放平臺的底層開放程度,開源軟件越多的平臺越有利于實驗教學深入軟件代碼層面.
開源中國社區(qū)[12]是目前國內最大的開源技術社區(qū),它為軟件開發(fā)者們提供了一個發(fā)現(xiàn)、使用、交流開源技術的平臺.在該平臺上,部分軟件帶有官方推薦標識,該標識在一定程度上代表了軟件質量.圖2為六個人工智能開放平臺在開源中國社區(qū)上的開源軟件數(shù)量對比結果.由圖可見,曠視與訊飛在開源中國社區(qū)上沒有開源軟件,而其余平臺無論就總的開源軟件數(shù),還是就帶推薦標識的軟件數(shù),從多到少的順序均為阿里、騰訊、百度和京東.
圖2 開源中國社區(qū)上各平臺開源軟件數(shù)量對比Fig.2 Number of open source software from AI open platforms in OSCHINA
GitHub[13]是國際上流行的開源及私有軟件項目的托管平臺,各軟件上記錄有“star”數(shù),該值代表了用戶對該軟件的滿意程度.圖3為六個人工智能平臺在GitHub上的開源軟件數(shù)量對比結果,其中:按照“star”數(shù)的多少,劃分為“star”數(shù)小于100的軟件數(shù)量、“star”數(shù)大于等于100且小于等于1 000的軟件數(shù)量、“star”數(shù)大于1 000的軟件數(shù)量等三個層次;部分數(shù)據來自于多個賬號所發(fā)布開源軟件的總和,即,百度數(shù)據來自于“百度”、“百度 EFE團隊”、“百度FEX團隊”等三個賬號,京東數(shù)據來自于“中國京東”、“TIGLabs”、“JDRD FEB”等三個賬號,曠視數(shù)據來自于“MegEngine天元”、“Face++ |曠視”、“megvii-model”等三個賬號,騰訊數(shù)據來自于“騰訊”、“騰訊 AlloyTeam”、“WeUI”等三個賬號.可見,按開源軟件數(shù)從多到少的順序依次為百度、阿里、騰訊、京東、曠視,而未見訊飛有相關開源軟件.
圖3 GitHub上各平臺開源軟件數(shù)量對比Fig.3 Number of open source software from AI open platforms in GitHub
綜合開源中國社區(qū)和GitHub上的數(shù)據,阿里、百度、騰訊三者在開源軟件數(shù)上優(yōu)勢明顯,可作為軟件代碼層面上實驗教學的優(yōu)選項.
學術論文可以反映特定機構在科學技術上的創(chuàng)新,可用于實驗教學中引導學生跟進前沿技術,促進實驗教學在理論與實際操作上相結合.論文數(shù)可以在一定程度上反映機構在科學技術創(chuàng)新上的能力.人工智能屬于工程技術,本文對比了六個人工智能開放平臺所在公司被美國工程索引(EI Compendex)數(shù)據庫收錄的論文數(shù).
圖4顯示了對比結果,其中為了對比論文數(shù)趨勢,論文被分為2018年之前和2018年及之后兩部分.可見,無論就論文總數(shù),還是就論文數(shù)趨勢,從多到少的順序均為阿里、騰訊、百度、訊飛、曠視和京東,其中阿里、騰訊、百度在論文數(shù)上優(yōu)勢明顯,可作為在技術理論深入和擴展層面上實驗教學的優(yōu)選項.
圖4 EI Compendex收錄論文數(shù)對比Fig.4 Number of papers indexed in EI Compendex
近些年來,人工智能技術和應用發(fā)展迅速,相關人才需求急劇上升,人工智能技術實驗教學顯得十分重要.雖然已有一些人工智能實驗教學平臺建設已有成效,但存在數(shù)據資源不足、設備昂貴、技術相對落后等三方面困境.同時,隨著中臺概念的日益興起,一些大型互聯(lián)網公司逐步建設并以免費、少費、收費等多種方式運營著人工智能開放平臺,這些平臺具有新的、齊全的大數(shù)據資源,強大的云計算能力和新的人工智能技術.基于此,本文提出借力互聯(lián)網、充分發(fā)掘利用人工智能開放平臺資源來破解人工智能技術實驗教學困境,并就實驗教學中人工智能開放平臺的選擇問題,對國內六個人工智能開放平臺在價格、功能數(shù)、開源軟件數(shù)、論文數(shù)等四個方面進行了調研和對比.對比結果為:百度、騰訊、曠視有免費使用量且無時間限制,在價格方面是優(yōu)選項;百度有較多功能,可作為在人工智能應用層面上實驗教學的優(yōu)選項;阿里、百度、騰訊在開源軟件數(shù)上優(yōu)勢明顯,可作為軟件代碼層面上實驗教學的優(yōu)選項;阿里、騰訊、百度在論文數(shù)上優(yōu)勢明顯,可作為在技術理論深入和擴展層面上實驗教學的優(yōu)選項.
上述研究可為人工智能技術實驗教學困境的解決以及在實驗教學時人工智能開放平臺的選擇,提供有益參考.但由于人工智能技術領域廣闊且人工智能開放平臺更新迅速,面向實驗教學的人工智能開放平臺對比研究仍是開放性的,其價格、功能數(shù)、開源軟件、論文數(shù)等在不斷變化,仍需持續(xù)跟蹤;平臺對比范圍有待擴大,如可涵蓋亞馬遜人工智能平臺、英特爾人工智能平臺等,而且平臺內部的功能及價格項也可更細分和深入.