• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      數(shù)據(jù)易得真是中國人工智能產(chǎn)業(yè)的優(yōu)勢嗎

      2017-12-29 21:38:40李軍
      財經(jīng) 2017年28期
      關(guān)鍵詞:人工智能算法

      隱私數(shù)據(jù)泛濫短期內(nèi)降低了人工智能的開發(fā)門檻,讓算法的設(shè)計實現(xiàn)更加簡單,但這以數(shù)據(jù)所有權(quán)的粗暴剝奪和算法濫用為代價,不可能是長久之計

      11月21日《金融時報》刊出李開復先生寫的一篇文章《中國搞21世紀數(shù)字經(jīng)濟的條件比美國有利》,文中談到,中國人已開始在智慧城市開展大數(shù)據(jù)收集工作,公民的隱私當然會受到損害,但算法也將因此變得更加豐富。中國政府善于——借用馬克·扎克伯格的話來說——“快速行動,破除陳規(guī)”。巨大的消費市場,以及持續(xù)的增長潛力,將使中國有可能發(fā)展出一套頗具經(jīng)濟效益且獨立于西方的數(shù)字生態(tài)系統(tǒng)……

      此文令筆者驚詫莫名。李開復先生是IT與互聯(lián)網(wǎng)行業(yè)的意見領(lǐng)袖,前Google公司中國區(qū)總經(jīng)理,更是互聯(lián)網(wǎng)創(chuàng)業(yè)投資行業(yè)的領(lǐng)軍人物。對于數(shù)字化與人工智能的發(fā)展,李先生應(yīng)該有比絕大部分IT與互聯(lián)網(wǎng)人士更加深刻的洞察。但認為公民隱私數(shù)據(jù)濫用會推動人工智能和相關(guān)的算法演進,中國因此比美國更有利于發(fā)展數(shù)字經(jīng)濟,卻是一種片面與短視的認識,必須加以澄清。

      弱人工智能時代的數(shù)據(jù)污染

      人工智能作為一種最新的信息技術(shù)手段,核心就是通過模仿人類的學習過程,以海量數(shù)據(jù)對于特定的復雜數(shù)學模型(如神經(jīng)網(wǎng)絡(luò))進行訓練,通過數(shù)學模型的逐步優(yōu)化,建立包含智能化業(yè)務(wù)規(guī)則的系統(tǒng)并加以實用。

      現(xiàn)階段的人工智能是弱人工智能,其特點是:1.單一模型只能針對特定應(yīng)用;2.需要海量的正確數(shù)據(jù)進行模型訓練;3.產(chǎn)生的智能化業(yè)務(wù)規(guī)則可解釋性極差。

      換句話說,一個弱人工智能系統(tǒng)就是一個專用的無法打開的黑盒子,既沒有高適應(yīng)性,也無法拆解出具體的智能化業(yè)務(wù)規(guī)則,而且高度依賴于參與訓練的海量數(shù)據(jù)。

      從目前的業(yè)務(wù)實踐來看,構(gòu)建人工智能系統(tǒng),絕大部分工作是數(shù)據(jù)準備,包括設(shè)計數(shù)據(jù)、獲取數(shù)據(jù)、清洗數(shù)據(jù)和整合數(shù)據(jù)等步驟。這部分工作平均要花費60%-70%的時間。對于大型的人工智能系統(tǒng),一般會安排專門的數(shù)據(jù)工程師按照數(shù)據(jù)科學家的要求進行數(shù)據(jù)準備。

      在弱人工智能發(fā)展階段,人工智能系統(tǒng)高度依賴于海量數(shù)據(jù)訓練,并且算法本身對錯誤數(shù)據(jù)幾乎沒有甄別能力。

      數(shù)據(jù)作為整個人工智能產(chǎn)業(yè)鏈的最上游,數(shù)據(jù)的任何問題都有可能影響到人工智能的產(chǎn)業(yè)鏈中下游甚至最終的全面應(yīng)用。

      試想一下,如果支撐人工智能的關(guān)鍵數(shù)據(jù)來源是灰色的甚至是黑色的,這就意味著從源頭開始的數(shù)據(jù)采集、處理、傳遞和數(shù)據(jù)質(zhì)量管理就處于失控狀態(tài)。

      數(shù)據(jù)使用者無法通過追溯的方式了解數(shù)據(jù)本身的采集要求,更不可能通過提高數(shù)據(jù)源數(shù)據(jù)質(zhì)量的方式訓練出更加高質(zhì)量的模型。在很多場景下,來源不明的數(shù)據(jù)甚至無法手工剔除錯誤,以避免對模型訓練的干擾。

      如果非法數(shù)據(jù)的提供方出于某些目的對數(shù)據(jù)進行特定方向的加工處理,并提供給人工智能企業(yè),那基于這些數(shù)據(jù)訓練出的模型就可能受到特定方向的誤導,造成模型畸形,未來的全面應(yīng)用就有可能會面臨極大風險。

      盡管目前還沒有這樣的案例出現(xiàn),但從理論上來分析,這是完全可能的,非法數(shù)據(jù)來源正在為人工智能應(yīng)用埋下未知風險。

      對于中小企業(yè)的人工智能應(yīng)用,數(shù)據(jù)污染和算法畸形可能不會造成嚴重后果,畢竟應(yīng)用范圍有限。但對于涉及國計民生或者是對市場有重大影響的行業(yè),嚴控訓練數(shù)據(jù)來源、數(shù)據(jù)質(zhì)量,是企業(yè)和政府必須考慮的問題。

      李軍

      2016年10月美國國家科技委員會公布的《美國國家人工智能研究和發(fā)展戰(zhàn)略計劃》中有七大戰(zhàn)略計劃,第五個就是開發(fā)用于人工智能培訓及測試的公共數(shù)據(jù)集和環(huán)境。

      這份戰(zhàn)略計劃中談到,政府將開發(fā)滿足多樣化人工智能興趣與應(yīng)用的豐富數(shù)據(jù)集,并開放滿足商業(yè)和公共利益的訓練測試資源,以支持企業(yè)在豐富健康的大數(shù)據(jù)環(huán)境下加速人工智能技術(shù)發(fā)展,規(guī)避數(shù)據(jù)缺陷本身帶來的潛在風險。

      播灑跳蚤,收獲的絕對不會是巨龍。不合法不健康缺乏管控的大數(shù)據(jù)基礎(chǔ),很難構(gòu)建出有強大競爭力的人工智能產(chǎn)業(yè)環(huán)境。那些認為損害隱私會帶來算法提升乃至獲得數(shù)字經(jīng)濟競爭優(yōu)勢的想法是片面的、短視的。

      隱私濫用動搖數(shù)據(jù)基礎(chǔ)

      盜版音樂從根本上動搖了音樂產(chǎn)業(yè)的價值鏈,對音樂產(chǎn)業(yè)的生產(chǎn)環(huán)節(jié)是毀滅性的打擊,這個道理也適用于人工智能和數(shù)據(jù)生產(chǎn)的關(guān)系。

      對于人工智能應(yīng)用來說,數(shù)據(jù)絕不是俯首可得的,這需要一個健康的產(chǎn)業(yè)環(huán)境,從數(shù)據(jù)收集、數(shù)據(jù)清洗、數(shù)據(jù)匹配到數(shù)據(jù)集成。一個廣泛應(yīng)用的人工智能應(yīng)用往往要牽涉到多個產(chǎn)業(yè)的數(shù)據(jù)合作,這也是數(shù)據(jù)服務(wù)提供商存在的基礎(chǔ)。

      數(shù)據(jù)服務(wù)商獲取合法的數(shù)據(jù),以脫敏操作為前提進行數(shù)據(jù)整合,并按照所服務(wù)企業(yè)的要求提供數(shù)據(jù)和分析,最終獲得自身的良性發(fā)展。

      所謂數(shù)據(jù)脫敏,是對某些敏感信息通過脫敏規(guī)則進行數(shù)據(jù)的變形,實現(xiàn)敏感隱私數(shù)據(jù)的可靠保護。在涉及客戶安全數(shù)據(jù)或者一些商業(yè)性敏感數(shù)據(jù)的情況下,在不違反系統(tǒng)規(guī)則條件下,對真實數(shù)據(jù)進行改造并提供測試使用,如身份證號、手機號、卡號等個人信息都需要進行數(shù)據(jù)脫敏。

      低價劣質(zhì)的私鹽泛濫,正規(guī)的鹽業(yè)市場一定會萎縮。如果隱私數(shù)據(jù)泛濫,數(shù)據(jù)服務(wù)行業(yè)就會受到沉重的打擊。

      有了近乎免費的數(shù)據(jù)資源,沒有人再愿意為數(shù)據(jù)支付合理的價格。數(shù)據(jù)產(chǎn)業(yè)最前端的數(shù)據(jù)準備和整合環(huán)節(jié)不再能夠得到合理的收益,費力卻沒有回報的數(shù)據(jù)基礎(chǔ)性工作就始終無法健康發(fā)展,最終動搖整個數(shù)據(jù)產(chǎn)業(yè)良性發(fā)展的基礎(chǔ)。

      當真正需要使用數(shù)據(jù)的企業(yè)在市場上茫然四顧,發(fā)現(xiàn)數(shù)據(jù)準備和整合的工作必須要自己從頭做起,我不知道這算是什么數(shù)字化的競爭優(yōu)勢!

      整合善用才是關(guān)鍵

      在IT和互聯(lián)網(wǎng)專業(yè)人士眼中的大數(shù)據(jù),尤其是推動整個數(shù)字化社會層面的大數(shù)據(jù),有更加寬廣的范疇。隱私數(shù)據(jù)只是大數(shù)據(jù)藍圖中的小小一塊拼圖。要讓社會全面進入數(shù)字化發(fā)展階段,跨行業(yè)、跨企業(yè)、政企融合后的數(shù)據(jù)才是構(gòu)建數(shù)字化社會堅實的基礎(chǔ)。

      猜你喜歡
      人工智能算法
      我校新增“人工智能”本科專業(yè)
      基于MapReduce的改進Eclat算法
      Travellng thg World Full—time for Rree
      2019:人工智能
      商界(2019年12期)2019-01-03 06:59:05
      進位加法的兩種算法
      人工智能與就業(yè)
      算法初步兩點追蹤
      數(shù)讀人工智能
      小康(2017年16期)2017-06-07 09:00:59
      基于增強隨機搜索的OECI-ELM算法
      下一幕,人工智能!
      南風窗(2016年19期)2016-09-21 16:51:29
      福清市| 屯昌县| 金塔县| 于田县| 吉林省| 突泉县| 上栗县| 安陆市| 乐业县| 建昌县| 政和县| 平潭县| 南平市| 婺源县| 东明县| 宣城市| 安远县| 金平| 泾阳县| 灌南县| 涞水县| 吴忠市| 清新县| 汤原县| 疏勒县| 岑溪市| 株洲市| 安吉县| 长阳| 开封市| 石景山区| 得荣县| 开原市| 高要市| 三江| 武平县| 襄樊市| 客服| 寻乌县| 齐齐哈尔市| 天峻县|