• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      培養(yǎng)合格人工智能編輯分幾步

      2020-11-05 10:28:56陳曦
      發(fā)明與創(chuàng)新 2020年37期
      關(guān)鍵詞:韓亞人臉識(shí)別人臉

      文/陳曦

      圖/東方IC

      前段時(shí)間,微軟宣布擬裁撤近80名外包編輯,由人工智能編輯負(fù)責(zé)接下來(lái)的MSN網(wǎng)站的新聞抓取、排版和配圖等工作。但沒(méi)想到,剛到崗沒(méi)多久,人工智能編輯就“翻車(chē)”了。人工智能編輯在尋找配圖時(shí),把非裔歌手Leigh與阿拉伯裔歌手Jade弄混了。為何一向以高識(shí)別率著稱(chēng)的人工智能,這次卻“翻車(chē)”了?

      解決臉盲問(wèn)題需不斷擴(kuò)大學(xué)習(xí)范圍

      人臉識(shí)別技術(shù)是目前人工智能領(lǐng)域公認(rèn)的比較成熟的技術(shù),圈內(nèi)人士也熱衷像刷分一樣把人臉識(shí)別準(zhǔn)確率屢屢刷出新高,最高的號(hào)稱(chēng)準(zhǔn)確率可達(dá)99.9%。人臉識(shí)別技術(shù)有如此輝煌的戰(zhàn)績(jī),為何此次人工智能編輯還會(huì)臉盲?

      “人臉識(shí)別技術(shù)的工作原理,主要是比對(duì)五官比例以及面部特征。”天津大學(xué)智能與計(jì)算學(xué)部教授韓亞洪解釋?zhuān)?jiǎn)單說(shuō),就是基于人臉圖像的大數(shù)據(jù),先對(duì)看到的人臉圖像進(jìn)行預(yù)處理,提取面部各個(gè)方面的特征,并通過(guò)分層多次提取,尋找對(duì)于識(shí)別個(gè)體人臉最有效的特征表達(dá)。

      人臉識(shí)別技術(shù)這些年已經(jīng)發(fā)生了重大變化,傳統(tǒng)的人臉識(shí)別方法已被基于卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)方法替代。深度學(xué)習(xí)方法的主要優(yōu)勢(shì)是它們可通過(guò)大規(guī)模數(shù)據(jù)集進(jìn)行訓(xùn)練,從而學(xué)習(xí)到這些數(shù)據(jù)的最佳特征。

      “雖然可以使用大規(guī)模數(shù)據(jù)集進(jìn)行訓(xùn)練,但是目前99.9%的準(zhǔn)確率基本上是在一些基準(zhǔn)的數(shù)據(jù)集上測(cè)試的結(jié)果。這個(gè)數(shù)據(jù)集肯定是有范圍的,如果收集的數(shù)據(jù)是在數(shù)據(jù)集分布的范圍內(nèi),便可獲得比較高的準(zhǔn)確率?!表n亞洪說(shuō)。

      據(jù)了解,目前號(hào)稱(chēng)人臉識(shí)別準(zhǔn)確率達(dá)99%以上的,很多指的都是和全世界最權(quán)威的人臉數(shù)據(jù)庫(kù)LFW(Labeled Faces in the Wild)進(jìn)行比對(duì)測(cè)試的成績(jī)。LFW可以被認(rèn)作一個(gè)考查深度學(xué)習(xí)系統(tǒng)人臉識(shí)別能力的題庫(kù),它從互聯(lián)網(wǎng)上提取6000張不同朝向、表情和光照環(huán)境的人臉照片作為考題,可以讓任何系統(tǒng)在里面“跑分”。“跑分”過(guò)程是LFW給出一對(duì)照片,詢(xún)問(wèn)測(cè)試系統(tǒng)兩張照片是不是同一個(gè)人,系統(tǒng)給出Yes或No的答案。

      “解決特定的臉盲問(wèn)題并不難,其實(shí)就是重新針對(duì)任務(wù),收集這項(xiàng)任務(wù)領(lǐng)域內(nèi)的人臉圖像,在原有算法模型上訓(xùn)練,或重新設(shè)計(jì)新的算法模型進(jìn)行訓(xùn)練,都會(huì)提高人臉識(shí)別率,以滿足實(shí)際應(yīng)用的需求?!表n亞洪說(shuō),但是超出了特定任務(wù),人工智能的“臉盲癥”就會(huì)復(fù)發(fā)。目前并沒(méi)有哪個(gè)通用的模型算法可以解決所有的任務(wù),但是人工智能可以通過(guò)不斷地調(diào)整及大量的學(xué)習(xí),從而提高人臉識(shí)別的準(zhǔn)確性。

      深度神經(jīng)網(wǎng)絡(luò)模型是進(jìn)階的必要條件

      “目前針對(duì)新聞文檔的分析和處理任務(wù),人工智能編輯做起來(lái)相對(duì)得心應(yīng)手?!表n亞洪介紹,具體地說(shuō),比如在一篇很長(zhǎng)的報(bào)道中,讓人工智能編輯把重點(diǎn)摘出來(lái),這是沒(méi)有問(wèn)題的。當(dāng)下,大量的新聞報(bào)道會(huì)涉及圖片和視頻,人工智能編輯可以將圖片或者視頻自動(dòng)提取出來(lái),再?gòu)拇笃奈淖謭?bào)道中,選取與之相匹配的文字說(shuō)明,這個(gè)工作人工智能是可以比較準(zhǔn)確地做到的。

      “解決特定領(lǐng)域的問(wèn)題,人工智能大多時(shí)候還是沒(méi)問(wèn)題的,但是要實(shí)現(xiàn)通用,就比較難了。”韓亞洪強(qiáng)調(diào),實(shí)現(xiàn)這些功能需要用到自然語(yǔ)言處理、模式識(shí)別、圖像視頻理解等領(lǐng)域的技術(shù)。

      要培養(yǎng)一名人工智能編輯,首先需要收集大量的新聞報(bào)道和圖片視頻,再根據(jù)收集到的數(shù)據(jù)設(shè)計(jì)一個(gè)針對(duì)這個(gè)任務(wù)的深度神經(jīng)網(wǎng)絡(luò)模型,網(wǎng)絡(luò)模型里會(huì)有很多參數(shù),然后通過(guò)數(shù)據(jù)把參數(shù)訓(xùn)練出來(lái),它就具備了最初設(shè)定的各種編輯能力。在使用過(guò)程中,人工智能編輯會(huì)學(xué)習(xí)更多的新聞,它的業(yè)務(wù)能力和性能也將不斷提升。

      “不過(guò)目前的新聞生產(chǎn)對(duì)于人工智能編輯來(lái)說(shuō)還很困難?!表n亞洪說(shuō),要讓人工智能學(xué)會(huì)寫(xiě)新聞,必須要針對(duì)某個(gè)特定新聞主題,進(jìn)行大量資料搜集和模型訓(xùn)練。目前人工智能技術(shù)只能在風(fēng)格相對(duì)固定、詞匯量使用范圍較小的領(lǐng)域完成文本生成,比如天氣預(yù)報(bào)等內(nèi)容,人工智能編輯可以很好地輸出相關(guān)報(bào)道和消息。但要生成有創(chuàng)新要求、情感描述豐富的文章,人工智能編輯的能力仍有待提升。

      協(xié)作將使新聞生產(chǎn)更加高效

      “有趣的是,人工智能犯的錯(cuò)誤大多是我們意想不到的低級(jí)錯(cuò)誤,但在某些方面又強(qiáng)悍到讓人類(lèi)望塵莫及。”韓亞洪舉例說(shuō),像給文章分類(lèi)這種工作,人類(lèi)編輯要進(jìn)行大量閱讀,重復(fù)性勞動(dòng)耗時(shí)耗力,速度非常慢。但這項(xiàng)工作人工智能編輯做起來(lái)就非常簡(jiǎn)單。另外,對(duì)于可以使用模板的短新聞,比如天氣預(yù)報(bào)、證券信息等,人工智能編輯可以準(zhǔn)確迅速地將各種數(shù)字或者專(zhuān)有名詞嵌套到模板中,從而完成一定的文檔生成任務(wù)。

      美聯(lián)社曾使用人工智能系統(tǒng)自動(dòng)編發(fā)企業(yè)財(cái)報(bào)。人工智能系統(tǒng)對(duì)數(shù)據(jù)進(jìn)行自動(dòng)抓取,將其嵌套在美聯(lián)社預(yù)先設(shè)定的新聞模板中,幾秒鐘就能完成一篇150字至300字的短消息,該系統(tǒng)每季度能產(chǎn)出約4000篇新聞,與之相比,美聯(lián)社的人工編輯們每季度只能完成400篇。

      做這些特定的工作,人工智能編輯比人類(lèi)厲害的地方不僅在于速度,準(zhǔn)確率也可圈可點(diǎn)。“像分類(lèi)或者是嵌套模板寫(xiě)短消息這類(lèi)的工作,因?yàn)槿蝿?wù)明確,人工智能的準(zhǔn)確率還是非常高的,很少出現(xiàn)錯(cuò)別字或者數(shù)據(jù)錯(cuò)誤。”韓亞洪介紹。

      在運(yùn)用大數(shù)據(jù)分析預(yù)測(cè)爆款方面,人工智能編輯可能比人類(lèi)單純從經(jīng)驗(yàn)出發(fā)顯得更“科學(xué)”。2015年,《紐約時(shí)報(bào)》使用人工智能機(jī)器人對(duì)社交平臺(tái)中的文章進(jìn)行篩選和分析,預(yù)測(cè)哪部分內(nèi)容適合推廣。凡是由它自動(dòng)推薦的文章的點(diǎn)擊量都大大增加,甚至達(dá)到了普通文章的38倍。

      “但在人工智能編輯的世界中,只有知道和不知道兩種狀態(tài),因此處理的內(nèi)容一旦超綱,它們就會(huì)犯很多低級(jí)到可笑的錯(cuò)誤。”韓亞洪說(shuō),像這次人工智能編輯就把非裔歌手Leigh與阿拉伯裔歌手Jade弄混了。

      “目前階段的編輯工作完全依賴(lài)人工智能是不現(xiàn)實(shí)的,讓人工智能成為人類(lèi)編輯的幫手似乎更切實(shí)可行?!表n亞洪說(shuō)。美聯(lián)社預(yù)測(cè),人工智能介入媒體行業(yè)能幫助新聞工作者釋放20%左右的時(shí)間,讓后者可以將這部分時(shí)間更多地投入到內(nèi)容創(chuàng)作方面,簡(jiǎn)單的事實(shí)核查與調(diào)研方面的工作交給人工智能,有利于提高新聞質(zhì)量。

      “未來(lái),人類(lèi)應(yīng)該把人工智能編輯當(dāng)作合作伙伴,雙方協(xié)同起來(lái),使工作更加高效高質(zhì)?!表n亞洪說(shuō),人類(lèi)不應(yīng)該覺(jué)得人工智能是來(lái)“搶飯碗”的,而應(yīng)該為有人工智能這樣的合作伙伴而感到幸運(yùn)。

      猜你喜歡
      韓亞人臉識(shí)別人臉
      人臉識(shí)別 等
      有特點(diǎn)的人臉
      揭開(kāi)人臉識(shí)別的神秘面紗
      三國(guó)漫——人臉解鎖
      “網(wǎng)紅”韓亞
      派出所工作(2018年1期)2018-05-30 10:48:04
      基于類(lèi)獨(dú)立核稀疏表示的魯棒人臉識(shí)別
      馬面部與人臉相似度驚人
      長(zhǎng)得象人臉的十種動(dòng)物
      奇聞怪事(2014年5期)2014-05-13 21:43:01
      基于K-L變換和平均近鄰法的人臉識(shí)別
      河曲县| 安阳市| 乌什县| 三原县| 斗六市| 武定县| 九龙城区| 台南县| 易门县| 丘北县| 富源县| 古浪县| 屏山县| 三台县| 北流市| 舞阳县| 康马县| 自贡市| 昌邑市| 宁晋县| 木里| 德保县| 德化县| 北海市| 平谷区| 泰顺县| 朝阳区| 淳化县| 宝应县| 华阴市| 德兴市| 山丹县| 大宁县| 黄平县| 宿迁市| 南投县| 房产| 汝阳县| 刚察县| 临猗县| 卢氏县|