• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      人工智能在教育試題檢索中的應(yīng)用與探索

      2020-07-06 03:39:35蘇喻汪成成張丹王士進(jìn)
      中國(guó)新通信 2020年3期
      關(guān)鍵詞:題庫(kù)淺層檢索

      蘇喻 汪成成 張丹王士進(jìn)

      摘要:隨著互聯(lián)網(wǎng)技術(shù)的不斷進(jìn)步,在線(xiàn)教育行業(yè)得到了蓬勃的發(fā)展。借助人工智能和大數(shù)據(jù)技術(shù),教育個(gè)性化學(xué)習(xí)系統(tǒng)能夠?qū)崿F(xiàn)學(xué)生的學(xué)情分析,為學(xué)生推薦個(gè)性化學(xué)習(xí)資源,從而提升老師的教學(xué)效率和學(xué)生的學(xué)習(xí)效率,并為教育管理者提供決策依據(jù)[1]。

      關(guān)鍵詞:智能;教育;試題檢索

      常見(jiàn)的教育個(gè)性化學(xué)習(xí)系統(tǒng)通過(guò)多元用戶(hù)數(shù)據(jù)終端收集用戶(hù)行為日志等,一方面對(duì)答題記錄中的試題進(jìn)行建模,構(gòu)建結(jié)構(gòu)化題庫(kù);另一方面對(duì)學(xué)生進(jìn)行學(xué)情建?;?qū)蠋煹氖褂昧?xí)慣建模(即用戶(hù)建模),生成學(xué)生的學(xué)情畫(huà)像或教師的教學(xué)畫(huà)像(即用戶(hù)畫(huà)像)。最后,基于結(jié)構(gòu)化題庫(kù)、用戶(hù)畫(huà)像和具體應(yīng)用場(chǎng)景,融合相關(guān)的人工智能算法,形成一系列的個(gè)性化學(xué)習(xí)應(yīng)用,如基于內(nèi)容的推薦模式等。

      個(gè)性化學(xué)習(xí)應(yīng)用中的各種模式,均會(huì)直接或間接利用到試題檢索技術(shù),比如基于內(nèi)容的推薦模式中,系統(tǒng)根據(jù)一道試題的題面和語(yǔ)義信息,從海量題庫(kù)中找到其相似的試題集合。因此,試題檢索技術(shù)是教育個(gè)性化學(xué)習(xí)系統(tǒng)的基礎(chǔ)性技術(shù)。

      一、試題檢索所面臨的挑戰(zhàn)

      相較于互聯(lián)網(wǎng)領(lǐng)域的檢索技術(shù),教育領(lǐng)域?qū)υ囶}的檢索精度要求更高,會(huì)面臨如下諸多難點(diǎn)。

      第一,同樣的試題表示呈多樣化。具有同樣知識(shí)點(diǎn)的題目,在題面內(nèi)容表述可能有較大差異。這種特性給試題語(yǔ)義表征造成了困難。

      第二,由于不同教育專(zhuān)家對(duì)知識(shí)體系的理解不同,因此知識(shí)點(diǎn)標(biāo)簽沒(méi)有統(tǒng)一的標(biāo)準(zhǔn)體系,如果題庫(kù)不按照某一標(biāo)準(zhǔn)重新標(biāo)注,則不能直接用于檢索。而完全基于人工標(biāo)簽的試題檢索方案要花費(fèi)巨大的人工標(biāo)注量[2]。如何利用試題上已有的多標(biāo)準(zhǔn)的知識(shí)點(diǎn)標(biāo)簽進(jìn)行檢索,給任務(wù)帶來(lái)了難題。

      第三,在實(shí)際應(yīng)用場(chǎng)景中,需要從海量的題庫(kù)中實(shí)時(shí)檢索出符合用戶(hù)個(gè)性化需求的試題,既要滿(mǎn)足效率上的實(shí)時(shí)性,又要滿(mǎn)足效果上的可用性。

      二、試題檢索的主要流程及相關(guān)技術(shù)介紹

      試題檢索系統(tǒng)一般分為三個(gè)主要步驟。首先,根據(jù)被檢索試題的淺層語(yǔ)義特征,采用基于淺層特征的召回技術(shù),快速?gòu)暮A款}庫(kù)中檢索出和被檢索試題相關(guān)的候選試題集合;然后,利用基于神經(jīng)網(wǎng)絡(luò)的精排技術(shù),將候選試題集合進(jìn)行二次排序,以獲得更精準(zhǔn)的檢索結(jié)果;此外,對(duì)于一些強(qiáng)調(diào)用戶(hù)個(gè)性化的場(chǎng)景中,還會(huì)利用基于用戶(hù)的個(gè)性化推薦技術(shù),根據(jù)用戶(hù)的搜索習(xí)慣對(duì)二次排序結(jié)果進(jìn)行調(diào)整,最大程度的滿(mǎn)足用戶(hù)個(gè)性化需求。

      基于淺層特征的召回技術(shù)的主要作用是從海量的候選題庫(kù)中快速召回符合條件的相關(guān)試題候選集合,此步驟更加注重于檢索效率。一般而言,被檢索的試題淺層特征為文本中的關(guān)鍵詞,知識(shí)點(diǎn)標(biāo)簽等。該技術(shù)通過(guò)構(gòu)建淺層特征到試題ID的倒排索引存儲(chǔ)形式,可以根據(jù)試題的淺層特征組合快速獲取包含這些特征的試題候選集合。試題檢索中的淺層特征召回技術(shù)一般采用Lucene、Solr、Elasticsearch等[3]。Lucene是基于Java開(kāi)發(fā)的文本信息檢索工具,當(dāng)前流行的檢索召回系統(tǒng)Elasticsearch和Solr都是基于Lucene開(kāi)發(fā)的,提供了比Lucene更為豐富的查詢(xún)語(yǔ)言,并且擴(kuò)展性和查詢(xún)性能更優(yōu)。

      在召回技術(shù)所獲得的試題候選基礎(chǔ)上,要進(jìn)行二次精排,該部分更加注重檢索精度。隨著深度學(xué)習(xí)技術(shù)在自然語(yǔ)言處理領(lǐng)域的不斷進(jìn)步,基于神經(jīng)網(wǎng)絡(luò)的精排技術(shù)逐漸被提出。此類(lèi)技術(shù)常見(jiàn)的有基于標(biāo)簽預(yù)測(cè)的方法和基于相似試題對(duì)關(guān)系的學(xué)習(xí)方法。前者通過(guò)訓(xùn)練試題知識(shí)點(diǎn)標(biāo)簽預(yù)測(cè)模型,得到稠密的試題語(yǔ)義向量表示,然后利用向量間的距離,去估計(jì)兩道試題語(yǔ)義間的關(guān)系。該種建模方法可以利用TextCNN、Transformer、Bert[4]等模型?;谙嗨圃囶}對(duì)關(guān)系的學(xué)習(xí)方法,模型的輸入是兩道試題文本,訓(xùn)練目標(biāo)是判斷兩道題是否為相似題。二次精排可以通過(guò)訓(xùn)練好的模型直接預(yù)估兩道題的相似度,在擁有大量訓(xùn)練數(shù)據(jù)的情況下能夠取得更好的效果。

      在一些場(chǎng)景中,還需要在檢索過(guò)程中考慮用戶(hù)個(gè)性化信息。如在教師給一道考試題搭配相關(guān)鞏固試題的場(chǎng)景中,有些老師傾向于選擇偏同步學(xué)習(xí)類(lèi)的試題,另外一些老師則可能傾向于綜合復(fù)習(xí)類(lèi)。因子分解機(jī)(FM)模型可以將考區(qū)、考試類(lèi)型等二階特征組合融入到模型中,用于個(gè)性化推薦?;谏窠?jīng)網(wǎng)絡(luò)的推薦模型,如Wide&Deep[5]、DeepFM[6]等模型,也可以應(yīng)用到試題個(gè)性化檢索中。近年來(lái),融入注意力(Attention)機(jī)制[7]和知識(shí)圖譜的推薦系統(tǒng)不斷的被提出,有效的提升了神經(jīng)網(wǎng)絡(luò)模型的可解釋性。試題檢索系統(tǒng)可以采用這些研究方案,對(duì)檢索結(jié)果提供諸如知識(shí)點(diǎn)相似度、試題難度符合度等信息,供用戶(hù)進(jìn)行二次篩選。

      三、總結(jié)與展望

      隨著教育個(gè)性化學(xué)習(xí)系統(tǒng)被廣大教師學(xué)生的逐步認(rèn)可,可預(yù)見(jiàn)有更多的研究者會(huì)投入到以試題檢索技術(shù)為代表的一系列相關(guān)技術(shù)研究中。我們有理由相信,人工智能會(huì)進(jìn)一步深入到教學(xué)的各個(gè)環(huán)節(jié)中,護(hù)航學(xué)生快樂(lè)學(xué)習(xí),助力教育者實(shí)現(xiàn)因材施教的夢(mèng)想。

      參考文獻(xiàn):

      [1] 劉淇,陳恩紅,黃振亞. 面向個(gè)性化學(xué)習(xí)的學(xué)生認(rèn)知能力分析[J]. 中國(guó)計(jì)算機(jī)學(xué)會(huì)通信, 2017, (04).

      [2] 胡國(guó)平, 張丹, 蘇喻,等. 試題知識(shí)點(diǎn)預(yù)測(cè):一種教研知識(shí)強(qiáng)化的卷積神經(jīng)網(wǎng)絡(luò)模型[J]. 中文信息學(xué)報(bào), 2018, v.32(05):142-151.

      [3] 蘇潭英, 郭憲勇, 金鑫. 一種基于Lucene的中文全文檢索系統(tǒng)[J]. 計(jì)算機(jī)工程, 2007, 033(023):94-96.

      [4] Minaee S , Kalchbrenner N , Cambria E , et al. Deep Learning Based Text Classification: A Comprehensive Review[J]. 2020.

      [5] Cheng H T , Koc L , Harmsen J , et al. Wide & Deep Learning for Recommender Systems[J]. 2016.

      [6] Guo H , Tang R , Ye Y , et al. DeepFM: A Factorization-Machine based Neural Network for CTR Prediction[J]. 2017.

      [7] Liu Q , Huang Z , Huang Z , et al. [ACM Press the 24th ACM SIGKDD International Conference - London, United Kingdom (2018.08.19-2018.08.23)] Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining - KDD '18 - Finding Similar Exercises in Online Education Systems[C]// 2018:1821-1830.

      猜你喜歡
      題庫(kù)淺層檢索
      “勾股定理”優(yōu)題庫(kù)
      淺層換填技術(shù)在深厚軟土路基中的應(yīng)用
      基于淺層曝氣原理的好氧顆粒污泥的快速培養(yǎng)
      “軸對(duì)稱(chēng)”優(yōu)題庫(kù)
      “軸對(duì)稱(chēng)”優(yōu)題庫(kù)
      “整式的乘法與因式分解”優(yōu)題庫(kù)
      2019年第4-6期便捷檢索目錄
      淺層地下水超采區(qū)劃分探究
      專(zhuān)利檢索中“語(yǔ)義”的表現(xiàn)
      包氣帶淺層地?zé)崛萘坑?jì)算方法商榷
      沈丘县| 宁远县| 苗栗县| 临清市| 蓝田县| 玉龙| 安吉县| 彝良县| 新闻| 香港| 佛学| 苍梧县| 区。| 溧阳市| 濉溪县| 炎陵县| 方正县| 股票| 开封市| 西华县| 闵行区| 教育| 巫溪县| 南漳县| 金湖县| 耒阳市| 黄平县| 吉木萨尔县| 云和县| 新乐市| 东至县| 纳雍县| 五华县| 太谷县| 弋阳县| 育儿| 神池县| 南召县| 尼勒克县| 邹平县| 老河口市|