• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于深度學(xué)習(xí)的教材德目分類方法

    2021-09-15 02:36:22郭書武陳軍華
    關(guān)鍵詞:向量分類文本

    郭書武,陳軍華

    (上海師范大學(xué)信息與機(jī)電工程學(xué)院,上海 201418)

    0 引 言

    所謂德目教育,就是將德目作為主要內(nèi)容進(jìn)行的道德教育。一個(gè)健康、穩(wěn)定的社會(huì)必然要求有一套被時(shí)代所公認(rèn)的核心價(jià)值體系,并被公民所內(nèi)化[1]。隨著時(shí)代的發(fā)展,我國(guó)德目指標(biāo)也在不斷的發(fā)展,比如“仁、義、禮、智、信”就是傳統(tǒng)意義上的德目指標(biāo),而“愛國(guó)守法、明禮誠(chéng)信、團(tuán)結(jié)友愛、勤儉自強(qiáng)、敬業(yè)奉獻(xiàn)”就是現(xiàn)代意義的德目指標(biāo)。對(duì)學(xué)生的德目教育是學(xué)校的重要職責(zé),而教材是進(jìn)行德目教育的重要途徑和載體,所以教材德目指標(biāo)也就成為學(xué)校選取教材的重要標(biāo)準(zhǔn)之一,從而達(dá)到傳遞社會(huì)的核心價(jià)值體系的教學(xué)目標(biāo)。

    本文的研究源于教育部哲學(xué)社會(huì)科學(xué)重大課題攻關(guān)項(xiàng)目(立項(xiàng)號(hào):13JZD046)——大中小德育課程一體化建設(shè)研究,實(shí)驗(yàn)數(shù)據(jù)集來源于上海市中小學(xué)教材。

    教材為教育教學(xué)提供基本遵循,教材的內(nèi)容選取對(duì)學(xué)生的價(jià)值觀養(yǎng)成起到了關(guān)鍵作用,同時(shí),中小學(xué)教材存在內(nèi)容簡(jiǎn)單重復(fù)的結(jié)構(gòu)性問題。所以,為了能夠更好地對(duì)教材內(nèi)容進(jìn)行德目評(píng)定,項(xiàng)目組專家根據(jù)當(dāng)今我國(guó)社會(huì)主義核心價(jià)值體系的要求,制定了相應(yīng)的德目指標(biāo),其中包含4個(gè)一級(jí)德目指標(biāo),分別是:政治認(rèn)同(A)、國(guó)家意識(shí)(B)、文化自信(C)、公民人格(D)。為了更加細(xì)致嚴(yán)謹(jǐn)?shù)脑u(píng)價(jià)教材的德目指標(biāo),又將每個(gè)一級(jí)德目指標(biāo)細(xì)分為4種二級(jí)德目指標(biāo),分別是:黨的領(lǐng)導(dǎo)(A1)、科學(xué)理論(A2)、政治制度(A3)、發(fā)展道路(A4)、國(guó)家利益(B1)、國(guó)情觀念(B2)、民族團(tuán)結(jié)(B3)、國(guó)際視野(B4)、國(guó)家語言(C1)、歷史文化(C2)、革命傳統(tǒng)(C3)、時(shí)代精神(C4)、健康身心(D1)、守法平等(D2)、誠(chéng)信盡責(zé)(D3)和自強(qiáng)合作(D4)。本文針對(duì)二級(jí)德目指標(biāo)的自動(dòng)分類進(jìn)行研究。

    1 相關(guān)工作

    文本分類是自然語言處理領(lǐng)域中重要的應(yīng)用,諸多的傳統(tǒng)機(jī)器學(xué)習(xí)方法已經(jīng)應(yīng)用到了各種文本分類任務(wù)中。文獻(xiàn)[2]通過結(jié)合改良后的K-modes算法,改良了KNN算法,提高了KNN算法在面對(duì)大樣本數(shù)據(jù)集時(shí)的執(zhí)行效率。文獻(xiàn)[3]提出了一種基于模擬退火(SA)優(yōu)化SVM的文本分類方法,有效地解決了優(yōu)化SVM參數(shù)難題。LDA[4]經(jīng)常被用來做文檔主題聚類的分析,所以文獻(xiàn)[5]將LDA和卡方統(tǒng)計(jì)相結(jié)合,然后利用SVM進(jìn)行文本分類,實(shí)驗(yàn)結(jié)果表明,把卡方統(tǒng)計(jì)和主題模型相結(jié)合的方法可以有效提升模型的泛化能力。Spark可以基于map reduce算法進(jìn)行分布式計(jì)算,文獻(xiàn)[6]將Spark框架和KNN相結(jié)合,實(shí)現(xiàn)了對(duì)大數(shù)據(jù)量數(shù)據(jù)集的文本分類。盡管傳統(tǒng)方法在一些文本分類任務(wù)中已經(jīng)取得了非常不錯(cuò)的效果,但是其單純通過詞頻來衡量詞的重要性不夠全面,無法利用詞的位置信息,且不能夠表示這些詞語之間的聯(lián)系。

    如何有效地利用詞之間的聯(lián)系及其位置信息,成為了文本分類任務(wù)中需要解決的問題。長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)[7]是一種時(shí)間循環(huán)神經(jīng)網(wǎng)絡(luò),可以處理時(shí)間序列中間隔很長(zhǎng)的事件,文獻(xiàn)[8]結(jié)合協(xié)同訓(xùn)練的方法對(duì)LSTM進(jìn)行擴(kuò)展,并實(shí)現(xiàn)了對(duì)中文命名實(shí)體的識(shí)別。文獻(xiàn)[9]結(jié)合CNN和LSTM,并對(duì)其進(jìn)行了改進(jìn)和優(yōu)化,在聯(lián)合預(yù)測(cè)模型上添加修正模型,完成了電網(wǎng)電量缺失數(shù)據(jù)的預(yù)測(cè)任務(wù)。文獻(xiàn)[10]結(jié)合了CNN和GRU[11],并采用條件隨機(jī)場(chǎng)模型作為分類器,實(shí)驗(yàn)結(jié)果表明能夠?qū)崿F(xiàn)較高準(zhǔn)確率的情感類別的分類。Kim[12]提出了TextCNN,將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用到了文本分類當(dāng)中,TextCNN具有多個(gè)不同大小的卷積核,可以更好地捕捉到句子中的關(guān)鍵信息,其通過融合各個(gè)卷積層的輸出,然后輸入到Softmax層得到分類結(jié)果。

    使用傳統(tǒng)的文本分類算法對(duì)教材文本進(jìn)行深度學(xué)習(xí)時(shí),存在特征矩陣稀疏、特征維數(shù)高的問題,并且不能有效地利用詞之間的聯(lián)系及位置信息,且上海市中小學(xué)教材數(shù)據(jù)集存在樣本分布不均衡的問題,各指標(biāo)下的教材文本條數(shù)差異較大,模型在數(shù)據(jù)量較少的類別上不能有效地獲取特征信息。針對(duì)上述問題,本文提出一種結(jié)合卷積神經(jīng)網(wǎng)絡(luò)TextCNN和注意力機(jī)制的文本分類模型,將其稱為IoMET_A(Indicators of Moral Education Target based Attention),并提出一種新的數(shù)據(jù)增強(qiáng)技術(shù)來得到一個(gè)均衡的數(shù)據(jù)集。

    2 IoMET_A建模

    2.1 數(shù)據(jù)增強(qiáng)

    深度學(xué)習(xí)中數(shù)據(jù)集的質(zhì)量對(duì)模型的性能有很大的影響,一個(gè)極端不均衡的數(shù)據(jù)集會(huì)對(duì)模型的訓(xùn)練造成困擾,有可能導(dǎo)致過擬合的發(fā)生。如圖1所示,上海市中小學(xué)教材文本數(shù)據(jù)存在數(shù)據(jù)不均衡的問題,各類別的數(shù)量差異較大。所以,本文需要采用數(shù)據(jù)增強(qiáng)的技術(shù)來得到一個(gè)較為均衡的數(shù)據(jù)集。

    圖1 數(shù)據(jù)增強(qiáng)前各類別分布情況

    數(shù)據(jù)增強(qiáng)是擴(kuò)充數(shù)據(jù)樣本規(guī)模的一種有效方法,常用的方法有過采樣、欠采樣、回譯、打亂句內(nèi)詞語順序以及句子順序等。其中,過采樣是在數(shù)據(jù)不足的類別上,通過重復(fù)、自主抽樣或合成少數(shù)類過采樣技術(shù)SMOTE來平衡數(shù)據(jù)集,SMOTE是通過構(gòu)建相鄰實(shí)例的凸組合來創(chuàng)建少數(shù)類別的新實(shí)例,沒有使用重復(fù)樣例,不會(huì)過多地過擬合。同時(shí),Wei等人[13]提出了一種簡(jiǎn)單通用的NLP數(shù)據(jù)增強(qiáng)技術(shù)EDA,其包含4種簡(jiǎn)單的操作來進(jìn)行數(shù)據(jù)增強(qiáng),其中包括同義詞替換(Synonyms Repalce, SR)、隨機(jī)插入(Rand-omly Insert, RI)、隨機(jī)交換(Randomly Swap, RS)和隨機(jī)刪除(Randomly Delete, RD),EDA使用NLTK做英文的同義詞查詢,對(duì)數(shù)據(jù)集中的實(shí)例生成相同數(shù)量的新文本,在規(guī)模較小的數(shù)據(jù)集進(jìn)行訓(xùn)練時(shí),EDA取得了十分突出的表現(xiàn),顯著提高了模型的性能。

    因此,針對(duì)上海市中小學(xué)教材文本數(shù)據(jù)集不均衡的問題,本文結(jié)合SMOTE和EDA的思想提出一種新的數(shù)據(jù)增強(qiáng)方法,即使用自建停用詞表和同義詞詞林做同義詞查詢,實(shí)現(xiàn)了在德目指標(biāo)較少類別上的過采樣,并隨機(jī)打亂句內(nèi)詞語的順序以及樣本順序。如圖2所示,數(shù)據(jù)增強(qiáng)后的數(shù)據(jù)集已經(jīng)基本滿足需求,有效地防止了過擬合的發(fā)生,并提高了模型的泛化能力。

    圖2 數(shù)據(jù)增強(qiáng)后各類別分布情況

    2.2 注意力機(jī)制

    Attention機(jī)制最開始被Google Mind團(tuán)隊(duì)[14]結(jié)合RNN模型用在了圖像分類任務(wù)中。而后Bahdanau等人[15]使用類似的注意力機(jī)制來完成機(jī)器翻譯的任務(wù),使得模型能夠?qū)崿F(xiàn)翻譯和對(duì)齊同時(shí)進(jìn)行,這是Attention機(jī)制在NLP中的首次應(yīng)用。此后,Attention機(jī)制開始被廣泛地應(yīng)用到各種場(chǎng)景任務(wù)中,Google機(jī)器翻譯團(tuán)隊(duì)[16]提出了Transformer的概念,其整個(gè)網(wǎng)絡(luò)結(jié)構(gòu)完全由注意力機(jī)制組成,不再利用CNN或者RNN來構(gòu)造分類模型,在WMT2014語料中的英德、英法翻譯任務(wù)中表現(xiàn)十分突出,且其訓(xùn)練速度也優(yōu)于傳統(tǒng)的CCN、RNN模型。傳統(tǒng)的CNN在進(jìn)行文本分類任務(wù)時(shí),每個(gè)通道對(duì)應(yīng)一個(gè)句子,獲得句子的特征表示后,再輸入到分類器中,沒有考慮將文本的特征表示輸入到分類器之前句對(duì)之間的聯(lián)系,而Yin等人[17]提出了3種在卷積神經(jīng)網(wǎng)絡(luò)中使用Attention機(jī)制的方法,通過把Attention機(jī)制和CNN相結(jié)合,從而把不同的CNN通道的句對(duì)聯(lián)系起來。

    一個(gè)注意力函數(shù)實(shí)質(zhì)上可以認(rèn)為是一個(gè)查詢(Query)到一個(gè)鍵值對(duì)(set of Key-Value pairs)的映射,其中的Query、Key、Value和輸出都是用向量來表示,如圖3所示。其中Source可以看作是存儲(chǔ)器內(nèi)存儲(chǔ)的內(nèi)容,其中的元素由地址Key和值Value組成,假設(shè)當(dāng)前有 L_x 個(gè)查詢,最終要獲取到存儲(chǔ)器中對(duì)應(yīng)的Value值,即Attention的數(shù)值。其中,L_x=‖Source‖ ,代表輸入的文本序列的長(zhǎng)度。

    圖3 查詢到鍵值對(duì)映射

    常被用來計(jì)算Query和Key相似性的函數(shù)有內(nèi)積公式、余弦相似度公式和感知器網(wǎng)絡(luò)公式,分別為:

    (Sim(Query,Keyi)=Query·Keyi

    (1)

    (2)

    (Sim(Query,Keyi)=MLP(Query,Keyi)

    (3)

    然后對(duì)相似性計(jì)算結(jié)果使用Softmax 進(jìn)行歸一化處理,從而得到其概率分布,其中ai表示第i個(gè)查詢的相似性概率分布,公式為:

    (4)

    最后根據(jù)權(quán)重系數(shù)對(duì)Value 進(jìn)行加權(quán)求和:

    (5)

    Attention機(jī)制的實(shí)質(zhì)其實(shí)就是一個(gè)尋址的過程,通過計(jì)算與Key的注意力分布并附加在Value上,從而計(jì)算Attention Value,這個(gè)過程也是Attention機(jī)制降低神經(jīng)網(wǎng)絡(luò)模型復(fù)雜度的表現(xiàn),通過將視角聚焦于與當(dāng)前任務(wù)關(guān)聯(lián)度更高的信息,降低甚至無視其他無關(guān)的信息,可以有效地解決神經(jīng)網(wǎng)絡(luò)模型信息過載的問題,同時(shí)能夠提高模型的計(jì)算效率和泛化能力。

    2.3 IoMET_A模型

    如圖4所示,IoMET_A的建模流程分為文本預(yù)處理、數(shù)據(jù)增強(qiáng)、特征提取和訓(xùn)練。

    圖4 IoMET_A的建模流程

    1)文本預(yù)處理。文本預(yù)處理的目標(biāo)就是將文本變?yōu)榭煞治?、可預(yù)測(cè)的形式,而上海市中小學(xué)教材數(shù)據(jù)集中存在大量的特殊符號(hào)、語氣助詞等與分類無關(guān)的信息,而這些噪音會(huì)增加模型計(jì)算的開銷,因此要盡可能地去除噪音,所以本文利用jieba[18]分詞工具和自建停用詞表對(duì)教材文本進(jìn)行噪音去除。

    2)數(shù)據(jù)增強(qiáng)。一個(gè)均衡的數(shù)據(jù)集對(duì)模型的分類性能有著十分重要的影響,鑒于上海市教材數(shù)據(jù)集的嚴(yán)重不平衡性,本文結(jié)合SMOTE和EDA的思想實(shí)現(xiàn)少數(shù)類別的過采樣,并以一定概率隨機(jī)打亂句子以及句內(nèi)詞語的順序,從而得到了一個(gè)平衡的新數(shù)據(jù)集。

    3)特征提取。本文利用Word2vec[19-20]中的負(fù)采樣模型Skip-Gram生成詞向量,將預(yù)處理后的詞語映射到低維向量中。

    (4)訓(xùn)練。IoMET_A的模型結(jié)構(gòu)如圖5所示,與普通的TextCNN結(jié)構(gòu)不同的是,在輸入層和卷積層之間引入了attention層,引入attention層是為了給每個(gè)詞語創(chuàng)建上下文向量,然后將上下文向量和詞語原本預(yù)訓(xùn)練進(jìn)行拼接,作為詞語新的表示,輸入到卷積層,然后經(jīng)過池化層、全連接層,從而得到文本的類別。

    圖5 IoMET_A模型結(jié)構(gòu)圖

    本文目標(biāo)函數(shù)采用收斂速度較快的交叉熵?fù)p失函數(shù)。損失函數(shù)為:

    (6)

    則每一個(gè)Batch的損失為:

    (7)

    用gi表示圖中上下文向量,注意力機(jī)制是另外的MLP(多層感知機(jī)網(wǎng)絡(luò)結(jié)構(gòu)),當(dāng)預(yù)測(cè)句子時(shí),該機(jī)制確定哪些詞語應(yīng)該受到更多的關(guān)注,即:

    (8)

    其中,αi,j稱為attention權(quán)重,要求α≥0且∑jαi,j·xj=1,這里可以通過softmax規(guī)范化來實(shí)現(xiàn):

    (9)

    (10)

    其中,score值由上面提到的MLP來計(jì)算。

    3 實(shí)驗(yàn)結(jié)果與分析

    3.1 實(shí)驗(yàn)準(zhǔn)備

    本文數(shù)據(jù)集來自于上海市中小學(xué)教材文本,共計(jì)33360條數(shù)據(jù),包含16個(gè)類別,23083個(gè)詞匯。經(jīng)數(shù)據(jù)增強(qiáng)后,均衡數(shù)據(jù)集共包含110665條數(shù)據(jù),16個(gè)類別,28966個(gè)詞匯。從均衡數(shù)據(jù)集中隨機(jī)選取8:2的數(shù)據(jù)作為訓(xùn)練集和測(cè)試集。樣本數(shù)據(jù)示例如表1所示。

    表1 部分樣本數(shù)據(jù)示例

    實(shí)驗(yàn)需要回答以下研究問題:

    Q1:IoMET_A 模型的數(shù)據(jù)增強(qiáng)方法是否有效?

    Q2:IoMET_A 模型的參數(shù)選取是否合理?

    Q3:結(jié)合注意力機(jī)制的IoMET_A是否有更好的表現(xiàn)?

    3.2 實(shí)驗(yàn)設(shè)置

    本文實(shí)驗(yàn)環(huán)境基于Python3.6,利用Keras深度學(xué)習(xí)框架完成對(duì)IoMET_A及參照模型的搭建,實(shí)驗(yàn)環(huán)境如表2所示。

    表2 實(shí)驗(yàn)環(huán)境

    3.3 詞向量預(yù)訓(xùn)練

    本文利用Google開源的負(fù)采樣模型(Skip-Gram with Negative Sampling)來生成預(yù)訓(xùn)練詞向量,Skip-Gram模型的訓(xùn)練窗口大小設(shè)置為15(當(dāng)前詞與預(yù)測(cè)詞的最遠(yuǎn)距離),模型的學(xué)習(xí)速率設(shè)為0.05,negative值設(shè)為5,min_count設(shè)為1(表示不會(huì)有詞語被拋棄),迭代次數(shù)設(shè)為10次。預(yù)訓(xùn)練詞向量參數(shù)設(shè)置如表3所示。預(yù)訓(xùn)練詞向量詞語相似性示例如表4所示。

    表3 預(yù)訓(xùn)練詞向量參數(shù)

    表4 預(yù)訓(xùn)練詞向量相似度示例

    3.4 實(shí)驗(yàn)設(shè)計(jì)

    實(shí)驗(yàn)1 驗(yàn)證IoMET_A模型所提出的數(shù)據(jù)增強(qiáng)方法的有效性。

    實(shí)驗(yàn)2 驗(yàn)證IoMET_A的參數(shù)選取是否合理。

    實(shí)驗(yàn)3 驗(yàn)證本文所提出的IoMET_A模型的有效性,同時(shí)與Bi-LSTM[7]、Bi-GRU[9]、GRNN[21]和IoMET以及Google提供的BERT-Base[22]作為參照模型進(jìn)行分類性能對(duì)比。各模型的超參數(shù)設(shè)置如表5和表6所示。

    表5 模型超參數(shù)設(shè)置

    表6 BERT模型訓(xùn)練參數(shù)設(shè)置

    3.5 實(shí)驗(yàn)評(píng)價(jià)標(biāo)準(zhǔn)

    精確率(Precision, P)表示發(fā)現(xiàn)的項(xiàng)目中有多少是相關(guān)的比例。召回率(Recall, R)表示相關(guān)的項(xiàng)目中發(fā)現(xiàn)了多少的比例。F1-度量值(F1-Measure, F1)是精確率和召回率組合成的一個(gè)得分,被定義為精確率和召回率的調(diào)和平均數(shù)。計(jì)算公式分別為:

    (11)

    (12)

    (13)

    其中,TP(True Positive)表示是相關(guān)項(xiàng)目中正確識(shí)別為相關(guān)的,F(xiàn)P(False Positive)是不相關(guān)項(xiàng)目中錯(cuò)誤識(shí)別為相關(guān)的,F(xiàn)N(False Negative)是相關(guān)項(xiàng)目中錯(cuò)誤識(shí)別為不相關(guān)的。

    3.6 結(jié)果分析

    實(shí)驗(yàn)1為了驗(yàn)證IoMET_A模型所用數(shù)據(jù)增強(qiáng)方法的有效性,將進(jìn)行數(shù)據(jù)增強(qiáng)后的教材文本和原始文本分別輸入到TextCNN文本分類器中,并通過F1-度量值進(jìn)行評(píng)價(jià),實(shí)驗(yàn)結(jié)果如圖6所示。

    圖6 各個(gè)類別的F1-度量值曲線對(duì)比

    實(shí)驗(yàn)2因?yàn)椴煌某瑓?shù)設(shè)置會(huì)對(duì)模型有不同的影響,需要對(duì)參數(shù)進(jìn)行優(yōu)化處理。

    不同的詞向量維度生成的詞向量矩陣各不相同,表達(dá)的文本特征信息也有所不同,為了尋找在上海市教材文本數(shù)據(jù)集下的最優(yōu)詞向量維度,設(shè)置多組對(duì)照實(shí)驗(yàn),使用F1-度量值作為模型性能評(píng)價(jià)指標(biāo)。IoMET_A在不同的維度下的表現(xiàn)如圖7所示。

    圖7 詞向量維度對(duì)模型性能的影響

    模型過擬合是模型訓(xùn)練過程中經(jīng)常會(huì)出現(xiàn)的情況,由于過擬合的模型在測(cè)試集和訓(xùn)練集的損失函數(shù)差異很大,所以過擬合的模型是不能用在實(shí)際應(yīng)用中的。Krizhevsky等人[23]提出可以在訓(xùn)練模型的過程中,每一個(gè)訓(xùn)練批次都忽略一些隱藏層節(jié)點(diǎn),減少這些隱藏層節(jié)點(diǎn)的相互作用,從而減少過擬合的發(fā)生。所以本文在(0,1)區(qū)間內(nèi)做多組對(duì)照實(shí)驗(yàn),觀察模型在不同的Dropout取值下IoMET_A的分類性能。IoMET_A在不同的Dropout取值下的表現(xiàn)如圖8所示。

    圖8 不同Dropout取值對(duì)模型性能的影響

    實(shí)驗(yàn)3為了驗(yàn)證IoMET_A對(duì)教材德目指標(biāo)分類任務(wù)的有效性,設(shè)置了多組對(duì)照實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表7所示。

    表7 不同分類模型的分類結(jié)果

    對(duì)于Q1,從圖6中可以看出,經(jīng)過數(shù)據(jù)增強(qiáng)后的教材文本的各類別的F1-度量值均高于原始文本,驗(yàn)證了本文所使用的數(shù)據(jù)增強(qiáng)方法的有效性,可以有效地解決文本數(shù)據(jù)集不均衡的問題。

    對(duì)于Q2,從圖7中可以看出,IoMET_A在詞向量維度100維~150維之間的分類性能最好,可能是由于詞向量維數(shù)設(shè)置過高時(shí),由語料庫預(yù)訓(xùn)練出的詞向量質(zhì)量下降導(dǎo)致的。從圖8可以看出,IoMET_A在Dropout取值處于(0,0.5)時(shí)沒有特別明顯的變化,并在Dropout=0.3時(shí)模型的分類性能最佳。

    對(duì)于Q3,從表7中可以看出,在對(duì)上海市中小學(xué)教材德目指標(biāo)的分類任務(wù)中,本文提出的IoMET_A在詞向量維度是150維、Dropout=0.3時(shí),取得最高77.51%的F1-度量值,參照模型分別取得61.28%(IoMET)、75.62%(Bi_LSTM)、74.82%(Bi_GRU)、75.19%(GRNN)、78.35%(BERT)的F1-度量值,BERT比IoMET_A的F1-度量值提升了不到1個(gè)百分點(diǎn),但是,因?yàn)槠湫枰?xùn)練的參數(shù)量龐大,導(dǎo)致其收斂速度也比本文提出的IoMET_A要慢很多,所以針對(duì)本文特定的教材德目指標(biāo)分類任務(wù)來說,IoMET_A依然是一個(gè)不錯(cuò)的選擇。

    原始的IoMET模型不能很好地利用詞之間的聯(lián)系和位置信息,所以當(dāng)輸入的語句過長(zhǎng)時(shí),就可能會(huì)丟失一些重要的語義信息。本文提出的結(jié)合注意力機(jī)制的IoMET_A文本分類模型,為每一個(gè)詞都生成一個(gè)上下文向量,然后結(jié)合預(yù)訓(xùn)練的詞向量輸入到卷積神經(jīng)網(wǎng)絡(luò)中去,有效地提高了模型的泛化能力,在上海市中小學(xué)教材德目指標(biāo)的分類任務(wù)中取得了更好的表現(xiàn)。

    4 結(jié)束語

    本文以上海市中小學(xué)教材德目指標(biāo)研究作為實(shí)驗(yàn)背景,提出了IoMET_A文本分類模型,實(shí)現(xiàn)了較高準(zhǔn)確率的德目指標(biāo)預(yù)測(cè),可以為德目指標(biāo)的研究工作提供有效的參考依據(jù),替代部分人工工作。結(jié)合了注意力機(jī)制的IoMET_A使得輸入的序列向量具有了更強(qiáng)的語義特征信息,能夠有效地保留文本序列的語義關(guān)系信息,且針對(duì)樣本數(shù)量不均衡的問題,IoMET_A結(jié)合了SMOTE和EDA的思想,使用自建停用詞表和同義詞詞林做同義詞查詢實(shí)現(xiàn)了少數(shù)類別過采樣,并隨機(jī)打亂句子順序以及句內(nèi)詞語順序來建立一個(gè)均衡的數(shù)據(jù)集。從實(shí)驗(yàn)結(jié)果也可以看出,IoMET_A所用的數(shù)據(jù)增強(qiáng)方法可以有效地提高模型的性能,使得模型的F1-度量值得到較高提升,并且結(jié)合了注意力機(jī)制的IoMET_A模型相比未結(jié)合注意力機(jī)制的IoMET,擁有更好的模型泛化能力,同時(shí)與其他設(shè)置的參照模型相比也有明顯優(yōu)勢(shì)。

    接下來的研究方向是改進(jìn)文本的預(yù)處理方法,優(yōu)化模型結(jié)構(gòu),使得IoMET_A模型的性能得到進(jìn)一步提高。

    猜你喜歡
    向量分類文本
    向量的分解
    分類算一算
    聚焦“向量與三角”創(chuàng)新題
    在808DA上文本顯示的改善
    分類討論求坐標(biāo)
    基于doc2vec和TF-IDF的相似文本識(shí)別
    電子制作(2018年18期)2018-11-14 01:48:06
    數(shù)據(jù)分析中的分類討論
    教你一招:數(shù)的分類
    向量垂直在解析幾何中的應(yīng)用
    文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
    人人妻人人澡人人爽人人夜夜| 亚洲在久久综合| 久久毛片免费看一区二区三区| 夜夜爽夜夜爽视频| 看免费成人av毛片| 免费人成在线观看视频色| 成年女人在线观看亚洲视频| 国产免费现黄频在线看| 男女边摸边吃奶| 国产黄频视频在线观看| 人人妻人人澡人人看| 午夜福利,免费看| av视频免费观看在线观看| 99国产精品免费福利视频| 欧美变态另类bdsm刘玥| 中文字幕免费在线视频6| 狂野欧美激情性bbbbbb| 久久精品国产亚洲av天美| 巨乳人妻的诱惑在线观看| 久久亚洲国产成人精品v| 精品人妻熟女毛片av久久网站| 日本-黄色视频高清免费观看| 一级片免费观看大全| 男人操女人黄网站| 有码 亚洲区| 黑人欧美特级aaaaaa片| 五月天丁香电影| 亚洲国产成人一精品久久久| 日韩在线高清观看一区二区三区| 最近中文字幕2019免费版| 1024视频免费在线观看| 成人黄色视频免费在线看| 日韩中字成人| 26uuu在线亚洲综合色| 午夜福利网站1000一区二区三区| 国产在线视频一区二区| 国产毛片在线视频| 亚洲欧美一区二区三区国产| 日韩三级伦理在线观看| 午夜av观看不卡| 26uuu在线亚洲综合色| 有码 亚洲区| 久久久久久久大尺度免费视频| 亚洲 欧美一区二区三区| a级毛片在线看网站| 国产一区二区在线观看日韩| 精品午夜福利在线看| 天美传媒精品一区二区| 国产成人aa在线观看| 我要看黄色一级片免费的| 色婷婷av一区二区三区视频| 精品一区二区三区四区五区乱码 | 成年人免费黄色播放视频| 精品人妻一区二区三区麻豆| 人妻系列 视频| 亚洲精品日韩在线中文字幕| 成年人免费黄色播放视频| 两个人免费观看高清视频| 国产爽快片一区二区三区| 好男人视频免费观看在线| 多毛熟女@视频| 一级毛片 在线播放| 国产精品一区二区在线不卡| 中文乱码字字幕精品一区二区三区| 欧美成人精品欧美一级黄| 亚洲第一av免费看| 91午夜精品亚洲一区二区三区| 久久这里只有精品19| 中国国产av一级| 日韩三级伦理在线观看| 国产精品久久久久久精品电影小说| 久久99热6这里只有精品| 免费黄频网站在线观看国产| 黄色配什么色好看| 哪个播放器可以免费观看大片| av免费在线看不卡| 久久午夜福利片| 麻豆精品久久久久久蜜桃| 在线观看人妻少妇| 日韩,欧美,国产一区二区三区| 在线看a的网站| 久久久久精品久久久久真实原创| 天堂8中文在线网| 9热在线视频观看99| 免费黄网站久久成人精品| 国产不卡av网站在线观看| 日本免费在线观看一区| 亚洲综合色惰| 最后的刺客免费高清国语| 在线观看www视频免费| 少妇精品久久久久久久| 国产在线免费精品| 哪个播放器可以免费观看大片| 精品午夜福利在线看| 亚洲婷婷狠狠爱综合网| 丝瓜视频免费看黄片| 一本一本久久a久久精品综合妖精 国产伦在线观看视频一区 | 99热6这里只有精品| 欧美精品高潮呻吟av久久| 看免费成人av毛片| 中文字幕人妻熟女乱码| 校园人妻丝袜中文字幕| 一二三四在线观看免费中文在 | 日韩 亚洲 欧美在线| 热re99久久国产66热| av电影中文网址| 久久久久久人妻| 久久精品国产亚洲av天美| 色5月婷婷丁香| 在线看a的网站| 99久久中文字幕三级久久日本| 一区二区三区四区激情视频| 国产精品蜜桃在线观看| 久久久久国产网址| 亚洲精品乱码久久久久久按摩| 我的女老师完整版在线观看| 久久 成人 亚洲| videossex国产| 王馨瑶露胸无遮挡在线观看| 亚洲色图综合在线观看| 免费不卡的大黄色大毛片视频在线观看| 在线观看免费日韩欧美大片| av网站免费在线观看视频| 亚洲精品自拍成人| 日本av免费视频播放| 又粗又硬又长又爽又黄的视频| 国产成人a∨麻豆精品| 国产日韩欧美视频二区| 日韩在线高清观看一区二区三区| 天堂中文最新版在线下载| 国产极品粉嫩免费观看在线| 日日摸夜夜添夜夜爱| 少妇熟女欧美另类| 免费人成在线观看视频色| 久久女婷五月综合色啪小说| 亚洲综合色网址| 精品久久久精品久久久| 乱码一卡2卡4卡精品| 91精品三级在线观看| 满18在线观看网站| 日韩av免费高清视频| 亚洲av免费高清在线观看| 日日啪夜夜爽| 久久久久久久久久久免费av| av免费观看日本| 在线观看美女被高潮喷水网站| 色婷婷久久久亚洲欧美| 亚洲丝袜综合中文字幕| av网站免费在线观看视频| 国产精品国产三级国产av玫瑰| 国产成人a∨麻豆精品| 韩国高清视频一区二区三区| 国产毛片在线视频| 1024视频免费在线观看| 亚洲av电影在线观看一区二区三区| 国产精品女同一区二区软件| 纯流量卡能插随身wifi吗| 久久av网站| 精品人妻偷拍中文字幕| 日韩大片免费观看网站| 美国免费a级毛片| 黄色 视频免费看| 中国美白少妇内射xxxbb| 母亲3免费完整高清在线观看 | 在线观看一区二区三区激情| a级片在线免费高清观看视频| 国产女主播在线喷水免费视频网站| 国产男人的电影天堂91| a 毛片基地| 欧美精品高潮呻吟av久久| 精品人妻偷拍中文字幕| 久久久久国产网址| 久久久国产一区二区| 欧美国产精品一级二级三级| 黄色怎么调成土黄色| 制服诱惑二区| 插逼视频在线观看| 肉色欧美久久久久久久蜜桃| 久久久国产精品麻豆| 国产成人精品在线电影| 亚洲国产日韩一区二区| 侵犯人妻中文字幕一二三四区| a 毛片基地| 久久精品夜色国产| 国产无遮挡羞羞视频在线观看| 亚洲婷婷狠狠爱综合网| 久久这里有精品视频免费| 我要看黄色一级片免费的| 亚洲综合精品二区| 国产国语露脸激情在线看| 大话2 男鬼变身卡| 免费av不卡在线播放| 久久这里有精品视频免费| 久久国产精品男人的天堂亚洲 | 亚洲欧美一区二区三区国产| 久久久久久人妻| 国产色爽女视频免费观看| 伦理电影大哥的女人| 欧美人与善性xxx| 国产女主播在线喷水免费视频网站| 精品久久蜜臀av无| 9色porny在线观看| 中文字幕亚洲精品专区| 宅男免费午夜| 在线精品无人区一区二区三| 国产 一区精品| 国产成人av激情在线播放| 亚洲精品中文字幕在线视频| 人妻一区二区av| 亚洲精品美女久久av网站| 午夜日本视频在线| 亚洲国产精品一区三区| 久久精品国产亚洲av天美| 亚洲成人av在线免费| 精品久久久久久电影网| 老司机亚洲免费影院| 两个人免费观看高清视频| 国产一区二区三区av在线| 久久99热这里只频精品6学生| 国产精品蜜桃在线观看| 波野结衣二区三区在线| www.色视频.com| 日本欧美国产在线视频| 国产伦理片在线播放av一区| 日韩伦理黄色片| 亚洲成人手机| 日本91视频免费播放| 制服丝袜香蕉在线| 国产成人av激情在线播放| 国产爽快片一区二区三区| 国产av精品麻豆| 免费不卡的大黄色大毛片视频在线观看| 久久午夜福利片| 成人综合一区亚洲| 国产精品无大码| 男男h啪啪无遮挡| 极品少妇高潮喷水抽搐| 午夜福利网站1000一区二区三区| 黑人欧美特级aaaaaa片| 乱人伦中国视频| 黄色一级大片看看| 少妇的丰满在线观看| 国产成人aa在线观看| 欧美人与善性xxx| 日韩中文字幕视频在线看片| 中文字幕另类日韩欧美亚洲嫩草| 免费播放大片免费观看视频在线观看| 国产成人aa在线观看| 高清视频免费观看一区二区| 精品一区二区免费观看| 熟女人妻精品中文字幕| 午夜福利,免费看| 美女主播在线视频| 高清欧美精品videossex| 精品人妻在线不人妻| 最新的欧美精品一区二区| 观看美女的网站| 久久久久久人妻| 成年美女黄网站色视频大全免费| √禁漫天堂资源中文www| 侵犯人妻中文字幕一二三四区| 宅男免费午夜| 国产国语露脸激情在线看| 高清欧美精品videossex| 午夜视频国产福利| 视频区图区小说| 高清欧美精品videossex| 国产精品国产av在线观看| 人成视频在线观看免费观看| 视频中文字幕在线观看| 国产又色又爽无遮挡免| 国产男女内射视频| 夜夜爽夜夜爽视频| 国产欧美另类精品又又久久亚洲欧美| 99久久人妻综合| 最新的欧美精品一区二区| 免费日韩欧美在线观看| 国产av码专区亚洲av| 看免费av毛片| 一本一本久久a久久精品综合妖精 国产伦在线观看视频一区 | 一区二区av电影网| 香蕉精品网在线| freevideosex欧美| 亚洲av电影在线观看一区二区三区| 黄色视频在线播放观看不卡| 久久鲁丝午夜福利片| 七月丁香在线播放| 免费看av在线观看网站| 久久鲁丝午夜福利片| 男女免费视频国产| 国产亚洲最大av| 韩国高清视频一区二区三区| 成年美女黄网站色视频大全免费| 久久ye,这里只有精品| 18禁动态无遮挡网站| 国产成人精品久久久久久| 久久午夜综合久久蜜桃| 黑人巨大精品欧美一区二区蜜桃 | 国产视频首页在线观看| 久久精品国产a三级三级三级| 在线看a的网站| 日本av手机在线免费观看| 国产乱人偷精品视频| 天天躁夜夜躁狠狠久久av| 午夜免费鲁丝| 男人添女人高潮全过程视频| 日本午夜av视频| 国产精品久久久久成人av| 亚洲精品一二三| 免费播放大片免费观看视频在线观看| 五月天丁香电影| 国产在线视频一区二区| 久久人人爽人人爽人人片va| 日本av免费视频播放| 捣出白浆h1v1| 国产毛片在线视频| 亚洲av日韩在线播放| 色吧在线观看| 精品少妇内射三级| 亚洲婷婷狠狠爱综合网| 999精品在线视频| 精品视频人人做人人爽| 亚洲国产精品一区二区三区在线| 草草在线视频免费看| 色哟哟·www| 好男人视频免费观看在线| 久久久久久人妻| 亚洲精品一二三| 精品人妻偷拍中文字幕| 亚洲美女视频黄频| 日日爽夜夜爽网站| 狂野欧美激情性bbbbbb| 精品国产一区二区三区四区第35| 99精国产麻豆久久婷婷| 大香蕉久久成人网| 各种免费的搞黄视频| 久久午夜福利片| 高清在线视频一区二区三区| 亚洲经典国产精华液单| 亚洲国产欧美在线一区| 亚洲精品中文字幕在线视频| 久久久久久久久久人人人人人人| 色视频在线一区二区三区| 欧美精品高潮呻吟av久久| 如日韩欧美国产精品一区二区三区| 最近手机中文字幕大全| 亚洲国产精品999| 搡女人真爽免费视频火全软件| 女性被躁到高潮视频| 不卡视频在线观看欧美| 一级a做视频免费观看| 中文字幕免费在线视频6| 亚洲激情五月婷婷啪啪| 2021少妇久久久久久久久久久| 伦精品一区二区三区| 久久久国产一区二区| 熟妇人妻不卡中文字幕| 中文欧美无线码| 亚洲四区av| 精品酒店卫生间| 亚洲av国产av综合av卡| 啦啦啦视频在线资源免费观看| 天天影视国产精品| 久久99一区二区三区| 亚洲,一卡二卡三卡| 高清毛片免费看| 欧美精品一区二区大全| 久久国产亚洲av麻豆专区| 人妻 亚洲 视频| 国产欧美日韩综合在线一区二区| 久久久久国产精品人妻一区二区| 亚洲中文av在线| 成人影院久久| 精品亚洲成a人片在线观看| 亚洲av国产av综合av卡| 亚洲国产色片| 黑丝袜美女国产一区| 人人妻人人添人人爽欧美一区卜| 在线观看免费视频网站a站| 极品人妻少妇av视频| 99热这里只有是精品在线观看| 亚洲国产精品一区二区三区在线| 午夜老司机福利剧场| 捣出白浆h1v1| 91久久精品国产一区二区三区| 少妇精品久久久久久久| av福利片在线| 久久精品夜色国产| 你懂的网址亚洲精品在线观看| 亚洲,一卡二卡三卡| 精品亚洲成a人片在线观看| 国产精品偷伦视频观看了| 亚洲国产精品成人久久小说| 美女脱内裤让男人舔精品视频| 天堂8中文在线网| 久久久精品免费免费高清| 国产精品秋霞免费鲁丝片| 国产 精品1| 亚洲人成77777在线视频| 9色porny在线观看| 午夜免费观看性视频| 亚洲综合色惰| 韩国精品一区二区三区 | 久久这里只有精品19| 亚洲精品第二区| 肉色欧美久久久久久久蜜桃| 哪个播放器可以免费观看大片| 天堂8中文在线网| 国产黄色视频一区二区在线观看| 伊人久久国产一区二区| 中文字幕人妻熟女乱码| 久久久久网色| 亚洲欧美精品自产自拍| 亚洲综合精品二区| 成人亚洲欧美一区二区av| 观看美女的网站| 久久毛片免费看一区二区三区| 亚洲欧洲精品一区二区精品久久久 | 丁香六月天网| 亚洲伊人久久精品综合| 精品亚洲成国产av| 一级片'在线观看视频| videos熟女内射| 99热网站在线观看| 久久久久久久亚洲中文字幕| 国产精品三级大全| 亚洲,欧美精品.| 亚洲 欧美一区二区三区| 90打野战视频偷拍视频| 五月天丁香电影| 日韩av在线免费看完整版不卡| 一级黄片播放器| 波多野结衣一区麻豆| 中文字幕制服av| 久久久久久伊人网av| 亚洲国产毛片av蜜桃av| 国产精品三级大全| 91精品三级在线观看| 美女福利国产在线| 大话2 男鬼变身卡| 国产精品国产三级国产专区5o| 香蕉国产在线看| 如何舔出高潮| 日韩大片免费观看网站| 亚洲人成网站在线观看播放| 亚洲色图综合在线观看| av.在线天堂| 亚洲欧美一区二区三区国产| 免费观看a级毛片全部| 久久久久久人妻| 亚洲成国产人片在线观看| 亚洲国产看品久久| 中国国产av一级| 大香蕉久久网| 日韩欧美精品免费久久| 日韩av不卡免费在线播放| 另类精品久久| 国产成人免费观看mmmm| 精品视频人人做人人爽| 美国免费a级毛片| 国产一区二区三区综合在线观看 | 男女午夜视频在线观看 | 欧美成人精品欧美一级黄| 2022亚洲国产成人精品| 色婷婷久久久亚洲欧美| 大陆偷拍与自拍| 久久97久久精品| 久久久久久久久久成人| 黑人猛操日本美女一级片| 精品一品国产午夜福利视频| 日日撸夜夜添| 亚洲国产精品国产精品| 人人妻人人澡人人看| 亚洲精品国产av蜜桃| av播播在线观看一区| 日韩一区二区三区影片| 一级,二级,三级黄色视频| 亚洲精品日本国产第一区| 日本免费在线观看一区| 最后的刺客免费高清国语| 色94色欧美一区二区| 卡戴珊不雅视频在线播放| 亚洲在久久综合| 久久人人爽av亚洲精品天堂| 蜜桃在线观看..| 欧美另类一区| 一区二区日韩欧美中文字幕 | 性色av一级| 蜜臀久久99精品久久宅男| 秋霞在线观看毛片| 汤姆久久久久久久影院中文字幕| 国产日韩欧美视频二区| 国产精品成人在线| 国产一级毛片在线| 99热国产这里只有精品6| 丝瓜视频免费看黄片| 少妇人妻久久综合中文| 亚洲精品一区蜜桃| 菩萨蛮人人尽说江南好唐韦庄| videos熟女内射| 久久久国产一区二区| 久久久精品免费免费高清| 青春草亚洲视频在线观看| 人人妻人人爽人人添夜夜欢视频| 日本爱情动作片www.在线观看| 亚洲中文av在线| 一级毛片我不卡| 制服丝袜香蕉在线| 最近2019中文字幕mv第一页| 一级,二级,三级黄色视频| 少妇人妻精品综合一区二区| 国产极品天堂在线| 久久久精品区二区三区| 波多野结衣一区麻豆| 熟妇人妻不卡中文字幕| 视频区图区小说| 日韩制服丝袜自拍偷拍| 日本vs欧美在线观看视频| 亚洲精品一区蜜桃| 啦啦啦在线观看免费高清www| 久久久久久久久久成人| 大香蕉97超碰在线| 男人操女人黄网站| 精品一区二区三卡| 国精品久久久久久国模美| 满18在线观看网站| 女的被弄到高潮叫床怎么办| 高清av免费在线| 国产欧美亚洲国产| 一本一本久久a久久精品综合妖精 国产伦在线观看视频一区 | 咕卡用的链子| 18在线观看网站| av线在线观看网站| 爱豆传媒免费全集在线观看| 欧美激情国产日韩精品一区| 欧美国产精品va在线观看不卡| 香蕉国产在线看| 在线观看一区二区三区激情| 校园人妻丝袜中文字幕| 最近最新中文字幕大全免费视频 | 女人精品久久久久毛片| 免费在线观看完整版高清| 亚洲精品国产av成人精品| av播播在线观看一区| 国产色爽女视频免费观看| 在线观看美女被高潮喷水网站| 精品国产露脸久久av麻豆| 国产亚洲一区二区精品| 精品久久蜜臀av无| 在线天堂中文资源库| 老司机影院成人| 欧美bdsm另类| 精品一品国产午夜福利视频| 嫩草影院入口| 欧美日韩成人在线一区二区| 涩涩av久久男人的天堂| 成人18禁高潮啪啪吃奶动态图| 夫妻性生交免费视频一级片| 国产精品99久久99久久久不卡 | 午夜av观看不卡| 国产色婷婷99| 国精品久久久久久国模美| 国产精品 国内视频| 亚洲精品一区蜜桃| 亚洲情色 制服丝袜| 日本黄大片高清| 纯流量卡能插随身wifi吗| 欧美国产精品一级二级三级| 国产高清不卡午夜福利| 热re99久久精品国产66热6| 99久久中文字幕三级久久日本| 免费在线观看完整版高清| av在线播放精品| 久久国产精品大桥未久av| 男人爽女人下面视频在线观看| 亚洲欧美色中文字幕在线| 国产精品成人在线| 亚洲人与动物交配视频| 街头女战士在线观看网站| 久久人人97超碰香蕉20202| 国产一区二区在线观看av| 日韩一区二区视频免费看| 精品少妇久久久久久888优播| 美女脱内裤让男人舔精品视频| 国产精品久久久久久精品电影小说| 亚洲精品视频女| 一边摸一边做爽爽视频免费| 制服诱惑二区| 亚洲欧美色中文字幕在线| 精品一区在线观看国产| 亚洲,欧美,日韩| 一区二区三区四区激情视频| 大陆偷拍与自拍| 亚洲av免费高清在线观看| 亚洲一区二区三区欧美精品| 美女视频免费永久观看网站| 色婷婷av一区二区三区视频| 国产色婷婷99| 精品第一国产精品| 久久精品人人爽人人爽视色| 一本大道久久a久久精品| 亚洲精品自拍成人| 在线亚洲精品国产二区图片欧美| 成人国语在线视频| 热99久久久久精品小说推荐| 亚洲色图综合在线观看| 中文字幕人妻丝袜制服| 97精品久久久久久久久久精品| 中文字幕人妻熟女乱码| 久久久a久久爽久久v久久| 多毛熟女@视频| 国产成人精品福利久久| 日本欧美国产在线视频| 免费高清在线观看视频在线观看| 自线自在国产av|