• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于BERT字向量和TextCNN的農(nóng)業(yè)問句分類模型分析

    2022-10-11 12:52:36鮑彤羅瑞郭婷貴淑婷任妮
    關(guān)鍵詞:特征

    鮑彤,羅瑞,郭婷,貴淑婷,任妮*

    (1江蘇省農(nóng)業(yè)科學(xué)院信息中心,江蘇南京210014;2江蘇大學(xué)科技信息研究所,江蘇鎮(zhèn)江212013)

    0 引言

    【研究意義】隨著我國(guó)農(nóng)業(yè)組織形式和生產(chǎn)方式發(fā)生深刻變化,農(nóng)業(yè)技術(shù)服務(wù)有效供給不足、供需對(duì)接不暢等問題日益凸顯(趙秋倩等,2020)。農(nóng)業(yè)技術(shù)服務(wù)過(guò)度依賴于領(lǐng)域?qū)<壹皩I(yè)農(nóng)技推廣人員,人才消耗難以滿足農(nóng)業(yè)轉(zhuǎn)型升級(jí)和高質(zhì)量發(fā)展的需要。隨著人工智能等技術(shù)的發(fā)展,構(gòu)建農(nóng)業(yè)領(lǐng)域的智能問答系統(tǒng)能更高效、精準(zhǔn)和便捷地為農(nóng)業(yè)生產(chǎn)經(jīng)營(yíng)者提供專業(yè)化農(nóng)技指導(dǎo),為解決上述問題提供了一種方法。智能問答系統(tǒng)通常由問題處理模塊、檢索模塊和答案抽取模塊組成,而問答語(yǔ)句的自動(dòng)分類是提問處理模塊的關(guān)鍵環(huán)節(jié),直接影響后續(xù)檢索和答案抽取的精確率(鄭實(shí)福等,2002;吳友政等,2005)?!厩叭搜芯窟M(jìn)展】問句分類屬于文本分類的研究范疇,一直是自然語(yǔ)言處理領(lǐng)域的研究熱點(diǎn)。其中結(jié)合詞頻和逆文檔頻率的TF-IDF算法(武永亮等,2017)、利用空間聚類的K近鄰(K-NearestNeighbor,KNN)(周慶平等,2016)及基于條件獨(dú)立假設(shè)的樸素貝葉斯(Naive Bayes mode,NBM)(Jiang et al.,2016)等機(jī)器學(xué)習(xí)方法已達(dá)到較好的分類效果,但由于過(guò)于依賴人工定義特征,模型的泛化能力不夠理想。而基于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)方法因強(qiáng)大的特征提取能力備受青睞。Kim(2014)在預(yù)訓(xùn)練Word2vec詞向量的基礎(chǔ)上,首次提出了基于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural networks,CNN)的文本分類模型;胡萬(wàn)亭和賈真(2020)將新聞的標(biāo)題和正文2個(gè)部分融入TF-IDF算法,進(jìn)行詞向量加權(quán)輸入CNN模型進(jìn)行分類。CNN僅利用卷積和池化就具備很好的特征提取能力,但卷積操作不能考慮文本序列的位置信息,而循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent neural network,RNN)具有的序列結(jié)構(gòu),可提取文本的上下文特征,因此許多學(xué)者將CNN與RNN相結(jié)合進(jìn)行研究。Hassan和Mahmood(2018)利用CNN提取文本局部的靜態(tài)特征,同時(shí)利用RNN獲取文本的上下文信息,再將特征融合進(jìn)行分類;Liu等(2020)提出CNN和門控循環(huán)單元(Gated recurrent unit,GRU)結(jié)合的短文本分類模型,降低了模型參數(shù),有利于提升文本分類精度。此類組合方法也已經(jīng)運(yùn)用在醫(yī)學(xué)(杜琳等,2018)、知識(shí)產(chǎn)權(quán)(呂璐成等,2020)、公共政策(邱爾麗等,2020)和微博輿情(馬瑩雪和趙吉昌,2021)等領(lǐng)域的文本分類研究中。在農(nóng)業(yè)領(lǐng)域,有學(xué)者利用農(nóng)業(yè)專業(yè)詞庫(kù)已構(gòu)建基于規(guī)則和機(jī)器學(xué)習(xí)方法相結(jié)合的問句分類模型(魏芳芳等,2015;趙燕等,2018)。隨著深度學(xué)習(xí)的發(fā)展,趙明等(2018)根據(jù)番茄智能問答系統(tǒng)的特點(diǎn),提出基于BiGRU的番茄病蟲害問答系統(tǒng)問句分類模型;金寧等(2020)根據(jù)詞語(yǔ)重要性對(duì)文本詞向量進(jìn)行加權(quán),建立BiGRU和多尺度卷積神經(jīng)網(wǎng)絡(luò)(Multi-CNN)結(jié)合的農(nóng)業(yè)問句分類模型;馮帥等(2021)提出基于深度卷積神經(jīng)網(wǎng)絡(luò)的水稻知識(shí)文本分類方法,將ResNet的殘差模塊進(jìn)行改進(jìn)設(shè)計(jì),并利用膠囊網(wǎng)絡(luò)(Capsule network,Caps-Net)進(jìn)行分類;王郝日欽等(2021)利用農(nóng)業(yè)專業(yè)詞庫(kù)對(duì)文本進(jìn)行向量編碼,引入注意力機(jī)制強(qiáng)化關(guān)鍵詞特征,構(gòu)建了水稻問答系統(tǒng)中問句的自動(dòng)分類模型。農(nóng)業(yè)問句長(zhǎng)度較短且句意多蘊(yùn)含在各類專有名詞中,具有很強(qiáng)的領(lǐng)域性和稀疏性,因此當(dāng)下主流的詞向量模型難以適用。隨著BERT(Bidirectional encoder representations from transformers)(Devlin et al.,2018)等預(yù)訓(xùn)練語(yǔ)言模型的出現(xiàn),有諸多學(xué)者利用BERT訓(xùn)練更細(xì)粒度的動(dòng)態(tài)字詞向量,并在特定領(lǐng)域的文本分類任務(wù)中取得了更好的效果(李悅晨等,2021;劉忠寶等,2021;王思麗等,2021;尹鵬博等,2021),但將該模型應(yīng)用在農(nóng)業(yè)的研究相對(duì)較少?!颈狙芯壳腥朦c(diǎn)】農(nóng)業(yè)領(lǐng)域短文本分類存在數(shù)據(jù)稀疏性、高度依賴上下文等問題,目前通過(guò)預(yù)訓(xùn)練BERT模型對(duì)農(nóng)業(yè)問句分類鮮有報(bào)道?!緮M解決的關(guān)鍵問題】通過(guò)對(duì)不同詞向量模型和深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)合進(jìn)行試驗(yàn),選出效果最優(yōu)的模型作為問答系統(tǒng)中的分類方法,為后續(xù)構(gòu)建農(nóng)業(yè)領(lǐng)域智能問答系統(tǒng)提供技術(shù)支持。

    1 數(shù)據(jù)采集與研究方法

    1.1 BERT-TextCNN分類算法

    綜合利用預(yù)訓(xùn)練模型BERT和TextCNN模型開展農(nóng)業(yè)問句分類技術(shù)研究,本研究大致分為農(nóng)業(yè)問句嵌入層、特征提取層和分類層3個(gè)部分(圖1)。以“玉米苗枯病怎么防治”為例:(1)BERT模型經(jīng)過(guò)Tokennizer模塊將“玉米苗枯病怎么防治”按照單個(gè)漢字為最小單元進(jìn)行拆分,生成問句編碼序列[‘玉’,‘米’,‘苗’,‘枯’,‘病’,‘怎’,‘防’,‘治’];(2)將拆分后序列按照Vocab字典中漢字對(duì)應(yīng)ID進(jìn)行向量編碼并進(jìn)行Padding填充生成固定維度的的詞向量;(3)將詞向量矩陣輸入TextCNN網(wǎng)絡(luò),利用不同大小的卷積核提取多維的特征圖,將多個(gè)特征進(jìn)行拼接作為該句的分類結(jié)果輸出。

    在農(nóng)業(yè)問句的分類中,BERT對(duì)輸入的問句編碼包含字向量(Token embedding)、句向量(Segement embedding)和位置向量(Position embedding)。3個(gè)向量求和后生成最終的特征向量矩陣∈,式中,為句子長(zhǎng)度,為詞向量維度。之后利用不同尺寸的卷積核對(duì)特征向量矩陣M進(jìn)行卷積操作:

    式中,為卷積核特征向量,()為卷積層激活函數(shù),為偏置項(xiàng)。本研究中,經(jīng)過(guò)卷積后的向量經(jīng)過(guò)最大池化保留特征作為全連接層的輸入,計(jì)算公式如下:

    在融合特征的基礎(chǔ)上,輸出層利用Softmax函數(shù)進(jìn)行分類,并利用Dropout隨機(jī)丟棄神經(jīng)單元。分類函數(shù)的計(jì)算公式如下:

    式中,表示模型分類結(jié)果,為輸出層權(quán)重,為偏置項(xiàng)。

    1.2 文本采集和數(shù)據(jù)集構(gòu)建

    本研究利用Python爬蟲從農(nóng)業(yè)種植網(wǎng)、幫農(nóng)網(wǎng)、淘金地農(nóng)業(yè)網(wǎng)等網(wǎng)站共爬取76944條問答對(duì)數(shù)據(jù),數(shù)據(jù)采集詳情如表1所示。在文本預(yù)處理過(guò)程中刪除問句中空格和中英文特殊符號(hào),并在剔除無(wú)效字段后將疑問句全部轉(zhuǎn)為陳述句,構(gòu)建農(nóng)業(yè)問答對(duì)數(shù)據(jù)庫(kù)。

    從預(yù)處理后的問答庫(kù)中隨機(jī)抽取20000條問句,利用關(guān)鍵詞的詞頻及共現(xiàn)頻次主題聚類后劃分類別。由表2可看出,農(nóng)業(yè)問句的分類主要包括病蟲草害防治、栽培技術(shù)、田間管理、土肥水管理、品種資源與繁育和其他等6個(gè)類別。在經(jīng)過(guò)多人標(biāo)注和交叉檢驗(yàn)后,按照8∶1∶1的比例劃分訓(xùn)練集、驗(yàn)證集和測(cè)試集。訓(xùn)練集用來(lái)建立分類模型,驗(yàn)證集用來(lái)調(diào)整模型參數(shù),測(cè)試集用來(lái)驗(yàn)證模驗(yàn)分類效果。

    1.3 試驗(yàn)平臺(tái)和模型參數(shù)

    程序運(yùn)行平臺(tái)的CPU為Intel(R)Xeon(R)Silver 4114,GPU為Tesla P40 64G,操作系統(tǒng)為Ubuntu16.04,深度學(xué)習(xí)框架為Pytorch1.1,BERT選擇中文版本BERT-base-Chinese,詞向量維度為768,Word2vec詞向量維度為300,卷積核大小為[3,4,5],學(xué)習(xí)率為5e-5,截?cái)嚅L(zhǎng)度為32,Drop_rate為0.5。

    1.4 模型評(píng)價(jià)指標(biāo)

    為驗(yàn)證不同模型的分類效果,選擇精確率(Precision,P)、召回率(Recall,R)和調(diào)和平均值(F1-Score,F(xiàn)1)作為評(píng)價(jià)指標(biāo)。相關(guān)公式如下:

    圖1 基于BERT-TextCNN的農(nóng)業(yè)問句分類模型Fig.1 Agricultural questions classification model based on BERT-TextCNN

    表1 數(shù)據(jù)采集詳情Table 1 Data collection details

    表2 農(nóng)業(yè)問句類別分布Table 2 Category distribution of agricultural questions

    式中,TP代表正類預(yù)測(cè)正確的數(shù)量,F(xiàn)P代表將負(fù)類預(yù)測(cè)為正類的數(shù)量,F(xiàn)N代表將正類預(yù)測(cè)為負(fù)類的數(shù)量。

    2 基于BERT-TextCNN的農(nóng)業(yè)問句分類模型分析

    2.1 BERT與Word2vec分類結(jié)果驗(yàn)證

    為探究不同的詞向量編碼方式對(duì)農(nóng)業(yè)問句分類模型的影響,將Word2vec-word、Word2vec-char、BERT分別作為編碼層,對(duì)比TextCNN、BiLSTM、TextRCNN、DPCNN等深度學(xué)習(xí)模型的分類效果。在進(jìn)行多輪試驗(yàn)并取最優(yōu)值后,從表3可看出,在以詞向量作為嵌入時(shí),各基線模型效果均不理想,其中TextCNN模型的值為50.55%,BiLSTM模型效果最差,值為47.48%;而將字級(jí)特征作為嵌入時(shí),各基線模型的分類效果均大幅提升,其中TextCNN模型分類效果最優(yōu),值達(dá)91.22%,TextRCNN和DPCNN模型的值也均超過(guò)90%,BiLSTM模型的分類性能略低,值為89.42%。在字向量的對(duì)比中,單純利用BERT模型即得到更優(yōu)秀的表現(xiàn),值達(dá)92.06%;將BERT作為字向量嵌入到其他基線模型中效果也均有小幅的提升,其中表現(xiàn)最好的依然是BERT-TextCNN模型,值達(dá)93.32%,比Word2vecchar-TextCNN提升2.1%;BERT-BiLSTM模型的效果同樣略低,但值仍然達(dá)92.08%,比Word2vec-char-BiLSTM提升2.66%。

    2.2 BERT-TextCNN模型農(nóng)業(yè)問句分類結(jié)果比較

    為對(duì)比本研究的方法對(duì)農(nóng)業(yè)問句的分類效果,采用測(cè)試集分別將BERT-TextCNN和其他現(xiàn)在常用的4種農(nóng)業(yè)領(lǐng)域文本分類方法進(jìn)行測(cè)試和分析。由表4可看出,在農(nóng)業(yè)短文本的分類模型中,相比時(shí)間序列模型BiGRU,基于空間卷積模型的CNN模型分類效果更好,其中引入注意力機(jī)制的Attention_DenseCNN和BiGRU_MulCNN在F1值方面比BiGRU分別提高2.82%和0.54%,其中原因是農(nóng)業(yè)短文本的句式太短,BiGRU在上下文特征提取方面的優(yōu)勢(shì)難以發(fā)揮作用。而預(yù)訓(xùn)練模型BERT在值相比于BiGRU、Attention_DenseCNN和BiGRU_MulCNN均 有 較 大提升,達(dá)92.06%。此外,在BERT的基礎(chǔ)上拼接CNN層,對(duì)BERT生成的字向量進(jìn)行空間維度的特征提取,可有效解決短文本特征稀疏的問題,提高分類準(zhǔn)確率,該模型的值達(dá)93.32%,將BERT模型的值提高1.26%,取得了更好的分類效果。

    表3 不同詞向量嵌入時(shí)分類結(jié)果比較Table 3 Results of question classification with different word vectors

    表4 不同模型農(nóng)業(yè)問句分類結(jié)果比較Table 4 Comparison of agricultural questions of different models

    2.3 BERT-TextCNN模型農(nóng)業(yè)問句細(xì)分試驗(yàn)結(jié)果

    為進(jìn)一步對(duì)比模型間的差異和效果,通過(guò)細(xì)分實(shí)驗(yàn)分析BERT字向量嵌入時(shí)各模型在不同類別上的、和值。由表5可看出,各模型在病蟲草害防治和土肥水管理2個(gè)類別中評(píng)價(jià)指標(biāo)均很高,而在栽培技術(shù)、田間管理和其他3個(gè)類別中準(zhǔn)確率稍差,因?yàn)榍?個(gè)大類中標(biāo)注的數(shù)據(jù)量較多,而在數(shù)據(jù)量小的類別上性能略有下降。同時(shí),各模型在其他類別的值較低,因?yàn)槠渲邪穗y以判斷或與其他類別有交叉的樣本,影響了整體分類效果??傮w上,BERT-TextCNN在栽培技術(shù)、田間管理、土肥水管理和其他4個(gè)類別中均取得了最優(yōu)的性能,證明TextCNN模型在農(nóng)業(yè)短文本分類中的有效性和魯棒性。

    為進(jìn)一步分析模型在各類別的分類情況,對(duì)各模型在測(cè)試集的分類結(jié)果構(gòu)建混淆矩陣。由圖2可看出,在6個(gè)類別中,病蟲害防治、土肥水管理和品種資源三個(gè)類別分類結(jié)果相對(duì)集中,錯(cuò)分現(xiàn)象較少,而栽培技術(shù)與田間管理兩個(gè)類別間易出現(xiàn)交叉錯(cuò)分,錯(cuò)分。通過(guò)對(duì)問句文本的觀察發(fā)現(xiàn),栽培技術(shù)和田間管理在少部分問句中分類界限比較模糊,如問句“苗木移栽時(shí)為什么要進(jìn)行修剪”,其中“移栽”和“修剪”分別屬于栽培技術(shù)和田間管理2個(gè)類別,此類樣本在一定程度上影響了分類精度。另外,數(shù)據(jù)集中存在一句多問的樣本,同時(shí)包含多個(gè)分類類別,也對(duì)分類效果產(chǎn)生了負(fù)面影響。而其他類別的錯(cuò)分情況比較分散,這是因?yàn)樵擃愒跀?shù)據(jù)標(biāo)注時(shí)包含了大量難以明確定義的問句,在特征方面與別的類別存在融合,導(dǎo)致了分類錯(cuò)誤,但是總體而言,各類別分錯(cuò)的占比較低。

    表5 基于BERT嵌入時(shí)各模型在不同類別的結(jié)果Table 5 Classification results of BERT embedding in different categories

    圖2 基于BERT模型的分類結(jié)果混淆矩陣Fig.2 Confusion matrix of classification results based on BERT

    2.4 BERT-TextCNN模型參數(shù)分析

    模型中超參數(shù)的設(shè)置對(duì)最終分類結(jié)果有重要影響,為進(jìn)一步提升BERT-TextCNN的分類性能,固定其他參數(shù)不變,對(duì)卷積核大小、迭代次數(shù)和學(xué)習(xí)率大小等參數(shù)進(jìn)行進(jìn)一步的探究。卷積核的大小決定了TextCNN抽取文本特征的視野程度,卷積核越大,捕獲的特征越多,但同時(shí)也會(huì)產(chǎn)生更多的參數(shù)計(jì)算,因此選擇合適的卷積核至關(guān)重要。由表6可看出,在卷積核大小設(shè)置為[3,4,5]時(shí),模型分類的效果最好,當(dāng)卷積核大小設(shè)置為[4,5,6]和[3,4,5,6]時(shí)效果也非常接近,但卷積核的寬度增加也帶來(lái)了更高的計(jì)算成本,因此,本研究中卷積核大小設(shè)定為[3,4,5]。

    迭代次數(shù)可反映深度學(xué)習(xí)模型損失函數(shù)的下降程度和模型收斂情況。由圖3可看出,在BERTTextCNN模型迭代效果分析調(diào)參的3次試驗(yàn)中,當(dāng)訓(xùn)練迭代至2次時(shí),分類效果已有明顯的提升,迭代次數(shù)至4次時(shí),模型已收斂完成并達(dá)到最優(yōu)值,證明TextCNN在提取特征方面的并行計(jì)算能力可讓模型可更快速地收斂,之后繼續(xù)訓(xùn)練對(duì)模型的分類性能不再有明顯的提升。而為降低訓(xùn)練時(shí)間和計(jì)算成本,本研究中模型迭代次數(shù)設(shè)為5。

    表6 卷積核大小對(duì)試驗(yàn)結(jié)果的影響Table 6 Influence of convolution kernel size on experimental results

    學(xué)習(xí)率作為深度學(xué)習(xí)中重要的參數(shù),決定著優(yōu)化函數(shù)能否收斂及何時(shí)收斂到全局最小值。當(dāng)學(xué)習(xí)率設(shè)置得過(guò)小時(shí),收斂過(guò)程將變得十分緩慢,會(huì)增加訓(xùn)練時(shí)間;而當(dāng)學(xué)習(xí)率設(shè)置的過(guò)大時(shí),模型可能陷入局部最優(yōu),甚至不能收斂。由表7可看出,當(dāng)學(xué)習(xí)率設(shè)置為1e-3時(shí),BERT-TextCNN模型未能收斂;隨著學(xué)習(xí)率的增加,模型在5e-5時(shí)達(dá)最優(yōu)值;而當(dāng)學(xué)習(xí)率為5e-6時(shí),分類性能開始下降。因此,本研究中學(xué)習(xí)率設(shè)定為5e-5。

    圖3 迭代次數(shù)對(duì)分類結(jié)果的影響Fig.3 Influence of number of iterations on the experimental results

    表7 學(xué)習(xí)率大小對(duì)試驗(yàn)結(jié)果的影響Table 7 Influence of learning rate on experimental results

    3 討論

    本研究通過(guò)采集網(wǎng)絡(luò)文本中的農(nóng)業(yè)問句數(shù)據(jù),經(jīng)過(guò)清洗后構(gòu)建農(nóng)業(yè)問句語(yǔ)料庫(kù),并基于農(nóng)業(yè)問句詞語(yǔ)特征稀疏、文本長(zhǎng)度較短的特點(diǎn),提出基于BERT字向量和TextCNN結(jié)合的農(nóng)業(yè)問句分類模型,在進(jìn)行多個(gè)深度學(xué)習(xí)模型對(duì)比試驗(yàn)后,發(fā)現(xiàn)BERT模型作為詞向量嵌入時(shí)所有的分類評(píng)價(jià)指標(biāo)上均優(yōu)于Word2vec模型,說(shuō)明BERT經(jīng)過(guò)海量語(yǔ)料預(yù)訓(xùn)練后生成的動(dòng)態(tài)字向量比Word2vec具有更強(qiáng)的表征能力,與其他學(xué)者在情感分類(劉思琴和馮胥睿瑞,2020)、醫(yī)學(xué)(趙旸等,2020)及社交電商(李可悅等,2021)等領(lǐng)域的研究結(jié)果相符,證明BERT模型生成的字向量在專業(yè)領(lǐng)域文本分類中具有更好的分類性能。同時(shí),在以Word2vec-word、Word2vec-char和BERT-char等不同向量編碼進(jìn)行時(shí),TextCNN的值均優(yōu)于其他模型,表明在短文本的分類中,TextCNN僅通過(guò)卷積和池化操作獲取的局部特征可達(dá)到不錯(cuò)的分類效果;而以BiLSTM為代表的循環(huán)神經(jīng)網(wǎng)絡(luò)模型在不同詞向量嵌入時(shí)值均低于其他模型,說(shuō)明循環(huán)神經(jīng)網(wǎng)絡(luò)在問句文本較短、特征稀疏的情況下,其長(zhǎng)距離特征提取的優(yōu)勢(shì)不能充分發(fā)揮,分類效果不佳。最后,將BiLSTM和最大池化結(jié)合的TextRCNN及更深層次的DPCNN模型分類效果也均優(yōu)于BiLSTM模型,也證明了在短文本分類中CNN模型的卷積和池化操作對(duì)分類性能具有明顯的提升效果。

    目前,在農(nóng)業(yè)問句的研究中,王郝日欽等(2021)提出基于Attention_DenseCNN的水稻問答系統(tǒng)問句分類,證明CNN模型可提高農(nóng)業(yè)問句分類性能;馮帥等(2021)提出深度卷積神經(jīng)網(wǎng)絡(luò)的水稻知識(shí)文本分類方法也表明具有卷積結(jié)構(gòu)的CNN網(wǎng)絡(luò)更適合進(jìn)行農(nóng)業(yè)短文本分類,這與本研究的結(jié)果一致。金寧等(2020)提出BiGRU和MulCNN模型證明混合網(wǎng)絡(luò)可獲得比單一CNN網(wǎng)絡(luò)更好的分類效果,這與本研究結(jié)果結(jié)合,表明構(gòu)建表征能力更強(qiáng)的詞向量和多特征混合神經(jīng)網(wǎng)絡(luò)對(duì)于提升農(nóng)業(yè)短文本分類效果具有積極的作用。

    本研究采用的方法在農(nóng)業(yè)問據(jù)的分類上雖取得了良好的效果,但在某些方面還需進(jìn)一步改進(jìn)。首先,構(gòu)建數(shù)據(jù)集采用的是多個(gè)不同網(wǎng)頁(yè)自動(dòng)收集的方法,導(dǎo)致源數(shù)據(jù)中存在大量的噪聲,盡管經(jīng)過(guò)數(shù)據(jù)清洗等預(yù)處理操作,也難以避免模型在此數(shù)據(jù)集上的學(xué)習(xí)受到干擾。其次,本研究?jī)H利用TextCNN進(jìn)行特征提取,對(duì)農(nóng)業(yè)問句中多維度的特征挖掘還不充分,模型在編碼過(guò)程中并未考慮詞頻與文檔等層面的特征分布,僅通過(guò)單一的網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行分類,易造成誤分現(xiàn)象。

    4 建議

    4.1 規(guī)范農(nóng)業(yè)問句采集和處理流程,提升數(shù)據(jù)集構(gòu)建質(zhì)量

    在農(nóng)業(yè)問句的采集過(guò)程中,不同農(nóng)技服務(wù)平臺(tái)或網(wǎng)頁(yè)的字段內(nèi)容、格式不同,導(dǎo)致數(shù)據(jù)存在較大噪聲,需要花費(fèi)大量人力和時(shí)間成本進(jìn)行清洗。因此,需要規(guī)范農(nóng)業(yè)問句的采集和處理流程,可利用正則表達(dá)式去除標(biāo)簽、表格等無(wú)效的HTML字段,并清洗入庫(kù);在數(shù)據(jù)的標(biāo)注過(guò)程中可采用阿里NLP、哈工大LTP等開源共享平臺(tái),進(jìn)行多人協(xié)同標(biāo)注和交叉檢驗(yàn),提升數(shù)據(jù)集構(gòu)建質(zhì)量。

    4.2 獲取多維度的文本特征,提高分類精度

    農(nóng)業(yè)問句長(zhǎng)度較短且口語(yǔ)化嚴(yán)重,文本的特征稀疏。各類專有名詞如杜鵑花、設(shè)施農(nóng)業(yè)、番茄病毒病等具有很強(qiáng)的領(lǐng)域性,在去除停用詞后進(jìn)行分詞往往只能保留少數(shù)動(dòng)詞和名詞,再加上分詞工具的錯(cuò)誤拆分會(huì)進(jìn)一步稀疏特征,制約了模型的分類性能。建議采用TF-IDF等算法引入詞頻及文檔信息,并在特征提取階段加入BiLSTM、注意力機(jī)制等模型獲取問句上下文和關(guān)鍵詞特征,擴(kuò)大特征提取范圍,提高模型分類精度。

    4.3 完善農(nóng)技人員培訓(xùn)體系,探索數(shù)字化農(nóng)技服務(wù)模式

    農(nóng)業(yè)問句表述的是農(nóng)民實(shí)際生產(chǎn)、生活中遇到的迫切需要解決的問題,其中,病蟲害診斷防治和栽培管理技術(shù)是廣大農(nóng)民群眾在生產(chǎn)中咨詢最多的話題。建議相關(guān)政府職能部門加強(qiáng)與農(nóng)村合作社、農(nóng)業(yè)科研院所等部門的合作,完善農(nóng)技推廣與服務(wù)人員培訓(xùn)體系。充分利用各類農(nóng)技推廣平臺(tái)和移動(dòng)終端應(yīng)用程序等現(xiàn)代信息技術(shù),開設(shè)農(nóng)業(yè)科學(xué)技術(shù)相關(guān)培訓(xùn)課程,提高農(nóng)民知識(shí)儲(chǔ)備和技能水平,并利用線上線下結(jié)合的農(nóng)技指導(dǎo)服務(wù)模式,積極開展農(nóng)業(yè)生產(chǎn)病蟲害防治和栽培技術(shù)相關(guān)指導(dǎo)工作。

    猜你喜歡
    特征
    抓住特征巧觀察
    離散型隨機(jī)變量的分布列與數(shù)字特征
    具有兩個(gè)P’維非線性不可約特征標(biāo)的非可解群
    月震特征及與地震的對(duì)比
    如何表達(dá)“特征”
    被k(2≤k≤16)整除的正整數(shù)的特征
    不忠誠(chéng)的四個(gè)特征
    詈語(yǔ)的文化蘊(yùn)含與現(xiàn)代特征
    新聞傳播(2018年11期)2018-08-29 08:15:24
    抓住特征巧觀察
    基于特征篩選的模型選擇
    久久精品熟女亚洲av麻豆精品| a级毛片免费高清观看在线播放| 国产精品人妻久久久影院| 少妇的逼好多水| 国产亚洲午夜精品一区二区久久 | 日韩视频在线欧美| 人人妻人人澡人人爽人人夜夜| 亚洲成人精品中文字幕电影| 亚州av有码| 国精品久久久久久国模美| 精品久久久久久久末码| 国产av不卡久久| 看非洲黑人一级黄片| 国产乱人视频| 亚洲色图av天堂| 国产精品不卡视频一区二区| 欧美人与善性xxx| www.av在线官网国产| 99久久九九国产精品国产免费| 欧美区成人在线视频| 在线观看一区二区三区| 国产高清有码在线观看视频| 内地一区二区视频在线| 欧美日韩综合久久久久久| 国内少妇人妻偷人精品xxx网站| 亚州av有码| 春色校园在线视频观看| 国产色婷婷99| 国产免费一级a男人的天堂| 色吧在线观看| 成年人午夜在线观看视频| 国产亚洲av片在线观看秒播厂| 国产精品.久久久| 少妇被粗大猛烈的视频| 一区二区三区免费毛片| tube8黄色片| 国产高清不卡午夜福利| 久久精品人妻少妇| 观看美女的网站| 国产亚洲一区二区精品| 九草在线视频观看| 亚洲美女视频黄频| 婷婷色综合www| 最近最新中文字幕大全电影3| av天堂中文字幕网| 最近最新中文字幕免费大全7| 97热精品久久久久久| 亚洲精品乱码久久久v下载方式| 精品酒店卫生间| 久久精品国产自在天天线| 观看美女的网站| 美女视频免费永久观看网站| 看十八女毛片水多多多| 亚洲av成人精品一二三区| 久久6这里有精品| 美女视频免费永久观看网站| 久久久久国产网址| 国产成人免费观看mmmm| 国产片特级美女逼逼视频| 国产日韩欧美在线精品| 亚洲欧美清纯卡通| 在线亚洲精品国产二区图片欧美 | 亚洲av电影在线观看一区二区三区 | 欧美潮喷喷水| 只有这里有精品99| 亚洲,一卡二卡三卡| 如何舔出高潮| 美女脱内裤让男人舔精品视频| 我的女老师完整版在线观看| 国产人妻一区二区三区在| 欧美潮喷喷水| 成人黄色视频免费在线看| 精品少妇久久久久久888优播| 婷婷色av中文字幕| 一个人看的www免费观看视频| av免费观看日本| 亚洲aⅴ乱码一区二区在线播放| 中文字幕亚洲精品专区| 欧美日韩一区二区视频在线观看视频在线 | 国精品久久久久久国模美| 18禁动态无遮挡网站| 伊人久久精品亚洲午夜| av福利片在线观看| 99精国产麻豆久久婷婷| 在线看a的网站| 成人毛片60女人毛片免费| 中文天堂在线官网| 欧美精品人与动牲交sv欧美| 欧美日韩在线观看h| 九九久久精品国产亚洲av麻豆| 有码 亚洲区| 精品久久久久久久末码| 韩国高清视频一区二区三区| 中文字幕亚洲精品专区| 97在线人人人人妻| 欧美潮喷喷水| 亚洲成色77777| 国产精品国产三级专区第一集| 又粗又硬又长又爽又黄的视频| 丝袜脚勾引网站| 少妇的逼水好多| 亚洲精品久久久久久婷婷小说| 噜噜噜噜噜久久久久久91| 天堂俺去俺来也www色官网| 亚洲,欧美,日韩| 美女主播在线视频| 亚洲最大成人手机在线| 波多野结衣巨乳人妻| 免费看a级黄色片| 校园人妻丝袜中文字幕| 在线观看人妻少妇| 神马国产精品三级电影在线观看| 午夜免费鲁丝| 国产爽快片一区二区三区| 精品国产一区二区三区久久久樱花 | 亚洲av欧美aⅴ国产| 听说在线观看完整版免费高清| 成人鲁丝片一二三区免费| 看免费成人av毛片| 99热网站在线观看| 在线免费观看不下载黄p国产| 人妻一区二区av| 在线观看一区二区三区| 国产精品久久久久久精品电影小说 | 十八禁网站网址无遮挡 | 国产黄频视频在线观看| 欧美日韩国产mv在线观看视频 | 大话2 男鬼变身卡| 偷拍熟女少妇极品色| 欧美极品一区二区三区四区| 国产高潮美女av| 噜噜噜噜噜久久久久久91| 国产v大片淫在线免费观看| 岛国毛片在线播放| 国产精品国产三级国产av玫瑰| 久久久久精品性色| 中国美白少妇内射xxxbb| 精品国产乱码久久久久久小说| 欧美xxxx黑人xx丫x性爽| 99热这里只有是精品50| 汤姆久久久久久久影院中文字幕| 国产精品久久久久久av不卡| 成人午夜精彩视频在线观看| 3wmmmm亚洲av在线观看| 色婷婷久久久亚洲欧美| 亚洲欧美日韩东京热| 久久久久久久久大av| 亚洲精品日本国产第一区| 免费看不卡的av| av免费观看日本| 亚洲va在线va天堂va国产| 国产伦精品一区二区三区四那| 久久国产乱子免费精品| 性色avwww在线观看| 中文字幕久久专区| 日本与韩国留学比较| 亚洲国产精品成人综合色| 男女那种视频在线观看| 国产 一区精品| 午夜老司机福利剧场| 久热这里只有精品99| 亚洲欧美日韩无卡精品| 99久国产av精品国产电影| 欧美高清成人免费视频www| av免费观看日本| 美女cb高潮喷水在线观看| 久久久精品免费免费高清| 国产精品无大码| 亚洲国产最新在线播放| 午夜视频国产福利| 日本wwww免费看| 中文乱码字字幕精品一区二区三区| 免费av观看视频| 亚洲美女视频黄频| 青春草国产在线视频| 亚洲成色77777| 国产黄a三级三级三级人| 又爽又黄无遮挡网站| 色网站视频免费| 国产一区二区亚洲精品在线观看| 精品人妻一区二区三区麻豆| 亚洲av中文av极速乱| 国产成人免费无遮挡视频| 亚洲三级黄色毛片| 视频区图区小说| 亚洲欧美清纯卡通| 国产欧美亚洲国产| 国产男人的电影天堂91| 欧美高清性xxxxhd video| 国产精品一区二区性色av| 欧美性感艳星| 欧美潮喷喷水| 精品人妻偷拍中文字幕| 国产黄片视频在线免费观看| 日日啪夜夜爽| 蜜臀久久99精品久久宅男| 性插视频无遮挡在线免费观看| 日韩电影二区| 99久久精品热视频| 婷婷色av中文字幕| 久久精品人妻少妇| 国模一区二区三区四区视频| 免费看光身美女| 日韩三级伦理在线观看| 成年av动漫网址| 国产午夜福利久久久久久| 偷拍熟女少妇极品色| 观看免费一级毛片| 免费观看a级毛片全部| 男人和女人高潮做爰伦理| 欧美+日韩+精品| 国产欧美另类精品又又久久亚洲欧美| 亚洲久久久久久中文字幕| 交换朋友夫妻互换小说| av国产久精品久网站免费入址| 亚洲在线观看片| 亚洲自拍偷在线| 久久久色成人| 成人亚洲欧美一区二区av| 在线观看国产h片| 国产日韩欧美亚洲二区| 婷婷色麻豆天堂久久| 欧美xxxx黑人xx丫x性爽| 97超碰精品成人国产| 美女国产视频在线观看| 特大巨黑吊av在线直播| 国产精品国产三级专区第一集| 性色avwww在线观看| 亚洲无线观看免费| 国产国拍精品亚洲av在线观看| 精品99又大又爽又粗少妇毛片| 亚洲av欧美aⅴ国产| 91精品伊人久久大香线蕉| 国产在线男女| 自拍欧美九色日韩亚洲蝌蚪91 | 麻豆精品久久久久久蜜桃| 人体艺术视频欧美日本| 视频中文字幕在线观看| 80岁老熟妇乱子伦牲交| 日韩三级伦理在线观看| 国产乱人偷精品视频| 日本与韩国留学比较| 99久久精品国产国产毛片| 欧美+日韩+精品| 2018国产大陆天天弄谢| 国产 一区 欧美 日韩| 欧美日韩在线观看h| 男人爽女人下面视频在线观看| 成人高潮视频无遮挡免费网站| 日本猛色少妇xxxxx猛交久久| 欧美成人午夜免费资源| 精品人妻视频免费看| 日韩亚洲欧美综合| 97超碰精品成人国产| 国产真实伦视频高清在线观看| 我要看日韩黄色一级片| 免费黄色在线免费观看| 久久久精品免费免费高清| 久久久午夜欧美精品| 91久久精品国产一区二区成人| 国产久久久一区二区三区| 老司机影院毛片| 亚洲精品色激情综合| 日韩成人av中文字幕在线观看| 国产淫片久久久久久久久| 亚洲精品乱码久久久v下载方式| 人妻制服诱惑在线中文字幕| 日韩不卡一区二区三区视频在线| 性插视频无遮挡在线免费观看| 真实男女啪啪啪动态图| 在线看a的网站| 男女国产视频网站| 国产精品一二三区在线看| 国产探花极品一区二区| 日韩不卡一区二区三区视频在线| 久久久久九九精品影院| 国产色婷婷99| 久久99精品国语久久久| av在线天堂中文字幕| 亚洲图色成人| 亚洲精品日韩在线中文字幕| 黄色视频在线播放观看不卡| 高清午夜精品一区二区三区| 欧美日韩国产mv在线观看视频 | 日本与韩国留学比较| 亚洲国产精品成人久久小说| 大陆偷拍与自拍| 91在线精品国自产拍蜜月| 欧美高清成人免费视频www| 又粗又硬又长又爽又黄的视频| 尤物成人国产欧美一区二区三区| 国产伦精品一区二区三区视频9| 啦啦啦啦在线视频资源| 免费高清在线观看视频在线观看| 久久久久网色| 欧美xxⅹ黑人| 99久国产av精品国产电影| 亚洲经典国产精华液单| 在线观看免费高清a一片| 欧美人与善性xxx| 激情五月婷婷亚洲| 成人欧美大片| 亚洲欧洲日产国产| 联通29元200g的流量卡| 在线观看三级黄色| 亚洲av成人精品一区久久| 99久久精品热视频| 国产乱人偷精品视频| 国产一区二区在线观看日韩| 女的被弄到高潮叫床怎么办| 日韩欧美精品v在线| 在线免费观看不下载黄p国产| 国产女主播在线喷水免费视频网站| 国产在视频线精品| 高清午夜精品一区二区三区| 亚洲欧美清纯卡通| 亚洲电影在线观看av| 嫩草影院入口| 99久久九九国产精品国产免费| 美女xxoo啪啪120秒动态图| 80岁老熟妇乱子伦牲交| 丰满乱子伦码专区| 成人综合一区亚洲| 少妇的逼好多水| 国产成人a区在线观看| 菩萨蛮人人尽说江南好唐韦庄| 中文字幕制服av| 亚洲熟女精品中文字幕| 国产精品伦人一区二区| 精品久久久久久久久亚洲| 成人二区视频| 深夜a级毛片| 国产视频内射| av播播在线观看一区| 99热全是精品| 中文欧美无线码| 天堂俺去俺来也www色官网| 亚洲一区二区三区欧美精品 | 哪个播放器可以免费观看大片| 青春草国产在线视频| 亚洲av国产av综合av卡| 天堂俺去俺来也www色官网| 亚洲av中文av极速乱| 国产 精品1| 国内精品美女久久久久久| 亚洲va在线va天堂va国产| 欧美日韩综合久久久久久| 国产免费一区二区三区四区乱码| 九九在线视频观看精品| 大香蕉97超碰在线| 边亲边吃奶的免费视频| 人妻少妇偷人精品九色| 亚洲精品视频女| 少妇人妻精品综合一区二区| 国产极品天堂在线| 国产视频内射| 哪个播放器可以免费观看大片| 成人二区视频| 26uuu在线亚洲综合色| 免费看日本二区| 国产精品成人在线| 香蕉精品网在线| 熟女人妻精品中文字幕| 亚洲av欧美aⅴ国产| 午夜爱爱视频在线播放| 日韩一本色道免费dvd| 国产 精品1| 国产永久视频网站| 韩国av在线不卡| 国产极品天堂在线| 一级av片app| freevideosex欧美| 国产精品久久久久久精品古装| 日本与韩国留学比较| 日本黄色片子视频| 哪个播放器可以免费观看大片| 嘟嘟电影网在线观看| 深夜a级毛片| 蜜桃亚洲精品一区二区三区| 久久精品国产自在天天线| 中文字幕亚洲精品专区| 亚洲国产精品专区欧美| 又黄又爽又刺激的免费视频.| 国产欧美另类精品又又久久亚洲欧美| 一级毛片aaaaaa免费看小| 一级片'在线观看视频| 一级毛片aaaaaa免费看小| 国产亚洲午夜精品一区二区久久 | 青青草视频在线视频观看| 91狼人影院| 国产综合精华液| 十八禁网站网址无遮挡 | 久久影院123| 中国美白少妇内射xxxbb| 一级毛片久久久久久久久女| 五月开心婷婷网| av卡一久久| .国产精品久久| 欧美xxxx黑人xx丫x性爽| 欧美区成人在线视频| 午夜福利视频1000在线观看| 夜夜看夜夜爽夜夜摸| 春色校园在线视频观看| 国内少妇人妻偷人精品xxx网站| 久久久久国产精品人妻一区二区| 国产精品无大码| 特大巨黑吊av在线直播| 免费av毛片视频| 老女人水多毛片| 亚洲av福利一区| 青春草视频在线免费观看| 亚洲内射少妇av| 看黄色毛片网站| 欧美一区二区亚洲| 精品酒店卫生间| 成人无遮挡网站| 亚洲色图av天堂| 精品少妇久久久久久888优播| 久久久精品免费免费高清| 亚洲欧洲国产日韩| 午夜爱爱视频在线播放| 九九在线视频观看精品| 天美传媒精品一区二区| 日韩一区二区视频免费看| 日韩制服骚丝袜av| 国产精品久久久久久久久免| 三级国产精品欧美在线观看| 色播亚洲综合网| 亚洲av中文字字幕乱码综合| 国产精品av视频在线免费观看| 国产乱来视频区| 制服丝袜香蕉在线| 亚洲精品影视一区二区三区av| 亚洲国产精品999| 国产av不卡久久| 中文在线观看免费www的网站| 精品久久久久久久久亚洲| 免费看av在线观看网站| 2021天堂中文幕一二区在线观| 丝袜脚勾引网站| 亚洲国产高清在线一区二区三| 色播亚洲综合网| 十八禁网站网址无遮挡 | 精品国产一区二区三区久久久樱花 | 成人亚洲精品一区在线观看 | 亚洲欧美清纯卡通| 中文字幕av成人在线电影| 建设人人有责人人尽责人人享有的 | 日本黄大片高清| 97精品久久久久久久久久精品| 男女啪啪激烈高潮av片| 五月天丁香电影| 夜夜看夜夜爽夜夜摸| 黄色怎么调成土黄色| 国产综合懂色| 免费观看a级毛片全部| 下体分泌物呈黄色| 全区人妻精品视频| 日日摸夜夜添夜夜爱| 中文资源天堂在线| 男女边吃奶边做爰视频| 国产成人a区在线观看| 久久久久久伊人网av| 熟妇人妻不卡中文字幕| 国产真实伦视频高清在线观看| 亚洲欧美日韩另类电影网站 | 色5月婷婷丁香| 国产精品爽爽va在线观看网站| 男女无遮挡免费网站观看| 亚洲精品乱久久久久久| 尤物成人国产欧美一区二区三区| 久久精品久久久久久噜噜老黄| 麻豆成人av视频| 搡老乐熟女国产| 十八禁网站网址无遮挡 | 亚洲av一区综合| 一个人看的www免费观看视频| 一本一本综合久久| 亚洲欧美精品专区久久| 亚洲国产精品国产精品| 97在线视频观看| 日韩,欧美,国产一区二区三区| 性色avwww在线观看| 久久久亚洲精品成人影院| 成人二区视频| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 亚洲精品久久久久久婷婷小说| 国产黄色视频一区二区在线观看| 最近的中文字幕免费完整| kizo精华| 国产精品三级大全| 成人美女网站在线观看视频| 欧美日韩精品成人综合77777| 国产69精品久久久久777片| 日日啪夜夜撸| 亚洲人与动物交配视频| 国内精品美女久久久久久| 最近中文字幕高清免费大全6| 午夜免费男女啪啪视频观看| 亚洲欧洲日产国产| 精品一区二区三卡| 亚洲精品色激情综合| 99久久人妻综合| 亚洲欧洲国产日韩| 亚洲不卡免费看| 在线观看一区二区三区| 成人亚洲精品av一区二区| av国产免费在线观看| 亚洲不卡免费看| 成人国产av品久久久| 99re6热这里在线精品视频| 国产欧美另类精品又又久久亚洲欧美| 高清在线视频一区二区三区| 亚洲av成人精品一二三区| 亚洲久久久久久中文字幕| 又大又黄又爽视频免费| 女的被弄到高潮叫床怎么办| 黄片wwwwww| 在线观看av片永久免费下载| 日韩亚洲欧美综合| 国产黄色免费在线视频| 亚洲美女搞黄在线观看| 国产黄a三级三级三级人| 免费大片黄手机在线观看| 在线 av 中文字幕| 日韩中字成人| 国产欧美日韩精品一区二区| 国产av国产精品国产| 我的老师免费观看完整版| 极品教师在线视频| 国产男人的电影天堂91| 亚洲欧美日韩东京热| 大香蕉97超碰在线| 少妇人妻一区二区三区视频| 一级爰片在线观看| 国产黄片视频在线免费观看| 国产精品一区二区性色av| 如何舔出高潮| 日本猛色少妇xxxxx猛交久久| 国产欧美亚洲国产| 国产 精品1| 日韩不卡一区二区三区视频在线| 波多野结衣巨乳人妻| 美女内射精品一级片tv| 久久久午夜欧美精品| av黄色大香蕉| 舔av片在线| 在线天堂最新版资源| a级毛色黄片| 丰满人妻一区二区三区视频av| 秋霞伦理黄片| 99九九线精品视频在线观看视频| 国产成人freesex在线| 久久久久国产网址| 69人妻影院| 黄色配什么色好看| 国产成人免费无遮挡视频| 亚洲,欧美,日韩| 亚洲aⅴ乱码一区二区在线播放| 亚洲av二区三区四区| 最后的刺客免费高清国语| av在线蜜桃| 99热全是精品| 26uuu在线亚洲综合色| 特大巨黑吊av在线直播| 99久久精品热视频| 观看免费一级毛片| 国产国拍精品亚洲av在线观看| 97超碰精品成人国产| 91在线精品国自产拍蜜月| 国产精品一区二区在线观看99| 插阴视频在线观看视频| 寂寞人妻少妇视频99o| 欧美xxxx性猛交bbbb| 黄片无遮挡物在线观看| 熟妇人妻不卡中文字幕| 国产成人免费观看mmmm| 在线精品无人区一区二区三 | 免费看av在线观看网站| 久久久国产一区二区| 看十八女毛片水多多多| 99热全是精品| xxx大片免费视频| 色综合色国产| 国产中年淑女户外野战色| 一本色道久久久久久精品综合| 欧美激情国产日韩精品一区| 丝袜脚勾引网站| 亚洲国产精品专区欧美| 在线精品无人区一区二区三 | 国产午夜精品一二区理论片| 最后的刺客免费高清国语| 少妇人妻一区二区三区视频| 日韩欧美一区视频在线观看 | 日本爱情动作片www.在线观看| 中文天堂在线官网| 极品少妇高潮喷水抽搐| 国产黄片视频在线免费观看| 中文字幕av成人在线电影| 国产亚洲av片在线观看秒播厂| 免费观看性生交大片5| 亚洲精品亚洲一区二区| 国产一区有黄有色的免费视频| 丝袜美腿在线中文| 国产亚洲5aaaaa淫片| 精品一区二区三卡| videossex国产| 亚洲真实伦在线观看| 大又大粗又爽又黄少妇毛片口| 国产免费一区二区三区四区乱码| 国产真实伦视频高清在线观看| 99久久精品一区二区三区| 97热精品久久久久久| av国产免费在线观看| 国产精品人妻久久久久久|