• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于循環(huán)神經(jīng)網(wǎng)絡(luò)的花兒信息模型建模方法

      2020-08-13 07:17:51趙吉山王青海
      軟件 2020年6期

      趙吉山 王青海

      摘 ?要: “花兒”是一種流傳在青海、甘肅兩省、寧夏回族自治區(qū)以及新疆個(gè)別地區(qū)的山歌,被譽(yù)為大西北之魂,是國(guó)家級(jí)人類非物質(zhì)文化遺產(chǎn),2009年9月被聯(lián)合國(guó)列為人類非物質(zhì)文化遺產(chǎn)。隨著網(wǎng)絡(luò)技術(shù)及機(jī)器學(xué)習(xí)的迅猛發(fā)展,對(duì)“花兒”信息的網(wǎng)絡(luò)傳播和深度挖掘至關(guān)重要。對(duì)此,筆者提出利用機(jī)器學(xué)習(xí)自然語(yǔ)言處理(Machine Learning-Natural Language Processing)來(lái)進(jìn)行花兒唱詞信息挖掘。通過(guò)構(gòu)建循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)青海花兒模型,展開(kāi)對(duì)花兒唱詞的數(shù)據(jù)挖掘,并且實(shí)現(xiàn)Python內(nèi)置語(yǔ)言模塊與動(dòng)態(tài)網(wǎng)頁(yè)互聯(lián),能為花兒藝術(shù)研究者及民間花兒藝術(shù)愛(ài)好者提供有效且高質(zhì)量的花兒信息。利用RNN進(jìn)行花兒唱詞挖掘是一個(gè)非常有意義的研究課題,對(duì)未來(lái)花兒藝術(shù)的發(fā)展和傳承具有重大的作用。

      關(guān)鍵詞: 循環(huán)神經(jīng)網(wǎng)絡(luò);青?;▋?信息挖掘;動(dòng)態(tài)網(wǎng)頁(yè)

      中圖分類號(hào): TP389.1 ? ?文獻(xiàn)標(biāo)識(shí)碼: A ? ?DOI:10.3969/j.issn.1003-6970.2020.06.004

      本文著錄格式:趙吉山,王青海. 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的花兒信息模型建模方法[J]. 軟件,2020,41(06):1923

      【Abstract】: “Huaer” is a folk song spread in Qinghai、Gansu Province、Ningxia and some areas in Xinjiang. It is known as the soul of the Northwest and is a national intangible cultural heritage. Human intangible cultural heritage. With the rapid development of network technology and machine learning, it is very important for the network dissemination and deep mining of Huaer information. In this regard, the author proposes to use Machine Learning- Natural Language Processing to perform flower singing information mining. By constructing a Recurrent Neural Network (RNN) Qinghai Huaer model, the data mining of Huaer chanting is carried out, and the built-in language module of Python is interconnected with dynamic web pages, which can be a flower art researcher and folk flower art hobby Provide effective and high-quality Huaer information. The use of RNN for the mining of Huaer lyrics is a very significant research topic, and it will have a significant effect on the development and inheritance of Huaer art in the future.

      【Key words】: Recurrent neural network; Qinghai huaer; Information mining; Dynamic webpage

      0 ?引言

      伴隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,國(guó)外及國(guó)內(nèi)的網(wǎng)民獲取信息的速度更加迅速,人們?nèi)找嬖鲩L(zhǎng)的精神文化需求越來(lái)越高,青?;▋好耖g愛(ài)好者及花兒研究者急需獲取有效、全面、及數(shù)據(jù)規(guī)模較大的花兒信息。目前世界文化正處在大發(fā)展時(shí)期,各種思想文化交流交融更加頻繁,文化在綜合國(guó)力競(jìng)爭(zhēng)中的作用及地位更加凸顯,作為中華民族傳統(tǒng)文化中的一部分,青?;▋旱陌l(fā)展與傳播在當(dāng)下也是不可或缺的。對(duì)此,筆者利用計(jì)算機(jī)技術(shù)的優(yōu)勢(shì),分析本地區(qū)特色文化——青海花兒,通過(guò)研究青海花兒的發(fā)展?fàn)顩r得出:互聯(lián)網(wǎng)上對(duì)于花兒信息的收錄量很少,內(nèi)容不完整、不全面、且收集困難?;▋鹤鳛楸镜貐^(qū)特有的藝術(shù),其有很大的發(fā)展空間,并且在傳承及發(fā)揚(yáng)的過(guò)程中收到資源限制,因此,青?;▋盒畔⒌难芯吭诋?dāng)下更顯必要性和緊迫性。

      1 ?RNN與PHP概述

      1.1 ?RNN

      RNN是一類專門(mén)用于處理序列x(1)、x(2)、...x(t)的神經(jīng)網(wǎng)絡(luò)。RNN可以擴(kuò)展到更長(zhǎng)的序列,大多數(shù)的RNN也能處理可變長(zhǎng)度的序列。它以不同的方式共享參數(shù),輸出的每一項(xiàng)是前一項(xiàng)的函數(shù),輸出的每一項(xiàng)對(duì)先前的輸出應(yīng)用相同的更新規(guī)則產(chǎn)生[1]。RNN可應(yīng)用于跨越兩個(gè)維度的空間數(shù)據(jù),當(dāng)某個(gè)應(yīng)用涉及時(shí)間的數(shù)據(jù),并且將整個(gè)序列數(shù)據(jù)提供給網(wǎng)絡(luò)之前就能觀察到整個(gè)序列時(shí),RNN可具有關(guān)于時(shí)間向后的連接[2]。主流的循環(huán)神經(jīng)網(wǎng)絡(luò)模型的基本結(jié)構(gòu)如圖1所示。

      圖1.1左半部為沒(méi)有按時(shí)間展開(kāi)的RNN模型基本結(jié)構(gòu)圖(圖中黑色方塊表示單個(gè)時(shí)間步的延遲),右半部為按時(shí)間展開(kāi)的圖。在結(jié)構(gòu)圖中,對(duì)于每個(gè)時(shí)間步t,一般的作如下表示:

      (1)x(t)表示在時(shí)間步t時(shí)訓(xùn)練樣本的輸入。而x(t–1)、x(t+1)分別表示在時(shí)間步t–1、t+1時(shí)訓(xùn)練樣本的輸入。

      (2)h(t)表示在時(shí)間步t時(shí)隱藏層的激活函數(shù)。h(t)由x(t)、h(t–1)共同決定,一般二分問(wèn)題采用sigmoid函數(shù),K類別分類問(wèn)題采用softmax函數(shù)。

      (3)o(t)表示在時(shí)間步t時(shí)模型的輸出。o(t)只由模型當(dāng)前的隱藏狀態(tài)h(t)決定。

      (4)L(t)表示在時(shí)間步t時(shí)模型的損失函數(shù),損失函數(shù)L(t)表示輸出值o(t)與相應(yīng)訓(xùn)練目標(biāo)y(t)的長(zhǎng)度[3]。

      (5)y(t)代表在時(shí)間步t時(shí)訓(xùn)練樣本序列的目標(biāo)輸出。輸入層到隱藏層、隱藏層到輸出層、隱藏層到隱藏層的連接分別由權(quán)重矩陣U、V、W參數(shù)化。

      1.2 ?PHP

      PHP:Hypertext Preprocessor(簡(jiǎn)稱PHP)是一種通用編程語(yǔ)言,最初為動(dòng)態(tài)網(wǎng)頁(yè)開(kāi)發(fā)而設(shè)計(jì)。語(yǔ)法吸收了C、Java和Perl語(yǔ)言的特性,語(yǔ)法簡(jiǎn)單利于學(xué)習(xí),在互聯(lián)網(wǎng)動(dòng)態(tài)網(wǎng)頁(yè)開(kāi)發(fā)技術(shù)當(dāng)中應(yīng)用廣泛,主要適用于網(wǎng)頁(yè)開(kāi)發(fā)領(lǐng)域。PHP獨(dú)特的語(yǔ)法混合了C、Java、Perl以及PHP自創(chuàng)的語(yǔ)法。它可以比CGI或者Perl更快速地執(zhí)行動(dòng)態(tài)網(wǎng)頁(yè)。用PHP做動(dòng)態(tài)頁(yè)面和其他的編程語(yǔ)言相比,PHP是將程序嵌入到HTML中去執(zhí)行,執(zhí)行效率比完全生成HTML標(biāo)記的CGI要高許多[4]。PHP還可以執(zhí)行編譯后代碼,編譯可以達(dá)到加密和優(yōu)化代碼運(yùn)行,使代碼運(yùn)行更快。

      2 ?python內(nèi)置模塊與動(dòng)態(tài)網(wǎng)頁(yè)互聯(lián)

      Python是一門(mén)解釋型的編程語(yǔ)言,因此它具有解釋型語(yǔ)言的運(yùn)行機(jī)制[5]。迄今為止Python由于其可擴(kuò)展性、跨平臺(tái)等特性相較于其他語(yǔ)言擁有諸多的優(yōu)勢(shì),python的可擴(kuò)展性體現(xiàn)為它的模塊,其強(qiáng)大的類庫(kù)為機(jī)器學(xué)習(xí)等計(jì)算機(jī)前沿學(xué)科提供了有效的幫助。本次實(shí)驗(yàn)涉及的Python模塊包括應(yīng)用于文本中自動(dòng)提取語(yǔ)義主題的Gensim模塊和Python標(biāo)準(zhǔn)庫(kù)中的sys、os、time、json、process、和網(wǎng)絡(luò)模塊socket等等。

      Gensim是一款開(kāi)源的第三方Python模塊,用于從原始的非結(jié)構(gòu)化的文本中,無(wú)監(jiān)督地學(xué)習(xí)到文本隱層的主題向量表達(dá)[6]。它支持包括TF-IDF、LSA、LDA、和word2vec在內(nèi)的多種主題模型算法,支持流式訓(xùn)練,并提供了諸如相似度計(jì)算,信息檢索等一些常用任務(wù)的API接口。在本實(shí)驗(yàn)中我們采用Word2vec,Word2Vec是Google公司推出的用于獲取詞向量的工具,該工具內(nèi)部算法通過(guò)深度學(xué)習(xí)實(shí)現(xiàn)詞到向量的轉(zhuǎn)化。Word2vec模型輸出的詞向量可以被用來(lái)做很多自然語(yǔ)言處理的相關(guān)工作,比如聚類、找同義詞、詞性分析,預(yù)測(cè)等[7]。

      本實(shí)驗(yàn)采用Google公司開(kāi)源項(xiàng)目PPython實(shí)現(xiàn)Python與動(dòng)態(tài)網(wǎng)頁(yè)互聯(lián),其實(shí)現(xiàn)對(duì)兩種語(yǔ)言的優(yōu)勢(shì)互補(bǔ),結(jié)合使用Python程序和PHP程序,可理解為Python語(yǔ)言和PHP語(yǔ)言相結(jié)合的技術(shù),通俗的可以理解為Python語(yǔ)言和PHP語(yǔ)言混編技術(shù)。Python和PHP語(yǔ)言各有其內(nèi)部定義的數(shù)據(jù)類型,當(dāng)PHP端數(shù)據(jù)發(fā)送到Python端或者Python端數(shù)據(jù)發(fā)送到PHP端時(shí)在傳統(tǒng)技術(shù)上需要轉(zhuǎn)碼處理,而PPython技術(shù)通過(guò)將Python和PHP不同數(shù)據(jù)類型序列化就可以直接發(fā)送數(shù)據(jù),不用進(jìn)行轉(zhuǎn)碼處理,大大提高開(kāi)發(fā)速度。Python語(yǔ)言因其GIL(Global Interpreter Lock)特性,多線程效率不高,在基于由Python程序和PHP程序的混編機(jī)制實(shí)現(xiàn)的PPython中,Python端可進(jìn)行多進(jìn)程方式部署,從而提高Python程序的整體工作效率,此技術(shù)提高了Python的多線程效率。PPython技術(shù)實(shí)現(xiàn)基本原理為socket通信,因此需要網(wǎng)絡(luò)模塊socket支持。socket(套接字)是網(wǎng)絡(luò)編程中的一個(gè)基本組件,套接字基本上是一個(gè)信息通道,兩端各有一個(gè)程序[8]。這些程序可能都位于(通過(guò)網(wǎng)絡(luò)相連的)不同的計(jì)算機(jī)上,通過(guò)套接字向?qū)Ψ桨l(fā)送信息。PPython中網(wǎng)絡(luò)通信的主要原理如圖2所示。

      3 ?基于RNN的青?;▋耗P蜆?gòu)建

      3.1 ?Python爬蟲(chóng)構(gòu)建

      循環(huán)神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建對(duì)數(shù)據(jù)量有較高的要求,因此本實(shí)驗(yàn)所用的花兒唱詞信息采用Python網(wǎng)絡(luò)爬蟲(chóng)技術(shù)獲取。利用爬蟲(chóng)技術(shù)可以快速、準(zhǔn)確的從WEB應(yīng)用中獲取花兒唱詞信息,為后續(xù)實(shí)驗(yàn)的進(jìn)行提供數(shù)據(jù)支持。Python網(wǎng)絡(luò)爬蟲(chóng)的構(gòu)建是模擬計(jì)算機(jī)網(wǎng)絡(luò)連接,即計(jì)算機(jī)對(duì)服務(wù)器進(jìn)行一次Request請(qǐng)求(帶著請(qǐng)求頭和消息體),相應(yīng)地服務(wù)器對(duì)于計(jì)算機(jī)的Request請(qǐng)求進(jìn)行Response回應(yīng)(帶著HTML文件)。爬蟲(chóng)程序模擬計(jì)算機(jī)對(duì)服務(wù)器發(fā)起Request請(qǐng)求,并且接受服務(wù)器端的Response內(nèi)容并解析、提取所需的信息。

      筆者通過(guò)分析花兒信息源,發(fā)現(xiàn)現(xiàn)有的花兒信息主要分布在WEB應(yīng)用網(wǎng)易云音樂(lè)、QQ音樂(lè)上。對(duì)此根據(jù)不同平臺(tái)WEB頁(yè)面的結(jié)構(gòu),相應(yīng)的進(jìn)行爬蟲(chóng)程序的設(shè)計(jì)。通過(guò)分析,網(wǎng)易云音樂(lè)WEB頁(yè)面結(jié)構(gòu)為多頁(yè)面網(wǎng)頁(yè)結(jié)構(gòu),這種類型的網(wǎng)頁(yè)爬蟲(chóng)流程為。

      (1)手動(dòng)翻頁(yè)觀察個(gè)網(wǎng)頁(yè)的URL構(gòu)成特點(diǎn),構(gòu)造出所有頁(yè)面的URL存入列表中。

      (2)根據(jù)URL列表依次循環(huán)取出URL。

      (3)定義爬蟲(chóng)函數(shù)。

      (4)循環(huán)調(diào)用爬蟲(chóng)函數(shù),存儲(chǔ)數(shù)據(jù)。

      (5)循環(huán)完畢,結(jié)束爬蟲(chóng)程序。

      多頁(yè)面爬蟲(chóng)流程圖如圖3所示。

      而QQ音樂(lè)WEB頁(yè)面結(jié)構(gòu)為跨頁(yè)面網(wǎng)頁(yè)結(jié)構(gòu),跨頁(yè)面的爬蟲(chóng)流程為。

      (1)定義爬取函數(shù)爬取列表頁(yè)的所有專輯的URL。

      (2)將專輯URL存入列表中。

      (3)定義爬取詳細(xì)頁(yè)數(shù)據(jù)函數(shù)。

      (4)進(jìn)入專輯詳細(xì)頁(yè)面爬取詳細(xì)頁(yè)數(shù)據(jù)。

      (5)存儲(chǔ)數(shù)據(jù),循環(huán)結(jié)束,結(jié)束爬蟲(chóng)程序。

      跨頁(yè)面爬蟲(chóng)流程圖如圖4所示。

      本實(shí)驗(yàn)獲取到的所有花兒唱詞數(shù)據(jù)保存在文本文件中,以便后續(xù)處理。

      3.2 ?唱詞分詞

      中文與英文相比,英文以空格作為非常明顯的分隔符,而且一個(gè)英文單詞橫向可按字母拆分,但是中文由于繼承自古代漢語(yǔ)的傳統(tǒng),詞語(yǔ)之間沒(méi)有分隔符,并且按“永字八法”分為點(diǎn)、橫、豎、撇、捺、折、彎、鉤8種。古代漢語(yǔ)中除了人名、地名和連綿詞等,詞通常就是單個(gè)漢字,所以當(dāng)時(shí)沒(méi)有分詞書(shū)寫(xiě)的必要。而現(xiàn)代漢語(yǔ)中雙字或多字詞居多,一個(gè)字不再等同于一個(gè)詞[9]。因此給中文分詞帶來(lái)難度。為了得到更加有效的實(shí)驗(yàn)數(shù)據(jù)及更為嚴(yán)謹(jǐn)?shù)膶?shí)驗(yàn)結(jié)果分析,對(duì)于花兒唱詞采用目前主流的分詞工具jieba分詞。通過(guò)分詞工具jieba將爬取到的花兒唱詞進(jìn)行去噪處理,并且剔除唱詞中含有的“,”、“。”、“_”、“《”、“》”、“[”、“]”、“(”、“)”、等特殊字符。分詞結(jié)束后即可得到可以用于訓(xùn)練的預(yù)料庫(kù),此后進(jìn)行RNN模型的訓(xùn)練。

      3.3 ?系統(tǒng)建模

      語(yǔ)料庫(kù)規(guī)模越大,模型的訓(xùn)練結(jié)果就越好,而對(duì)于規(guī)模較小的語(yǔ)料則相反。模型訓(xùn)練需要Python NLP gensim包,首先需要安裝gensim,但是gensim對(duì)科學(xué)技術(shù)庫(kù)NumPy和SciPy的版本有要求,需要注意NumPy和SciPy版本,當(dāng)導(dǎo)入時(shí)算法程序不出錯(cuò)則成功。在genism中,與訓(xùn)練算法相關(guān)的參數(shù)都在gensim.models.word2vec.Word2Vec中。需要注意的參數(shù)有。

      (1)sentences:此參數(shù)設(shè)置當(dāng)前需要分析的語(yǔ)料庫(kù),可以是序列、字符文件。在本實(shí)驗(yàn)中,采用文件遍歷讀取。

      (2)size:此參數(shù)設(shè)置詞向量的維度,默認(rèn)值是100。這個(gè)維度的取值一般與當(dāng)前所使用的語(yǔ)料的規(guī)模相關(guān),如果語(yǔ)料庫(kù)很小,比如小于100M的文本語(yǔ)料,則使用默認(rèn)值。如果語(yǔ)料庫(kù)規(guī)模較大,則增大維度。

      (3)window:此參數(shù)為詞向量上下文最大距離,window越大,則和某一詞較遠(yuǎn)的詞也會(huì)產(chǎn)生上下文關(guān)系。默認(rèn)值為5。在實(shí)際使用中,可以根據(jù)實(shí)際的需求來(lái)動(dòng)態(tài)調(diào)整這個(gè)參數(shù)的大小。如果是小語(yǔ)料則這個(gè)值可以設(shè)的更小。

      (4)sg:此參數(shù)為word2vec兩個(gè)模型的選擇。如果是1,則是Skip-Gram模型,是0則是CBOW(Continuous Bag-of-Words)模型,默認(rèn)參數(shù)值為0。

      (5)hs:此參數(shù)為word2vec兩個(gè)解法的選擇,如果參數(shù)值是1,并且負(fù)采樣個(gè)數(shù)negative大于0,則是Hierarchical Softmax。參數(shù)值為0,則是Negative Sampling。默認(rèn)參數(shù)值為0。

      (6)negative:此參數(shù)為使用Negative Sampling時(shí)負(fù)采樣的個(gè)數(shù),默認(rèn)是5。推薦在[3,10]之間。

      (7)cbow_mean:此參數(shù)為用于CBOW在做投影的時(shí)候,為1則為上下文的詞向量的平均值。為0,則算法中的xw為上下文的詞向量之和。在本文中采用平均值來(lái)表示xw,默認(rèn)值也是1,不推薦修改默認(rèn)值。

      (8)min_count:此參數(shù)為需要計(jì)算詞向量的最小詞頻。添加此參數(shù),可去掉生僻的低頻詞,默認(rèn)是5。語(yǔ)料庫(kù)太小,則調(diào)低這個(gè)值。

      (9)iter:此參數(shù)為隨機(jī)梯度下降法中迭代的最大次數(shù),默認(rèn)是5。對(duì)于規(guī)模較小的語(yǔ)料庫(kù),可以調(diào)小這個(gè)參數(shù)值,相應(yīng)的規(guī)模較大的語(yǔ)料庫(kù),可以增大這個(gè)參數(shù)值。

      (10)alpha:此參數(shù)為在隨機(jī)梯度下降法中迭代的初始步長(zhǎng),默認(rèn)是0.025。

      (11)min_alpha:由于算法支持在迭代的過(guò)程中逐漸減小步長(zhǎng),min_alpha給出了最小的迭代步長(zhǎng)值。

      模型的訓(xùn)練調(diào)用word2vec.Word2Vec()算法即可,對(duì)于不同規(guī)模的語(yǔ)料庫(kù),需要對(duì)算法參數(shù)進(jìn)行調(diào)整,才能達(dá)到更好的訓(xùn)練結(jié)果。當(dāng)模型訓(xùn)練完成以后,需要保存模型以便重用。在word2vec中模型的保存有兩種方式可供選擇,一種是直接保存模型,另一種是以C語(yǔ)言可以解析的形式存儲(chǔ),對(duì)此根據(jù)需求保存。

      此外,模型訓(xùn)練的速度受到訓(xùn)練程序運(yùn)行環(huán)境和語(yǔ)料庫(kù)規(guī)模的影響。當(dāng)語(yǔ)料庫(kù)特別龐大時(shí),性能更為優(yōu)良的計(jì)算機(jī)能更快的進(jìn)行模型的訓(xùn)練。

      4 ?RNN花兒唱詞挖掘

      4.1 ?挖掘結(jié)果

      本實(shí)驗(yàn)?zāi)P偷挠?xùn)練屬于無(wú)監(jiān)督學(xué)習(xí),并沒(méi)有太多的類似于監(jiān)督學(xué)習(xí)里面客觀的評(píng)判方式,更多的依賴于端應(yīng)用。利用RNN對(duì)青?;▋盒畔⑻幚?,實(shí)現(xiàn)對(duì)花兒唱詞信息進(jìn)行聚類、找同義詞、詞性分析、預(yù)測(cè)。word2vec語(yǔ)言模型性能較高,但由于其對(duì)數(shù)據(jù)量有很高的要求。由于花兒信息搜集困難,預(yù)測(cè)的準(zhǔn)確度不夠高。實(shí)驗(yàn)部分結(jié)果如下:

      4.2 ?挖掘分析

      本實(shí)驗(yàn)采用循環(huán)神經(jīng)網(wǎng)絡(luò),這是為了綜合運(yùn)用歷史信息中的正向信息和反向信息所設(shè)計(jì)的優(yōu)秀的神經(jīng)網(wǎng)絡(luò),在數(shù)據(jù)采集上,由于青?;▋旱臍v史屬性及文化背景限制,筆者所搜集的花兒信息有限,加之神經(jīng)網(wǎng)絡(luò)對(duì)語(yǔ)料庫(kù)規(guī)模的要求較高,訓(xùn)練結(jié)果的正確性有待提高,需要將語(yǔ)音識(shí)別技術(shù)把現(xiàn)有的花兒視頻、音頻的語(yǔ)音信號(hào)轉(zhuǎn)化為相應(yīng)文本或命令來(lái)獲取大量花兒數(shù)據(jù)更為理想。

      4.3 ?詞云生成

      作為青海傳統(tǒng)文化——青?;▋?,提取花兒唱詞關(guān)鍵內(nèi)容形成詞云,詞云的生成對(duì)詞進(jìn)行排序后,由于詞語(yǔ)過(guò)多,僅截取了前300個(gè)高頻詞,詞云如圖5所示,觀察詞云圖可知:“花兒”(圖5的中心位置)這個(gè)詞的詞頻最高,其他詞根據(jù)詞頻依次從原點(diǎn)展開(kāi)分布在各點(diǎn)。

      5 ?結(jié)論

      本文通過(guò)循環(huán)神經(jīng)網(wǎng)絡(luò)序列建模,將深度學(xué)習(xí)自然語(yǔ)言處理應(yīng)用于青?;▋盒畔⑼诰虍?dāng)中。在實(shí)驗(yàn)中發(fā)現(xiàn)許多有趣的特性,分析挖掘青?;▋何谋拘畔⒌脑硗瑯拥目梢詰?yīng)用到很多方面,人工智能的發(fā)展會(huì)給我們帶來(lái)更多的機(jī)遇,我們也會(huì)面臨著更多的挑戰(zhàn)。合理有效的利用好計(jì)算機(jī)技術(shù)能為我們?nèi)祟惖姆椒矫婷鎺?lái)便利,例如語(yǔ)音識(shí)別、DNA序列分析、情感分類、機(jī)器翻譯、命名體識(shí)別等。實(shí)驗(yàn)中在青海花兒信息搜集過(guò)程中出現(xiàn)了些許困難,更大規(guī)模的語(yǔ)料庫(kù)及優(yōu)化RNN內(nèi)部網(wǎng)絡(luò)架構(gòu)能更加有效地分析花兒信息。如何通過(guò)語(yǔ)音識(shí)別、視頻行為識(shí)別技術(shù)的輔助來(lái)獲取數(shù)據(jù)規(guī)模更大的語(yǔ)料庫(kù),及優(yōu)化網(wǎng)絡(luò)內(nèi)部架構(gòu)是下一部研究的問(wèn)題。

      參考文獻(xiàn)

      [1] The Unreasonable Effectiveness of Recurrent Neural Networks. http://karpathy.github.io/2015/05/21/rnn-effectiveness/.

      [2] 邵偉明, 葛志強(qiáng), 李浩, 等. 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的半監(jiān)督動(dòng)態(tài)軟測(cè)量建模方法[J]. 電子測(cè)量與儀器學(xué)報(bào), 2019, 33(11): 7-13.

      [3] 余萍, 曹潔. 深度學(xué)習(xí)在故障診斷與預(yù)測(cè)中的應(yīng)用[J/OL]. 計(jì)算機(jī)工程與應(yīng)用: 1-25 [2020-02-17].

      [4] [美] Luke Welling, Laura Thomson. PHP and MySQL Web Development[M]. 慧珍, 武欣, 羅云峰, 等譯. 北京: 機(jī)械工業(yè)出版社, 2018: X—XIV.

      [5] 林信良. Python程序設(shè)計(jì)教程[M]. 北京: 清華大學(xué)出版社, 2017: 2—6.

      [6] 唐曉麗, 白宇, 張桂平, 等. 一種面向聚類的文本建模方法[J]. 山西大學(xué)學(xué)報(bào)(自然科學(xué)版), 2014, 37(04): 595-600.

      [7] 丁璐璐. 基于信息覓食理論的智庫(kù)情報(bào)分析質(zhì)量及其提升策略研究[D]. 吉林大學(xué), 2019.

      [8] 董彧先. 基于Python的網(wǎng)絡(luò)編程研究與分析[J]. 科學(xué)技術(shù)創(chuàng)新, 2019(20): 85-86.

      [9] 成銳. 基于Lucene面向主題的手機(jī)搜索引擎的研究與實(shí)現(xiàn)[D]. 電子科技大學(xué), 2012.

      富锦市| 轮台县| 孙吴县| 来安县| 武冈市| 云阳县| 辽源市| 金沙县| 蚌埠市| 平顶山市| 南丰县| 合水县| 安庆市| 涞水县| 师宗县| 都江堰市| 磐安县| 建水县| 五家渠市| 寻乌县| 枞阳县| 瑞安市| 安庆市| 铜陵市| 固阳县| 合江县| 克什克腾旗| 太仆寺旗| 东平县| 呼玛县| 米林县| 嵩明县| 筠连县| 姚安县| 和龙市| 沙河市| 城步| 山东省| 简阳市| 瓦房店市| 南雄市|