關(guān)鍵詞:投資項(xiàng)目;監(jiān)測(cè);LSTM網(wǎng)絡(luò);經(jīng)濟(jì)預(yù)測(cè)
0 引言
甘肅省實(shí)現(xiàn)了投資項(xiàng)目在線(xiàn)審批監(jiān)管,累計(jì)在線(xiàn)審批投資項(xiàng)目18.4萬(wàn)個(gè),辦理項(xiàng)目事項(xiàng)20.1萬(wàn)件,有力支撐了全省經(jīng)濟(jì)社會(huì)全面發(fā)展。但隨著“放管服”改革和優(yōu)化營(yíng)商環(huán)境工作進(jìn)入縱深,既有投資項(xiàng)目監(jiān)控預(yù)測(cè)能力日益無(wú)法適應(yīng)高質(zhì)量發(fā)展的要求,亟須構(gòu)建一套能夠準(zhǔn)確監(jiān)測(cè)投資現(xiàn)狀,有效預(yù)測(cè)未來(lái)走勢(shì)的智能監(jiān)測(cè)預(yù)測(cè)系統(tǒng)。
人工智能和大數(shù)據(jù)技術(shù)的發(fā)展為解決這一問(wèn)題提供了新的思路,深度學(xué)習(xí)作為人工智能領(lǐng)域的重要分支,在處理復(fù)雜非線(xiàn)性問(wèn)題和時(shí)間序列預(yù)測(cè)上展現(xiàn)出了顯著的優(yōu)勢(shì)。徐映梅等人[1]對(duì)傳統(tǒng)統(tǒng)計(jì)計(jì)量方法和深度學(xué)習(xí)方法的對(duì)比表明,針對(duì)結(jié)構(gòu)復(fù)雜的非線(xiàn)性多變量數(shù)據(jù),神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)效果更為理想。長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM) 是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò),因其獨(dú)特的門(mén)控機(jī)制,能夠在保持長(zhǎng)期依賴(lài)關(guān)系的同時(shí),有效避免梯度消失和梯度爆炸問(wèn)題,從而在處理時(shí)序數(shù)據(jù)時(shí)展現(xiàn)出卓越的性能。朱青等人[2]通過(guò)實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),LSTM模型能較準(zhǔn)確地反映GDP增長(zhǎng)的變化規(guī)律,在宏觀經(jīng)濟(jì)預(yù)測(cè)中具有較高的應(yīng)用價(jià)值。王國(guó)金[3]對(duì)LSTM模型的初始權(quán)重及閾值進(jìn)行了優(yōu)化,提升了LSTM網(wǎng)絡(luò)模型的經(jīng)濟(jì)預(yù)測(cè)效果。但運(yùn)用深度學(xué)習(xí)進(jìn)行投資項(xiàng)目預(yù)測(cè)的相關(guān)研究和實(shí)踐還比較欠缺。
本文旨在設(shè)計(jì)并實(shí)現(xiàn)融合LSTM神經(jīng)網(wǎng)絡(luò)的投資項(xiàng)目監(jiān)測(cè)預(yù)測(cè)系統(tǒng),充分利用LSTM在網(wǎng)絡(luò)建模與預(yù)測(cè)方面的特性,通過(guò)對(duì)投資項(xiàng)目的歷史數(shù)據(jù)進(jìn)行深度挖掘和學(xué)習(xí),實(shí)現(xiàn)對(duì)投資項(xiàng)目數(shù)量的精確預(yù)測(cè),為投資主管部門(mén)投資形勢(shì)研判、經(jīng)濟(jì)調(diào)控和政策制定提供支撐,實(shí)現(xiàn)用數(shù)據(jù)說(shuō)話(huà)、用數(shù)據(jù)管理、用數(shù)據(jù)決策。
1 相關(guān)理論與技術(shù)
1.1 Django 框架
Django是Python的主流Web框架之一,它通過(guò)減少重復(fù)的代碼,使開(kāi)發(fā)人員能夠?qū)W⒂陂_(kāi)發(fā)中的關(guān)鍵事務(wù),專(zhuān)注于編寫(xiě)應(yīng)用程序[4]。Django提供了大量的開(kāi)箱即用工具,使開(kāi)發(fā)過(guò)程更加簡(jiǎn)單和高效,用來(lái)快速構(gòu)建復(fù)雜和高性能的Web應(yīng)用程序。Django采用MTV(Model-Template-View) 的架構(gòu)設(shè)計(jì),是MVC 模式的一種變體,強(qiáng)調(diào)模板在Web應(yīng)用程序中的重要性模型負(fù)責(zé)數(shù)據(jù)處理和數(shù)據(jù)庫(kù)交互,通過(guò)定義一系列的數(shù)據(jù)模型類(lèi)來(lái)與數(shù)據(jù)庫(kù)進(jìn)行映射。視圖負(fù)責(zé)業(yè)務(wù)邏輯處理,視圖函數(shù)或類(lèi)接收HTTP請(qǐng)求,處理數(shù)據(jù)并決定返回給用戶(hù)的響應(yīng)內(nèi)容。模板提供友好的方式來(lái)定義HTML和其他格式輸出,通過(guò)變量和模板標(biāo)簽動(dòng)態(tài)渲染視圖提供的數(shù)據(jù)。在典型的Django應(yīng)用中,用戶(hù)請(qǐng)求被Django的URL映射機(jī)制傳遞給相應(yīng)的視圖,視圖處理數(shù)據(jù)操作等業(yè)務(wù)邏輯將數(shù)據(jù)傳遞給模板,模板生成HTML頁(yè)面并響應(yīng)返回給請(qǐng)求者。
Django的高效安全和可擴(kuò)展kapRFsGsmDBHo+/kT8YkBQ==性源于其獨(dú)特的內(nèi)部機(jī)制,對(duì)象關(guān)系映射(ORM) 使開(kāi)發(fā)者不必直接編寫(xiě)SQL語(yǔ)句而以Python對(duì)象的方式操作數(shù)據(jù),URL分發(fā)機(jī)制通過(guò)URLconf文件簡(jiǎn)潔地映射URL到相應(yīng)的視圖函數(shù),插件式中間件(Middleware) 允許在請(qǐng)求響應(yīng)周期的不同階段插入自定義功能,表單驗(yàn)證和生成機(jī)制簡(jiǎn)化了網(wǎng)頁(yè)表單的處理過(guò)程,多級(jí)別緩存機(jī)制大幅提高應(yīng)用性能,Django同時(shí)提供跨站腳本攻擊(XSS) 和跨站請(qǐng)求偽造(CSRF) 等安全防護(hù)機(jī)制。
1.2 LSTM 神經(jīng)網(wǎng)絡(luò)
長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM) 是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN) 結(jié)構(gòu),它能夠有效克服RNN中存在的梯度消失問(wèn)題,尤其在長(zhǎng)距離依賴(lài)的任務(wù)中的表現(xiàn)遠(yuǎn)優(yōu)于RNN,梯度反向傳播過(guò)程中不會(huì)再受到梯度消失問(wèn)題的困擾,可以對(duì)存在短期或者長(zhǎng)期依賴(lài)的數(shù)據(jù)進(jìn)行精確的建模[5]。
LSTM核心在于其內(nèi)部的細(xì)胞狀態(tài)和門(mén)控機(jī)制,這些機(jī)制賦予LSTM對(duì)長(zhǎng)期依賴(lài)關(guān)系的強(qiáng)大建模能力。細(xì)胞狀態(tài)使LSTM能對(duì)序列連續(xù)地存儲(chǔ)和傳遞信息,從而使長(zhǎng)期依賴(lài)關(guān)系得以有效地保留和累積。門(mén)控機(jī)制通過(guò)輸入門(mén)、遺忘門(mén)和輸出門(mén)靈活地控制信息的讀取、更新和輸出,確保模型能夠在捕獲短期動(dòng)態(tài)變化的同時(shí),充分理解和利用長(zhǎng)期的歷史信息。細(xì)胞狀態(tài)(C) 是一個(gè)持續(xù)傳遞的信息通道,負(fù)責(zé)在時(shí)間步之間保持和傳遞信息,細(xì)胞狀態(tài)能夠保留長(zhǎng)期依賴(lài),不受輸入門(mén)、遺忘門(mén)和輸出門(mén)的直接影響。門(mén)控機(jī)制的遺忘門(mén)、輸入門(mén)和輸出門(mén)基于前一時(shí)刻的隱藏狀態(tài)和當(dāng)前時(shí)間步的輸入。遺忘門(mén)決定細(xì)胞狀態(tài)中哪些信息應(yīng)當(dāng)被丟棄,1表示完全保留信息,0表示完全遺忘信息。輸入門(mén)的計(jì)算結(jié)果表示哪些新信息應(yīng)被加入細(xì)胞狀態(tài)中。輸出門(mén)決定如何從當(dāng)前細(xì)胞狀態(tài)中提取有用信息用于生成當(dāng)前時(shí)間步的隱藏狀態(tài),該隱藏狀態(tài)將用于后續(xù)的計(jì)算或作為模型的輸出。遺忘門(mén)與輸入門(mén)結(jié)合形成了更新后的細(xì)胞狀態(tài)。輸出門(mén)與細(xì)胞狀態(tài)相乘(經(jīng)過(guò)tanh激活函數(shù)),將結(jié)果作為當(dāng)前時(shí)間步的隱藏狀態(tài),隱藏狀態(tài)不僅影響下一個(gè)時(shí)間步的LSTM單元,也是模型對(duì)外部世界的輸出。LSTM 通過(guò)門(mén)控機(jī)制實(shí)現(xiàn)了對(duì)信息的精確控制,允許模型在處理序列數(shù)據(jù)時(shí)選擇性地保留、更新和讀取信息,適于需要考慮序列數(shù)據(jù)中長(zhǎng)距離依賴(lài)關(guān)系的任務(wù)。
2 系統(tǒng)設(shè)計(jì)
2.1 系統(tǒng)架構(gòu)設(shè)計(jì)
系統(tǒng)基于Django框架,采用三層架構(gòu)設(shè)計(jì),從上而下依次為應(yīng)用層、業(yè)務(wù)層和數(shù)據(jù)層。應(yīng)用層負(fù)責(zé)與用戶(hù)直接交互,承擔(dān)著界面展示、功能調(diào)用以及請(qǐng)求處理等關(guān)鍵任務(wù),確保系統(tǒng)的可用性和易用性。業(yè)務(wù)層是整個(gè)系統(tǒng)邏輯處理的中樞,涵蓋了業(yè)務(wù)規(guī)則定義、業(yè)務(wù)流程控制以及服務(wù)接口封裝等多項(xiàng)重要職能。在業(yè)務(wù)層系統(tǒng)將復(fù)雜的業(yè)務(wù)邏輯進(jìn)行了模塊化、組件化的精細(xì)劃分與實(shí)現(xiàn),從而有效保證了業(yè)務(wù)處理的穩(wěn)定性和可維護(hù)性。處于底層的數(shù)據(jù)層包括數(shù)據(jù)訪(fǎng)問(wèn)與操作、數(shù)據(jù)持久化等一系列與數(shù)據(jù)相關(guān)的處理工作,通過(guò)與上層業(yè)務(wù)邏輯緊密配合,數(shù)據(jù)層不僅提供了可靠的數(shù)據(jù)支撐,同時(shí)也確保了數(shù)據(jù)的安全性和一致性。
2.2 功能模塊設(shè)計(jì)
1) 總量數(shù)據(jù)監(jiān)測(cè)。對(duì)項(xiàng)目審批和事項(xiàng)辦理數(shù)據(jù)進(jìn)行分類(lèi)、統(tǒng)計(jì)、排序,對(duì)疑似異常項(xiàng)目回溯到基本數(shù)據(jù)后進(jìn)行人工處理,監(jiān)測(cè)范圍主要是一般投資項(xiàng)目、專(zhuān)項(xiàng)庫(kù)和審批事項(xiàng)。投資項(xiàng)目監(jiān)測(cè)交叉分析項(xiàng)目審核備類(lèi)型、審批地區(qū)和機(jī)構(gòu)、賦碼日期、審核備日期、國(guó)標(biāo)行業(yè)分類(lèi)、發(fā)改部門(mén)行業(yè)分類(lèi)、項(xiàng)目目錄、開(kāi)竣工日期等屬性,黃河戰(zhàn)略、生態(tài)產(chǎn)業(yè)、外貸、民間資本推介等專(zhuān)項(xiàng)庫(kù)標(biāo)識(shí),值域?yàn)轫?xiàng)目數(shù)量和投資額。分析結(jié)果以表格、熱圖等形式展示,便于快速計(jì)算和提取信息。審批事項(xiàng)監(jiān)測(cè)交叉分析項(xiàng)目審批級(jí)別、審批機(jī)關(guān)、地區(qū)、事項(xiàng)名稱(chēng)、事項(xiàng)狀態(tài),申報(bào)、接件、受理和辦結(jié)日期等屬性,值域?yàn)槭马?xiàng)辦件量,分析結(jié)果以表格、熱圖等形式展示。
2) 專(zhuān)項(xiàng)庫(kù)監(jiān)測(cè)。主要是儲(chǔ)備項(xiàng)目、黃河戰(zhàn)略項(xiàng)目、重點(diǎn)投資項(xiàng)目和重大前期項(xiàng)目等專(zhuān)項(xiàng)項(xiàng)目的監(jiān)測(cè)。儲(chǔ)備項(xiàng)目監(jiān)測(cè)分析儲(chǔ)備項(xiàng)目類(lèi)型、屬性、屬地、行業(yè)、投資、前期工作情況、建設(shè)性質(zhì)、輔助標(biāo)識(shí)等屬性。黃河戰(zhàn)略項(xiàng)目監(jiān)測(cè)分析黃河戰(zhàn)略項(xiàng)目類(lèi)型、屬地、行業(yè)、投資、開(kāi)復(fù)工情況、責(zé)任人、包抓領(lǐng)導(dǎo)、輔助標(biāo)識(shí)等屬性。重點(diǎn)投資項(xiàng)目監(jiān)測(cè)分析重點(diǎn)投資項(xiàng)目擬開(kāi)竣工日期、類(lèi)型、屬性、屬地、行業(yè)、投資、前期工作情況、開(kāi)復(fù)工情況、責(zé)任人、包抓領(lǐng)導(dǎo)、輔助標(biāo)識(shí)等屬性。重大前期項(xiàng)目監(jiān)測(cè)分析重大前期項(xiàng)目前期工作情況、類(lèi)型、屬性、行業(yè)、投資責(zé)任人、包抓領(lǐng)導(dǎo)、輔助標(biāo)識(shí)等屬性。
3) 投資項(xiàng)目預(yù)測(cè)。為了實(shí)現(xiàn)投資項(xiàng)目未來(lái)趨勢(shì)的精準(zhǔn)預(yù)測(cè)與高效自動(dòng)化處理,構(gòu)建基于LSTM網(wǎng)絡(luò)的投資項(xiàng)目預(yù)測(cè)模型。該模型以2015年10月份以來(lái)的投資項(xiàng)目審批數(shù)據(jù)為基礎(chǔ),充分考慮訓(xùn)練集與測(cè)試集的時(shí)間序列特性以及樣本長(zhǎng)度的影響,將其作為關(guān)鍵參數(shù)加入模型構(gòu)建過(guò)程中。在模型的具體實(shí)現(xiàn)上,優(yōu)化了損失函數(shù)的選擇與設(shè)定,旨在確保模型在學(xué)習(xí)歷史數(shù)據(jù)規(guī)律的同時(shí),能夠準(zhǔn)確捕捉到投資項(xiàng)目各維度指標(biāo)間的復(fù)雜動(dòng)態(tài)關(guān)系,并有效防止過(guò)擬合或欠擬合現(xiàn)象的發(fā)生,使得模型具備較強(qiáng)的泛化能力,對(duì)未來(lái)投資項(xiàng)目趨勢(shì)進(jìn)行科學(xué)合理的預(yù)測(cè)。將模型處理過(guò)程函數(shù)化,開(kāi)發(fā)用戶(hù)接口界面,實(shí)現(xiàn)投資項(xiàng)目預(yù)測(cè)自動(dòng)化。
2.3 LSTM 預(yù)測(cè)模型構(gòu)建
1) 數(shù)據(jù)預(yù)處理。本系統(tǒng)數(shù)據(jù)來(lái)源于甘肅省投資項(xiàng)目在線(xiàn)審批監(jiān)管平臺(tái)分析數(shù)據(jù)庫(kù),在項(xiàng)目審批過(guò)程中實(shí)現(xiàn)數(shù)據(jù)實(shí)時(shí)更新。截至2024年3月,在庫(kù)項(xiàng)目18.4萬(wàn)個(gè),基于項(xiàng)目數(shù)量平穩(wěn)和月度預(yù)測(cè)業(yè)務(wù)需求等考慮,本系統(tǒng)將日數(shù)據(jù)轉(zhuǎn)換為月數(shù)據(jù),從2015年10月至2024年3月共102個(gè)月。按90%比例劃分訓(xùn)練集和測(cè)試集,訓(xùn)練集91個(gè)月,測(cè)試集11個(gè)月。數(shù)據(jù)特征與預(yù)測(cè)目標(biāo)均為投資項(xiàng)目數(shù)量。
2) 模型實(shí)現(xiàn)。本文基于Keras的深度學(xué)習(xí)框架搭建LSTM模型。Keras是模型層面的深度學(xué)習(xí)接口庫(kù),主要負(fù)責(zé)模型的構(gòu)建、訓(xùn)練及預(yù)測(cè)等核心功能。Keras具有卓越的封裝特性,能夠便捷高效地搭建各類(lèi)實(shí)驗(yàn)所需的網(wǎng)絡(luò)模型,極大地提升實(shí)驗(yàn)效率。對(duì)于深度學(xué)習(xí)底層涉及的復(fù)雜張量運(yùn)算,Keras 依賴(lài)于Theano或Tensorflow這樣的后端引擎提供計(jì)算支持,自身并不直接處理。
3) 模型評(píng)價(jià)方法。采用時(shí)間序列常用的均方根誤差(RMSE) 和平均絕對(duì)百分比誤差(MAPE) 評(píng)估模型效果。RMSE通過(guò)計(jì)算預(yù)測(cè)值與實(shí)際值之間差異的平方,取平均后再開(kāi)平方根得到評(píng)估模型的表現(xiàn)。其公式如下:
MAPE有效消除了數(shù)據(jù)規(guī)模的影響,使得不同規(guī)模或波動(dòng)特性的數(shù)據(jù)集之間可以進(jìn)行準(zhǔn)確的預(yù)測(cè)性能評(píng)估,適合評(píng)估和比較具有顯著差異性尺度或者波動(dòng)幅度的數(shù)據(jù)集預(yù)測(cè)精確度。
3 實(shí)證分析與結(jié)果討論
3.1 投資項(xiàng)目監(jiān)測(cè)
通過(guò)系統(tǒng)監(jiān)測(cè)近5年甘肅省投資項(xiàng)目數(shù)據(jù)可以看出,2019年至2023年甘肅省投資項(xiàng)目總體上呈增長(zhǎng)趨勢(shì),如圖1所示。分季度看,從一季度到二季度是投資項(xiàng)目的快速增長(zhǎng)期;三、四季度是項(xiàng)目的實(shí)施期,新報(bào)項(xiàng)目較前兩季度有所下降。但2023年一至四季度投資項(xiàng)目數(shù)量持續(xù)增長(zhǎng),展現(xiàn)出了較強(qiáng)的投資動(dòng)力。
項(xiàng)目審批事項(xiàng)情況與投資項(xiàng)目數(shù)量分季度趨勢(shì)基本一致。但2020年和2021年項(xiàng)目審批事項(xiàng)較2019 年有明顯下降,主要原因是這一階段項(xiàng)目立項(xiàng)階段事項(xiàng)辦理后實(shí)施階段審批數(shù)量較少,也就是說(shuō)有大量項(xiàng)目未落地實(shí)施。2022年至2023年情況有明顯好轉(zhuǎn),項(xiàng)目審批事項(xiàng)數(shù)量顯著增加。
從監(jiān)測(cè)結(jié)果來(lái)看,2023年1—12月,甘肅省投資項(xiàng)目數(shù)量和投資額均保持高位運(yùn)行,1季度項(xiàng)目數(shù)量和投資額均呈現(xiàn)明顯的增長(zhǎng)趨勢(shì);2、3季度保持平緩;3季度又有一輪顯著的增長(zhǎng)。
3.2 投資項(xiàng)目預(yù)測(cè)
采用本文模型對(duì)甘肅省2023年11月—2024年3 月投資項(xiàng)目數(shù)量進(jìn)行預(yù)測(cè),實(shí)際值與預(yù)測(cè)值見(jiàn)表1。
該模型預(yù)測(cè)投資項(xiàng)目數(shù)量的均方根誤差(RMSE) 為937.012 4,平均絕對(duì)百分比誤差(MAPE) 為0.254 6。
4 結(jié)束語(yǔ)
本文設(shè)計(jì)實(shí)現(xiàn)了融合LSTM神經(jīng)網(wǎng)絡(luò)的投資項(xiàng)目監(jiān)測(cè)預(yù)測(cè)系統(tǒng)。本文立足現(xiàn)有投資項(xiàng)目信息化成果,通過(guò)業(yè)務(wù)流程梳理、系統(tǒng)整合、匯聚、集成,實(shí)現(xiàn)信息資源統(tǒng)一匯聚、分析應(yīng)用和深度服務(wù)。采用大數(shù)據(jù)分析方法,實(shí)現(xiàn)投資項(xiàng)目數(shù)量和投資額的實(shí)時(shí)監(jiān)測(cè),針對(duì)不同年度、行業(yè)領(lǐng)域以及地域的投資分布情況,進(jìn)行深度數(shù)據(jù)挖掘與精細(xì)化對(duì)比分析,為投資策略?xún)?yōu)化和資源配置提供了強(qiáng)有力的數(shù)據(jù)支持。構(gòu)建LSTM網(wǎng)絡(luò)投資項(xiàng)目數(shù)量預(yù)測(cè)模型,通過(guò)對(duì)2023 年11 月—2024年3月投資項(xiàng)目數(shù)量預(yù)測(cè),達(dá)到了較好的效果,為投資發(fā)展趨勢(shì)預(yù)測(cè)和促投資穩(wěn)增長(zhǎng)提供了有效的數(shù)據(jù)和方法支撐。系統(tǒng)有效實(shí)現(xiàn)了甘肅省投資項(xiàng)目的實(shí)時(shí)監(jiān)測(cè)和智能預(yù)測(cè),在政府投資決策和調(diào)控領(lǐng)域有重要的應(yīng)用價(jià)值。同時(shí),系統(tǒng)預(yù)測(cè)的準(zhǔn)確率等方面還需要進(jìn)一步研究提升。