超大城市作為全球化進(jìn)程中的核心節(jié)點(diǎn),具有資源、人口和基礎(chǔ)設(shè)施高度集中的特點(diǎn),是社會(huì)經(jīng)濟(jì)發(fā)展的重要引擎。數(shù)據(jù)科學(xué)和人工智能技術(shù)的快速發(fā)展為超大城市運(yùn)行管理的量化研究提供了新的可能性,目前的數(shù)據(jù)驅(qū)動(dòng)方法多聚焦于具體應(yīng)用場(chǎng)景,尚未形成覆蓋超大城市運(yùn)行管理現(xiàn)代化水平的綜合監(jiān)測(cè)模型。結(jié)合機(jī)器學(xué)習(xí)中的非監(jiān)督學(xué)習(xí)聚類算法、統(tǒng)計(jì)分析方法以及大數(shù)據(jù)挖掘技術(shù),本研究構(gòu)建了超大城市運(yùn)行管理現(xiàn)代化水平監(jiān)測(cè)的算法模型,旨在反映超大城市在管理體系和運(yùn)行效率方面的現(xiàn)狀與挑戰(zhàn)。基于研究結(jié)果,選擇了國(guó)內(nèi)典型超大城市北京、上海、廣州、深圳進(jìn)行實(shí)例應(yīng)用與驗(yàn)證。結(jié)果表明,所設(shè)計(jì)的算法模型能夠有效揭示城市運(yùn)行管理中的潛在問題與發(fā)展瓶頸。研究成果旨在為超大城市運(yùn)行管理水平的評(píng)估和提升提供科學(xué)的算法模型支持,為相關(guān)政策制定與管理實(shí)踐提供理論依據(jù)和應(yīng)用參考。
一、超大城市運(yùn)行管理現(xiàn)代化水平監(jiān)測(cè)指標(biāo)體系
在技術(shù)路線上,本研究首先構(gòu)建超大城市運(yùn)行管理現(xiàn)代化水平的監(jiān)測(cè)指標(biāo)體系,確定各指標(biāo)權(quán)重;其次運(yùn)用DBSCAN(Density-Based Spatial Clustering of Applications with Noise,基于密度的噪聲應(yīng)用空間聚類)聚類算法識(shí)別數(shù)據(jù)空間中的高密度區(qū)域和異常數(shù)據(jù)點(diǎn),以提高監(jiān)測(cè)結(jié)果的可靠性;進(jìn)而結(jié)合三西格瑪(3g)原則與等比縮放算法,測(cè)算指標(biāo)數(shù)據(jù)閾值區(qū)間及目標(biāo)值,并構(gòu)建現(xiàn)代化水平識(shí)別模型;最后通過等寬離散化方法劃分管理水平等級(jí),驗(yàn)證模型的科學(xué)性與可行性。
(一)體征指標(biāo)
參考學(xué)者陸軍和楊浩天的研究方法,以管理組織結(jié)構(gòu)現(xiàn)代化、綜合統(tǒng)籌體系現(xiàn)代化、專項(xiàng)業(yè)務(wù)能力現(xiàn)代化和社會(huì)參與機(jī)制現(xiàn)代化四個(gè)核心維度,選取15項(xiàng)超大城市運(yùn)行管理現(xiàn)代化監(jiān)測(cè)指標(biāo)數(shù)據(jù),反映超大城市運(yùn)行管理現(xiàn)代化水平[1(如表1所示)。
(二)特征權(quán)重
采用變異系數(shù)法[2確定權(quán)重。該方法依據(jù)數(shù)據(jù)的變異程度賦予不同權(quán)重,變異程度越大,指標(biāo)在綜合評(píng)價(jià)中的重要性越高。由于模型數(shù)據(jù)涵蓋不同領(lǐng)域和監(jiān)測(cè)對(duì)象,變異系數(shù)能夠有效衡量數(shù)據(jù)的離散程度,從而增強(qiáng)可比性。其計(jì)算過程如下:
1.數(shù)據(jù)歸一化處理:
2.計(jì)算均值與標(biāo)準(zhǔn)差:
(1)均值的計(jì)算公式為:
(2)標(biāo)準(zhǔn)差的計(jì)算公式為:
3.計(jì)算變異系數(shù):
4.計(jì)算模型權(quán)重:
注: 表示第i個(gè)數(shù)據(jù)的權(quán)重,n為數(shù)據(jù)維度。
二、超大城市運(yùn)行管理現(xiàn)代化水平監(jiān)測(cè)模型建構(gòu)
本文采取多目標(biāo)決策分析法[3],綜合考量超大城市運(yùn)行管理現(xiàn)代化的各個(gè)關(guān)鍵因素從而探尋超大城市運(yùn)行管理現(xiàn)代化水平狀態(tài)。超大城市運(yùn)行管理現(xiàn)代化水平指標(biāo)數(shù)據(jù)為無(wú)量綱的百分比數(shù)據(jù)。其中的數(shù)據(jù)主要來(lái)源于中國(guó)城市統(tǒng)計(jì)年鑒委員會(huì)2022年發(fā)布的《中國(guó)城市統(tǒng)計(jì)年鑒》,如地方財(cái)政城鄉(xiāng)社區(qū)支出,城市管理支出等;權(quán)威媒體的新聞報(bào)道,如北京市的全市供電可靠率、天然氣管網(wǎng)覆蓋率等;各地政府統(tǒng)計(jì)網(wǎng)站,如全市機(jī)械化作業(yè)率,城市政務(wù)通自動(dòng)覆蓋率等。
首先,采用非監(jiān)督學(xué)習(xí)聚類算法對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,通過消除數(shù)據(jù)噪聲、剔除異常值并處理缺失數(shù)據(jù)提升數(shù)據(jù)質(zhì)量和分析的準(zhǔn)確性。在此過程中,聚類算法能夠自動(dòng)識(shí)別數(shù)據(jù)中的自然分組,無(wú)須預(yù)先設(shè)定類別,使數(shù)據(jù)結(jié)構(gòu)更加清晰。此外,聚類算法在異常值檢測(cè)方面具有顯著優(yōu)勢(shì),可為城市運(yùn)行管理現(xiàn)代化水平的監(jiān)測(cè)預(yù)警提供有力支持。與此同時(shí),該方法能夠?qū)崿F(xiàn)高效、高精度的數(shù)據(jù)清洗,使后續(xù)分析基于更加精準(zhǔn)和可靠的數(shù)據(jù)展開。4]其次,基于清洗后的有效數(shù)據(jù)使用統(tǒng)計(jì)學(xué)習(xí)算法建立各個(gè)指標(biāo)的閾值區(qū)間。最后,根據(jù)實(shí)際數(shù)據(jù)與閾值的偏差百分比分析各個(gè)指標(biāo)表現(xiàn)得分。該方法具備較強(qiáng)的適應(yīng)性和可擴(kuò)展性,可結(jié)合不同城市或不同時(shí)期的數(shù)據(jù)進(jìn)行調(diào)整,使評(píng)估結(jié)果更加科學(xué)、客觀,為城市風(fēng)險(xiǎn)管理提供有力的數(shù)據(jù)支撐。[5]
(一)閾值區(qū)間
本文選取北京、上海、廣州、深圳4座典型超大城市2022年的城市運(yùn)行管理現(xiàn)代化數(shù)據(jù),采用基于機(jī)器學(xué)習(xí)的聚類算法建立指標(biāo)數(shù)據(jù)的目標(biāo)值。
首先用DBSCAN算法檢測(cè)噪聲數(shù)據(jù)和離群值并進(jìn)行剔除。DBSCAN是一種基于密度的聚類算法,廣泛應(yīng)用于噪聲數(shù)據(jù)和離群值檢測(cè)。該算法通過設(shè)定鄰域半徑 ( ε ) 和最小樣本數(shù) ( M i n P t s ) ,在數(shù)據(jù)空間中識(shí)別高密度區(qū)域,并將低密度區(qū)域的數(shù)據(jù)點(diǎn)視為噪聲或離群值。與傳統(tǒng)的K-Means等方法不同,DBSCAN無(wú)須預(yù)設(shè)簇的數(shù)量,能夠自動(dòng)識(shí)別數(shù)據(jù)中的自然結(jié)構(gòu),尤其DBSCAN能夠識(shí)別任意形狀的簇,而不僅限于球狀或均勻分布的數(shù)據(jù),提高了聚類的適用性。6]
表示在以點(diǎn) p 為中心, e p s 為半徑的鄰域內(nèi)的數(shù)據(jù)點(diǎn)數(shù)量,如果這個(gè)數(shù)量不小于最小點(diǎn)數(shù) M i n P t s ,則點(diǎn) p 就是一個(gè)核心點(diǎn)。
然后使用三西格瑪 3 σ 原則確定閥值區(qū)間。三西格瑪 3 σ 原則假設(shè)數(shù)據(jù)服從正態(tài)分布,并以均值 ( μ ) 和標(biāo)準(zhǔn)差 ( σ ) 為基礎(chǔ)設(shè)定閾值區(qū)間,即 μ ± 3 σ 。在正態(tài)分布下,超出此范圍的值通常被視為異常,從而進(jìn)行風(fēng)險(xiǎn)檢測(cè)和異常識(shí)別。
與
分別為閾值區(qū)間的下限和上限,如果數(shù)據(jù)點(diǎn)落在這個(gè)范圍之外則判定為離群值進(jìn)行剔除。
最后,對(duì)剩余的數(shù)據(jù)計(jì)算均值作為目標(biāo)值。
表示均值
表示第 i 個(gè)數(shù)據(jù)點(diǎn)的值, n 表示數(shù)據(jù)點(diǎn)的數(shù)量,經(jīng)過上述步驟,原始數(shù)據(jù)得到清洗,形成干凈數(shù)據(jù)集后確定了對(duì)應(yīng)的目標(biāo)值
。
(二)模型建構(gòu)
基于等比縮放算法構(gòu)建城市運(yùn)行管理現(xiàn)代化水平識(shí)別模型,以目標(biāo)值作為決策分?jǐn)?shù)的判定依據(jù)。目標(biāo)值作為數(shù)據(jù)的理想狀態(tài),是分析和決策的重要參考。當(dāng)監(jiān)測(cè)值不低于目標(biāo)值時(shí),表示該指標(biāo)表現(xiàn)良好;低于目標(biāo)值則反映出監(jiān)測(cè)數(shù)據(jù)較差。評(píng)分計(jì)算方式為監(jiān)測(cè)值與目標(biāo)值的比值乘以理論最大分?jǐn)?shù)。對(duì)于目標(biāo)值為100 % 的情況,由于觀測(cè)值不會(huì)超出目標(biāo)值,其決策分?jǐn)?shù)同樣按照該比值與最大分?jǐn)?shù)計(jì)算。
其中, 代表第i個(gè)指標(biāo)的客觀得分,T代表目標(biāo)值, M 代表實(shí)際監(jiān)測(cè)值。基于以上方法建立城市運(yùn)行管理水平監(jiān)測(cè)模型(如表2所示)。
(三)超大城市運(yùn)行管理現(xiàn)代化水平評(píng)分與等級(jí)劃分
計(jì)算超大城市運(yùn)行管理現(xiàn)代化水平得分公式為:
基于超大城市運(yùn)行管理現(xiàn)代化水平模型權(quán)重和決策算法,使用等寬離散化方法將超大城市運(yùn)行管理現(xiàn)代化水平劃分為五個(gè)等級(jí),詳細(xì)分級(jí)情況如表3所示。
三、超大城市運(yùn)行管理現(xiàn)代化水平監(jiān)測(cè)模型檢驗(yàn)
為了驗(yàn)證算法模型的有效性和可行性,以北京、上海、廣州、深圳作為實(shí)例分析對(duì)象。通過收集相關(guān)指標(biāo)數(shù)據(jù),結(jié)合等比縮放算法對(duì)城市運(yùn)行管理進(jìn)行建模分析,并進(jìn)一步評(píng)估算法在實(shí)際應(yīng)用中的表現(xiàn)。其中北京市運(yùn)行管理現(xiàn)代化水平結(jié)果如表4所示,其他城市因篇幅原因不在正文中展示;四座超大城市運(yùn)行管理現(xiàn)代化水平總評(píng)結(jié)果及其一級(jí)指標(biāo)項(xiàng)得分結(jié)果如表5所示。
根據(jù)算法模型計(jì)算得到的結(jié)果,北京的運(yùn)行管理現(xiàn)代化值為0.87,屬于高現(xiàn)代化水平;上海的運(yùn)行管理現(xiàn)代化得分為0.67,屬于較高現(xiàn)代化水平;廣州的得分為0.49,處于一般現(xiàn)代化水平;深圳的得分為0.43,也屬于一般現(xiàn)代化水平。四座超大城市均未表現(xiàn)出較低或低現(xiàn)代化水平。這一結(jié)果與當(dāng)前四座超大城市的運(yùn)行管理現(xiàn)代化水平狀態(tài)高度一致,表明該算法模型能夠真實(shí)反映城市運(yùn)行管理現(xiàn)代化水平,進(jìn)一步證明了模型的科學(xué)性和有效性。
超大城市運(yùn)行管理現(xiàn)代化水平模型顯示,北京在專項(xiàng)業(yè)務(wù)能力領(lǐng)域表現(xiàn)優(yōu)異,該領(lǐng)域下11個(gè)三級(jí)指標(biāo)中除污水處理率和管道天然氣覆蓋率監(jiān)測(cè)值低于目標(biāo)值外,其余三級(jí)指標(biāo)監(jiān)測(cè)值均超過目標(biāo)值。這表明北京在精細(xì)化、智慧化、高效性等業(yè)務(wù)能力方面有著較強(qiáng)的表現(xiàn)。同樣,在綜合統(tǒng)籌體系與社會(huì)參與機(jī)制領(lǐng)域內(nèi),北京也超越其他超大城市具有優(yōu)異表現(xiàn),表明具備較為完整的統(tǒng)籌體系以及強(qiáng)有力的社會(huì)服務(wù)和公共參與機(jī)制。但是,北京在管理組織結(jié)構(gòu)領(lǐng)域中表現(xiàn)不佳,該領(lǐng)域下三級(jí)指標(biāo)地方財(cái)政城鄉(xiāng)社區(qū)事務(wù)支出的監(jiān)測(cè)值低于目標(biāo)值,地方財(cái)政城鄉(xiāng)社區(qū)事務(wù)支出水平直接影響著城市治理體系的運(yùn)行效率和基層治理能力,尤其是在城鄉(xiāng)社區(qū)事務(wù)的資金投人與實(shí)際需求之間存在差距,可能導(dǎo)致管理組織結(jié)構(gòu)在執(zhí)行層面的效率低下,成為未來(lái)制約北京城市運(yùn)行管理現(xiàn)代化水平的關(guān)鍵要素之一。
上海超大城市運(yùn)行管理現(xiàn)代化水平得分總體低于北京,但上海各項(xiàng)一級(jí)指標(biāo)得分水平較為均衡,未出現(xiàn)某一領(lǐng)域的極端高低差異。這種均衡也表明,上海在某些領(lǐng)域(如管理組織結(jié)構(gòu)的優(yōu)化、社會(huì)參與機(jī)制的創(chuàng)新等)未能充分實(shí)現(xiàn)突破性進(jìn)展,導(dǎo)致整體得分低于北京。為進(jìn)一步提高運(yùn)行管理現(xiàn)代化水平,上??赡苄枰诰S持各項(xiàng)指標(biāo)均衡的同時(shí),適當(dāng)加大在建筑區(qū)綠化覆蓋率、生活垃圾回收利用率、市民熱線滿意度等關(guān)鍵領(lǐng)域的投入和改革力度。通過強(qiáng)化創(chuàng)新驅(qū)動(dòng)和優(yōu)化資源配置,上海有望在保持均衡發(fā)展的基礎(chǔ)上,進(jìn)一步提高城市運(yùn)行管理的現(xiàn)代化水平。
廣州的得分居于四個(gè)城市中的第三位,整體水平略低于北京和上海,但仍高于深圳。廣州在管理組織結(jié)構(gòu)與社會(huì)參與機(jī)制領(lǐng)域的得分最高,表明其在組織架構(gòu)和社會(huì)參與方面的基礎(chǔ)和潛力。但廣州在綜合統(tǒng)籌體系上的表現(xiàn)顯著低于其他城市,專項(xiàng)業(yè)務(wù)能力方面得分也反映出廣州在現(xiàn)代化城市管理中仍存在較大的提升空間,尤其是在城市高效服務(wù)和可靠性程度方面。具體而言,廣州在全市供電可靠率、管道天然氣覆蓋率、固定垃圾箱數(shù)量、城市道路機(jī)械化作業(yè)率等方面尚未達(dá)到理想的現(xiàn)代化水平,城市管理中的數(shù)字化應(yīng)用和智慧化服務(wù)的推廣速度有待提升,從整體得分來(lái)看,可以在提高公共服務(wù)效率、提升安全和綠色治理水平方面投入更多精力。
深圳在四座超大城市中排名最末。深圳在城市事件問題速遞精準(zhǔn)率、城市道路機(jī)械化作業(yè)率、生活垃圾回收利用率、全市供電可靠率、市民熱線滿意度中優(yōu)勢(shì)明顯,但在整體城市運(yùn)行現(xiàn)代化方面的得分仍然相對(duì)較低,主要原因在于其他一些領(lǐng)域的表現(xiàn)不足,例如管理組織結(jié)構(gòu)和綜合統(tǒng)籌體系領(lǐng)域,深圳未能展現(xiàn)出與其他超大城市相當(dāng)?shù)乃?,另外在城市運(yùn)行的整體協(xié)調(diào)性、規(guī)劃的系統(tǒng)性和治理結(jié)構(gòu)的現(xiàn)代化等方面仍顯得較為薄弱。
模型計(jì)算結(jié)果有效揭示了不同城市在運(yùn)行管理現(xiàn)代化水平上的顯著差異,同時(shí)也反映了各自發(fā)展過程中所面臨的獨(dú)特挑戰(zhàn)與優(yōu)勢(shì)。通過對(duì)北京、上海、廣州、深圳等超大城市的綜合評(píng)估,可以看出這些城市在現(xiàn)代化城市管理體系的構(gòu)建過程中取得明顯進(jìn)展,但在管理組織結(jié)構(gòu)、資源統(tǒng)籌、社會(huì)參與機(jī)制等領(lǐng)域仍存在差異化表現(xiàn)。這些差異不僅源自各城市在歷史發(fā)展階段、經(jīng)濟(jì)結(jié)構(gòu)以及治理模式上的不同,也受到當(dāng)?shù)卣?、?cái)政投入以及技術(shù)發(fā)展水平的深刻影響。本文結(jié)合機(jī)器學(xué)習(xí)中的非監(jiān)督學(xué)習(xí)聚類算法、統(tǒng)計(jì)分析方法及大數(shù)據(jù)挖掘技術(shù),通過對(duì)多個(gè)維度的指標(biāo)進(jìn)行綜合分析,研究超大城市運(yùn)行管理現(xiàn)代化水平監(jiān)測(cè)模型的構(gòu)建與算法權(quán)重的確定,旨在全面反映超大城市在運(yùn)行管理方面的現(xiàn)狀、挑戰(zhàn)與發(fā)展趨勢(shì)。然而,超大城市的運(yùn)行現(xiàn)代化管理是一個(gè)高度復(fù)雜且動(dòng)態(tài)演化的系統(tǒng)工程,其評(píng)價(jià)體系不僅涉及多領(lǐng)域的數(shù)據(jù)分析,還需應(yīng)對(duì)不斷變化的內(nèi)外部環(huán)境因素。由于數(shù)據(jù)可得性與案例有限性,當(dāng)前算法模型的適應(yīng)性與靈活性仍有待進(jìn)一步提高,尤其是在處理不同類型超大城市的管理需求時(shí)。此外,現(xiàn)有模型所依賴的城市數(shù)據(jù)在空間范圍上還較為局限,未來(lái)研究應(yīng)加強(qiáng)數(shù)據(jù)源的多元化,進(jìn)一步集成社會(huì)、環(huán)境、經(jīng)濟(jì)等多個(gè)維度的數(shù)據(jù),從而增強(qiáng)模型的全面性和精準(zhǔn)度,應(yīng)考慮將不同區(qū)域、不同發(fā)展階段的超大城市納入研究范疇,進(jìn)一步豐富模型的適用性。總體而言,隨著技術(shù)的進(jìn)步與數(shù)據(jù)的積累,超大城市運(yùn)行管理現(xiàn)代化水平的監(jiān)測(cè)與評(píng)估將變得更加精準(zhǔn)和動(dòng)態(tài)化。研究者后續(xù)可進(jìn)一步探索如何將新興的人工智能技術(shù)、物聯(lián)網(wǎng)、大數(shù)據(jù)平臺(tái)等與現(xiàn)有的監(jiān)測(cè)模型深度融合,為超大城市的智慧高效治理提供更具創(chuàng)新性與前瞻性的支持。
參考文獻(xiàn):
[1]陸軍,楊浩天.中國(guó)超大城市運(yùn)行管理現(xiàn)代化:體征指標(biāo)與量化評(píng)價(jià)[J].探索,2024(5):140-154.
[2]楊思佳,王仁軍,鄭江華,等.結(jié)合變異系數(shù)法和機(jī)器學(xué)習(xí)模型的棉花長(zhǎng)勢(shì)監(jiān)測(cè)[J].測(cè)繪通報(bào),2024(07):111-116.
[3]何保榮.基于多目標(biāo)決策的時(shí)間序列數(shù)據(jù)挖掘算法仿真[J].計(jì)算機(jī)仿真,2019,36(11):243-246.
[4]夏魯寧,荊繼武.SA-DBSCAN:一種自適應(yīng)基于密度聚類算法[J].中國(guó)科學(xué)院研究生院學(xué)報(bào),2009,26(04):530-538.
[5]曾莎潔.基于機(jī)器學(xué)習(xí)算法的智慧城市運(yùn)行安全監(jiān)測(cè)模型研究[J].自動(dòng)化與儀器儀表,2024(07):229-233.
[6]唐成龍,諶顏,唐海春,等.大數(shù)據(jù)背景下數(shù)據(jù)預(yù)處理方法研究運(yùn)用[J].信息記錄材料,2021,22(9):199-200.
作者:劉莉,西南政法大學(xué)政治與公共管理學(xué)院副教授、重慶城市治理與發(fā)展研究院研究員周文煊,西南政法大學(xué)政治學(xué)碩士研究生
責(zé)任編輯:侯詩(shī)羽