——基于百度遷徙大數(shù)據(jù)的研究①"/>
胡少東 林曉博
(汕頭大學(xué) 商學(xué)院,廣東 汕頭,515063)
“雞同鴨講眼碌碌。”這是廣東家喻戶曉的《外來(lái)媳婦本地郎》的歌詞,形容21 世紀(jì)初匯聚不同方言背景的廣東家庭成員交流情況。廣東省作為我國(guó)改革開放的前沿地區(qū),一直是全國(guó)熱門的人口遷入地。流動(dòng)人口以省外流入為主,而且集中在珠三角地區(qū)[1-2]。然而,近些年來(lái),廣東省的跨省流入規(guī)模在縮減,但省內(nèi)流動(dòng)人口持續(xù)增長(zhǎng)[3]。截至2020 年第七次全國(guó)人口普查,廣東省省內(nèi)流動(dòng)人口超過(guò)兩千萬(wàn)人,占全省流動(dòng)人口總數(shù)的43%。
廣東省是我國(guó)漢語(yǔ)方言最復(fù)雜的省份之一,省內(nèi)方言紛繁復(fù)雜、犬牙交錯(cuò)[4]。主要分布著粵方言、閩方言以及客家方言三個(gè)方言大區(qū),具體可以細(xì)分為11 個(gè)方言片。隨著普通話的推廣,普通話已成為人們?cè)谡綀?chǎng)合使用的語(yǔ)言。不過(guò),在非正式場(chǎng)合,人們的用語(yǔ)并沒(méi)有明確的規(guī)定[5]。廣東省語(yǔ)委2014 年在深圳、珠海和汕頭開展調(diào)查發(fā)現(xiàn),這三個(gè)地方的居民一方面既高度認(rèn)同普通話,另一方面又習(xí)慣在非正式場(chǎng)合使用自己的母語(yǔ)方言進(jìn)行交流[6]。此外,在粵東地區(qū),只有一半的受訪者表示會(huì)在工作場(chǎng)合使用普通話進(jìn)行交流[7]??梢?jiàn),方言依然流行于廣東居民的日常生活中,形成了方言和普通話并用的情況。考慮到語(yǔ)言能夠影響到人口流動(dòng)的決策[8],地級(jí)市之間的方言文化差異是否會(huì)影響省內(nèi)人口的流動(dòng)呢?
本文借助“百度遷徙”所收集到的海量人口流動(dòng)數(shù)據(jù),從社會(huì)網(wǎng)絡(luò)角度分析廣東省省內(nèi)人口流動(dòng)情況。同時(shí),實(shí)證探究廣東省內(nèi)地級(jí)市之間的方言文化差異對(duì)于省內(nèi)人口流動(dòng)的影響作用。相較于現(xiàn)有研究,本文的貢獻(xiàn)可能有兩個(gè)方面:第一,本文將從文化的視角解釋廣東省省內(nèi)人口流動(dòng),補(bǔ)充了廣東省省內(nèi)人口流動(dòng)的影響因素研究。第二,借助實(shí)時(shí)和海量的數(shù)據(jù)把握廣東省省內(nèi)人口流動(dòng)的情況與變化,為廣東省各地因地制宜地制定人口政策提供參考。
地區(qū)之間語(yǔ)言的同質(zhì)性和相似性增加了人口流動(dòng)的可能性,語(yǔ)言的差異則會(huì)形成人口跨地區(qū)流動(dòng)的非正式壁壘[9-11]。在德國(guó),標(biāo)準(zhǔn)德語(yǔ)的普及減少了人們交流的困難,但是德語(yǔ)方言在現(xiàn)代社會(huì)中更體現(xiàn)為一種持久的地區(qū)文化差異,仍對(duì)人口遷移產(chǎn)生顯著影響[12]。在我國(guó),勞動(dòng)力流動(dòng)的范圍在空間距離上會(huì)更偏好鄰近城市,在空間位置上則是偏好方言相近、文化背景相似的地方,而普通話的推廣能夠有效減少文化的負(fù)向作用,從而促進(jìn)勞動(dòng)力跨文化區(qū)域流動(dòng)[8][13-14]。相關(guān)研究認(rèn)為方言距離對(duì)勞動(dòng)力流動(dòng)的影響是呈現(xiàn)出先促進(jìn)、后抑制的倒U形結(jié)構(gòu)[15]。
語(yǔ)言主要通過(guò)信息溝通、身份認(rèn)同和人力資本這三個(gè)方面影響人口流動(dòng)決策。首先,語(yǔ)言是交流的載體。唐寅在《閶門即事》中寫道“五更市賣何曾絕?四遠(yuǎn)方言總不同?!蔽覈?guó)是個(gè)多方言的國(guó)家,北方地區(qū)的方言內(nèi)部差異不大,溝通較為方便;而南方地區(qū)的方言種類多,語(yǔ)音、語(yǔ)調(diào)等都比較復(fù)雜,方言之間存在著較大的差異,造成人們交流中存在一定的障礙[16-17]。其次,語(yǔ)言會(huì)影響身份認(rèn)同?!额伿霞矣?xùn)·音辭》中寫道:“夫九州之人,言語(yǔ)不同,生民已來(lái),固常然矣?!狈窖允侨藗冇脕?lái)區(qū)分不同群體的工具之一,人們?cè)诮徽勥^(guò)程中往往會(huì)根據(jù)口音來(lái)判斷彼此身份[18]。在一些方言占強(qiáng)勢(shì)地位的地區(qū),語(yǔ)言的差異不僅會(huì)讓外來(lái)人口被貼上“外來(lái)人”標(biāo)簽,同時(shí)還會(huì)讓他們感受到來(lái)自主流社會(huì)的排斥,使得他們難以融入當(dāng)?shù)豙5]。最后,語(yǔ)言能力是一項(xiàng)人力資本。掌握方言溝通可以有助于外來(lái)人口擴(kuò)大在當(dāng)?shù)氐纳缃痪W(wǎng)絡(luò)和提高自身的社會(huì)認(rèn)同度,減少創(chuàng)業(yè)壁壘,增加遷入人口創(chuàng)業(yè)機(jī)會(huì),增加收入,提高定居的可能性[19]。
廣東省是我國(guó)人口流動(dòng)活躍的地區(qū)之一。同時(shí),透過(guò)人口普查和全國(guó)流動(dòng)人口動(dòng)態(tài)監(jiān)測(cè)調(diào)查數(shù)據(jù),可以發(fā)現(xiàn)珠三角城市群的省內(nèi)流入人口增速要快于省際流入,在此趨勢(shì)下珠三角城市群流入人口將逐漸呈現(xiàn)省內(nèi)和省際并重的特征[20]。
通過(guò)總結(jié)已有研究可以發(fā)現(xiàn):第一,廣東省內(nèi)人口流動(dòng)比重在增加,這會(huì)成為未來(lái)省內(nèi)人口流動(dòng)趨勢(shì)。目前關(guān)于廣東省內(nèi)人口流動(dòng)的研究還仍不足,而且基本是借助人口普查數(shù)據(jù)。隨著人口流動(dòng)的變化,需要借助及時(shí)、海量的數(shù)量來(lái)分析以便更好了解人口流動(dòng)變化。第二,對(duì)于人口流動(dòng)影響因素的研究從經(jīng)濟(jì)、社會(huì)層面拓展到更為深層的文化層面。文化的差異會(huì)增加人口跨地區(qū)流動(dòng)的負(fù)擔(dān)從而阻礙人口的流動(dòng)。我國(guó)疆域廣闊、方言眾多,“十里不同音”,即使在一個(gè)省內(nèi),也是存在多樣化的方言文化。方言對(duì)于同一省內(nèi)的人口流動(dòng)是否會(huì)產(chǎn)生影響?特別是占比較高的廣東省內(nèi)人口流動(dòng),是否會(huì)受到方言文化差異的影響?現(xiàn)有研究尚未探討這個(gè)問(wèn)題。
大數(shù)據(jù)時(shí)代的到來(lái)使得海量的人口流動(dòng)可以被及時(shí)觀察到。本文將采用百度地圖慧眼平臺(tái)(https://qianxi.baidu.com/#/)提供的人口遷徙大數(shù)據(jù)進(jìn)行研究。百度地圖平臺(tái)為用戶手機(jī)里的APP 提供定位服務(wù),服務(wù)范圍涵蓋航空、鐵路、公路等交通運(yùn)輸方式。百度地圖平臺(tái)可以基于定位服務(wù)判斷用戶所在位置的變化來(lái)分析用戶的流動(dòng)軌跡,是國(guó)內(nèi)數(shù)據(jù)源最廣的LBS(Location Based Service)平臺(tái)[21]。該平臺(tái)通過(guò)采集用戶位置信息進(jìn)行處理,從而得出每日各省市的人口流動(dòng)數(shù)據(jù),并按日公布數(shù)據(jù),實(shí)現(xiàn)人口流動(dòng)數(shù)據(jù)的及時(shí)性和可視化。
春運(yùn)是中國(guó)獨(dú)特文化現(xiàn)象,一年一度的大規(guī)模返鄉(xiāng)是中國(guó)人口流動(dòng)的寫照。大量人口被經(jīng)濟(jì)發(fā)達(dá)、資源更豐富的地區(qū)所吸引,但以戶籍制度為基礎(chǔ)的二元社會(huì)體制存在,這些流動(dòng)人口大多只能以“暫住居民”的身份生活在城市中。中國(guó)人具有濃厚的鄉(xiāng)土情結(jié),春節(jié)回家團(tuán)聚是中國(guó)人一年一度的重要儀式。大批外出人口會(huì)在春節(jié)前一段時(shí)間里集中返鄉(xiāng)過(guò)年,過(guò)年后又會(huì)返回到城市工作[14]。因此,春運(yùn)期間的數(shù)據(jù)對(duì)于反映我國(guó)區(qū)域間人口流動(dòng)的方向具有特殊作用[22]。
根據(jù)國(guó)家發(fā)改委的信息,2020 年春運(yùn)的起始時(shí)間為“2020 年1 月10 日(臘月十六)到2020年2 月18 日(正月二十五)”。2020 年春節(jié)期間新冠疫情爆發(fā),為有效控制疫情,我國(guó)部分地區(qū)采取交通管制、旅行限制等措施,使人口的跨區(qū)域流動(dòng)受到一定影響。但是,2020 年春節(jié)前,人口跨區(qū)域流動(dòng)受到的限制極小[23],在一定程度上可反映正常情況下的人員流動(dòng)情況??紤]到疫情防控從2020 年1 月24 日開始且省內(nèi)城市地理距離較近,為更好反映人口返鄉(xiāng)情況,本文選擇春節(jié)前一周的人口流動(dòng)數(shù)據(jù)作為研究,并收集了廣東省21 個(gè)地級(jí)市在2020 年1 月17 日(農(nóng)歷臘月二十三)至2020 年1 月23 日(農(nóng)歷臘月二十九)期間人口流動(dòng)的數(shù)據(jù)。同時(shí)收集了2023 年農(nóng)歷同時(shí)期(2023 年1 月14 日至2023 年1 月20 日)的人口流動(dòng)數(shù)據(jù),以對(duì)比兩個(gè)時(shí)期人口流動(dòng)的網(wǎng)絡(luò)。
百度遷徙頁(yè)面里提供的不是i 地流向j 地具體人數(shù),而是i 地流向j 地的人口數(shù)占i 地總流出人口數(shù)的比例,是一個(gè)相對(duì)重要數(shù)值,需要進(jìn)行處理[24]。同時(shí),頁(yè)面中還提供了每個(gè)城市的“遷徙規(guī)模指數(shù)”。根據(jù)百度平臺(tái)的解釋,這個(gè)指數(shù)可用來(lái)反映遷入或遷出人口規(guī)模,城市間的數(shù)值可進(jìn)行橫向?qū)Ρ取R虼吮疚膶俣冗w徙頁(yè)面提供的每個(gè)城市每日的“遷出規(guī)模指數(shù)”乘以遷往每個(gè)城市的比例從而得到每日i 地流向j 地的指數(shù),加總形成研究時(shí)間段內(nèi)i 地遷往j 地的指數(shù)[23],具體如下:
其中,Tindexi,j為i 地在t 時(shí)間段內(nèi)前往j 地的總指數(shù);indexi,t為i 地每日的遷出指數(shù);percenti,j,t為每日i 地遷出人口中遷往j 地的占比。
最后,本文構(gòu)建了以流出地為縱坐標(biāo)和流入地為橫坐標(biāo)的關(guān)系矩陣,并利用遷移指數(shù)(Tindexi,j)作為邊的權(quán)重,得到一個(gè)21*21 的有向多值網(wǎng)絡(luò)矩陣,用于分析廣東省省內(nèi)人口流動(dòng)情況。同時(shí)借助Gephi 軟件將人口流動(dòng)網(wǎng)絡(luò)進(jìn)行可視化。其中,節(jié)點(diǎn)越大表示度數(shù)越大,點(diǎn)之間的連邊越粗則表示權(quán)重越大,見(jiàn)圖1 和圖2。
圖1 2020 年廣東省內(nèi)人口流動(dòng)網(wǎng)絡(luò)
圖2 2023 年廣東省內(nèi)人口流動(dòng)網(wǎng)絡(luò)
Gephi 軟件的模塊化功能可以借助節(jié)點(diǎn)之間的聯(lián)系緊密程度的大小對(duì)節(jié)點(diǎn)做歸類,將網(wǎng)絡(luò)中的節(jié)點(diǎn)劃分到不同的子群當(dāng)中。模塊化表明了同一個(gè)社區(qū)成員之間存在著較高的密集和相對(duì)較強(qiáng)的、直接的或者積極的聯(lián)系,因此這個(gè)功能可以用于網(wǎng)絡(luò)中的社會(huì)發(fā)現(xiàn)[25]。為了研究人口流動(dòng)關(guān)系,本文借助Gephi 軟件的模塊化功能將網(wǎng)絡(luò)進(jìn)行模塊化,結(jié)果見(jiàn)表1。
表1 網(wǎng)絡(luò)模塊化結(jié)果
表2 變量描述性統(tǒng)計(jì)
同一模塊中大多城市都在地理位置上相近或接壤,例如模塊1 中的廣州市與佛山市,模塊2中的深圳市與惠州市,模塊3 中的粵東潮汕揭三市。除外,還發(fā)現(xiàn)各模塊中的城市在方言文化之間具有一定程度的相似性。2020 年模塊1 的“廣州市、佛山市、江門市”在方言上都是使用粵語(yǔ)中的廣府片,在2023 年模塊1 中的城市里也分布著粵語(yǔ)方言。在模塊2 中,2020 年深圳市、惠州市、韶關(guān)市都是既有使用粵語(yǔ)也有客家方言的城市,2023 年的城市大多都是有使用粵語(yǔ)或者客家方言的,例如深圳市、東莞市、河源市、梅州市。另外,模塊3 中兩個(gè)時(shí)期的城市保持穩(wěn)定,均是粵東地區(qū)的“汕頭市、揭陽(yáng)市、潮州市”,這三個(gè)城市不僅地理上相近,而且文化高度同源,均使用閩語(yǔ)中的潮汕片??傊?,廣東省省內(nèi)城際人口流動(dòng)在除了地理距離上的關(guān)聯(lián)性外,在方言文化上也具有相近性。
在上述網(wǎng)絡(luò)分析中,人口流動(dòng)關(guān)系密切的城市在方言文化上存在著相近性。方言距離是否會(huì)對(duì)廣東省省內(nèi)人口流動(dòng)存在一定的影響?為避免疫情防控對(duì)人口流動(dòng)的影響,本文將選取2020年春 節(jié)前(2020 年1 月17 日至2020 年1 月23 日)即人口正常流動(dòng)狀態(tài)下的數(shù)據(jù)作為研究數(shù)據(jù)。
在現(xiàn)有的文獻(xiàn)中,引力模型常被用來(lái)分析區(qū)域之間人口流動(dòng)。最早的引力模型來(lái)源于物理學(xué)中的萬(wàn)有引力公式,后來(lái)被應(yīng)用到人口流動(dòng)的研究當(dāng)中。在基礎(chǔ)引力模型中,地區(qū)的人口流動(dòng)是由遷出地與遷入地之間的地理距離以及這兩地的人口規(guī)模所決定的,見(jiàn)公式(2):
對(duì)公式(2)的等式兩邊取對(duì)數(shù)可以得到公式(3):
若以i 地為人口的遷出地,j 地為人口的遷入地,則公式(3)中的Mij表示從i 地遷往j 地的人口規(guī)模,POPi和POPj分別表示i 地和j 地的人口規(guī)模,DISij則代表i 地和j 地的地理距離。
本文借鑒已有研究做法[12]使用修正的引力模型檢驗(yàn)德國(guó)方言對(duì)德國(guó)歷史上人口流動(dòng)影響的做法,在公式(3)的基礎(chǔ)上加入了方言文化距離和相關(guān)控制變量得到公式(4):
其中,DIAij為i 地和j 地之間的方言距離變量以衡量遷入地與遷出地的方言文化差異,Eij代表相關(guān)的控制變量。
4.2.1 解釋變量:方言距離
鑒于數(shù)據(jù)可得性,本文使用的賦值測(cè)量方法來(lái)構(gòu)建廣東省21 個(gè)地級(jí)市之間的方言距離指標(biāo)的[15]。首先根據(jù)廣東省現(xiàn)行的行政區(qū)域?qū)?986 年廣東省各縣匹配到2020 年的地級(jí)市當(dāng)中。然后,對(duì)縣與縣之間的方言差異進(jìn)行賦值,具體規(guī)則為:如果兩個(gè)縣使用的方言屬于同一方言片,那么我們賦值1;如果兩個(gè)縣使用的方言屬于同一方言區(qū)中的不同方言片,就賦值為2;如果兩個(gè)縣使用的方言是同一方言大區(qū)而方言區(qū)不相同時(shí),賦值為3;如果兩個(gè)縣分別屬于不同的方言大區(qū)則賦值為4。方言數(shù)據(jù)采用徐現(xiàn)祥團(tuán)隊(duì)的研究結(jié)果[26]。同時(shí),考慮到地區(qū)之間方言的使用范圍及影響力,對(duì)方言差異進(jìn)行人口加權(quán),利用公式(5)計(jì)算出地級(jí)市之間的方言距離。
其中,假設(shè)i 縣和j 縣分別由A 市和B 市管轄,diaij是根據(jù)i 縣和j 縣的方言差異賦值規(guī)則得到的數(shù)值。POPAi和POPBj分別表示i 縣人口占A 市的總?cè)丝诒戎睾蚸 縣人口占B 市的總?cè)丝诒戎?。由于使用的?shù)據(jù)是按照1986 年我國(guó)的行政區(qū)劃登記各縣方言,為了更好地匹配上各縣人口數(shù)據(jù),本文使用距離1986 年最近的《人口普查分縣資料2000》中各縣的人口數(shù)據(jù)。DIAA,B則為經(jīng)過(guò)人口數(shù)量加權(quán)計(jì)算得出的地級(jí)市方言距離。
4.2.2.被解釋變量:人口流動(dòng)
隨著我國(guó)戶籍制度改革的推進(jìn)和地區(qū)交通基礎(chǔ)設(shè)施的完善等,中國(guó)的流動(dòng)人口在快速增長(zhǎng)。戶籍制度雖然對(duì)公民在非戶籍地定居有一定的阻礙作用,但對(duì)其自由流動(dòng)選擇是沒(méi)有任何影響的。流動(dòng)人口的增多和流動(dòng)行為的多樣化也使得在現(xiàn)在的實(shí)證研究中對(duì)于“人口遷徙”和“人口流動(dòng)”這兩個(gè)概念也不再進(jìn)行明確的區(qū)別[27]。本文采用的人口流動(dòng)數(shù)據(jù)來(lái)源于“百度遷徙”,平臺(tái)提供的數(shù)據(jù)是關(guān)于城市之間人口的流動(dòng)比例。在現(xiàn)有研究中[8][28],學(xué)者們使用地區(qū)的人口遷移率研究方言文化對(duì)人口遷移影響。由于在“春運(yùn)”期間流動(dòng)人口主要是從外地返回其家鄉(xiāng),為了更好地反映城市之間的流動(dòng),本文采用春運(yùn)期間人口遷入來(lái)源地的比重來(lái)衡量人口在日常流向其他城市的數(shù)據(jù),然后計(jì)算研究時(shí)間內(nèi)數(shù)據(jù)的平均值形成人口流動(dòng)數(shù)據(jù)。
4.2.3.其他控制變量
本文結(jié)合引力模型以及相關(guān)研究,在實(shí)證中控制了影響人口流動(dòng)的其他因素。第一,地理距離?,F(xiàn)有研究認(rèn)為地理距離對(duì)人口流動(dòng)和遷徙有重要的影響。廣東省在地理上東西跨度較大。因此,本文借助百度地圖獲取21 個(gè)地級(jí)市的經(jīng)緯度數(shù)據(jù),計(jì)算出兩兩之間的地理距離。第二,是否接壤。根據(jù)兩個(gè)城市是否接壤可以來(lái)刻畫城市的區(qū)位特征[28]。對(duì)此,本文將通過(guò)設(shè)置虛擬變量來(lái)表示城市之間是否接壤,如果兩個(gè)城市有交界則記為1,沒(méi)有交界則記為0。第三,經(jīng)濟(jì)發(fā)展水平差異。現(xiàn)有研究表明地區(qū)之間的發(fā)展差異、就業(yè)機(jī)會(huì)、工資水平是促進(jìn)人口流動(dòng)的經(jīng)濟(jì)動(dòng)因。本文以兩地之間的人均GDP 差值的絕對(duì)值來(lái)衡量地區(qū)經(jīng)濟(jì)發(fā)展水平差異。此外,實(shí)證分析中還考慮了地區(qū)人口規(guī)模,采用各市年末戶籍人口數(shù)進(jìn)行衡量。相關(guān)數(shù)據(jù)均來(lái)源于《廣東統(tǒng)計(jì)年鑒2020》。
4.3.1.基準(zhǔn)回歸結(jié)果
為了探究方言距離對(duì)于廣東省省內(nèi)人口流動(dòng)的影響,本文使用公式(4)作為基準(zhǔn)回歸方程,具體的估計(jì)結(jié)果如表3 所示。首先,第(1)列只將方言距離和人口流動(dòng)分別作為解釋變量和被解釋變量,回歸結(jié)果顯示兩者具有相關(guān)性而且“方言距離”顯著為負(fù),這表明兩地的方言距離越大則省內(nèi)人口流動(dòng)的可能性會(huì)越低。然后我們?cè)诘冢?)列和第(3)列中進(jìn)一步控制了地理因素、人口規(guī)模、經(jīng)濟(jì)發(fā)展因素和地區(qū)固定效應(yīng)??梢?jiàn),“地理距離”的估計(jì)系數(shù)顯著為負(fù),說(shuō)明城市之間的地理距離較近則人口流動(dòng)的可能性比較高。同時(shí),經(jīng)濟(jì)因素對(duì)廣東省省內(nèi)流動(dòng)具有顯著影響,經(jīng)濟(jì)發(fā)展水平差異越大,人口流動(dòng)的可能性會(huì)更大,經(jīng)濟(jì)發(fā)展水平是影響人口流動(dòng)的重要因素。在控制上述變量后,本文關(guān)注的“方言距離”的估計(jì)系數(shù)依舊為負(fù)數(shù)而且通過(guò)顯著水平檢驗(yàn),顯示了城市的方言文化因素對(duì)于人口流動(dòng)具有一定的影響,即兩地的方言距離會(huì)顯著降低人口流出的可能性。因此,如果遷入地和遷出地有相近的方言文化則能夠有效地減少流動(dòng)人口的交流困難,加強(qiáng)身份認(rèn)同,從而增加了人口流動(dòng)的可能性。
表3 基準(zhǔn)回歸結(jié)果
4.3.2.穩(wěn)健性分析
(1)更換變量指標(biāo)
首先,參照現(xiàn)有研究做法[14],本文構(gòu)建城市人口流動(dòng)機(jī)會(huì)比率來(lái)替換被解釋變量。人口流動(dòng)機(jī)會(huì)比率意思為:對(duì)于流出地i 而言,人口流動(dòng)到j(luò) 地的概率與沒(méi)有流動(dòng)到j(luò) 地的概率比值。其計(jì)算方式見(jiàn)公式(6):
其中,odds 表示人口流動(dòng)機(jī)會(huì)比率,p 表示從i 地流向j 地在觀測(cè)期間的平均比重。本文將被解釋變量由“人口流動(dòng)比例”變更為“人口流動(dòng)機(jī)會(huì)比率”。將人口流動(dòng)機(jī)會(huì)比率作為被解釋變量進(jìn)行回歸,回歸結(jié)果如表4 第(1)列所示。估計(jì)結(jié)果與基準(zhǔn)回歸結(jié)果接近,說(shuō)明人口流動(dòng)的衡量指標(biāo)變更不會(huì)影響到我們回歸結(jié)論。
表4 穩(wěn)健性檢驗(yàn)結(jié)果
在方言距離的測(cè)量中,對(duì)于方言差異采用“1-2-3-4”的賦值方法可能存在主觀性。為此,根據(jù)各縣方言的不同,將方言差異賦值數(shù)值由“1-2-3-4”調(diào)整為“1-5-25-50”,得到新的方言距離數(shù)據(jù)。回歸估計(jì)結(jié)果在表4 的第(2)列。由于“1-5-25-50”的數(shù)值比“1-2-3-4”要大,因此得到的方言距離也變大,回歸系數(shù)仍通過(guò)顯著性檢驗(yàn),而且依然為負(fù)數(shù),估計(jì)結(jié)果穩(wěn)健。
(2)子樣本回歸
雖然百度遷徙平臺(tái)是根據(jù)海量用戶的定位信息形成的數(shù)據(jù),但是目前數(shù)據(jù)仍無(wú)法獲取每個(gè)個(gè)體的具體信息。有些個(gè)體可能是由廣東省外到達(dá)廣東省內(nèi)城市再轉(zhuǎn)回目的地或者從廣東省內(nèi)某個(gè)城市出發(fā)經(jīng)過(guò)中轉(zhuǎn)后返回其他省份,這時(shí)候該地就可能不是流動(dòng)人員真正的遷出地或者遷入地,而是其從廣東省外返鄉(xiāng)或者從廣東省內(nèi)返回外省的一個(gè)中轉(zhuǎn)城市。為了減少這部分的影響使得結(jié)果更為穩(wěn)健,本文剔除了廣州市和深圳市的樣本,原因在于這兩座城市既是廣東省經(jīng)濟(jì)中心,也是廣東省的兩大綜合交通樞紐,是重要的目的地和中轉(zhuǎn)地。剔除后的子樣本回歸結(jié)果如表4 第(3)列所示,檢驗(yàn)結(jié)果沒(méi)有發(fā)生大的變化,所有變量仍保持顯著。同時(shí),可以發(fā)現(xiàn)經(jīng)濟(jì)發(fā)展水平差異的重要性有所下降,而地理距離和方言文化的影響較基準(zhǔn)回歸結(jié)果有所上升。
(3)變化研究時(shí)間段
2023 年我國(guó)對(duì)新型冠狀病毒感染調(diào)整為“乙類乙管”,經(jīng)濟(jì)社會(huì)有序恢復(fù)正常。本文收集了2023 年農(nóng)歷同時(shí)期(2023 年1 月14 日至2023 年1 月20 日)的人口流動(dòng)數(shù)據(jù)以檢驗(yàn)研究結(jié)論。表4 的第(4)列結(jié)果顯示,在2023 年,廣東省內(nèi)人口流動(dòng)同樣受到方言文化的影響,即方言文化越接近,人口流動(dòng)越密切。
4.3.3.內(nèi)生性檢驗(yàn)
人口流動(dòng)現(xiàn)狀可能會(huì)受到早期的移民活動(dòng)、流動(dòng)人口的個(gè)體社會(huì)關(guān)系等因素的影響,在回歸中遺漏了不可觀測(cè)的變量,從而形成內(nèi)生性問(wèn)題。
戲劇藝術(shù)具有濃厚的地方特色,我國(guó)民間的戲曲大部分是采用當(dāng)?shù)卣Z(yǔ)言進(jìn)行表演的[29]。由于表演語(yǔ)言的特殊性,戲劇的受眾群體通常是使用該種方言的居民[30]。廣東省的戲劇類型分布與省內(nèi)的方言區(qū)劃在地理上基本重合[31],例如,以閩語(yǔ)潮汕話演唱的潮劇主要流行在粵東潮汕方言地區(qū),在省內(nèi)其他地區(qū)則難以見(jiàn)到潮劇的表演。同時(shí),戲劇是在長(zhǎng)久歷史積淀中形成的文化,與方言文化存在相關(guān)性,而對(duì)于現(xiàn)代人口流動(dòng)則不產(chǎn)生影響,因此選做工具變量是合適的。
本文根據(jù)《廣東省地方戲曲劇種普查報(bào)告(2019)》對(duì)于廣東省21 個(gè)地級(jí)市本土戲曲劇種的調(diào)查結(jié)果設(shè)置虛擬變量,即如果兩個(gè)城市的本土戲曲劇種相同記為1,有差異則記為0,從而形成方言距離的工具變量。本文采用2SLS 方法進(jìn)行內(nèi)生性檢驗(yàn),結(jié)果見(jiàn)表5,第一階段的結(jié)果顯示方言距離與兩地戲曲類型差異存在顯著的負(fù)相關(guān)關(guān)系,戲曲種類相同的地區(qū)方言距離會(huì)越小。第一階段的F 值為24.38。根據(jù)經(jīng)驗(yàn)法則,該數(shù)值大于10 則可以排除弱工具變量問(wèn)題。在使用工具變量之后,第(2)列中方言距離的估計(jì)系數(shù)依然顯著為負(fù)。
表5 內(nèi)生性檢驗(yàn)
傳統(tǒng)的人口理論關(guān)注經(jīng)濟(jì)因素、家庭因素等對(duì)人口流動(dòng)決策的影響,如推拉理論、新勞動(dòng)遷移理論。不過(guò)這些理論并沒(méi)有關(guān)注到方言文化對(duì)人口流動(dòng)決策的影響?!吧傩‰x家老大回,鄉(xiāng)音無(wú)改鬢毛衰?!弊孕×?xí)得的方言伴隨并影響著人的一生。本文的研究表明,方言文化是影響人口流動(dòng)決策的重要因素之一,人口理論需要加強(qiáng)對(duì)方言文化的關(guān)注。
本文基于百度遷徙大數(shù)據(jù)研究得出:第一,在廣東省內(nèi)人口流動(dòng)網(wǎng)絡(luò)中,將城市進(jìn)行模塊化分析以發(fā)現(xiàn)城市子群,位于同一模塊中城市具有兩個(gè)特點(diǎn):地理位置臨近和方言相近。第二,實(shí)證分析結(jié)果表明除了地理距離、經(jīng)濟(jì)發(fā)展水平差異、人口規(guī)模等經(jīng)濟(jì)社會(huì)因素對(duì)廣東省內(nèi)人口流動(dòng)產(chǎn)生影響外,方言文化差異也會(huì)影響到省內(nèi)的人口流動(dòng)。如果流出地與流入地的方言距離越小,人口流動(dòng)的可能性會(huì)越高,即方言文化背景相似地區(qū)對(duì)于省內(nèi)流動(dòng)人口具有一定的吸引力。穩(wěn)健性檢驗(yàn)和內(nèi)生性檢驗(yàn)進(jìn)一步表明,方言文化差異對(duì)廣東省省內(nèi)人口流動(dòng)具有顯著的抑制作用。
城市因人而興,隨著省內(nèi)人口流動(dòng)規(guī)模的增長(zhǎng),促進(jìn)城市和區(qū)域協(xié)調(diào)發(fā)展需要進(jìn)一步做好流動(dòng)人口管理與服務(wù)工作。本文從文化和春運(yùn)視角出發(fā),探究方言文化差異與廣東省內(nèi)人口流動(dòng)的關(guān)系,研究結(jié)論具有一定的政策啟示:第一,對(duì)于粵東西北而言,目前普通話水平較低,需要進(jìn)一步發(fā)展深化基礎(chǔ)教育和中等教育、在保護(hù)本土方言的基礎(chǔ)上推廣普通話、提高當(dāng)?shù)厝说恼Z(yǔ)言能力,減少溝通障礙以增加地區(qū)的吸引力。第二,2022 年8 月廣東省自然資源廳發(fā)布了《廣東省都市圈國(guó)土空間規(guī)劃協(xié)調(diào)指引》,明確了廣東省未來(lái)規(guī)劃建設(shè)的五大都市圈,分別為廣州都市圈、深圳都市圈、珠西都市圈、汕潮揭都市圈以及湛茂都市圈。結(jié)合本文的研究,這五大都市圈各自內(nèi)部人口流動(dòng)活躍,在地理和文化上具有相近性。未來(lái)在加強(qiáng)都市圈建設(shè)的同時(shí),需要開展都市圈之間的交流與協(xié)作,減少地域文化差異,增加省內(nèi)不同文化背景人口的交流,促進(jìn)廣東省區(qū)域協(xié)調(diào)發(fā)展。