崔新雨 劉玲 周一青 潘振崗
摘要:通過(guò)對(duì)高鐵車(chē)載緩存系統(tǒng)的概念、在工作流程的各個(gè)階段遇到的問(wèn)題以及相應(yīng)的智能化解決方案進(jìn)行詳細(xì)介紹,指出高鐵車(chē)載緩存可以有效地減少移動(dòng)設(shè)備與路邊基站直連通信的次數(shù),提升乘客的內(nèi)容服務(wù)體驗(yàn)。但是,高鐵車(chē)載緩存系統(tǒng)在實(shí)際的應(yīng)用中仍然存在諸多問(wèn)題,具體包括高鐵與路邊基站的協(xié)同緩存、乘客請(qǐng)求數(shù)據(jù)缺失下的請(qǐng)求規(guī)律挖掘,以及通信、計(jì)算、緩存資源的聯(lián)合管控。
關(guān)鍵詞:高鐵通信;車(chē)載緩存;智能
Abstract: An overview of the basic idea of the high-speed railway onboard caching system is presented. The main challenges at each stage of the workflow and the corresponding intelligent solutions are detailed. It is pointed out that the high-speed railway onboard caching can effectively reduce the number of direct communications between mobile devices and roadside base stations, improving the quality of service of passengers. However, there are still many problems to be solved in practice, including the collaborative caching of high-speed railway and roadside base stations, the mining of request features when passenger request data is missing, and the joint management and control of communication, computing, and caching resources.
Keywords: high-speed railway communications; onboard caching; intelligence
近年來(lái),高鐵憑借其較高的行駛速度、舒適的乘車(chē)體驗(yàn)等優(yōu)點(diǎn),逐漸成為人們優(yōu)選的遠(yuǎn)途出行方式。同時(shí),隨著移動(dòng)通信技術(shù)的飛速發(fā)展[1-6],在搭乘高鐵時(shí),乘客出于娛樂(lè)、辦公等目的,可以通過(guò)手機(jī)等移動(dòng)通信設(shè)備發(fā)起對(duì)視頻等多媒體業(yè)務(wù)內(nèi)容的請(qǐng)求[7]。不同于用戶在靜止或低速移動(dòng)狀態(tài)下通過(guò)移動(dòng)通信設(shè)備與基站建立通信連接,高鐵場(chǎng)景下移動(dòng)通信設(shè)備與路邊基站的直連通信面臨著3個(gè)主要問(wèn)題[8]。
(1)封閉式金屬車(chē)廂引起的信號(hào)衰減。高鐵車(chē)廂多采用金屬全封閉式的結(jié)構(gòu),無(wú)線信號(hào)在穿過(guò)金屬車(chē)廂時(shí)會(huì)受到較大的穿透損耗。
(2)高速移動(dòng)引起的連接不穩(wěn)定。由于路邊基站的覆蓋范圍有限,高鐵的高速移動(dòng)將引起頻繁的基站切換,從而影響移動(dòng)設(shè)備與路邊基站連接的穩(wěn)定性。
(3)高速移動(dòng)引起的多普勒頻移。高鐵與路邊基站之間的相對(duì)運(yùn)動(dòng)會(huì)引起嚴(yán)重的多普勒頻移,從而會(huì)影響無(wú)線信號(hào)的正確接收與解調(diào)。尤其是4G/5G采用的正交頻分復(fù)用技術(shù),對(duì)載波頻率偏移十分敏感。
在高鐵通信場(chǎng)景下,面向具有較大帶寬、較低時(shí)延需求的多媒體類(lèi)業(yè)務(wù),移動(dòng)通信設(shè)備與路邊基站直連的方式通常難以滿足業(yè)務(wù)的服務(wù)質(zhì)量需求,乘客在觀看視頻時(shí)將面臨頻繁播放卡頓、加載慢等問(wèn)題,觀看服務(wù)體驗(yàn)受到嚴(yán)重影響。
為了帶給乘客更優(yōu)的服務(wù)體驗(yàn),可以在高鐵上應(yīng)用車(chē)載緩存技術(shù)[9-10]。通過(guò)在高鐵上搭載緩存服務(wù)器,并在服務(wù)器中預(yù)先緩存乘客可能會(huì)請(qǐng)求的內(nèi)容,使得乘客請(qǐng)求有一定的概率被車(chē)載緩存服務(wù)器就近響應(yīng),避免乘客移動(dòng)通信設(shè)備與路邊基站的直連通信。本文將結(jié)合現(xiàn)有研究,概述高鐵車(chē)載緩存系統(tǒng),分析高鐵車(chē)載緩存系統(tǒng)面臨的主要問(wèn)題并總結(jié)相應(yīng)的智能化解決方案,同時(shí)討論高鐵車(chē)載緩存系統(tǒng)未來(lái)面臨的挑戰(zhàn),為車(chē)載緩存技術(shù)在高鐵中的智能應(yīng)用提供參考。
1 高鐵車(chē)載緩存系統(tǒng)
本節(jié)中,我們將從系統(tǒng)架構(gòu)、用戶請(qǐng)求規(guī)律、系統(tǒng)工作流程的角度對(duì)高鐵車(chē)載緩存系統(tǒng)進(jìn)行概述。
1.1 系統(tǒng)架構(gòu)
高鐵車(chē)載緩存系統(tǒng)架構(gòu)由4部分組成,分別是高鐵車(chē)載緩存服務(wù)器、高鐵車(chē)載中繼通信系統(tǒng)、路邊接入網(wǎng)和云端計(jì)算中心,如圖1所示[12-13]。高鐵搭載了一定容量的緩存服務(wù)器,負(fù)責(zé)存儲(chǔ)內(nèi)容,調(diào)度用戶請(qǐng)求,為乘客提供就近的內(nèi)容接入服務(wù)。高鐵車(chē)載中繼通信系統(tǒng)由無(wú)線接入點(diǎn)和中繼站組成,無(wú)線接入點(diǎn)分布在各節(jié)車(chē)廂,中繼站安裝在高鐵頂部,無(wú)線接入點(diǎn)與中繼站之間通過(guò)有線連接。乘客、車(chē)載緩存服務(wù)器分別通過(guò)無(wú)線、有線的方式接入車(chē)載中繼通信系統(tǒng),通過(guò)中繼通信的方式與路邊基站建立連接,以避免信號(hào)穿過(guò)車(chē)廂所產(chǎn)生的穿透損耗,獲得更優(yōu)的信號(hào)質(zhì)量。此外,若乘客請(qǐng)求的內(nèi)容被車(chē)載服務(wù)器所緩存,緩存內(nèi)容將直接經(jīng)車(chē)載中繼通信系統(tǒng)發(fā)送給乘客。路邊接入網(wǎng)由部署在鐵路沿線的路邊基站組成,為乘客提供移動(dòng)網(wǎng)絡(luò)接入服務(wù)。云端計(jì)算中心部署了內(nèi)容源服務(wù)器,源服務(wù)器中存儲(chǔ)了網(wǎng)絡(luò)中的所有內(nèi)容。云端計(jì)算中心經(jīng)核心網(wǎng)與路邊基站相連,當(dāng)乘客請(qǐng)求的內(nèi)容未被車(chē)載緩存服務(wù)器緩存時(shí),將由源服務(wù)器為乘客提供所需內(nèi)容。
1.2 用戶請(qǐng)求規(guī)律
用戶對(duì)內(nèi)容的請(qǐng)求具有一定的統(tǒng)計(jì)規(guī)律,這些統(tǒng)計(jì)規(guī)律是高鐵車(chē)載緩存系統(tǒng)工作時(shí)的重要參考依據(jù)。用戶整體發(fā)起的內(nèi)容請(qǐng)求通常服從ZipF定律,即少量?jī)?nèi)容吸引了大部分用戶對(duì)其發(fā)起請(qǐng)求,而剩余的大量?jī)?nèi)容則很少受到用戶們的關(guān)注[11]。這部分少量?jī)?nèi)容也被稱(chēng)為熱點(diǎn)內(nèi)容。研究中常用流行度表示內(nèi)容受用戶請(qǐng)求的頻次,熱點(diǎn)內(nèi)容具有較高的流行度,非熱點(diǎn)內(nèi)容具有較低的流行度。在較短的時(shí)間內(nèi)(例如一天),內(nèi)容流行度并不會(huì)發(fā)生顯著的變化。
對(duì)于用戶個(gè)體而言,常用喜好分布對(duì)用戶過(guò)去一段時(shí)間的請(qǐng)求規(guī)律進(jìn)行描述,喜好分布代表了用戶對(duì)各個(gè)內(nèi)容的喜好程度。喜好分布是極具個(gè)性化的,某一用戶個(gè)體可能會(huì)對(duì)熱點(diǎn)內(nèi)容完全不感興趣,不同用戶的喜好分布也可能完全不同。由于喜好分布是根據(jù)用戶以往的請(qǐng)求歷史記錄計(jì)算生成的,所以喜好分布僅能在一定程度上反應(yīng)用戶未來(lái)的請(qǐng)求傾向,用戶未來(lái)的請(qǐng)求行為還會(huì)受到推薦系統(tǒng)、社交關(guān)系等多重因素的影響。
統(tǒng)計(jì)技術(shù)、智能化預(yù)測(cè)技術(shù)等可以量化內(nèi)容的流行度和用戶的喜好分布,為緩存內(nèi)容的放置提供參考。在高鐵場(chǎng)景下,得益于可提前獲取乘客的班次信息,車(chē)載緩存系統(tǒng)可在列車(chē)啟程前統(tǒng)計(jì)乘客的喜好分布,推算內(nèi)容流行度,針對(duì)性地緩存乘客群體可能會(huì)請(qǐng)求的內(nèi)容。
1.3 系統(tǒng)工作流程
高鐵車(chē)載緩存系統(tǒng)的工作流程分為3步,分別是內(nèi)容放置、請(qǐng)求調(diào)度與內(nèi)容分發(fā)、內(nèi)容更新[13]。
(1)內(nèi)容放置。高鐵駛離始發(fā)站之前,車(chē)載緩存服務(wù)器可以獲得搭乘本次高鐵的乘客信息,并統(tǒng)計(jì)乘客們的喜好分布、乘客群體的內(nèi)容流行度等能夠反映乘客請(qǐng)求傾向的關(guān)鍵參考特征,然后根據(jù)這些關(guān)鍵參考特征,選擇乘客可能會(huì)在乘車(chē)過(guò)程中請(qǐng)求的內(nèi)容存入服務(wù)器。
(2)請(qǐng)求調(diào)度與內(nèi)容分發(fā)。車(chē)載緩存服務(wù)器具備調(diào)度用戶請(qǐng)求的功能。乘客在搭乘高鐵的過(guò)程中發(fā)起對(duì)內(nèi)容的請(qǐng)求后,車(chē)載緩存服務(wù)器將檢測(cè)用戶請(qǐng)求的內(nèi)容是否被緩存,并根據(jù)檢測(cè)結(jié)果對(duì)用戶請(qǐng)求進(jìn)行調(diào)度。如果車(chē)載緩存服務(wù)器緩存了乘客請(qǐng)求的內(nèi)容,車(chē)載緩存服務(wù)器將通過(guò)中繼通信系統(tǒng)向乘客分發(fā)緩存內(nèi)容。如果乘客請(qǐng)求的內(nèi)容未被車(chē)載服務(wù)器緩存,車(chē)載緩存服務(wù)器則將乘客請(qǐng)求轉(zhuǎn)移至云端計(jì)算中心的內(nèi)容源服務(wù)器處,由源服務(wù)器向用戶分發(fā)請(qǐng)求內(nèi)容。
(3)內(nèi)容更新。高鐵由始發(fā)站駛向終點(diǎn)站的過(guò)程中將途徑多個(gè)中間站,乘客的流動(dòng)使得緩存內(nèi)容也需要進(jìn)行相應(yīng)的調(diào)整。高鐵到達(dá)下一站點(diǎn)之前,車(chē)載緩存服務(wù)器將根據(jù)乘客在下一站點(diǎn)的流動(dòng)狀況對(duì)緩存內(nèi)容進(jìn)行更新,用上車(chē)乘客可能會(huì)請(qǐng)求的內(nèi)容替換下車(chē)乘客可能會(huì)請(qǐng)求的內(nèi)容。
2 高鐵車(chē)載緩存面臨的主要問(wèn)題
高鐵車(chē)載緩存系統(tǒng)在工作過(guò)程中會(huì)受到多方面的制約,影響緩存資源發(fā)揮效用。本節(jié)將分析高鐵車(chē)載緩存面臨的主要問(wèn)題,包括內(nèi)容放置階段面臨的緩存容量受限、請(qǐng)求調(diào)度階段面臨的請(qǐng)求隨機(jī)性大、內(nèi)容分發(fā)階段面臨的無(wú)線資源受限問(wèn)題以及業(yè)務(wù)場(chǎng)景支持單一的問(wèn)題。
2.1 內(nèi)容放置階段面臨緩存容量受限的問(wèn)題
云端計(jì)算中心的源內(nèi)容服務(wù)器存儲(chǔ)了動(dòng)輒拍字節(jié)級(jí)的海量?jī)?nèi)容,但車(chē)載緩存服務(wù)器的容量通常在太字節(jié)級(jí)左右,只有較小比例的內(nèi)容能被高鐵車(chē)載緩存服務(wù)器緩存。通常,人們使用緩存命中率作為衡量緩存資源效用的指標(biāo)。緩存命中率等于用戶請(qǐng)求被緩存服務(wù)器滿足的次數(shù)占用戶請(qǐng)求總次數(shù)的比例,緩存命中率越高代表緩存資源越能得到充分利用。緩存容量受限增加了內(nèi)容放置階段的難度,選擇哪些內(nèi)容進(jìn)行緩存直接決定了緩存命中率的高低。
2.2 請(qǐng)求調(diào)度階段面臨請(qǐng)求隨機(jī)性大的問(wèn)題
從提升乘客請(qǐng)求服務(wù)體驗(yàn)的角度出發(fā),如果乘客的請(qǐng)求可以直接被車(chē)載緩存服務(wù)器滿足,那么乘客可以獲得低時(shí)延的請(qǐng)求服務(wù)體驗(yàn),從而避免所提請(qǐng)求被調(diào)度至云端計(jì)算中心的情況。但是,乘客的請(qǐng)求行為在個(gè)人喜好、推薦系統(tǒng)、社交關(guān)系等多重因素的影響下較為隨機(jī),乘客根據(jù)個(gè)人喜好做出的選擇,可能會(huì)受到推薦系統(tǒng)的影響而臨時(shí)改變。此外,受社交關(guān)系的影響,乘客也可能會(huì)請(qǐng)求與個(gè)人喜好不匹配但受家人推送的內(nèi)容。乘客請(qǐng)求的隨機(jī)性,增加了請(qǐng)求被調(diào)度至云端計(jì)算中心的概率,降低了請(qǐng)求平均時(shí)延的性能。
2.3 內(nèi)容分發(fā)階段面臨無(wú)線資源受限的問(wèn)題
乘客的移動(dòng)通信設(shè)備與高鐵中繼通信系統(tǒng)之間通過(guò)無(wú)線的方式建立連接。由于無(wú)線中繼通信系統(tǒng)頻譜資源有限,當(dāng)較多的乘客發(fā)起請(qǐng)求,特別是請(qǐng)求超高清視頻等大帶寬業(yè)務(wù)內(nèi)容時(shí),容易引起網(wǎng)絡(luò)擁塞,從而影響分發(fā)時(shí)延。即便在緩存命中率較高的情況下,如果網(wǎng)絡(luò)擁塞問(wèn)題不能解決,同樣會(huì)影響到用戶的服務(wù)體驗(yàn)。緩存資源與通信資源需要進(jìn)行協(xié)同才能最大限度地發(fā)揮緩存資源的效用。
2.4 業(yè)務(wù)場(chǎng)景支持單一的問(wèn)題
緩存服務(wù)器可以對(duì)多種業(yè)務(wù)提供緩存服務(wù),如小文件加載、大文件下載、音視頻點(diǎn)播等。小文件主要來(lái)自于各類(lèi)門(mén)戶網(wǎng)站的html、js、jpg等網(wǎng)頁(yè)素材,使用緩存服務(wù)器對(duì)網(wǎng)頁(yè)的小文件進(jìn)行加速,可以減少連接的建立時(shí)間、首包時(shí)間等,優(yōu)化網(wǎng)頁(yè)的加載時(shí)間;大文件是指大小在20 MB以上的文件,例如應(yīng)用安裝包、應(yīng)用更新包等,通過(guò)緩存服務(wù)器的加速,可以提升下載速度,減少下載總時(shí)間;音視頻點(diǎn)播業(yè)務(wù)來(lái)自于各類(lèi)音視頻網(wǎng)站,緩存服務(wù)器通過(guò)對(duì)MP4、Flash視頻(FLV)等主流的視頻格式進(jìn)行緩存,可以降低音視頻的卡頓率,優(yōu)化首播時(shí)間等。目前高鐵緩存服務(wù)器僅對(duì)音視頻點(diǎn)播業(yè)務(wù)進(jìn)行了較好的支持,但仍需對(duì)小文件加載和大文件下載業(yè)務(wù)進(jìn)行進(jìn)一步優(yōu)化,以提升乘客在瀏覽門(mén)戶網(wǎng)站、下載大文件時(shí)的體驗(yàn)。
3 智能化高鐵車(chē)載緩存關(guān)鍵技術(shù)
智能技術(shù)的發(fā)展為上述部分問(wèn)題的解決提供了新的思路,本節(jié)分別針對(duì)高鐵車(chē)載緩存系統(tǒng)在內(nèi)容放置、請(qǐng)求調(diào)度、內(nèi)容分發(fā)階段面臨的主要問(wèn)題,總結(jié)相應(yīng)的智能化解決方案,包括基于深度學(xué)習(xí)的緩存內(nèi)容放置、基于內(nèi)容推薦的用戶請(qǐng)求調(diào)度和基于編碼緩存的緩存內(nèi)容分發(fā)。
3.1 基于深度學(xué)習(xí)的緩存內(nèi)容放置
緩存容量的受限為緩存內(nèi)容的放置帶來(lái)了一定的挑戰(zhàn),選擇哪些內(nèi)容進(jìn)行緩存將直接影響緩存命中率。為了在緩存容量受限的條件下盡可能地發(fā)揮緩存資源的效用,可以使用深度學(xué)習(xí)技術(shù)提高內(nèi)容流行度的預(yù)測(cè)精度,從而為緩存內(nèi)容的放置決策提供更加可靠的參考信息[14]。
文獻(xiàn)[14]在緩存服務(wù)器中引入了深度學(xué)習(xí)模塊,如圖2所示。緩存服務(wù)器除了具備基本的緩存資源、緩存資源管理器,還額外引入了與深度學(xué)習(xí)相關(guān)的內(nèi)容特征數(shù)據(jù)庫(kù)、流行度預(yù)測(cè)器、人工智能加速卡。緩存資源是內(nèi)容存儲(chǔ)的物理媒介,緩存資源管理器根據(jù)內(nèi)容流行度的預(yù)測(cè)結(jié)果負(fù)責(zé)內(nèi)容的放置、刪除與更新。內(nèi)容特征數(shù)據(jù)庫(kù)負(fù)責(zé)采集乘客在過(guò)去一段時(shí)間的內(nèi)容請(qǐng)求特征、乘客搭乘高鐵出行時(shí)的內(nèi)容請(qǐng)求特征、各內(nèi)容的類(lèi)別特征等,構(gòu)建訓(xùn)練神經(jīng)網(wǎng)絡(luò)所需的數(shù)據(jù)集。流行度預(yù)測(cè)器內(nèi)置流行度預(yù)測(cè)模型,預(yù)測(cè)模型可以從內(nèi)容特征數(shù)據(jù)庫(kù)中提取數(shù)據(jù)訓(xùn)練深度神經(jīng)網(wǎng)絡(luò),并輸出深度神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的內(nèi)容流行度,供緩存資源管理器進(jìn)行決策。人工智能加速卡負(fù)責(zé)加速深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,使得流行度的預(yù)測(cè)精度可以盡快收斂。根據(jù)數(shù)據(jù)集規(guī)模的大小以及深度神經(jīng)網(wǎng)絡(luò)模型的復(fù)雜程度,高鐵可以動(dòng)態(tài)地配置緩存服務(wù)器中的人工智能加速卡資源,避免加速資源浪費(fèi)或不足的問(wèn)題。
緩存服務(wù)器內(nèi)置的流行度預(yù)測(cè)模型采用雙向長(zhǎng)短期記憶網(wǎng)絡(luò),該網(wǎng)絡(luò)由兩個(gè)循環(huán)神經(jīng)網(wǎng)絡(luò)的變體組成,分別是雙向循環(huán)神經(jīng)網(wǎng)絡(luò)和長(zhǎng)短期記憶網(wǎng)絡(luò)。循環(huán)神經(jīng)網(wǎng)絡(luò)是一種典型的深度學(xué)習(xí)模型,適合處理序列信息。例如,對(duì)內(nèi)容流行度在過(guò)去一段時(shí)間的變化進(jìn)行采樣而得到的流行度序列信息。雙向循環(huán)神經(jīng)網(wǎng)絡(luò)由兩個(gè)循環(huán)神經(jīng)網(wǎng)絡(luò)組成,兩個(gè)循環(huán)神經(jīng)網(wǎng)絡(luò)分別采用從前向后、從后向前的方式處理序列信息。在循環(huán)神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,長(zhǎng)短期記憶網(wǎng)絡(luò)對(duì)網(wǎng)絡(luò)單元進(jìn)行了改進(jìn),使用具備門(mén)系統(tǒng)、更多參數(shù)的細(xì)胞替代原有的網(wǎng)絡(luò)單元,使得其在處理長(zhǎng)信息序列方面更有優(yōu)勢(shì)。雙向長(zhǎng)短期記憶網(wǎng)絡(luò)在雙向循環(huán)神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,將隱藏層的每個(gè)單元替換為長(zhǎng)短期記憶細(xì)胞??紤]到緩存服務(wù)器的計(jì)算能力和內(nèi)容流行度預(yù)測(cè)精度需求,可以對(duì)雙向長(zhǎng)短期記憶網(wǎng)絡(luò)的隱藏層層數(shù)進(jìn)行一些動(dòng)態(tài)的調(diào)整。
緩存服務(wù)器在進(jìn)行緩存內(nèi)容放置時(shí),將依次經(jīng)歷數(shù)據(jù)預(yù)處理、基于深度學(xué)習(xí)的流行度預(yù)測(cè)、內(nèi)容緩存3個(gè)過(guò)程。由于誤操作等因素,個(gè)別用戶產(chǎn)生的流行度序列信息存在異常,不能反映整體的流行度變化趨勢(shì),因此在訓(xùn)練神經(jīng)網(wǎng)絡(luò)之前需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,剔除異常的流行度序列信息。預(yù)處理后的數(shù)據(jù)被輸入至雙向長(zhǎng)短期記憶網(wǎng)絡(luò),網(wǎng)絡(luò)經(jīng)過(guò)一定次數(shù)的迭代訓(xùn)練,待預(yù)測(cè)精度、交叉熵?fù)p失函數(shù)等反應(yīng)訓(xùn)練效果的指標(biāo)達(dá)到閾值后,將停止訓(xùn)練,輸出對(duì)未來(lái)內(nèi)容流行度的預(yù)測(cè)值。緩存資源管理器根據(jù)內(nèi)容流行度的預(yù)測(cè)結(jié)果,選擇流行度最高的內(nèi)容存入緩存資源。
在高鐵車(chē)載緩存的場(chǎng)景下,可以在車(chē)載緩存服務(wù)器中引入基于深度學(xué)習(xí)的內(nèi)容流行度預(yù)測(cè)模塊。車(chē)載緩存服務(wù)器根據(jù)提前獲知的列車(chē)乘客搭乘信息,獲取乘客的歷史請(qǐng)求記錄,再通過(guò)深度學(xué)習(xí)技術(shù)對(duì)乘客群體的內(nèi)容流行度進(jìn)行精準(zhǔn)預(yù)測(cè),從而針對(duì)性地緩存乘客群體可能請(qǐng)求的內(nèi)容。這樣可以在緩存容量受限的條件下,提高緩存資源的效用。
3.2 基于內(nèi)容推薦的用戶請(qǐng)求調(diào)度
在請(qǐng)求調(diào)度階段,乘客請(qǐng)求被車(chē)載緩存服務(wù)器滿足得越多,平均請(qǐng)求時(shí)延就越低;但較大的乘客請(qǐng)求隨機(jī)性使得大量的乘客請(qǐng)求被調(diào)度至云端計(jì)算中心,影響了車(chē)載緩存資源的效用,以及平均請(qǐng)求時(shí)延的性能??紤]到用戶的請(qǐng)求易受推薦系統(tǒng)的影響,文獻(xiàn)[15]和[16]提出通過(guò)向用戶推薦緩存內(nèi)容來(lái)降低其請(qǐng)求的隨機(jī)性,從而提升用戶請(qǐng)求緩存內(nèi)容的概率。上述文獻(xiàn)的不同之處在于:文獻(xiàn)[15]提出了一種硬推薦機(jī)制,在用戶發(fā)起請(qǐng)求前,向用戶推薦緩存內(nèi)容;而文獻(xiàn)[16]提出了一種軟推薦機(jī)制,待用戶發(fā)起請(qǐng)求后,如果用戶請(qǐng)求的不是緩存內(nèi)容,再向用戶推薦服務(wù)體驗(yàn)更佳的緩存內(nèi)容,并詢(xún)問(wèn)用戶是否改變自己的請(qǐng)求,具體如圖3所示。
文獻(xiàn)[15]首先量化建模了用戶對(duì)內(nèi)容的請(qǐng)求概率。在模型中,用戶對(duì)內(nèi)容的請(qǐng)求概率大小受用戶喜好分布與推薦系統(tǒng)的雙重影響,且不同用戶受推薦系統(tǒng)影響的程度不一。對(duì)于推薦給用戶的內(nèi)容,由于該內(nèi)容獲得了一定的曝光度,所以用戶請(qǐng)求推薦內(nèi)容的概率會(huì)獲得一定幅度的提升;對(duì)于未推薦給用戶的內(nèi)容,由于用戶被推薦內(nèi)容所吸引,因此用戶請(qǐng)求未推薦內(nèi)容的概率會(huì)有一定幅度的下降。
通過(guò)上述模型,可以估算推薦系統(tǒng)向用戶推薦緩存內(nèi)容后,用戶對(duì)緩存內(nèi)容的請(qǐng)求概率。在用戶發(fā)起請(qǐng)求前,選擇推薦后請(qǐng)求概率最高的幾個(gè)緩存內(nèi)容并推薦給用戶,以增加緩存內(nèi)容的命中率。值得注意的是,推薦系統(tǒng)的初衷是幫助用戶發(fā)現(xiàn)感興趣的內(nèi)容,如果緩存內(nèi)容與用戶喜好相差較多,則不會(huì)被推薦給用戶。
在文獻(xiàn)[16]提出的軟推薦機(jī)制下,推薦系統(tǒng)在用戶發(fā)起請(qǐng)求前向用戶推薦內(nèi)容,但不考慮推薦的內(nèi)容是否被緩存。待用戶發(fā)起請(qǐng)求后,緩存服務(wù)器檢查用戶請(qǐng)求的內(nèi)容是否被緩存,如果用戶請(qǐng)求的內(nèi)容未被緩存,則再通過(guò)推薦系統(tǒng)進(jìn)行二次推薦,向用戶推薦符合用戶喜好且緩存了的內(nèi)容。在二次推薦時(shí),推薦系統(tǒng)將對(duì)用戶做出提示,請(qǐng)求二次推薦的內(nèi)容可以獲得更好的服務(wù)體驗(yàn),用戶可以根據(jù)需求自行決定是否改變?cè)械恼?qǐng)求,請(qǐng)求二次推薦的內(nèi)容。
在高鐵場(chǎng)景下,可以利用智能化的推薦系統(tǒng),使用硬推薦或軟推薦機(jī)制向乘客推薦車(chē)載緩存服務(wù)器中緩存的內(nèi)容,以避免用戶的請(qǐng)求被調(diào)度至云端計(jì)算中心,從而提高車(chē)載緩存服務(wù)器的服務(wù)效率。
3.3 基于編碼緩存的緩存內(nèi)容分發(fā)
對(duì)高鐵實(shí)際網(wǎng)絡(luò)數(shù)據(jù)的分析表明,其每分鐘的活躍乘客數(shù)量保持在100人左右,約占8編組列車(chē)滿員人數(shù)的1/5,每分鐘的活躍乘客數(shù)量峰值可達(dá)200人左右[17]。由于無(wú)線中繼通信系統(tǒng)的頻譜資源有限,當(dāng)較多的乘客發(fā)起請(qǐng)求時(shí),系統(tǒng)容易引起網(wǎng)絡(luò)擁塞。文獻(xiàn)[18]提出了一種基于用戶與接入點(diǎn)協(xié)同的編碼緩存機(jī)制,通過(guò)在流量負(fù)載低峰期向用戶本地的存儲(chǔ)資源中緩存特定的子文件,接入點(diǎn)可以在流量負(fù)載高峰期通過(guò)異或編碼多播的方式進(jìn)行分發(fā)。相比于非編碼緩存,編碼緩存可以大幅減少高峰期的流量負(fù)載,降低對(duì)有限頻譜資源的要求。
為了闡述編碼緩存的機(jī)理,圖4給出了一個(gè)編碼緩存的簡(jiǎn)單例子。其中,接入點(diǎn)(如基站)緩存了兩個(gè)大小為F的文件A、B,分別被分割為兩個(gè)大小相同的子文件A1、A2、B1、B2;用戶1、2具有相同容量的本地緩存資源,均可以緩存兩個(gè)子文件,接入點(diǎn)與用戶之間通過(guò)無(wú)損無(wú)線鏈路建立連接。在流量負(fù)載低峰期(如深夜)對(duì)子文件進(jìn)行緩存放置,如圖4中左圖所示,用戶1緩存子文件A1、B1,用戶2緩存子文件A2、B2。當(dāng)用戶在流量負(fù)載高峰期提出文件請(qǐng)求時(shí),例如用戶1請(qǐng)求文件A,用戶2請(qǐng)求文件B,系統(tǒng)將進(jìn)行子文件的分發(fā)。如圖4中右圖所示,由于用戶1缺少子文件A2,用戶2缺少子文件B1,那么接入點(diǎn)可以將子文件A2和B1進(jìn)行異或操作形成編碼子文件A2⊕B1,然后通過(guò)多播的方式發(fā)送給用戶1、2。用戶1將本地緩存的子文件B1與編碼子文件A2⊕B1再次進(jìn)行異或操作,即可得到所需的子文件A2;用戶2將本地緩存的子文件A2與編碼子文件A2⊕B1再次進(jìn)行異或操作,即可得到所需的子文件B1。由于異或操作并不改變文件大小,所以上述分發(fā)過(guò)程中產(chǎn)生的數(shù)據(jù)量為F/2。而在非編碼緩存機(jī)制下,接入點(diǎn)需要分別向用戶1發(fā)送A2,向用戶2發(fā)送B1,分發(fā)過(guò)程中產(chǎn)生的數(shù)據(jù)量為F??梢?jiàn),編碼緩存較非編碼緩存可以降低分發(fā)時(shí)的流量負(fù)載。
文獻(xiàn)[18]從理論的角度證明了編碼緩存機(jī)制的優(yōu)越性。在用戶數(shù)量為K、文件總量為N、用戶本地緩存容量為M的情況下,編碼緩存機(jī)制下的流量負(fù)載是非編碼緩存機(jī)制下流量負(fù)載的1/(1+KM/N)倍,理論最優(yōu)流量負(fù)載下界最多是編碼緩存機(jī)制下的流量負(fù)載的1/12。相比于非編碼緩存機(jī)制夠能大幅降低流量負(fù)載,采用編碼緩存機(jī)制能夠有效降低對(duì)頻譜資源的需求。在高鐵場(chǎng)景下,可以在乘客乘車(chē)前按照一定的規(guī)則,在乘客的移動(dòng)通信設(shè)備上緩存子文件。乘客在乘車(chē)的過(guò)程中,通過(guò)異或編碼多播的方式獲得缺失的子文件,以降低中繼通信系統(tǒng)在高峰期的流量負(fù)載壓力,避免網(wǎng)絡(luò)擁塞。
4 未來(lái)挑戰(zhàn)
高鐵車(chē)載緩存相關(guān)的研究雖然已取得了一定的進(jìn)展,在實(shí)際中也獲得了一定的應(yīng)用,但仍然存在許多需要解決的問(wèn)題。本節(jié)對(duì)其中的3個(gè)主要問(wèn)題進(jìn)行討論,包括高鐵與路邊基站的協(xié)同緩存,乘客請(qǐng)求數(shù)據(jù)缺失下的請(qǐng)求規(guī)律挖掘,以及通信、計(jì)算、緩存資源的聯(lián)合管控。
(1)高鐵與路邊基站的協(xié)同緩存
緩存服務(wù)器可以部署在高鐵中,也可以部署在鐵路沿線的路邊基站中。當(dāng)高鐵車(chē)載緩存服務(wù)器無(wú)法滿足乘客請(qǐng)求時(shí),可以將乘客請(qǐng)求調(diào)度至路邊基站的緩存服務(wù)器中。如果路邊基站的緩存服務(wù)器無(wú)法滿足用戶請(qǐng)求,再將用戶請(qǐng)求調(diào)度至云端計(jì)算中心。通過(guò)這種兩級(jí)緩存的方式,可以增加乘客就近獲得請(qǐng)求內(nèi)容的概率,降低乘客平均請(qǐng)求時(shí)延。但是,由于高鐵是高速移動(dòng)的,且在各個(gè)路邊基站覆蓋范圍內(nèi)的停留時(shí)間較為短暫,這導(dǎo)致路邊基站需要在較短的時(shí)間內(nèi)完成緩存內(nèi)容的分發(fā)。因此,高鐵與路邊基站如何協(xié)同緩存內(nèi)容的放置,在有限的時(shí)間內(nèi)完成緩存內(nèi)容的順利分發(fā)是未來(lái)需要解決的一個(gè)難點(diǎn)問(wèn)題。
(2)乘客請(qǐng)求數(shù)據(jù)缺失下的請(qǐng)求規(guī)律挖掘
緩存內(nèi)容的放置取決于乘客的請(qǐng)求規(guī)律,而乘客請(qǐng)求規(guī)律的挖掘需要乘客請(qǐng)求歷史數(shù)據(jù)的支持。但是,大部分的請(qǐng)求歷史數(shù)據(jù)受到隱私協(xié)議的保護(hù),因此車(chē)載緩存服務(wù)器所能獲得的歷史請(qǐng)求數(shù)據(jù)是不完整的。同時(shí),部分乘客的請(qǐng)求歷史數(shù)據(jù)較少,即便隱私授權(quán)后可以得到全部的請(qǐng)求歷史數(shù)據(jù),也不足以支持對(duì)乘客請(qǐng)求規(guī)律進(jìn)行挖掘。因此,還需進(jìn)一步探索智能化技術(shù)在高鐵車(chē)載緩存中的應(yīng)用,在乘客請(qǐng)求歷史數(shù)據(jù)集較小情況下,提高請(qǐng)求規(guī)律挖掘精度。
(3)通信、計(jì)算、緩存資源的聯(lián)合管控
高鐵車(chē)載緩存服務(wù)器可以為傳統(tǒng)的多媒體類(lèi)業(yè)務(wù)提供良好的支持,但對(duì)虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)等新興的計(jì)算密集型業(yè)務(wù)而言,僅有緩存服務(wù)器的支持是不夠的,還需要在高鐵上搭載移動(dòng)邊緣計(jì)算服務(wù)器進(jìn)行協(xié)助。不同的業(yè)務(wù)對(duì)通信、計(jì)算、存儲(chǔ)資源的需求是不同的。為了滿足不同業(yè)務(wù)的服務(wù)質(zhì)量需求,人們需要設(shè)計(jì)高效的資源分配機(jī)制,從而對(duì)高鐵車(chē)載通信、計(jì)算、緩存資源進(jìn)行合理調(diào)度。
5 結(jié)束語(yǔ)
受高鐵全封閉式金屬車(chē)廂引起的穿透信號(hào)損耗、高鐵高速移動(dòng)引起的通信連接不穩(wěn)定和多普勒頻移等因素的影響,乘客移動(dòng)設(shè)備與路邊基站直連的通信方式往往難以保障乘客的通信服務(wù)體驗(yàn)。高鐵車(chē)載緩存技術(shù)通過(guò)在高鐵上搭載緩存服務(wù)器,并在緩存服務(wù)器中預(yù)先存儲(chǔ)乘客未來(lái)可能請(qǐng)求的內(nèi)容,使得乘客未來(lái)的請(qǐng)求有一定幾率被緩存服務(wù)器就近滿足,移動(dòng)通信設(shè)備無(wú)須與路邊基站進(jìn)行直連通信。
本文首先從系統(tǒng)架構(gòu)、用戶請(qǐng)求特性、系統(tǒng)工作流程等方面對(duì)高鐵車(chē)載緩存系統(tǒng)進(jìn)行了概述,然后分析了緩存放置階段面臨的緩存容量受限問(wèn)題、請(qǐng)求調(diào)度階段面臨的請(qǐng)求隨機(jī)性較大問(wèn)題、內(nèi)容分發(fā)階段面臨的無(wú)線資源受限問(wèn)題以及業(yè)務(wù)場(chǎng)景支持單一的問(wèn)題。針對(duì)上述的問(wèn)題,我們分別總結(jié)了相應(yīng)的智能化解決方案,通過(guò)使用深度學(xué)習(xí)技術(shù)對(duì)內(nèi)容流行度進(jìn)行精準(zhǔn)預(yù)測(cè),為緩存內(nèi)容的放置提供更可靠的參考依據(jù);考慮乘客的請(qǐng)求易受推薦系統(tǒng)的影響,通過(guò)推薦系統(tǒng)向乘客推薦緩存內(nèi)容,以降低乘客請(qǐng)求的隨機(jī)性;通過(guò)人車(chē)協(xié)同,在乘客移動(dòng)設(shè)備中預(yù)先緩存精心設(shè)計(jì)的子文件,使得緩存內(nèi)容可以通過(guò)編碼多播的方式分發(fā)給乘客,降低對(duì)無(wú)線通信資源的需求。高鐵車(chē)載緩存技術(shù)的發(fā)展仍面臨諸多挑戰(zhàn),例如高鐵與路邊基站的協(xié)同緩存,乘客請(qǐng)求數(shù)據(jù)缺失下的請(qǐng)求規(guī)律挖掘,通信、計(jì)算、緩存資源的聯(lián)合管控等。上述挑戰(zhàn)的解決將有利于高鐵車(chē)載緩存資源進(jìn)一步發(fā)揮效用,為乘客帶來(lái)更好的通信服務(wù)體驗(yàn)。
致謝
特別感謝中國(guó)科學(xué)院計(jì)算技術(shù)研究所曹夢(mèng)華、邢旺同學(xué)在文章撰寫(xiě)過(guò)程中提供的大力支持。
參考文獻(xiàn)
[1] ZHOU Y Q, LIU L, WANG L, et al. Service aware 6G: an intelligent and open network based on convergence of communication, computing and caching [J]. Digital communication networks, 2020, 6(3): 253-260. DOI: 10.1016/j.dcan.2020.05.003
[2] LIU L, ZHOU Y Q, YUAN J H, et al. Economically optimal MS association for multimedia content delivery in cache-enabled heterogeneous cloud radio access networks [J]. IEEE journal on selected areas in communications, 2019, 37(7): 1584-1593. DOI: 10.1109/ JSAC.2019.2916280
[3] LIU L, ZHOU Y Q, GARCIA V, et al. Load aware joint CoMP clustering and inter-cell resource scheduling in heterogeneous ultra dense cellular networks [J]. IEEE transactions on vehicular technology, 2018, 67(3): 2741-2755. DOI: 10.1109/TVT.2017.2773640
[4] GARCIA V, ZHOU Y Q, SHI J L. Coordinated multipoint transmission in dense cellular networks with user-centric adaptive clustering[J]. IEEE transactions on wireless communication, 2014, 13(8): 4297-4308. DOI: 10.1109/ TWC.2014.2316500
[5] ZHOU Y Q, LIU H, PAN Z G, et al. Two-stage cooperative multicast transmission with optimized power consumption and guaranteed coverage [J]. IEEE journal on selected areas in communications, 2014, 32(2): 274-284. DOI: 10.1109/JSAC.2014.141208
[6] ZHOU Y Q, WANG J Z, SAWAHASHI M. Downlink transmission of broadband OFCDM systems—Part I: hybrid detection [J]. IEEE transactions on communication, 2005, 53(4): 718-729. DOI: 10.1109/tcomm.2004.841961
[7] 艾渤, 馬國(guó)玉, 鐘章隊(duì). 智能高鐵中的5G技術(shù)及應(yīng)用 [J]. 中興通訊技術(shù), 2019, 25(6): 42-47. DOI: 10.12142/ZTETJ.201906007
[8] GAO M L, AI B, NIU Y, et al. Edge caching and content delivery with minimized delay for both high-speed train and local users [C]// 2019 IEEE Global Communications Conference. Waikoloa, HI, USA: IEEE, 2019. DOI: 10.1109/ GLOBECOM38437.2019.9013389
[9] KANAI K, MUTO T, KATTO J, et al. Proactive content caching for mobile video utilizing transportation systems and evaluation through field experiments [J]. IEEE journal on selected areas in communications, 2016, 34(8): 2102-2114. DOI: 10.1109/JSAC.2016.2577238
[10] ZHOU Y Q, TIAN L, LIU L, et al. Fog computing enabled future mobile communication networks: a convergence of communication and computing [J]. IEEE communications magazine, 2019, 57(5): 20-27. DOI: 10.1109/ MCOM.2019.1800235
[11] DUTTA L K, XIONG J, GUI L, et al. On hit rate improving and energy consumption minimizing in cache-based convergent overlay network on high-speed train [C]// 2019 IEEE International Symposium on Broadband Multimedia Systems and Broadcasting. Jeju, Korea: IEEE, 2019. DOI: 10.1109/ BMSB47279.2019.8971853
[12] WU Y, FANG X M, YAN L. Performance analysis of on-board content caching and retrieval for high-speed railways [C]//2019 IEEE 2nd 5G World Forum. Dresden, Germany: IEEE, 2019. DOI: 10.1109/5GWF.2019.8911642
[13] LI B, XIONG J, LIU B, et al. Cache-based popular services pushing on high-speed train by using converged broadcasting and cellular networks [J]. IEEE transactions on broadcasting, 2019, 65(3): 577-588. DOI: 10.1109/ TBC.2018.2863102
[14] JIANG Y X, FENG H J, ZHENG F C, et al. Deep learning-based edge caching in fog radio access networks [J]. IEEE transactions on wireless communications, 2020, 19(12): 8442-8454. DOI: 10.1109/TWC.2020.3022907
[15] CHATZIELEFTHERIOU L E, KARALIOPOULOS M, KOUTSOPOULOS I. Jointly optimizing content caching and recommendations in small cell networks [J]. IEEE transactions on mobile computing, 2019, 18(1): 125-138. DOI: 10.1109/TMC.2018.2831690
[16] SERMPEZIS P, GIANNAKAS T, SPYROPOULOS T, et al. Soft cache hits: improving P14erformance through recommendation and delivery of related content [J]. IEEE journal on selected areas in communications, 2018, 36(6): 1300-1313. DOI: 10.1109/ JSAC.2018.2844983
[17] 王忠峰, 王富章, 孫華龍. 高鐵動(dòng)車(chē)組WiFi運(yùn)營(yíng)服務(wù)系統(tǒng)服務(wù)質(zhì)量的測(cè)量與分析 [J]. 電子技術(shù)應(yīng)用, 2018, 44(5): 77-81. DOI: 10.16157/ j.issn.0258-7998.175166
[18] MADDAH-ALI M A, NIESEN U. Fundamental limits of caching [J]. IEEE transactions on information theory, 2014, 60(5): 2856-2867. DOI: 10.1109/TIT.2014.2306938
作者簡(jiǎn)介
崔新雨,中國(guó)科學(xué)院計(jì)算技術(shù)研究所在讀博士生;主要研究方向?yàn)橥ㄐ排c計(jì)算融合、移動(dòng)邊緣緩存等。
劉玲,中國(guó)科學(xué)院計(jì)算技術(shù)研究所助理研究員;主要研究方向?yàn)槌芗W(wǎng)絡(luò)中的干擾管控與資源管理、通信與計(jì)算融合等;曾獲IEEE ICC 2018最佳論文獎(jiǎng);已發(fā)表論文20余篇。
周一青,中國(guó)科學(xué)院大學(xué)教授,中國(guó)科學(xué)院計(jì)算技術(shù)研究所“百人計(jì)劃”研究員、博士生導(dǎo)師,無(wú)線通信技術(shù)研究中心副主任,移動(dòng)計(jì)算與新型終端北京市重點(diǎn)實(shí)驗(yàn)室副主任;主要研究方向?yàn)橐苿?dòng)通信、通信與計(jì)算融合等;曾獲得WCSP2019、IEEE ICC2018、ISCIT2016、IEEE PIMRC2015、ICCS2014、WCNC013最佳論文獎(jiǎng),并獲《China Communications》《IEEE Transactions on Vehicular Technology》最佳編輯獎(jiǎng)等;已發(fā)表論文150余篇。
潘振崗,北京紫光展銳通信技術(shù)有限公司中央研究院先進(jìn)通信技術(shù)實(shí)驗(yàn)室主任;主要研究方向?yàn)闊o(wú)線信號(hào)處理、多天線系統(tǒng)、信道編解碼、跨層優(yōu)化。