周嘉凡,杜岳峰,宋寶燕,李曉光*,趙阿珠,肖緒界
基于元路徑注意力機制的MOOC視頻推薦方法
周嘉凡1,杜岳峰1,宋寶燕1,李曉光1*,趙阿珠2,肖緒界3
(1.遼寧大學(xué) 信息學(xué)院,沈陽 110036; 2.中國人民解放軍32286部隊,遼寧 鐵嶺 112600; 3.中國人民解放軍92515部隊,沈陽 125099)(*通信作者郵箱xgli@lnu.edu.cn)
MOOC平臺上,一個課程可能存在多個版本的視頻,為向?qū)W生推薦一個滿足學(xué)習(xí)興趣的MOOC視頻就需要分析學(xué)生興趣與視頻內(nèi)容的關(guān)系,為此,提出一種基于元路徑注意力機制的視頻推薦方法Mrec。一方面,利用異構(gòu)信息網(wǎng)(HIN)描述學(xué)習(xí)者和MOOC資源之間的關(guān)系,進而使用元路徑表達學(xué)生和視頻之間的交互關(guān)系;另一方面,利用注意力機制捕捉學(xué)生、視頻、元路徑的特征對學(xué)習(xí)興趣的影響情況。具體來說,Mrec方法包括兩層注意力機制:第一層是節(jié)點注意力層,通過鄰居的特征加權(quán)聯(lián)合節(jié)點自身的特征,利用多頭注意力得到實體在不同元路徑下的特征表示;第二層是路徑注意力層,通過融合在不同元路徑的指導(dǎo)下學(xué)習(xí)到的實體的特征表示來捕捉實體在不同興趣下的特征表示,并將學(xué)習(xí)到的用戶與視頻實體輸入到多層感知機(MLP)中得到預(yù)測分數(shù)來進行top-推薦。在MOOCCube和MOOCdata數(shù)據(jù)集上進行實驗的結(jié)果表明,Mrec的點擊率、歸一化折損累積收益(NDCG)、平均倒數(shù)排名(MRR)與受試者工作特征曲線下面積(AUC)均優(yōu)于對比方法。
推薦系統(tǒng);異構(gòu)信息網(wǎng)絡(luò);元路徑;注意力機制;圖神經(jīng)網(wǎng)絡(luò)
隨著互聯(lián)網(wǎng)的快速發(fā)展,出現(xiàn)了越來越多的線上學(xué)習(xí)方式,而教育信息的發(fā)展也催生了大量的在線學(xué)習(xí)平臺,如學(xué)堂云、中國大學(xué)MOOC等,學(xué)習(xí)者可以隨時隨地學(xué)習(xí),學(xué)習(xí)行為不再受限于場地、時間等因素。這種發(fā)展也使得在線學(xué)習(xí)資源數(shù)量快速增長,用戶可以接觸到更多的教學(xué)資源,但這些海量資源中包含了大量的冗余信息,會嚴重擾亂學(xué)習(xí)者對有用信息的分析和選擇,進而影響用戶使用在線學(xué)習(xí)平臺進行學(xué)習(xí)的有效性和持續(xù)性。因此,學(xué)習(xí)平臺需要更好地理解與捕捉用戶的興趣,為其推薦合適的學(xué)習(xí)資源,以便讓用戶可以在較短時間內(nèi)獲得所需要的學(xué)習(xí)內(nèi)容。
為了理解與捕捉用戶興趣,根據(jù)用戶現(xiàn)有的知識水平為其推薦合適的資源:文獻[1]中提出了一個基于內(nèi)容的協(xié)同過濾算法,該算法基于用戶的點擊行為提取用戶的興趣,同時還利用人口統(tǒng)計學(xué)特征以及課程之間的依賴關(guān)系為用戶推薦合適的課程;文獻[2]中提出了一個HRL(Hierarchical Reinforcement Learning)模型,該模型利用強化學(xué)習(xí)生成用戶畫像,分析用戶興趣進行推薦;文獻[3]中利用知識感知的自適應(yīng)推薦方法,可以根據(jù)用戶的知識狀態(tài)捕捉用戶學(xué)習(xí)興趣,為用戶推薦前驅(qū)或者后繼知識。
因此,本文引入異構(gòu)信息網(wǎng)絡(luò)(Heterogeneous Information Network, HIN)對這些實體關(guān)系進行表達,利用元路徑表達學(xué)習(xí)者與MOOC資源之間的興趣關(guān)系,并在HIN的基礎(chǔ)上提出了Mrec推薦方法。Mrec是一個端到端的課程視頻推薦方法,利用兩層注意力機制即節(jié)點間的注意力機制以及元路徑間的注意力機制學(xué)習(xí)實體的表示,最后輸入到多層感知機(Multi-Layer Perceptron, MLP)中得到預(yù)測結(jié)果。
本文的主要工作包括:1)提出了一種基于元路徑注意力機制的MOOC視頻推薦模型,利用兩層注意力機制學(xué)習(xí)實體和實體關(guān)系的特征表示;2)提出了實體特征的注意力表達機制,通過鄰居節(jié)點特征增強節(jié)點自身的學(xué)習(xí)興趣特征;3)提出了路徑間的注意力表達機制,用來計算節(jié)點在不同元路徑下生成表示的權(quán)重;4)在真實數(shù)據(jù)集上進行實驗,以驗證本文方法的有效性和準確性。
圖神經(jīng)網(wǎng)絡(luò)(Graph Neural Network, GNN)近年來迅速發(fā)展,在很多領(lǐng)域表現(xiàn)優(yōu)異。推薦系統(tǒng)的挑戰(zhàn)主要是從歷史交互和邊信息中學(xué)習(xí)有效的用戶與物品表示,由于推薦系統(tǒng)中很多信息具有圖結(jié)構(gòu),而且GNN擅長捕捉節(jié)點間的連接與圖數(shù)據(jù)的表示學(xué)習(xí),所以有很多工作將GNN應(yīng)用到推薦系統(tǒng)中。
文獻[4]中提出的圖卷積網(wǎng)絡(luò)(Graph Convolutional Network, GCN)模型是將圖卷積和神經(jīng)網(wǎng)絡(luò)結(jié)合的典型的譜模型,它可以實現(xiàn)半監(jiān)督分類的圖任務(wù);但是該模型將節(jié)點鄰居平等對待,無法處理動態(tài)圖。文獻[5]中提出的GraphSAGE模型是一個具有開創(chuàng)性的空間GNN模型,它對目標節(jié)點的鄰居進行采樣,聚合它們的嵌入,并與目標嵌入合并以進行更新;但是它也無法區(qū)分不同鄰居的權(quán)重。文獻[6]中提出的GAT(Graph ATtention networks)模型是一個空間GNN模型,解決了譜模型的幾個關(guān)鍵挑戰(zhàn),例如從特定圖形結(jié)構(gòu)到另一個圖形結(jié)構(gòu)的泛化能力差,以及復(fù)雜的矩陣求逆計算。GAT利用注意機制聚合鄰域特征,為不同節(jié)點指定不同的權(quán)重。
基于GCN、GraphSAGE、GAT等圖模型,再結(jié)合不同的圖類型與邊信息,后續(xù)出現(xiàn)了很多基于GNN的推薦模型,典型的如基于GAT的GraphRec+[7]、基于GCN的ACKrec等。
GraphRec+模型基于GAT利用多個帶注意力機制的GNN分別提取user-item、user-user、item-item三種關(guān)系圖的用戶與項目信息,通過融合源自上述三種關(guān)系圖的關(guān)系信息來實現(xiàn)預(yù)測性能更強的推薦系統(tǒng)。
文獻[8]在異構(gòu)圖上使用元路徑引導(dǎo)用戶興趣的傳播,再利用三層GCN聚合多跳鄰居的信息,還提出了一種注意力機制,自適應(yīng)地融合來自不同元路徑的上下文信息,以捕獲不同用戶的不同興趣來為其進行推薦。
與上述所有模型不同,雖然都是基于GNN進行推薦,本文引入了元路徑,提出了一個兩層注意力機制的模型,可以學(xué)習(xí)節(jié)點與節(jié)點之間、元路徑與元路徑之間的權(quán)重,同時元路徑的設(shè)計也更加豐富,以進一步提高推薦結(jié)果的精準度。
如圖1所示,本文將MOOC數(shù)據(jù)構(gòu)建為一個HIN,網(wǎng)絡(luò)里包含用戶、課程、視頻、教師等各種實體以及實體之間復(fù)雜的關(guān)系。
在HIN中,兩個節(jié)點能通過不同類型的聯(lián)系連接起來,這種聯(lián)系叫作元路徑。
用U、C、T、V分別表示用戶、課程、教師和視頻。兩個用戶可以通過多個元路徑連接,例如用戶→課程→用戶(UCU)和用戶→課程→教師→課程→用戶(UCTCU),不同的元路徑總是揭示不同的語義,前者表示兩個用戶點擊同一門課程,后者表示兩個用戶點擊過同一個老師講授的兩門課程。
本文為用戶以及視頻設(shè)計的元路徑如表1、2所示,為用戶設(shè)計了3條元路徑,為視頻設(shè)計了2條元路徑。
圖1 MOOC數(shù)據(jù)構(gòu)建的HIN
表1 用戶元路徑
表2 視頻元路徑
本章主要介紹Mrec方法的組成,包括特征的抽取、實體表示的生成過程以及推薦列表的生成,圖2是生成實體表示的框架。
圖2 實體表示生成框架
通常,視頻的標題幾乎是整個視頻總體知識的高度概括(例如,“C++”“二叉樹”“隊列”),其中包含豐富的語義信息,因此,本文用Word2vec[12]為視頻的標題生成嵌入,并將其用作視頻的內(nèi)容特征,對于用戶,本文也用同樣的方法。
在為每個節(jié)點匯總來自各個元路徑的鄰居信息之前,應(yīng)該注意到,每個節(jié)點基于不同元路徑的鄰居,在為這個節(jié)點進行推薦時,都扮演著不同的角色,即使是同一條元路徑上的鄰居,在學(xué)習(xí)針對特定任務(wù)的節(jié)點嵌入中,它們也表現(xiàn)出不同的重要性。所以本文引入了節(jié)點級別的注意力機制,可以了解HIN中每個節(jié)點的不同鄰居的重要性,并匯總這些有意義的鄰居的表示以形成節(jié)點嵌入。
如圖3所示,本文將一個節(jié)點在某條下元路徑的鄰居進行聚合,為其鄰居分配不同的權(quán)重,再結(jié)合節(jié)點自身的表示,得到一個節(jié)點特定于某條元路徑下的表示。
圖3 節(jié)點間注意力機制
由于HIN是一個無標度網(wǎng)絡(luò),所以圖數(shù)據(jù)的方差很大。為了解決這個問題,本文采用了多頭注意力機制學(xué)習(xí)節(jié)點間的權(quán)重,以便訓(xùn)練過程更加穩(wěn)定。具體來說,就是將節(jié)點級別的注意力重復(fù)次進行連接。盡管多頭注意力具有探索中心節(jié)點及其鄰域之間的多個子空間的能力,但是并不是所有的子空間都擁有一樣的重要性,有些節(jié)點甚至不存在某些子空間,所以捕獲一個無用表示的注意力頭部輸入到網(wǎng)絡(luò)中可能會誤導(dǎo)模型的最終預(yù)測。因此本文使用soft-gate為不同的注意力頭部分配不同的權(quán)重,得到模型的最終輸出:
通常HIN中的每個節(jié)點都包含各種類型的語義信息,特定于一條元路徑的節(jié)點嵌入只能從一個方面表示節(jié)點,想要得到更加全面豐富的節(jié)點嵌入,需要融合不同元路徑下節(jié)點的語義信息;而且由于每個用戶學(xué)習(xí)的偏好不同,所以不同的元路徑不應(yīng)該被同等對待。
為此,本文利用注意力機制來融合在不同元路徑下學(xué)習(xí)到的實體的表示,并生成注意力聯(lián)合表示。具體來說,本文學(xué)習(xí)不同元路徑的注意力權(quán)重,如下所示:
一個節(jié)點的聯(lián)合注意力表示如下:
本文將得到的用戶以及視頻的表示輸入到MLP中得到預(yù)測的分數(shù):
其中:MLP組件由兩個隱藏層(ReLU作為激活函數(shù))和一個輸出層(帶有S型函數(shù))實現(xiàn),本文為MLP組件實現(xiàn)了塔式結(jié)構(gòu),將每個連續(xù)的高層的層大小減半。
本文定義的損失函數(shù)如下:
實驗中采用的數(shù)據(jù)集包括:
MOOCCube:采用了文獻[14]中收集的數(shù)據(jù)集,包括199 199個用戶,38 181個視頻,706個課程,1 738個老師,以及各個實體之間的復(fù)雜關(guān)系,本文僅使用了該數(shù)據(jù)集上10 000個學(xué)生相關(guān)的視頻、課程教師以及它們之間的關(guān)系,具體數(shù)據(jù)如表3所示。
MOOCdata:從網(wǎng)站https://www.icourse163.org上抓取了用戶以及課程的數(shù)據(jù),包括32 156個用戶的59 169個瀏覽記錄以及254個課程和4 978個視頻。
表3 MOOCCube數(shù)據(jù)集中實體以及各種聯(lián)系的統(tǒng)計信息
對于本文提出的Mrec方法,在測試集上使用隨機拆分方法進行訓(xùn)練、驗證,運行5次,取平均結(jié)果。
為了評估本文提出的Mrec的性能,本文使用的對比方法如下:
DeepWalk[15]:一種基于隨機游動的網(wǎng)絡(luò)嵌入方法,專為同構(gòu)圖設(shè)計。本文的實驗中忽略節(jié)點的異質(zhì)性,在整個異質(zhì)圖上執(zhí)行DeepWalk。
BPR(Bayesian Personalized Ranking)[16]:它以貝葉斯方式優(yōu)化了推薦任務(wù)的成對排名損失。
FM(Factorization Machines)[17]:一種標準的矩陣分解方法,為了確保與其他方法的公平比較,本文僅使用用戶和視頻的表示。
metapath2vec[18]:一種基于異構(gòu)圖的嵌入方法,該方法執(zhí)行基于元路徑的隨機游走,并利用skip-gram生成異構(gòu)圖的嵌入表示。
NAIS(Neural Attentive Item Similarity)[19]:這是一個item-to-item的協(xié)同過濾算法,但是使用注意力機制方法來區(qū)分不同的在線學(xué)習(xí)行為的權(quán)重。
MOOCRec[20]:該算法通過設(shè)計不同的元路徑得到每條節(jié)點下的表示,再利用兩層元路徑間的注意力機制以及一個協(xié)同注意力層為用戶進行推薦。
Mrec1:在Mrec的基礎(chǔ)上消除了節(jié)點間的注意力機制,給每個鄰居分配相同的權(quán)重。
Mrec2:在Mrec的基礎(chǔ)上消除了元路徑間的注意力,每條元路徑擁有相同的權(quán)重。
Mrec:本文提出的推薦方法,利用了節(jié)點間的注意力與元路徑間的注意力生成實體的表示
各方法的HR@20、NGCD@20、MRR和AUC評估結(jié)果如表4所示,可以看到本文方法在兩個數(shù)據(jù)集的各項指標上均取得了最高值。從表4中可以看出,基于HIN的方法優(yōu)于其他方法,表明基于HIN的方法可以很好地利用MOOC數(shù)據(jù)的異質(zhì)性,利用輔助信息豐富節(jié)點的表示,來達到更好的推薦效果。與metapath2vec等基于隨機游走策略生成實體表示不同,Mrec利用節(jié)點的鄰居生成節(jié)點的表示,還利用注意力機制學(xué)習(xí)不同元路徑的權(quán)重,可以更好地對實體建模。
表4 MOOC數(shù)據(jù)集上各個方法的實驗結(jié)果
從表4中還可以看到,Mrec的各項指標都明顯高于Mrec1,這說明了節(jié)點間注意力機制的重要性,在同一條元路徑下,不同的鄰居確實是扮演著不同角色,在為用戶推薦時擁有不同的重要性,利用好這些鄰居可以提高推薦的準確性;Mrec2的各項指標也明顯低于Mrec,這表明了學(xué)習(xí)不同元路徑的權(quán)重的必要性。
本文使用不同的嵌入維度(即16、32、64、128、256)進行了實驗,結(jié)果如圖4所示,可以看到當實體的嵌入維度為128時,方法可獲得最佳性能。結(jié)果還表明,HIN中用戶與視頻的嵌入維度是提高推薦任務(wù)性能的重要因素,而實體表示的維度并不是越高越好。
圖4 不同維度的表現(xiàn)
本節(jié)主要針對不同的元路徑組合進行比較,以便選取最佳的元路徑來提高模型的性能。具體來說,考慮了單個元路徑的不同對比以及多個元路徑的組合,如表5所示。
表5 不同元路徑的組合描述
圖5 不同組合元路徑的AUC和MRR
本文研究了MOOC系統(tǒng)中視頻推薦的問題,提出了一種基于端到端圖神經(jīng)網(wǎng)絡(luò)模型Mrec,將豐富的上下文輔助信息納入MOOC視頻推薦中。為了以更自然和直觀的方式利用上下文信息,本文將MOOC建模為HIN,設(shè)計了一個基于注意力的圖神經(jīng)網(wǎng)絡(luò),利用節(jié)點級別的注意力和元路徑級別的注意力分別學(xué)習(xí)節(jié)點和元路徑的重要性,可以有效地探索和聚集用戶的潛在興趣,更好地對實體建模。在收集的數(shù)據(jù)集進行了綜合實驗,結(jié)果表明Mrec方法優(yōu)于其他基準方法,說明了方法的有效性。但是本文僅從HIN的角度出發(fā)形成實體的表示,怎樣融合視頻內(nèi)容與用戶興趣進行更精確的推薦,仍然是后續(xù)亟待解決的重要問題。
[1] JING X, TANG J. Guess you like: course recommendation in MOOCs[C]// Proceedings of the 2017 International Conference on Web Intelligence. New York: ACM, 2017:783-789.
[2] ZHANG J, HAO B W, CHEN B, et al. Hierarchical reinforcement learning for course recommendation in MOOCs[C]// Proceedings of the 33rd AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2019: 435-442.
[3] LIU Q, TONG S W, LIU C R, et al. Exploiting cognitive structure for adaptive learning[C]// Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2019: 627-635.
[4] KIPF T N, WELLING M. Semi-supervised classification with graph convolutional networks[EB/OL]. (2017-02-22)[2021-06-20].https://arxiv.org/pdf/1609.02907.pdf.
[5] HAMILTON W L, YING Z, LESKOVEC J. Inductive representation learning on large graphs[C]// Proceedings of the 31st International Conference on Neural Information Processing Systems. Red Hook, NY: Curran Associates Inc., 2017:1025-1035.
[6] VELI?KOVI? P, CURURULL G, CASANOVA A, et al. Graph attention networks[EB/OL]. (2018-02-04)[2021-06-20].https://arxiv.org/pdf/1710.10903.pdf.
[7] FAN W Q, MA Y, LI Q, et al. A graph neural network framework for social recommendations[J]. IEEE Transactions on Knowledge and Data Engineering, 2022, 34(5): 2033-2047.
[8] HU B B, SHI C, ZHAO W X, et al. Leveraging meta-path based context for top-recommendation with a neural co-attention model[C]// Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2018: 1531-1540.
[9] GONG J B, WANG S, WANG J L, et al. Attentional graph convolutional networks for knowledge concept recommendation in MOOCs in a heterogeneous view[C]// Proceedings of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval. New York: ACM, 2020:79-88.
[10] SUN Y Z, HAN J W. Mining heterogeneous information networks: a structural analysis approach[J]. ACM SIGKDD Explorations Newsletter, 2013, 14(2):20-28.
[11] SUN Y Z, HAN J W, YAN X F, et al. PathSim: meta path-based top-similarity search in heterogeneous information networks[J]. Proceedings of the VLDB Endowment, 2011, 4(11):992-1003.
[12] MIKOLOV T, CHEN K, CORRADO G, et al. Efficient estimation of word representations in vector space[EB/OL]. (2013-09-07)[2021-06-20].https://arxiv.org/pdf/1301.3781.pdf.
[13] ZHANG J N, SHI X J, XIE J Y, et al. GaAN: gated attention networks for learning on large and spatiotemporal graphs[C]// Proceedings of the 34th Conference on Uncertainty in Artificial Intelligence. Arlington, VA: AUAI Press, 2018: 339-349.
[14] YU J, LUO G, XIAO T, et al. MOOCCube: a large-scale data repository for NLP applications in MOOCs[C]// Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics. Stroudsburg, PA: Association for Computational Linguistics, 2020: 3135-3142.
[15] PEROZZI B, AL-RFOU R, SKIENA S. DeepWalk: online learning of social representations[C]// Proceedings of the 20th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2014: 701-710.
[16] RENDLE S, FREUDENTHALER C, GANTNER Z, et al. BPR: Bayesian personalized ranking from implicit feedback[C]// Proceedings of the 25th Conference on Uncertainty in Artificial Intelligence. Arlington, VA: AUAI Press, 2009:452-461.
[17] RENDLE S. Factorization machines with libFM[J]. ACM Transactions on Intelligent Systems and Technology, 2017, 3(3): No.57.
[18] DONG Y X, CHAWLA N V, SWAMI A. metapath2vec: scalable representation learning for heterogeneous networks[C]// Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2017: 135-144.
[19] HE X N, HE Z K, SONG J K, et al. NAIS: neural attentive item similarity model for recommendation[J]. IEEE Transactions on Knowledge and Data Engineering, 2018, 30(12): 2354-2366.
[20] SHENG D M, YUAN J L, XIE Q, et al. MOOCRec: an attention meta-path based model for Top-K recommendation in MOOC[C]// Proceeding of the 2020 International Conference on Knowledge Science, Engineering and Management, LNCS 12274/LNAI 12274. Cham: Springer, 2020: 280-288.
MOOC video recommendation method based on meta-path attention mechanism
ZHOU Jiafan1*, DU Yuefeng1, SONG Baoyan1, LI Xiaoguang1, ZHAO Azhu2, XIAO Xujie3
(1,,110036,;232286,112600,;392515,125099,;)
On the MOOC platform, there may be multiple versions of videos for one course,in order to recommend a MOOC video that satisfies the learning interest of the student,it is necessary to analyze the relationship between student interests and video contents. For this purpose, a video recommendation model named Mrec was proposed based on meta-path attention mechanism. For one thing, the Heterogeneous Information Network (HIN) was used to describe the relationships between learners and MOOC resources, and then meta-path was used to express the interaction between students and videos. For another, the attention mechanism was used to capture the influences of the characteristics of students, videos and meta-paths on learning interest. Specifically, the Mrec model was composed of two layers of attention mechanism: the first layer was the node attention layer, the node own characteristics were weightely combined with neighbor characteristics, and the feature representations of entities under different meta-paths were obtained by multi-head attention; the second layer was the path attention layer, in which the feature representations of entities learned under the guidance of different meta-paths were integrated to capture the feature representations of entities under different interests, and the learned users and video entities were put into Multi-Layer Perceptron (MLP) to obtain the prediction scores for top-recommendation. Experimental results on MOOCCube and MOOCdata datasets show that Mrec outperforms the comparison methods in terms of Hit Ratio (HR), Normalized Discounted Cumulative Gain (NDCG), Mean Reciprocal Ranking (MRR) and Area Under receiver operating characteristic Curve (AUC).
recommendation system; Heterogeneous Information Network (HIN); meta-path; attention mechanism; Graph Neural Network (GNN)
This work is partially supported by National Key Research and Development Program of China (2019YFB1406002, 2021YFF0901004), National Natural Science Foundation of China (U1811261), Project of Public Opinion and Network Security Big Data System Engineering Laboratory of Liaoning Province (2016-294), Scientific Research Project of Education Department of Liaoning Province (LJKZ0094), Natural Science Foundation Project of Liaoning Province (2020-BS-082), Youth Nursery Project of Education Department of Liaoning Province (LQN202010).
ZHOU Jiafan, born in 1996, M. S. candidate. Her research interests include recommendation system, data mining.
DU Yuefeng, born in 1986, Ph. D., lecturer. His research interests include recommendation system, data quality management.
SONG Baoyan, born in 1965, Ph. D., professor. Her research interests include database technologies.
LI Xiaoguang, born in 1973, Ph. D., associate professor. His research interests include data mining, machine learning, graph data analysis.
ZHAO Azhu, born in 1989, M. S., engineer. Her research interests include information system.
XIAO Xujie, born in 1986, Ph. D., lecturer. His research interests include data governance.
TP311
A
1001-9081(2022)06-1808-06
10.11772/j.issn.1001-9081.2021091800
2021?10?22;
2022?03?11;
2022?03?14。
國家重點研發(fā)計劃項目(2019YFB1406002, 2021YFF0901004);國家自然科學(xué)基金項目資助項目(U1811261);遼寧省公共輿情與網(wǎng)絡(luò)安全大數(shù)據(jù)系統(tǒng)工程實驗室基金資助項目(2016-294);遼寧省教育廳科學(xué)研究項目(LJKZ0094);遼寧省自然科學(xué)基金資助項目(2020-BS-082);遼寧省教育廳青年育苗項目(LQN202010)。
周嘉凡(1996—),女,山西晉城人,碩士研究生,主要研究方向:推薦系統(tǒng)、數(shù)據(jù)挖掘;杜岳峰(1986—),男,遼寧沈陽人,講師,博士,CCF會員,主要研究方向:推薦系統(tǒng)、數(shù)據(jù)質(zhì)量管理;宋寶燕(1965—),女,遼寧鐵嶺人,教授,博士,CCF會員,主要研究方向:數(shù)據(jù)庫技術(shù);李曉光(1973—),男,遼寧沈陽人,副教授,博士,CCF會員,主要研究方向:數(shù)據(jù)挖掘、機器學(xué)習(xí)、圖數(shù)據(jù)分析;趙阿珠(1989—)女,遼寧沈陽人,工程師,碩士,主要研究方向:信息系統(tǒng);肖緒界(1986—),男,遼寧本溪人,講師,博士,主要研究方向:數(shù)據(jù)治理。