許明英 杜軍平 梁美玉 薛哲 李昂
摘 要:針對(duì)科研團(tuán)隊(duì)精準(zhǔn)立體畫(huà)像構(gòu)建的現(xiàn)實(shí)需求,本文提出了面向科技大數(shù)據(jù)的科研團(tuán)隊(duì)精準(zhǔn)立體畫(huà)像生成方法。該方法包含科研團(tuán)隊(duì)識(shí)別、科研團(tuán)隊(duì)研究主題預(yù)測(cè)、科研團(tuán)隊(duì)精準(zhǔn)立體畫(huà)像生成三個(gè)模塊?;诘闹虚g中心度排名方法識(shí)別科研團(tuán)隊(duì)負(fù)責(zé)人,通過(guò)2-派系和滾雪球方法識(shí)別科研團(tuán)隊(duì)成員,實(shí)現(xiàn)科研團(tuán)隊(duì)的識(shí)別。綜合考慮研究領(lǐng)域內(nèi)科研團(tuán)隊(duì)研究主題間的交互影響,提出基于圖注意力網(wǎng)絡(luò)的主題融合的科研團(tuán)隊(duì)研究主題預(yù)測(cè)方法,通過(guò)建模相同研究領(lǐng)域的團(tuán)隊(duì)間的主題關(guān)聯(lián),提高科研團(tuán)隊(duì)的研究主題預(yù)測(cè)準(zhǔn)確率??蒲袌F(tuán)隊(duì)精準(zhǔn)立體畫(huà)像生成模塊通過(guò)科研團(tuán)隊(duì)簡(jiǎn)介生成、科研合作關(guān)系構(gòu)建、科研團(tuán)隊(duì)研究主題及主題趨勢(shì)詞云生成科研團(tuán)隊(duì)的精準(zhǔn)立體畫(huà)像?;谔岢龅姆椒ㄔ谕ㄐ蓬I(lǐng)域的科研成果數(shù)據(jù)集上識(shí)別出科研團(tuán)隊(duì),預(yù)測(cè)科研團(tuán)隊(duì)的研究主題,生成科研團(tuán)隊(duì)精準(zhǔn)立體畫(huà)像并進(jìn)行可視化展示,驗(yàn)證了所提方法的有效性。
關(guān)鍵詞:科研團(tuán)隊(duì);畫(huà)像;團(tuán)隊(duì)識(shí)別;主題預(yù)測(cè);圖注意力網(wǎng)絡(luò)
中圖分類號(hào):TP391文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):2097-0145(2022)03-0015-08doi:10.11847/fj.41.3.15
Accurate Stereo Portrait Generation Method of Scientific Research Team
for Scientific and Technological Big Data
XU Ming-ying, DU Jun-ping, LIANG Mei-yu, XUE Zhe, LI Ang
(Beijing Key Laboratory of Intelligent Telecommunication Software and Multimedia, Beijing University of Posts and Telecommunications, Beijing 100876, China)
Abstract:In view of the practical demand of accurate stereo portrait construction of scientific research team, this paper proposes an accurate stereo portrait generation algorithm of scientific research team. The algorithm includes three modules: research team identification, research topic prediction and research team portrait generation. The leader of the scientific research team is identified based on the iterative middle centrality ranking method, and the members of the scientific research team are identified through the 2-faction and snowball methods, so as to realize the identification of the scientific research team. Considering the interaction between the research topics of the research team in the research field, a topic prediction method based on the topic fusion of the graph attention network is proposed to improve precision of topic prediction. The research team portrait generation module generates the accurate stereo portrait of the research team through the generation of the research team profile, the construction of research cooperation relationship, and the construction of the research team topic and trend cloud. Scientific research team is identified on the data set of scientific research achievements, and the accurate stereo portrait of scientific research team is generated and visualized. Experiments verify the effectiveness of the proposed method.Key words:scientific research team; portrait; team identification; topic prediction; graph attention network
1 引言
科研團(tuán)隊(duì)合作在許多科學(xué)研究領(lǐng)域已經(jīng)變得勢(shì)在必行,科學(xué)、技術(shù)和工程領(lǐng)域超過(guò)90%的成果是通過(guò)團(tuán)隊(duì)合作完成的[1]。隨著科研任務(wù)的復(fù)雜化和專業(yè)化程度的提高,科研任務(wù)越來(lái)越傾向于由科研團(tuán)隊(duì)合作完成。科研團(tuán)隊(duì)合作有助于團(tuán)隊(duì)成員實(shí)現(xiàn)科研團(tuán)隊(duì)間的科技信息資源共享,獲取和整合科技知識(shí)、技術(shù)和其他必要的科技資源,從而提升科技創(chuàng)新能力[2,3]。相關(guān)調(diào)研發(fā)現(xiàn)信息檢索領(lǐng)域內(nèi)高產(chǎn)的學(xué)者更樂(lè)于合作,而且更愿意和自己研究興趣相似的人合作,科研團(tuán)隊(duì)合作與研究質(zhì)量正相關(guān)[4]。
如何從浩如煙海的科技大數(shù)據(jù)中快速、準(zhǔn)確地識(shí)別出科研團(tuán)隊(duì),如何有效地刻畫(huà)科研團(tuán)隊(duì)使團(tuán)隊(duì)信息更加直觀地展示,為科研團(tuán)隊(duì)管理、評(píng)審專家決策提供科學(xué)的決策支持是科技大數(shù)據(jù)領(lǐng)域亟需解決的重要科學(xué)問(wèn)題[5]。從海量科技大數(shù)據(jù)中有效地識(shí)別科研團(tuán)隊(duì)并對(duì)其進(jìn)行分析[6,7]和刻畫(huà),有助于快速掌握科研團(tuán)隊(duì)現(xiàn)狀,改善對(duì)科研團(tuán)隊(duì)的管理以及更好地引導(dǎo)科研團(tuán)隊(duì)的發(fā)展。目前針對(duì)科研團(tuán)隊(duì)畫(huà)像的研究相對(duì)較少,莫君蘭等[8]提出了科研團(tuán)隊(duì)畫(huà)像的概念,通過(guò)融合多源異構(gòu)數(shù)據(jù)構(gòu)建科研團(tuán)隊(duì)畫(huà)像。劉行兵等[9]使用AHP層次分析法,構(gòu)建了體現(xiàn)科研團(tuán)隊(duì)協(xié)同創(chuàng)新能力的科研團(tuán)隊(duì)畫(huà)像?,F(xiàn)有的科研團(tuán)隊(duì)畫(huà)像構(gòu)建方法沒(méi)有考慮對(duì)科研團(tuán)隊(duì)的研究主題未來(lái)趨勢(shì)的刻畫(huà),無(wú)法幫助科學(xué)家和政府預(yù)見(jiàn)未來(lái)的研究方向,無(wú)法為科研管理部門(mén)提供決策支持。
本文提出了面向科技大數(shù)據(jù)的科研團(tuán)隊(duì)精準(zhǔn)立體畫(huà)像生成方法,該方法包括科研團(tuán)隊(duì)識(shí)別、科研團(tuán)隊(duì)研究主題預(yù)測(cè)、科研團(tuán)隊(duì)精準(zhǔn)立體畫(huà)像生成三個(gè)模塊??蒲袌F(tuán)隊(duì)識(shí)別模塊通過(guò)獲取科技大數(shù)據(jù)中相關(guān)研究領(lǐng)域的科研成果等科技資源,基于社會(huì)網(wǎng)絡(luò)分析的思想[10,11],采用迭代的中間中心度排名方法識(shí)別出了團(tuán)隊(duì)領(lǐng)導(dǎo)人與團(tuán)隊(duì)成員[12]。科研團(tuán)隊(duì)研究主題預(yù)測(cè)模塊通過(guò)分析各個(gè)研究領(lǐng)域的科研團(tuán)隊(duì)成果數(shù)據(jù)的特點(diǎn)[13~15],抽取科研團(tuán)隊(duì)的研究主題,提出基于圖注意力網(wǎng)絡(luò)(GAT)的科研團(tuán)隊(duì)主題融合方法預(yù)測(cè)科研團(tuán)隊(duì)的研究主題未來(lái)趨勢(shì)??蒲袌F(tuán)隊(duì)精準(zhǔn)立體畫(huà)像生成模塊通過(guò)科研團(tuán)隊(duì)簡(jiǎn)介、科研團(tuán)隊(duì)合作關(guān)系圖和科研團(tuán)隊(duì)研究主題及預(yù)測(cè)詞云構(gòu)建科研團(tuán)隊(duì)精準(zhǔn)立體畫(huà)像,對(duì)科研團(tuán)隊(duì)進(jìn)行全面、立體地刻畫(huà)。
本文的主要貢獻(xiàn)如下:(1)提出了面向科技大數(shù)據(jù)的科研團(tuán)隊(duì)精準(zhǔn)立體畫(huà)像生成方法,通過(guò)科研團(tuán)隊(duì)識(shí)別、科研團(tuán)隊(duì)研究主題預(yù)測(cè)、科研團(tuán)隊(duì)精準(zhǔn)立體畫(huà)像生成三個(gè)模塊構(gòu)建科研團(tuán)隊(duì)畫(huà)像。(2) 針對(duì)科研團(tuán)隊(duì)的科研成果數(shù)據(jù),提出了一種基于圖注意力網(wǎng)絡(luò)(GAT)的主題融合的研究主題預(yù)測(cè)方法,提高了科研團(tuán)隊(duì)的主題趨勢(shì)預(yù)測(cè)準(zhǔn)確率。(3) 在科技成果數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn),挖掘出科研團(tuán)隊(duì),精準(zhǔn)地預(yù)測(cè)出了科研團(tuán)隊(duì)研究主題趨勢(shì),設(shè)計(jì)模板生成了科研團(tuán)隊(duì)精準(zhǔn)立體畫(huà)像。
2 相關(guān)工作
2.1 科研團(tuán)隊(duì)識(shí)別
利用大型科技文獻(xiàn)數(shù)據(jù)構(gòu)建科研合作網(wǎng)絡(luò),識(shí)別科研團(tuán)隊(duì)的方法得到了廣泛的研究[16,17]。通過(guò)學(xué)術(shù)合作關(guān)系構(gòu)建學(xué)術(shù)合作網(wǎng)絡(luò)[18,19],通過(guò)社會(huì)網(wǎng)絡(luò)分析法[20]識(shí)別科研團(tuán)隊(duì)[21]。通常使用作者合著、文獻(xiàn)引用等信息構(gòu)建整體科研合作網(wǎng)絡(luò)[22],基于靜態(tài)分析法分析科研合作網(wǎng)絡(luò)的統(tǒng)計(jì)特征和合作成員的個(gè)人屬性[23]。選擇中間中心度作為識(shí)別團(tuán)隊(duì)負(fù)責(zé)人的指標(biāo),通過(guò)中間中心度指標(biāo)排名,挖掘出科研網(wǎng)絡(luò)中的團(tuán)隊(duì)負(fù)責(zé)人和合作密切的團(tuán)隊(duì)成員[24]。于永勝等[12]提出了基于迭代中間中心度方法,從而更準(zhǔn)確地實(shí)現(xiàn)科研團(tuán)隊(duì)的識(shí)別與挖掘。
2.2 主題預(yù)測(cè)
Prabhakaran等[25]使用歷史曲線上的時(shí)間分析來(lái)預(yù)測(cè)特定領(lǐng)域的研究主題的興衰。Li等[26]利用機(jī)器學(xué)習(xí)方法對(duì)納米材料生物醫(yī)學(xué)領(lǐng)域的研究成果進(jìn)行挖掘,科學(xué)地預(yù)測(cè)其研究領(lǐng)域的發(fā)展趨勢(shì)。相關(guān)研究開(kāi)始關(guān)注計(jì)算機(jī)科學(xué)領(lǐng)域的主題演化趨勢(shì)預(yù)測(cè),Tesfamariam等[27]采用經(jīng)典的時(shí)間序列預(yù)測(cè)模型ARIMA預(yù)測(cè)計(jì)算機(jī)科學(xué)中國(guó)際會(huì)議的研究主題趨勢(shì)。LSTM被用來(lái)捕獲時(shí)序特征[28],并被用于科學(xué)研究主題預(yù)測(cè)任務(wù)。Liang等[29]使用科技出版物和科技期刊的相關(guān)數(shù)據(jù),應(yīng)用LSTM網(wǎng)絡(luò)預(yù)測(cè)候選主題的流行度分?jǐn)?shù)以確定未來(lái)的研究主題。
2.3 科研團(tuán)隊(duì)畫(huà)像構(gòu)建
對(duì)科研團(tuán)隊(duì)進(jìn)行分析與刻畫(huà)有助于改善對(duì)科研團(tuán)隊(duì)的管理。隨著用戶畫(huà)像技術(shù)[30]的發(fā)展,融合多源異構(gòu)數(shù)據(jù)的科研人員畫(huà)像構(gòu)建方法得到了廣泛的研究[31,32],莫君蘭等[8]通過(guò)融合多源異構(gòu)數(shù)據(jù)構(gòu)建包含團(tuán)隊(duì)結(jié)構(gòu)抽取、團(tuán)隊(duì)緊密度提取、團(tuán)隊(duì)研究主題提取、團(tuán)隊(duì)影響力的科研團(tuán)隊(duì)畫(huà)像。劉行兵等[9]使用AHP層次分析法,構(gòu)建體現(xiàn)科研團(tuán)隊(duì)的協(xié)同創(chuàng)新能力的科研團(tuán)隊(duì)畫(huà)像,通過(guò)科研團(tuán)隊(duì)績(jī)效評(píng)價(jià)體系對(duì)科研團(tuán)隊(duì)的創(chuàng)新能力進(jìn)行數(shù)字化。然而,現(xiàn)有的科研團(tuán)隊(duì)畫(huà)像構(gòu)建方法沒(méi)有考慮科研團(tuán)隊(duì)的研究主題未來(lái)趨勢(shì)的刻畫(huà)。
3 科研團(tuán)隊(duì)精準(zhǔn)立體畫(huà)像生成方法的提出
針對(duì)科研團(tuán)隊(duì)精準(zhǔn)立體畫(huà)像構(gòu)建的現(xiàn)實(shí)需求,提出了科研團(tuán)隊(duì)精準(zhǔn)立體畫(huà)像生成方法。科研團(tuán)隊(duì)精準(zhǔn)立體畫(huà)像生成方法的整體框架如圖1所示。
科研團(tuán)隊(duì)精準(zhǔn)立體畫(huà)像生成方法包括三個(gè)模塊:科研團(tuán)隊(duì)識(shí)別模塊、科研團(tuán)隊(duì)研究主題預(yù)測(cè)模塊、科研團(tuán)隊(duì)精準(zhǔn)立體畫(huà)像生成模塊??蒲袌F(tuán)隊(duì)識(shí)別模塊對(duì)科技論文的作者列表進(jìn)行處理,去除沒(méi)有作者或作者機(jī)構(gòu)不存在的數(shù)據(jù),構(gòu)建科研合著網(wǎng)絡(luò),使用基于社會(huì)網(wǎng)絡(luò)分析法識(shí)別科研團(tuán)隊(duì)。使用迭代中間中心度方法識(shí)別出不同研究領(lǐng)域的科研團(tuán)隊(duì)負(fù)責(zé)人,通過(guò)2-派系和滾雪球方法識(shí)別科研團(tuán)隊(duì)成員的核心成員和非核心成員。科研團(tuán)隊(duì)研究主題預(yù)測(cè)模塊采用基于圖注意力網(wǎng)絡(luò)的科研團(tuán)隊(duì)主題融合方法融合某科研團(tuán)隊(duì)受到的其他科研團(tuán)隊(duì)的主題影響,預(yù)測(cè)科研團(tuán)隊(duì)主題未來(lái)發(fā)展趨勢(shì)。科研團(tuán)隊(duì)精準(zhǔn)立體畫(huà)像生成模塊設(shè)計(jì)團(tuán)隊(duì)簡(jiǎn)介模板、團(tuán)隊(duì)合作關(guān)系圖模板,對(duì)識(shí)別出的科研團(tuán)隊(duì)的信息進(jìn)行統(tǒng)計(jì)分析,基于設(shè)計(jì)的模板形成團(tuán)隊(duì)簡(jiǎn)介;根據(jù)科研團(tuán)隊(duì)的科研成果的作者列表數(shù)據(jù)中作者的共現(xiàn)信息、科研團(tuán)隊(duì)成員的碩博士論文中的作者及指導(dǎo)教師信息,抽取科研團(tuán)隊(duì)負(fù)責(zé)人及團(tuán)隊(duì)成員之間的合作信息及師徒關(guān)系,構(gòu)建團(tuán)隊(duì)合作關(guān)系圖;生成科研團(tuán)隊(duì)的研究主題及主題預(yù)測(cè)詞云,最終生成科研團(tuán)隊(duì)的精準(zhǔn)立體畫(huà)像。
3.1 科研團(tuán)隊(duì)識(shí)別
團(tuán)隊(duì)負(fù)責(zé)人是科研團(tuán)隊(duì)的核心和靈魂,科研團(tuán)隊(duì)負(fù)責(zé)人識(shí)別是科研團(tuán)隊(duì)識(shí)別的重要部分。采用于永勝等[12]提出的方法基于迭代的中間中心度排名方法識(shí)別科研團(tuán)隊(duì)負(fù)責(zé)人,通過(guò)2-派系和滾雪球方法識(shí)別科研團(tuán)隊(duì)成員,從而實(shí)現(xiàn)科研團(tuán)隊(duì)的識(shí)別與挖掘??蒲袌F(tuán)隊(duì)識(shí)別算法的具體步驟如表1所示。
科研團(tuán)隊(duì)識(shí)別模塊以學(xué)者合著列表為輸入構(gòu)建科研合著網(wǎng)絡(luò),計(jì)算科研合著網(wǎng)絡(luò)中所有節(jié)點(diǎn)的中間中心度排名,選取出科研團(tuán)隊(duì)負(fù)責(zé)人,使用2-派系方法識(shí)別出與團(tuán)隊(duì)負(fù)責(zé)人相連的核心科研人員,以科研團(tuán)隊(duì)負(fù)責(zé)人和核心科研人員為基點(diǎn)通過(guò)滾雪球的方法識(shí)別出非核心科研人員。
3.2 基于圖注意力網(wǎng)絡(luò)的科研團(tuán)隊(duì)主題融合的主題趨勢(shì)預(yù)測(cè)算法(GATP)
通過(guò)分析領(lǐng)域內(nèi)科研團(tuán)隊(duì)成果數(shù)據(jù)的特性發(fā)現(xiàn),團(tuán)隊(duì)的研究主題趨勢(shì)會(huì)受到該領(lǐng)域內(nèi)其他科研團(tuán)隊(duì)的研究主題的影響,因此提出了基于圖注意力網(wǎng)絡(luò)的科研團(tuán)隊(duì)主題融合的主題趨勢(shì)預(yù)測(cè)算法(GATP),GATP算法框架圖如圖2所示。
圖2 基于圖注意力網(wǎng)絡(luò)的科研團(tuán)隊(duì)主題融合的主題趨勢(shì)預(yù)測(cè)框架圖
給定某研究領(lǐng)域內(nèi)多個(gè)科研團(tuán)隊(duì)的研究主題,為了追蹤領(lǐng)域內(nèi)每個(gè)團(tuán)隊(duì)的研究主題,通過(guò)部署多個(gè)循環(huán)神經(jīng)網(wǎng)絡(luò)LSTM對(duì)不同團(tuán)隊(duì)的研究主題序列進(jìn)行建模,將每個(gè)研究團(tuán)隊(duì)的研究主題編碼為多個(gè)低維的向量表示,區(qū)分不同科研團(tuán)隊(duì)的研究主題。采用基于圖注意力網(wǎng)絡(luò)的科研團(tuán)隊(duì)主題關(guān)聯(lián)融合方法建模研究領(lǐng)域內(nèi)科研團(tuán)隊(duì)之間的主題關(guān)聯(lián),獲取領(lǐng)域內(nèi)其他科研團(tuán)隊(duì)的研究主題對(duì)該科研團(tuán)隊(duì)的主題影響。給定一個(gè)科研團(tuán)隊(duì)在第t年及第t年之前的研究主題,基于圖注意力網(wǎng)絡(luò)的科研團(tuán)隊(duì)主題融合的主題趨勢(shì)預(yù)測(cè)算法GATP,根據(jù)該科研團(tuán)隊(duì)在第t年及第t年之前的研究主題和領(lǐng)域內(nèi)其他科研團(tuán)隊(duì)對(duì)該科研團(tuán)隊(duì)的主題影響預(yù)測(cè)該科研團(tuán)隊(duì)在t+1年的研究主題。
3.2.1 基于LSTM的科研團(tuán)隊(duì)主題序列建模
對(duì)于科技大數(shù)據(jù)某領(lǐng)域包含n個(gè)團(tuán)隊(duì)的科技論文集P={p1,p2,…,pn},pi代表了一個(gè)團(tuán)隊(duì)的科技論文集合,抽取團(tuán)隊(duì)中主題詞集
{w1,w2,…,wj,…,wv}。應(yīng)用one-hot向量pti∈Rv表示團(tuán)隊(duì)i在第t年的研究主題,
pti={pt1,pt2,…,ptj,ptv},ptj表示主題詞wj的歸一化詞頻,v是出現(xiàn)在科技論文集P中的詞匯。ptj的計(jì)算公式如(1)式所示。
ptj=tf(wj)∑si=1tf(wj)(1)
其中tf(wj)是主題詞wj在團(tuán)隊(duì)pi中出現(xiàn)的詞頻,s是團(tuán)隊(duì)pi中所有主題詞的數(shù)目。
為了追蹤領(lǐng)域內(nèi)每個(gè)團(tuán)隊(duì)的研究主題,區(qū)分不同團(tuán)隊(duì)的研究主題表示,部署了多個(gè)LSTM對(duì)不同團(tuán)隊(duì)的研究主題序列進(jìn)行建模。以當(dāng)前時(shí)間步長(zhǎng)的研究主題為輸入,將研究主題迭代編碼為隱藏狀態(tài),以捕獲不同團(tuán)隊(duì)的研究主題。團(tuán)隊(duì)的主題序列由帶有不同參數(shù)的多個(gè)LSTM鏈建模。
假設(shè)某一研究領(lǐng)域下有四個(gè)團(tuán)隊(duì):團(tuán)隊(duì)i,團(tuán)隊(duì)j,團(tuán)隊(duì)k和團(tuán)隊(duì)l。給定團(tuán)隊(duì)i的研究主題pi={p1i,p2i,…,pti},pti是團(tuán)隊(duì)i在第t年的研究主題,pti∈Rv。為了避免詞匯量增加時(shí)的維數(shù)災(zāi)難,部署詞嵌入矩陣,將pti轉(zhuǎn)換成稠密低維的向量。團(tuán)隊(duì)i第t年的研究主題表示為xti。xti的計(jì)算公式如(2)式所示。
xti=pti(2)
其中是詞嵌入矩陣,∈Rdw×v,xti∈Rdw。
將xti作為輸入,使用LSTM建模研究團(tuán)隊(duì)i在第t年的研究主題表示hti。hti的計(jì)算公式如(3)式所示。
hti=LSTM(ht-1i,xti)(3)
3.2.2 基于圖注意力網(wǎng)絡(luò)的主題影響力融合
對(duì)于領(lǐng)域內(nèi)的某一團(tuán)隊(duì),其研究主題會(huì)隨著領(lǐng)域內(nèi)其他團(tuán)隊(duì)主題的影響而發(fā)生變化。除了跟蹤團(tuán)隊(duì)內(nèi)的研究主題外,還需要計(jì)算領(lǐng)域內(nèi)其他團(tuán)隊(duì)的研究主題對(duì)該團(tuán)隊(duì)主題演變的科學(xué)影響。團(tuán)隊(duì)之間主題的交互影響被建模為圖,通過(guò)部署圖注意力網(wǎng)絡(luò)獲得其他團(tuán)隊(duì)對(duì)該團(tuán)隊(duì)的主題影響。給定科研團(tuán)隊(duì)在第t年的研究主題表示hti,htj,htk,htl。將它建模為圖G=(V,E)。其中V表示團(tuán)隊(duì)的集合,即hti,htj,htk,htl。E是邊的集合,每條邊表示團(tuán)隊(duì)的研究主題間的交互影響。
團(tuán)隊(duì)i的主題影響h_GATti聚合了其他團(tuán)隊(duì)的研究主題,團(tuán)隊(duì)i的主題影響計(jì)算公式如(4)和(5)式所示。
eij=aT([Whti]‖[Whtj])(4)
h_GATti=σ(∑j∈Niexp(Relu(eij))∑k∈Niexp(Relu(eik))·Whtj)(5)
其中W是線性變換權(quán)重矩陣,a是注意力權(quán)重向量。Ni是與團(tuán)隊(duì)i在同一領(lǐng)域的其他團(tuán)隊(duì)。
3.2.3 科研團(tuán)隊(duì)的研究主題趨勢(shì)預(yù)測(cè)
連接領(lǐng)域內(nèi)科研團(tuán)隊(duì)i的主題表示hti和領(lǐng)域內(nèi)科研團(tuán)隊(duì)i的主題影響h_GATti,將其輸入softmax預(yù)測(cè)器,得到科研團(tuán)隊(duì)i在第t+1年預(yù)測(cè)主題詞的分布t+1i,計(jì)算公式如(6)式所示。
t+1i=softmax(Wo[hti;h_GATti]+bo)(6)
使用歸一化多項(xiàng)式邏輯損失作為損失函數(shù),最小化預(yù)測(cè)主題詞分布t+1i和目標(biāo)主題詞分布pt+1i的KL散度。損失函數(shù)和KL散度的計(jì)算公式如(7)和(8)式所示。通過(guò)最小化一個(gè)領(lǐng)域內(nèi)所有科研團(tuán)隊(duì)的研究主題序列的損失來(lái)實(shí)現(xiàn)科研團(tuán)隊(duì)的主題預(yù)測(cè)最優(yōu)化。
loss=∑s∈{i,j,k,l}∑Tt=1KL(t+1s‖pt+1s)(7)
KL(t+1s‖pt+1s)=∑jt+1s,jlog
t+1s,jpt+1s,j(8)
3.3 科研團(tuán)隊(duì)精準(zhǔn)立體畫(huà)像生成方法
科研團(tuán)隊(duì)精準(zhǔn)立體畫(huà)像包含三部分:科研團(tuán)隊(duì)簡(jiǎn)介、團(tuán)隊(duì)合作關(guān)系圖構(gòu)建、科研團(tuán)隊(duì)研究主題預(yù)測(cè)。為每個(gè)部分設(shè)計(jì)了模板,科研團(tuán)隊(duì)簡(jiǎn)介模板主要包括科研團(tuán)隊(duì)總?cè)藬?shù)、科研團(tuán)隊(duì)的主要研究領(lǐng)域、團(tuán)隊(duì)負(fù)責(zé)人主持項(xiàng)目數(shù)、團(tuán)隊(duì)項(xiàng)目總數(shù)、發(fā)表論文總數(shù)、被引用次數(shù)、團(tuán)隊(duì)發(fā)表的會(huì)議論文數(shù)、期刊論文數(shù);團(tuán)隊(duì)合作關(guān)系圖模板包括團(tuán)隊(duì)負(fù)責(zé)人與科研團(tuán)隊(duì)之間的合作關(guān)系以及之間的師徒關(guān)系、團(tuán)隊(duì)成員所屬機(jī)構(gòu)及學(xué)科;研究團(tuán)隊(duì)主題模板將科研團(tuán)隊(duì)研究主題及主題趨勢(shì)以主題詞云的形式展示。
科研團(tuán)隊(duì)識(shí)別模塊識(shí)別出科研團(tuán)隊(duì)負(fù)責(zé)人及科研團(tuán)隊(duì)成員的基本信息,包含科研團(tuán)隊(duì)人員的姓名、所屬機(jī)構(gòu)、研究方向、團(tuán)隊(duì)負(fù)責(zé)人及團(tuán)隊(duì)成員的主持基金信息、科研論文成果、論文被引信息。統(tǒng)計(jì)分析科研團(tuán)隊(duì)的基本信息生成科研團(tuán)隊(duì)簡(jiǎn)介,通過(guò)團(tuán)隊(duì)負(fù)責(zé)人及團(tuán)隊(duì)成員的碩博論文信息挖掘科研團(tuán)隊(duì)負(fù)責(zé)人及成員之間的合作關(guān)系及師徒關(guān)系?;诳蒲袌F(tuán)隊(duì)研究主題預(yù)測(cè)出科研團(tuán)隊(duì)的研究主題未來(lái)趨勢(shì),通過(guò)科研團(tuán)隊(duì)研究主題及主題趨勢(shì)生成研究主題及主題趨勢(shì)詞云圖。綜合科研團(tuán)隊(duì)簡(jiǎn)介、科研團(tuán)隊(duì)合作關(guān)系圖、科研團(tuán)隊(duì)研究主題及主題趨勢(shì),生成科研團(tuán)隊(duì)精準(zhǔn)立體畫(huà)像。
4 實(shí)驗(yàn)驗(yàn)證分析
4.1 數(shù)據(jù)集
搜集從2011年到2020年10年間通信領(lǐng)域的科技論文44164篇作為實(shí)驗(yàn)數(shù)據(jù)集。每條數(shù)據(jù)包括科技論文的標(biāo)題、摘要、所屬項(xiàng)目名稱、作者、作者所在的單位等字段。獲得的數(shù)據(jù)如果存在無(wú)效數(shù)據(jù)的問(wèn)題,如無(wú)作者、單作者論文數(shù)據(jù),則將此類數(shù)據(jù)刪除,刪除無(wú)效數(shù)據(jù)后,剩余有效的科技論文43242篇。科研團(tuán)隊(duì)識(shí)別的前提是對(duì)作者數(shù)據(jù)進(jìn)行消歧,而作者消歧需要與機(jī)構(gòu)數(shù)據(jù)結(jié)合,對(duì)機(jī)構(gòu)數(shù)據(jù)進(jìn)行清洗,對(duì)作者數(shù)據(jù)進(jìn)行清洗。獲取的數(shù)據(jù)中作者信息包括中文作者及英文作者,對(duì)于英文數(shù)據(jù)采取作者名字、機(jī)構(gòu)與中文數(shù)據(jù)進(jìn)行對(duì)齊的方式將其轉(zhuǎn)化為統(tǒng)一的中文作者以方便后續(xù)處理。
4.2 科研團(tuán)隊(duì)識(shí)別
構(gòu)建整體科研合著網(wǎng)絡(luò)。從整體合著網(wǎng)絡(luò)中提取出作者發(fā)文量最小閾值為10、作者合著頻次最小閾值為5的合著網(wǎng)絡(luò)作為初始科研合著網(wǎng)絡(luò),計(jì)算所有節(jié)點(diǎn)的中間中心度排名,選取出排名最高的學(xué)者作為科研團(tuán)隊(duì)負(fù)責(zé)人。將該學(xué)者從合著網(wǎng)絡(luò)中刪除,繼續(xù)計(jì)算中間中心度排名,基于迭代的中間中心度排名方法通過(guò)反復(fù)迭代選擇團(tuán)隊(duì)負(fù)責(zé)人,通過(guò)循環(huán)計(jì)算中間中心度值排名,每次只抽取排名最高的節(jié)點(diǎn)作為團(tuán)隊(duì)負(fù)責(zé)人,然后從網(wǎng)絡(luò)中剔除該節(jié)點(diǎn),繼續(xù)進(jìn)行迭代計(jì)算,直到剩下節(jié)點(diǎn)的中間中心度值不大于1,獲得較好的科研團(tuán)隊(duì)負(fù)責(zé)人識(shí)別結(jié)果。
以基于迭代的中間中心度方法識(shí)別出的科研團(tuán)隊(duì)負(fù)責(zé)人作為基點(diǎn),在初始合著網(wǎng)絡(luò)中選取與團(tuán)隊(duì)負(fù)責(zé)人有合著關(guān)系的結(jié)點(diǎn)集合,利用2-派系方法在整體科研合著網(wǎng)絡(luò)中識(shí)別出團(tuán)隊(duì)的核心科研人員,在整體合著網(wǎng)絡(luò)中以科研團(tuán)隊(duì)的團(tuán)隊(duì)負(fù)責(zé)人、核心成員的各個(gè)作者為頂點(diǎn),使用滾雪球的方式向下滾動(dòng)一層,獲得該科研團(tuán)隊(duì)的非核心成員。識(shí)別出了5個(gè)科研團(tuán)隊(duì)并統(tǒng)計(jì)了5個(gè)科研團(tuán)隊(duì)的詳細(xì)信息如表2所示。表2給出了識(shí)別出的5個(gè)科研團(tuán)隊(duì)中每個(gè)團(tuán)隊(duì)的團(tuán)隊(duì)人數(shù)、研究領(lǐng)域、團(tuán)隊(duì)項(xiàng)目數(shù)、發(fā)表論文數(shù)、被引次數(shù)、師徒關(guān)系對(duì)數(shù)。
4.3 科研團(tuán)隊(duì)研究主題預(yù)測(cè)的有效性分析
將基于圖注意力網(wǎng)絡(luò)的科研團(tuán)隊(duì)主題融合的主題趨勢(shì)預(yù)測(cè)算法GATP與經(jīng)典的時(shí)間序列預(yù)測(cè)方法ARIMA[33]、基于遞歸神經(jīng)網(wǎng)絡(luò)的研究主題預(yù)測(cè)方法LSTM、DARNN[34]、DSTP[35]進(jìn)行比較。采用時(shí)間序列預(yù)測(cè)任務(wù)中的評(píng)價(jià)指標(biāo)RMSE、precision@n(簡(jiǎn)記為p@n,n表示預(yù)測(cè)的主題詞的數(shù)目)對(duì)主題預(yù)測(cè)性能進(jìn)行評(píng)價(jià)。表3~表5給出了GATP算法及其對(duì)比算法在識(shí)別出的5個(gè)科研團(tuán)隊(duì)上的RMSE值、平均RMSE值、主題預(yù)測(cè)準(zhǔn)確率、主題預(yù)測(cè)平均準(zhǔn)確率。
表3是提出的基于圖注意力網(wǎng)絡(luò)的科研團(tuán)隊(duì)主題融合的主題趨勢(shì)預(yù)測(cè)算法GATP和對(duì)比的預(yù)測(cè)方法在識(shí)別出的通信領(lǐng)域的5個(gè)科研團(tuán)隊(duì)的科研成果數(shù)據(jù)集上的主題預(yù)測(cè)性能RMSE值和平均RMSE值。從表中可以看出,經(jīng)典的主題預(yù)測(cè)算法ARIMA的主題預(yù)測(cè)性能RMSE值和平均RMSE值是最大的,基于循環(huán)神經(jīng)網(wǎng)絡(luò)的主題預(yù)測(cè)模型LSTM、DARNN和DSTP的主題預(yù)測(cè)性能RMSE值和平均RMSE值低于ARIMA。GATP在所有科研團(tuán)隊(duì)上的RMSE值和平均RMSE值都是最小的。這說(shuō)明提出的方法通過(guò)模型的訓(xùn)練將預(yù)測(cè)的主題詞分布無(wú)限與科研團(tuán)隊(duì)的目標(biāo)主題詞分布逼近,實(shí)現(xiàn)了主題預(yù)測(cè)性能RMSE值的最小化。
表4是提出的基于圖注意力網(wǎng)絡(luò)的科研團(tuán)隊(duì)主題融合的主題趨勢(shì)預(yù)測(cè)算法GATP和對(duì)比的主題預(yù)測(cè)方法在科研團(tuán)隊(duì)1、2、3上的主題預(yù)測(cè)準(zhǔn)確率。從表4可以看出,提出的主題預(yù)測(cè)算法GATP的主題預(yù)測(cè)準(zhǔn)確率超過(guò)了經(jīng)典的預(yù)測(cè)模型ARIMA以及基于循環(huán)神經(jīng)網(wǎng)絡(luò)的主題預(yù)測(cè)模型?;谘h(huán)神經(jīng)網(wǎng)絡(luò)的主題預(yù)測(cè)模型LSTM、DARNN、DSTP方法在科研團(tuán)隊(duì)1上的主題預(yù)測(cè)準(zhǔn)確率高于ARIMA的主題預(yù)測(cè)準(zhǔn)確率,而在科研團(tuán)隊(duì)2、3上的主題預(yù)測(cè)準(zhǔn)確率比ARIMA的預(yù)測(cè)準(zhǔn)確率低。說(shuō)明基于循環(huán)神經(jīng)網(wǎng)絡(luò)的主題預(yù)測(cè)模型LSTM、DARNN、DSTP在科研團(tuán)隊(duì)1、2、3上的主題預(yù)測(cè)性能不穩(wěn)定,不適合科研團(tuán)隊(duì)1、2、3的主題預(yù)測(cè)。GATP算法在科研團(tuán)隊(duì)1、2、3上都達(dá)到了最好的預(yù)測(cè)性能。
表5是GATP算法和比較的主題預(yù)測(cè)方法在科研團(tuán)隊(duì)4、5的主題預(yù)測(cè)準(zhǔn)確率和在5個(gè)團(tuán)隊(duì)上的平均預(yù)測(cè)準(zhǔn)確率。表5的實(shí)驗(yàn)結(jié)果顯示了與表4類似的趨勢(shì)?;谏窠?jīng)網(wǎng)絡(luò)的主題預(yù)測(cè)方法LSTM、DARNN、DSTP在科研團(tuán)隊(duì)4、5上的預(yù)測(cè)準(zhǔn)確率不如ARMIA。通過(guò)表4與表5的實(shí)驗(yàn)結(jié)果得出結(jié)論,基于循環(huán)神經(jīng)網(wǎng)絡(luò)的主題預(yù)測(cè)方法LSTM、DARNN、DSTP在各個(gè)科研團(tuán)隊(duì)的主題預(yù)測(cè)準(zhǔn)確率是不穩(wěn)定的。GATP實(shí)現(xiàn)了最好的主題預(yù)測(cè)性能,而且穩(wěn)定性較高,說(shuō)明提出的GATP主題預(yù)測(cè)方法,通過(guò)部署圖注意力網(wǎng)絡(luò)融合相同研究領(lǐng)域內(nèi)其他團(tuán)隊(duì)對(duì)某團(tuán)隊(duì)的主題影響,實(shí)現(xiàn)了團(tuán)隊(duì)主題的主題趨勢(shì)預(yù)測(cè),表現(xiàn)出了最佳的主題預(yù)測(cè)性能,驗(yàn)證了所提方法的有效性。
5 科研團(tuán)隊(duì)精準(zhǔn)立體畫(huà)像生成
選擇識(shí)別的科研團(tuán)隊(duì)1,構(gòu)建該團(tuán)隊(duì)的精準(zhǔn)立體畫(huà)像。獲取該團(tuán)隊(duì)的團(tuán)隊(duì)負(fù)責(zé)人及團(tuán)隊(duì)成員的信息,基于該科研團(tuán)隊(duì)的統(tǒng)計(jì)信息,形成團(tuán)隊(duì)簡(jiǎn)介。生成科研團(tuán)隊(duì)1的團(tuán)隊(duì)簡(jiǎn)介為:團(tuán)隊(duì)共5人,主要研究領(lǐng)域?yàn)橥ㄐ排c信息系統(tǒng)。該團(tuán)隊(duì)負(fù)責(zé)人主持項(xiàng)目5項(xiàng),團(tuán)隊(duì)項(xiàng)目數(shù)12項(xiàng),發(fā)表論文420篇,論文被引用576次。團(tuán)隊(duì)共發(fā)表會(huì)議論文96篇,期刊論文302篇?;谠摽蒲袌F(tuán)隊(duì)的統(tǒng)計(jì)信息,獲取團(tuán)隊(duì)成員間的指導(dǎo)關(guān)系,構(gòu)建科研團(tuán)隊(duì)合作關(guān)系圖。基于科研團(tuán)隊(duì)主題預(yù)測(cè)模塊從該科研團(tuán)隊(duì)的科研成果中抽取研究主題,形成研究主題詞云,采用提出的GATP算法預(yù)測(cè)科研團(tuán)隊(duì)的主題趨勢(shì),形成主題趨勢(shì)詞云。科研團(tuán)隊(duì)合作關(guān)系圖和科研團(tuán)隊(duì)研究主題詞云圖如圖3和圖4所示。
科研團(tuán)隊(duì)合作關(guān)系圖展示了團(tuán)隊(duì)負(fù)責(zé)人與科研團(tuán)隊(duì)成員之間的合作關(guān)系以及之間的師徒關(guān)系,并展示了科研團(tuán)隊(duì)負(fù)責(zé)人及科研團(tuán)隊(duì)成員所屬的機(jī)構(gòu)及學(xué)科。科研團(tuán)隊(duì)研究主題詞云圖展示該科研團(tuán)隊(duì)的研究主題及未來(lái)研究主題趨勢(shì)。
6 結(jié)論與啟示
本文針對(duì)科研團(tuán)隊(duì)精準(zhǔn)立體畫(huà)像構(gòu)建的現(xiàn)實(shí)需求以及現(xiàn)有的科研團(tuán)隊(duì)畫(huà)像的研究現(xiàn)狀,圍繞科研團(tuán)隊(duì)識(shí)別、科研團(tuán)隊(duì)研究主題預(yù)測(cè)、科研團(tuán)隊(duì)精準(zhǔn)立體畫(huà)像生成,提出了面向科技大數(shù)據(jù)的科研團(tuán)隊(duì)精準(zhǔn)立體畫(huà)像生成方法。在科研團(tuán)隊(duì)的研究主題趨勢(shì)預(yù)測(cè)方面,科研團(tuán)隊(duì)的研究主題趨勢(shì)受該團(tuán)隊(duì)的研究主題的影響以及相同領(lǐng)域其他科研團(tuán)隊(duì)的研究主題的影響,因此在預(yù)測(cè)科研團(tuán)隊(duì)的研究主題時(shí),提出了基于圖注意力網(wǎng)絡(luò)的科研團(tuán)隊(duì)主題融合的主題趨勢(shì)預(yù)測(cè)算法,通過(guò)融合其他團(tuán)隊(duì)主題的關(guān)聯(lián)信息,提高了科研團(tuán)隊(duì)研究主題預(yù)測(cè)的準(zhǔn)確性。在科研團(tuán)隊(duì)畫(huà)像構(gòu)建方面,抽取了科研團(tuán)隊(duì)的研究主題,將科研團(tuán)隊(duì)的研究主題及主題趨勢(shì)通過(guò)詞云的方式展示出來(lái),進(jìn)而為科研管理部門(mén)提供項(xiàng)目決策支持。
參 考 文 獻(xiàn):
[1]Yao X, Zhang C, Qu Z. Global village or virtual balkans? Evolution and performance of scientific collaboration in the information age[J]. Journal of the Association for Information Science and Technology, 2020, 71(4): 395-408.
[2]Li W, Jia Y, Du J. Variance-constrained state estimation for nonlinearly coupled complex networks[J]. IEEE Transactions on Cybernetics, 2017, 48(2): 818-824.
[3]Meng D, Jia Y, Du J, et al.. High-precision formation control of nonlinear multi-agent systems with switching topologies: a learning approach[J]. International Journal of Robust and Nonlinear Control, 2015, 25(13): 1993-2018.
[4]Lariviere V, Desrochers N, Macaluso B, et al.. Contributorship and division of labor in knowledge production[J]. Social Studies of Science, 2016, 46(3), 417-435.
[5]王偉.基于學(xué)術(shù)大數(shù)據(jù)的科學(xué)家合作行為分析與挖掘[D].大連:大連理工大學(xué),2010.
[6]Wei X, Du J, Liang M, et al.. Boosting deep attribute learning via support vector regression for fast moving crowd counting[J]. Pattern Recognition Letters, 2019, 119: 12-23.
[7]Meng D, Jia Y, Du J, et al.. Stability analysis of continuous-time iterative learning control systems with multiple state delays[J]. Acta Automatica Sinica, 2010, 36(5): 696-703.
[8]莫君蘭,竇永香,開(kāi)慶.基于多源異構(gòu)數(shù)據(jù)的科研團(tuán)隊(duì)畫(huà)像的構(gòu)建[J].情報(bào)理論與實(shí)踐,2020,43(9):100-106.
[9]劉行兵,翟亞超,柴斌,等.基于 AHP 模型的協(xié)同創(chuàng)新科研團(tuán)隊(duì)畫(huà)像的構(gòu)建[J].科技管理研究,2021,(19):136-140.
[10]Kou F, Du J, He Y, et al.. Social network search based on semantic analysis and learning[J]. CAAI Transactions on Intelligence Technology, 2016, 1(4): 293-302.
[11]Kou F, Du J, Yang C, et al.. Hashtag recommendation based on multi-features of microblogs[J]. Journal of Computer Science and Technology, 2018, 33(4): 711-726.
[12]于永勝,董誠(chéng),韓紅旗,等.基于社會(huì)網(wǎng)絡(luò)分析的科研團(tuán)隊(duì)識(shí)別方法研究——基于迭代的中間中心度排名方法識(shí)別科研團(tuán)隊(duì)領(lǐng)導(dǎo)人[J].情報(bào)理論與實(shí)踐,2018,41(7):105-110.
[13]Zhao H, Liu Q, Zhu H, et al.. A sequential approach to market state modeling and analysis in online p2p lending[J]. IEEE Transactions on Systems, Man, and Cybernetics-Systems, 2017, 48(1): 21-33.
[14]Sun B, Du J, Gao T. Study on the improvement of k-nearest-neighbor algorithm[A]. The 2009 International Conference on Artificial Intelligence and Computational Intelligence[C]. IEEE, Shang Hai, 2009. 390-393.
[15]Hu W, Gao J, Li B, et al.. Anomaly detection using local kernel density estimation and context-based regression[J]. IEEE Transactions on Knowledge and Data Engineering, 2018, 32(2): 218-233.
[16]Liang Y, Jia Y, Du J, et al.. Vector field guidance for three-dimensional curved path following with fixed-wing UAVs[A]. The 2015 American Control Conference[C]. Institute of Electrical and Electronics Engineers Inc, 2015. 1187-1192.
[17]Meng D, Jia Y, Du J. Multi-agent iterative learning control with communication topologies dynamically changing in two directions[J]. IET Control Theory & Applications, 2013, 7(2): 261-270.
[18]Cao J, Mao D, Cai Q, et al.. A review of object representation based on local features[J]. Journal of Zhejiang University Science, 2013, 14(7): 495-504.
[19]Meng D, Jia Y, Du J. Stability of varying two-dimensional roesser systems and its application to iterative learning control convergence analysis[J]. IET Control Theory & Applications, 2015, 9(8): 1221-1228.
[20]Kou F, Du J, Lin Z, et al.. A semantic modeling method for social network short text based on spatial and temporal characteristics[J]. Journal of Computational Science, 2018, 28: 281-293.
[21]Chen W, Li Y, Yu J. Construction and evaluation of the safety risk factors of the urban utility tunnel based on the social network analysis[J]. Journal of Safety and Environment, 2020, 20(5): 1652-1660.
[22]王曰芬,楊雪,余厚強(qiáng),等.人工智能科研團(tuán)隊(duì)的合作模式及其對(duì)比研究[J].圖書(shū)情報(bào)工作,2020,64(20):14-21.
[23]Xue Z, Du J, Du D, et al.. Deep low-rank subspace ensemble for multi-view clustering[J]. Information Sciences, 2019, 482: 210-227.
[24]李綱,李春雅,李翔.基于社會(huì)網(wǎng)絡(luò)分析的科研團(tuán)隊(duì)發(fā)現(xiàn)研究[J].圖書(shū)情報(bào)工作,2014,58(7):63-70.
[25]Prabhakaran V, William L, McFarland D. Predicting the rise and fall of scientific topics from trends in their rhetorical framing[A]. Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics[C]. Association for Computational Linguistics, Berlin, 2016. 1170-1180.
[26]Li Y, Pu Q, Li S, et al.. Machine learning methods for research highlight prediction in biomedical effects of nanomaterial application[J]. Pattern Recognition Letters, 2019, 117: 111-118.
[27]Tesfamariam M, Yemisrach G, Sergey V. Towards predicting trend of scientific research topics using topic modeling[A]. Proceedings of the 7th International Young Scientist Conference on Computational Science[C]. Elsevier B.V., 2018. 304-310.
[28]Lu Z, Tan H, Li W. An evolutionary context-aware sequential model for topic evolution of text stream[J]. Information Sciences, 2019, 473: 166-177.
[29]Liang Z, Maoa J, Luc K, et al.. Combining deep neural network and bibliometric indicator for emerging research topic prediction[J]. Information Processing & Management, 2021, 58(5): 1-18.
[30]張壯,馮小年,錢(qián)鐵云.基于多模態(tài)融合技術(shù)的用戶畫(huà)像方法[J].北京大學(xué)學(xué)報(bào),2020,56(1):105-111.
[31]袁莎,唐杰,顧曉韜.開(kāi)放互聯(lián)網(wǎng)中的學(xué)者畫(huà)像技術(shù)綜述[J].計(jì)算機(jī)研究與發(fā)展,2018,55(9):1903-1919.
[32]顧曉韜.開(kāi)放互聯(lián)網(wǎng)中的研究者畫(huà)像[D].北京:清華大學(xué),2017.
[33]Hadi A, Amin K, Orkun K. ARIMA-based decoupled time series forecasting of electric vehicle charging demand for stochastic power system operation[J]. Electric Power Systems Research, 2016, 140: 378-390.
[34]Qin Y, Song D, Chen H, et al.. A dual-stage attention-based recurrent neural network for time series prediction[A]. Proceedings of the 26th International Joint Conference on Artificial Intelligence[C]. International Joint Conferences on Artificial Intelligence Press, Melbourne, VIC, 2017. 2627-2633.
[35]Qin Y, Chen D, Xiang S, et al.. Gated dual attention unit neural networks for remaining useful life prediction of rolling bearings[J]. IEEE Transactions on Industrial Informatics, 2020, 17(9): 6438-6447.