劉立?豐洪才
摘要:針對(duì)教育視頻內(nèi)容的復(fù)雜性,本文主要探討如何解決在教育領(lǐng)域里快速、準(zhǔn)確地檢索所需的視頻內(nèi)容的問題。文中從分析視頻結(jié)構(gòu)入手,介紹了基于內(nèi)容的視頻檢索技術(shù)以及其優(yōu)勢(shì)。檢索效果顯示該技術(shù)在教育教學(xué)領(lǐng)域中有一定的應(yīng)用價(jià)值,豐富了教學(xué)方式,學(xué)生對(duì)其認(rèn)可度較高。
關(guān)鍵詞:視頻;基于內(nèi)容的視頻檢索技術(shù);教育;教學(xué);學(xué)生
一、引言
近年來,計(jì)算機(jī)網(wǎng)絡(luò)和多媒體技術(shù)得到了迅猛發(fā)展,視頻作為主要的多媒體信息載體,已經(jīng)成為互聯(lián)網(wǎng)中重要的數(shù)據(jù)類型,且在安全監(jiān)控和視頻網(wǎng)站中得到了廣泛應(yīng)用。與文本、音頻和圖像相比,視頻因其豐富的信息量和直觀體驗(yàn)已成為主要的信息來源。每天有數(shù)以百萬計(jì)的視頻被上傳到互聯(lián)網(wǎng)上,傳統(tǒng)的信息檢索主要依靠人工標(biāo)注的方式,但這種方式無論是在網(wǎng)絡(luò)帶寬占用量、資源定位時(shí)間開銷還是用戶的使用習(xí)慣等方面都存在不足。面對(duì)海量的視頻數(shù)據(jù),僅通過添加文本標(biāo)簽描述的形式對(duì)視頻進(jìn)行基于關(guān)鍵詞匹配的檢索已無法滿足人們的需求,于是基于內(nèi)容的視頻檢索(Content Based Video Retrieval, CBVR)技術(shù)橫空出世。CBVR是通過對(duì)視頻數(shù)據(jù)從低層到高層進(jìn)行處理、分析和理解的過程,根據(jù)視頻的內(nèi)容及上下文關(guān)系獲取其內(nèi)容,并根據(jù)內(nèi)容進(jìn)行檢索[1]。
教育是人類社會(huì)發(fā)展的一個(gè)重要領(lǐng)域,現(xiàn)代教育正日益重視科技創(chuàng)新。視頻技術(shù)所帶來的改變也已經(jīng)開始影響傳統(tǒng)教學(xué)方法。然而,隨著視頻資源井噴式增長,如何更有效地挖掘其價(jià)值成為一個(gè)關(guān)鍵問題。因此,本文將探討視頻檢索技術(shù)在教育中的應(yīng)用。
二、基于內(nèi)容的視頻檢索技術(shù)
視頻是由一系列靜態(tài)圖像幀按時(shí)間或空間順序排布得到的圖像集。作為一種交互性強(qiáng)的媒體,視頻具有內(nèi)容豐富和邏輯性強(qiáng)的特點(diǎn)。近年來,視頻在采集、存儲(chǔ)、傳輸和回放等方面取得了顯著進(jìn)展。從20世紀(jì)90年代后期開始,國際社會(huì)開始對(duì)視頻檢索技術(shù)進(jìn)行研究?;趦?nèi)容的視頻檢索一直是國內(nèi)外研究者關(guān)注的熱點(diǎn)問題,已經(jīng)取得了一定的研究成果。代表性的系統(tǒng)之一是由IBM公司研發(fā)的QBIC(按圖像內(nèi)容查詢)系統(tǒng),它是一個(gè)功能齊全的視頻檢索系統(tǒng),在視頻檢索領(lǐng)域具有重要意義。另外,Video Q系統(tǒng)改進(jìn)了傳統(tǒng)的基于主題和關(guān)鍵詞的檢索方法,使用戶能夠通過視覺特征和視頻序列中的時(shí)空關(guān)系進(jìn)行視頻檢索。在我國,對(duì)視頻檢索的研究起步較晚,技術(shù)水平相對(duì)落后。近年來,國內(nèi)研究學(xué)者開始重視視頻檢索系統(tǒng)中相對(duì)較少的問題,并且在基于內(nèi)容的視頻搜索技術(shù)方面取得了許多成果。其中代表性的系統(tǒng)包括Ifind系統(tǒng)、New VideoCAR系統(tǒng)和TV-FI系統(tǒng)。
(一)基本概念
視頻的視覺信息通過每一幀圖像來表達(dá),而每一幀圖像又由一系列連續(xù)的幀組成,而鏡頭則是由一組連續(xù)拍攝的幀序列構(gòu)成的。關(guān)鍵幀是能夠準(zhǔn)確反映和體現(xiàn)一個(gè)鏡頭或整個(gè)視頻內(nèi)容的圖像幀。關(guān)鍵幀提取是一種從視頻幀集合中發(fā)現(xiàn)并消除重復(fù)幀的技術(shù)。在鏡頭分割之后,可以根據(jù)鏡頭的內(nèi)容選取一定數(shù)量的關(guān)鍵幀建立視頻索引,這對(duì)于視頻的索引、檢索和瀏覽非常重要。而場(chǎng)景則是由在時(shí)間上相鄰并具有相似視覺屬性的鏡頭所組成的。場(chǎng)景檢測(cè)的主要目的是描述視頻中具有語義的事件。場(chǎng)景檢測(cè)也被稱為鏡頭聚類,它關(guān)注的是在時(shí)間上的連續(xù)性以及在內(nèi)容上的相似性。通過對(duì)鏡頭進(jìn)行聚類,可以將視頻分割成不同的場(chǎng)景,從而方便進(jìn)行進(jìn)一步的視頻分析和處理。
(二)關(guān)鍵技術(shù)
CBVR包含了特征提取與匹配技術(shù)、鏡頭邊緣檢測(cè)技術(shù)(Shot Edge Detection)[2]、關(guān)鍵幀提取技術(shù)(Key Frame Extraction)[3]、場(chǎng)景分割(Scene Segmentation)[4]、視頻摘要(Video Summary)[5]等技術(shù)。
CBVR工作過程如下:
第一步:將視頻流轉(zhuǎn)化成幀圖像,并保存到視頻數(shù)據(jù)庫中。
第二步:解決如何有效地組織視頻信息等關(guān)鍵問題。將視頻分割成多個(gè)視頻片段并描述每個(gè)片段的特殊性是組織視頻信息的方法之一。視頻鏡頭分割(鏡頭邊緣檢測(cè))的主要目標(biāo)是檢測(cè)出鏡頭的邊緣,即將一段視頻分割成若干獨(dú)立的鏡頭。其分割技術(shù)的關(guān)鍵在于確定鏡頭邊界。鏡頭邊界主要依據(jù)鏡頭之間的明顯特征差異確定,即如果相鄰兩幀的差異超出了設(shè)定閾值,則說明存在鏡頭邊界(分割點(diǎn))。鏡頭變化有突變和漸變兩種方式,突變是指從一個(gè)鏡頭直接切換到下一個(gè)鏡頭,沒有使用任何編輯手段;漸變(緩變)是指鏡頭之間通過某種過渡方式緩慢地切換到下一個(gè)鏡頭,該變化過程一般在幾幀或幾十幀之間完成。鏡頭檢測(cè)的準(zhǔn)確性將直接影響視頻語義標(biāo)注和后續(xù)瀏覽、檢索效果。
第三步:關(guān)鍵幀是指視頻序列中最能準(zhǔn)確反映和體現(xiàn)一個(gè)鏡頭甚至整個(gè)視頻內(nèi)容的圖像幀。它是將視頻轉(zhuǎn)換為圖像的關(guān)鍵環(huán)節(jié),也是保證視頻索引、檢索和瀏覽的重要前提,同時(shí)也是形成視頻摘要的重要方式之一。
第四步:視頻特征提取與匹配,在視頻檢索過程中,從視頻中提取一些圖像特征與視覺感受保持一致,通常采用特征向量表示相應(yīng)的圖像。特征提取是視頻幀分析與識(shí)別的前提,是高維視頻數(shù)據(jù)簡(jiǎn)化表達(dá)的有效方式。而視頻幀的特征匹配是通過比較特征向量的相似性來判斷視頻幀的相似程度,實(shí)質(zhì)上是計(jì)算各特征向量之間的距離[6]。常用計(jì)算相似度的方法有:歐式距離、絕對(duì)值距離、切氏距離、名氏距離、最值相似系數(shù)等。
第五步:輸出視頻檢索結(jié)果,將特征最相近的視頻幀返回給用戶。
CBVR對(duì)于視頻的存儲(chǔ)、處理、檢索和傳輸有重要的意義。
三、基于內(nèi)容的視頻檢索技術(shù)在教學(xué)的應(yīng)用
當(dāng)下中國教育信息化正邁向全面轉(zhuǎn)型提升的階段,基于視頻的課堂實(shí)錄、直播與視頻的混合學(xué)習(xí)也在層出不窮,這不僅激發(fā)了學(xué)生的興趣,同時(shí)也拓寬了教育信息傳播渠道,豐富了教學(xué)內(nèi)容呈現(xiàn)形式,給學(xué)生帶來了多感官的體驗(yàn)視頻已經(jīng)成為教學(xué)活動(dòng)展示的主要形式,傳播教學(xué)理念的重要載體。視頻可以把豐富的網(wǎng)絡(luò)資源與課本上的知識(shí)進(jìn)行有機(jī)結(jié)合,這不斷加速推進(jìn)教育模式的創(chuàng)新,還擴(kuò)展了傳統(tǒng)課堂的知識(shí)容量。特別是在疫情時(shí)代,國內(nèi)各級(jí)各類學(xué)校開啟了一場(chǎng)史無前例的在線教育活動(dòng),視頻作為現(xiàn)代教學(xué)改革的重要載體,對(duì)教育資源的整合與強(qiáng)化起到了重要的作用。但當(dāng)前的教育視頻資源數(shù)量巨大且以分散狀態(tài)存在,不少教育視頻依然存在加工粗糙、導(dǎo)航不明確等不利于教育持續(xù)發(fā)展的因素。
傳統(tǒng)視頻教材大多以“課”作為單位進(jìn)行錄制,具有整體性、封閉性等特點(diǎn),但這忽略了學(xué)生的使用體驗(yàn),學(xué)生很難獲取個(gè)性化、專業(yè)化的信息資源,限制了視頻中價(jià)值的發(fā)揮。而基于內(nèi)容的視頻檢索技術(shù)通過有效地管理視頻資源并查找其中的重要信息,使得高效、準(zhǔn)確地進(jìn)行視頻內(nèi)容檢索成為可能。這也帶動(dòng)了教育視頻價(jià)值的提升,解決了我國教育信息化發(fā)展中存在的建設(shè)成本高、信息化效果不突出等一系列問題。具體體現(xiàn)如下:
(一)加快教學(xué)視頻的瀏覽、查詢和檢索
人類社會(huì)的知識(shí)生產(chǎn)與傳播模式一直在發(fā)生變化,當(dāng)今社會(huì)正處于信息傳播“碎片化”的時(shí)代,傳統(tǒng)媒體傳播效果與體驗(yàn)感都不如視頻。視頻的優(yōu)點(diǎn)是視覺感強(qiáng),且簡(jiǎn)單易懂。有研究表明人類在接受信息時(shí),視覺的接受率為83%,而聽覺的接受率只有13%。視頻將教育知識(shí)方便、快捷地送達(dá)到學(xué)生手中,減少學(xué)生獲取知識(shí)的時(shí)間,這拓寬了信息傳播的渠道,提高了學(xué)生的信息獲取能力,也加快了信息轉(zhuǎn)化為知識(shí)的進(jìn)程[7]。學(xué)生獲取知識(shí)的方式已經(jīng)不再局限于傳統(tǒng)方法,因此通過視頻可以解決由于知識(shí)和技術(shù)缺乏而制約學(xué)生發(fā)展的問題,促進(jìn)宣傳和普及。與此同時(shí),教育視頻的數(shù)據(jù)量也呈指數(shù)級(jí)增長,如何在較短時(shí)間內(nèi)從海量且參差不齊的教學(xué)視頻庫中提取出最佳的學(xué)習(xí)材料,改善學(xué)習(xí)效果,一直困擾著眾多學(xué)者。傳統(tǒng)的視頻查找方式通常是通過快進(jìn)來查找內(nèi)容,而利用CBVR(Content-Based Video Retrieval,基于內(nèi)容的視頻檢索)中的鏡頭分割技術(shù)能夠有效地檢測(cè)出鏡頭的邊緣,將一段段冗長的教學(xué)視頻分割成若干獨(dú)立的鏡頭。精準(zhǔn)地定位鏡頭的分割點(diǎn),減少了學(xué)習(xí)者檢索的時(shí)間,提高了教學(xué)視頻的檢索效率。該技術(shù)不僅便捷了師生對(duì)視頻資源的獲取方式,更能優(yōu)化視頻資源的利用效果,為教學(xué)帶來更多的可能性和靈活性。
(二)提高教學(xué)視頻檢索的精度
基于內(nèi)容的視頻檢索技術(shù)通過對(duì)視頻內(nèi)容進(jìn)行分析和處理,能夠提高教學(xué)視頻檢索的精度。傳統(tǒng)的視頻檢索技術(shù)主要是基于文本信息的檢索,但是對(duì)于一些復(fù)雜的視頻內(nèi)容,僅僅通過文本信息的檢索是無法準(zhǔn)確地找到所需要的內(nèi)容。CBVR則能夠從視頻中提取出各種基于視覺和語義的特征,并據(jù)此建立索引,使得視頻檢索的精度更高,從而能夠更準(zhǔn)確地滿足學(xué)生對(duì)于教學(xué)資源的需求。
視頻具有靜態(tài)特性和動(dòng)態(tài)特性。靜態(tài)特性是指圖像幀的原始屬性,主要是從顏色、紋理、形狀、大小等視覺特征來體現(xiàn)。通過分析比較視頻圖像的靜態(tài)特征,可以區(qū)別于其他圖像的特征。動(dòng)態(tài)特征是視頻獨(dú)有的屬性,主要是視頻中的物體運(yùn)動(dòng)或攝像機(jī)的運(yùn)動(dòng)引起,反映了視頻動(dòng)態(tài)的時(shí)域變化。
CBVR會(huì)自動(dòng)獲取視頻的特征,然后根據(jù)這些特征進(jìn)行查找。查找的過程中,直接對(duì)獲得的幀進(jìn)行分類是不現(xiàn)實(shí)的。原因在于:一是視頻的數(shù)據(jù)量巨大,需要占用較多的存儲(chǔ)空間,這就難以滿足用戶實(shí)時(shí)性要求;二是視頻中可能包含許多與識(shí)別無關(guān)的信息。因此,必須對(duì)視頻幀進(jìn)行有效的特征提取和選擇,以簡(jiǎn)化被識(shí)別幀數(shù)據(jù),提高視頻的識(shí)別率。通過比較特征向量的相似性來判斷視頻幀的相似度?;趦?nèi)容的視頻檢索技術(shù)對(duì)教學(xué)視頻進(jìn)行分析,選擇相應(yīng)的特征,然后利用這些特征建立索引進(jìn)行檢索。用戶只需提供教學(xué)視頻的片段信息,CBVR采用一種近似匹配的方法逐步求精來獲得查詢和檢索結(jié)果,可以實(shí)現(xiàn)視頻內(nèi)容的自動(dòng)標(biāo)注和分類,并與特定主題或教學(xué)目標(biāo)進(jìn)行關(guān)聯(lián),這避免了采用傳統(tǒng)檢索方法所帶來的不確定性。例如,學(xué)生要學(xué)習(xí)計(jì)算機(jī)組裝與維護(hù)技術(shù),可以給出一段類似的示例視頻或提取的圖像幀作為范例。系統(tǒng)就可以根據(jù)例子檢索出類似的視頻段,學(xué)生可以通過觀看操作視頻漸進(jìn)地掌握計(jì)算機(jī)組裝與維護(hù)的技術(shù)。這項(xiàng)技術(shù)為教學(xué)提供了更多有效的視頻資料,實(shí)現(xiàn)了以應(yīng)用能力為本的培養(yǎng)形式,提高了學(xué)生理論聯(lián)系實(shí)際的綜合素質(zhì)。
(三)實(shí)現(xiàn)對(duì)教學(xué)視頻功能的挖掘與價(jià)值提升
教育視頻內(nèi)容分析包括感知理解、認(rèn)知理解和情緒理解這三個(gè)方面[8]。感知理解主要從人物動(dòng)作、表情、語言等方面理解視頻內(nèi)容,已經(jīng)有許多學(xué)者利用視頻技術(shù)評(píng)估學(xué)生在課堂中的注意力、參與度和是否存在異常行為等方面。教師可以通過學(xué)生的聽課狀態(tài)來判斷他們是否積極主動(dòng)地參與課堂活動(dòng),是否能夠跟上教師的教學(xué)進(jìn)度。然而,聽課狀態(tài)需要通過分析學(xué)生的行為來獲取。
當(dāng)一個(gè)學(xué)生玩手機(jī)、睡覺、嬉戲聊天、吃東西等時(shí),往往表示該學(xué)生對(duì)學(xué)習(xí)內(nèi)容感到困惑;學(xué)生的課堂行為也是多變的,因此需要實(shí)時(shí)監(jiān)測(cè)學(xué)生的聽課狀態(tài),以獲得及時(shí)的教學(xué)效果反饋。視頻檢索技術(shù)中的目標(biāo)檢測(cè)可以較好地檢測(cè)學(xué)生的課堂行為,為調(diào)整教學(xué)方法和評(píng)估課堂效果提供依據(jù)。這種方式關(guān)注學(xué)生的學(xué)習(xí)狀態(tài)??梢詫⑷四樧R(shí)別的結(jié)果與學(xué)生日常行為表現(xiàn)、成長記錄情況結(jié)合起來,這為形成教學(xué)過程性評(píng)價(jià)提供了參考依據(jù)。
認(rèn)知理解較直觀感知需要更高層次的抽象,它是在感知理解的基礎(chǔ)上對(duì)視頻內(nèi)容進(jìn)行抽象實(shí)現(xiàn)更高層語義理解[9]。目前,學(xué)者們正在不斷探索認(rèn)知理解。在教學(xué)中,教師和學(xué)生可以根據(jù)對(duì)視頻的語義理解來檢索視頻媒體。基于內(nèi)容的視頻分析可以提取視頻的語義信息,構(gòu)建從底層特征到高層語義之間的橋梁,最終形成符合人類思維形式的信息檢索方式。
教育過程不僅僅局限于認(rèn)知層面的教育,情感教育是教育過程中的重要組成部分。它旨在培養(yǎng)學(xué)生的情感能力、道德品質(zhì)、社交能力等,使學(xué)生在認(rèn)知上得到提升的同時(shí),也能在情感上得到鍛煉和提升。近年來,人們?cè)絹碓蕉嗟卦诟鞣N網(wǎng)絡(luò)平臺(tái)上以文字、圖片、視頻等方式表達(dá)個(gè)人情感,通過視頻來挖掘用戶的情感已成為當(dāng)前的研究熱點(diǎn)。目前,情緒的感知主要通過觀察法、人物表情識(shí)別法、行為分析法以及傳感器生理信號(hào)分析法等方式進(jìn)行。與其他情緒感知方式相比,視頻感知只需要攝像頭即可完成,操作簡(jiǎn)單且可行性高。通過從視頻序列中分離出特定的表情狀態(tài),可以判斷學(xué)生的學(xué)習(xí)情緒。情緒對(duì)學(xué)習(xí)的影響主要表現(xiàn)為影響學(xué)習(xí)者的認(rèn)知和記憶,良好的情緒有助于增加學(xué)習(xí)者積極選擇的注意程度[10]。激發(fā)學(xué)習(xí)者積極情緒并調(diào)節(jié)認(rèn)知投入度。視頻因其表現(xiàn)形式豐富,能夠承載更多的情感特征。通過視頻進(jìn)行情感分析的主要研究任務(wù)是圍繞視頻中的人物對(duì)象進(jìn)行建模,并檢測(cè)人物的面部、身體姿勢(shì)或與情緒相關(guān)的視覺特征進(jìn)行情感分析。這包括以下幾個(gè)步驟:首先提取視頻的關(guān)鍵幀,將動(dòng)態(tài)視頻轉(zhuǎn)化為靜態(tài)幀,然后對(duì)這一系列的視頻幀進(jìn)行處理,提取具有代表性的幀,最后使用分類器對(duì)視頻數(shù)據(jù)進(jìn)行情感分析。通過挖掘?qū)W生在教學(xué)活動(dòng)中的情感傾向,幫助教師了解真實(shí)的教學(xué)情況,進(jìn)而改善教學(xué)效果[11]?;谝曨l的教學(xué)情感分析是一種通過自然語言處理技術(shù)來分析視頻中教學(xué)內(nèi)容和教師的情感狀態(tài)的方法。這種方法可以有效地衡量學(xué)生對(duì)視頻教學(xué)的看法和情感反應(yīng),幫助教師更好地了解學(xué)生的需求并作出相應(yīng)的調(diào)整?;谝曨l的教學(xué)情感分析可以發(fā)揮以下作用:
①評(píng)估教學(xué)質(zhì)量和提高教學(xué)效果通過對(duì)教學(xué)材料的情感分析,教育工作者可以對(duì)教學(xué)過程和效果進(jìn)行評(píng)估和分析,并有針對(duì)性地調(diào)整教學(xué)策略,提高學(xué)生的興趣和學(xué)習(xí)效果。
②優(yōu)化教材內(nèi)容和設(shè)計(jì):情感分析可以幫助教育工作者提高教材的可讀性和理解性,優(yōu)化教學(xué)設(shè)計(jì),使教材更適合學(xué)生的需求和興趣。
③提高師生互動(dòng)效果:情感分析可以幫助教育工作者更好地了解學(xué)生的情感反應(yīng),進(jìn)一步改善師生關(guān)系和提高師生互動(dòng)效果。
④提高學(xué)生的學(xué)習(xí)體驗(yàn)和滿意度:通過情感分析,教育工作者可以更好地滿足學(xué)生的需求,提高學(xué)生的學(xué)習(xí)體驗(yàn)和學(xué)習(xí)滿意度。
⑤推動(dòng)教育教學(xué)科技創(chuàng)新:基于內(nèi)容的教學(xué)情感分析涉及自然語言處理、圖像處理、機(jī)器學(xué)習(xí)等多種技術(shù)和工具的應(yīng)用和整合,可以推動(dòng)教育教學(xué)科技創(chuàng)新,促進(jìn)教育教學(xué)的持續(xù)發(fā)展。
(四)減輕視頻存儲(chǔ)負(fù)擔(dān)
隨著MOOC、在線學(xué)習(xí)網(wǎng)站等教育視頻數(shù)據(jù)的急劇增加,海量的教育視頻數(shù)據(jù)需要分析與理解,這給用戶實(shí)現(xiàn)快速查找造成了極大的困擾?;趦?nèi)容的視頻檢索技術(shù)可以通過智能的搜索和推薦算法,自動(dòng)化地整合和挖掘視頻資源,使得教師和學(xué)生可以更加方便地獲取所需的教學(xué)視頻資源。該技術(shù)還能夠提高視頻制作的效率和質(zhì)量,因?yàn)榛趦?nèi)容的視頻檢索技術(shù)可以自動(dòng)標(biāo)注和分類視頻內(nèi)容,用戶就不必通過一遍遍瀏覽視頻文件的方式來查找所需要的視頻,從而減輕了視頻存儲(chǔ)的負(fù)擔(dān)。基于內(nèi)容的視頻檢索技術(shù)為教育視頻制作提供參考和準(zhǔn)確的數(shù)據(jù)支持,這能夠幫助視頻制作者更快地了解用戶需求和教學(xué)目標(biāo),從而更好地制作出符合需求和品質(zhì)的教育視頻。
四、結(jié)束語
教育的現(xiàn)代化是教育變革的重要趨勢(shì),視頻作為教育現(xiàn)代化的重要手段,能有效地促進(jìn)學(xué)習(xí)者參與學(xué)習(xí)活動(dòng)、理解學(xué)習(xí)內(nèi)容、掌握學(xué)習(xí)技能[12]。在教學(xué)理論的指導(dǎo)下,應(yīng)用基于內(nèi)容的視頻檢索技術(shù)于教育領(lǐng)域,既符合教育信息化的要求,又優(yōu)化了知識(shí)傳播的形式,從而促進(jìn)教學(xué)質(zhì)量的提升。未來還可以從視頻在線互動(dòng)學(xué)習(xí)、在線資源開發(fā)等方向進(jìn)行深入的研究,推動(dòng)教育向智能化、多模態(tài)化的發(fā)展。
參考文獻(xiàn)
[1]胡志軍,徐勇.基于內(nèi)容的視頻檢索綜述[J].計(jì)算機(jī)科學(xué),2020,47(01):117-123.
[2] Bouyahi Mohamed,Ben Ayed Yassine. Multimodal Features for Shots Boundary Detection[J]. THIRTEENTH INTERNATIONAL CONFERENCE ON MACHINE VISION (ICMV 2020),2021,11605.
[3] Sun Yunyun,Li Peng,Jiang Zhaohui,Hu Sujun. Feature fusion and clustering for key frame extraction.[J]. Mathematical biosciences and engineering : MBE,2021,18(6).
[4]Dai Cheng,Liu Xingang,Yang Laurence T.,Ni Minghao,Ma Zhenchao,Zhang Qingchen,Deen M. Jamal. Video Scene Segmentation Using Tensor-Train Faster-RCNN for Multimedia IoT Systems[J]. IEEE INTERNET OF THINGS JOURNAL,2021,8(12).
[5]李群,肖甫,張子屹等.基于空時(shí)變換網(wǎng)絡(luò)的視頻摘要生成[J].軟件學(xué)報(bào),2022,33(09):3195-3209.
[6]劉立.基于視頻內(nèi)容檢索關(guān)鍵技術(shù)在水果病蟲害檢測(cè)中的應(yīng)用[D].武漢輕工大學(xué),2022.
[7]胡水星.教育數(shù)據(jù)挖掘及其教學(xué)應(yīng)用實(shí)證分析[J].現(xiàn)代遠(yuǎn)距離教育,2017(04):29-37.
[8]繆裕青,董晗,張萬楨等.一種多任務(wù)學(xué)習(xí)的跨模態(tài)視頻情感分析方法[J/OL].計(jì)算機(jī)工程與應(yīng)用:1-8[2023-03-08].http://kns.cnki.net/kcms/detail/11.2127.tp.20220422.1637.012.html.
[9]王萍.人工智能在教育視頻中的應(yīng)用分析與設(shè)計(jì)[J].電化教育研究,2020,41(03):93-100+121.
[10]黃歡,孫力娟,曹瑩等.基于注意力的短視頻多模態(tài)情感分析[J].圖學(xué)學(xué)報(bào),2021,42(01):8-14.
[11]歐陽元新,王樂天,李想等.教育領(lǐng)域反饋文本情感分析方法及應(yīng)用研究[J].計(jì)算機(jī)教育,2020(06):80-84.
[12]況姍蕓,黃潤梅,盧昀等.基礎(chǔ)教育信息化教學(xué)實(shí)踐現(xiàn)狀分析與推進(jìn)建議——基于“部級(jí)優(yōu)課”視頻課例的調(diào)查[J].中國電化教育,2018(09):61-68.