• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于知識關(guān)聯(lián)的多層本體立方體設(shè)計與實現(xiàn)

    2022-01-07 07:01:10劉政昊
    現(xiàn)代情報 2022年1期

    劉政昊

    摘?要:[目的/意義]結(jié)合金融證券行業(yè)特征,借鑒層次式設(shè)計思路和數(shù)據(jù)立方體概念,提出多層領(lǐng)域本體立方體模型并完成構(gòu)建。[方法/過程]復(fù)用FBIO本體進行知識建模;利用LDA主題建模與BIRCH層次聚類完成概念提取;基于依存句法和深度學(xué)習框架的知識抽取完成本體實例擴充;通過維度分類和基于概率的實體空間向量表示增強語義關(guān)聯(lián)性。[結(jié)果/結(jié)論]多層構(gòu)建方式和立方體結(jié)構(gòu)增加了知識內(nèi)在關(guān)聯(lián),為金融概念知識提供多層次、細粒度的知識組織方式;也為本體構(gòu)建提供新的思路。

    關(guān)鍵詞:多層領(lǐng)域本體;本體立方體;金融證券;知識關(guān)聯(lián);層次聚類;知識抽取

    DOI:10.3969/j.issn.1008-0821.2022.01.008

    〔中圖分類號〕G254?〔文獻標識碼〕A?〔文章編號〕1008-0821(2022)01-0072-15

    Abstract:[Purpose/Significance]Based on the characteristics of financial securities industry,a multilevel domain ontology cube model was proposed and constructed by referring to the concept of hierarchical design and data cube.[Method/Process]FBIO was used ontology for knowledge modeling;LDA topic modeling and Birch hierarchical clustering were used to complete concept extraction.Ontology instance expansion was completed by knowledge extraction based on dependency syntax and deep learning framework.Semantic relevance was enhanced through dimension classification and probabilistic entity space vector representation.[Result/Conclusion]The multi-level structure and the cube structure increased the internal correlation of knowledge,and provided a multi-level and fine-grained knowledge organization mode for financial concept knowledge.It also provides new ideas for ontology construction.

    Key words:multilayer domain ontology;ontology cube;financial securities;knowledge association;hierarchical clustering;knowledge extraction

    金融是現(xiàn)代經(jīng)濟的核心。隨著經(jīng)濟全球化進程的加速,各金融機構(gòu)間的關(guān)聯(lián)日趨緊密,各細分行業(yè)產(chǎn)生的海量數(shù)據(jù)關(guān)聯(lián)也趨于多樣化,金融市場已成為開放、互聯(lián)的復(fù)雜巨系統(tǒng)[1]。金融科技概念的興起也引發(fā)了金融行業(yè)新一輪的技術(shù)革命,在國家大數(shù)據(jù)戰(zhàn)略背景下,金融大數(shù)據(jù)發(fā)揮了重要的價值[2-5]。然而,金融行業(yè)積累的豐富數(shù)據(jù)資源在給加速金融行業(yè)轉(zhuǎn)型升級帶來新的機遇的同時也引發(fā)了新的問題。在證券行業(yè),由于業(yè)務(wù)、產(chǎn)品、客戶多模塊線條需要統(tǒng)一布局,存在著數(shù)據(jù)多源異構(gòu)且稀疏性強、知識動態(tài)性和關(guān)聯(lián)性顯著等特點[6],加之證券投資領(lǐng)域知識體系本就紛繁復(fù)雜,這無疑增加了投研人員和投資者的認知和分析成本,從長遠來看,也不利于證券行業(yè)的數(shù)字化和智能化發(fā)展。因而,如何對金融知識進行有效組織與關(guān)聯(lián)以提高金融領(lǐng)域知識的利用效率,已成為學(xué)術(shù)界與業(yè)界共同關(guān)注的熱點問題。

    本體(Ontology)作為一種能在語義和知識層次上描述多源異構(gòu)知識的建模工具,被認為是大數(shù)據(jù)環(huán)境下解決“信息和知識孤島問題”的最佳方法[7-8]。領(lǐng)域本體(Domain Ontology)是對具體專業(yè)領(lǐng)域內(nèi)知識的概括與集合,不僅定義領(lǐng)域內(nèi)基本概念,還覆蓋各個概念之間的關(guān)系,提供該領(lǐng)域內(nèi)的重要術(shù)語及理論、實例和相互關(guān)系領(lǐng)域活動等[9]?;陬I(lǐng)域本體的知識表示與組織保證知識理解的唯一性,同時能夠適應(yīng)涉及的知識領(lǐng)域多樣性以及語義關(guān)系復(fù)雜性的特點[10]。

    領(lǐng)域本體的構(gòu)建方法一直是當前本體研究熱點,傳統(tǒng)的人工構(gòu)建方法需要領(lǐng)域?qū)<业慕槿?,成本較高且難以復(fù)用[11-12]。隨著人工智能的發(fā)展,越來越多基于深度學(xué)習的自動化構(gòu)建方法受到了學(xué)者們廣泛關(guān)注[13-16]。本文以金融證券行業(yè)為例,提出了一種能夠多維度表征知識概念的本體立方體結(jié)構(gòu)框架,首先對概念進行主題建模和層次聚類,構(gòu)建概念間層級關(guān)系;然后基于信息抽取方法和技術(shù),對大量的非結(jié)構(gòu)化語料進行有效的實體和關(guān)系抽取,并依據(jù)概念間的語義相似性進行維度分類,從而構(gòu)建起實例本體立方體結(jié)構(gòu),為實現(xiàn)金融知識的有效關(guān)聯(lián)與融合提供了理論模型支持,同時也為領(lǐng)域本體構(gòu)建方法提供了新的實現(xiàn)思路。

    1?相關(guān)研究

    1.1?領(lǐng)域本體構(gòu)建方法與技術(shù)

    隨著人工智能第三次熱潮的到來,本體概念頻繁地被人工智能與知識工程領(lǐng)域所提及。目前,領(lǐng)域本體的構(gòu)建方法與技術(shù)已經(jīng)相對成熟。早在2003年,歐盟信息社會技術(shù)方案委員會就通過研究本體構(gòu)建的36種方法,分析了以文本、字典、知識庫及半結(jié)構(gòu)化圖表為數(shù)據(jù)源的領(lǐng)域本體構(gòu)建技術(shù)、方法與工具[17]。同時期中國科學(xué)院則致力于研究形式化本體在領(lǐng)域知識的復(fù)用和共享中的作用以及領(lǐng)域知識復(fù)用的虛擬領(lǐng)域本體的構(gòu)建方法與技術(shù)[18],并取得了一定成果。隨著對領(lǐng)域本體構(gòu)建研究的深入,越來越多的學(xué)者試圖通過不同的技術(shù)和方法對不同領(lǐng)域進行本體建模。

    在以統(tǒng)計學(xué)習為主的構(gòu)建技術(shù)中,自然語言處理、信息檢索等技術(shù)被廣泛應(yīng)用在領(lǐng)域本體構(gòu)建的各個模塊,如國外學(xué)者Shih C W等[19]的基于詞匯共現(xiàn)與合并的水結(jié)晶模型(Crystallizing Model);Sanchez D等[20]的基于核心動詞挖掘技術(shù);國內(nèi)研究者鄭姝雅等[21]面向用戶生成內(nèi)容的術(shù)語抽取技術(shù);鄧詩琦等[22]面向智能應(yīng)用的應(yīng)用驅(qū)動循環(huán)技術(shù)等。這些技術(shù)的基本思想都是利用詞匯單元的共現(xiàn)信息識別它們的關(guān)系并應(yīng)用在概念和關(guān)系抽取中,構(gòu)建過程注重應(yīng)用關(guān)聯(lián)規(guī)則挖掘等淺層語義,雖然一定程度上提高了構(gòu)建效率,但準確率低下,難以擴展和復(fù)用。此外,Shamsfard M等[23]在調(diào)研中發(fā)現(xiàn),領(lǐng)域本體的構(gòu)建中多數(shù)研究仍主要關(guān)注層次關(guān)系(Hierarchical Relation),對于非層次關(guān)系的抽取與表示常常無能為力,因此僅采用統(tǒng)計學(xué)習為主的技術(shù)構(gòu)建的本體維度略顯單一,只適合體系較為單一明確且知識關(guān)聯(lián)特征不明顯的領(lǐng)域。

    與統(tǒng)計學(xué)習技術(shù)相對應(yīng)的語言學(xué)構(gòu)建技術(shù)則更加注重對深層語義的理解與分析,因此語義字典、語義模板等被應(yīng)用在實際的領(lǐng)域本體構(gòu)建中。國外學(xué)者Zouaq A等[24]提出了一種基于深度語義分析與圖論方法結(jié)合的領(lǐng)域本體構(gòu)建方法;Lee C S等[25]在構(gòu)建過程中利用語形學(xué)的概念構(gòu)建了概念間的關(guān)系,同時結(jié)合領(lǐng)域?qū)<覍Ω拍詈完P(guān)系進行了修正;國內(nèi)學(xué)者劉萍等[26]基于語言學(xué)的方法對領(lǐng)域本體構(gòu)建的概念抽取和關(guān)系識別進行了綜述分析,并認為深度語義和知識關(guān)聯(lián)特征需要多源異構(gòu)數(shù)據(jù)融合和概念語義增強理解才能實現(xiàn)?;谡Z言學(xué)的方法可以在一定程度上解決術(shù)語多含義的問題并降低關(guān)系識別的誤差和丟失,從而獲得更高性能和更加權(quán)威的本體知識,但是由于領(lǐng)域知識的高度復(fù)雜性和動態(tài)性,僅靠語言學(xué)主導(dǎo)的領(lǐng)域本體構(gòu)建在實際應(yīng)用中依舊會受到較大的限制。

    1.2?金融領(lǐng)域本體建模

    本體作為一種能夠在語義和知識層次上描述信息系統(tǒng)的建模工具,被廣泛應(yīng)用于各領(lǐng)域的知識表示與關(guān)聯(lián)中。在特定的金融領(lǐng)域中,好的本體模型作為金融知識表示的模式層可以很大程度上滿足金融行業(yè)對數(shù)據(jù)質(zhì)量和語義關(guān)聯(lián)嚴謹性的需求[27],因此也受到該領(lǐng)域?qū)W界業(yè)界的廣泛關(guān)注?,F(xiàn)有的金融本體中最為知名的是美國企業(yè)數(shù)據(jù)管理委員會(Enterprise Data Management Council,EDM Council)主導(dǎo),通過眾包方式構(gòu)建的FIBO(Financial Industry Business Ontology)。FIBO作為領(lǐng)域本體,定義了金融基本概念(FBC)、金融指標(IND)、金融實體(BE)、證券和股票(SEC)以及貸款(LOAN)等領(lǐng)域內(nèi)的實體及其關(guān)系,并且在構(gòu)建中也運用了層級化的思想。然而,F(xiàn)IBO尚處于本體開發(fā)周期的初級階段[28],主要對基本術(shù)語進行規(guī)范和共享,對金融知識的關(guān)聯(lián)表現(xiàn)一般。Browne O等[29]對FIBO進行了擴展,將以前未映射的股票和債券納入其中,并開發(fā)了數(shù)據(jù)管理框架,但這一改進只部分解決了數(shù)據(jù)交換的問題,多層次語義無法關(guān)聯(lián)的問題依舊存在。

    此外,Ren R等[30]基于金融新聞庫構(gòu)建了特定金融領(lǐng)域本體,該本體試圖存儲所有與金融新聞相關(guān)的重要信息,其語義表達能力較強,但由于缺乏規(guī)范性的構(gòu)建流程,本體涉及的范圍邊界模糊、收集的概念顆粒度不適當,難以大規(guī)模運用;Yang B[31]提出物流金融風險本體論OntoLFR,并構(gòu)建了物流金融風險本體論模型,以適應(yīng)風險在預(yù)警和事前控制中的可變性、復(fù)雜性和關(guān)聯(lián)性,雖然該本體構(gòu)建目的明確,但領(lǐng)域知識的揭示需要借助來自上層的知識體系及相關(guān)領(lǐng)域的大量概念,而該模型沒有提供規(guī)范化的標準,難以與相關(guān)領(lǐng)域集成;強韶華等[32]基于本體的規(guī)則推理技術(shù)和案例推理技術(shù)構(gòu)建了金融事件本體,并建立基于本體的主題事件案例庫設(shè)計案例推理(CBR)表示、檢索與重用,其優(yōu)點在于融合了金融輿情數(shù)據(jù)并考慮了本體推理,但其在金融領(lǐng)域?qū)傩栽O(shè)計、基于本體的CBR+RBR關(guān)聯(lián)模型設(shè)計上均存在一定的缺陷,并且本體案例庫的設(shè)計規(guī)模較小,存在與實際應(yīng)用脫節(jié)的問題。

    綜合現(xiàn)有研究可以發(fā)現(xiàn),雖然領(lǐng)域本體的構(gòu)建方法和應(yīng)用趨于多元化,但是由于知識系統(tǒng)的復(fù)雜性,在對領(lǐng)域異構(gòu)知識的共享與重構(gòu)時,未能很好地完成信息的廣泛組織和有效關(guān)聯(lián)。目前的領(lǐng)域本體構(gòu)建思路偏重于專業(yè)性和針對性,但依舊存在本體難以服用和集成、概念體系不規(guī)范等問題,而且忽略了本體作為一種可共享的概念集合所應(yīng)當具備的通用性與集成性。在金融領(lǐng)域,本體對于金融知識組織和表示具有很強的指導(dǎo)意義,但目前的構(gòu)建過程并不十分規(guī)范;此外,現(xiàn)有的金融本體中影響力較大的FIBO本體不完全適用于中國的金融體系,且該本體包含范圍太廣,并沒有聚焦于特定的細分領(lǐng)域,因此不能很好地刻畫細粒度的概念和知識。綜上,本文以金融證券領(lǐng)域為例,基于現(xiàn)有研究的不足,重點解決的核心問題是:如何利用和改進多層本體框架,構(gòu)建多層次、多維度的領(lǐng)域本體,提供一組具有正確類別、層級結(jié)構(gòu)和關(guān)聯(lián)關(guān)系的金融證券領(lǐng)域概念語料庫,以便更好地管理金融領(lǐng)域知識、支持經(jīng)濟決策。

    2?多層本體立方體模型設(shè)計

    2.1?概念定義

    在數(shù)據(jù)庫領(lǐng)域中,數(shù)據(jù)立方體是數(shù)據(jù)倉庫和聯(lián)機分析處理研究領(lǐng)域的一種核心數(shù)據(jù)模型,它可以多維度表征數(shù)據(jù)特征,現(xiàn)有的很多研究借鑒了這一思路,如Li J等[33]通過構(gòu)建語義—空間—時間數(shù)據(jù)立方體(Semantics-Space-Time Cube),探討了語義、空間和時間這3個異構(gòu)信息方面的相互關(guān)系,并得出文本語義隨時間和空間的變化規(guī)律;Esteban P E等[34]使用基于RDF數(shù)據(jù)立方體詞匯表的多維模型方法,向開放鏈接數(shù)據(jù)添加值,完成了數(shù)據(jù)多維度特征的分析;師智斌[35]則借助FCA理論,以形式化的概念和概念層次為基礎(chǔ)進行了高性能數(shù)據(jù)立方體及其語義研究。由此可見,數(shù)據(jù)立方體的本質(zhì)在于多維度、多刻面的特征表示。

    本體作為知識庫的表現(xiàn)形式之一,融合多維度信息可以從不同側(cè)面展示本體知識的隱含特征,因此可以利用數(shù)據(jù)立方體的結(jié)構(gòu)形式進一步豐富其語義表達的多維性和靈活性。本文依托數(shù)據(jù)立方體概念,將能夠多維表征關(guān)聯(lián)知識實例的本體模型定義為“本體立方體(Ontology Cube)”,具體定義如下:

    定義1:本體立方體(Ontology Cube)是指由維度構(gòu)建出來的多維知識表示和存儲空間,是一種為了滿足用戶從多角度多層次進行知識查詢和分析的需要而建立起來的基于事實和維的本體實例模型,其包含了所有要檢索分析的領(lǐng)域知識實例和關(guān)系,所有的關(guān)聯(lián)知識的操作都在立方體上進行。

    表1對數(shù)據(jù)立方體和本體立方體涉及的基本概念、存儲對象、主要解決的問題和典型應(yīng)用場景進行了詳細的對比介紹。

    2.2?構(gòu)建思想

    框架布局和層次設(shè)計是在復(fù)雜性概念和具有結(jié)構(gòu)特征的實例之間構(gòu)建關(guān)系系統(tǒng)的前提。金融證券行業(yè)是對信息高度敏感的行業(yè),也是信息源高度異構(gòu)、知識體系最為龐雜的代表行業(yè)之一,因此需要建立一種能夠多層次且多維度刻畫領(lǐng)域知識的本體結(jié)構(gòu),以便能夠?qū)崿F(xiàn)對復(fù)雜知識體系規(guī)范而明確的描述,從而增強概念間的語義關(guān)聯(lián)。對此提出以下構(gòu)建思想:

    1)借鑒由任守綱等提出的層次式領(lǐng)域本體模型[36],面向不同層次的知識體系并遵循自頂而下的本體構(gòu)建原則,構(gòu)建由基礎(chǔ)層、概念層和實例層構(gòu)成的3層領(lǐng)域本體模型。其中,位于基礎(chǔ)層的頂層本體提供了領(lǐng)域特征的普遍聯(lián)系,揭示了領(lǐng)域知識在更高語義層次上的關(guān)系,為概念層本體提供了底層抽象;概念層的概念本體作為銜接抽象概念與應(yīng)用實例的中間層次,能夠描述領(lǐng)域基本特征的明確化概念并針對領(lǐng)域核心知識類別進行規(guī)范化和明確化的表示;而應(yīng)用本體作為實例層,可以實現(xiàn)領(lǐng)域內(nèi)的具體實例集成表示。

    2)根據(jù)Zhang L L等的劃分依據(jù),將實例層的各金融實體劃分為行業(yè)、企業(yè)和內(nèi)部環(huán)境3個維度[37],形成本體立方體結(jié)構(gòu)。三者從不同的范圍和方向搭建了領(lǐng)域知識框架,其本身也作為類與類的關(guān)系(行業(yè)—企業(yè)關(guān)系、行業(yè)—內(nèi)部環(huán)境關(guān)系、企業(yè)—內(nèi)部環(huán)境關(guān)系)包含在本體之中。

    行業(yè)(Industry):“行業(yè)”維度或稱為“市場”維度,從宏觀層面描述金融證券相關(guān)實體、屬性及其關(guān)系。金融證券行業(yè)/市場的主要屬性包括名稱、行業(yè)經(jīng)營狀態(tài)、行業(yè)政策、行業(yè)能力(市場容量、輸出值和業(yè)內(nèi)的公司數(shù)量),行業(yè)財務(wù)指標、行業(yè)的生命周期(初創(chuàng)期、成長期、成熟期和衰退期)及行業(yè)系統(tǒng)性風險等。

    企業(yè)(Company):“企業(yè)”維度從中觀層面描述領(lǐng)域知識。其主要屬性包括公司或機構(gòu)名稱和數(shù)量,公司或機構(gòu)治理結(jié)構(gòu)的股權(quán)結(jié)構(gòu)、管理結(jié)構(gòu)、貿(mào)易聯(lián)盟結(jié)構(gòu),企業(yè)/機構(gòu)競爭合作,企業(yè)財務(wù)指標、公司的生命周期、企業(yè)外部風險等。其中企業(yè)財務(wù)指標是一個比較寬泛的概念,具有比較明顯的數(shù)值屬性。財務(wù)指標及其對應(yīng)的財務(wù)實體通常用來反映財務(wù)實體的狀態(tài)、變化和關(guān)系,其屬性包括更新頻率、時間、數(shù)據(jù)源等。

    內(nèi)部環(huán)境(Inner Environment):“內(nèi)部環(huán)境”維度則是從微觀層面進行知識表示。其主要屬性包括公司產(chǎn)品架構(gòu)、公司人員組織結(jié)構(gòu)、產(chǎn)品財務(wù)指標(包括增長階段、產(chǎn)能、銷售、價格等)、公司內(nèi)部文化(公司價值觀、公司戰(zhàn)略、公司理念等)以及企業(yè)內(nèi)部風險等。

    具體的多層本體立方體模型如圖1所示。在該模型中,基礎(chǔ)層和概念層不具有維度傾向性,僅具有層次關(guān)系;實例層本體則被定義為由行業(yè)—企業(yè)—內(nèi)部環(huán)境3個維度組成的立方體結(jié)構(gòu),其中由概念映射的實例集合可以構(gòu)成特定的子立方體,每個子立方體內(nèi)存儲著由概率值作為空間坐標的實體和關(guān)系。此外,所有概念和實體可跨層映射與關(guān)聯(lián)。

    3?多層金融股權(quán)本體立方體構(gòu)建

    3.1?研究框架

    本文依托前述多層本體立方體的設(shè)計思路和本體規(guī)范化構(gòu)建流程,分別從知識建模、知識挖掘、知識抽取和知識關(guān)聯(lián)的視角逐步完成多層、多維本體立方體的半自動化構(gòu)建,并提出如圖2所示的研究框架,具體研究步驟如下:

    1)數(shù)據(jù)獲取與預(yù)處理:獲取證券行業(yè)報告、企業(yè)研報及公告、財經(jīng)新聞短訊、證券領(lǐng)域?qū)I(yè)術(shù)語及相關(guān)學(xué)術(shù)文獻等多源異構(gòu)數(shù)據(jù),通過分詞、去停用詞等預(yù)處理形成初始語料庫。

    2)知識建模與表示:結(jié)合領(lǐng)域?qū)<抑R完成對描述通用知識特征的上層本體構(gòu)建,然后復(fù)用FIBO本體框架,并用OWL語言進行描述和建模。

    3)知識組織與挖掘:利用LDA模型對概念主題建模,并對概念進一步進行BIRCH層次聚類,在繼承上層本體的基礎(chǔ)上實現(xiàn)層次概念及關(guān)系的組織。

    4)知識抽取與擴展:首先基于依存句法實現(xiàn)知識實例的語義三元組抽取;而后針對特定的實體和關(guān)系利用FinBert深度學(xué)習預(yù)訓(xùn)練模型實現(xiàn)實體和關(guān)系的進一步抽取和擴充。

    5)知識關(guān)聯(lián)與融合:對概念和實例按構(gòu)建維度分類,并利用相似度算法計算語義相似性,以確定其空間位置;最后將3層本體立方體結(jié)構(gòu)聚合,完成證券本體立方體的構(gòu)建。

    3.2?知識建模:基礎(chǔ)層構(gòu)建

    上層本體可通過四元組O=(C,P,R,X)抽象化表示,其中C表示本體中概念集合,P表示概念屬性的集合,R表示概念間關(guān)系的集合,X則表示本體公理與規(guī)則集合。

    以證券領(lǐng)域為例,上層本體的基本概念集合可表示為C={金融主體,金融合約,事件,機構(gòu),指標,時間,空間}。其中金融主體是指參與金融活動的個體,如股東、法人、債權(quán)人等;金融合約是金融活動得以實施的憑證,如合約文書、口頭合約;事件特指在金融活動中金融主體或機構(gòu)參與的活動,如公司破產(chǎn)、對外投資等;機構(gòu)主要指從事金融服務(wù)業(yè)有關(guān)的金融中介機構(gòu),同時也包含政府機構(gòu)及合法存在的社會機構(gòu)等。此外,概念與概念之間除了is-a、is-part-of、is-kind-of、is-instance-of、is-attribute-of等繼承與依賴關(guān)系,還可以人為定義不同實體概念的關(guān)系,實現(xiàn)概念間的初步關(guān)聯(lián),如在企業(yè)—企業(yè)關(guān)系中,R企業(yè)={同業(yè)資金往來,控股,合作,競爭}。上層本體公理與規(guī)則X代表領(lǐng)域本體內(nèi)存在的事實,可以對本體內(nèi)類或者關(guān)系進行約束,如機構(gòu)、事件等屬于金融概念的范圍。在實際構(gòu)建與建模過程中,由于開發(fā)人員知識背景以及人力、時間的限制,將每一個相關(guān)的領(lǐng)域本體都進行構(gòu)建是不現(xiàn)實的;考慮到國外已經(jīng)構(gòu)建了成熟的金融領(lǐng)域本體且不同語言描述的本體在基本概念定義上大體相同,為提高本體構(gòu)建效率,研究復(fù)用了FIBO本體。FIBO本體雖然是領(lǐng)域本體,但主要關(guān)注金融全領(lǐng)域的普遍聯(lián)系[38],并涵蓋了證券子領(lǐng)域的通用概念、屬性與關(guān)系,可以指導(dǎo)上層本體的構(gòu)建。

    構(gòu)建上層本體的核心是完成對通用知識的表示,研究采用OWL語言完成通用概念的建模?;驹卦谥R表示過程中首先需要對信息資源和知識資源進行面向?qū)ο蟮某橄螅蕴崛「拍罴捌潢P(guān)系;其次需要按照OWL的語法要求構(gòu)建相應(yīng)的類(包括概念、屬性、關(guān)系等)并將類存儲在OWL類型聲明文檔中。

    在基礎(chǔ)層,OWL強大的表達能力還得到了許多概念構(gòu)造函數(shù)和公理的支持,除了可以通過“subClassOf”和“subPropertyOf”形成概念的層級結(jié)構(gòu),通過“domain”“range”“equivalentProperty”“hasValue”等描述概念間的約束關(guān)系外;還可以通過“equivalentClass”“sameAs”“inverseOf”形成語義關(guān)聯(lián)關(guān)系;通過“intersectionOf”“unionOf”等形成概念的邏輯組合;通過“uniqueProperty”“transitiveProperty”等實現(xiàn)概念及其關(guān)系的公理定義[39]。上述定義還為概念層和實例層的構(gòu)建提供了規(guī)范的表示框架,便于相關(guān)概念和實體的規(guī)范表示與擴充,從而從更高的語義層面指導(dǎo)概念層和實例層的設(shè)計與實現(xiàn)。

    3.3?知識挖掘:概念層構(gòu)建

    3.3.1?概念主題建模

    目前在金融領(lǐng)域,現(xiàn)有的結(jié)構(gòu)化語料尚未達到能夠構(gòu)建共享概念模型的程度,因此,利用主題建模的方式挖掘非結(jié)構(gòu)化文本信息有助于領(lǐng)域概念的識別。本文采用LDA主題模型構(gòu)建特征詞項,經(jīng)過聚類得到的特征詞可以為概念主題劃分和層級聚類奠定基礎(chǔ)。

    為保證文本來源的多樣性,并能夠從行業(yè)、企業(yè)和內(nèi)部環(huán)境的角度分別進行主題建模,本文爬取百度百科金融證券領(lǐng)域相關(guān)詞條325個,調(diào)用Tushare接口獲得上市公司簡介及主營業(yè)務(wù)4 270條,獲取公司研報及證券行業(yè)短訊共1 000條,此外還人工收集了350條專業(yè)術(shù)語解釋,共同作為主題建模的語料庫。

    在模型參數(shù)設(shè)置方面,采用專家咨詢法集合困惑度判斷法設(shè)定主題數(shù)K=5,learning_decay=0.7,learning_offset設(shè)為50,訓(xùn)練結(jié)果如表2所示。

    進一步地,利用pyLDAvis實現(xiàn)主題建??梢暬?,如圖3所示。圖中左側(cè)氣泡分布表示不同主題,圓圈大小代表每個主題的出現(xiàn)頻率,而主題間的位置遠近表達了主題接近性。距離越大,說明主題之間的差異性越高,困惑度也就越小。圖3右側(cè)則顯示了Topic1前30個特征詞。其中淺藍色表示該詞在整個文檔的權(quán)重,紅色表示該詞在當前主題中所占的權(quán)重。此外,超參數(shù)λ可以調(diào)節(jié)特征詞的顯示,λ越接近1表示該主題下更頻繁出現(xiàn)的詞與主題更相關(guān);λ越接近0則表示該主題下更特殊、更獨有的詞與主題更相關(guān)。

    3.3.2?概念層次聚類

    基于概念主題建模得到了大量的實體標志詞,然而各概念間的層次關(guān)系較為混亂,無法構(gòu)建出結(jié)構(gòu)清晰的概念本體模型?;诖?,在上層本體的框架基礎(chǔ)上利用LDA主題模型和語義特征構(gòu)建自定義特征詞典獲取具有代表性的特征詞,然后通過BIRCH聚類算法劃分領(lǐng)域內(nèi)概念的層次關(guān)系。BIRCH算法是一種增量的聚類方法,首先用自底向上的層次算法,然后用迭代的重定位來改進結(jié)果,且聚類效率很高。實驗的具體步驟如下:

    1)層次聚類。BIRCH聚類算法無需提前設(shè)定聚類數(shù)目,初始聚類結(jié)果設(shè)定為與前述主題相等的5個簇,如圖4(a)所示,可以看到此時概念間的父類子類關(guān)系并不明顯。為了能夠?qū)⒅黝}建模得到的詞向量達到較好的層次聚類效果,將得到的聚類數(shù)目最多的簇再次聚類,以此類推共迭代10次,圖4(b)展示了最后一次迭代的聚類結(jié)果。

    2)聚類評價。研究采用輪廓系數(shù)(Silhouette Coefficient)對聚類結(jié)果進行評價。如式(1)所示,輪廓系數(shù)S(i)結(jié)合內(nèi)聚度a(i)和分離度b(i)兩種因素,當S(i)趨近于1時,說明樣本i聚類越合理。最后一次迭代時的輪廓系數(shù)為0.4577,表明聚類結(jié)果已較為理想。

    3)層級與類別劃分。將詞向量對應(yīng)到具體的詞語,從最后一次的迭代結(jié)果開始向上追溯,根據(jù)每次的聚簇形狀,結(jié)合詞語所表達的概念范疇可大致劃分成3層概念集合(其中第0層繼承自上層本體,不包含在內(nèi)),具體的層級關(guān)系如表3所示。

    從表3可以發(fā)現(xiàn),基于上層本體框架的層級聚類能夠在一定程度上表征領(lǐng)域的層級關(guān)系,但由于金融領(lǐng)域的特殊性,各術(shù)語概念間的層級關(guān)系并不十分明顯,且概念間存在多種潛在的關(guān)聯(lián)關(guān)系如時空關(guān)聯(lián)、事件關(guān)聯(lián)等,導(dǎo)致BIRCH聚類效果并不突出;也正因如此,構(gòu)建多維度的本體立方體模型顯得十分必要。

    3.4?知識抽?。簩嵗龑訕?gòu)建

    實例層的應(yīng)用本體引用和繼承上層本體集成的模塊,并通過對概念本體的映射,實現(xiàn)領(lǐng)域內(nèi)的實例集成表示與本體擴充。然而,要構(gòu)建應(yīng)用本體需要對大量的證券領(lǐng)域?qū)嶓w和非層級關(guān)系進行抽取,傳統(tǒng)的語言學(xué)模板方法需要構(gòu)建大量的規(guī)則,雖然準確率較高,但不適應(yīng)數(shù)據(jù)量較大的情況;因此后來又陸續(xù)提出了基于句法分析的關(guān)系抽取和基于深度學(xué)習的監(jiān)督/半監(jiān)督關(guān)系抽取方法。本文先基于依存句法規(guī)則進行開放域三元組抽取,而后根據(jù)提取結(jié)果,借助深度學(xué)習框架完成限定域?qū)嶓w的輔助抽取,從而實現(xiàn)了應(yīng)用本體的進一步擴充。

    3.4.1?基于依存句法的開放域?qū)嶓w關(guān)系抽取

    依存句法分析(Dependency Parsing)能夠根據(jù)詞性及詞間的位置關(guān)系判斷句中各成分的語法依存關(guān)系,因此,基于依存句法的實體關(guān)系抽取主要依賴于句中的謂詞,當以謂詞為代表的關(guān)系中含有論元時,能夠提取出語義三元組。本文采用LTP自然語言處理工具實現(xiàn)多源文本數(shù)據(jù)的三元組有效提取,通過設(shè)置抽取規(guī)則,如表4所示,為擴充本體實例及其關(guān)系提供技術(shù)支持。

    對于抽取的結(jié)果,將表義模糊的實體和非表意關(guān)系進行人工剔除,最終得到32 627個實體及其關(guān)聯(lián)的1 928種語義關(guān)系,部分抽取結(jié)果如圖5所示。

    3.4.2?基于深度學(xué)習的限定域?qū)嶓w抽取

    開放域的抽取固然可以有效地擴充實體和關(guān)系,然而一方面由于獲取的頭尾實體及關(guān)系類型過多導(dǎo)致難以有效組織應(yīng)用本體結(jié)構(gòu);另一方面基于句法分析得到的實體雖然表義明確但過于冗長,且一些證券領(lǐng)域的專有名詞和公司名未能被很好地識別出來。對此特別對公司股票、組織機構(gòu)、人名地名、主營產(chǎn)品和風險事件進行了實體識別。

    本文將實體識別環(huán)節(jié)視為一個序列標注問題,通過BIO標注法對隨機抽取的2 000條文本進行人工標注,然后使用FinBERT+Bi-LSTM+CRF實體標注深度學(xué)習框架進行訓(xùn)練。具體來說,首先利用FinBERT預(yù)訓(xùn)練模型對詞向量進行訓(xùn)練,而后將生成詞向量通過與定義的實體標簽信息進行合并編碼作為輸入到Bi-LSTM模型加強詞性分析,捕捉前后文的雙向語義信息,最后通過CRF解碼完成命名實體識別任務(wù)。

    本文將實驗數(shù)據(jù)按照7∶1∶2分為訓(xùn)練集、開發(fā)集和測試集,設(shè)置learning rate=0.001,banch_size=32,epochs=20。最終的實驗結(jié)果如表5所示。

    上述結(jié)果可以看出,機構(gòu)名和公司名的識別效果較好,而風險識別結(jié)果較差,這與標注樣本的規(guī)范性和實體在文本中所占比例有關(guān)。研究對語料中未標注文本進行了實體抽取,人工去重和剔除錯誤結(jié)果后,共抽取出23 245個實體,完成了對領(lǐng)域?qū)嶓w的擴充。

    3.5?知識關(guān)聯(lián):多層本體立方體聚合

    3.5.1?文本分類與空間向量表示

    多層本體的聚合完成了多層次、細粒度的金融領(lǐng)域知識表示,但是對于證券領(lǐng)域內(nèi)大量跨層級實體和非層級關(guān)系的表征依舊顯得無能為力。比如“信用風險”在不同的語境下的風險對象可能是企業(yè)或個人,甚至可能是整個產(chǎn)業(yè)鏈;再如“合作”關(guān)系的主體可能涉及到不同層次下的金融主體與金融機構(gòu)。由此可見,概念本身的多義性決定了其能夠在不同維度表征不同含義,而并非只能劃歸到單一的維度或類別中。本體立方體可以將實體表示為基于概率的三維向量,從而加強語義關(guān)聯(lián)的能力。

    基于依存句法的三元組較好地保留了語境和語義信息,可以作為分類的原始語料。因此,研究將提取的語義三元組視為一個整體進行分類,并用概率表示頭實體和尾實體的分類結(jié)果;對于相同的實體,則取平均值作為最終的空間向量值。得到的結(jié)果將其進一步劃分在不同的子立方體內(nèi),完成實體的最終定位。

    在實驗中,依照2.2節(jié)的維度劃分情況將隨機抽取的8 000個三元組分為行業(yè)(市場)、企業(yè)和內(nèi)部環(huán)境3類,然后將數(shù)據(jù)按8∶2分為訓(xùn)練集和測試集。實驗采用Keras+Finbert深度學(xué)習框架完成分類任務(wù),設(shè)定banch size=16,epochs=5,采用Adam優(yōu)化器,實驗結(jié)果如表6所示。

    實驗結(jié)果表明,對于三元組的維度分類總體效果是符合預(yù)期的。在最后的預(yù)測任務(wù)中,直接用Softmax激活函數(shù)所表達的分類概率作為每個三元組的頭實體和尾實體的坐標值。例如三元組(渤海財險,簽訂,戰(zhàn)略合作協(xié)議)被分為“行業(yè)/企業(yè)/內(nèi)部環(huán)境”的概率分別為0.2365/0.7611/0.0024,那么頭實體“渤海財險”和尾實體“戰(zhàn)略合作協(xié)議”的相對坐標均為(0.2365,0.7611,0.0024),只是由于二者分屬不同的概念類別,因此被存儲在不同的子立方體中;再如(貴州茅臺,屬于,白酒行業(yè))這一三元組整體的輸出概率為0.0533/0.9446/0.0021,但由于頭尾實體在語料庫中均出現(xiàn)多次,所以二者最終的相對坐標以平均值的形式被表征出來。表7分別呈現(xiàn)了在語料庫中頭尾實體唯一(a)和不唯一(b)兩種情況下部分預(yù)測實例和基于概率的空間向量表示結(jié)果。

    3.5.2?多維本體關(guān)聯(lián)與融合

    三層本體通過語義數(shù)據(jù)映射模型將所有的概念和實體逐一映射、完全關(guān)聯(lián)。在構(gòu)建過程中,從上而下的構(gòu)建模式將知識元素映射到底層的實體、關(guān)系及屬性,大大增強了本體結(jié)構(gòu)的穩(wěn)定性與可擴展性;而在應(yīng)用過程中,自下而上的歸納與融合能夠逐步提煉出缺失的金融證券知識概念與關(guān)系模式,并能夠進一步利用語義數(shù)據(jù)映射補充至上層本體。此外,連接不同層級和不同子立方體之間的關(guān)系對于完整、多維的概念知識描述尤其重要?;诒?的實例及空間向量表示,圖6直觀展示了多層本體立方體的映射、關(guān)聯(lián)與融合結(jié)果。

    為了便于本體的存儲與可視化,研究選用本體構(gòu)建工具Protégé5.5.0版本對證券領(lǐng)域本體進行編輯,通過OWL語言對本體進行描述,部分概念及關(guān)系如圖7所示。

    在概念層到應(yīng)用層的實例化過程中,研究采用D2RQ技術(shù)實現(xiàn)關(guān)系數(shù)據(jù)向RDF格式的轉(zhuǎn)換,并將實例化數(shù)據(jù)結(jié)果存儲在RDF數(shù)據(jù)庫graphDB中。在數(shù)據(jù)映射技術(shù)的基礎(chǔ)上,對本體中術(shù)語和數(shù)據(jù)源抽取知識中詞匯的映射關(guān)系等加以構(gòu)建處理,從而促使不同的數(shù)據(jù)源的數(shù)據(jù)能夠綜合在一起,不同源的實體也會指向現(xiàn)實的同一個客體[40],最后融合而成的實例知識庫提供了一種存儲和管理的新方式。

    3.6?多層本體立方體評價

    本體的評價是領(lǐng)域本體構(gòu)建非常重要的環(huán)節(jié),能夠幫助判斷本體是否符合領(lǐng)域需求以不斷迭代改進。目前尚未由通用而規(guī)范的本體評價方法,本文借鑒了黃奇等[41]對本體映射系統(tǒng)的評價體系,將評價的維度分為內(nèi)容多樣性、結(jié)構(gòu)深入性、語義關(guān)聯(lián)性和本體實用性4個方面,每個層面采取定性或定量的細化評價方法。

    3.6.1?內(nèi)容多樣性

    在內(nèi)容多樣性的評價層面,研究借鑒了Onto QA本體評價方法。該方法是Tartir S等[42]在2005年提出的一種評價本體通用性的方法,評價指標包括類的豐富性(CR)、關(guān)系豐富性(RR)、屬性豐富性(AR)等,如表8所示。

    從表8的評價結(jié)果可以看出對證券領(lǐng)域本體定義的類和概念相對豐富,并能夠較為充分地體現(xiàn)出關(guān)系多樣性,但是概念的屬性相對較少,證實了金融證券領(lǐng)域概念分散、關(guān)系復(fù)雜且基礎(chǔ)屬性較少的特點。

    3.6.2?結(jié)構(gòu)深入性

    結(jié)構(gòu)深入性體現(xiàn)了本體在結(jié)構(gòu)關(guān)系層面是否充分挖掘,并直接影響了語義層面的關(guān)聯(lián)性。本文通過設(shè)定“多層”本體的概念豐富了本體的結(jié)構(gòu)表現(xiàn)形式,同時各層本體具有完整的映射關(guān)系,如層級關(guān)系映射、類和實例映射。此外,實例層的立方體結(jié)構(gòu)直觀地刻畫了各實例的維度傾向性和距離關(guān)系,為本體結(jié)構(gòu)提供了新的設(shè)計思路。

    3.6.3?語義關(guān)聯(lián)性

    語義關(guān)聯(lián)性是對概念實體豐富性和結(jié)構(gòu)深入性的擴展,也是本文的核心內(nèi)容。語義關(guān)聯(lián)性可以由層次聚類、關(guān)系抽取和維度分類的效果直接體現(xiàn)。層次聚類結(jié)果表明,證券領(lǐng)域概念層級關(guān)系在文本信息中較難發(fā)現(xiàn),仍需依賴人工梳理;關(guān)系抽取結(jié)果反映出領(lǐng)域關(guān)系的多樣性,基于句法分析的抽取雖然使得部分實體過于冗長,但最大程度地保留了語義信息;維度分類和實體的空間映射作為本文的創(chuàng)新之一,對于豐富各實例的語義表達起到了一定的增強作用。

    3.6.4?本體實用性

    實用性是從使用者的角度出發(fā)對構(gòu)建的本體進行全面的評價,它是對內(nèi)容、結(jié)構(gòu)和語義的綜合評判。在實用性層面,借鑒黃奇的評價指標,如表9所示,結(jié)合實際情況進行合理的解釋說明,并通過公式φ=∑4i=1αiβi加以量化。

    對指標的量化打分需要領(lǐng)域?qū)<业慕槿耄疚臉?gòu)建的本體實用性評分為0.8104,說明具備一定的理論研究和應(yīng)用價值。然而上述關(guān)于實用性的量化指標依舊過于主觀,未來針對特定領(lǐng)域的本體評價體系仍需進一步完善。

    4?結(jié)論與展望

    金融大數(shù)據(jù)的價值源于其蘊涵的廣泛存在的知識關(guān)聯(lián),而傳統(tǒng)的金融大數(shù)據(jù)的扁平化組織忽略了數(shù)據(jù)內(nèi)在的聯(lián)系,也沒有考慮多源異構(gòu)數(shù)據(jù)的有效組織與融合。本文依托于本體及其構(gòu)建理論,針對傳統(tǒng)單層領(lǐng)域本體知識表示模型無法進行規(guī)范而明確描述的弱點,構(gòu)建了包含基礎(chǔ)層、概念層和實例層在內(nèi)的多層領(lǐng)域本體,同時結(jié)合證券領(lǐng)域特殊性,考慮“行業(yè)—企業(yè)—內(nèi)部環(huán)境”三級維度概念對領(lǐng)域知識的影響,借鑒數(shù)據(jù)立方體概念,提出并構(gòu)建了“多層金融領(lǐng)域本體立方體”知識表示模型,豐富和擴展了本體構(gòu)建的理論與方法論體系。在具體的構(gòu)建過程中,按照知識獲取、挖掘、抽取、關(guān)聯(lián)及存儲的知識管理周期思路,并依靠主題建模、層次聚類、關(guān)系抽取和維度分類等自然語言處理技術(shù)實現(xiàn)了證券領(lǐng)域本體架構(gòu)的半自動化構(gòu)建,具有一定的應(yīng)用價值。

    當然,任何領(lǐng)域的知識幾乎都是無窮盡的,領(lǐng)域之間也總是存在交叉性,而且領(lǐng)域內(nèi)的知識也是動態(tài)發(fā)展變化的,因此本文構(gòu)建的本體存在一定的局限性。在數(shù)據(jù)獲取方面,雖然語料來源豐富,但對文本內(nèi)容的真實性和有效性未作處理,各來源比例也未進行規(guī)范;在數(shù)據(jù)處理方面,由于處理的數(shù)據(jù)規(guī)模有限,加之證券領(lǐng)域概念復(fù)雜分散,因此無法全部覆蓋,需要人工干預(yù)。未來將會對語料來源進行進一步的規(guī)范說明,并繼續(xù)探索領(lǐng)域本體自動構(gòu)建的相關(guān)算法;此外,隨著知識圖譜的不斷發(fā)展,在后續(xù)研究中可以考慮將構(gòu)建的本體與知識圖譜直接映射,從而更好地應(yīng)用在領(lǐng)域知識的表示、分析、關(guān)聯(lián)與融合中。

    參考文獻

    [1]錢學(xué)森,于景元,戴汝為.一個科學(xué)新領(lǐng)域——開放的復(fù)雜巨系統(tǒng)及其方法論[C]//中國系統(tǒng)工程學(xué)會第六次年會,1990:526-532.

    [2]Hasan M M,Popp J,Oláh J.Current Landscape and Influence of Big Data on Finance[J].Journal of Big Data,2020,7(1):1-17.

    [3]Zhang P,Yu K,Yu J,et al.QuantCloud:Big Data Infrastructure for Quantitative Finance on the Cloud[J].IEEE Transactions on Big Data,2018,4(3):368-380.

    [4]丁曉蔚,蘇新寧.基于區(qū)塊鏈可信大數(shù)據(jù)人工智能的金融安全情報分析[J].情報學(xué)報,2019,38(12):1297-1309.

    [5]陳云.金融大數(shù)據(jù)[M].上海:上??茖W(xué)技術(shù)出版社,2015.

    [6]林天華,張倩倩,祁旭陽,等.證券大數(shù)據(jù)分析研究[J].計算機技術(shù)與發(fā)展,2020,30(10):179-186.

    [7]李善平,尹奇韡,胡玉杰,等.本體論研究綜述[J].計算機研究與發(fā)展,2004,(7):1041-1052.

    [8]劉仁寧,李禹生.領(lǐng)域本體構(gòu)建方法[J].武漢工業(yè)學(xué)院學(xué)報,2008,27(1):46-49,53.

    [9]El-Diraby T E.Domain Ontology for Construction Knowledge[J].Journal of Construction Engineering and Management,2013,139(7):768-784.

    [10]張文秀,朱慶華.領(lǐng)域本體的構(gòu)建方法研究[J].圖書與情報,2011,(1):16-19,40.

    [11]付苓.大數(shù)據(jù)環(huán)境下領(lǐng)域本體構(gòu)建框架研究[J].圖書館,2017,(11):66-71.

    [12]丁晟春,李岳盟,甘利人.基于頂層本體的領(lǐng)域本體綜合構(gòu)建方法研究[J].情報理論與實踐,2007,(2):236-240.

    [13]Singh A,Anand P.Automatic Domain Ontology Construction Mechanism[C]//Intelligent Computational Systems.IEEE,2013:304-309.

    [14]Yan Y,Jiang Z,Liu X,et al.An Intelligent Approach for Construction Domain Ontology[C]//IEEE International Conference on Automation & Logistics.IEEE,2009:1283-1288.

    [15]王思麗,楊恒,祝忠明,等.基于BERT的領(lǐng)域本體分類關(guān)系自動識別研究[J].情報科學(xué),2021,39(7):75-82.

    [16]肖奎,譚小虎,吳天吉.一種面向領(lǐng)域的本體自動構(gòu)建方法[J].小型微型計算機系統(tǒng),2013,34(7):1514-1517.

    [17]Gomez-Perez A,Manzano-Macho D.A Survey of Ontology Learning Techniques and Applications[J].Technical Report of the OntoWeb Project:Deliverable 1.5,2003.

    [18]陳剛,陸汝鈐,金芝.基于領(lǐng)域知識重用的虛擬領(lǐng)域本體構(gòu)造[J].軟件學(xué)報,2003,(3):350-355.

    [19]Shih C W,Chen M Y,Chu H C,et al.The Enhancement of Domain Ontology Construction Using a Crystallizing Approach[J].The Experts Systems with Applications,2011,38(6):7544-7557.

    [20]Sanchez D,Moreno A.Learning Non-taxonomic Relationships from Web Documents for Domain Ontology Construction[J].Data & Knowledge Engineering,2008,64(3):600-623.

    [21]鄭姝雅,黃奇,張戈,等.面向用戶生成內(nèi)容的本體構(gòu)建方法[J].情報科學(xué),2019,37(11):43-47.

    [22]鄧詩琦,洪亮.面向智能應(yīng)用的領(lǐng)域本體構(gòu)建研究——以反電話詐騙領(lǐng)域為例[J].數(shù)據(jù)分析與知識發(fā)現(xiàn),2019,3(7):73-84.

    [23]Shamsfard M,Barforoush A A.The State of the Art in Ontology Learning:A Framework for Comparison[J].Knowledge Engineering Review,2003,18(4):293-316.

    [24]Zouaq A,Gasevic D,Hatala M.Towards Open Ontology Learning and Filtering[J].Information Systems,2011,36(7):1064-1081.

    [25]Lee C S,Kao Y F,Kuo Y H,et al.Automated Ontology Construction for Unstructured Text Documents[J].Data & Knowledge Engineering,2007,60(3):547-566.

    [26]劉萍,胡月紅.領(lǐng)域本體學(xué)習方法和技術(shù)研究綜述[J].現(xiàn)代圖書情報技術(shù),2012,(1):19-26.

    [27]Ruan T,Xue L J,Wang H F,et al.Building and Exploring an Enterprise Knowledge Graph for Investment Analysis[C]//Proceedings of the International Semantic Web Conference.Heidelberg:Springer,2016:418-436.

    [28]Kayed A,Hirzallah N,Shalabi L A A,et al.Building Ontological Relationships:A New Approach[J].Journal of the American Society for Information Science and Technology,2008,59(11):1801-1809.

    [29]Browne O,OReilly P,Hutchinson M,et al.Distributed Data and Ontologies:An Integrated Semantic Web Architecture Enabling More Efficient Data Management[J].Journal of the Association for Information Science and Technology,2019,70(6):575-586.

    [30]Ren R,Zhang L L,Cui L M,et al.Personalized Financial News Recommendation Algorithm Based on Ontology[J].Elsevier B.V.,2015,55:843-851.

    [31]Yang B.Construction of Logistics Financial Security Risk Ontology Model Based on Risk Association and Machine Learning[J].Safety Science,2020,123(C).

    [32]強韶華,羅云鹿,李玉鵬,等.基于RBR和CBR的金融事件本體推理研究[J].數(shù)據(jù)分析與知識發(fā)現(xiàn),2019,3(8):94-104.

    [33]Li J,Chen S M,Chen W,et al.Semantics-Space-Time Cube:A Conceptual Framework for Systematic Analysis of Texts in Space and Time[J].IEEE Transactions on Visualization and Computer Graphics,2020,26(4):1789-1806.

    [34]Esteban P E,Candela G,Trujillo J,et al.Adding Value to Linked Open Data Using a Multidimensional Model Approach Based on the RDF Data Cube Vocabulary[J].Computer Standards & Interfaces,2020,68(1):1-15.

    [35]師智斌.高性能數(shù)據(jù)立方體及其語義研究[D].北京:北京交通大學(xué),2009.

    [36]任守綱,徐煥良,劉小軍,等.層次式本體模型的領(lǐng)域分析與設(shè)計方法的研究[J].計算機與應(yīng)用化學(xué),2009,26(11):1385-1388.

    [37]Zhang L L,Zhao M H,F(xiàn)eng Z L.Research on Knowledge Discovery and Stock Forecasting of Financial News Based on Domain Ontology[J].International Journal of Information Technology & Decision Making,2019,18(3):953-979.

    [38]Petrova G G,Tuzovsky A F,Aksenova N V.Application of the Financial Industry Business Ontology(FIBO)for Development of a Financial Organization Ontology[J].2017,803(1):012116.

    [39]Gruber T R.Towards Principles for the Design of Ontologies Used for Knowledge Sharing[J].International Journal of Human-Computer Studies,1995,43(5-6):907-928.

    [40]曹敏,鄒京希,唐立軍,等.基于知識圖譜技術(shù)的海量非結(jié)構(gòu)化配網(wǎng)數(shù)據(jù)集成方法[P].云南:CN107330125A,2017-11-07.

    [41]黃奇,范佳林,陸佳瑩,等.本體映射系統(tǒng)的評價體系研究[J].情報學(xué)報,2017,36(8):781-789.

    [42]Tartir S,Arpinar I B,Moore M,et al.OntoQA:Metric-Based Ontology Quality Analysis[C]//IEEE ICDM 2005 Workshop on Knowledge Acquisition from Distributed,Autonomous,Semantically Heterogeneous Data and Knowledge Sources.IEEE,2005.

    (責任編輯:孫國雷)

    国产男人的电影天堂91| 人体艺术视频欧美日本| 在线观看免费视频网站a站| 巨乳人妻的诱惑在线观看| 亚洲男人天堂网一区| 国产成人精品福利久久| 久久99蜜桃精品久久| 国产一区亚洲一区在线观看| 春色校园在线视频观看| 日本91视频免费播放| 日韩,欧美,国产一区二区三区| 中文天堂在线官网| 欧美日韩亚洲国产一区二区在线观看 | 亚洲av欧美aⅴ国产| 一个人免费看片子| 狠狠精品人妻久久久久久综合| 丝袜在线中文字幕| 黄色 视频免费看| 亚洲国产成人一精品久久久| 97精品久久久久久久久久精品| 欧美日韩国产mv在线观看视频| 丰满少妇做爰视频| 女性被躁到高潮视频| 久久精品久久久久久久性| 日本欧美国产在线视频| 亚洲美女搞黄在线观看| 99精国产麻豆久久婷婷| 欧美精品国产亚洲| 国产成人aa在线观看| 国产色婷婷99| 一级片免费观看大全| av又黄又爽大尺度在线免费看| 久久精品国产综合久久久| 成年av动漫网址| 国产一区二区三区综合在线观看| 久久精品国产自在天天线| 精品一区二区免费观看| 午夜福利在线观看免费完整高清在| 午夜免费观看性视频| 亚洲国产最新在线播放| 啦啦啦在线观看免费高清www| 最近中文字幕高清免费大全6| 一区二区三区激情视频| 亚洲精品美女久久av网站| 亚洲色图 男人天堂 中文字幕| 国产精品一区二区在线不卡| 美女视频免费永久观看网站| 久久久国产精品麻豆| 精品国产乱码久久久久久小说| 校园人妻丝袜中文字幕| 国产爽快片一区二区三区| 捣出白浆h1v1| 美女脱内裤让男人舔精品视频| kizo精华| 久久影院123| 国产av码专区亚洲av| 午夜影院在线不卡| 日韩视频在线欧美| av视频免费观看在线观看| 欧美激情 高清一区二区三区| 国产成人精品无人区| 大码成人一级视频| 九色亚洲精品在线播放| 午夜福利,免费看| 国产精品偷伦视频观看了| 久久影院123| 久久久精品区二区三区| 日韩,欧美,国产一区二区三区| 99香蕉大伊视频| av在线播放精品| 婷婷色av中文字幕| 日韩,欧美,国产一区二区三区| 五月伊人婷婷丁香| 久久 成人 亚洲| 女人被躁到高潮嗷嗷叫费观| 九草在线视频观看| 亚洲国产av影院在线观看| 中国国产av一级| 一本大道久久a久久精品| 久久人人爽人人片av| 国产不卡av网站在线观看| 久久人人97超碰香蕉20202| 久久鲁丝午夜福利片| 国产成人精品久久久久久| 国产男人的电影天堂91| 国产在视频线精品| 成年女人在线观看亚洲视频| 国产免费现黄频在线看| 在线观看三级黄色| 中文字幕av电影在线播放| 国产一级毛片在线| 亚洲精品久久成人aⅴ小说| 久久久久国产网址| 一本色道久久久久久精品综合| 校园人妻丝袜中文字幕| 国产乱人偷精品视频| 99re6热这里在线精品视频| 26uuu在线亚洲综合色| 男女高潮啪啪啪动态图| 在线观看国产h片| 国产精品嫩草影院av在线观看| 国产精品一二三区在线看| 韩国精品一区二区三区| 深夜精品福利| 一级片免费观看大全| 亚洲国产av新网站| 久久 成人 亚洲| 久久精品国产鲁丝片午夜精品| 久久av网站| 欧美bdsm另类| 国产av国产精品国产| a 毛片基地| 国产又色又爽无遮挡免| 亚洲第一区二区三区不卡| www.精华液| 毛片一级片免费看久久久久| 亚洲欧美色中文字幕在线| 久久精品人人爽人人爽视色| 高清av免费在线| 国产亚洲最大av| 啦啦啦啦在线视频资源| 久久这里有精品视频免费| 亚洲精品日韩在线中文字幕| 欧美国产精品一级二级三级| 国产爽快片一区二区三区| 色网站视频免费| 欧美日韩精品成人综合77777| 2018国产大陆天天弄谢| 国产成人欧美| 蜜桃在线观看..| 制服诱惑二区| 国产日韩一区二区三区精品不卡| 黑人巨大精品欧美一区二区蜜桃| 成年人免费黄色播放视频| 日本wwww免费看| 久久久久人妻精品一区果冻| 国产在线一区二区三区精| 在线精品无人区一区二区三| 免费在线观看黄色视频的| 国产日韩一区二区三区精品不卡| 亚洲精品一区蜜桃| 色94色欧美一区二区| 丝袜美足系列| 久久久久久久亚洲中文字幕| 看免费成人av毛片| 精品午夜福利在线看| 王馨瑶露胸无遮挡在线观看| 少妇的逼水好多| 永久免费av网站大全| 国产高清国产精品国产三级| 欧美成人午夜精品| 国产av精品麻豆| 欧美日韩一级在线毛片| av女优亚洲男人天堂| 欧美精品高潮呻吟av久久| 午夜日本视频在线| 在线观看美女被高潮喷水网站| 久久久久久人妻| 99国产精品免费福利视频| 欧美日韩一级在线毛片| 午夜91福利影院| 国产精品国产三级国产专区5o| 80岁老熟妇乱子伦牲交| 久久精品亚洲av国产电影网| 国产在视频线精品| 美女中出高潮动态图| 免费人妻精品一区二区三区视频| 久久久久久久久免费视频了| 日韩视频在线欧美| 亚洲一区二区三区欧美精品| 欧美日韩国产mv在线观看视频| 日韩中文字幕欧美一区二区 | 精品亚洲成a人片在线观看| av女优亚洲男人天堂| 如何舔出高潮| 女的被弄到高潮叫床怎么办| 国产精品久久久久久精品电影小说| 亚洲少妇的诱惑av| 大香蕉久久网| 美女高潮到喷水免费观看| 满18在线观看网站| 中文字幕色久视频| √禁漫天堂资源中文www| 亚洲情色 制服丝袜| www日本在线高清视频| 97精品久久久久久久久久精品| 激情视频va一区二区三区| 老女人水多毛片| 精品人妻熟女毛片av久久网站| 夫妻性生交免费视频一级片| 18在线观看网站| 日韩中字成人| 国产精品免费大片| 王馨瑶露胸无遮挡在线观看| 9191精品国产免费久久| 日韩中文字幕欧美一区二区 | 欧美黄色片欧美黄色片| 国产欧美亚洲国产| 国产成人精品久久久久久| 日本免费在线观看一区| 中文字幕人妻熟女乱码| 国产精品人妻久久久影院| 各种免费的搞黄视频| 我要看黄色一级片免费的| 欧美人与性动交α欧美软件| av电影中文网址| 国产精品免费视频内射| 久久精品久久久久久久性| 在线观看人妻少妇| 午夜免费观看性视频| 蜜桃在线观看..| 日本免费在线观看一区| 国产成人精品久久久久久| 日本vs欧美在线观看视频| 中文字幕最新亚洲高清| 久久ye,这里只有精品| 搡老乐熟女国产| 亚洲色图综合在线观看| 国产无遮挡羞羞视频在线观看| 亚洲精品成人av观看孕妇| 最近的中文字幕免费完整| www.自偷自拍.com| 成年女人在线观看亚洲视频| 国产成人精品福利久久| 久久久久久久久久人人人人人人| 亚洲成色77777| 一级,二级,三级黄色视频| 国产精品欧美亚洲77777| 亚洲综合色网址| 少妇被粗大猛烈的视频| av片东京热男人的天堂| 午夜av观看不卡| 精品久久久久久电影网| 亚洲综合色网址| 卡戴珊不雅视频在线播放| 狂野欧美激情性bbbbbb| 亚洲精品中文字幕在线视频| 亚洲av在线观看美女高潮| 国产日韩欧美在线精品| 亚洲经典国产精华液单| 男女下面插进去视频免费观看| 久久久亚洲精品成人影院| 搡女人真爽免费视频火全软件| 久久热在线av| 中文字幕制服av| 精品一品国产午夜福利视频| 亚洲人成电影观看| 中文字幕av电影在线播放| 午夜福利一区二区在线看| 亚洲激情五月婷婷啪啪| 我要看黄色一级片免费的| 日韩精品免费视频一区二区三区| 亚洲成国产人片在线观看| 亚洲四区av| 涩涩av久久男人的天堂| 麻豆av在线久日| 国产亚洲一区二区精品| 午夜福利,免费看| 国产 一区精品| 中文乱码字字幕精品一区二区三区| 国产淫语在线视频| 日韩av不卡免费在线播放| 精品卡一卡二卡四卡免费| 欧美日韩国产mv在线观看视频| 久久亚洲国产成人精品v| 婷婷色综合大香蕉| 黄网站色视频无遮挡免费观看| 日本黄色日本黄色录像| 多毛熟女@视频| 天堂俺去俺来也www色官网| 赤兔流量卡办理| 一级毛片 在线播放| 另类精品久久| 欧美xxⅹ黑人| 亚洲成人手机| 精品视频人人做人人爽| 亚洲精品乱久久久久久| 性色av一级| 成人毛片60女人毛片免费| 男女高潮啪啪啪动态图| 国产色婷婷99| 五月伊人婷婷丁香| 天堂俺去俺来也www色官网| 性高湖久久久久久久久免费观看| 成人18禁高潮啪啪吃奶动态图| 男人舔女人的私密视频| 超色免费av| 丝袜美足系列| 在线天堂中文资源库| av免费在线看不卡| 午夜精品国产一区二区电影| 高清黄色对白视频在线免费看| 9191精品国产免费久久| 18+在线观看网站| 国产成人精品婷婷| 18禁动态无遮挡网站| av在线观看视频网站免费| 一区二区三区四区激情视频| 国产不卡av网站在线观看| 看非洲黑人一级黄片| 日韩一区二区三区影片| 日韩熟女老妇一区二区性免费视频| 久久综合国产亚洲精品| 涩涩av久久男人的天堂| 亚洲欧美成人综合另类久久久| 婷婷色综合www| 成人亚洲精品一区在线观看| 激情五月婷婷亚洲| 巨乳人妻的诱惑在线观看| 只有这里有精品99| 国产精品久久久久久精品电影小说| 一本一本久久a久久精品综合妖精 国产伦在线观看视频一区 | 欧美国产精品一级二级三级| 丝瓜视频免费看黄片| 91aial.com中文字幕在线观看| 男男h啪啪无遮挡| 欧美人与善性xxx| 女人精品久久久久毛片| 成年av动漫网址| 成人毛片60女人毛片免费| 亚洲精品国产av成人精品| 国产又色又爽无遮挡免| 黑人猛操日本美女一级片| 国产欧美日韩一区二区三区在线| 久久精品亚洲av国产电影网| 亚洲av免费高清在线观看| 国产男女超爽视频在线观看| 青春草亚洲视频在线观看| 国产av一区二区精品久久| 日本色播在线视频| 妹子高潮喷水视频| 国产成人精品无人区| av不卡在线播放| 深夜精品福利| 成人漫画全彩无遮挡| 韩国精品一区二区三区| 成人国产麻豆网| 下体分泌物呈黄色| 欧美人与善性xxx| 777米奇影视久久| 十八禁高潮呻吟视频| 亚洲精品自拍成人| 九色亚洲精品在线播放| 中文字幕另类日韩欧美亚洲嫩草| 国产免费一区二区三区四区乱码| 另类亚洲欧美激情| 久久久精品94久久精品| 久久久久久人妻| 99热国产这里只有精品6| 久久久久精品性色| 国产成人精品久久二区二区91 | 美女主播在线视频| 久久久久久免费高清国产稀缺| 久久精品人人爽人人爽视色| 美女福利国产在线| 欧美激情 高清一区二区三区| 精品一区在线观看国产| av在线老鸭窝| 各种免费的搞黄视频| 热re99久久精品国产66热6| 2022亚洲国产成人精品| 日韩免费高清中文字幕av| 熟女电影av网| 亚洲精品久久午夜乱码| 国产探花极品一区二区| 丰满乱子伦码专区| 欧美黄色片欧美黄色片| 国产精品人妻久久久影院| 亚洲欧美色中文字幕在线| 成人手机av| 三级国产精品片| 欧美日本中文国产一区发布| 日日摸夜夜添夜夜爱| 丁香六月天网| 成年女人毛片免费观看观看9 | 男女午夜视频在线观看| 一级毛片黄色毛片免费观看视频| 午夜激情久久久久久久| 亚洲av在线观看美女高潮| 亚洲美女视频黄频| 精品国产超薄肉色丝袜足j| 日产精品乱码卡一卡2卡三| 不卡av一区二区三区| 久久人妻熟女aⅴ| 综合色丁香网| 亚洲成av片中文字幕在线观看 | 国产视频首页在线观看| 18+在线观看网站| 国产精品秋霞免费鲁丝片| 女人高潮潮喷娇喘18禁视频| 波多野结衣一区麻豆| 天堂俺去俺来也www色官网| 国产精品无大码| 国产片特级美女逼逼视频| 欧美精品人与动牲交sv欧美| 国产在视频线精品| 寂寞人妻少妇视频99o| 91在线精品国自产拍蜜月| 精品人妻熟女毛片av久久网站| 亚洲内射少妇av| 国产午夜精品一二区理论片| av免费在线看不卡| 国产淫语在线视频| 中国三级夫妇交换| 亚洲三级黄色毛片| 国产精品女同一区二区软件| 看免费成人av毛片| 一级毛片我不卡| 欧美激情高清一区二区三区 | 一级黄片播放器| 国产探花极品一区二区| 久久热在线av| 精品少妇黑人巨大在线播放| 91久久精品国产一区二区三区| 免费看不卡的av| 最近最新中文字幕免费大全7| 国产成人精品一,二区| 又大又黄又爽视频免费| 一个人免费看片子| 精品久久久久久电影网| 欧美97在线视频| 青草久久国产| 国产欧美日韩一区二区三区在线| 视频在线观看一区二区三区| 香蕉精品网在线| av.在线天堂| 欧美日韩av久久| 国产精品国产三级专区第一集| 欧美国产精品va在线观看不卡| 日本免费在线观看一区| 美女福利国产在线| 亚洲欧美一区二区三区黑人 | 欧美最新免费一区二区三区| 亚洲精品国产一区二区精华液| 热99久久久久精品小说推荐| 亚洲国产精品一区三区| 80岁老熟妇乱子伦牲交| 高清av免费在线| 国产亚洲精品第一综合不卡| 亚洲欧美成人综合另类久久久| 精品亚洲成国产av| 日韩一卡2卡3卡4卡2021年| 一级爰片在线观看| 一级片'在线观看视频| 欧美av亚洲av综合av国产av | 看免费av毛片| 久久国产精品男人的天堂亚洲| 欧美国产精品一级二级三级| 亚洲第一青青草原| 激情五月婷婷亚洲| 久久久久国产网址| 天美传媒精品一区二区| 老司机影院毛片| 国产一区二区 视频在线| 大香蕉久久网| 性色avwww在线观看| 叶爱在线成人免费视频播放| 下体分泌物呈黄色| 亚洲av日韩在线播放| 99热全是精品| 边亲边吃奶的免费视频| 免费黄色在线免费观看| 99热国产这里只有精品6| 国产精品久久久久久精品古装| 又大又黄又爽视频免费| 国产无遮挡羞羞视频在线观看| 搡女人真爽免费视频火全软件| 亚洲精品国产av成人精品| 久久免费观看电影| 黄色 视频免费看| 亚洲国产欧美日韩在线播放| 国产精品无大码| av女优亚洲男人天堂| 成人手机av| 99久久精品国产国产毛片| 女人久久www免费人成看片| av不卡在线播放| 国产av码专区亚洲av| 狂野欧美激情性bbbbbb| 老鸭窝网址在线观看| 99热全是精品| 男女下面插进去视频免费观看| 激情视频va一区二区三区| 国产极品粉嫩免费观看在线| 亚洲国产成人一精品久久久| 精品午夜福利在线看| 久久久国产欧美日韩av| 制服人妻中文乱码| 日韩精品免费视频一区二区三区| 久久99热这里只频精品6学生| 夫妻性生交免费视频一级片| 亚洲国产欧美网| 亚洲一码二码三码区别大吗| 国产精品熟女久久久久浪| 一区二区三区精品91| 欧美日韩av久久| 日本色播在线视频| 国产成人精品一,二区| 国产精品亚洲av一区麻豆 | 一区二区三区激情视频| 最新的欧美精品一区二区| 卡戴珊不雅视频在线播放| 91精品三级在线观看| 国产一区亚洲一区在线观看| 欧美亚洲日本最大视频资源| 亚洲色图 男人天堂 中文字幕| 国产亚洲精品第一综合不卡| 久久久久精品久久久久真实原创| 国产淫语在线视频| 精品少妇久久久久久888优播| 欧美+日韩+精品| 最近手机中文字幕大全| 国产成人精品在线电影| 久久精品夜色国产| 日本wwww免费看| 国产深夜福利视频在线观看| 久久久精品94久久精品| 亚洲国产精品国产精品| 亚洲精品乱久久久久久| 国产精品二区激情视频| 亚洲情色 制服丝袜| 精品国产露脸久久av麻豆| 五月天丁香电影| 男的添女的下面高潮视频| 美女视频免费永久观看网站| 哪个播放器可以免费观看大片| 午夜影院在线不卡| 免费不卡的大黄色大毛片视频在线观看| 热99久久久久精品小说推荐| 卡戴珊不雅视频在线播放| 亚洲av电影在线进入| 少妇人妻精品综合一区二区| 中文天堂在线官网| 免费黄网站久久成人精品| av又黄又爽大尺度在线免费看| 美女中出高潮动态图| 国产av国产精品国产| av有码第一页| 国产精品久久久久久精品电影小说| www.av在线官网国产| 五月天丁香电影| av免费观看日本| 中文字幕制服av| 午夜久久久在线观看| 性高湖久久久久久久久免费观看| 99久久综合免费| a级毛片在线看网站| 欧美日韩av久久| 日韩不卡一区二区三区视频在线| 考比视频在线观看| 青春草亚洲视频在线观看| 成人亚洲欧美一区二区av| 侵犯人妻中文字幕一二三四区| 这个男人来自地球电影免费观看 | 亚洲三级黄色毛片| 一区二区三区四区激情视频| 欧美黄色片欧美黄色片| 亚洲av免费高清在线观看| 免费观看av网站的网址| 成人二区视频| 大码成人一级视频| 亚洲人成网站在线观看播放| 大片免费播放器 马上看| 久久亚洲国产成人精品v| 我要看黄色一级片免费的| 亚洲天堂av无毛| 欧美日韩亚洲高清精品| 黑人猛操日本美女一级片| 亚洲成人av在线免费| 国产精品久久久久成人av| 美女主播在线视频| 午夜福利一区二区在线看| 成人漫画全彩无遮挡| 永久网站在线| 香蕉精品网在线| 极品人妻少妇av视频| 蜜桃在线观看..| www.精华液| 久久久久久久久久人人人人人人| 丰满饥渴人妻一区二区三| 免费高清在线观看视频在线观看| 精品亚洲成a人片在线观看| 黑人欧美特级aaaaaa片| 免费大片黄手机在线观看| 最近的中文字幕免费完整| 日产精品乱码卡一卡2卡三| 欧美亚洲日本最大视频资源| 日韩中字成人| 高清在线视频一区二区三区| 日韩大片免费观看网站| 久久久久国产网址| 亚洲五月色婷婷综合| 免费人妻精品一区二区三区视频| 天天影视国产精品| 一区二区三区四区激情视频| 波野结衣二区三区在线| 国产乱来视频区| 1024视频免费在线观看| 一个人免费看片子| 91在线精品国自产拍蜜月| 母亲3免费完整高清在线观看 | 捣出白浆h1v1| 黄色视频在线播放观看不卡| 国产福利在线免费观看视频| 亚洲图色成人| 久久热在线av| 久久精品人人爽人人爽视色| 久久久精品区二区三区| 母亲3免费完整高清在线观看 | 考比视频在线观看| 一级毛片我不卡| 国产免费现黄频在线看| 久久久久久免费高清国产稀缺| 欧美中文综合在线视频| 深夜精品福利|