李 旸,郭曉敏,王素格,2,梁吉業(yè),2
(1. 山西大學 計算機與信息技術學院,山西 太原 030006;2. 山西大學 計算智能與中文信息處理教育部重點實驗室,山西 太原 030006)
基于內涵模糊概念格的汽車評價知識發(fā)現(xiàn)方法研究
李 旸1,郭曉敏1,王素格1,2,梁吉業(yè)1,2
(1. 山西大學 計算機與信息技術學院,山西 太原 030006;2. 山西大學 計算智能與中文信息處理教育部重點實驗室,山西 太原 030006)
為了有效利用汽車評論數(shù)據(jù),參照已建立的汽車評價本體,從文本中抽取評價搭配對,提出基于五元組的對象評價度量,從而獲取汽車評價模糊形式背景。在模糊形式背景中,定義了內涵模糊概念和內涵模糊概念格。設計了模糊形式背景和內涵模糊概念格構建算法,并以實例對如何基于內涵模糊概念格進行知識發(fā)現(xiàn)予以討論。
汽車評價;知識發(fā)現(xiàn);模糊形式概念分析;內涵模糊概念;模糊概念格
Web2.0技術的在線交互性使得用戶產生的數(shù)據(jù)呈現(xiàn)爆炸式增長,但人們在享有先進技術所帶來的便利性的同時,也面臨著如何從海量評論數(shù)據(jù)中尋求有價值信息的難題[1]?;ヂ?lián)網上的海量用戶評論數(shù)據(jù)蘊含著巨大的價值,比如,企業(yè)可通過對產品評論數(shù)據(jù)的價值挖掘,及時了解用戶的反饋和建議,以輔助產品定位、產品設計、營銷策略等企業(yè)生產經營中的決策過程。然而,在產品評價領域,如何有效地挖掘、表示和組織數(shù)據(jù)中蘊含的大量有價值的評價知識是自然語言處理和知識工程領域亟需解決的問題。
在基于知識的系統(tǒng)中,知識表示的形式多種多樣,但形式簡潔、便于推理的概念、規(guī)則、關聯(lián)等占有重要的地位。然而,在文本大數(shù)據(jù)環(huán)境下,鑒于語言現(xiàn)象的復雜性和數(shù)據(jù)的不確定性,即使限定領域,研究知識表示及基于數(shù)據(jù)挖掘技術構建領域知識庫也仍是一項挑戰(zhàn)性工作。
本文針對互聯(lián)網上的海量汽車評論數(shù)據(jù),提出了一種基于內涵模糊概念格的汽車評價知識發(fā)現(xiàn)方法。該方法首先依據(jù)面向觀點挖掘的汽車領域本體,從原始語料中抽取評價搭配五元組,并通過定義屬性對評價對象的情感傾向性指標構建模糊形式背景;然后,利用置信閾值、內涵模糊形式概念和偏序關系等,構建方面粒度意義下的汽車評價內涵模糊概念格;最后,基于構建的內涵模糊概念格,利用規(guī)則抽取技術和概念相似性度量等,形成汽車評價知識庫。該方法具有以下特點: 內涵模糊形式概念為概念描述提供了一種新穎的形式,同時可作為規(guī)則和關聯(lián)知識的基本單元;內涵模糊概念格可作為知識的結構化組織方式;置信閾值可調節(jié)控制知識庫的規(guī)模。
知識的表示形式主要有案例式、邏輯模式、框架式、語義網絡、產生式(規(guī)則)、狀態(tài)空間等[2]。不同的知識獲取方法對應于不同類型的知識表示方式,而不同的知識表示方式又對應于不同的知識組織方式。
目前,常用的知識庫構建方法有基于本體的方法和基于認知模型的方法兩類?;诒倔w的知識庫構建方法已相當成熟,而基于認知模型的方法還在被不斷地深入研究。Liwei Tan[3]等在其專著中論述了基于認知模型的知識庫構建方法,并對兩種方法的異同進行了討論。形式概念分析(formal concept analysis,F(xiàn)CA)[4]是一種基于概念內涵與外延統(tǒng)一性認知,以格結構的形式直觀化隱含在數(shù)據(jù)中概念的特化和泛化關系的數(shù)學工具。FCA不僅提供了一種從數(shù)據(jù)中挖掘概念的方法,同時將獲取的概念以格的形態(tài)進行組織,有利于概念規(guī)則的生成和概念關聯(lián)的建立,在知識獲取和處理中扮演著重要角色[5]。Belen[6]論述了FCA作為基于事例推理(case-based reasoning,CBR)的支撐技術的可能性,他們利用FCA從事例中獲取知識并建立知識庫,表明FCA能夠刻畫事例知識庫中概念化結構的本質。它不僅可找到事例中的模式、規(guī)律和例外,還可從描述事例的屬性中抽取依賴規(guī)則,從而指導知識庫查詢過程。Muangprathub[7]利用FCA作為知識發(fā)現(xiàn)與組織的基本工具,構建了增量式知識庫,進而構建CBR系統(tǒng)。模糊集理論(fuzzy sets)[8]是關于不確定性最重要的理論之一。模糊集理論還衍生了重要的不確定性推理理論——模糊邏輯(fuzzy logic,F(xiàn)L)。Achiche[9]利用模糊邏輯,提出了構建知識庫的方法FL-GA,并與另一種基于模糊邏輯的知識庫構建方法FL-MA進行了對比分析。為了拓展應用范圍,許多知識獲取的理論與方法被推廣至模糊背景下,F(xiàn)CA也不例外。Tadrat[10]將模糊集引入經典FCA,通過將數(shù)值型的多值屬性轉化為0-1二值屬性,然后利用FCA構建知識庫,結果表明構建的知識庫提升了CBR系統(tǒng)的分類效果。經典的FCA是處理0-1形式背景的,即對象要么有某種屬性,要么沒有某種屬性,它不能反映對象具有某種屬性的“程度”。將模糊集或模糊邏輯與經典的FCA相結合有利于刻畫數(shù)據(jù)中的模糊性,挖掘具有模糊屬性的概念和規(guī)則,構建具有模糊屬性的知識庫,拓展FCA的應用場景。
經典的FCA通過伽羅瓦連接從所謂的經典形式背景中抽取概念,定義概念間的偏序關系,進而構建概念格。為了適應數(shù)據(jù)的不確定性,特別是模糊性,Quan等人[11]將模糊集與經典FCA相結合,發(fā)展了一類模糊形式概念分析技術(fuzzy formal concept analysis,F(xiàn)FCA),其對應的概念格被稱為模糊概念格。這一拓展從對經典形式背景的推廣開始。
定義1[11]三元組K=(O,A,R)被稱為一個模糊形式背景,其中O是有限對象集;A是有限屬性集;R是O×A上的一個模糊關系,即存在一個映射μ:O×A→[0,1],使得對任意的o∈O,a∈A,有μ(o,a)∈[0,1],μ(o,a)被稱為(o,a)隸屬于關系R的隸屬度。
顯然,當模糊關系R退化為一個確定性關系時,模糊形式背景就退化為一個經典的0-1形式背景。模糊形式背景可以表示為一個二維表。表1給出了一個面向汽車評價的簡單模糊形式背景。
表1 一個面向汽車評價的簡單模糊形式背景
其中,對象集O={桑塔納,比亞迪G3,馬自達2},屬性集A={動力性,加速能力,坡道表現(xiàn)},模糊關系R由相應的隸屬度μ(o,a)所定義,比如,μ(比亞迪G3,加速能力)=0.84等。本例中,模糊關系R表示“動力性”、“加速能力”及“坡道表現(xiàn)”等屬性對對象即汽車在評價情感方面的影響程度,其值越大,表示汽車在這一屬性下的評價越高,反之,評價越低。
實際應用中,為了聚焦于感興趣的對象(屬性)或得到有意義的概念,設置閾值是一種常用的技巧。為此,在模糊形式概念分析中,需要對模糊關系的隸屬度設置閾值,它可以用來控制從數(shù)據(jù)中抽取的概念數(shù)量,從而控制所生成的模糊概念格的規(guī)模和生成的規(guī)則數(shù)量。
定義2[11]設K=(O,A,R)是一個模糊形式背景,給定隸屬度置信閾值λ∈[0,1]。設W?O,V?A,定義兩個映射如下:
定義2中,W*表示W中對象所共有的隸屬度不小于置信閾值λ的屬性;V*則表示在V中所有屬性下隸屬度都不小于置信閾值λ的對象全體。
例如: 對表1所示的模糊形式背景,給定置信閾值λ=0.5。設W={桑塔納,馬自達2},則W*={坡道表現(xiàn)}。設V={動力性,坡道表現(xiàn)},則V*={桑塔納}。
定義3設K=(O,A,R) 是一個模糊形式背景,給定置信閾值λ。設W?O,V?A,滿足W*=V,V*=W,則稱二元組(W,VF)是一個內涵模糊形式概念,其中屬性a∈V隸屬于該模糊概念的隸屬度μa=mino∈Wμ(o,a)。
需要說明的是,在定義4中,VF的上標是為了強調VF是一個定義在V上的模糊集。另外,為了表示及推導方便,約定(O,?)=(O,{a(μa=0)}a∈V)和(O,A)=(?,{a(μa=1)}a∈V)是兩個特殊的內涵模糊概念。
根據(jù)定義3,不難得到表1所示的模糊形式背景中的所有內涵模糊概念,它們被羅列在表2中。比如,Concept 3=({桑塔納,比亞迪G3},{動力性(0.7),加速能力(0.5)}),其中屬性后所列數(shù)值表示該屬性隸屬于此概念的隸屬度。
表2 由表1中抽出的內涵模糊概念
以CS(Kλ)表示模糊形式背景K在置信閾值λ下產生的所有內涵模糊概念。容易證明,上面定義的≤關系是CS(Kλ)上的一個偏序關系,且偏序集(CS(Kλ, ≤)構成了一個格,稱其為內涵模糊概念格。
例如,計算表2中Concept1和Concept3的相似度,則有
圖1給出了由表2所示的模糊形式背景在置信閾值λ=0.5時所得到的內涵模糊概念格,連線上的權重表示其所連接的兩個概念的相似度。
圖1 表2所給定的模糊形式背景在λ=0.5時所獲內涵模糊概念格
定義6設C=(W,VF)是一個內涵模糊概念,稱gran(C)=|W|,即概念外延中所包含的對象的個數(shù),為概念C的粒度。
內涵模糊概念的粒度越小,表明概念的外延越少,內涵屬性越多。概念的粒度越大,表明概念的外延越多,內涵屬性越少。
汽車評價知識庫的構建分為兩個階段: 構建模糊形式背景和內涵模糊概念格。首先,依據(jù)汽車本體[12]抽出評價搭配對構成五元組,將其處理后得到模糊形式背景。然后,在一定的置信閾值下,從構造的模糊形式背景中抽取內涵模糊概念;采用漸進式算法構建對應的內涵模糊概念格;計算相鄰模糊概念的相似度并添加到對應的邊上,形成內涵模糊概念格。最終,構建面向汽車評價的知識庫。主要流程如圖2、圖3所示。
圖2 汽車評價知識庫構建流程圖—構建模糊形式背景
圖3 汽車評價知識庫構建流程圖—構建內涵模糊概念格
4.1 構建模糊形式背景
構建面向汽車評價的模糊形式背景,需要度量屬性對對象即汽車在評價情感方面的影響程度,并用來作為模糊形式背景中的模糊關系R。
定義7設o是一個汽車品牌(對象),a是用于評價汽車的一個屬性(特征),屬性a對對象o的重要度μ(o,a)定義為
算法1構建面向汽車評價的模糊形式背景K。
Input: 汽車評論語料。
Output: 模糊形式背景K。
Step 1: 將原始語料按照車系(g=1,2,…)進行分類存儲。
Step 5: 將Step 4中的五元組按方面分解為6個矩陣表示(行標簽為車系,列標簽為屬性),并依據(jù)公式(5)計算出方面a對車系g的重要度μ(g,a),得到面向汽車評價的模糊形式背景K。
4.2 構建內涵模糊概念格
本節(jié)在Godin[14]的漸進式概念格構建算法中,對概念添加相應的對象隸屬度,構建面向汽車評價的內涵模糊概念格CS(Kλ)。
算法2構建面向汽車評價的內涵模糊概念格CS(Kλ)。
Input: 面向汽車評價的模糊形式背景K,置信閾值λ。
Output: 面向汽車評價的CS(Kλ)。
Step 1: 更新內涵模糊概念格的最小元。
Step 2: 遍歷現(xiàn)存節(jié)點。
Step 3: 將當前要插入的對象和格中所有的節(jié)點求交集,判斷格中節(jié)點是下面的哪類節(jié)點。
Step 3.1 不變點: 新增對象的屬性和它們的內涵交集是空的;
Step 3.2 更新節(jié)點: 若新增對象擁有的屬性集包含了這些節(jié)點的內涵,則將該對象加到節(jié)點的外延中;
Step 3.3 新增節(jié)點: 若加入的對象的內涵與原來格中某個節(jié)點的內涵的交集不在格中出現(xiàn),則新節(jié)點的父節(jié)點是某個新增節(jié)點或更新節(jié)點。
Step 4: 修改現(xiàn)存節(jié)點或增加新的節(jié)點(給每個節(jié)點的屬性添加相應的隸屬度),并將它放在適當?shù)奈恢谩?/p>
Step 5: 依據(jù)節(jié)點的修改進行邊的修改。
Step 6: 循環(huán)Step2~Step5,直到將所有的對象都用于構建內涵模糊概念格。
Step 7: 依據(jù)公式(4),計算相鄰內涵模糊概念的相似性度量,并將其添加到對應的邊上。
5.1 數(shù)據(jù)及預處理
數(shù)據(jù)選取了新浪汽車網站上價格區(qū)間為5萬~20萬的374個車系的37 646條評論。
首先,通過添加汽車本體中的屬性詞和評價詞到用戶詞典中,利用中科院分詞軟件ICTCLAS將評論數(shù)據(jù)進行分詞,并標注出屬性詞和評價詞。篩選包含屬性詞和評價詞的評論13 013條,相應的車系為338個。相應的語料統(tǒng)計信息如表3所示。
表3 新浪汽車價格區(qū)間為5萬~20萬的汽車評論語料統(tǒng)計信息表
關于汽車評價的每個方面都對應著一定數(shù)量的屬性,經過屬性約簡,這些屬性對應著模糊形式背景中的屬性,汽車六個方面所對應的屬性數(shù)如表4所示。
表4 汽車六個方面所對應的屬性數(shù)
5.2 參數(shù)分析
在汽車評價知識庫的構建過程中,參數(shù)詞窗口大小windsize和置信閾值λ會影響知識庫的構建效果。詞窗口windsize的具體設置依據(jù)文獻[15]。為了分析和說明置信閾值λ對知識庫構建的影響,設計了以下兩個實驗。
實驗1: 置信閾值λ對知識庫規(guī)模的影響。
知識庫的規(guī)模由內涵模糊概念格的規(guī)模所決定,而內涵模糊概念格的規(guī)模可由內涵模糊概念的數(shù)量定量表示。實驗對比了每個方面在9個不同的λ取值點下(從0.1到0.9,步長為0.1)所獲得的內涵模糊概念數(shù)量。圖4和圖5分別給出了“安全性”和“服務性”兩個方面的實驗結果。
圖4 汽車安全性在不同λ值下的內涵模糊概念數(shù)量
圖5 汽車服務性在不同λ值下的內涵模糊概念數(shù)量
由圖4和圖5可知: 隨著λ的增大,內涵模糊概念個數(shù)減少,即知識庫的規(guī)模在減小。λ取值分別為0.593 6和0.415 2時,內涵模糊概念數(shù)目處于平均水平。
實驗2: 置信閾值λ對內涵模糊概念粒度的影響。
本實驗對比了每個方面在不同置信閾值下內涵模糊概念的平均粒度。圖6和圖7分別給出了“安全性”和“服務性”兩個方面的情形。
圖6 汽車安全性在不同λ值下模糊概念平均粒度
圖7 汽車服務性在不同λ值下模糊概念平均粒度
由圖6和圖7可知: 隨著λ的增大,兩個方面的內涵模糊概念平均粒度呈現(xiàn)增大趨勢,在λ值分別取0.593 6和0.415 2時,內涵模糊概念的平均粒度處于平均水平。
上述實驗1和實驗2表明:λ越小,獲得的內涵模糊概念越多,概念的粒度越小,知識庫規(guī)模越大;λ越大,獲得的內涵模糊概念越少,概念的粒度越大,知識庫規(guī)模越小。但在實際應用中,可根據(jù)問題的需要結合領域專家意見合理選擇置信閾值。
5.3 知識庫構建結果
依據(jù)第4.2節(jié)的內涵模糊概念格構建過程和第5.2節(jié)的參數(shù)分析,windsize針對不同的搭配對抽取模式設置為3或5個詞長,得到了15 633個五元組。依據(jù)汽車本體中六個方面的屬性詞將其矩陣化后得到了的模糊形式背景,然后由模糊形式背景構建了內涵模糊概念格這一汽車評價知識庫的表示核心,其中知識以內涵模糊概念來表示,知識庫的框架以格結構來表示。表5所示汽車的六個方面在置信閾值λ取其對應的模糊形式背景K的隸屬度均值時所獲得的概念數(shù)量和概念平均粒度情況。其中,汽車經濟性在λ取隸屬度均值0.271 6時所獲內涵模糊概念格和部分概念如圖8和表6所示。需要說明的是,在圖7中,并沒有標注相鄰概念的相似度。比如,Concept 11和Concept 30的相似度見式(7)。
表5 汽車六個方面的內涵模糊概念發(fā)現(xiàn)結果
圖8 汽車經濟性方面評價的內涵模糊概念格(λ=0.271 6)
??11({派喜,比亞迪F3,賽拉圖,銳歐,海福星,長城C30,風云,獵豹,逍客,SX4,世嘉,福瑞迪,陸風X8,新陽光,天籟,凱美瑞,W5},{費用(0.3158),油耗(0.2753)})12({賽拉圖,標致206,風云,新佳樂,軒逸,逍客,騎士,世嘉,天籟,睿翼,昊銳,比亞迪M6},{性價比(0.2817),油耗(02806)})??
續(xù)表
結合圖8和表6,對如何利用內涵模糊概念格和其中包含的概念進行如下說明。
(1) 由于內涵模糊概念中的外延和內涵是由伽羅瓦連接相互約束的,并且概念的內涵屬性具有隸屬度值,所以概念本身即表達了一些由數(shù)據(jù)支撐的陳述,即知識。比如,由概念Concept 23=({賽拉圖,風云,逍客,世嘉,秀爾,天籟},{性價比(0.281 7),費用(0.315 8)})可知: 賽拉圖、風云、逍客、世嘉、秀爾、天籟等是唯一一組性價比評價均超過0.281 7,且費用評價均超過0.315 8的車型。
(2) 當指定一組屬性時,有可能從內涵模糊概念格中找到與指定屬性完全一致的一類汽車集。例如,指定經濟性方面的屬性{性價比,費用,油耗},則從Concept 30可知,它對應著一組車型,即{賽拉圖,風云,逍客,世嘉,天籟},它們同屬一個評價類別的車,并且這些車在三個屬性上的隸屬度都大于或等于對應的隸屬度(0.281 7,0.315 8,0.280 6)。
(3) 在內涵模糊概念格上的任何一條從上到下的鏈上,排在下面的概念所包含的車型一定比排在上面的概念所包含的車型評價要高。即有規(guī)則:
這個規(guī)則告訴用戶,在搜索到相關汽車集的基礎上需要搜索更高要求的汽車時,可以在內涵模糊概念格中向下搜索。例如,搜索到Concept30中的汽車后,若還想尋找更細粒度的汽車時,可以向下查找它的子概念,分別為Concept35和Concept36。并且可以看到,相比Concept30,在Concept35和Concept36中的屬性都多了一個,而其余三個屬性的隸屬度值保持不變或有所增大。
(4) 概念的關聯(lián)性也是一種知識,通過計算內涵模糊概念間的相似度可以找到評價相近的產品。以Concept30為例,它的超概念為Concept11、Concept12和Concept23,子概念為Concept35和Concept36。Concept30與這些概念的相似度分別為0.673 2、0.640 4、0.680 4、0.375 8和0.712 0。這樣即可找到與Concept30中汽車評價相近的汽車。
(5) 由于格結構的緣故,基于內涵模糊概念格可提高查詢的效率。很多基于屬性的查詢只需在內涵模糊概念格的某一條鏈上查詢即可,而不需要遍歷整個知識庫。
基于內涵模糊概念格還可挖掘更多其他類型的評價知識。
本文針對包含豐富情感信息的產品評論數(shù)據(jù),提出了一種基于內涵模糊概念格的汽車評價知識發(fā)現(xiàn)方法,通過將屬性對評價對象作用形式化為一個模糊關系,在數(shù)據(jù)上加載了一種適用于評價知識發(fā)現(xiàn)的架構,即模糊形式背景。利用定義的內涵模糊概念及其偏序關系,設計了從模糊形式背景中抽取內涵模糊概念和其對應的格結構的算法。通過汽車評價領域的真實數(shù)據(jù),給出了一個構建產品評價知識庫的實例,并對如何利用構建的內涵模糊概念格進行知識抽取進行了說明。未來計劃在構建的汽車評價知識庫的基礎上,從內涵模糊概念格的關聯(lián)規(guī)則等出發(fā)去挖掘知識庫的應用。
[1]EpplerMJ,MengisJ.Theconceptofinformationoverload:areviewofliteraturefromorganizationscience,accounting,marketing,MIS,andrelateddisciplines[J].TheInformationSociety, 2004, 20(5): 325-344.
[2]ErnestDavis.Internationalencyclopediaofthesocial&behavioralsciences[M]. 2nd,Amsterdam:Elsevier, 2015: 98-104.
[3]TanL,ZhuS,ManW.Aknowledgebaseconstructionmethodbasedoncognitivemodel[M].KnowledgeEngineeringandManagement.SpringerBerlinHeidelberg, 2011: 235-240.
[4]GanterB,WilleR.Formalconceptanalysis:mathematicalfoundations[M].Berlin,Springer-Verlag, 1999.
[5]PoelmansJ,KuznetsovSO,IgnatovDI,etal.Formalconceptanalysisinknowledgeprocessing:Asurveyonmodelsandtechniques[J].ExpertSystemswithApplications, 2013, 40(16): 6601-6623.
[6]Díaz-AgudoB,González-CaleroPA.FormalconceptanalysisasasupporttechniqueforCBR[J].Knowledge-basedSystems, 2001, 14(3): 163-171.
[7]MuangprathubJ,BoonjingV,PattaraintakornP.Anewcase-basedclassificationusingincrementalconceptlatticeknowledge[J].Data&KnowledgeEngineering, 2013, 83: 39-53.
[8]L.Zadeh.Fuzzysets[J].InformationandControl, 1965, 8(1): 338-353.
[9]AchicheS,BalazinskiM,BaronL,etal.Toolwearmonitoringusinggenetically-generatedfuzzyknowledgebases[J].EngineeringApplicationsofArtificialIntelligence, 2002, 15(3): 303-314.
[10]TadratJ,BoonjingV,PattaraintakornP.Buildingclassificationrulesforcase-basedclassifierusingfuzzysetsandformalconceptanalysis[C]//Proceedingsofthe5thInternationalConferenceonSoftComputingasTransdisciplinaryScienceandTechnology.ACM, 2008: 13-18.
[11]QuanTT,HuiSC,CaoTH.Afuzzyfca-basedapproachforcitation-baseddocumentretrieval[C]//ProceedingsofIEEEConferenceonCyberneticsandIntelligentSystems, 2004, 1: 578-583.
[12] 馮淑芳, 王素格. 面向觀點挖掘的汽車本體知識庫的構建[J]. 計算機應用與軟件, 2011, 28(5): 45-47.
[13] 薛賓. 基于評價搭配的產品情感傾向聚類方法研究[D]. 太原: 山西大學, 2013.
[14]GodinR.IncrementalconceptformationalgorithmbasedonGalois(concept)lattices[J].ComputationalIntelligence, 1995, 11(2): 246 -267.
[15] 廖健, 王素格, 李德玉, 等. 基于觀點袋模型的汽車評論情感極性分類[J]. 中文信息學報, 2015,29(3): 113-120.
KnowledgeDiscoveryfromCarCommentsBasedonIntensionFuzzyConceptLattice
LI Yang1, GUO Xiaomin1, WANG Suge1,2, LIANG Jiye1,2
(1. School of Computer & Information Technology, Shanxi University, Taiyuan, Shanxi 030006, China; 2. MOE Key Laboratory of Computational Intelligence and Chinese Information Processing, Shanxi University, Taiyuan, Shanxi 030006, China)
To utilize car comments efficiently, this paper extracts collocations from reviews texts, and proposes the 5-tupel based evaluation measurement of objects. With such built fuzzy formal context of car comments, we define intension fuzzy concept and intension fuzzy concept lattice. We design the algorithms for constructing a fuzzy formal context and an intension fuzzy concept lattice, and illustrate how to conduct knowledge discovery based on an intension fuzzy concept lattice with a real example.
car evaluation; knowledge discovery; fuzzy formal concept analysis; intension fuzzy concept; intension fuzzy concept lattice
李旸(1988—),博士研究生,主要研究領域為文本情感分析。
郭曉敏(1990—),碩士,主要研究領域為文本情感分析。
王素格(1964—),博士,教授,主要研究領域為自然語言處理與文本情感分析。
1003-0077(2017)03-0069-08
2015-08-15定稿日期: 2015-12-15
國家自然科學基金(61573231,61632011,61432011,61672331);山西省科技基礎條件平臺計劃(2015091001-0102)
TP391
: A