汪培莊
(遼寧工程技術(shù)大學(xué) 智能工程與數(shù)學(xué)研究院,遼寧 阜新,123000)
一場(chǎng)重大的科技革命必以一門新學(xué)科作為標(biāo)志,這門新學(xué)科又必須以一支新數(shù)學(xué)作為支撐。工業(yè)革命以牛頓力學(xué)為標(biāo)志學(xué)科,以微積分作為數(shù)學(xué)支撐。信息革命以信息科學(xué)作為標(biāo)志,機(jī)制主義人工智能理論[1-2]是把結(jié)構(gòu)主義、功能主義和行為主義這三大流派有機(jī)統(tǒng)一起來的以柔性邏輯[3]包容的通用人工智能理論,是信息科學(xué)的重要發(fā)展。那么,什么是信息科學(xué)的數(shù)學(xué)支撐呢?本文對(duì)此問題的回答是,因素空間是機(jī)制主義人工智能理論的數(shù)學(xué)基礎(chǔ), 它是為迎接人工智能的深刻革命而作的數(shù)學(xué)準(zhǔn)備。
信息科學(xué)與物質(zhì)科學(xué)的根本差別是有沒有認(rèn)識(shí)主體的參與??腕w是離開認(rèn)識(shí)主體的存在,認(rèn)識(shí)主體按其目標(biāo)需求從客體信息提取語義信息,再將語義信息轉(zhuǎn)化為知識(shí),提高智能,改造主、客觀世界,這就是信息科學(xué)的主要內(nèi)容。因素是信息提取的導(dǎo)向標(biāo),是信息向知識(shí)轉(zhuǎn)化的分析與融合器。信息生態(tài)的機(jī)制就是要以因素為導(dǎo)向,首先關(guān)注客體的形式與效用這兩個(gè)方面。用目標(biāo)需求從后往前倒逼,用儲(chǔ)備的知識(shí)從前往后疏通,這樣前后夾逼,所得到的語義信息就是形式與效用相統(tǒng)一的全信息??腕w的狀態(tài)千變?nèi)f化,必須用因素來進(jìn)行分析與綜合,例如形狀、大小、顏色、質(zhì)量等,統(tǒng)稱為狀態(tài)因素,狀態(tài)因素使人形成對(duì)事物外形的知覺。事物的內(nèi)在屬性也要用因素來梳理,杯子可以是日常飲具或者是保健食品容器,也可能是供人鑒賞的藝術(shù)品,不同的目標(biāo)需求按效用來觀察事物的內(nèi)在屬性,屬性因素揭示事物的內(nèi)在效用。狀態(tài)因素與屬性因素之間的結(jié)合衍生出特定的概念;因素之間的相互關(guān)聯(lián)決定事物的因果,提供邏輯推理以進(jìn)行決策?;谝蛩乜臻g理論所建立的數(shù)據(jù)庫以培植數(shù)據(jù)的方式來實(shí)現(xiàn)數(shù)據(jù)生態(tài)與知識(shí)生態(tài)之間的同構(gòu),用因素來組織數(shù)據(jù),運(yùn)用知識(shí)把傳統(tǒng)的搜索技術(shù)提到一個(gè)新的高度,這些都是機(jī)制主義人工智能所需要的數(shù)學(xué)理論和方法。
什么是因素?按字面來理解,因字既言本事物之所以是,亦言它事物之所以生。前者講事物構(gòu)成,后者講因果關(guān)聯(lián)。因素非因,乃因之素。雨量充沛是豐收的一個(gè)原因,但它不是因素。因素是降雨量,由它統(tǒng)領(lǐng)“洪澇”、“雨量充沛”、“雨量欠缺”和“干旱”等性狀。因素通過變化來顯示其影響。如果降雨量的變化不能改變豐收這一結(jié)果的話,那么雨量充沛就不是豐收的原因;降雨量之所以對(duì)古代農(nóng)業(yè)那么重要,是因?yàn)樗淖兓瓤梢允勾蟊娤灿S收,也可以使遍地顆粒無收,這才使人們知道降雨量對(duì)糧食收成來說是多么重要的一個(gè)因素,遇到少雨就要考慮防旱。從原因到因素是人在認(rèn)識(shí)上的一種升華。只有掌握因素才能找到原因,看透原因。因素是比屬性高一個(gè)層次的東西,它是屬性的統(tǒng)領(lǐng),是屬性之名。事物都是質(zhì)與量的統(tǒng)一,屬性是質(zhì)表,因素是質(zhì)根。屬性被動(dòng)描寫事物,因素則具有啟發(fā)的特質(zhì),在信息科學(xué)和人工智能的數(shù)學(xué)描述中,因素是一個(gè)特別關(guān)鍵的詞。只有強(qiáng)調(diào)質(zhì)根,才能找到事物和認(rèn)識(shí)的成因。哲學(xué)家早已對(duì)屬性下過定義,但至今仍忽視質(zhì)根。屬性像是珍珠,質(zhì)根是串聯(lián)珍珠的線頭。線頭一斷,珍珠就灑滿遍地,搜索起來格外困難。人腦是信息提取的優(yōu)化結(jié)構(gòu),人腦的感覺細(xì)胞是按特征(即因素)來組織的;生命科學(xué)中所誕生的基因就是生命的質(zhì)根?;蜃钤绲挠⑽拿Q是Factor,因素就是廣義的基因。信息革命需要將打開生命之門的這把鑰匙引向信息之門,哲理指明了因素空間乃是信息科學(xué)和人工智能對(duì)數(shù)學(xué)的期望之所在。
在數(shù)學(xué)上,因素被定義成映射,更具體一點(diǎn)地說,因素是一種性狀映射,它把事物映射成它們的性狀。
定義1[4]設(shè)U是所要討論的一類事物的集合,叫作論域。一個(gè)定義在論域U上的映射f: U→X(f)叫作U上的一個(gè)因素,其中X(f)是映射f所映照出來的事物性狀的集合,叫作f的性狀空間。
性狀有兩種類型,一種是連續(xù)的實(shí)數(shù)值,例如,因素身高可表示為特定的人群U上的一個(gè)映射f =(cm),它把張三映射成實(shí)數(shù)185 cm,把李四映射成175 cm ···這樣的性狀空間叫作定量的性狀空間,此時(shí)的因素就是我們過去所熟悉的變量,變量是一種特殊的因素,因素就是變量的推廣。定量性狀空間是歐氏空間中的一個(gè)超矩形(或),n叫作性狀空間的維數(shù)。因素身高還可以有另外一種形式的性狀空間:X(身高)={高,中,低},它把張三映射成高個(gè)子,把李四映射成中等個(gè)子 ···這是離散的用自然語言描述的性狀,這種性狀空間叫作定性的性狀空間。性狀都是按因素成串地呈現(xiàn),世界上沒有單一的性狀,性狀的數(shù)目m叫作相數(shù),必 須大于1。單一的特征用來識(shí)別時(shí)都是二相,例如,臉上長痣是一種特征,但在識(shí)別過程中注意的焦點(diǎn)不是去描述痣的特性而是要區(qū)別“有痣”和“無痣”,仍是二相映射。為了方便,我們將特征稱為二相因素,但在這樣稱呼時(shí)必須聲明:特征本來指的是痣,是一個(gè)屬性,若把它視為因素,則它就不再是一個(gè)屬性而是一個(gè)二相映射了。因素與屬性是不同層次的東西,前者統(tǒng)帥后者。當(dāng)然,同一個(gè)詞在不同的場(chǎng)合中可以從屬性變?yōu)橐蛩?,也可以從因素變?yōu)閷傩浴?/p>
只取定量性狀空間的因素叫作定量因素,只取定性性狀空間的因素叫作定性因素。這樣稱呼僅僅是為了敘述的方便。嚴(yán)格來說,定性與定量是一對(duì)普遍矛盾,它們對(duì)立統(tǒng)一地寓于事物之中,相互轉(zhuǎn)化,因素既可以定性,也可以定量,我們對(duì)任何因素都同時(shí)預(yù)備著定性與定量兩種性狀空間,以備相互轉(zhuǎn)換。在同時(shí)出現(xiàn)兩種性狀空間的時(shí)候,我們用X(f)來表示定量性狀空間。要將中的性狀轉(zhuǎn)化為 X(f)上的模糊或非模糊子集。這些事情要靠模糊集和直覺模糊集等學(xué)科來完成。這種工作涉及坐標(biāo)框架的標(biāo)定,對(duì)于因素空間來說至關(guān)重要。
定性映射決定論域的劃分。設(shè) f是定義在論域U上的一個(gè)因素,按這個(gè)因素的性狀在論域 U中定義了一個(gè)等價(jià)關(guān)系~:對(duì)任意 u,v∈U , u~v當(dāng)且僅當(dāng)f(u)=f(v)。一個(gè)等價(jià)關(guān)系決定 U中對(duì)象的一個(gè)分類,記對(duì)象u所在的類為 [u]f={v∈U|f(v)=f(u)}。
定義2 記 H(f,U)={[u]|u∈U} ,我們將它稱為f對(duì)U的劃分。
因素有簡(jiǎn)單與復(fù)雜之分,所謂 f 對(duì) U 比 g 對(duì) U的劃分更細(xì) (記作 H(f,U)}H(g,U))是指:任給一個(gè)由g 所分出的類 [u]g,必有 f 所分出的類 [ν]f使 [v]f?[u]g。
定義3 設(shè) f,g 是定義在 U上的兩個(gè)因素,如果H(f,U)}H(g,U),則稱因素 f 比 g 復(fù)雜,記作 f≥g。反之,則稱因素 f 比g 簡(jiǎn)單,記作 f≤g。
不難證明,任給 U上的一個(gè)因素集 F?,(F?,})形(成)一個(gè)偏序集。給定U上的一組因素fj:U→Xfj(j=1,2,···,n),由它們所構(gòu)成的集合F?={f1,f2,···,fn}稱為元因素集。對(duì)F*的任意子集 {f(1),f(2),···,f(k)},可以定義一個(gè)U上的合成因素 F:U→X(F),其狀態(tài)空間是
記此因素的合成運(yùn)算為 F=f(1)∪ f(2)∪···∪ f(k)。式(1)的意思是:合成因素的性狀空間被定義成其所含元空間的笛卡爾乘積。對(duì)于任意兩個(gè)合成因素,我們可以定義它們的二次合成,其性狀空間被定義成兩組元的并集中諸元的性狀空間的乘積。如此可以在 F?的冪集中定義因素之間的任意多次合成運(yùn)算∪。類似地,用兩組元的交集中諸元性狀空間的乘積可以定義因素之間的另外一種運(yùn)算,叫作分解運(yùn)算。分解運(yùn)算可以直觀地理解為提取兩因素的最大子公因素。分解兩個(gè)不含公共元的因素,可得零因素0。一組因素稱為兩兩不可約,如果兩兩之交為0。不難證明 P(F?)=(P(F?);∪,∩)形成一個(gè)因素格,這個(gè)因素格可以由偏序集 (F?,})按下述方式形成:
F?=f1∪ f2∪···∪ fn是在所定義的系統(tǒng)中最大的因素,叫作全因素。由此還可以定義余運(yùn)算c。 Fc的性狀空間是那些不被F所包含的元性狀空間的乘積。不難證明形成一個(gè)因素布爾代數(shù)。
這個(gè)定義在以前一直引用的文獻(xiàn)[5]的基礎(chǔ)上做了簡(jiǎn)化。
所有笛卡爾空間,例如力學(xué)的運(yùn)動(dòng)空間、控制論的狀態(tài)空間、模式識(shí)別的特征空間等,都是性狀空間。它們都可作為因素空間的特例,因素空間是笛卡爾空間的推廣。如圖1所示,任何事物都可以像張三這樣地被映射成為性狀空間中的一個(gè)點(diǎn),因素空間為一般事物的描述提供了普適性的數(shù)學(xué)框架。一群對(duì)象被映射成為性狀空間中的樣本點(diǎn)集。要對(duì)這群對(duì)象分類,就必須將它們投射到因素性狀空間中來進(jìn)行分割。
圖 1 張三被映射為因素空間中的一個(gè)點(diǎn)Fig. 1 Mapping Zhang San mapped to a point in the factor space
定義5[4]給定U上的定性因素空間? =(U,XF?), 對(duì) 任 意 a=(a1,a2,···,an)∈ X, 記 其 在U上的原相為
[a]可能是空集 ?,若 [a]≠ ?,則稱a是一個(gè)實(shí)性狀顆粒,否則稱a是一個(gè)虛組態(tài)。全體實(shí)性狀的集合記為
定義5多用于定性因素,其中的a是指性狀顆粒。但定義5也可用于連續(xù)情形,此時(shí)a細(xì)化為一個(gè)實(shí)數(shù)點(diǎn)。
背景關(guān)系是因素空間的核心概念,下面會(huì)看到它既可以決定概念的自動(dòng)生成,又可決定概念之間的一切推理,由它可以建立知識(shí)描述的確定性理論框架。但現(xiàn)實(shí)中的背景關(guān)系多帶有不確定性。原因有二:1) 性狀粒度往往過大,說一個(gè)人的性狀容易,說一群人的性狀就不確定了,存在著抽樣的隨機(jī)性;2) 定性因素相的劃分不明確,例如年齡這個(gè)因素,究竟怎樣劃分青年、中年和老年?存在著模糊性。為此,要引入背景分布和模糊背景關(guān)系的概念,為了節(jié)省篇幅,本文只介紹背景分布。
設(shè)論域 U=(U,A,p)是一個(gè)概率場(chǎng),? =(U,XF?)是定義在 U 上的一個(gè)因素空間。又設(shè) X =(X,B)是總性狀空間 X 上的一個(gè)可測(cè)結(jié)構(gòu)。若所有 F?中的元fj都是從{U到X的可}測(cè)映射,即對(duì)任 B∈B,都有(B)=u ∈ U|fj(u)∈ B∈ A,則不難證明,所有因素F ∈ P(F?),包括 F?,都是從U到X的可測(cè)映射。
定義6 設(shè)論域 U=(U,A,p)是一個(gè)概率場(chǎng),?=(U,XF?)是定義在 U 上的一個(gè)因素空間,X=(X,B)是總性狀空間上的一個(gè)可測(cè)結(jié)構(gòu)。若所有 F?中的元fj都是可測(cè)映射,記 p=pF?為 p經(jīng)過 F?在 X上(所誘導(dǎo))出來的概率,亦即對(duì)任意 B∈B,都有 p(B)=pF??1(B),那么 p叫 作因素 F?的背景分布。
背景分布是背景關(guān)系的隨機(jī)化。隨機(jī)化后的因素都可視為廣義的隨機(jī)變量,特別對(duì)定性因素而言,因素可以叫作隨機(jī)詞。為了方便,我們常將因素的記號(hào)改為隨機(jī)變量的記號(hào),甚至約定: F?中的元因素的替代符號(hào)是 xi(i=1,2,···,n): F?={x1,x2,···,xn},
為了簡(jiǎn)便,我們以后講可測(cè)因素空間就是指定義6中所說的帶有可測(cè)結(jié)構(gòu)的因素空間而且所有元都是從 U 到 X的隨機(jī)變量。
背景分布 p是背景關(guān)系 R的隨機(jī)化。對(duì)定性因素而言,不難證明,背景關(guān)系 R就是背景分布的支撐,亦即
由此,可以將背景分布的概念推廣到定量因素的情形。
定義7 對(duì)定量因素而言,背景分布密度函數(shù)p(x)的支撐集 R叫作因素元之間的背景集。亦即
數(shù)據(jù)工作者熟知信息系統(tǒng)和形式背景理論,它們?yōu)閿?shù)據(jù)建立了表格,為非數(shù)值信息找到了初步的符號(hào)表示。因素空間理論正是它們的提升,為信息系統(tǒng)建立坐標(biāo)框架,把一張形式系統(tǒng)表可視化地變?yōu)橐蛩匦誀羁臻g的一組樣本點(diǎn),背景關(guān)系就成為它們的母體。背景關(guān)系是因素空間的形骸,塑造這個(gè)形骸的工具就是背景基。
將按因素空間思想組織起來的數(shù)據(jù)叫作因素?cái)?shù)據(jù)庫,主要的庫表叫作因素表,具表頭t =(u;x1,x2,···,xk)。若把對(duì)象去掉,以 s=(x1,x2,···,xk)為表頭,則表中的每一行就是因素空間中的一個(gè)點(diǎn),由于與對(duì)象割斷了聯(lián)系,這個(gè)點(diǎn)就不再反映個(gè)人的隱私。
定義8[4]記S={si=(x1i,x2i,···,xki;yi)|i=1,2,···,m},叫作相樣本或隱私樣本。
因素庫中首先考慮樣本怎樣表現(xiàn)背景關(guān)系。很明顯的事實(shí)是,當(dāng)樣本逼近母體時(shí),相樣本就變成背景關(guān)系。
設(shè) S 是相樣本,始終有 S?R;所有同表頭相樣本的并就是背景關(guān)系:
只要表頭相同,對(duì)相樣本不斷地求并,就可以單調(diào)遞增地逼近目標(biāo)。同表頭的相樣本求并就是行的疊加。這個(gè)過程是可以并行處理的。因素庫的目標(biāo)是要將數(shù)據(jù)培育成背景關(guān)系,形成認(rèn)知包以產(chǎn)生知識(shí)。要使這一思想得以實(shí)現(xiàn),關(guān)鍵在于信息壓縮。
定義9[4]若每個(gè)元性狀空間 X(fj)都是有序集,且背景關(guān)系 R 是 X{ 中的凸集,記} R的所有頂點(diǎn)所成的集為 B=B(R)=P|P是R的頂點(diǎn) ,叫作背景基。將R{ 換作樣本 S ,}記 B 的所有頂點(diǎn)所成的集為叫作樣本背景基。
背景基可以生成背景關(guān)系,它是背景關(guān)系的無信息損失的壓縮,對(duì)因素庫的實(shí)際應(yīng)用具有重要的意義。無論數(shù)據(jù)多大,樣本背景基的數(shù)量始終保持在低維度上。在網(wǎng)上吞吐數(shù)據(jù)時(shí),每輸入一個(gè)新的數(shù)據(jù),都要判斷它是否是樣本背景基的內(nèi)點(diǎn),若是,則刪除此數(shù)據(jù),否則將它納入樣本背景基,此時(shí),要逐一檢驗(yàn)原有的基點(diǎn),它若在新基點(diǎn)中變成內(nèi)點(diǎn),則淘汰刪除之。
夾角判別法[4]P 是 S的一個(gè)內(nèi)點(diǎn)當(dāng)且僅當(dāng)在S 中存在一點(diǎn) Q ,使射線 PQ 與射線 PO形成鈍角,亦即(Q?P,O?P)<0。
例1 在圖2中,S包含三點(diǎn): a=(2,1)、b=(4,5)、c=(5,3),試問d =(2,4)是內(nèi)點(diǎn)嗎? e =(3,2) 呢?
都是非負(fù),d不是S的內(nèi)點(diǎn)。
一旦出現(xiàn)負(fù)數(shù)就是內(nèi)點(diǎn),e是S的內(nèi)點(diǎn)。
圖 2 背景基內(nèi)點(diǎn)的夾角判別法Fig. 2 The angle criterion for inner points of background base
這個(gè)判別法雖然是近似的,正有改進(jìn)研究,但此方法卻有應(yīng)用價(jià)值。計(jì)算量很小,復(fù)雜度是O(nk)(n 是因素個(gè)數(shù),k是樣本點(diǎn)個(gè)數(shù)),能適應(yīng)大數(shù)據(jù)的需求。
因素空間是一個(gè)概念劃分單元,不同單元聯(lián)結(jié)起來形成因素藤。劉增良[6]提出了因素神經(jīng)網(wǎng)絡(luò),使因素空間理論和神經(jīng)網(wǎng)絡(luò)方法結(jié)合起來,把學(xué)習(xí)機(jī)制引入因素空間。因素藤又與因素神經(jīng)網(wǎng)絡(luò)相對(duì)應(yīng),呈現(xiàn)新的活力。黃崇福[7]提出了智聯(lián)網(wǎng),把因素空間作為智聯(lián)網(wǎng)的數(shù)學(xué)刻畫工具,進(jìn)一步上升到網(wǎng)絡(luò)數(shù)學(xué),具有比筆者更加廣闊的視野和更加宏偉的歷史使命。
因素空間是信息系統(tǒng)和形式背景理論的提升,能為客體提供一個(gè)可以存放其形式信息和效用信息的坐標(biāo)系統(tǒng),把關(guān)系數(shù)據(jù)庫中的數(shù)據(jù)變成可視的樣本點(diǎn),它們的母體所形成的背景分布,乃是因素空間的形骸,塑造它的工具是背景基。
1982是不平凡的一年,在這一年中同時(shí)出現(xiàn)了3個(gè)數(shù)學(xué)分支,公開宣稱以知識(shí)和智能作為自己的數(shù)學(xué)研究對(duì)象。在這3個(gè)分支中,首先要介紹的是德國數(shù)學(xué)家R. Wille所提出的形式概念分析(normal concept analysis)[8]。在他以前,數(shù)學(xué)家們認(rèn)為,任何概念的外延都是集合,而任何集合都是概念的外延。Wille明確地對(duì)后一句話說不。他提出了內(nèi)涵和外延的對(duì)合性準(zhǔn)則,認(rèn)為只有滿足對(duì)合性,才能把一個(gè)集合視為一個(gè)概念的外延。給定對(duì)象集O和 屬性集 A,從它們{之中分別取出一組對(duì)象} E和一組屬性 I ,記 f(E)=a∈A|?o∈E;o具有屬性a,它是E 中對(duì)象共有屬}性所形成的集。記g(I)={o∈O|?a∈I;o具有屬性a,它是 I中屬性共同依附的對(duì)象所形成的集。如果 f(E)=I 且記 g(I)=E,則稱配對(duì)a=(I,E)滿足對(duì)合性,并稱 a 是一個(gè)以 I為內(nèi)涵和以E為外延的概念。
他以科教電影《生物與水》的資料制作了1張形式背景表(見表1),其中有8類生物和9種屬性:需要水,b 在水中生活,c 在陸地生活,d有葉綠素,雙子葉,f 單子葉,g 能運(yùn)動(dòng),h 有四肢,i哺乳。表1以對(duì)象為行以屬性為列,當(dāng)且僅當(dāng)?shù)趇對(duì)象具有第j 屬性在第i 行第 j列的格子中出現(xiàn)符號(hào)“×”。為了檢驗(yàn)對(duì)合性,他讓我們先隨意選1個(gè)對(duì)象,螞蟥,即取,它具有屬性 a ,b 和 g ,即 f(E)={a,b,g}=I。然后再從這3個(gè)屬性所在的列,找他們共同依附的對(duì)象有螞蟥、魚和蛙,即 g(I)={1,2,3}=E′,因 E′≠ E,故不滿足對(duì)合性。繼續(xù)往前,看這3個(gè)對(duì)象所共有的屬性是 a 、b 和 g ,即 f(E′)={a,b,g}=I。于是,E′與 I滿足對(duì)合性,這樣我們便找到了一個(gè)對(duì)合配對(duì),這就是水生動(dòng)物的樣本概念 (a∧b∧g,{1,2,3})。之所以稱為樣本概念是因?yàn)檫@概念是從表1生成的,表1只是一個(gè)樣本,所生成的概念是否有效,要看樣本是否接近母體。像這樣地搜索下去,最后找到了19個(gè)概念,按序生成一個(gè)概念體系,他稱之為概念格(見圖3)。
表 1 科教電影“生物與水”的背景Table 1 The background of science and education film"biology and water"
圖 3 “生物與水”的‘概念格’圖Fig. 3 The concept lattice of "biology and water"
需要強(qiáng)調(diào)兩點(diǎn):1)Wille第一次給概念下了一個(gè)嚴(yán)格的數(shù)學(xué)定義,強(qiáng)調(diào)了內(nèi)涵與外延的對(duì)合性。內(nèi)涵是使概念得到統(tǒng)一認(rèn)識(shí)的語義信息,外延是檢驗(yàn)信息傳遞是否符合客觀實(shí)際的關(guān)口。若內(nèi)涵與外延不對(duì)合,信息傳遞就不可能可靠地反映客觀現(xiàn)實(shí),信息科學(xué)的根基便會(huì)動(dòng)搖,所有的信息實(shí)踐活動(dòng)都將缺乏根據(jù)。2)自從他的論文發(fā)表以后,計(jì)算機(jī)就開始自動(dòng)生成概念,這是人工智能的一大飛躍。機(jī)器早就可以證明定理,但機(jī)器卻從未生成概念。定理只能在已有的概念之間兜圈子,人的智能卻能從對(duì)比中產(chǎn)生新的概念,為定理制造新的猜想。Wille必定明白:我們不可能也不需要使機(jī)器像人腦一樣真正地感知世界,但只要機(jī)器能機(jī)械地按他的算法構(gòu)建概念體系,又能保證這個(gè)體系能隨時(shí)回歸聯(lián)通到人腦,就能幫助人類大大加速智力建設(shè)!因?yàn)椋畔⒖茖W(xué)雖與腦學(xué)科緊密相連,但卻有獨(dú)立于人腦的特色,其中存在著用數(shù)學(xué)可以描述的規(guī)律。概念體系無需全部浸泡在感知的海洋里,它可以有間歇地脫離實(shí)際,脫離大腦,就像我們自己的知識(shí)并非每一步都要親眼見到或經(jīng)過大腦(理解)一樣。關(guān)鍵是,只有堅(jiān)持內(nèi)涵與外延的對(duì)合性,機(jī)器自動(dòng)生成的概念才能向人腦回歸和聯(lián)通。沒有回歸聯(lián)通人腦能力的機(jī)器概念體系所具有的功效和價(jià)值為零。
Wille的工作缺陷在于:1)他的形式背景表以屬性來分列,制造了列表困難,由此導(dǎo)致他的算法復(fù)雜。為了尋找對(duì)合的概念,從每一行或列開始搜索,再每兩行或兩列 ······這樣的搜索方式本身就是指數(shù)爆炸的。他一整本書就是為了避免指數(shù)爆炸而設(shè)立各種算法,但仍然無法擺脫N-hard陷阱。2)Wille所說的概念,都是屬性的析取,只含“且”字而不含“或”字,這不是一般概念而是基本概念。對(duì)合性只對(duì)基本概念成立,帶或字的概念是無法對(duì)合的?;靖拍钪荒苄纬砂敫?,所以,他說的概念格應(yīng)該改為基本概念半格。
在此,我們要介紹1982年由以Pawlak為代表的波蘭學(xué)派所提出的粗糙集(rough sets)[9]。粗糙集明確地以數(shù)據(jù)庫為研究對(duì)象,他們的學(xué)派也是KDD(數(shù)據(jù)知識(shí)發(fā)現(xiàn))的倡導(dǎo)者。粗糙集把重點(diǎn)從屬性值轉(zhuǎn)為屬性名。用屬性名列表,避免了Wille的列表困難。所列的表叫作信息系統(tǒng),稱為關(guān)系數(shù)據(jù)庫的庫表。他們用數(shù)學(xué)描述知識(shí),用內(nèi)外夾逼的思想來刻畫概念,提出了決策的一般模型。粗糙集是關(guān)系數(shù)據(jù)庫的數(shù)學(xué)基礎(chǔ)。
形式概念分析雖然與粗糙集同年提出,但卻隱藏了十余年,后來才引起粗糙集學(xué)者們的廣泛重視。Wille的嚴(yán)謹(jǐn)性觸動(dòng)了粗糙集作者的粗獷風(fēng)格,曾在粗糙集文獻(xiàn)中說過:劃分就是知識(shí)。按此說法,任一集合與其余集就是一個(gè)劃分,就是知識(shí),就有概念,這集合就應(yīng)當(dāng)是某個(gè)概念的外延,這就直接違反了Wille的對(duì)合性原則。在這一點(diǎn)上,粗糙集是有缺點(diǎn)的。然而粗糙集突出了屬性名,就是突出了因素,比起形式概念分析,是一個(gè)重大的進(jìn)步,可惜的是,他們并沒有把屬性名提到因素的高度。粗糙集在人工智能的應(yīng)用熱點(diǎn)是屬性約簡(jiǎn),靠的是區(qū)分矩陣,每一個(gè)矩陣方格中放置的是一組屬性名。由這個(gè)矩陣要造就一個(gè)區(qū)分函數(shù),中間必須涉及屬性名的運(yùn)算,可是,粗糙集沒有定義屬性名的運(yùn)算,把它與屬性值的邏輯運(yùn)算混雜在一起,出現(xiàn)數(shù)學(xué)描述的漏洞,所提出的算法也過于繁雜,并沒有取得應(yīng)用的實(shí)效。盡管存在著這些問題,粗糙集仍取得了重要的發(fā)展[10-11]。
因素空間也在1982年由筆者提出[12],早期曾用于模糊智能的研究,直到2012年才與形式概念分析及粗糙集合流。因素空間為概念生成提供了貼切的數(shù)學(xué)描述。人靠什么分男女?靠的是性別。靠什么分中外?靠的是國籍。靠什么分老少?靠的是年齡。性別、國籍和年齡都是因素。同一個(gè)人群按照不同的因素可以做出不同的劃分。它們又可以綜合起來形成更細(xì)的劃分。因素是概念的劃分器,要講概念,必須從因素講起。概念產(chǎn)生于比較,比較發(fā)現(xiàn)異同。但是世界上沒有絕對(duì)的異,也沒有絕對(duì)的同,所謂異同都是相對(duì)于一定因素而言的。因素是比較的角度和依據(jù)。風(fēng)馬牛不相及的東西不能進(jìn)行比較,因?yàn)樗鼈冎g沒有可比較的基礎(chǔ)。因素就是比較基。若 f 代表顏色,a 和 b是有顏色的兩個(gè)東西,我們便可以用“f (a)=f(b)?”來比較 a和 b在顏色方面的異同。若 g 代表吸引力,a和 b是有吸引力可言的兩個(gè)東西,便可以用“g (a)=g(b)?”來比較 a 和 b在吸引力方面的異同。總之,比較離不開因素。一個(gè)因素把事物從一個(gè)方面進(jìn)行劃分,多個(gè)因素把事物從多個(gè)方面進(jìn)行劃分。因素越多,對(duì)事物的劃分就越細(xì),概念產(chǎn)生得就越多。知識(shí)發(fā)展的生態(tài)就是概念的不斷分割過程。嬰兒出世時(shí)只有零概念,其內(nèi)涵是零描述而外延是混沌一團(tuán)的宇宙。生存需求的本能因素把母親從萬物中區(qū)分出來,在外延上進(jìn)行分割。人們形象地把外延稱為概念的團(tuán)粒。概念在何時(shí)不夠用呢?就是目標(biāo)需求的差異發(fā)生在一個(gè)概念團(tuán)粒的內(nèi)部,用這個(gè)概念無法區(qū)分差異,在這個(gè)時(shí)候,認(rèn)知的需求就要力求打破團(tuán)粒,使之由粗變細(xì),而相應(yīng)的內(nèi)涵便要在原概念(稱為上位概念)的內(nèi)涵上再增添新的劃分內(nèi)容。人類的知識(shí)大樹這就是這樣一步一步形成的。每一步都是上位概念的分割,都要靠因素。知識(shí)的圖譜必須以因素作為導(dǎo)引。
新因素對(duì)上位概念團(tuán)粒劃分的貢獻(xiàn)可以用分辨度來刻畫,把U中任意兩個(gè)不同的對(duì)象序列叫作一個(gè)對(duì)子。能分辨的對(duì)子數(shù)目越多,分辨度就越大。
定義10[4]設(shè)
叫作因素 f 對(duì) U中對(duì)象的分辨度。
現(xiàn)在讓我們回到前面所說的背景關(guān)系 R 。 R是性狀空間 X中所有原子內(nèi)涵所成之集,它當(dāng)然是描寫內(nèi)涵的。外延是論域中的事情,但是由于 F是從H(U,F)到 R 的同構(gòu)映射。 R又是論域的代表,所以背景關(guān)系成了內(nèi)涵與外延的重合體,這就使背景關(guān)系R是概念生成的雙料調(diào)色板。
定義11[4]給定定性因素空間 (U,X(F)),設(shè) R是因素 F?={f1,f2,···,fn}的背景關(guān)系,則對(duì)任意 a∈R,稱a=(a,[a])為原子概念,a 和 [a]分別叫作概念 α的原子內(nèi)涵和原子外延;對(duì)任意A ?R,記 [A]=∪{[a]|a∈A},Γ={γ=(A,[A])|A?R},稱 γ=(A,[A])分別是以 A,[A]為內(nèi)涵和外延的概念;稱 Γ =(Γ,∨,∧,?)是由 (U,X(F))所生成的概念布爾代數(shù)。
這個(gè)定義告訴我們,對(duì)于定性因素空間而言,原子概念的提取是不需要計(jì)算的,只要背景關(guān)系知道了,它的每一個(gè)性狀顆粒就決定一個(gè)原子概念。
由原子概念用“且”字連接起來,可以生成其他的所有概念,形成布爾代數(shù),這在計(jì)算機(jī)上就可實(shí)現(xiàn)概念的自動(dòng)生成,理論上極其簡(jiǎn)單。自動(dòng)生成的概念不是怕少而是怕多,設(shè)原子概念的個(gè)數(shù)是 k,則生成的概念個(gè)數(shù)就是 2k。我們需要把概念的范圍縮小,非原子概念不一定滿足對(duì)合性,其中滿足對(duì)合性的概念是哪些呢?
定義12 內(nèi)涵能表為合取范式的概念叫作基本概念。
所謂合取范式就是形如(a11∨a12∨···∨a1k(1))∧···∧(an1∨an2∨···∨ank(n))這樣的式子,其中 ∨與 ∧分別代表“或”與“且”。每個(gè)小括號(hào)都是析取式,最后都用且字合起來。它們?cè)谝蛩氐南嗫臻g中是擬超矩形(聯(lián)通或不聯(lián)通的超矩形)。原子概念都是基本概念。所有基本概念的集合對(duì)合取運(yùn)算封閉,形成一個(gè)半格,叫作基本概念半格。Wille在圖2中所畫的就是基本概念半格,只不過在最下面加了一個(gè)極限概念,它的外延是空集,內(nèi)涵無限制。
定義13 給定因素空間和背景關(guān)系。包含所有原子概念的基本概念子半格叫作粒子半格。
通過粒子半格的建立,能在給定因素下將上位概念團(tuán)粒細(xì)化到所有原子概念。在實(shí)際運(yùn)用中,基本概念半格中的概念還嫌多。粒子半格中不一定有最小的半格,要找的是到達(dá)原子分割步數(shù)盡可能少的粒子半格。下面是所要求的一種基本算法,其復(fù)雜度是
基本算法1 最短粒子半格算法[13]
1) 給定U,計(jì)算每個(gè)因素對(duì)U中對(duì)象的分辨度;
2) 選對(duì)U分辨度最大的因素f來實(shí)現(xiàn)f對(duì)U的分類: 置換對(duì)象足碼即(行足碼)使同類對(duì)象連接在一起;
3) 用所分出的子類U′取代U, 重復(fù)步驟1)和2),直到所有的子類都變成粒子為止,總結(jié)出粒子半格。
例2 給定表2:
表 2 成員狀況因素表Table 2 Member status factors
X=X(f1)×X(f2)×X(f3)={男高重,男高常,男高輕,男中重,男中常,男中輕,男低重,男低常,男低輕,女高重,女高常,女高輕,女中重,女中常,女中輕,女低重,女低常,女低輕}
X被分成18個(gè)格子,去掉其中的虛組態(tài),得到U上3個(gè)因素所形成的背景關(guān)系:
R={男高重,男高常,男中常,男中輕,女中重,女中常,女低常,女低輕}
共有8個(gè)原子內(nèi)涵,這8個(gè)原子內(nèi)涵將U分成8塊:
[男高重]={1, 2, 3}, [男高常]={4, 5}, [男中常]={6, 7, 8}, [男中輕]={9, 10}, [女中重]={11, 12},[女中常]={13, 14, 15}, [女低常]={16}, [女低輕]={17, 18, 19, 20}
于是,對(duì)合性地生成8個(gè)原子概念:
由這8個(gè)原子概念任意取并,可以生成全部概念。例子說明,從背景關(guān)系提取概念代數(shù)的方法是直接方法,是自然對(duì)合的算法,是無需計(jì)算的算法。
布爾代數(shù)中的概念并不都是對(duì)合的,例如:
其內(nèi)涵與外延不滿足對(duì)合性,取并以后就不應(yīng)該再談對(duì)合。
共有28–9=247個(gè)非空的新概念,太多,需要尋找基本概念,這時(shí)才需要基本算法1。
表 3 表2的變換Table 3 Transformation of table 2
此時(shí),對(duì)象已經(jīng)按體重排好,得到分類:
表 4 表3的轉(zhuǎn)換Table 4 Transformation of table 3
同時(shí), C2中的對(duì)象未經(jīng)置換就已經(jīng)按身高排好,于是得到分類:
3類分別與內(nèi)涵常高、常中、常低對(duì)合,得到3個(gè)基本概念 β21=(常高,C21), β22=(常中,C22),β23=(常低,C23)。
同時(shí),C3中的對(duì)象未經(jīng)置換就已經(jīng)按性別排好,于是得到分類:
各子類分別與內(nèi)涵輕中、輕低對(duì)合,得到兩個(gè)基本概念 β31=(輕中,C31),β32=(輕低,C32)。
4) 再就因素 f3(性別)逐類考察,看看該類對(duì)象是否男女分相排列. 發(fā)現(xiàn)性別在所有類中的排列都無需置換,類似可將C22=C221{6,7}+C221{8,13,14,15}得到兩個(gè)基本概念β221=(常中男,C221),β222=(常中女,C222) 。所有類都無法再劃分。
5) 畫出基本概念半格圖(見圖4)
圖 4 成員狀況粒子半格Fig. 4 Member state particle semi-lattice
在此半格中共有13個(gè)基本概念,即 β0=(?,U),β1=(重,C1),β2=(常,C2),β3=(輕,C3),β11=(重高,C11),β12=(重中,C12), β21=(常高,C21), β22=(常中,C22),β23=(常低,C23),β31=(輕中,C31),β32=(輕低,C32),β221=(常中男,C221),β32=(常中女,C222),其中,不能再分的有 β11、 β12、 β21、 β23、 β31、 β32、 β221、 β222等8個(gè),它們就是前述的8個(gè)原子概念。其余5個(gè)基本概念,除β0=(?,U)外, β1=(重, 1, 2, 3, 11, 12),β2=(常, 4, 5, 6, 7,8, 13, 14, 15, 16), β3=(輕, 9, 10, 17, 1819, 20)和β22=(常中, 6, 7, 8, 13, 14, 15)。它們都是我們格外關(guān)心的非原子的基本概念。
基本概念半格的提取,得到的原子概念是相同的,但中間的基本概念半格不是唯一的,與因素劃分的先后次序有關(guān)。好的排序會(huì)加快實(shí)現(xiàn)原子分割,排除冗余的因素最大分辨度原則提供了一種較好的排序。這個(gè)算法強(qiáng)調(diào)的是對(duì)象的足碼置換,就是士兵集合按營、連、排、班站隊(duì)的方法. 具有大數(shù)據(jù)所要求的快捷性。
回到Wille的例子,怎樣用因素空間理論來處理同樣的問題呢?
首先,要將以屬性值分列的表,改為以因素分列的因素表。它有9個(gè)屬性,分屬于7個(gè)因素:f1=需水性,具有性狀空間 X(f1)={Y,N}, f2=棲性,具有性狀空間 X(f2)={水,陸,兩棲}, f3=有無葉綠素,具有性狀空間 X(f3)={Y,N}, f4=單雙子葉,具有性狀空間 X(f4)={單,雙}, f5=能動(dòng)性,具有性狀空間X(f5)={Y,N},f6=有無四肢,具有性狀空間X(f6)={Y,N}, f7=是否哺乳,具有性狀空間X(f7)={Y,N}。于是可將形式背景表1改寫為下面的表5,在表中出現(xiàn)了符號(hào)*,例如問句是單字葉還是雙子葉,這是毫無意義的,不能用No。問螞蟥有四肢嗎?回答雖然是No,但問題卻是有意義的。Wille沒有區(qū)分No和*,都是空白。
表 5 將形式背景表按因素并列Table 5 Juxtaposition of formal background tables by factors
蓄水性這個(gè)因素對(duì)所有對(duì)象的呈相都一樣,沒有變化的因素失去了存在價(jià)值,我們把這一列從表中刪除。同一因素空間中所有因素必須對(duì)所有對(duì)象都有意義,因而我們必須分成兩個(gè)因素空間來處理,對(duì)表5的左列進(jìn)行適當(dāng)變換,得到了表5的右列,就可以分開了。得到表6,表6的左右兩個(gè)表,各是一個(gè)因素空間??梢杂薪患鐥栽趦蓚€(gè)表中都有。
表 6 將形式背景表分解成兩個(gè)因素性狀表Table 6 Form background table is decomposed into two factor traits
我們把不起變化的因素刪除得到表7。
表 7 兩個(gè)因素性狀表的化簡(jiǎn)Table 7 Simplification of the table of two factors
按照因素空間的概念生成理論很容易得到簡(jiǎn)捷的粒子半格(見圖5)。經(jīng)過適當(dāng)處理,可以得到清晰的概念體系。動(dòng)物因素空間生成4個(gè)原子概念:1)無肢非哺水動(dòng)物(NN水,螞蟥);2)有肢非哺水動(dòng)物(YN水,魚);3)哺肢兩棲動(dòng)物(YY水,蛙);4)哺肢陸動(dòng)物(NN水,螞蟥)。還生成兩個(gè)非原子的基本概念:1)非哺水動(dòng)物(N水,{螞蟥,魚});2)哺肢動(dòng)物(YY,{蛙,狗})。植物因素空間生成4個(gè)原子概念:1)水單植物(水單,水草);2)兩棲單植物(兩單,蘆葦);3)陸雙子葉植物 (陸雙,豆);4. 陸單子葉植物(陸單,豆玉米)。還生成兩個(gè)非原子的基本概念:1)單子葉植物 (單,{水草,;蘆葦,玉米}); 2)陸植物 (陸,{豆,玉米})。例畢。
圖 5 因素空間對(duì)生物與水的形式概念分析圖Fig. 5 Formal concept analysis for biological and water based on factors space
因?yàn)閃ille關(guān)于科教事物的“概念格”不能直接翻譯成為一張因素表,所以我們不能用因素空間的結(jié)果來和它進(jìn)行直接的比較。但可以看出,概念格中缺少了幾個(gè)原子概念,這是不符合實(shí)際的。其原因是,對(duì)合性與同因素的不同屬性值之間的對(duì)等性有時(shí)會(huì)發(fā)生沖突。因素空間用性狀顆粒來分類的方法可以避免這種沖突。
回顧一下本節(jié)的內(nèi)容,Wille從內(nèi)涵和外延的對(duì)合性出發(fā),給概念下了嚴(yán)格的數(shù)學(xué)定義,以保障信息傳遞能可靠地反映現(xiàn)實(shí)。他大膽地譜寫了計(jì)算機(jī)自動(dòng)生成概念的新篇章,使機(jī)械制造的概念能隨時(shí)向人腦回歸與聯(lián)通,這是人工智能的一大飛躍。他的形式背景表以屬性來分列,導(dǎo)致算法復(fù)雜,無法擺脫N-hard陷阱。他說的概念格也不準(zhǔn)確,應(yīng)該改為基本概念半格。因素空間繼承他的理論,把形式背景提升為因素空間的核心理論,用因素統(tǒng)帥屬性值,用背景關(guān)系來定義原子概念,自然對(duì)合,無需計(jì)算。對(duì)于基本概念也有3次冪以下的簡(jiǎn)捷算法。
Wille不知道機(jī)制主義的人工智能理論,對(duì)形式(語法)信息、效用信息和語義全信息不加區(qū)分,他所舉的例子都是語法信息。所以,本節(jié)可以視為形式信息的提取。至于如何用因素空間將形式信息與效用信息向語義信息,提升,是我們?cè)谙乱还?jié)要做的事情。
在介紹語義信息提升之前,先介紹因素之間的關(guān)聯(lián)特性。
則稱因素 f1,f2,···,fn是相對(duì)獨(dú)立的。
不難證明,相互獨(dú)立一定相對(duì)獨(dú)立,反之不盡然。不相對(duì)獨(dú)立的一組因素,它們的背景關(guān)系不能涵蓋整個(gè)笛卡爾乘積空間,這說明它們的性狀搭配是受到制約的,這種制約反映了它們之間是相互關(guān)聯(lián)的
定義15 若。R ≠ X(f1)× X(f2)×···× X(fn)則稱因素f1,f2,···,fn之間有關(guān)聯(lián)。
取n = 2,采用1.2節(jié)中約定的簡(jiǎn)單記號(hào)。若R≠X(x)×X(y),則因素 x 與 y之間互有關(guān)聯(lián)。對(duì)任意x∈X ,記 R(x)={y∈Y|(x,y)∈R},叫作 R 在 x點(diǎn)的截集,它是 Y的子集。
對(duì)于定性因素而言,記 |R(x)|為R(x)中所含性狀顆粒的個(gè)數(shù)。若 |R(x)|越小,則 x 對(duì) y的制約性越強(qiáng)。
記RX={x|?y∈ Y;(x,y)∈ R}和RY={y|?x∈ X;(x,y)∈R}分別叫作 R 在 X 和 Y 中的投影。 (RX)c叫作x 對(duì) y 的盲區(qū), (RY)c叫作 y 對(duì) x的盲區(qū)。排除盲區(qū)可以提高搜索效率。
R的領(lǐng)域越小,關(guān)聯(lián)性越強(qiáng)。當(dāng)小到只有一個(gè)性狀顆粒 (a,b)的時(shí)候,則輸入 x的 任意前提 A,關(guān)聯(lián)到y(tǒng) 只有兩種可能:若 A 包含 a ,則 y=b ,否則 y≠b。當(dāng)b 是關(guān)鍵性狀時(shí),R 可以用作由x 測(cè)y 的精準(zhǔn)預(yù)報(bào)器。
對(duì)于定性因素而言,若存在一個(gè) a∈X,使|R(a)|=1,則 x 對(duì) y的最大制約強(qiáng)度達(dá)到1。此時(shí)截集 R(x)只能包含一個(gè)性狀顆粒,設(shè)為 b,這便引出了因果律:若 x=a 則y =b。
因素間互為因果,若將因素 x當(dāng)作條件因素而將 y當(dāng) 作結(jié)果因素,對(duì)任意 E?X,E′?Y,以E(x)表示x∈E ,以 E′(y)表示 y∈E,試問在何種條件下,才能保證有 E(x)→ E′(y)?
注意, x、y 本身可以是復(fù)雜因素, X,Y可以是任意高維的,這個(gè)定理適用于任意維數(shù)的空間,它說明背景關(guān)系決定了因素X到Y(jié)的全部因果律。
這個(gè)定理證明的思路很簡(jiǎn)單,在圖6中把 X的子集 E 拿到 X×Y 中來就變成它的柱體擴(kuò)張 E×Y;把Y 的子集 E′拿到X×Y中來就變成它的柱體擴(kuò)張X×E′。它們都是 X×Y中的子集,就可以檢驗(yàn)一下E×Y是否被X×E′所包含,若是,則二者形成前因與后果。但注意, X×Y中有很多點(diǎn)是虛空的,背景集R才 是實(shí)際存在的疆域,所以二者都要與 R取交然后才能比較。式(10)又可寫成
符號(hào) ?R叫作在背景 R之下的蘊(yùn)涵關(guān)系。因素空間以背景蘊(yùn)涵為集運(yùn)算(,以背景推理為邏輯。)
怎樣從表頭為 T=u;f1,f2,···,fn?1;g=fn的相樣本 S 中來提取因果規(guī)則呢?設(shè) s∈X(f),t∈X(g),記[s]={u|f(u)=t},[t]={u|g(u)=t}。
圖 6 背景關(guān)系決定因果Fig. 6 Determinants of background relations
定義16 如果 [s]?[t],則稱 [s]是因素 f的一個(gè)決定類。因素 f的所有決定類的并集叫作它對(duì)結(jié)果的決定域。因素 f 的決定域所占行數(shù) h與表的行數(shù)(即全體對(duì)象個(gè)數(shù))m之比稱為它對(duì)結(jié)果的決定度[14],記作 c(f)=h/m。
條件因素 f與結(jié)果因素 g 都在對(duì) U進(jìn)行分類,如果 f 分出的某個(gè)類 [s]變成 g 的一個(gè)類 [t],則 [s]中的對(duì)象都具有相同的結(jié)果t,這時(shí)就得到一個(gè)推理句:“若u∈[s]則 g(u)=t ” 。若記 x=f(u),x=f(u),則推理句變?yōu)椤叭?x=s ,則 y=t”,簡(jiǎn)寫為s→t。于是,因素表就可以對(duì)諸條件因素進(jìn)行劃分,類越分越細(xì),鉆入結(jié)果類的機(jī)會(huì)就越來越多,得到的推理句也越來越多,直到不能再分為止。整個(gè)表就轉(zhuǎn)化為一組規(guī)則,叫作因果規(guī)則,這種方法叫作因果分析法。在大數(shù)據(jù)面前,必須進(jìn)行因素的約簡(jiǎn),這與因素的分類次序相關(guān),下面算法的思想是按決定度的大小次序來排列,使因素能得到較好的約簡(jiǎn)。
基本算法2 因果關(guān)聯(lián)
給定以表頭 T=(u;f1,···,fk;g)為表頭的因素表S,要從表中提取因果關(guān)聯(lián)規(guī)則,可采取下列步驟:
1) 計(jì)算各個(gè)因素 fj對(duì)結(jié)果 g的決定度;
2)選決定度最大的因素對(duì) U分類,若出現(xiàn)能鉆入結(jié)果類的類別,就寫出相應(yīng)的因果句;逐次細(xì)化分類,直到所分類全部鉆入結(jié)果類或不能再分為止。所有因果句的全體稱為因果規(guī)則集。
因果關(guān)聯(lián)規(guī)則的提取,是一種有用的歸納方法,具有很高的概括性,是歸納、學(xué)習(xí)、分類、評(píng)價(jià)、預(yù)測(cè)、控制等高級(jí)思維活動(dòng)的統(tǒng)一算法。以它為基礎(chǔ)可以向任何領(lǐng)域精細(xì)化。該法與決策樹的算法很相似,只是用決定度取代了信息增益。在這方面已經(jīng)發(fā)表了很多關(guān)于因素空間的文章[15-19]。
有了以上的準(zhǔn)備,讓我們來處理語義信息的提升問題。狀態(tài)與效用是有緊密關(guān)聯(lián)的兩個(gè)或兩組因素。利用這兩組因素的數(shù)據(jù)可以提取從狀態(tài)到效用的因果關(guān)聯(lián),得到一組因果規(guī)則作為知識(shí)儲(chǔ)備起來,當(dāng)要從形式信息推測(cè)效用信息的時(shí)候,就要利用狀態(tài)效用因果關(guān)聯(lián)所提供的一組規(guī)則??纯次覀兯鎸?duì)的對(duì)象,其狀態(tài)和那條規(guī)則的前件相匹配,就推斷它有哪種效用。若硬匹配不行,就用相似性測(cè)度,選最貼近的一個(gè)作為推斷,最后將形式信息與效用信息結(jié)合起來,得到語義信息,這就是從形式信息向語義信息的提升過程。
例3 服務(wù)對(duì)象狀況到服務(wù)效用的因果關(guān)聯(lián)
表8給出了用戶(服務(wù)對(duì)象)的狀況和服務(wù)效用之間的關(guān)聯(lián)數(shù)據(jù),把用戶狀況看作形式信息,把購買力看作服務(wù)效用信息,我們要來分析從形式信息到效用信息的因果關(guān)聯(lián)。具體地說,要提取從用戶狀況來判斷其購買力。表達(dá)形式信息有4個(gè)因素:f1=年齡,具有性狀空間 X(f1)={老,中,青};f2=職業(yè),X(f2)={師,生,商};f3=信貸,X(f3)={好,可,差};f4=收入,X(f4)={高,平,低};效用形式的因素是g=購買力,具有性狀空間X(g)={購買, 不買}。
表 8 因果關(guān)聯(lián)分析表Table 8 Causal association analysis table
先看因素f1與因素g之間的因果關(guān)系。按年齡可把9個(gè)用戶分成老、中、青3類,從表8中可以看到這 3 類分別是:[老]={1, 5, 6},[中]={2, 4, 9},[青]={3, 7, 8}。這3類有哪一類是對(duì)購買的決定類呢?在3個(gè)老年用戶中,用戶1和5是不買,用戶6是購買,他們的購買情況不一致,就不是對(duì)購買的決定類。再看中年用戶2、4和9,他們都是購買,于是[中]就可以鉆入[購買],[中]就是 g 的一個(gè)決定類。青年用戶不是決定類。所以年齡對(duì)g的決定度是3/9。
類似地,對(duì)因素職業(yè)來說, [師]={1, 2, 9}, [生]={3, 7, 8},[商]={4, 5, 6},他們都不是決定類 f2對(duì)g的決定度=0;對(duì)因素還貸來說, [好]={2, 6, 9},[可]={3, 4, 5}, [差]={1, 7, 8},還貸好的用戶類[好]鉆入[購買],還貸差的用戶類[差]鉆入[不買],都是決定類,f3對(duì)g的決定度是 6/9;對(duì)因素收入來說,只有收入高的用戶類[高]是決定類,f4對(duì)g的決定度是2/9。
選取決定度最高的因素“信貸”,它有兩個(gè)決定類,由這兩個(gè)決定類的鉆入情況分別得到兩個(gè)因果推理句:
因果規(guī)則1:信貸好購買。
因果規(guī)則2:信貸差不買。
從論域中刪除這兩個(gè)決定類,得到新的論域,取U′=[可]={3,4,5},得表 9。
表 9 由表8的刪除而得的表Table 9 A table obtained by the deletion of table 8
按表9重新計(jì)算各個(gè)因素對(duì)g的決定度。取決定度最大的因素f1,它有3個(gè)決定類:[老]={5},[中]={4},[青]={3},分別寫成下列推理句:
因果規(guī)則3:信貸可且年齡不老→購買。
因果規(guī)則4:信貸可且年齡老→不買。
因果規(guī)則5:信貸可且年齡青→購買。
刪除表中的用戶3、4和5,表9被刪空,因果規(guī)則提取完畢。最后共得到五條因果規(guī)則。面對(duì)一個(gè)新用戶,只需先查他的信貸狀況,再補(bǔ)充考慮其年齡,就可以判斷其購買傾向。 例畢。
因果規(guī)則的可靠性依賴于樣本的大小和準(zhǔn)確性,還要隨時(shí)間場(chǎng)合的變化而不斷調(diào)整。
本節(jié)介紹了因素空間如何將形式信息與效用信息關(guān)聯(lián)起來,提升為全面的語義信息。以上兩節(jié)為機(jī)制主義人工智能的信息轉(zhuǎn)化第一定律提供了有用的數(shù)學(xué)理論。
在實(shí)現(xiàn)信息向知識(shí)的轉(zhuǎn)化中,需要有更好的搜索工具。因素是啟發(fā)指引搜索的關(guān)鍵詞。本節(jié)將介紹如何用因素思維實(shí)現(xiàn)目標(biāo)因素與場(chǎng)景因素的對(duì)接和搜索,為信息轉(zhuǎn)化的第二定律從數(shù)學(xué)上作一點(diǎn)探索性的思考。傳統(tǒng)人工智能教科書上以九宮棋來講述搜索策略,為了說明思想,本節(jié)特以九宮棋為例來進(jìn)行闡述。要想使用因素空間理論進(jìn)行信息的智能化處理,先要在思維上習(xí)慣于因素分析。隨時(shí)隨處都要問:“我思考的目標(biāo)是什么?我面臨的對(duì)象是什么?要使二者合籠,最為關(guān)鍵的因素是什么?”下面以下九宮棋為例來說明這個(gè)問題。
1) 確立目標(biāo),選定目標(biāo)因素
智能是一個(gè)目標(biāo)驅(qū)動(dòng)的活動(dòng),下棋也是這樣,在任何比賽中,棋手的目標(biāo)是贏得比賽。獲勝是棋手的目標(biāo)因素。
2) 注意對(duì)象,確定對(duì)象因素
目標(biāo)因素的實(shí)現(xiàn)離不開對(duì)象描述。九宮棋的對(duì)象描述依賴于兩個(gè)對(duì)象因素:棋盤和游戲規(guī)則。
棋盤。九宮棋的棋盤是由3條橫線和3條豎線繪制的9點(diǎn)陣。在人工智能書中,也被描述成3行3列的九宮格。
游戲規(guī)則。分別由執(zhí)黑白兩色棋子的棋手交替放子于棋盤未被占用的格子點(diǎn)上,黑子先手。如果一方在1條線(水平、垂直或?qū)蔷€)上連接放上了3個(gè)棋子,該方就贏;如果在棋盤的所有格點(diǎn)都被占用時(shí)仍沒有贏家,那就成和棋。這兩種結(jié)局都叫作下完了一盤棋。
一盤棋在下完第t步棋時(shí),黑白子在棋盤上的分布狀態(tài)可以描述為一個(gè)3×3的矩陣,元素bij描述第i 條橫線和第 j條豎線交點(diǎn)所呈現(xiàn)的狀況(白、黑或空), B(t)叫作一個(gè)棋局。下三子棋的論域U 是所有棋局的集合: U ={{B(t)}|t=1,2,···,t?}},其中t?是下完一盤棋的步數(shù),總有 t?≤ 9。
3) 目標(biāo)因素與對(duì)象因素的對(duì)接
因素空間在哪里?因素空間在目標(biāo)因素與對(duì)象因素對(duì)接的過程中出現(xiàn)。設(shè) O是目標(biāo)因素,它有性狀空間{白勝,黑勝,對(duì)弈}。對(duì)象因素是什么?黑方為了取勝,首先需要從棋盤中選擇下子的位置,這就要考慮9個(gè)格子點(diǎn)在博弈中各自具有的戰(zhàn)略地位。對(duì)每一步棋,建立1個(gè)因素 ft,ft稱為第t 步棋的“點(diǎn)勢(shì)”,其性狀空間是 X(ft)={中心,頂點(diǎn),邊點(diǎn)}。9個(gè)格子點(diǎn)中有1個(gè)中心、4個(gè)頂點(diǎn)和4個(gè)邊點(diǎn)。中心是4條線的交匯,頂點(diǎn)是3條線的交匯,邊點(diǎn)是2條線的交匯。搶占中心是決定勝負(fù)的關(guān)鍵。黑子下了一步棋之后,還要考慮白子如何應(yīng)對(duì),所涉及的因素記為 gt,它具有性狀空間X(gt)={搶占中心,堵于頂點(diǎn),堵于邊點(diǎn),放任},于是就出現(xiàn)了一個(gè)最簡(jiǎn)單的因素空間 (U,XFo),其中Fo={f1,g2,f3,g4,f5,g6,···;hi(t?),O(t?)}, h 表示 f 或 g。
有了因素空間,就可以應(yīng)用因素空間的理論。將f1,g2,f3,g4,f5,g6,···,hf(t?)當(dāng)作條件因素,而將O(t?)當(dāng)作結(jié)果因素來設(shè)計(jì)因素?cái)?shù)據(jù)庫。我們從數(shù)據(jù)庫中選了100個(gè)樣本點(diǎn),也就是下了100盤棋來進(jìn)行學(xué)習(xí),得到因素表10(為了節(jié)省篇幅,不寫被約間的因素)。
表 10 一字棋的因果關(guān)聯(lián)分析表Table 10 A causal link analysis table for Chinese characters
應(yīng)用因素空間的因果分析算法2,可以從表10中提取因果規(guī)則:如果 f1=中心,則“O (t?)=黑勝”的頻率是84/90。這一規(guī)則說明,只要黑子在第一步占領(lǐng)中心,對(duì)方就只有招架之功而無還手之力。黑方很容易取勝。
4) 精細(xì)化與棋譜
為了使這一規(guī)則更加確切,需要分析黑棋不能取勝的原因。要區(qū)分情況就要增加因素。當(dāng)黑子占中心點(diǎn)以后,再下一子,無論下在何處,必與中心相連而構(gòu)成一字的勝利威脅。此時(shí)白子必在對(duì)稱點(diǎn)上堵截。黑子求勝必須在被圍堵的情況下形成一字?在圖1的第三局勢(shì)中,畫了兩條一字線,只要第二枚黑子下在這兩條紅線(但不包括右下角)上,黑棋就能取勝,否則下和。這就形成一個(gè)棋譜(見圖7)。
圖 7 棋譜1的圖示Fig. 7 Chess 1 Icon
在這個(gè)棋譜中有一個(gè)關(guān)鍵詞,就是希望線。
如果白棋堵在邊上,在圖2的第3局勢(shì)中,畫了兩條一字線,第2黑子下在這兩條紅線的任何一條上,黑棋就能取勝,否則下和。這就形成一個(gè)棋譜 (見圖 8)。
圖 8 棋譜2的圖示Fig. 8 Chess 2 Icon
當(dāng)黑棋失誤被白棋搶占了中心以后,白棋取勝的細(xì)節(jié)可以進(jìn)一步引進(jìn)新的因素來進(jìn)行分析,不再詳說。如何引進(jìn)新的因素,在這里還是要靠人的因素思維。
早在20世紀(jì)60年代,筆者參與了在我國高校設(shè)立概率論課程的工作。在那時(shí),筆者就用因素空間來處理柯爾莫戈洛夫所提出的概率基本空間[20]。一枚硬幣在一次投擲中可能出現(xiàn)兩個(gè)基本事件,得到基本空間={正,反}。要弄清楚這兩個(gè)基本事件為什么是隨機(jī)的,就要找出那些影響硬幣面向的因素,如硬幣性狀、手的動(dòng)作、桌面條件、環(huán)境影響等,這些因素都會(huì)對(duì)結(jié)果產(chǎn)生影響。我們可以作這樣一個(gè)決定論性的假設(shè):當(dāng)所有因素的狀態(tài)都固定以后,所得的結(jié)果便會(huì)唯一確定。如其不然,就必有其他某些具有影響力的因素尚未被考慮到,若把這些被遺漏的因素統(tǒng)統(tǒng)都考慮進(jìn)去,則這個(gè)決定性假設(shè)便應(yīng)告成立。每個(gè)因素都有一個(gè)狀態(tài)變化的維度,所有這些因素就張成一個(gè)高維空間,這正是我們后來所說的因素空間。是因素的集合,的充分性便確定了從到的一個(gè)映射,使偶然現(xiàn)象得到必然性的描述。充分的條件可以導(dǎo)致必然的結(jié)果;但若存在著難以觀測(cè)和控制的因素,則人的辨別和控制范圍便從點(diǎn)x蛻化成為團(tuán)粒。在進(jìn)行一種試驗(yàn)時(shí),所能識(shí)控的范圍叫作條件。我們只知在中但卻不知在其中的何處,當(dāng)?shù)姆秶缭搅苏磧擅娴倪吔鐣r(shí),確定性就轉(zhuǎn)化為隨機(jī)性,世界是必然的也是隨機(jī)的,這是辯證的統(tǒng)一,否定任何一方都是錯(cuò)誤的。我們不承認(rèn)隨機(jī)性可以被消滅,但是卻承認(rèn)二者可以相互轉(zhuǎn)化,只有用因素空間來描述基本空間才能刻畫這種轉(zhuǎn)化。柯爾莫戈洛夫心目中所要定義的基本空間其實(shí)就是一個(gè)因素空間。
不充分的條件也是條件,它雖不能決定結(jié)果但卻能制約結(jié)果的發(fā)生頻率,體現(xiàn)這種內(nèi)在必然性聯(lián)系的就是概率,概率是廣義的因果律。概率論是一種廣義的因果論,這就注定了概率統(tǒng)計(jì)會(huì)在人工智能中占有重要的地位,我們現(xiàn)在能對(duì)概率論有這樣一種較為深刻的認(rèn)識(shí),是因?yàn)橛辛艘蛩乜臻g。
用因素空間來構(gòu)造基本空間,可以實(shí)現(xiàn)決定性向隨機(jī)性的逼進(jìn)。概率論不僅要研究概率的邏輯規(guī)律,更應(yīng)實(shí)現(xiàn)隨機(jī)性向確定性的轉(zhuǎn)化。雖然,大數(shù)定律和貝葉斯概率都體現(xiàn)這種轉(zhuǎn)化,但還有很大的發(fā)展空間。筆者所提的構(gòu)架是,將基本空間的因素分為兩個(gè)部分,可觀察、可控的因素算第1部分,這部分因素所導(dǎo)引的變量是非隨機(jī)變量,余下的因素算第2部分,統(tǒng)歸為一個(gè)余因素[12],它所引導(dǎo)的變量是隨機(jī)性的。從中挑選出少數(shù)幾個(gè)特別突出的因素作為精細(xì)處理的對(duì)象,剩下那些影響微弱且相互獨(dú)立的眾多因素,都?xì)w順于中心極限定理。這樣一來,隨機(jī)變量的一般分解式為
1965年,Zadeh教授提出了模糊集合論[21],這是人工智能在數(shù)學(xué)上取得突破的重要?dú)v史進(jìn)展。他把模糊集定義成從論域到[0, 1]上的一個(gè)映射表示對(duì)的隸屬程度;至于論域是什么,則很少有人問津。然而,論域是刻畫模糊信息極為重要的一環(huán),筆者提出因素空間的理論來刻畫論域,以實(shí)現(xiàn)模糊性與清晰性之間的相互轉(zhuǎn)換。例如,年輕是一個(gè)模糊概念,要看一個(gè)人是否年輕,單就年齡這個(gè)因素打分(確定隸屬度)相當(dāng)困難。若加上因素面貌,打起分來就容易一些;若再加上精力、體魄、反應(yīng)、朝氣等因素,打分就更容易了。問題的關(guān)鍵是因素的增加會(huì)降低認(rèn)識(shí)的模糊性。
模糊數(shù)學(xué)與概率論都需要因素空間的理論,借用因素空間可以探討隨機(jī)性與模糊性這兩種不確定性之間的聯(lián)系與區(qū)別。在隨機(jī)試驗(yàn)中,事件是因素空間中一個(gè)固定的集合,因素的變異點(diǎn)在條件域中變,所以隨機(jī)試驗(yàn)?zāi)P偷奶卣魇恰叭θ潭?,點(diǎn)子在變”。模糊試驗(yàn)則相反,要考慮張三是否年輕,張三是論域中的一個(gè)固定的點(diǎn)子,年輕這一模糊概念在人的腦海中有著不確定的邊界,成了在變的圈圈,模糊試驗(yàn)?zāi)P偷奶卣魇恰包c(diǎn)子固定,圈圈在變”。這種對(duì)偶性有很深刻的意義,在數(shù)學(xué)上可用論域(地面)和冪集(天上)來作一種轉(zhuǎn)換:中的圈圈變成里的一個(gè)點(diǎn),中的點(diǎn)子可以變成上的一個(gè)圈圈,于是地上的模糊試驗(yàn)就可轉(zhuǎn)化成天上的隨機(jī)試驗(yàn)。天上的隨機(jī)變量是隨機(jī)集,相應(yīng)的統(tǒng)計(jì)不是普通的數(shù)理統(tǒng)計(jì)而是集值統(tǒng)計(jì)或區(qū)間統(tǒng)計(jì)。靠著隨機(jī)區(qū)間對(duì)的覆蓋頻率來確定隸屬度,隸屬曲線就成了隨機(jī)集的落影,這就形成了模糊落影理論[22]。文獻(xiàn)[22]把序、拓?fù)浜涂蓽y(cè)結(jié)構(gòu)提升到冪上,建立了8種超拓?fù)浜统蓽y(cè)結(jié)構(gòu),由之建立了隨機(jī)集和信度的嚴(yán)密數(shù)學(xué)理論,證明了4種非可加信度與隨機(jī)集分布對(duì)應(yīng)關(guān)系的存在性和唯一性定理,把測(cè)度擴(kuò)張定理的擴(kuò)張起點(diǎn)從半環(huán)提前到π-系,這是一個(gè)有相當(dāng)難度的數(shù)學(xué)成果。1988年,北師大張洪敏等研究生在筆者指導(dǎo)下研制出國際第二臺(tái)模糊推理機(jī)[23],與日本山川烈在1987年的首臺(tái)“模糊計(jì)算機(jī)”相比,推理速度從每秒一千萬次提高到一千五百萬次,體積不到它的1/10。在錢學(xué)森教授的鼓勵(lì)下,因素空間被作為人工智能的數(shù)學(xué)支持理論來抓。1994年筆者和李洪興合著的《知識(shí)表示的數(shù)學(xué)理論》[5]一書問世,用因素空間描述了概念生成,推理、控制、決策、評(píng)價(jià)等問題;在1995年又出版了《模糊系統(tǒng)理論和模糊計(jì)算機(jī)》[24],為智能計(jì)算機(jī)的研制提供了數(shù)學(xué)基礎(chǔ)。
2012年以后,筆者將因素空間的研究重點(diǎn)轉(zhuǎn)向數(shù)據(jù)智能化的數(shù)學(xué)理論,與形式概念分析及粗糙集結(jié)緣?,F(xiàn)有的關(guān)系數(shù)據(jù)庫所面臨的大數(shù)據(jù)的挑戰(zhàn)是因素空間所要迎頭解決的首要問題。因素空間對(duì)形式信息的處理對(duì)象囊括了非結(jié)構(gòu)化數(shù)據(jù)。以因素空間為基礎(chǔ)的機(jī)制主義人工智能是數(shù)據(jù)智能化的靈魂,它不俯首聽命于大數(shù)據(jù)的擺布,而是要設(shè)計(jì)、制造、運(yùn)用和培育數(shù)據(jù),用數(shù)據(jù)來營造信息生態(tài)和知識(shí)生態(tài),建立信息、知識(shí)與神經(jīng)結(jié)構(gòu)的同構(gòu)體。它要改變當(dāng)今世界人工智能自下而上的手工式格局,代之以自上而下與自下而上相結(jié)合的發(fā)展理念。有許多文章可以參考[25-50],盡管作者們?cè)趯懽鞯臅r(shí)候還沒有形成自己思維的大局。
因素是信息描述的關(guān)鍵詞,因素空間是描寫事物和信息的普適性框架,它把數(shù)據(jù)變成可視的樣本點(diǎn),形成背景分布的母體,據(jù)以自動(dòng)概念生成和因果規(guī)則,由此可以產(chǎn)生學(xué)習(xí)、預(yù)測(cè)、評(píng)價(jià)和決策控制等一系列的數(shù)學(xué)操作。因素空間能將形式信息與效用信息關(guān)聯(lián)起來,提升為全面的語義信息,為機(jī)制主義人工智能的信息轉(zhuǎn)化第一定律提供了堅(jiān)實(shí)的數(shù)學(xué)理論。用因素思維實(shí)現(xiàn)目標(biāo)因素與場(chǎng)景因素的對(duì)接和搜索,可為信息轉(zhuǎn)化的第二定律提供手段。以因素空間為基礎(chǔ)的機(jī)制主義人工智能是數(shù)據(jù)智能化的靈魂,它將要設(shè)計(jì)、制造、運(yùn)用和培育數(shù)據(jù),用數(shù)據(jù)來營造信息生態(tài)和知識(shí)生態(tài),建立信息、知識(shí)與神經(jīng)結(jié)構(gòu)的同構(gòu)體??傊?,因素空間的發(fā)展前景巨大,對(duì)信息科學(xué)和人工智能的發(fā)展有重要作用。
[1]鐘義信. 高等人工智能原理: 觀念·方法·模型·理論[M]. 北京: 科學(xué)出版社, 2014.
[2]鐘義信. 信息科學(xué)與技術(shù)導(dǎo)論[M]. 3版. 北京: 北京郵電大學(xué)出版社, 2015.
[3]何華燦. 泛邏輯學(xué)原理[M]. 北京: 科學(xué)出版社, 2001.HE Huacan. Universal logics principle[M]. Beijing: Science Press, 2001.
[4]WANG Peizhuang, HE Ouyan, ZHONG Yixin, et al. Cognition math based on factor space[J]. Annals of data science,2016, 3(3): 281–303.
[5]汪培莊, 李洪興. 知識(shí)表示的數(shù)學(xué)理論[M]. 天津: 天津科學(xué)技術(shù)出版社, 1994.
[6]劉增良. 因素神經(jīng)網(wǎng)絡(luò)理論[M]. 北京: 北師大出版社,1990.
[7]HUANG Chongfu. Principle of internet of intelligences and development of its core technology[J]. Journal of risk analysis and crisis response, 2017, 7(3): 146–155.
[8]WILLE R. Restructuring lattice theory: an approach based on hierarchies of concepts[M]//RIVAL I. Ordered Set.Dordrecht: Springer, 1982: 445–470.
[9]PAWLAK Z. Rough sets[J]. International journal of computer and information sciences, 1982, 11(5): 341–356.
[10]WANG Guoyin, WANG Yan. 3DM: domain-oriented datadriven data mining[J]. Foundamenta informaticae, 2009,90(4): 395–426.
[11]LIANG Jiye, BAI Liang, DANG Chuangyin, et al. The kmeans-type algorithms versus imbalanced data distributions[J]. IEEE transactions on fuzzy systems, 2012, 20(4):728–745.
[12]汪培莊, SUGENO M. 因素場(chǎng)與Fuzzy集的背景結(jié)構(gòu)[J].模糊數(shù)學(xué), 1982(2): 45–54.
[13]汪培莊. 因素空間與因素庫[J]. 遼寧工程技術(shù)大學(xué)學(xué)報(bào):自然科學(xué)版, 2013, 32(10): 1297–1304.WANG Peizhuang. Factor spaces and factor data-bases[J].Journal of Liaoning technical university: natural science,2013, 32(10): 1297–1304.
[14]WANG Peizhen. Rules detecting and rules-data mutual enhancement based on factors space theory[J]. International journal of information technology and decision making,2002, 1(1): 73–90.
[15]汪培莊, 郭嗣琮, 包研科, 等. 因素空間中的因素分析法[J]. 遼寧工程技術(shù)大學(xué)學(xué)報(bào): 自然科學(xué)版, 2014, 33(7):865–870.WANG Peizhuang, GUO Sicong, BAO Yanke, et al. Causality analysis in factor spaces[J]. Journal of Liaoning technical university: natural science edition, 2014, 33(7):865–870.
[16]劉海濤, 郭嗣琮. 因素分析法的推理模型[J]. 遼寧工程技術(shù)大學(xué)學(xué)報(bào): 自然科學(xué)版, 2015, 34(1): 124–128.LIU Haitao, GUO Sicong. Reasoning model of causality analysis[J]. Journal of Liaoning technical university: natural science, 2015, 34(1): 124–128.
[17]曲國華, 李春華, 張強(qiáng). 因素空間屬性簡(jiǎn)約的區(qū)分函數(shù)[J].智能系統(tǒng)學(xué)報(bào), 2017, 12(6): 890–894.QU Guohua, LI Chunhua, ZHANG Qiang. The differential function for attributes reduction in factors SPACE[J].Journal of intelligent systems, 2017, 12(6): 890–894.
[18]包研科, 茹慧英, 金圣軍. 因素空間中知識(shí)挖掘的一種新算法[J]. 遼寧工程技術(shù)大學(xué)學(xué)報(bào): 自然科學(xué)版, 2014,33(8): 1141–1144.BAO Yanke, RU Huiying, JIN Shengjun. A new algorithm of knowledge mining in factor space[J]. Journal of Liaoning technical university: natural science, 2014, 33(8):1141–1144.
[19]曾繁慧, 鄭莉. 因素分析法的樣本培育[J]. 遼寧工程技術(shù)大學(xué)學(xué)報(bào): 自然科學(xué)版, 2017, 36(3): 320–323.ZENG Fanhui, ZHENG Li. Sample cultivation in factorial analysis[J]. Journal of Liaoning technical university: natural science, 2017, 36(3): 320–323.
[20]汪培莊. 隨機(jī)過程[M]//郝柏林, 于淥, 孫鑫, 等. 統(tǒng)計(jì)物理學(xué)進(jìn)展. 北京: 科學(xué)出版社, 1981.
[21]ZADEH L A. Fuzzy sets[J]. Information and control, 1965,8(3): 338–357.
[22]汪培莊. 模糊集與隨機(jī)集落影[M]. 北京: 北京師范大學(xué)出版社, 1985.
[23]唐旬. 國內(nèi)首臺(tái)模糊推理機(jī)分立元件樣機(jī)研制成功[N].光明日?qǐng)?bào), 1988-05-07.TANG Xun. The first prototype of a fuzzy inference machine in China was successfully developed by[N]. Guangming Daily, 1988-05-07.
[24]汪培莊, 李洪興. 模糊系統(tǒng)理論與模糊計(jì)算機(jī)[M]. 北京:科學(xué)出版社, 1995.
[25]歐陽合. 不確定性理論的統(tǒng)一理論: 因素空間的數(shù)學(xué)基礎(chǔ)(特約報(bào)告)[C]//東方思維與模糊邏輯—紀(jì)念模糊集誕生五十周年國際會(huì)議. 中國, 大連, 2015.OUYANG He, The unified theory of uncertainty theory:the mathematical foundation of factor space (special report)[C]//Oriental Thinking and Fuzzy Logic-the 50th Anniversary International Conference to Commemorate the Birth of Fuzzy Sets. Dalian, China, 2015.
[26]馮嘉禮. 思維與智能科學(xué)中的性質(zhì)論方法[M]. 北京: 原子能出版社, 1990.
[27]YUAN Xuehai, WANG Peizhuang, LEE F S. Factor space and its algebraic representation theory[J]. Journal of mathematical analysis and applications, 1992, 171(1): 256–276.
[28]袁學(xué)海, 汪培莊. 因素空間和范疇[J]. 模糊系統(tǒng)與數(shù)學(xué),1995, 9(2): 25–33.YUAN Xuehai, WANG Peizhuang. Factor spaces and categories[J]. Fuzzy systems and mathematics, 1995, 9(2):25–33.
[29]PENG X T, KANDEL A, WANG P Z. Concepts, rules,and fuzzy reasoning: a factor space approach[J]. IEEE transactions on systems, man, and cybernetics, 1991, 21(1):194–205.
[30]WANG P Z. A factor spaces approach to knowledge representation[J]. Fuzzy sets and systems, 1990, 36(1):113–124.
[31]汪培莊. 因素空間與概念描述[J]. 軟件學(xué)報(bào), 1992, 3(1):30–40.WANG Peizhuang. Factor space and description of concepts[J]. Journal of software, 1992, 3(1): 30–40.
[32]WANG P Z, LOE K F. Between mind and computer: fuzzy science and engineering[M]//Singapore: World scientific Publishing, 1994.
[33]WANG Peizhuang, LIU Zeng-liang, SHI Yong, et al.Factor space, the theoretical base of data science[J]. Annals of data science, 2014, 1(2): 233–251.
[34]金智新. 安全結(jié)構(gòu)理論[M]. 北京: 科學(xué)出版社, 2012.
[35]CHENG Q F, WANG T T, GUO S C, et al. The logistic regression from the viewpoint of the factor space theory[J].International journal of computers communications and control, 2017, 12(4): 492–502.
[36]YU Fusheng, HUANG Chongfu. Building intelligent information systems in factors space[J]. 2002.
[37]ZENG Wenyi, FENG Shuang. An improved comprehensive evaluation model and its application[J]. International journal of computational intelligence systems, 2014, 7(4):706–714.
[38]李德清, 馮艷賓, 王加銀, 等. 兩類均衡函數(shù)的結(jié)構(gòu)分析與一類狀態(tài)變權(quán)向量的構(gòu)造[J]. 北京師范大學(xué)學(xué)報(bào): 自然科學(xué)版, 2003, 39(5): 595–600.LI Deqing, FENG Yanbin, WANG Jiayin, et al. Structure analysis of two classes of balance functions and construction of a family of state variable weight vectors[J]. Journal of Beijing normal university: natural science, 2003, 39(5):595–600.
[39]李德清, 李洪興. 變權(quán)決策中變權(quán)效果分析與狀態(tài)變權(quán)向量的確定[J]. 控制與決策, 2004, 19(11): 1241–1245.LI Deqing, LI Hongxing. Analysis of variable weights effect and selection of appropriate state variable weights vector in decision making[J]. Control and decision, 2004,19(11): 1241–1245.
[40]李德清, 崔紅梅, 李洪興. 基于層次變權(quán)的多因素決策[J].系統(tǒng)工程學(xué)報(bào), 2004, 19(3): 258–263.LI Deqing, CUI Hongmei, LI Hongxing. Multifactor decision making based on hierarchical variable weights[J].Journal of systems engineering, 2004, 19(3): 258–263.
[41]LI Deqing, ZENG Wenyi, LI Junhong. New distance and similarity measures on hesitant fuzzy sets and their applications in multiple criteria decision making[J]. Engineering applications of artificial intelligence, 2015, 40: 11–16.
[42]余高鋒, 劉文奇, 李登峰. 基于折衷型變權(quán)向量的直覺語言決策方法[J]. 控制與決策, 2015, 30(12): 2233–2240.YU Gaofeng, LIU Wenqi, LI Dengfeng. Compromise type variable weight vector based method Intuitionistic linguistic making decision[J]. Control and decision, 2015, 30(12):2233–2240.
[43]余高鋒, 劉文奇, 石夢(mèng)婷. 基于局部變權(quán)模型的企業(yè)質(zhì)量信用評(píng)估[J]. 管理科學(xué)學(xué)報(bào), 2015, 18(2): 85–94.YU Gaofeng, LIU Wenqi, SHI Mengting. Credit evaluation of enterprise quality based on local variable weight model[J]. Journal of management sciences in China, 2015,18(2): 85–94.
[44]岳磊, 孫永剛, 史海波, 等. 基于因素空間的規(guī)則調(diào)度決策模型[J]. 信息與控制, 2010, 39(3): 302–307.YUE Lei, SUN Yonggang, SHI Haibo, et al. Rule-based scheduling decision-making model based on factor spaces[J]. Information and control, 2010, 39(3): 302–307.
[45]何清, 童占梅. 基于因素空間和模糊聚類的概念形成方法[J]. 系統(tǒng)工程理論與實(shí)踐, 1999, 19(8): 99–104.HE Qing, TONG Zhanmei. The concept formation method based on factor spaces and fuzzy clustering[J]. System engineering-theory & practice, 1999, 19(8): 99–104.
[46]米洪海, 閆廣霞, 于新凱, 等. 基于因素空間的多層診斷識(shí)別問題的數(shù)學(xué)模型[J]. 河北工業(yè)大學(xué)學(xué)報(bào), 2003,32(2): 77–80.MI Honghai, YAN Guangxia, YU Xinkai, et al. The mathematical model of multi-layer diagnosis-type recognition problem[J]. Journal of Hebei university of technology,2003, 32(2): 77–80.
[47]何平. 犯罪空間分析與治安系統(tǒng)優(yōu)化[M]. 北京: 中國書籍出版社, 2013.
[48]崔鐵軍, 馬云東. 連續(xù)型空間故障樹中因素重要度分布的定義與認(rèn)知[J]. 中國安全科學(xué)學(xué)報(bào), 2015, 25(3):23–28.CUI Tiejun, MA Yundong. Definition and cognition of factor important degree distribution in continuous space fault tree[J]. China safety science journal, 2015, 25(3):23–28.
[49]崔鐵軍, 馬云東. 因素空間的屬性圓定義及其在對(duì)象分類中的應(yīng)用[J]. 計(jì)算機(jī)工程與科學(xué), 2015, 37(11): 2169–2174.CUI Tiejun, MA Yundong. Definition of attribute circle in factor space and its application in object classification[J].Computer engineering and science, 2015, 37(11): 2169–2174.
[50]崔鐵軍, 馬云東. 基于因素空間的煤礦安全情況區(qū)分方
法的研究[J]. 系統(tǒng)工程理論與實(shí)踐, 2015, 35(11):2891–2897.
CUI Tiejun, MA Yundong. Research on the classification method about coal mine safety situation based on the factor space[J]. Systems engineering-theory and practice, 2015,35(11): 2891–2897.