于北瑜
【摘要】XML文檔,作為新數(shù)據(jù)形式,將文本內(nèi)容信息和結(jié)構(gòu)信息綜合起來,是目前進(jìn)行研究的一個熱點。支持向量機方法為了對分類器具體的構(gòu)造問題進(jìn)行解決,利用核函數(shù)做了空間映射,同時將分類的最優(yōu)超平面構(gòu)造出來,這一方法對于文本自動分類有著明顯的優(yōu)點。本文首先介紹了向量模型,其次,對基于支持向量機的XML文檔自動分類進(jìn)行闡述。
【關(guān)鍵詞】核方法;XML文檔;自動分類
XML文檔,有可擴展性以及結(jié)構(gòu)化和跨平臺性的特點,它和其他文本分析不同的是將結(jié)構(gòu)信息和文本內(nèi)容綜合起來。本文在支持向量機的基礎(chǔ)上,對此文