• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于模糊C均值聚類算法的蒙醫(yī)方劑類別劃分方法研究

      2017-08-07 13:05:51張春生圖雅李艷
      關(guān)鍵詞:蒙醫(yī)中心點(diǎn)方劑

      張春生,包?圖雅,李艷

      內(nèi)蒙古民族大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,內(nèi)蒙古 通遼 028043

      基于模糊C均值聚類算法的蒙醫(yī)方劑類別劃分方法研究

      張春生,包?圖雅,李艷

      內(nèi)蒙古民族大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,內(nèi)蒙古 通遼 028043

      目的 采用模糊 C 均值聚類(FCM)和硬 C 均值聚類(HCM)算法對(duì)蒙醫(yī)方劑進(jìn)行類別劃分,探討 2 種聚類算法的合理性。方法 選取《傳統(tǒng)蒙藥與方劑》中治療赫依病的 27 首蒙醫(yī)方劑,進(jìn)行數(shù)據(jù)預(yù)處理。采用 MS Visual Studio 2010 平臺(tái),使用 C#語言進(jìn)行開發(fā),分別運(yùn)用 Window From、WPF 技術(shù)實(shí)現(xiàn)漢、蒙文版本。采用 FCM 和 HCM 算法按 3、4、5、6 個(gè)類對(duì)數(shù)據(jù)進(jìn)行聚類分析。結(jié)果 所有相異數(shù)不為零的分類都存在包含現(xiàn)象,2種聚類算法得到的分類結(jié)果中藥物不存在交叉。與HCM算法比較,F(xiàn)CM 算法的分類結(jié)果中各類樣本數(shù)量差較小,即分類較均勻。結(jié)論 2 種算法均正確合理,其中 FCM 算法具有更好的聚類效果,可廣泛應(yīng)用于蒙醫(yī)方劑分析,為新藥研制提供數(shù)據(jù)支持。

      模糊C均值聚類;硬C均值聚類;蒙醫(yī);方劑;聚類;配伍

      數(shù)據(jù)挖掘技術(shù)自產(chǎn)生以來,無論在算法理論還是應(yīng)用研究方面均取得了豐富的研究成果,聚類分析作為數(shù)據(jù)挖掘的一種重要算法,在數(shù)據(jù)挖掘應(yīng)用中起到了關(guān)鍵的作用。在中醫(yī)方劑理論研究方面,它可按各項(xiàng)指標(biāo)要求對(duì)方劑信息進(jìn)行聚類分析,從而揭示其配伍規(guī)律,為新藥研究提供數(shù)據(jù)支持。

      目前,已有研究采用聚類分析方法分析中醫(yī)方劑配伍規(guī)律[1-4],但在蒙醫(yī)方劑聚類分析方面鮮有報(bào)道。目前該領(lǐng)域研究多采用一般的統(tǒng)計(jì)軟件作為分析工具,尚未建立專門的數(shù)據(jù)庫及開發(fā)通用程序,缺乏系統(tǒng)性、通用型、靈活性。

      本研究在前期研究[5-6]基礎(chǔ)上開發(fā)了一套通用的蒙醫(yī)方劑數(shù)據(jù)挖掘系統(tǒng)。該系統(tǒng)集成了模糊C均值聚類(FCM)算法和硬 C 均值聚類(HCM)算法,可進(jìn)行結(jié)果對(duì)比,同時(shí)HCM算法可為FCM算法提供初始中點(diǎn)服務(wù)。用戶可根據(jù)需要選擇合適的聚類算法,揭示蒙醫(yī)方劑配伍規(guī)律,為蒙藥新藥研制提供參考。

      1 模糊 C 均值聚類算法

      FCM 算法即眾所周知的 ISODATA 模糊聚類算法,是通過隸屬度即隸屬于某類程度實(shí)現(xiàn)聚類的一種算法,1973 年由 Bezdek 提出,是一種基于劃分的聚類算法。它的主旨是使被劃分到同一簇的對(duì)象間相似度最大,而不同簇間相似度最小。該算法是在 HCM算法硬性數(shù)據(jù)劃分的基礎(chǔ)上改進(jìn)的一種柔性模糊劃分。核心思想為把 n 個(gè)一維向量 xi(i=1,2,…,n)分為C個(gè)模糊組,并求每組的聚類中心,使非相似性指標(biāo)的價(jià)值函數(shù)達(dá)到最小。FCM 算法與 HCM 算法的主要區(qū)別在于其類的劃分原則是模糊的,每個(gè)數(shù)據(jù)點(diǎn)屬于哪一個(gè)類并不明確,而是用[0,1]區(qū)間的一個(gè)模糊值來確定屬于各個(gè)類的程度來表示。隸屬度是經(jīng)過歸一化的,一個(gè)數(shù)據(jù)集的隸屬度總和等于1:

      FCM 算法的價(jià)值函數(shù)/目標(biāo)函數(shù)一般化形式為:

      其中 uij屬[0,1];ci為模糊組 i 的聚類中心,為第 i個(gè)聚類中心與第 j個(gè)數(shù)據(jù)點(diǎn)間的歐幾里德距離;且是一個(gè)加權(quán)指數(shù)。

      構(gòu)造如下新目標(biāo)函數(shù),構(gòu)建最小值的必要條件:

      這里 λj(j=1,2,…,n)是公式①的 n 個(gè)約束式的拉格朗日乘子。對(duì)所有輸入?yún)⒘壳髮?dǎo),使公式②達(dá)到最小的必要條件為公式④和公式⑤:

      FCM 算法分析步驟:步驟 1:構(gòu)建滿足公式①的隨機(jī)隸屬度矩陣 U。步驟 2:計(jì)算每個(gè)類的中心點(diǎn)。步驟 3:計(jì)算價(jià)值函數(shù)。若價(jià)值函數(shù)小于給定閾值或與上次相比價(jià)值函數(shù)的變化量小于給定閾值則算法結(jié)束。步驟 4:重新生成隸屬度矩陣 U,回到步驟 2。

      2 數(shù)據(jù)預(yù)處理

      每首蒙醫(yī)方劑中包含的藥物數(shù)量和種類不同,而聚類分析要求所有方劑構(gòu)成一個(gè)矩陣,因此模糊聚類分析第一步是對(duì)方劑數(shù)據(jù)進(jìn)行預(yù)處理操作。

      設(shè)原始方劑事務(wù)集為 T={t1,t2,…,tn},ti的屬性(藥物組成)集為 Ui={ri1,ri2,…,rik},對(duì)應(yīng)的藥物重量集為 Wi={wi1,wi2,…,wik},預(yù)處理后事務(wù)的屬性集應(yīng)包含所有的 Ui中的屬性,即預(yù)處理后的屬性集為 U={r1,r2,…,rm}為所有 Ui的并集。最終形成二維矩陣 D[n,m],n 為事務(wù)數(shù),m 為 U 的屬性數(shù)。算法描述如下。

      U=null

      for i=1 to n //遍歷所有事務(wù)(方劑)

      scan r Ui

      //遍歷當(dāng)前方劑中各個(gè)屬性(藥物)

      if r not in U

      //若當(dāng)前方劑中屬性 r 不在 U 中

      U=U ∪ r; //U 并入 r

      endif

      endscan

      endfor

      D[n,m]=0 //二維矩陣初始化為 0

      for i=1 to n //遍歷所有事務(wù)(方劑)for j=1 to m //遍歷 U 中的每個(gè)屬性

      if rjin Ui

      //若 U 中的屬性 rj在當(dāng)前方劑的屬性中

      D[i,j]=wij;

      //二維矩陣對(duì)應(yīng)位置填對(duì)應(yīng)的重量

      endif

      endscan

      endfor

      3 聚類分析程序設(shè)計(jì)

      將 MS Visual Studio 2010 作為開發(fā)平臺(tái),采用 C#語言進(jìn)行開發(fā),同時(shí)提供漢、蒙文2種版本,分別采用 Window From、WPF 技術(shù)實(shí)現(xiàn)。該系統(tǒng)可提供 FCM、HCM 2 種聚類算法,可進(jìn)行聚類結(jié)果比較,同時(shí) HCM算法可為 FCM 算法提供初始中心點(diǎn)服務(wù)。

      FCM 算法設(shè)置了靈活的初始中心點(diǎn)和反模糊方法。初始中心點(diǎn)生成算法包括隨機(jī)中心點(diǎn)方法、隨機(jī)隸屬度矩陣算法,由HCM算法生成。反模糊方法包括最大隸屬度方法、中位數(shù)法、加權(quán)平均法。靈活多樣的生成算法為最終的聚類結(jié)果提供了保障。

      4 案例實(shí)驗(yàn)

      本研究以《傳統(tǒng)蒙藥與方劑》[7]中治療“赫依病”的 27首蒙醫(yī)方劑為例,討論方劑的聚類分析方法,27 首方劑共涉及藥物 87 味。

      對(duì)納入方劑進(jìn)行數(shù)據(jù)預(yù)處理,得到一個(gè) 27×87的二維矩陣,可用于 FCM 算法聚類。由于各方劑間藥物組成相差較大,采用隨機(jī)中心點(diǎn)方法或隨機(jī)隸屬度矩陣算法產(chǎn)生的初始中心點(diǎn),對(duì)應(yīng)的聚類結(jié)果并不理想。因此,本研究的初始中心點(diǎn)采用HCM算法生成。應(yīng)用程序界面見圖1。

      同時(shí)采用 FCM 和 HCM 2 種算法對(duì)聚類數(shù)為 3、4、5、6 的方劑分布情況進(jìn)行分析,聚類分析結(jié)果見表 1~表 4,2 種算法聚類結(jié)果的差異情況見表 5~表8。

      圖 1 蒙醫(yī)方劑數(shù)據(jù)挖掘系統(tǒng)聚類算法應(yīng)用程序界面

      表 1 27 首治療赫依病蒙醫(yī)方劑聚類數(shù)為 3 時(shí)分布情況

      表 2 27 首治療赫依病蒙醫(yī)方劑聚類數(shù)為 4 時(shí)分布情況

      表 3 27 首治療赫依病蒙醫(yī)方劑聚類數(shù)為 5 時(shí)分布情況

      表 4 27 首治療赫依病蒙醫(yī)方劑聚類數(shù)為 6 時(shí)分布情況

      表 5 聚類數(shù)為 3 時(shí)不同算法聚類結(jié)果比較

      表 6 聚類數(shù)為 4 時(shí)不同算法聚類結(jié)果比較

      表 7 聚類數(shù)為 5 時(shí)不同算法聚類結(jié)果比較

      表 8 聚類數(shù)為 6 時(shí)不同算法聚類結(jié)果比較

      聚類結(jié)果表明,當(dāng)分類數(shù)為3類和4類時(shí)效果較好,其中“蘇格木勒-3 音湯”和“烏莫黑.達(dá)布日海-5”為穩(wěn)定的獨(dú)體類,說明這2種方劑嚴(yán)格不同于其他方劑;另外,所有相異數(shù)不為零的分類都存在包含現(xiàn)象,2種聚類算法得到的分類結(jié)果中藥物不存在交叉,即某一子集要么在A類,要么在B類,是聚類算法不同造成的,反映了2種聚類算法的合理性;從分4類的結(jié)果來看,除“蘇格木勒-3 音湯”和“烏莫黑.達(dá)布日海-5”2 個(gè)獨(dú)體類外,另 2 個(gè)類的相異藥物數(shù)均為 8,由于相互包含關(guān)系的存在,實(shí)際上就是這 8個(gè)相異藥物歸屬哪一類的問題。

      與 HCM 算法比較,F(xiàn)CM 算法在類的劃分上引入隸屬度概念,從理論上 FCM 算法的分類結(jié)果更理想。本研究結(jié)果表明,與 HCM 算法比較,F(xiàn)CM 算法聚類結(jié)果中各類樣本數(shù)量差較小,即分類較均勻;本課題組蒙醫(yī)方劑學(xué)專家分析同樣認(rèn)為 FCM 算法分類結(jié)果更合理。

      6 小結(jié)

      本研究在蒙醫(yī)方劑數(shù)據(jù)挖掘平臺(tái)上實(shí)現(xiàn)了對(duì)蒙醫(yī)方劑的 FCM 和 HCM 聚類分析算法,提供了 FCM算法較靈活的生成策略。結(jié)果表明,2種算法均正確合理,其中 FCM 算法具有更好的聚類效果,可廣泛應(yīng)用于蒙醫(yī)方劑分析,為新藥研制提供數(shù)據(jù)支持。

      傳統(tǒng)醫(yī)藥學(xué)具有突出的民族性、地域性和歷史傳承性。中醫(yī)藥學(xué)與蒙醫(yī)藥學(xué)在哲學(xué)思想、藥性理論及其在各自醫(yī)藥理論指導(dǎo)下的臨床用藥等方面,均有相通之處,但又各成體系、各具特色。目前,基于數(shù)據(jù)挖掘的中醫(yī)方劑研究已較成熟,但針對(duì)蒙醫(yī)方劑的研究卻鮮有報(bào)道。本研究對(duì)方劑進(jìn)行了簡(jiǎn)單分類以驗(yàn)證算法合理性,在此基礎(chǔ)上可進(jìn)一步對(duì)各類中的藥物頻次、功能、主治等進(jìn)行分析。該方法可為保護(hù)蒙醫(yī)藥文化遺產(chǎn)、蒙醫(yī)藥研究提供新途徑,也可為蒙藥研發(fā)提供參考,具有一定的社會(huì)效益和經(jīng)濟(jì)價(jià)值。

      [1] 劉樹春,劉洋,張曉瑋,等.基于方劑數(shù)據(jù)的補(bǔ)腎常用中藥及其配伍規(guī)律的挖掘分析[J].中國(guó)實(shí)驗(yàn)方劑學(xué)雜志,2015,21(20):208-212.

      [2] 郭棟,童元元,黃生權(quán),等.基于數(shù)據(jù)挖掘的枸杞研究熱點(diǎn)分析[J].中國(guó)中醫(yī)藥信息雜志,2016,23(9):48-51.

      [3] 宋京美,吳嘉瑞,姜迪.基于數(shù)據(jù)挖掘的國(guó)家級(jí)名老中醫(yī)治療腫瘤用藥規(guī)律研究[J].中國(guó)中醫(yī)藥信息雜志,2015,22(6):50-53.

      [4] 徐曉晶,徐麗敏,沈春鋒,等.孟河醫(yī)派徐迪華治療咳嗽經(jīng)驗(yàn)用藥分析研究[J].中國(guó)中藥雜志,2015,40(21):4301-4305.

      [5] 張春生,圖雅,翁慧,等.基于關(guān)聯(lián)規(guī)則的條件函數(shù)依賴發(fā)現(xiàn)及數(shù)據(jù)修復(fù)[J].計(jì)算機(jī)應(yīng)用研究,2016,33(2):384-387.

      [6] ZHANG C S, TU Y. The design and real ization of mongolian medicine prescription data mining system[C]//2016 3rd International Conference on Information Science and Cont rol Engineering,2016.

      [7] 奧?烏力吉,布和巴特爾.傳統(tǒng)蒙藥與方劑[M].赤峰:內(nèi)蒙古科學(xué)技術(shù)出版社,2013:12.

      Study on M ongolian M edicine Prescription Classification Method Based on Fuzzy C-means Algorithm

      ZHANG Chun-sheng, BAO Tu-ya, LI Yan (College of Computer Science and Technology, Inner Mongolia University for Nationalities, Tongliao 028043, China)

      Objective To classify Mongolian medicine prescription by using fuzzy c-means algorithm (FCM) and hard c-means algorithm (HCM); To explore the rationality of two kinds of clustering algorithm. Methods 27 Mongolian medicine prescriptions for treating Heiyi disease from Chuan Tong Meng Yao Yu Fang Ji were set as experimental data, and the data were preprocessed first. MS Visual Studio 2010 platform was used, and C# language was used for research and development. Chinese version and Mogolian version were implemented With Window From and WPF technology, respectively. The medicine prescriptions were classified into 3, 4, 5, and 6 types by using FCM and HCM. Results All categorization With zero classification showed the existence of inclusion phenomena. The medicine in the classification results obtained by the two kinds of clustering algorithm did not exist cross. FCM could produce clustering results With smaller quantity difference and the more uniform classification compared With HCM. Conclusion The two algorithms are correct and reasonable, in which FCM algorithm has better clustering effect, and can be w idely used in Mongolian prescription analysis, With a purpose to provide data supports for the research and development of new medicine.

      fuzzy c-means algorithm; hard c-means algorithm; Mongolian medicine; prescription; clustering; compatibility

      10.3969/j.issn.1005-5304.2017.08.022

      R2-05;R291.2

      A

      1005-5304(2017)08-0099-05

      2016-08-31)

      2016-09-09;編輯:向宇雁)

      國(guó)家自然科學(xué)基金(81460656)

      包?圖雅,E-mai l:baotuya1978@163.com

      猜你喜歡
      蒙醫(yī)中心點(diǎn)方劑
      中藥方劑在治療黃褐斑中的應(yīng)用
      《金匱要略》黃芪類方劑探析
      Scratch 3.9更新了什么?
      如何設(shè)置造型中心點(diǎn)?
      電腦報(bào)(2019年4期)2019-09-10 07:22:44
      論方劑的配伍環(huán)境
      中成藥(2018年6期)2018-07-11 03:01:24
      甘草在方劑中的作用及配伍規(guī)律
      蒙醫(yī)“薩病”治療概述
      淺談室性早搏的蒙醫(yī)診治
      蒙醫(yī)對(duì)糖尿病的認(rèn)識(shí)及研究進(jìn)展
      赫依型心刺痛患者蒙醫(yī)辨證施護(hù)
      东山县| 林甸县| 钟山县| 马尔康县| 永康市| 义乌市| 开远市| 台山市| 河北省| 平潭县| 扎赉特旗| 南昌市| 牡丹江市| 周宁县| 繁峙县| 武安市| 洪雅县| 冀州市| 宁德市| 平远县| 浪卡子县| 清原| 敦化市| 康乐县| 双牌县| 白朗县| 新营市| 敦煌市| 丹寨县| 正宁县| 岳阳县| 无锡市| 右玉县| 九龙坡区| 威海市| 东乡| 舟山市| 碌曲县| 岗巴县| 承德市| 镶黄旗|