鄭帥,田國祥,韓迪迪,李承倬,許豐碩,呂軍
近年來,臨床大數(shù)據(jù)挖掘已成為醫(yī)學領(lǐng)域研究異軍突起的代表。隨著社會發(fā)展和技術(shù)的進步,我們在整合統(tǒng)計醫(yī)學數(shù)據(jù)資料方面有了更成熟的手段和更系統(tǒng)的方法,已經(jīng)過了簡單累計和直觀描述的時代,不再會把患者和疾病的相關(guān)資料“壓在箱底”。相反,在保證患者隱私前提下深度剖析這些珍貴的數(shù)據(jù)資料,用現(xiàn)代先進的科技手段,通過復雜且細致的統(tǒng)計分析,借助圖表直觀表現(xiàn),充分發(fā)揮這些數(shù)據(jù)巨大的潛在價值,從而為臨床診斷提供選擇,為患者帶來福祉。
在公共數(shù)據(jù)庫開發(fā)和臨床大數(shù)據(jù)挖掘這塊新大陸,我們看到了新的曙光,眾多新型模型的建立給克服疾病帶來了更加強有力的手段,如臨床預測模型、競爭風險模型等。在一些較為流行的臨床研究和基礎(chǔ)研究等領(lǐng)域的數(shù)據(jù)庫均得到了快速開發(fā),如王天一,柳青青等[1,2]介紹的UK biobank數(shù)據(jù)庫和MIMIC數(shù)據(jù)庫,但在罕見病這一類別卻很少有專項數(shù)據(jù)庫。Orphanet是由法、英、美國等于1997年共同建立的有關(guān)稀有疾病和相關(guān)治療藥物的信息門戶,旨在為醫(yī)療保健專業(yè)人員和公眾提供有價值的信息,這些信息可用于改善罕見病的診斷和護理方面,更能將資料轉(zhuǎn)化為有效的臨床指南。在中國,大多數(shù)的臨床資料是不予公開的,而公共數(shù)據(jù)庫更是少,在此階段,開發(fā)更多的公共數(shù)據(jù)庫顯得尤為重要!
Ophanet是1997年在法國建立的一個關(guān)于罕見病及其藥物的公共數(shù)據(jù)庫,目的是收集關(guān)于稀有疾病的知識,從而改善對罕見病患者的診斷,護理和治療。從2000年起,通過歐盟委員會的大力支持和資助,Orphanet已逐漸發(fā)展成為一個由37個國家組成的網(wǎng)絡,遍及歐洲和全球。在過去的20年中,Orphanet已成為稀有疾病的重要信息來源,并隨著信息量的的不斷搜集,Orphanet得到了迅速發(fā)展。此平臺可在線獲取高質(zhì)量的罕見病信息,而且提供識別罕見病患者的手段,并通過大量的科學數(shù)據(jù)來促進知識的產(chǎn)生。Orphanet為了提高罕見病在醫(yī)療保健領(lǐng)域和研究領(lǐng)域的知名度,建立了罕見病命名法(ORPHA numbers)。每種疾病都有一個唯一的ORPHA號,將這種命名法整合到健康和研究信息系統(tǒng)中對于確保罕見疾病的可見性至關(guān)重要。該術(shù)語與其他術(shù)語(OMIM,ICD,SNOMEDCT,MedDRA,UMLS,MeSH,GARD)等一致,這種交叉引用是邁向數(shù)據(jù)庫互操作性的關(guān)鍵一步,促進了擁有不同語言的我們彼此間的了解。可通過訪問https://www.orpha.net進入該數(shù)據(jù)庫主頁,看到如圖1所示的頁面,Orphanet數(shù)據(jù)庫分為8個模塊,下文對各個模塊進行詳細介紹。
圖1 Orphanet官網(wǎng)頁面
2.1 模塊1 這個模塊主要是介紹了罕見病的臨床體征、基因、分類等信息,點擊(inventory classification and encyclopaedia of rare diseases with genes involved)圖標進入數(shù)據(jù)集后如圖2所示,我們可在搜索某種疾病的信息時通過輸入疾病名稱獲取,也可輸入OMIM、Gene name or symbol、 orpha number、ICD-10編號進行搜索。我們以牙齦纖維瘤病-面部畸形綜合征為例進行疾病相關(guān)信息搜索,輸入Gingival fibromatosisfacial dysmorphism syndrome后,點擊search鍵,進入后在result中點擊more information按鍵,即可查看牙齦纖維瘤病-面部畸形綜合征的諸多信息,如牙齦纖維瘤病-面部畸形綜合征的患病率<1/1000000、遺傳方式為常染色體隱性遺傳、發(fā)病年齡為新生兒階段,以及其他數(shù)據(jù)庫所對應的編碼。下拉還可看到疾病的流行病學描述、臨床體征、遺傳咨詢及發(fā)表相關(guān)論文等方面的信息。
圖2 模塊1搜索頁面
2.2 模塊2 模塊2是罕見病的藥物數(shù)據(jù)集,此數(shù)據(jù)集包含了各類罕見病的在開發(fā)的所有對癥使用藥物,并可查詢到藥物的產(chǎn)地屬性等細節(jié)信息,有助于藥物研究人員以及臨床醫(yī)生對藥物的全面認知和適宜選擇。點擊(inventory of orphan drugs)圖標即可進入其數(shù)據(jù)集,我們以胃上皮腫瘤為例查詢其適用藥物,在查詢框輸入gastric epithelial tumor后點擊search鍵,進入后下拉,結(jié)果頁面顯示治療胃上皮腫瘤的藥物有Bevacizumab、Catumaxomab、Chimeric monoclonal antibody against claudin-18 splice variant 2等12種藥物,如果想要了解其藥物的產(chǎn)品類型,生產(chǎn)類型以及臨床試驗等更多信息,點擊藥物名稱即可查詢。
2.3 模塊3 模塊3是患者組織目錄,此數(shù)據(jù)集包含了對罕見病進行登記的組織和聯(lián)盟,點擊Directory of patient organisations圖標即可進入數(shù)據(jù)集,我們以腦海綿狀血管瘤為例,在搜索框輸入brain cavernous angioma之后點擊search鍵進行搜索,進去后在result框中點擊more information我們可以看到有33例患者已登記,下拉之后我們可以看到各個國家對此病研究的機構(gòu),對腦海綿狀血管瘤疾病有登記的有AAC-Angioma Alliance Canada,ACC - Association surles Cavernomes Cérébraux,點擊對應機構(gòu)的more information 后我們可以查詢到組織負責人以及聯(lián)系方式等信息,我們可以與研究者聯(lián)系進行更詳細的咨詢了解。
2.4 模塊4 模塊4是對罕見病研究的專業(yè)機構(gòu)目錄,此數(shù)據(jù)集提供有關(guān)專業(yè)人員的信息,這些專業(yè)人員的稀有疾病領(lǐng)域的活動已在Orphanet中注冊。例如,其中包括負責專家中心的顧問和醫(yī)師,實驗室的生物學家,研究人員,患者組織的代表,網(wǎng)絡的協(xié)調(diào)員,臨床試驗的主要研究人員,注冊管理機構(gòu)和生物庫的管理人員或聯(lián)系人,以及專家撰寫或Orphanet的同行評審數(shù)據(jù)。點擊Directory of professionals and institutions圖標即可進,數(shù)據(jù)挖掘和上述模塊基本相似,即根據(jù)要求輸入疾病名稱,在result框中點擊more information即可顯示相關(guān)信息,如若了解更為精細信息繼續(xù)點擊其名稱或者所對應的more information按鍵即可。
2.5 模塊5 模塊5是專家中心目錄,Orphanet提供有關(guān)專門知識或?qū)iT知識網(wǎng)絡的信息,這些專門知識或?qū)iT知識網(wǎng)絡專門用于一種特定罕見疾病或一組罕見疾病的醫(yī)學管理和(或)基因咨詢。醫(yī)療管理中心應在相關(guān)專業(yè)領(lǐng)域提供比標準醫(yī)院服務更高質(zhì)量的服務。它包括由該國的衛(wèi)生當局正式指定的中心,以及未正式指定但符合Orphanet資格標準的中心,這些中心均根據(jù)歐盟罕見病專家委員會的建議進行了改編。遺傳咨詢中心是組織針對所有遺傳疾病或特定遺傳疾病或一組疾病的遺傳咨詢咨詢的機構(gòu)。點擊Directory of expert centres圖標即可進入,此數(shù)據(jù)庫的數(shù)據(jù)信息查詢和前面所述的基本相似,輸入你要了解的專家姓名即可進行查詢。
2.6 模塊6 模塊6提供罕見病的診斷測試的醫(yī)學實驗目錄,Orphanet提供有關(guān)診斷測試的信息,這些信息能夠?qū)币娂膊∵M行診斷且需要罕見的技術(shù)能力,或在特定國家或地區(qū)是最佳標準。體質(zhì)基因測試也針對非罕見疾病,具有遺傳易感性的疾病和藥物遺傳學進行了注冊。測試應在臨床環(huán)境中進行,點擊Directory of medical laboratories providing diagnostic tests圖標即可進入類似上述模塊的頁面,以腦海綿狀細胞癌為例進行數(shù)據(jù)挖掘,我們查詢到所有疾病相關(guān)的信息,可在需要的領(lǐng)域后面的圓圈點擊,選好所需研究數(shù)據(jù)后點擊Filter按鍵進行數(shù)據(jù)過濾,下拉到圖3頁面即可查看到所需的信息。
圖3 信息篩選頁面
2.7 模塊7 模塊7是正在進行的罕見病的研究項目,臨床試驗,注冊和生物庫目錄數(shù)據(jù)集,Orphanet提供有關(guān)正在進行的和未發(fā)表的研究項目的信息,這些研究項目明確針對罕見病或一組罕見病,并且由資助機構(gòu)與科學委員會進行競爭性選擇研究項目的資助機構(gòu)提供資金,或者由國家常規(guī)研究基金發(fā)布。點擊Directory of ongoing research projects, clinical trials, registries and biobanks圖標即可進入查詢頁面,數(shù)據(jù)搜尋方法前面所述模塊的方法基本相似,在此就不做贅述。圖4為在此數(shù)據(jù)集搜尋到的以腦海綿狀血管瘤為例的部分信息。
2.8 模塊8 模塊8數(shù)據(jù)集為專題報告匯編,此數(shù)據(jù)集包含的信息量非常龐大,包含了最新的罕見病領(lǐng)域的最新研究信息 ,點擊Collection of thematic reports: Orphanet Reports Series圖標即可進入數(shù)據(jù)集,如圖5和6所示,主要分為三個子項目Rare diseases、Activity reports、Orphan Drugs。包含了最新的罕見病及同義詞列表、疾病的發(fā)生率、發(fā)病率及已報告病例數(shù)、還有通過降低患病率、發(fā)病率的疾病列表,歐洲罕見病藥物清單,以及各項有關(guān)罕見病的活動報告等,均在一定時間以PDF的格式投送在數(shù)據(jù)庫,并可以下載。圖7、8為我們查詢的部分數(shù)據(jù)樣本。
圖4 樣本數(shù)據(jù)頁面
圖5 Rare diseases,Orphan Drugs數(shù)據(jù)集
圖6 Activity reports數(shù)據(jù)集
圖7 流行病數(shù)據(jù)樣本
圖8 最新注冊的部分罕見病
在圖1的基礎(chǔ)上下拉到圖9頁面,我們可以看到OrphaNews、Orphadate、ordo三個別具特色的項目,OrphaNews每月提供2次免費的電子通訊,在每期更新中都會報道罕見病和相關(guān)治療藥物領(lǐng)域的最新發(fā)展,適用于罕見病和相關(guān)治療藥物領(lǐng)域所有相關(guān)人員,包括決策者,科學家,衛(wèi)生專業(yè)人員,患者代表,遺傳學家,生物制藥行業(yè)的成員,以及任何有興趣了解此領(lǐng)域重要發(fā)展和新計劃的人。Orphadata平臺為學術(shù)界提供了罕見病和相關(guān)治療藥物有關(guān)的全面且質(zhì)量較高的數(shù)據(jù)集,并將數(shù)據(jù)集的代碼存放在Git Hup平臺上,若有學者想獲取歷史數(shù)據(jù)的即可在Git Hup上查詢。ORDO(Orphanet稀有疾病本體論)由Orphanet和歐洲生物信息學研究所(EMBL-EBI)共同開發(fā),旨在為罕見病提供結(jié)構(gòu)化的詞匯表,捕獲疾病、基因和其他相關(guān)特征之間的關(guān)系,從而為計算提供了有用的信息。
圖9 Orphanet數(shù)據(jù)庫特色項目
據(jù)估計,多達7000余種的罕見疾病影響著全球超過3.5億人,受罕見疾病影響的人中約半數(shù)是兒童,且30%的人不超過5周歲[3,4]。目前,只有不到6%的罕見病擁有經(jīng)過批準的治療方案,提示存在著巨大的醫(yī)療需求,同時要求我們應及時共享罕見病相關(guān)信息[5]。創(chuàng)建于1997年的Orphanet是專用于罕見病的國際數(shù)據(jù)資源,由歐盟衛(wèi)生計劃資助,其旨在解決罕見病信息的稀缺和分散問題,努力為全球提供有關(guān)罕見病及藥物的全面信息和數(shù)據(jù),以幫助改善罕見病患者的診斷,護理和治療。Orphanet是目前有關(guān)罕見病的信息和數(shù)據(jù)最全面的庫,且是在罕見病的分類,文本信息與為患者,研究人員和醫(yī)療保健專業(yè)人員提供適當服務之間建立聯(lián)系的唯一資源[6]。在大數(shù)據(jù)風流的當代,數(shù)據(jù)庫資源在研究過程必不可少,Orphanet的開發(fā)很好的彌補了罕見病數(shù)據(jù)缺乏的問題。毫無疑問,生物醫(yī)學研究人員具有令人難以置信的能力來生成大型數(shù)據(jù)集,而數(shù)據(jù)共享為研究者提供了便利。越來越多地利用新穎的分析模型幫助研究人員從挖掘的數(shù)據(jù)中得出新的結(jié)論,為研究者們提供了更好地了解罕見疾病并發(fā)現(xiàn)新的治療機會的機會[7]。因此,對分析模型和罕見疾病數(shù)據(jù)庫的開發(fā)和利用應加快步伐,以有更多的治療手段或方案應對各種罕見疾病。