• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于STNext系統(tǒng)檢索天然產物文獻的方法

      2023-02-14 04:07:04
      甘肅科技 2023年12期
      關鍵詞:字段花色產物

      常 娟

      (國家圖書館,北京 100081)

      天然產物的來源都是自然界中存在的物質,包括植物、動物、微生物等生物體內所生成的化合物,以及地球化學過程中形成的化合物。這些天然產物一般具有廣泛的多樣性以及生物活性,對人類、動物和植物都具有重要的作用。許多天然產物中存在著大量結構新穎作用獨特的化合物,具有重要的藥用價值,包括抑制疾病、促進健康等方面,如屠呦呦等人從青蒿中發(fā)現了該植物治療瘧疾的有效成分青蒿素,可以有效降低瘧疾患者的死亡率;抵抗禽流感的藥物達菲的主要成分莽草酸是從八角茴香中提取、分離得到的。此外,天然產物在農業(yè)領域、食品和調味品等領域都有廣泛應用,因此天然產物的相關研究受到廣大學者關注。

      STNext系統(tǒng)創(chuàng)建于1983年,由美國化學文摘社(CAS)和德國卡爾斯魯厄信息中心(FIZ-Karlsruhe)聯合運營,在日本由日本國際化學情報協會(JAICI)代理,是提供世界科學信息的集成平臺,收錄200多個科學和技術數據庫,涵蓋了生物科學、生物技術、商業(yè)、化學、能源與環(huán)境、工程學、健康與安全、材料學、醫(yī)學以及納米科技等領域,提供以科學技術領域為中心的文獻、專利,以及化學物質及其物性、毒性等廣泛的信息,被全世界的專利局、企業(yè)、研究機構作為信息檢索工具使用。下面將結合案例介紹如何利用STNext進行天然產物檢索。

      1 數據源

      在STNext系統(tǒng)中,CAS提供了2個重要的化學文獻數據庫,即REGISTRY數據庫(CAS REGISTRY)和CAPLUS(Chemical Abstracts Plus數據庫),這2個數據庫是查詢化學信息的主要工具。其中CAS登記號的權威來源是REGISTRY數據庫,該數據庫存儲了自1957年以來的物質記錄,其中包含1.95億種有機和無機物質,包括合金、配位化合物、礦物、混合物、聚合物和鹽,以及7 000萬種蛋白質和核酸序列,其記錄內容包括化學物質登記號、準確的化學名稱、分子式、化學結構圖等信息。CAPLUS數據庫的文獻來源包括8 000多種國際性刊物、專利、同族專利、技術報告、書籍、會議錄、學位論文等,覆蓋了1907年以來世界上發(fā)表的約1 800多萬篇化學化工及相關學科文獻,其記錄內容包括題目、作者、出處、索引項、文摘等信息。CAPLUS數據庫每天增加3 000條新紀錄,每周增加14 000條索引記錄,它是最新的CA數據庫[1]。

      NAPRALERT數據庫(Natural Products Alert)是經美國國會論證后建立的專門從公開發(fā)表的文獻中收集來自植物、微生物和動物提取物(包括天然產物的次生代謝物)的化學成分、藥理活性和臨床研究的數據庫[2]。資料來自全世界大約700種期刊,當前內容包括從1650年至今的115 000篇科研論文和書籍提供的數據,其中80%是1975—2011年文獻的系統(tǒng)概括。該數據庫涉及129 000種化合物、48 000種植物、海洋生物、微生物和動物,可提供150萬份與上述生物活性相關的報告。

      CABA數據庫(CAB Abstracts)是由國際農業(yè)和生物科學中心(CABI)出版的數據庫,是全球最大以及專業(yè)的農業(yè)數據庫,選自世界上150多個國家、50多語種的7 500種期刊及3 500種其他類型文獻,涵蓋了1973年至今的約1 000萬條數據,數據包含書目信息、摘要、索引信息以及CAS的化學物質登記號,其內容覆蓋農業(yè)、林業(yè)、生物技術、遺傳學、人類醫(yī)學、人類營養(yǎng)、獸醫(yī)學等多種相關學科,數據規(guī)模大,質量好,是最具權威性的農業(yè)、林業(yè)文摘數據庫之一。

      2 檢索方法

      為提高檢索功能和增強檢索便利性,STNext對物質結構式、物質的特定反應、物性數據、生物物種信息、地理信息等進行了有效標引,支持主題檢索、結構檢索、物種檢索、數值檢索等多種檢索方式,針對不同需求以及不同數據庫的特點,可采用不同檢索方法。以下將結合不同的案例對不同的檢索方法進行詳細介紹。

      2.1 案例一

      收集現有文獻公開的花色苷結構信息及其生物活性相關文獻。

      花色苷是一類重要的天然水溶性色素,廣泛存在于果蔬中,是藍莓等漿果中的主要功效成分,具有多種生物活性,如抗氧化、抗癌、抗炎和抗菌等,在食品和制藥領域應用廣泛。花色苷屬于酚類化合物中的類黃酮,其母核結構如圖1所示[3]。

      圖1 花色苷母核結構

      由于天然產物結構具有復雜性和多樣性,如果想獲取比較全面的結構式會有一定的困難,可以借助STNext系統(tǒng)中的REGISTRY和CAPLUS數據庫,并從主題詞和結構檢索2個方向入手,來探尋相對全面的結構式結果集。

      在STNcxt中,有多個數據庫都有一個或多個詞典,詞典是一個查找檢索詞語的豐富資源,是經過標引的概念詞和物質,利用詞典可以快速建立起在基本索引里進行檢索的檢索式。通過借助CAPLUS中的詞典工具(CAS Lexicon)提取花色苷名稱,利用EXPAND(E)命令可以獲取花色苷下位類的物質名稱,新版的STNext中將CAS Lexicon更直觀地展示在了檢索界面,便于操作。下面結合案例具體檢索步驟如下。

      1)FILE CAPLUS(打開CAPLUS數據庫)

      2)E Anthocyanins/CT(使用詞典擴詞)

      3)E E3+ALL

      4)S E26-E131/BI(獲取花色苷在CAPLUS中的相關文獻,得到結果集L1)

      5)d L1 1-2 ti so pi hitstr

      使用“D HITSTR”命令進行目標化合物結構的瀏覽,可以節(jié)省文獻閱讀瀏覽時間,此方法僅適用于結果集比較小時,由于上述案例結果集數量龐大,僅瀏覽功能費時費力,可以選擇在REGISTRY數據庫中直接獲取花色苷的公開結構。

      6)File REGISTRY(打開REGISTRY數據庫)

      7)S E26-E131/CN AND OCCU/RL(在化學名稱中檢索并利用OCCU/RL限定為天然來源的物質結構,得到結果集L2)

      結果命中84個相關的公開結構,由于花色苷的種類過于繁多,其結構也數量龐大,使用主題詞檢索難免會有遺漏,如果想獲得所有花色苷已公開的結構,也可以嘗試結構檢索。

      REGISTRY數據庫作為一個物質數據庫,有著豐富的物質信息數據,比其他同類數據庫都要多。如果目標是求全,REGISTRY數據庫是一個很好的選擇?;ㄉ帐且活愐曰ㄇ嗨貫榕浠?,與一個或多個葡萄糖、半乳糖、鼠李糖、阿拉伯糖等分子通過糖苷鍵形成的化合物,因此可以通過花色苷的母核結構來進行檢索。將要檢索的結構通過結構編輯器畫好,就可以利用搜索引擎檢索出數據庫中相匹配的結構結果。下面結合案例具體檢索步驟如下。

      1)File REGISTRY(打開REGISTRY數據庫)

      2)在結構編輯器畫出結構并上傳,見圖2(得到結果集L3)

      圖2 編輯器畫出的結構(已標注可變基團)

      3)s L3 SSS FUL(亞結構檢索,獲取任意開放點有取代的物質,得到結果集L4)

      4)s L4 AND OCCU/RL(利用OCCU/RL限定為天然的物質結構,得到結果集L5,獲得相關結構)

      5)s L2 or L5(得到結果集L6)

      結果命中550個相關結構,與目前已報道的700余種花色苷類化合物比較接近[4],與主題檢索的結果相比更符合預期。由于REGISTRY數據庫不僅包含天然結構,還包含大量的人工合成結構,因此案例中通過“OCCU/RL”命令可以將人工合成結構排除在外,更精準地獲取目標結構。

      在上述案例中使用的“/RL”是在化工、醫(yī)藥等領域檢索中經常會用到的字段“CAS Roles”,是物質相關的具體研究信息,由CAS科學家創(chuàng)建的強大的索引術語,有助于精確篩選指定物質的特定研究文獻或者反應,包括天然來源、分析研究、生物研究、組合研究、合成制備、工藝研究、應用研究等11個超級角色,用4個字母的縮寫形式表示,超級角色下有特定角色,用3個字母的縮寫形式表示。如案例中用到的超級角色OCCU,其下位類包括GOC(地質、天文事件)、NPO(天然產物發(fā)生)、OCU(天然來源,未分類)、POL(污染物)等4個特定角色。在天然產物檢索過程中,可以通過使用“NPO/RL”命令可精準獲取來自天然產物中的物質,大大提高了檢索效率。此外,在檢索花色苷生物活性相關文獻時,在獲取花色苷在CAPLUS中的相關文獻后,可使用“BAC/RL”命令進行結果限定“s L1(L)BAC/RL”,獲取目標文獻。同樣,在檢索花色苷的制藥用途的相關文獻時,也可以使用“THU/RL”進行篩選,通過“s L1(L)THU/RL”命令獲取目標文獻。但是這種3個字母的特定角色代碼僅適用于CAPLUS數據庫中,在REGISTRY數據庫中需使用超級角色代碼,即案例中所用的“OCCU/RL”命令。

      2.2 案例二

      茶樹提取物的抗菌作用,以及是否會誘發(fā)人類皮膚炎。

      茶樹自古以來就被用作藥草使用,其提取物茶樹油具有廣譜殺菌和抗菌作用,可防治皮膚等的細菌感染,被廣泛應用于制藥、日化、食品、香料等行業(yè)。

      NAPRALERT作為天然產物數據庫包含很多源于自然界的已知結構代謝產物的化學和藥理學數據(包括體內研究),是檢索天然產物不可或缺的工具,NAPRALERT數據庫有2大特點,一是物種可以在/orgn字段中限定;二是其中的數據對每個物種的藥理活性和生物活性等作用進行分類,可檢索分類代碼表,用分類代碼/CC進行精確檢索。下面將以茶樹提取物為例詳細介紹使用NAPRALERT數據庫的檢索步驟。

      1)fil NAPRALERT

      2)s tea tree(得到結果集L1)

      3)d ORG(得到物種名稱,ORGN Class: DICOT Family: MYRTACEAE Genus: MELALEUCA Species:ALTERNIFOLIA)

      4)s MELALEUCA/ORGN(L)ALTERNIFOLIA/ORGN(用物種名稱檢索時,屬名、種名間用(L)運算符,得到結果集L2)

      5)s antibacterial activity/CC or antimicrobial activity/CC or 14001/CC or 14002/CC(抗菌活性的分類,得到結果集L3)

      6)s L2(L)L3(P)ACTIVE(得到結果集L4,被確認為活性(ACTIVE)或未被確認(INACTIVE)的記錄與分類代碼組合時用(P)運算符)

      7)d scan

      8)s dermatitis producing effect/cc or 15044/CC(得到結果集L5)

      9)s L5(P)"in humans"/STY(L)L2(得到目標結果集L6)

      上述案例中使用的“STY”是NAPRALERT數據庫中常用到的“Type of Study”字段,包括不同的研究類型,如臨床試驗、體內研究、體外研究、人類研究、植物研究等,在研究類型(sty)內進行鏈接時,使用(P)運算符即可。此外,NAPRALERT數據庫中的geographic area(GT)字段對地理信息也進行了標引,可獲取物種所對應的地理信息。

      2.3 案例三

      藍莓花色苷的提取工藝方法,要求在該工藝條件下花色苷的提取量不低于5 mg/g;由于溫度過高花色苷會逐步降解,因此需要提取溫度在20~50 ℃的花色苷提取方法。

      CABA數據庫的檢索功能非常強大,比較有特色的有CAB詞典以及分類代碼表,其中CAB詞典包括主題詞表(/CT)、地理信息詞庫(/GT)和物種名詞庫(/ORGN),此外還可以通過CAS的化學物質登記號進行檢索。這里要注意的是,CABA數據庫中的物種名詞庫(/ORGN)僅限于“ORGN”字段中的屬名信息,支持SEARCH和EXPAND命令,為檢索提供便利;而在NAPRALERT數據庫中的“ORGN”字段則包括該物種的科、屬、種名、常用名、有機部分以及地理區(qū)域,可以說NAPRALERT數據庫是了解天然產物物種信息的不二選擇。以案例中的藍莓“blueberry”為例,在CABA數據庫的“ORGN”字段中提取的為“Vaccinium”,在NAPRALERT數據庫的字段中提取的信息選取其中一條展示如下:

      ORGNClass:DICOT Family:ERICACEAE Genus:VACCINIUM Species:ANGUSTIFOLIUM

      [AIT.]

      Common name(s): LOWBUSH BLUEBERRY

      Organism part: RIPE-DRIED FRUIT

      Geographic area(GT):USA-MS;NORTH AMERICA

      此外,CABA數據庫還有特定的物性數據集(/PHP),支持物性的數值檢索功能,可使用相應的字段代碼在標題和摘要字段中進行檢索。下面結合案例詳細介紹使用CABA數據庫的數值檢索功能如下。

      STNext系統(tǒng)中的數值檢索有其特有的檢索方法和特點,一般情況下使用數值檢索采用s 數值 單位/數值檢索字段命令即可,在STNext內可以實現自動單位換算。此外,由于每個數值檢索字段有對應的單位,因此在數值后面也可以不寫單位,在檢索時將數值換算為相應單位的數值即可,即s 數值/數值檢索字段。如果不指定具體數值,也可以檢索包含有相應物性數值數據的文獻,即s數值檢索字段/PHP。

      1)fil CABA

      2)s blueberry(s)(anthocyanin? or cyanidin)(s)extract?(得到結果集L1)

      3)s(anthocyanin? or extract?)(6a)DOS>=5 mg/g(得到結果集L2)

      4)s L1 AND L2(得到目標結果集L3)

      5)s(anthocyanin? or cyanidin)(s)extract?(得到結果集L4)

      6)s extract?(5a)20-50C/TEMP.EX(得到結果集L5)

      7)s L4 AND L5(得到目標結果集L6)

      由此可見,數值檢索功能可以為檢索提供便利,如上述結果中還會得到“45 degrees”這種用單詞表達的結果,而且STNext系統(tǒng)可以自動實現單位換算,有助于縮小檢索范圍,提高檢索效率。此外,可在檢索字段后加.EX進行檢索,可以檢索特定的數值,或者將搜索范圍限定在已經指定了最大值和最小值的數值范圍,從而排出一部分噪聲文獻,進行更精確的檢索。

      3 結語

      通過對數據庫的比較發(fā)現,每個數據庫都各有特色,從收錄時間來看,NAPRALERT數據庫最早,包括了1650年至今的數據,可以檢索到很早時期的數據。從數據總量來看,REGISTRY數據庫包含1.95億有機和無機物質,CAPLUS數據庫收錄超過6千萬條數據記錄,數據量大且全面。從功能來看,NAPRALERT是專業(yè)的天然產物數據庫,其生物來源物種信息及其所在的地理位置、藥理活性、生物活性等都被提取并進行規(guī)范化處理,便于粗略了解天然產物的概況,掌握天然產物的來源物種信息;REGISTRY和CAPLUS數據庫文獻量大、更新快且包含分子結構,便于進行文獻調研,追蹤前沿,了解化合物信息、結構、理化性質、生物活性、藥理活性、用途等,是進行天然產物檢索的優(yōu)選數據庫;CABA是專業(yè)的農林數據庫,在STNext系統(tǒng)中有文本數值檢索功能的大多為專利全文數據庫,而CABA和FSTA(Food Science and Technolog Abstracts)作為農林、食品的非專利全文數據庫,數據庫資源相互補充,并且都有物性檢索功能,包括55個物性種類,是檢索過程中的一個相當便捷的功能。

      此外,在REAXYS數據庫中也包括天然產物及其衍生物數據,可以檢索得到生物活性、理化性質、化學反應等內容。在REAXYS中,可以通過ReaxysTree中的動植物英文名稱來進行天然產物檢索,但目前這些名稱均沒有經過規(guī)范化處理,也即在通過這些名稱進行檢索時不進行擴展檢索[5],使用時需特別注意。

      如果涉及到天然藥物,可能還需要用到BIOSIS Previews、Embase、MEDLINE、International Pharmaceutical Abstracts等生物醫(yī)藥相關數據庫,其中BIOSIS Previews、Embase和MEDLINE數據庫是生物醫(yī)學檢索經常使用的數據庫,International Pharmaceutical Abstracts數據總量較小,僅包含1970年至今的75萬條數據記錄。一般在檢索過程中,可以使用多個數據庫或數據庫集群進行檢索,以獲取更全面的檢索結果。

      針對天然產物結構復雜性、生物活性多樣化、用途廣泛等特點,選取合理的檢索方法及檢索策略,可以提高檢索效率,在檢索時要抓住不同數據庫的特點,使用合理的數據庫,熟悉STNcxt的標引方式,理清思路,準確快速地檢索到目標文獻。

      猜你喜歡
      字段花色產物
      低共熔溶劑在天然產物提取中的應用
      特產研究(2024年1期)2024-03-12 05:40:56
      圖書館中文圖書編目外包數據質量控制分析
      猜猜這是哪張牌?
      《天然產物研究與開發(fā)》青年編委會
      哪種花色是王牌
      初夏花色
      CNMARC304字段和314字段責任附注方式解析
      無正題名文獻著錄方法評述
      關于CNMARC的3--字段改革的必要性與可行性研究
      圖書館建設(2014年3期)2014-02-12 15:41:35
      遠志水解產物的分離及鑒定
      清水县| 镇平县| 东丰县| 团风县| 贵州省| 宝鸡市| 太谷县| 呼和浩特市| 温泉县| 扶余县| 富阳市| 怀仁县| 克拉玛依市| 虎林市| 越西县| 洪洞县| 吴江市| 青田县| 泰顺县| 凤城市| 乌兰察布市| 绥棱县| 长治市| 麦盖提县| 连山| 贺兰县| 连州市| 夏邑县| 靖江市| 彰化市| 开江县| 东山县| 临西县| 自治县| 金阳县| 巴林左旗| 青冈县| 南康市| 普安县| 金门县| 大英县|