收藏 丨 幾種常用的化學、天然產(chǎn)物及大分子數(shù)據(jù)庫
2024-08-26 點擊量:623
前 言
通用結(jié)構(gòu)數(shù)據(jù)庫包括PubChem(1.16億化合物)、ChemSpider(1.28億化合物)、ZINC(7.5億化合物)和生物學興趣化學實體(ChEBI;超過46,477種化合物),這些都是可自由獲取的化學化合物數(shù)據(jù)庫。
PubChem(https://pubchem.ncbi.nlm.nih.gov/) 是一個全球性的分子聚合器,擁有驚人的1.16億種化合物結(jié)構(gòu)。
ChemSpider (https://www.chemspider.com/)
則作為化學聚合器提供有關(guān)化合物名稱、自然屬性、二維和三維結(jié)構(gòu)等基本信息。這兩個數(shù)據(jù)庫通常被用于成分識別。
ChEBI (https://www.ebi.ac.uk/chebi/aboutChebiForward.do)是一個基于網(wǎng)絡(luò)的數(shù)據(jù)庫,存儲自然和合成生化化合物以及其他形式的化合物。
ZINC (https://zinc.docking.org/)整合了包括ChEMBL、DrugBank等在內(nèi)的其他數(shù)據(jù)庫,使其能夠連接具有生物靶標、代謝途徑和生物活性小分子的化合物,從而不僅僅是一個以化合物為中心的數(shù)據(jù)庫。
默克索引(Merck Index,https://merckindex.rsc.org/)在線(1610種化合物)和化學結(jié)構(gòu)查找服務(wù)(CSLS;7,400萬分子)包含了大量化學品。默克索引是生命科學的百科全書,可以作為半合成化合物搜索的數(shù)據(jù)庫。CSLS專門設(shè)計用于化學結(jié)構(gòu)搜索,有助于快速檢查結(jié)構(gòu)是否出現(xiàn)在100多個化學數(shù)據(jù)庫中。
COlleCtion of Open Natural prodUcTs(COCONUT,https://coconut.naturalproducts.net/)數(shù)據(jù)庫基于53個在線化學資源構(gòu)建,最終擁有超過400,000條天然產(chǎn)品記錄,具有高分子多樣性和結(jié)構(gòu)復雜性。它已成為目前最大的自然資源化學成分免費可訪問數(shù)據(jù)庫。
MetaboLights(包含27,883種化合物, https://www.ebi.ac.uk/metabolights/)和The BiGG Models知識庫(BiGG; 包含9,088種代謝物,http://bigg.ucsd.edu/models)是開放獲取的有機體代謝物數(shù)據(jù)庫。這兩個數(shù)據(jù)庫訪問網(wǎng)速較慢,需要耐心等待。
NaprAlert(約200,000種化合物,https://pharmacognosy.pharmacy.uic.edu/napralert/)收集了來自參考文獻的手工策劃的天然產(chǎn)品信息,并附有元數(shù)據(jù),但它對研究者的訪問權(quán)限有限。
TCM database@Taiwan (China)自2011年首次發(fā)布以來,該數(shù)據(jù)庫在中醫(yī)社區(qū)中得到了廣泛傳播和使用。它致力于收集大量的中醫(yī)數(shù)據(jù),包括來自草藥、動物產(chǎn)品和礦物的成分,具有虛擬篩選和分子對接模擬的功能(http://tcm.cmu.edu.tw/)。
SWEETLEAD (4442結(jié)構(gòu),https://simtk.org/projects/sweetlead):具有類似功能,還顯示了關(guān)于已知化合物(如全球批準的藥物、非法藥物和傳統(tǒng)草藥分離物)的精確化學結(jié)構(gòu)的詳細且高度整理的數(shù)據(jù)。
Phytochemdb (8093植化學成分,[http://iyfbodn.com/) 和 Medherb(https://medherb.com/):特點是手工收集植物成分。后者還提供有關(guān)基因、蛋白質(zhì)、植物種類和藥用重要草藥的現(xiàn)有文獻的信息。
Seaweed Metabolite Database (SWMD; 2110化合物,https://swmd.co.in/):提供關(guān)于海藻衍生化合物的信息。
地理分布特征數(shù)據(jù)庫:如亞洲的 TM-MC (34,108化合物,https://tm-mc.kr/),旨在整理列在中國、韓國和日本藥典中的東北亞傳統(tǒng)藥物。
非洲的 African Natural Products Database (ANPDB; 6515化合物,https://african-compounds.org/anpdb/),合并了北非自然產(chǎn)品數(shù)據(jù)庫和東非自然產(chǎn)品數(shù)據(jù)庫,包含來自非洲各地區(qū)本地植物、微生物、動物到海洋源的自然成分。
GlyTouCan(https://glytoucan.org/):這是一個國際糖庫,主要包括多糖的結(jié)構(gòu)、序列和成分信息。此數(shù)據(jù)庫作為一個廣泛的糖類信息庫,為研究多糖提供了基礎(chǔ)數(shù)據(jù)支持。
Complex Carbohydrates Magnetic Resonance Database (https://glycodata.org/ccmrd/):這是第一個固態(tài)NMR數(shù)據(jù)庫,專為揭示不溶性碳水化合物的復雜結(jié)構(gòu)而設(shè)計。
UniCarb-DB (1118 個結(jié)構(gòu), 1588 個譜圖,https://unicarb-db.expasy.org/):包括糖片段的MS譜數(shù)據(jù),為多糖的質(zhì)譜分析提供詳細的參考。
Lipid Metabolites and Pathways Strategy (LIPID MAPS; 48,352脂質(zhì)結(jié)構(gòu),https://lipidmaps.org/about/information):這是一個全面的脂質(zhì)數(shù)據(jù)庫,包括化學結(jié)構(gòu)和生物注釋。它提供了一種命名和分類脂質(zhì)的方法,已成為廣泛接受的標準。此外,LIPID MAPS還提供大量的軟件工具和教育資源,以及用于編目和識別不同級別脂質(zhì)的數(shù)據(jù)庫。Shi等人建立了一種整合的脂質(zhì)組學分析策略,該策略結(jié)合了自動化MS數(shù)據(jù)庫搜索(LIPID MAPS和HMDB)和兩個質(zhì)譜平臺(UHPSFC/QTOF-MS和UHPSFC/IMS-QTOF-MS),實現(xiàn)了三種同屬人參物種天然脂質(zhì)的高通量分析。
LipidIMMS Analyzer(http://lipid4danalyzer.zhulab.cn/):LipidIMMS Analyzer是一個專門從事自動數(shù)據(jù)處理和脂質(zhì)識別的開源網(wǎng)站,具備處理基于質(zhì)譜和多維信息的多種數(shù)據(jù)類型的能力,包括精確質(zhì)量數(shù)、保留時間、碰撞橫截面積和二級質(zhì)譜。2021年,該數(shù)據(jù)庫升級為Lipid4DAnalyzer,支持來自IM-MS和非IM-MS儀器的脂質(zhì)組學分析。
Overview and limitations of database in global traditional medicines: A narrative review