Balita - Microbial metaproteomics : mula sa pagpoproseso ng sample, pangongolekta ng data hanggang sa pagsusuri ng data

Wu Enhui, Qiao Liang*

Department of Chemistry, Fudan University, Shanghai 200433, China

Ang mga mikroorganismo ay malapit na nauugnay sa mga sakit at kalusugan ng tao. Kung paano maunawaan ang komposisyon ng mga microbial na komunidad at ang kanilang mga tungkulin ay isang pangunahing isyu na kailangang pag-aralan nang madalian. Sa mga nagdaang taon, ang metaproteomics ay naging isang mahalagang teknikal na paraan upang pag-aralan ang komposisyon at pag-andar ng mga microorganism. Gayunpaman, dahil sa pagiging kumplikado at mataas na heterogeneity ng mga sample ng microbial community, pagpoproseso ng sample, pagkuha ng data ng mass spectrometry at pagsusuri ng data ay naging tatlong pangunahing hamon na kasalukuyang kinakaharap ng metaproteomics. Sa pagsusuri ng metaproteomics, madalas na kinakailangan upang i-optimize ang pretreatment ng iba't ibang uri ng mga sample at magpatibay ng iba't ibang mga microbial separation, enrichment, extraction at lysis scheme. Katulad ng proteome ng isang species, ang mass spectrometry data acquisition mode sa metaproteomics ay kinabibilangan ng data-dependent acquisition (DDA) mode at data-independent acquisition (DIA) mode. Ang DIA data acquisition mode ay maaaring ganap na mangolekta ng peptide na impormasyon ng sample at may malaking potensyal na pag-unlad. Gayunpaman, dahil sa pagiging kumplikado ng mga sample ng metaproteome, ang pagsusuri ng data ng DIA nito ay naging isang pangunahing problema na humahadlang sa malalim na saklaw ng metaproteomics. Sa mga tuntunin ng pagsusuri ng data, ang pinakamahalagang hakbang ay ang pagbuo ng isang database ng pagkakasunud-sunod ng protina. Ang laki at pagkakumpleto ng database ay hindi lamang may malaking epekto sa bilang ng mga pagkakakilanlan, ngunit nakakaapekto rin sa pagsusuri sa mga species at functional na antas. Sa kasalukuyan, ang pamantayang ginto para sa pagtatayo ng isang metaproteome database ay isang database ng pagkakasunud-sunod ng protina batay sa metagenome. Kasabay nito, ang pampublikong paraan ng pagsasala ng database batay sa umuulit na paghahanap ay napatunayang may malakas na praktikal na halaga. Mula sa pananaw ng mga tukoy na diskarte sa pagsusuri ng data, ang mga pamamaraan ng pagsusuri ng data ng DIA na nakasentro sa peptide ay sumakop sa isang ganap na mainstream. Sa pag-unlad ng malalim na pag-aaral at artificial intelligence, lubos nitong ipo-promote ang katumpakan, saklaw at bilis ng pagsusuri ng macroproteomic data analysis. Sa mga tuntunin ng pagsusuri sa downstream na bioinformatics, isang serye ng mga tool sa annotation ang binuo sa mga nakaraang taon, na maaaring magsagawa ng anotasyon ng mga species sa antas ng protina, antas ng peptide at antas ng gene upang makuha ang komposisyon ng mga microbial na komunidad. Kung ikukumpara sa iba pang mga pamamaraan ng omics, ang functional analysis ng mga microbial na komunidad ay isang natatanging tampok ng macroproteomics. Ang Macroproteomics ay naging isang mahalagang bahagi ng pagsusuri ng multi-omics ng mga microbial na komunidad, at mayroon pa ring malaking potensyal na pag-unlad sa mga tuntunin ng lalim ng saklaw, pagiging sensitibo sa pagtuklas, at pagkakumpleto ng pagsusuri ng data.

01Sample ng pretreatment

Sa kasalukuyan, ang teknolohiya ng metaproteomics ay malawakang ginagamit sa pananaliksik ng microbiome ng tao, lupa, pagkain, karagatan, aktibong putik at iba pang larangan. Kung ikukumpara sa pagsusuri ng proteome ng isang species, ang sample na pretreatment ng metaproteome ng mga kumplikadong sample ay nahaharap sa mas maraming hamon. Ang komposisyon ng microbial sa aktwal na mga sample ay kumplikado, ang dynamic na hanay ng kasaganaan ay malaki, ang istraktura ng cell wall ng iba't ibang uri ng mga microorganism ay ibang-iba, at ang mga sample ay madalas na naglalaman ng isang malaking halaga ng host protein at iba pang mga impurities. Samakatuwid, sa pagsusuri ng metaproteome, madalas na kinakailangan upang ma-optimize ang iba't ibang uri ng mga sample at magpatibay ng iba't ibang mga microbial separation, enrichment, extraction at lysis scheme.

Ang pagkuha ng mga microbial metaproteome mula sa iba't ibang sample ay may ilang partikular na pagkakatulad pati na rin ang ilang pagkakaiba, ngunit sa kasalukuyan ay may kakulangan ng pinag-isang proseso ng pre-processing para sa iba't ibang uri ng metaproteome sample.

02Pagkuha ng data ng mass spectrometry

Sa shotgun proteome analysis, ang peptide mixture pagkatapos ng pretreatment ay unang pinaghihiwalay sa chromatographic column, at pagkatapos ay pumapasok sa mass spectrometer para sa data acquisition pagkatapos ng ionization. Katulad ng pagsusuri ng proteome ng solong species, ang mga mode ng pagkuha ng data ng mass spectrometry sa pagsusuri ng macroproteome ay kinabibilangan ng DDA mode at DIA mode.

Sa patuloy na pag-ulit at pag-update ng mga instrumento ng mass spectrometry, ang mga instrumento ng mass spectrometry na may mas mataas na sensitivity at resolution ay inilalapat sa metaproteome, at ang lalim ng saklaw ng pagsusuri ng metaproteome ay patuloy ding napabuti. Sa mahabang panahon, isang serye ng mga high-resolution na mass spectrometry na instrumento na pinamumunuan ng Orbitrap ay malawakang ginagamit sa metaproteome.

Ang talahanayan 1 ng orihinal na teksto ay nagpapakita ng ilang kinatawan na pag-aaral sa metaproteomics mula 2011 hanggang sa kasalukuyan sa mga tuntunin ng uri ng sample, diskarte sa pagsusuri, instrumento ng mass spectrometry, paraan ng pagkuha, software ng pagsusuri, at bilang ng mga pagkakakilanlan.

03Pagsusuri ng data ng mass spectrometry

3.1 Diskarte sa pagsusuri ng data ng DDA

3.1.1 Paghahanap sa Database

3.1.2de novodiskarte sa pagkakasunud-sunod

3.2 Istratehiya sa pagsusuri ng data ng DIA

04Pag-uuri ng mga species at functional annotation

Ang komposisyon ng mga microbial na komunidad sa iba't ibang antas ng taxonomic ay isa sa mga pangunahing lugar ng pananaliksik sa microbiome research. Sa mga nakalipas na taon, isang serye ng mga tool sa anotasyon ang binuo upang i-annotate ang mga species sa antas ng protina, antas ng peptide, at antas ng gene upang makuha ang komposisyon ng mga komunidad ng microbial.

Ang kakanyahan ng functional annotation ay upang ihambing ang target na pagkakasunud-sunod ng protina sa database ng functional na pagkakasunud-sunod ng protina. Gamit ang mga database ng function ng gene gaya ng GO, COG, KEGG, eggNOG, atbp., maaaring maisagawa ang iba't ibang functional annotation analysis sa mga protina na kinilala ng macroproteomes. Kasama sa mga tool sa anotasyon ang Blast2GO, DAVID, KOBAS, atbp.

05Buod at Outlook

Ang mga mikroorganismo ay may mahalagang papel sa kalusugan at sakit ng tao. Sa mga nagdaang taon, ang metaproteomics ay naging isang mahalagang teknikal na paraan upang pag-aralan ang pag-andar ng mga microbial na komunidad. Ang analytical na proseso ng metaproteomics ay katulad ng sa single-species na proteomics, ngunit dahil sa pagiging kumplikado ng research object ng metaproteomics, ang mga partikular na diskarte sa pananaliksik ay kailangang gamitin sa bawat hakbang ng pagsusuri, mula sa sample pretreatment, data acquisition hanggang sa data analysis. Sa kasalukuyan, salamat sa pagpapabuti ng mga pamamaraan ng pretreatment, ang patuloy na pagbabago ng teknolohiya ng mass spectrometry at ang mabilis na pag-unlad ng bioinformatics, ang metaproteomics ay gumawa ng malaking pag-unlad sa lalim ng pagkakakilanlan at saklaw ng aplikasyon.

Sa proseso ng pre-treatment ng macroproteome sample, dapat munang isaalang-alang ang likas na katangian ng sample. Kung paano paghiwalayin ang mga microorganism mula sa mga selula at protina sa kapaligiran ay isa sa mga pangunahing hamon na kinakaharap ng mga macroproteomes, at ang balanse sa pagitan ng kahusayan sa paghihiwalay at pagkawala ng microbial ay isang kagyat na problema na dapat lutasin. Pangalawa, ang pagkuha ng protina ng mga microorganism ay dapat isaalang-alang ang mga pagkakaiba na dulot ng structural heterogeneity ng iba't ibang bakterya. Ang mga sample ng macroproteome sa hanay ng bakas ay nangangailangan din ng mga tiyak na pamamaraan ng pre-treatment.

Sa mga tuntunin ng mga instrumento ng mass spectrometry, ang mga pangunahing instrumento ng mass spectrometry ay sumailalim sa paglipat mula sa mga mass spectrometer batay sa mga mass analyzer ng Orbitrap tulad ng LTQ-Orbitrap at Q Exactive hanggang sa mga mass spectrometer batay sa ion mobility na isinama sa mga time-of-flight mass analyzer gaya ng timsTOF Pro . Ang serye ng timsTOF ng mga instrumento na may impormasyon sa dimensyon ng ion mobility ay may mataas na katumpakan sa pagtuklas, mababang limitasyon sa pagtuklas, at mahusay na pag-uulit. Unti-unti silang naging mahalagang instrumento sa iba't ibang larangan ng pananaliksik na nangangailangan ng pagtuklas ng mass spectrometry, gaya ng proteome, metaproteome, at metabolome ng isang species. Kapansin-pansin na sa mahabang panahon, ang pabago-bagong hanay ng mga instrumento ng mass spectrometry ay limitado ang lalim ng saklaw ng protina ng pananaliksik sa metaproteome. Sa hinaharap, ang mga instrumento ng mass spectrometry na may mas malaking dynamic na hanay ay maaaring mapabuti ang sensitivity at katumpakan ng pagkilala sa protina sa mga metaproteome.

Para sa mass spectrometry data acquisition, kahit na ang DIA data acquisition mode ay malawakang pinagtibay sa proteome ng isang solong species, karamihan sa kasalukuyang macroproteome analysis ay gumagamit pa rin ng DDA data acquisition mode. Maaaring ganap na makuha ng DIA data acquisition mode ang fragment ion information ng sample, at kung ikukumpara sa DDA data acquisition mode, ito ay may potensyal na ganap na makuha ang peptide information ng macroproteome sample. Gayunpaman, dahil sa mataas na pagiging kumplikado ng data ng DIA, ang pagsusuri ng data ng macroproteome ng DIA ay nahaharap pa rin sa malalaking paghihirap. Ang pagbuo ng artificial intelligence at malalim na pag-aaral ay inaasahan na mapabuti ang katumpakan at pagkakumpleto ng pagsusuri ng data ng DIA.

Sa pagsusuri ng data ng metaproteomics, ang isa sa mga pangunahing hakbang ay ang pagtatayo ng database ng pagkakasunud-sunod ng protina. Para sa mga sikat na lugar ng pananaliksik tulad ng intestinal flora, maaaring gamitin ang intestinal microbial database gaya ng IGC at HMP, at nakamit ang magagandang resulta ng pagkakakilanlan. Para sa karamihan ng iba pang pagsusuri sa metaproteomics, ang pinakaepektibong diskarte sa pagbuo ng database ay ang magtatag pa rin ng isang sample-specific na database ng pagkakasunud-sunod ng protina batay sa metagenomic sequencing data. Para sa mga sample ng microbial na komunidad na may mataas na kumplikado at malaking dynamic na hanay, kinakailangan upang madagdagan ang lalim ng pagkakasunud-sunod upang madagdagan ang pagkakakilanlan ng mga species na mababa ang kasaganaan, sa gayon ay mapabuti ang saklaw ng database ng pagkakasunud-sunod ng protina. Kapag kulang ang sequencing data, maaaring gamitin ang isang umuulit na paraan ng paghahanap para i-optimize ang pampublikong database. Gayunpaman, ang umuulit na paghahanap ay maaaring makaapekto sa kontrol ng kalidad ng FDR, kaya ang mga resulta ng paghahanap ay kailangang maingat na suriin. Bilang karagdagan, ang kakayahang magamit ng tradisyonal na mga modelo ng kontrol sa kalidad ng FDR sa pagsusuri ng metaproteomics ay nagkakahalaga pa ring galugarin. Sa mga tuntunin ng diskarte sa paghahanap, ang hybrid spectral na diskarte sa library ay maaaring mapabuti ang lalim ng saklaw ng DIA metaproteomics. Sa mga nagdaang taon, ang hinulaang spectral library na nabuo batay sa malalim na pag-aaral ay nagpakita ng mahusay na pagganap sa DIA proteomics. Gayunpaman, ang mga database ng metaproteome ay kadalasang naglalaman ng milyun-milyong mga entry ng protina, na nagreresulta sa isang malaking sukat ng mga hinulaang spectral na aklatan, kumonsumo ng maraming mapagkukunan sa pag-compute, at nagreresulta sa isang malaking espasyo sa paghahanap. Bilang karagdagan, ang pagkakapareho sa pagitan ng mga pagkakasunud-sunod ng protina sa mga metaproteomes ay nag-iiba nang malaki, na nagpapahirap upang matiyak ang katumpakan ng modelo ng hula ng spectral library, kaya ang hinulaang mga spectral na aklatan ay hindi malawakang ginagamit sa metaproteomics. Bilang karagdagan, ang mga bagong inference ng protina at mga diskarte sa anotasyon ng pag-uuri ay kailangang mabuo upang mailapat sa pagsusuri ng metaproteomics ng mga mataas na pagkakasunud-sunod na mga protina.

Sa buod, bilang isang umuusbong na teknolohiya sa pananaliksik ng microbiome, ang teknolohiya ng metaproteomics ay nakamit ang mga makabuluhang resulta ng pananaliksik at mayroon ding malaking potensyal na pag-unlad.

Oras ng post: Aug-30-2024

Microbial metaproteomics : mula sa pagpoproseso ng sample, pagkolekta ng data hanggang sa pagsusuri ng data