Wu Enhui, Qiao Liang*
Fudani ülikooli keemiaosakond, Shanghai 200433, Hiina
Mikroorganismid on tihedalt seotud inimeste haiguste ja tervisega. Mikroobikoosluste ja nende funktsioonide mõistmine on oluline küsimus, mida tuleb kiiresti uurida. Viimastel aastatel on metaproteoomikast saanud oluline tehniline vahend mikroorganismide koostise ja funktsioonide uurimiseks. Mikroobikoosluse proovide keerukuse ja suure heterogeensuse tõttu on aga proovide töötlemine, massispektromeetria andmete kogumine ja andmete analüüs muutunud kolmeks peamiseks väljakutseks, millega metaproteoomika praegu silmitsi seisab. Metaproteoomika analüüsis on sageli vaja optimeerida erinevat tüüpi proovide eeltöötlust ja kasutada erinevaid mikroobide eraldamise, rikastamise, ekstraheerimise ja lüüsimise skeeme. Sarnaselt ühe liigi proteoomiga hõlmavad massispektromeetria andmete kogumise režiimid metaproteoomikas andmetest sõltuvat hankimise (DDA) ja andmetest sõltumatu hankimise (DIA) režiimi. DIA andmete kogumise režiim suudab proovi peptiiditeavet täielikult koguda ja sellel on suur arengupotentsiaal. Kuid metaproteoomi proovide keerukuse tõttu on selle DIA andmete analüüs muutunud suureks probleemiks, mis takistab metaproteoomika sügavat katmist. Andmete analüüsi seisukohalt on kõige olulisem samm valgujärjestuse andmebaasi koostamine. Andmebaasi suurus ja täielikkus ei avalda suurt mõju mitte ainult identifitseerimiste arvule, vaid mõjutavad ka analüüsi liikide ja funktsionaalse tasemega. Praegu on metaproteoomi andmebaasi koostamise kuldstandardiks metagenoomil põhinev valgujärjestuse andmebaas. Samas on tõestatud, et avaliku andmebaasi iteratiivsel otsingul põhineval filtreerimismeetodil on tugev praktiline väärtus. Spetsiifiliste andmeanalüüsi strateegiate vaatenurgast on peptiidikesksed DIA andmeanalüüsi meetodid hõivanud absoluutse peavoolu. Süvaõppe ja tehisintellekti arendamisega edendab see oluliselt makroproteoomilise andmeanalüüsi täpsust, katvust ja analüüsi kiirust. Järelvoolu bioinformaatika analüüsi osas on viimastel aastatel välja töötatud rida annotatsioonitööriistu, mis võivad mikroobikoosluste koostise saamiseks teostada liikide annotatsiooni valgu tasemel, peptiidide ja geenide tasemel. Võrreldes teiste oomikameetoditega on mikroobikoosluste funktsionaalne analüüs makroproteoomika ainulaadne omadus. Makroproteoomikast on saanud mikroobikoosluste multi-omika analüüsi oluline osa ja sellel on endiselt suur arengupotentsiaal katvuse sügavuse, tuvastamise tundlikkuse ja andmeanalüüsi täielikkuse osas.
01 Proovi eeltöötlus
Praegu on metaproteoomika tehnoloogiat laialdaselt kasutatud inimese mikrobioomi, pinnase, toidu, ookeani, aktiivmuda ja muude valdkondade uurimisel. Võrreldes ühe liigi proteoomianalüüsiga on keeruliste proovide metaproteoomi proovide eeltöötlusel rohkem väljakutseid. Mikroobide koostis tegelikes proovides on keeruline, arvukuse dünaamiline ulatus on suur, erinevat tüüpi mikroorganismide rakuseina struktuur on väga erinev ning proovid sisaldavad sageli suures koguses peremeesvalke ja muid lisandeid. Seetõttu on metaproteoomi analüüsimisel sageli vaja optimeerida erinevat tüüpi proove ja kasutada erinevaid mikroobide eraldamise, rikastamise, ekstraheerimise ja lüüsimise skeeme.
Mikroobsete metaproteoomide ekstraheerimisel erinevatest proovidest on nii teatud sarnasusi kui ka mõningaid erinevusi, kuid praegu puudub ühtne eeltöötlusprotsess erinevat tüüpi metaproteoomi proovide jaoks.
02 Massispektromeetria andmete kogumine
Püssi proteoomianalüüsis eraldatakse peptiidisegu pärast eeltöötlust kõigepealt kromatograafilises kolonnis ja seejärel sisestatakse massispektromeetrisse andmete kogumiseks pärast ioniseerimist. Sarnaselt üksikute liikide proteoomianalüüsile hõlmavad makroproteoomi analüüsi massispektromeetria andmete kogumise režiimid DDA-režiimi ja DIA-režiimi.
Massispektromeetria instrumentide pideva iteratsiooni ja uuendamisega rakendatakse metaproteoomile suurema tundlikkuse ja eraldusvõimega massispektromeetrilisi instrumente ning pidevalt täiustatakse ka metaproteoomi analüüsi katvussügavust. Pikka aega on metaproteoomides laialdaselt kasutatud mitmeid kõrge eraldusvõimega massispektromeetrilisi instrumente, mida juhib Orbitrap.
Algteksti tabelis 1 on toodud mõned tüüpilised metaproteoomika uuringud aastast 2011 kuni tänapäevani valimi tüübi, analüüsistrateegia, massispektromeetria instrumendi, hankimismeetodi, analüüsitarkvara ja identifitseerimiste arvu osas.
03 Massispektromeetria andmete analüüs
3.1 DDA andmeanalüüsi strateegia
3.1.1 Otsing andmebaasist
3.1.2de novosekveneerimisstrateegia
3.2 DIA andmete analüüsi strateegia
04Liigi klassifikatsioon ja funktsionaalne annotatsioon
Mikroobikoosluste koosseis erinevatel taksonoomilistel tasanditel on mikrobioomiuuringute üks peamisi uurimisvaldkondi. Viimastel aastatel on välja töötatud rida annotatsioonitööriistu liikide märkimiseks valgu tasemel, peptiidide ja geenide tasemel, et saada mikroobikoosluste koostist.
Funktsionaalse annotatsiooni olemus seisneb sihtvalgu järjestuse võrdlemises funktsionaalse valgu järjestuse andmebaasiga. Kasutades geenifunktsioonide andmebaase, nagu GO, COG, KEGG, eggNOG jne, saab makroproteoomide abil tuvastatud valkudel teha erinevaid funktsionaalse annotatsiooni analüüse. Annotatsioonitööriistade hulka kuuluvad Blast2GO, DAVID, KOBAS jne.
05 Kokkuvõte ja väljavaade
Mikroorganismid mängivad inimeste tervises ja haigustes olulist rolli. Viimastel aastatel on metaproteoomikast saanud oluline tehniline vahend mikroobikoosluste funktsioonide uurimiseks. Metaproteoomika analüütiline protsess on sarnane üheliigilise proteoomika omaga, kuid metaproteoomika uurimisobjekti keerukuse tõttu tuleb igas analüüsietapis omaks võtta konkreetsed uurimisstrateegiad, alates proovi eeltöötlusest, andmete hankimisest kuni andmete analüüsini. Praegu on metaproteoomika tänu eeltöötlusmeetodite täiustamisele, massispektromeetria tehnoloogia pidevale uuendusele ja bioinformaatika kiirele arengule teinud suuri edusamme tuvastamise sügavuse ja rakendusala osas.
Makroproteoomi proovide eeltöötlemise protsessis tuleb esmalt arvestada proovi iseloomuga. Mikroorganismide eraldamine keskkonnarakkudest ja valkudest on üks peamisi väljakutseid, millega makroproteoomid silmitsi seisavad, ning tasakaal eraldamise tõhususe ja mikroobide kadumise vahel on kiireloomuline probleem, mis tuleb lahendada. Teiseks peab mikroorganismide valkude ekstraheerimisel arvestama erinevate bakterite struktuurilisest heterogeensusest tingitud erinevustega. Jälgivahemikus olevad makroproteoomi proovid nõuavad ka spetsiifilisi eeltöötlusmeetodeid.
Massispektromeetria instrumentide osas on tavalised massispektromeetria seadmed läbinud ülemineku massispektromeetritelt, mis põhinevad Orbitrap massianalüsaatoritel, nagu LTQ-Orbitrap ja Q Exactive, massispektromeetritele, mis põhinevad ioonide liikuvuse sidemega lennuaja massianalüsaatoritel, nagu timsTOF Pro. . Ioonide liikuvuse mõõtmete teabega timsTOF-i seeria instrumentidel on kõrge tuvastamise täpsus, madal avastamispiir ja hea korratavus. Need on järk-järgult muutunud olulisteks instrumentideks erinevates uurimisvaldkondades, mis nõuavad massispektromeetrilist tuvastamist, näiteks ühe liigi proteoom, metaproteoom ja metaboloom. Väärib märkimist, et massispektromeetria seadmete dünaamiline ulatus on pikka aega piiranud metaproteoomiuuringute valgu katvuse sügavust. Tulevikus võivad suurema dünaamilise ulatusega massispektromeetria seadmed parandada valgu tuvastamise tundlikkust ja täpsust metaproteoomides.
Kuigi massispektromeetria andmete kogumiseks on DIA andmete kogumise režiimi laialdaselt kasutusele võetud ühe liigi proteoomides, kasutatakse enamikus praegustes makroproteoomi analüüsides endiselt DDA andmete kogumise režiimi. DIA andmete hankimise režiim suudab täielikult hankida proovi fragmendi ioonide teavet ja võrreldes DDA andmete kogumise režiimiga on sellel potentsiaal saada täielikult makroproteoomi proovi peptiiditeave. Kuid DIA andmete suure keerukuse tõttu on DIA makroproteoomide andmete analüüs endiselt suurte raskuste ees. Tehisintellekti ja süvaõppe arendamine peaks parandama DIA andmete analüüsi täpsust ja täielikkust.
Metaproteoomika andmeanalüüsis on üheks võtmeetapiks valgujärjestuse andmebaasi loomine. Populaarsete uurimisvaldkondade jaoks, nagu soolefloora, saab kasutada soolestiku mikroobide andmebaase, nagu IGC ja HMP, ning on saavutatud häid tuvastamise tulemusi. Enamiku teiste metaproteoomiliste analüüside puhul on kõige tõhusam andmebaasi ehitamise strateegia ikkagi proovispetsiifilise valgujärjestuse andmebaasi loomine metagenoomiliste järjestuste andmete põhjal. Suure keerukuse ja suure dünaamilise ulatusega mikroobikoosluse proovide puhul on vaja suurendada sekveneerimissügavust, et suurendada vähese arvukusega liikide tuvastamist, parandades seeläbi valgujärjestuse andmebaasi katvust. Kui järjestusandmed puuduvad, saab avaliku andmebaasi optimeerimiseks kasutada iteratiivset otsingumeetodit. Iteratiivne otsing võib aga mõjutada FDR-i kvaliteedikontrolli, mistõttu tuleb otsingutulemusi hoolikalt kontrollida. Lisaks tasub veel uurida traditsiooniliste FDR-i kvaliteedikontrolli mudelite rakendatavust metaproteoomika analüüsis. Otsingustrateegia osas võib hübriidspektri raamatukogu strateegia parandada DIA metaproteoomika katvussügavust. Viimastel aastatel on sügaval õppimisel loodud prognoositud spektraalteek näidanud DIA proteoomikas paremat jõudlust. Metaproteoomide andmebaasid sisaldavad aga sageli miljoneid valgukirjeid, mille tulemuseks on prognoositud spektraalraamatukogude suur hulk, kulub palju arvutusressursse ja tulemuseks on suur otsinguruum. Lisaks on metaproteoomide valgujärjestuste sarnasus väga erinev, muutes spektraalraamatukogu ennustusmudeli täpsuse tagamise keeruliseks, mistõttu ei ole ennustatud spektraalteeke metaproteoomikas laialdaselt kasutatud. Lisaks tuleb väga järjestusega sarnaste valkude metaproteoomilise analüüsi jaoks välja töötada uued valgu järelduste ja klassifikatsiooni annotatsiooni strateegiad.
Kokkuvõttes on metaproteoomika tehnoloogia areneva mikrobioomi uurimistehnoloogiana saavutanud märkimisväärseid uurimistulemusi ja sellel on ka tohutu arengupotentsiaal.
Postitusaeg: 30. august 2024