E-mail | SIS | Moodle | Helpdesk | Knihovny | cuni.cz | CIS Více

česky | english Přihlášení



Umělá inteligence objevuje nové geny

Naše okolí je plné organismů nesoucích genetickou informaci, a její analýza je komplikovaná. Objev nových genů v mikroorganismech otevírá dveře k fascinujícímu světu genetické rozmanitosti. Tým vědců, včetně Martina Pospíška z Katedry genetiky a mikrobiologie Přírodovědecké fakulty Univerzity Karlovy, se podílel na vývoji algoritmu, který nám pomáhá lépe porozumět složitému světu kolem nás.
Ilustrační obrázek DNA. Zdroj: Freepik.com

Metagenomika je obor molekulární biologie, který se zabývá studiem genetického materiálu (DNA a RNA) obsaženého v komplexní směsi mikroorganismů v různých prostředích. Tato analýza umožňuje zkoumat mikrobiální biodiverzitu a má klíčový význam pro porozumění složitým ekosystémům a jejich funkcím. Během analýzy DNA z prostředí se provádí sestavování a anotace genomu a predikce genů. Důležitým prvkem anotace genomu jsou exony (úseky DNA obsahující informace pro tvorbu proteinů), zatímco introny (úseky DNA neosahující tuto informaci) mohou způsobit některé obtíže při anotaci genů. Chybné zahrnutí nebo vynechání intronu může vést k nesprávné identifikaci hranic exonů, což ovlivní predikci funkce proteinu.

Odpadová voda jako jedno z možných prostředí ke studiu.
Zdroj: Wikipedie

Potenciál metagenomiky v prokaryotických taxonech je obrovský. Nicméně, identifikace genů a anotace eukaryotického genomu jsou omezeny, což komplikuje průzkum prostředí, kde dominují eukaryota, zejména houby. Tato skutečnost motivovala skupinu vědců k vývoji algoritmu, který má za cíl zlepšit anotaci genomů hub. Vzniklý nástroj nazývaný SVMmycointron predikuje introny a odstraňuje je ze sekvence DNA.

Pro maximalizování přesností se studie zaměřila na dva nejvíce zastoupené plísňové kmeny – Basidiomycota a Ascomycota. Tyto dva kmeny společně obsahují více než 93 % pozorovaných taxonů hub. Algoritmus založený na strojovém učení (podoblast umělé inteligence) sbíral informace z veřejně dostupných genomů hub. Na základě již známých sekvencí intronů jsou identifikována potenciální párová místa vyřezání intronů. Tato místa ukazují, kde by se mohly nacházet nekódující úseky. Po identifikaci algoritmus vyřezuje introny z analyzované sekvence DNA. Odstranění intronů zvýšilo počet predikovaných genů až o 9,1 %.  Geny, které byly nově identifikovány po odstranění intronů, byly nejčastěji přiřazeny k houbám a dalším eukaryotům.

Vylepšení anotace genomů pomocí algoritmů, jako je SVMmycointron, přináší nový pohled na genetickou diverzitu v mikrobiálních společenstvech, s potenciálem odhalit dosud nepoznané funkce a vztahy mezi geny v eukaryotickém prostředí. Tato studie tak představuje cenný krok vpřed v oblasti metagenomiky a výzkumu mikroorganismů, přispívající k rozvoji našich znalostí o biodiverzitě a evoluci eukaryotických genomů v různých prostředích.

                                                                                                                                                        Yulia Dyachenko

Le AV, Větrovský T, Barucic D, Saraiva JP, Dobbler PT, Kohout P, Pospíšek M, da Rocha UN, Kléma J, Baldrian P. Improved recovery and annotation of genes in metagenomes through the prediction of fungal introns. Mol Ecol Resour. 2023 Nov;23(8):1800-1811. doi: 10.1111/1755-0998.13852

 

Publikováno: Středa 22.11.2023 20:30

Akce dokumentů