Tweetnuť
Kopírovať odkaz
Čítať neskôr
Pre uloženie článku sa prihláste alebo sa ZDARMA registrujte.
Spoločnosť
05. august 2023

Umelá inteligencia

Čo majú spoločné pápež v páperovej bunde a dizajnové proteíny

Americkí vedci prišli na spôsob, ako pomocou umelej inteligencie navrhnúť proteíny plniace želanú funkciu.

Čo majú spoločné pápež v páperovej bunde a dizajnové proteíny

Deepfake obrázok pápeža/Proces navrhovania proteínu. Koláž Autor: Reddit/Bakerlab

Proteíny, či tiež bielkoviny, sú základnou stavebnou jednotkou všetkých živých organizmov. Navyše, tie najzložitejšie funkcie v bunke sú spravidla vykonávané práve proteínmi.

Pre funkciu proteínov je dôležitá ich štruktúra. Možno si ich predstaviť ako malé molekulové stroje, ktoré na to, aby plnili svoju funkciu, musia mať príslušný tvar. To hádam ani nie je prekvapivé, koniec koncov, aj z bežného života vieme, že inú funkciu má kladivo a inú skrutkovač. 

Nebolo by teda krásne vedieť si navrhnúť proteín na konkrétnu funkciu podobne, ako ľudia vymysleli hasák na vodoinštalatérske práce?

Nejde pritom len o nejakú akademickú súťaž zručnosti. Efektívnejšie či úplne nové enzýmy, alebo rôzne proteínové aktivátory, či inhibítory by veľmi rýchlo našli široké uplatnenie od chemického priemyslu cez potravinársky až po ekológiu a medicínu.

Čítajte tiež

Vylepšenie fotosyntetických enzýmov na výrobu biopalív, vytvorenie enzýmov na výrobu hnojív z atmosférického dusíka či na odbúranie ťažko degradovateľných plastov, navrhnutie selektívneho inhibítora proteínov poháňajúcich rakovinové bunky, to je len čriepok z vedeckých predstáv o použití umelo navrhnutých proteínov.  

Vedecký tím pod vedením Davida Bakera z Washingtonskej univerzity v Seattli teraz publikoval zásadný krok na ceste k realizácii týchto predstáv. Svoje vylepšenia v oblasti neurónových sietí zverejnili minulý mesiac v časopise Nature (bezplatná verzia článku je dostupná na portáli bioRxiv).

Všetko odštartoval londýnsky DeepMind

Ešte pred pár rokmi sme poriadne nevedeli ani to, ako z DNA sekvencie proteínových génov, vyskytujúcich sa prirodzene napríklad u ľudí, predpovedať štruktúru týchto proteínov.

Tento problém sa nazýval problém proteínového skladania (z angl. protein folding problem) a bol považovaný za veľmi zásadný. Experimentálne určenie štruktúry proteínov je totiž napriek veľkým pokrokom do dnešného dňa prácne a spravidla nie je úspech vyriešenia štruktúry pre daný proteín dopredu istý.

Pre pochopenie funkcie proteínov je však poznanie ich štruktúry absolútne kľúčové.

Desiatky rokov sa teda vedci rôznymi spôsobmi pokúšali predpovedať štruktúru proteínov iba z ich sekvencie, napríklad pomocou simulácií molekulovej dynamiky založenej na najrôznejších druhoch abstrakcií či rôznymi spôsobmi porovnávania so štruktúrou podobných, už známych proteínov. 

Na tento účel dokonca každý druhý rok organizovali vedeckú súťaž CASP, do ktorej experimentátori prispievali novými, zatiaľ nezverejnenými štruktúrami a výpočtové tímy posielali svoje predpovede trojrozmerných štruktúr týchto proteínov. Tie sa potom porovnávali a vyhodnotili sa najlepšie predikčné algoritmy.

Čítajte tiež

Výsledky však boli rozpačité. Mnohí predpokladali, že až potenciálny príchod kvantových počítačov nadobro vyrieši problém skladania proteínov, keďže len kvantový počítač by dokázal v realistickom čase do výpočtu zahrnúť aj kvantové javy dôležité na tejto molekulovej úrovni.

Až napokon pred zhruba dvomi rokmi sa nielen vedeckou obcou, ale aj mnohými svetovými médiami prehnala správa, že algoritmus AlphaFold2 od londýnskeho výskumného inštitútu DeepMind patriaceho od roku 2014 materskej spoločnosti Google v štrnástom vydaní súťaže CASP „o niekoľko hláv“ prevýšil všetky ostatné predikčné algoritmy. A prakticky vyriešil problém skladania proteínov.

Vedci vtedy pomocou umelej inteligencie, konkrétne pomocou špecifického typu neurónových sietí zvaných transforméry, prišli na spôsob, ako veľmi efektívne do predpovede štruktúry dosiaľ neurčených proteínov zahrnúť v tom čase už širokú bázu známych proteínových štruktúr. 

Od generovania obrázkov ku generovaniu proteínov

Hoci presný algoritmus AlphaFold2 naďalej ostáva v súkromných rukách, DeepMind publikoval dostatočne veľa informácií o jeho dizajne na to, aby akademici v pomerne krátkom čase dokázali vytvoriť podobne úspešné modely založené na rovnakých princípoch, dokonca s nižšími nárokmi na výpočtovú techniku. Jedným z nich je aj algoritmus nazvaný Rosetta. 

Tím Davida Bakera si teraz položil otázku, ako by sa dal tento úspešný algoritmus použiť na takpovediac opačný problém – ako navrhnúť sekvenciu proteínu tak, aby mal určitý tvar, a teda aj určitú funkciu. 

Naivné riešenie by samozrejme mohlo byť pomocou AlphaFoldu či Rosetty vyrátať štruktúry všetkých možných proteínov určitej veľkosti a potom si vybrať ten vhodný. Toľko výpočtovej sily však, pochopiteľne, nemáme.

Po riešenie preto Bakerov tím siahol do oblasti strojového spracovania obrázkov, odkiaľ v posledných rokoch prišla značná časť inovácií v oblasti umelej inteligencie.

Čítajte tiež

V roku 2020 vedci z tejto oblasti publikovali nový druh algoritmov, ktoré nazvali difúzne modely. „Difúzne“ preto, lebo boli voľne inšpirované tým, ako sa postupne stráca signál, keď dochádza k difúzii materiálu. 

Inzercia

Táto metóda je založená na tom, že k peknému, jasnému obrázku sa po troške pridáva čoraz viac šumu. Môžeme si to predstaviť tak, že najprv sa nám stratia jemné črty, potom tie hlavnejšie, až nám ostanú iba tie najhrubšie obrysy a nakoniec len šum. 

Na takýchto sériách obrázkov sa natrénuje neurónová sieť, ktorá sa naučí, ako najčastejšie vyzerajú obrázky, keď sa k nim pridáva stále viac šumu. 

Ak sa však neurónová sieť naučí šum pridávať, v tomto konkrétnom modeli je už pomerne ľahké naučiť ju aj ten šum odoberať – a takpovediac si vymýšľať jemné črty, ktoré v tom obrázku nie sú. A to len na základe hrubých čŕt, ktoré v danom obrázku sú, a množstva jemných čŕt z už skôr videných iných obrázkov. 

Na takýchto algoritmoch potom funguje dnes už populárne generovanie umelých obrázkov. Niektorým čitateľom možno bude známy virálny obrázok pápeža Františka v nadupanej bielej páperovej bunde.

Pápež František v dizajnérskej bunde, falošný obrázok vygenerovaný umelou inteligenciou na báze difúznych modelov. Zdroj foto: reddit.

Tieto difúzne metódy sa dajú dotiahnuť do extrému a výstupy generovať aj z náhodného šumu. 

Presne to využil tím Davida Bakera. Najprv spojili difúzne algoritmy s Rosettou. Zjednodušene povedané, počas vyučovania neurónovej siete vždy, keď k štruktúre proteínu pridali trochu šumu, nechali Rosettu, aby danú štruktúru nanovo preskladala a tak zabezpečila, aby ešte stále zodpovedala fyzicky realistickému proteínu.

To im následne umožnilo generovať proteínové štruktúry doslova z náhodne inicializovaného stavu.

Špecifické viazanie i vylepšené enzýmy

Aby však zabezpečili určité žiaduce vlastnosti proteínov, použili niekoľko trikov. 

Keď napríklad chceli vytvoriť proteín, ktorý by s niekoľkými ďalšími svojimi kópiami vytváral symetrický komplex, inicializovali algoritmus požadovaným počtom identických kópií daného šumu. Navrhnuté proteíny následne v laboratóriu zosyntetizovali a tieto proteíny prevažne takéto komplexy skutočne vytvárali.

Oveľa dôležitejšie však bolo, keď algoritmus iniciovali náhodným šumom, ktorý obklopoval iný, dobre definovaný proteín. Výsledkom bol proteín, ktorý sa pevne a špecificky na tento druhý proteín viazal. Animáciu tohto procesu možno vidieť na webovej stránke skupiny.

Snímky z animácie procesu navrhovania proteínu viažuceho sa na iný proteín (fialová špirála). Náhodne inicializované aminokyseliny (krátke reťazce gúľ vľavo) sa postupne spoja do proteínových špirál (vpravo). Zdroj: bakerlab.org

Experimentálne potom dokázali overiť, že minimálne 10 percent navrhnutých proteínových dizajnov sa skutočne na daný proteín pevne viazalo. Za zmienku stojí aj to, že do tohto demonštratívneho experimentu použili ako partnerský proteín nádorový supresor.

Ešte sľubnejšie pôsobí experiment, v ktorom navrhli proteín tak, že mu najprv zadali tvar, aký by malo mať jeho tzv. aktívne miesto. Pre väčšinu proteínov je totižto pre chemickú funkciu dôležitá len jeho celkom malá časť, aktívne miesto, zvyšok proteínu takpovediac len drží tvar. 

Pre svoj ukážkový experiment sa podujali navrhnúť neobvyklý proteín schopný viazať ióny niklu, a to tak, že algoritmu umelo zadali, ako by mala vyzerať len jeho malá časť okolo väzobného miesta samotného nikelnatého iónu. 44 takto navrhnutých proteínov aj zosyntentizovali a takmer polovica vykazovala veľmi silné viazanie Ni2+. 

Dobu fejk obrázkov teda strieda doba fejk proteínov.

Celkom vítaná zmena.

Autor je výskumník v oblasti systémovej biológie.

Odporúčame

Denník Svet kresťanstva

Diskutovať môžu exkluzívne naši podporovatelia, ktorí prispievajú od 5,- € mesačne alebo 60,- € ročne. Pridajte sa k nim teraz, prosím.

Ak máte otázku, napíšte, prosím, na diskusie@postoj.sk. Ďakujeme.