200 milionów w półtora roku - tyle białek rozszyfrował AlphaFold. Dużo tajemnic biologii zostało rozwiązane

AlphaFold, algorytm uczenia maszynowego, rozszyfrował budowę niemal wszystkich białek, które znajdują się w organizmach na Ziemi w zaledwie półtora roku. To największy przełom po odczytaniu ludzkiego genomu, twierdzą naukowcy.

W ubiegłym roku AlphaFold, algorytm sztucznej inteligencji opracowany przez należącą do Google firmę DeepMind, rozszyfrował budowę 350 tysięcy białek ludzkiego organizmu, czyli niemal wszystkich. W czwartek ogłoszono, że ten sam algorytm w półtora roku odkrył budowę ponad 200 milionów znanych dziś białek

Te odszyfrowane 200 milionów to prawie wszystkie białka w światowej bazie białek UniProt. Powtórzmy: to prawie wszystkie białka znane z wszystkich żywych organizmów na Ziemi, od bakterii, przez owady, po ludzi. DeepMind i badacze z Europejskiego Laboratorium Biologii Molekularnej ogłosili przełom na łamach prestiżowego czasopisma "Nature".

Reklama

Białka są jak poskręcane wstążki. Ich badania zajmowały lata

Poznanie budowy białek było od wielu dekad celem biochemików. Ich skład, czyli kolejność aminokwasów - ogniw, które tworzą białkowe łańcuchy - potrafią określać dziś dokładnie i szybko. Jest zapisana w sekwencji DNA, która koduje białko. 

Ale łańcuchy aminokwasów, łączą się w białka tworząc długie i poskręcane nici. A to kształt białka decyduje, czy stanie się enzymem przyspieszającym reakcje, receptorem odbierającym sygnały, czy przeciwciałem reagującym na intruza. Od kształtu zależy też, czy do białka będzie pasował dany związek chemiczny, na przykład lek.

Określenie kształtu, w jaki zwinie się białkowa nić, nie jest proste. Trzeba uzyskać białko w formie krystalicznej. Potem zbadać je za pomocą krystalografii rentgenowskiej i mikroskopii krioelektronowej. Takie badania jednego białka zajmowały długie miesiące. Po pół wieku badań tymi metodami poznano kształty około stu tysięcy różnych białek. W kolejce czekało dwieście milionów  kolejnych.

Nawet superkomputery były bezradne wobec białek

Duże nadzieje wiązano z rozwojem komputerów i technik obliczeniowych. Szybko okazało się, że algorytmy mogą pomóc rozszyfrować kształt tylko w przypadku niewielkich białek, o krótkich łańcuchach. 

W przypadku długich łańcuchów białek nawet superkomputery nie dawały sobie rady - a nawet nie było sensu ich uruchamiać. Gdyby każdy aminokwas mógł łączyć się z kolejnym tylko na dwa sposoby, w białku złożonym ze stu aminokwasów liczba możliwych ułożeń wynosiłaby 2 do potęgi 100. To trylion trylionów. Wyliczanie tego zajmowałoby tysiące lat.

Zmieniła to dopiero sztuczna inteligencja, czyli algorytmy uczenia maszynowego. Nie liczą niczego krok po kroku. Nauczone na przykładach białek o znanym składzie i kształcie potrafią trafnie przewidzieć jak zwinie się białkowa nić. To, co zajmowało do tej pory miesiące prac w laboratorium, algorytm wykonuje w kilka godzin.

To jak zamiana wozu konnego na rakietę kosmiczną

Zeszłoroczny przełom (odszyfrowanie kształtów ludzkich białek) ogłoszono trochę w pośpiechu. Spółce DeepMind zaczęli po piętach deptać naukowcy. Niezależni badacze wpadli na pomysł stworzenia niekomercyjnego algorytmu. W ciągu pół roku udało im się stworzyć od podstaw własny, który nazwali RoseTTAfold.

Opublikowali swoją pracę w "Science" tydzień przed doniesieniem DeepMind w “Nature". Przyznawali, że komercyjny AlphaFold jest nieco lepszy, ale dostęp do niego jest płatny lub możliwy tylko przez Europejskie Laboratorium Biologii Molekularnej. Za RoseTTAfold jest dostępna dla każdego, za darmo i w dowolnym terminie na serwerze utrzymywanym przez badaczy.

Co zmienia rozszyfrowanie kształtu wszystkich niemal białek żywych organizmów na Ziemi? Bardzo dużo. To tak duży przełom, że badacze mówią o “prezencie dla ludzkości". Będzie można łatwiej opracowywać leki, szczepionki, znaleźć przyczyny wielu chorób. To, co zajmowało lata - a czasami dekady - może teraz zająć tygodnie lub miesiące.

INTERIA.PL
Reklama
Reklama
Reklama
Reklama
Reklama
Strona główna INTERIA.PL
Polecamy