Posiada bezbłędne programowanie, maksymalną kompresję danych i niewyobrażalną pojemność. Czy to jakiś superkomputer? Nie, to nasz kod genetyczny.
Niby wszyscy słyszeli o DNA, genach, mutacjach i tym podobnych, lecz nie do końca chyba wszyscy z nas wiedzą czym jest informacja genetyczna zawarta w każdym żywym organizmie. Choć informacja ta może być też zawarta w wirusach, które nie należą do istot żywych (czasem budzi to zdziwienie, ale tak jest: wirus nie spełnia kryteriów stawianych organizmom żywym).
W XIX wieku Grzegorz Mendel prowadził badania nad dziedziczeniem i domyślał się, że informacja o tym, jak ma wyglądać organizm żywy, musi być gdzieś zawarta. Podobnie Darwin, choć stworzył teorię ewolucji, nie wiedział nic o sposobie przekazywania tej informacji. Badania nad odkryciem nośnika informacji trwały bardzo długo i dopiero w połowie XX wieku udało się go zidentyfikować.
28 lutego 1953 roku James D. Watson i Frances H.C. Crick ogłosili, że poznali strukturę DNA – kwasu deoksyrybonukleinowego – kluczowego (choć nie jedynego), nośnika informacji genetycznej. Otrzymali za to odkrycie w 1962 roku, wraz z jeszcze jednym naukowcem Maurice’m Wilkinsem, nagrodę Nobla w dziedzinie medycyny. O tym, że DNA stanowi podłoże zapisu genetycznego wiemy od 1943 roku, ale samo DNA zostało odkryte w 1869 roku przez Fryderyka Mieschera. Trzeba było blisko stu lat, żeby dowiedzieć się, czym jest i jak niezwykłą rolę pełni w naszym organizmie. Jednak poznanie struktury DNA, a zrozumienie jego działania, to dwie różne sprawy.
Fot. KTSDESIGN, Science Photo Library, Getty
Zacznijmy od białka
Jak prosto opisać działanie DNA? Proste to nie jest. Mimo wszystko spróbujmy. Musimy zdać sobie sprawę z tego, jak zbudowany jest każdy żywy organizm. Jego podstawowym budulcem są białka. To takie fundamentalne cegiełki, z których składa się wszystko co żywe. Liczba ich rodzajów jest ogromna. Co więcej często łączą się z innymi substancjami takimi jak cukry, tłuszcze (mówimy wtedy o nich odpowiednio glikoproteiny, lipoproteiny) i inne. Powoduje to niezwykłe bogactwo i różnorodność składowych, tworzących organizmy żywe. Białka te, oprócz funkcji budulcowych, mogą i uczestniczą w najprzeróżniejszych funkcjach związanych z metabolizmem komórkowym (przemianą materii). Każdy gatunek, a nawet organizm, ma białka podobne, ale i różniące się między sobą. Albo inaczej: są grupy białek, które pełnią w każdym organizmie podobne funkcje, ale pomiędzy poszczególnymi organizmami mogą się w swej budowie troszkę różnić (czasem mniej, czasem więcej). Tak naprawdę to białka stanowią o tym jak wyglądamy, jak funkcjonujemy itp. Białka są jednak substancjami składającymi się z mniejszych cząsteczek. Cząsteczki te nazywamy aminokwasami. W przyrodzie występuje ich wiele, ale tych, które wchodzą w skład białek jest 20. Łączą się ze sobą tworząc długie łańcuchy. Porządek w jakim poszczególne aminokwasy są ze sobą połączone jest niezwykle istotny, bo nawet pojedyncza zmiana jednego tylko aminokwasu może stanowić o tym, że finalny produkt, czyli białko, będzie miało diametralnie różne właściwości. Niektóre z białek składają się z setek tysięcy aminokwasów, a wystarczy tylko jedna zmiana, żeby białko to wykazywało całkowicie odmienne właściwości od wyjściowego. Oznacza to, że np. enzym (który jest białkiem) może stracić swoją funkcjonalność, lub nabyć zupełnie niepożądanej. Może to prowadzić w krańcowym przypadku do śmierci komórki, jeśli dotyczy to jakiegoś kluczowego enzymu np. biorącego udział w oddychaniu.
Co do tego ma DNA?
DNA ustala kolejność (sekwencję) aminokwasów w łańcuchach tworzących białka. To w nim jest dokładnie opisane, jaki aminokwas w której pozycji ma się znaleźć w łańcuchu białka. Jest niczym program komputerowy, który decyduje, co i w jakiej kolejności zobaczymy na ekranach naszych komputerów. Ta analogia do oprogramowania jest zresztą niezwykle trafiona. Kod programu zbudowany jest w swej najbardziej podstawowej strukturze z szeregu zer i jedynek, a ich kolejność decyduje o funkcjonalności programu (od razu przepraszam wszystkich informatyków za takie uproszczenia). Podobnie jest w DNA. Ono dla odmiany nie składa się z zer i jedynek tylko, jak to mądrze piszą uczeni, z par zasad (zasady w rozumieniu substancji chemicznych). Zasad kodujących w DNA jest cztery. Dla fanów trudniejszych nazw wymieńmy je: adenina (A), tymina (T), guanina (G), cytozyn (C). Celowo napisałem w nawiasie ich literki, bo w zapisach, które odczytują genetycy, używa się właśnie tych liter jako skrótów – ułatwiających i skracających zapis. Zatem przykładowy kod genetyczny odczytany przez genetyka może wyglądać tak: ACTGAATTCGCGCGGAATTAC. To bardzo krótka sekwencja. Koduje siedem aminokwasów. Dlaczego akurat siedem? Dlatego, że każdej trójce zasad odpowiada jeden aminokwas. A przypominam, że aminokwasów mamy 20. Zarówno długość nici DNA, jak i długość łańcucha budującego białko nie są niczym ograniczone. Zatem ustalając sekwencję zasad (literek) kodu genetycznego, jesteśmy w stanie odczytać sekwencję aminokwasów w łańcuchu białka, czyli możemy odpowiedzieć na pytanie, czym to białko się zajmuje.
Fot. wyss.harvard.edu
Bezbłędna maszyna kodująca
Ile zasad jest w jednym łańcuch DNA człowieka? Odpowiadam: trzy i pół miliarda! I każda – podkreślam – każda komórka, dysponuje pełnym zestawem tego materiału genetycznego. Każda z tych komórek, która buduje nasz organizm, dzieli się i musi powielać materiał genetyczny do potomnych komórek bezbłędnie, a komórek w naszym organizmie jest 10×1012. Czy wyobrażacie sobie liczbę operacji przepisywania takiej ogromnej ilości danych w ultrakrótkim czasie i to w dodatku bezbłędnie? Wystarczy jeden błąd, jedno potknięcie i nagle białko pełni inną funkcję. A co za tym idzie komórka przestaje pełnić swoją prawidłową rolę i albo umiera, albo co gorsza, może stać się zarzewiem nowotworu. Ilość czynników, które mogą zakłócić funkcjonowanie aparatu związanego z DNA, jest ogromna i obejmuje wiele substancji chemicznych, biologicznych i fizycznych. Jak to się dzieje, że pomimo takiej ogromnej ilości informacji przepisywanych wciąż na nowo, w ogóle możemy funkcjonować? Myślę, że nie dam rady tego opisać w tym jednym felietonie, ale do tematu powrócę. Na razie powiem tylko, że mechanizmy te są niezwykle złożone, samokontrolujące się i niezwykle rzadko popełniające błędy.
Wszystkie zmiany, w DNA, które jednak powstają nazywamy mutacjami. I tu zaskoczę czytelnika: niektóre z tych mutacji są celowo przez nasze organizmy wywoływane. Dlaczego? Są takie obszary funkcjonowania naszego organizmu, gdzie zmienność, nawet przypadkowa, jest konieczna do prawidłowego funkcjonowania. To osobna opowieść i o niej też napiszę.
Maksymalna kompresja, czyli cała wiedza świata w bagażniku auta
Jednak nie bez kozery porównałem kod genetyczny DNA do kodu komputerowego. Po pierwsze analogia narzuca się sama. Po drugie zobaczcie jak ogromną ilość danych przyroda upakowała we wręcz mikrometrowych rozmiarach. Cała informacja genetyczna o budowie człowieka mieści się na kilku mikrometrach! Wszystkie programy do kompresji danych mogą się schować, a my jedynie zawstydzić się tworząc technologie naśladujące naturę.
Ale przecież podpatrujemy naturę i doskonale potrafimy ją naśladować. Ostatnio prowadzi się dużo badań na temat możliwości zapisania danych komputerowych w DNA. I to z jakim efektem! Już dziś jesteśmy w stanie zapisać w ten sposób nie tylko tekst, ale także zdjęcia a nawet film. To zdumiewające, ale pojemność i trwałość DNA jest tak ogromna, że myśli się nawet o tym, żeby wykorzystywać DNA jako swoisty magazyn danych. A pojemność takiego magazynu jest niewyobrażalna.
Czy potraficie sobie uzmysłowić, ile danych ludzkość zgromadziła w Internecie? Całym Internecie? Żeby to wszystko zgromadzić potrzebujemy dziesiątków, jeśli nie setek tysięcy centrów baz danych pochłaniających ogromne powierzchnie i czerpiące gigantyczne ilości energii. Czy wiecie, ile zajęłyby te informacje, gdyby je zapisać w DNA? Powiem szczerze – sam byłem zdumiony. Cała wiedza świata przy użyciu kodowania w DNA zmieściłaby się w bagażniku waszego samochodu.
Czujemy się panami świata i przyrody. Jeśli jednak uświadomimy sobie co potrafi przyroda to konstatacja, że cierpimy na megalomanię, nawet w części nie oddaje rzeczywistości.
Fot. Shutterstock
Powyższy tekst jest artykułem popularnonaukowym. Zawiera szereg uproszczeń. Proszę zatem wszystkich czytających, aby wzięli to pod uwagę, a jeśli kogoś on zainteresował i wzbudził ochotę do dalszych studiów, to zachęcam do sięgnięcia do literatury fachowej.
Prof. Marcin Pasiarski
Kierownik Kliniki Hematologii, Immunologii i Transplantacji Szpiku Świętokrzyskiego Centrum Onkologii w Kielcach, konsultant wojewódzki w dziedzinie hematologii oraz przewodniczący świętokrzyskiego oddziału Polskiego Towarzystwa Hematologów i Transfuzjologów. W kręgu jego zainteresowań znajdują się techniki związane z tworzeniem nowych rodzajów szczepionek, nowoczesne metody zwalczania chorób nowotworowych oparte o immunoterapię adoptywną oraz leczenie nowotworów z użyciem komórek CAR-T. Wykłada w Collegium Medicum Uniwersytetu Jana Kochanowskiego. Jest fanem Jean’a Michela Jarre’a. Fascynuje się także nowymi technologiami. Uwielbia podróże i jeśli tylko jest okazja bierze plecak i w rusza w drogę.