Single nucleotide polymorfismus (SNPs)

Úvod

          Lidský genom obsahuje zhruba 3 miliardy párů bazí, přičemž se v něm vyskytují pouze 4 typy “základních kamenů” tzv. nukleotidů: Adenin (A), Thymin (T), Cytosin (C) a Guanin (G). Jednotlivé typy komplementárních nukleotidů se vzájemně spojují, čímž dochází k řetězení DNA. Navzájem se však může spojit pouze A + T nebo C + G. Všichni lidé na planetě mají z 99,9 % stejný genom, což nám zaručuje příslušnost k jednomu druhu, zatímco rozdíl mezi našimi DNA je zodpovědný za rozdíly mezi jednotlivci. Tyto odlišnosti v DNA ovlivňují nejen náš zevnějšek, ale také naši náchylnost nebo odolnost k určitým nemocem, případně rezistenci k lékům. Tyto odlišnosti v DNA nazýváme Single nucleotid polymorfismy SNPs (z anglického Single Nucleotide Polymorphisms, čti “snips”) někdy též bodové polymorfismy. V současné době je v lidské DNA známo něco okolo 9 milionů SNPs. Má se za to, že většina těchto SNP se v transkripci svého genu neprojevuje a jejich obsah není překládán do struktury proteinů. Některé SNPs však přímo ovlivňují expresi genu během onemocnění nebo obsahují infomaci, která se překládá do struktury proteinu. Kdybychom odhalili klíč, který by nám umožnil “odkódovat” informaci uloženou v SNPs, mohli bychom, po přečtení DNA, určit k jakým nemoc je daný člověk náchylný nebo odolný, mohli bychom připravovat léky, které by maximalizovali léčebný efekt a minimalizovali vedlejší účinky.

Polymorfismus a nemoci

          V lidské populaci je poměrně nízká genetická diverzita, zapříčiněná krátkou evolucí člověka. Existuje však několik vzácných variant (přítomny v populaci s frekvencí menší než 1 %), jež souvisí s vážnými zdravotními problémy, které jsou však většinou skryty u heterozygotních jedinců za dominantní alelou. Tyto vzácné varianty lidského genetického kódu pravděpodobně vznikly nedávno a jsou vysoce přenosné na další generaci. Na druhou stranu existují názory, že i běžné varianty lidského genu mohou významně přispívat ke genetickým změnám při běžných onemocněních (common disease-common variant CD-CV hypotéza). Pokud bychom akceptovali tuto hypotézu, pak bychom měli sestavit katalog mutací, které se vyskytují při dané chorobě. Dalším krokem by bylo určení těch mutací, které jsou opravdu zodpovědné za výskyt choroby. V tomhle postupu můžeme využít projekt Human genome project, jehož cílem je sestavení kompletního lidského genomu (pořadí bazí), identifikace genů a popis jednotlivých variant genů. Bohužel je velmi obtížné porovnávat různé varianty (uvnitř genu, mezi geny a mezi populacemi), protože každý člověk je jiný s jinýmy nároky a jiným vzorcem chování, které může ovlivňovat spoustu dalších faktorů. V ideálním případě bychom měli dostatečné množství lidí s různými variantami genetického kódu, kteří by žili ve stejném prostředí a podléhali stejným podmínkám. Toho však nikdy nelze dosáhnout a proto je studium genetických variant omezeno na tzv. asociační studie, které využívají vzorek lidí žijících ve stejných podmínkách.

Asociační studie

          Projekt lidského genomu měl za cíl popsat celou strukturu DNA. Jedním z velkých přínosů tohoto projektu bylo odhalení milionů variant DNA úseků, z nichž většina byla tvořena SNPs. Spojením několika farmaceutických firem, technologických firem a akademických středisek vzniklo mezinárodní SNP consortium, které se zaměřilo na sestavování podrobných SNP map lidského genomu a své výsledky publikuje na veřejných místech. Díky tomuto kroku mohou být jednotlivé SNP využity nezávislými laboratořemi k dalšímu výzkumu a nemusí se řešit otázky patentů. Stanovení tisíce vzorků DNA různých pacientů použitých v typických studiích za použití rychlých sekvenovacích zařízení musí být dobře reprodukovatelné a jeho cena by měla být co nejnižší. Poté se genotypy (SNPs) jednotlivých pacientů porovnávají s jejich fenotypem (klinické projevy) pomocí náročných statistických softwarů. Asociační studie zaměřené na výzkum SNPs se dělí na dva typy:

  1. přímé testování funkčních projevů SNP k dané chorobě
  2. používání SNP jako markeru pro nerovnováhu (LD - linkage disequilibrium)

          LD je obecně definováno měřením asociace mezi dvěmi genetickými markery, díky čemuž pak mohou sloužit k identifikaci oblastí souvisejících s nemocí. Princip této metody je stejný jako při určování genů zodpovědných za nemoc v rodině hledáním spojovací linie nemoci u předků (linkage analysis). Bohužel je při rodinných studiích k dispozici příliš málo generací (respektive jejich genom) a tak se projevy onemocnění hledají v rodokmenech. V lidském genomu je přibližně 300 vysoce specifických opakujících se markerů, které přímo označují gen odpovědný za monogenní onemocnění. Naopak LD v populaci označují místa, kde pod tíhou rekombinace došlo k vyřazení genetických markerů. LD navíc podávají informaci o výskytu nových mutací či genetického driftu. Otázka množství markerů, které jsou zapotřebí k popisu LD na genomu k identifikaci genů asociovaných s daným onemocněním je velmi nejasná. Pokud bychom měli dostatečně podrobný popis struktury lidského genomu (pomocí sekvenování), mohli bychom snížit počet markerů potřebných k označení LD na genomu a soustředili bychom se jen na místa bohatá na geny. Úplná znalost stupně a vzorce kolísání rekombinací v genomu by nám umožnila rozmístění markerů v rozumné formě a pravděpodobně o snížení počtu markerů potřebných k určení LD. Jednoduchým porovnáním různých úseků DNA s tělesným stavem odhalíme velké množství variant vztahů genetické predispozice a jejího odrazu v tělesné schránce.

Metody studia

          Analýza kandidátních genů, kde je patřičný gen vybrán na základě biologických projevů a testován ve vztahu k danému onemocnění, je praktická metoda pomocí níž jsou určovány geny zodpovědné za určité onemocnění. Více pragmatický způsob je využití linkage analýzy k určení rizikových míst na genomu v postižených rodinách a poté provedení analýzy na vhodné populaci, vedoucí ke zpřesnění rizikového místa určitého genu. Bohužel i tento přístup má své hranice, protože linkage analýza je poměrně málo efektivní.

Používání SNP map k identifikaci genů odpovědných za nemoc

          Frekvence, stabilita a relativně rovnoměrné rozmístění SNPs v genomu z nich dělá vhodný genetický marker. Sestavení podrobné SNP mapy může být využito ke zjištění odpovědnosti toho kterého genu za danou chorobu. Čím blíže je určitý SNP k vnímavému genu, tím spíše bude přecházet spolu s tímto genem do další generace. SNP, který se často liší u jedinců s nemocí, se porovná se zdravými jedinci, tento SNP nás upozorní na blízkost genu, který nemoc způsobuje. Stále rostoucí znalosti o genetickém podkladě nemocí nás vede k lepšímu porozumění tomu, jak která nemoc vzniká a dále se rozvíjí. Pochopení těchto souvislostí nám pomůže k vytváření účinných medikamentů k potlačení choroby i k její prevenci. Stejně tak podrobná SNP mapa nám pomůže identifikovat SNP, které jsou zodpovědné za odlišnou vnímavost k lékům a v budoucnosti by mohla posloužit k přípravě léků bez vedlejších účinků podle potřeb pacientů.