Генетични данни с открит достъп

- 6 mins

Поради личен интерес към случващото се в генетиката (и, въобще, в днешната наука), както и поради неубедителни (не)научно-фантастически причини, реших в открит достъп да публикувам част от генотипа си. Какво точно направих? 23andme е фирмата на жената на Сергей Брин, която предоставя достъпни цени за генетични изследвания (подробности по-долу). Платих $250 на 23andme.com и $100 на DHL за да ми пратят от щатите епруветка, в която да се изплюя и да изпратя обратно. След 3 седмици ми съобщиха:

Кратък ЛикБез (сов.рус. ликвидирование безграмотности): Генетичната информация се записва като ДНК последователност от четири вида нуклеотиди: A, C, G и T (спиралната структура сега не ни вълнува).

Ако последователностите ДНК са „мозък“, то белтъците са „мускули“. В ДНК са записани всевъзможни „рецепти“ за развитие (схеми и алгоритми за строеж), които се трансформират в белтъци, които изпълняват конкретни задачи (напр. разпознават вируси).

Участъците ДНК, кодиращи  белтъци се наричат гени (напр. гени, определящи цвета на очите). Конкретна проява на ген се нарича алел (напр. алел за сини очи). Алелите могат да се различават сред различните индивиди.

Геном се нарича съвкупността от генетична информация на един организъм (човешкият геном съдържа около 3млрд нуклеотида). Чо

Ако в популацията има индивиди, които на дадена позиция в генома си имат различни нуклеотиди, то тази позиция се нарича SNP (Single-nucleotide polymorphism).  Реално, не по всички позиции хората се различават, а само по около 10 млн.

Защо прочитат само част от генома? Към 2000г. е бил почти-напълно прочетен първият човешки геном и оттогава биологията (най-вече генетиката) изглеждат на порядък по-привлекателни за широк спектър от специалисти-физици/информатици/математици. А непрестанно падащата цена за пълно секвениране (четене на генома) от $100’000’000 през 2001г. до $10’000 през 2012г вече стабилно е насочила основните технически и човешки ресурси към масово предоставяне на персонална генетична информация. Граалната цел, очаквана в близките едноцифрено-чило-години е $1000/геном, но дори сега простосмъртните могат да се възползват от „четене“ на ограничено количество SNP (~1млн за $300), за някои от които е известна взаимовръзка със заболявания (значими резултати биват получавани за рак на гърдата и болестите на Паркинсон и Алцхаймер). През 2012г. 23andme започнаха четене на целия екзом (тези 1% от генома, които пряко кодират белтъци) — около 30млн нуклеотида за $1000.

Кой още е открил генетични данни публично? В началото на 2011г  американски програмист публикува резултатите си от 23andme и скоро след това идеята е започнала да се разпространява. Когато дойде моят ред да обмисля къде да публикувам своите данни, вече съществуваше open source платформата opensnp.org, разработана от няколко немски биоинформатика, един от които имах удоволствието да поразпитам конкретно. В областта има много какво още да се направи от гледна точка на инструменти за обработка на данните, уеб-интерфейс, рекламиране на предимствата на откритата наука, изясняване на етическите проблеми и т.н. Но към октомври 2012г има събрани >260човека, публикували в свободен достъп генетичните си данни, заедно с указани фенотипни признаци (заболявания, физически качества и т.н.), които могат да бъдат използвани за търсене на зависимости. 1’000 човека с известни генетични и фенотипни признаци са достатъчна база за сериозени изследвания.

Как изглеждат генетични SNP данни? Суровите (RAW) генетични данни изглеждат така:

# rsid chromosome position genotype rs4477212 1 82154 AA rs3094315 1 752566 AA rs3131972 1 752721 GG rs12124819 1 776546 AG rs11240777 1 798959 GG rs6681049 1 800007 CC ...

където всеки ред описва един SNP: — rsid е названието му — chromosome е номера на хромозомата, в която се намира (присъства и хромозома „MT“, т.е. „митохондриална“) — position е еднозначния номер на позицията на дадения SNP в последователно номерирания геном — genotype са два нуклеотида (двата присъстващи алела на съответния SNP), един от мама и един от тати (важно: не е ясно кой е от мама и кой е от тати); ако нуклеотид не е бил определен достатъчно надеждно, на мястото му е записан дефиз.

А сбита част от анализите, които 23andMe правят, можете да прочетете тук: Petar-Ivanov-Report. За да видите всички анализи трябва да ми пишете, за да разреша персонален достъп чрез официалната платформа на сайта им.

Какви са аргументите ПРОТИВ публикуване?

Весело звучеше застрашаващото предупреждение при даването на съгласие в сайта на 23andme: „Потвърдете, че осъзнавате необратимостта на получаванете на информацията, касаеща здравословното ви състояние“ (т.е. че ако веднъж ми съобщят, че съм дефектен, няма да могат да си върнат думите назад :”).

Какви са аргументите ЗА публикуване? Това, което мен ме интересува, е откриването на науката за независими учени (не изключвам, че един ден от тези данни ще мога да се възползвам и аз). А докато се научим да използваме толкова качествено достъпните данни, ще мине немалко време. Всъщност, много ще се радвам, ако приживе ми се отдаде възможност да бъда свидетел на подобен пробив в науката и технологията. А що се отнася до сигурността на личните данни, то какво да кажем за сигурността на мъртви кожни клетки (навсякъде), слюнка (по чаши), назалные секреты (по кърпички), косми (навсякъд), урина (в обществени тоалетни), семенна течност? При това, не само вашето тяло може да разкрие съществена част от генома ви, но също така телата на роднините ви.

Интересен факт (като бонус, че дочетохте дотук) Понеже простолюдието в ССС(Р)усия е отдавна промито на тема „искат да ни изтребят до крак“, „всички проблеми идват от запад“, „няма да им се дадем“ и т.н., то законодателите получават овации за всяка стъпка по „опазване на нацията“. Освен ежегодно СПИН-изследване на чужденците („да покажем кой ни разболя“), са съумели да въведат закон за забрана на износа на биологичен материал (?!) от страната (т.е. да си изнесеш задника можеш, а плюнка в писмо не можеш, само ако е заедно с теб). Че да не вземат американците да изобретят биологично оръжие, насочено към руския народ (сякаш в САЩ малко руснаци има за евентуални изследвания). Съответно, 23andme не ги допускат да работят с Русия. Приятели излизат за по 1 ден във Финландия и оттам свободно си плюят. :”)

Pesho Ivanov

Pesho Ivanov

comments powered by Disqus
cv photos couchsurfing rss facebook twitter github youtube topcoder mail protonmail spotify instagram linkedin