Bir gram DNA'ya Dünyaları sığdırmak (Dünyalar = 455 Exabyte)

Bir gram DNA'ya Dünyaları sığdırmak (Dünyalar = 455 Exabyte)

New Scientist'te yazıyor 1 gramlık DNA'ya 455 milyon terabytelık veri depolanabileceği. 4 gramı, tüm Dünya'da bir senede üretilen bilgiyi tutabilir (Bu teorik kapasite ama iki sene önce bir ekip 700 terabyte depolamayı zaten başarmıştı).

Peki bu ne demek, nasıl oluyor? Hemen şimdi mi imana gelelim, biraz bekleyelim mi?

DNA, orjinal amaci açısından epey dandik bir tasarım: Kopyalanırken bozuluyor, her hücrede tamamının bulunması gereksiz, önemli bir kısmı evrim sürecinde işlevsiz kalmış (sadece %8'lik bir kısmı fonksiyonel ve sadece %2'si protein sentezliyor). Ama DNA veri depolama için şahane: 

Adenin bu işte. Buna 01 değeri atayıp 4 tanesini ucuca eklersek, ASCII standardına göre U harfini elde ederiz. Baska bir standarda gore yorumlarsak belki de bir resmin köşesindeki minik, mutlu bir bulut olacak.

Adenin bu işte. Buna 01 değeri atayıp 4 tanesini ucuca eklersek, ASCII standardına göre U harfini elde ederiz. Baska bir standarda gore yorumlarsak belki de bir resmin köşesindeki minik, mutlu bir bulut olacak.

  1. Ufak bazlardan olusuyor (A,G,T,C... alt tarafı karbon, nitrojen gibi birkaç atomdan olusan çeteler bunlar)
  2. Böylece sadece birkaç atomla 2 bit temsil ediyoruz. (4 baz olduğundan her baz iki bite denk gelir. mesela guanin: 00, adenin: 01..)  
  3. Oda sıcaklığında bile binlerce yıl dayanıyorlar. Soğukta ise milyonlarca.
  4. Ucuca ekleyip uzun zincirlerle istediğimiz kadar bilgiyi kodlayabiliriz. Bunun teknolojisi resmen ayağa düştü.
  5. Zincirleri cok ufak alanlara sıkıştırmak mümkün. Kopup, yandaki zincire bağlanarak kodladığın bilgiyi mahvetmiyorlar.
  6. Depolanmış veriyi okuyabilmek de elzem. Ve DNA decode etmek de kolay artık. Eger veri kodlanırken iyi hata düzeltme kodları (ECC, error-correcting-codes) eklenmişse, nerdeyse %100'lük başarıyla o veri geri okunabiliyor.

Şimdi 1,2,3 çok özel degil. Olay atomlara bit degeri atamaktan ibaret olsaydı, ayni bilgiyi donuna da kodlarsın, tahta sehpaya da. Ama 4, 5 ve 6 DNAyı özel kılıyor. Hem yapısı uygun, hem de tıp alanında önceden yapılmış yatırımlar sayesinde bu iş ucuz.


Human Genome Project Amerikan halkına 2.7 milyar dolara malolmuştu (3 milyarlik butcesi vardi). Bu projede edinilen bilgiler sayesinde, tek bir insan genomunu kodlamak 10-100 milyon dolarlik masraftı. Bugün bu rakam genom basina sadece bin dolar. Yani 100 bin kat daha ucuz. Gereken donanım da "sadece" 10 milyon dolar. 
 

Human Genome Project bittikten sonra, genom analizinin ucuzlaması Moore Kanuna yakın bir çizgide ucuzlamış. 2007de yeni nesil teknolojiler devreye girince sadece 3 senede 1000 katlık bir ucuzlama yaşanmış. 2013te biten bu grafik bile eskide kaldı, yeni nesil 1000 dolarlık genom sekansı teknolojisiyle.

Human Genome Project bittikten sonra, genom analizinin ucuzlaması Moore Kanuna yakın bir çizgide ucuzlamış. 2007de yeni nesil teknolojiler devreye girince sadece 3 senede 1000 katlık bir ucuzlama yaşanmış. 2013te biten bu grafik bile eskide kaldı, yeni nesil 1000 dolarlık genom sekansı teknolojisiyle.


Peki DNA diskleri daha niye yok? Neden bütün porno arşivimizi annemizin göremeyeceği yerde, mesela gerektiğinde burnumuzdan çıkarıp bilgisayara takacağımız bir kılda tutamıyoruz? Bilim bunları sağlamayacaksa ne işe yarar!

Çünkü bu kadar ucuzlamaya rağmen, megabyte başına depolama masrafı 10 bin dolar civarı. Harddisklerde ise gigabyte başına birkaç cent (1 milyar kat daha ucuz). O yüzden ancak uzun dönem depolama yapacak kütüphaneler, hükümetlere yarar (Bu arada Norveç'in, Antarktikada yerin 120 metre altında, Dünyadaki tüm tohumlar için bir gen bankası yaptığını biliyor muydunuz?)

Masrafın ötesinde, veri okuma hızı da düşük. Modern RAM'lerde tutulan veriler saniyede 15-25 gigabyte hızda okunuyor. Günde ~2000 terabyte. Habere konu olan yeni nesil DNA sekansı ise günde 600 milyar baz işleyebiliyor. Her biri için 2 bitten (daha akıllıca bir kodlama yöntemi de var), 150 gigabyte. Yani RAMe göre ~10000 kat yavaş. Masrafa göre normalize edince, dolar başına 10 trilyon kat daha yavaş

Günün sorusu: Bu teknolojiyle WoW oynarsanız, kaç saniye hayatta kalırsınız? (Ve sinema filmi gibi oyunlar dururken ne diye böyle şeyler oynanıyor?)

 

  Katolik kilisesinin DNA'nın evrimi hakkındaki resmi görüşü 

 

Katolik kilisesinin DNA'nın evrimi hakkındaki resmi görüşü 

Not: Bu haberlerde aklıma takılan birşey oldu. Önceki ekipler 700 terabyte veriyi 1 milimetre küp DNA'ya koymuşlardı. Burada ise konu bir gram DNA ve artış 1 milyon kat. Acaba bir gram DNA kaç milimetre küpe sığıyor? Su gibi olsa cevap 1000 olur. Yani depolama yoğunluğundaki gerçek artış (teoride tabii) bir milyon değil bin kat olacak. Biraz bakındım da bulamadım kesin birşey.

Ek: Twitterdan dediklerine gore 1.4 - 1.7 gr/cm3 imiş. Demek ki yeni yöntem 2 sene önceki Harvard ekibinin çalışmasına kıyasla 1000 kat artışı öngörüyor aşagı yukarı. 

Bir iPhone uğruna ya Rab, ne istatistikler batıyor!

Bir iPhone uğruna ya Rab, ne istatistikler batıyor!

"Kaşının üstünde gözün var, başını eğ sıkıyönetim var" paketi

"Kaşının üstünde gözün var, başını eğ sıkıyönetim var" paketi