NCBI (The National Center for Biotechnology Information), özellikle genetikçilerin ve moleküler biyologların araştırma yaparken, en fazla kullandığı sitelerden biri. Nitekim Dünya çapında “bilim” kategorisinde en fazla tıklanan 3. site.
Site, içinde arama yapılmasını kolaylaştıracak onlarca veritabanı barındırıyor. Bu yazıda, her veritabanın ne anlama geldiği kısaca anlatacağım.
Sitenin kullandığı terimler, alışkın olmayanlar için çoğu kez yabancı gelebiliyor. Arama yapılacakken, hangi veritabanının kullanılması gerektiği bilinmeyebiliyor. Kullanım Kılavuzu’nun bu ilk bölümünde arama yaparken nereden başlanması gerektiğini, hangi veritabanının seçilmesi gerektiğini, bu veritabanların ne anlama geldiğini anlatacağım.

Doğru veritabanını seçmek sonuca ulaşmada çok önemli.
NCBI’nın web sitesini ziyaret ettiğimizde üst kısımda arama kutusunu, onun hemen solunda ise veritabanı listesini görürüz. Bu listede “Pubmed”, “Protein”, “Nucleotide” gibi veritabanları yer alır. Şimdi sırasıyla bu veritabanlarında ne gibi veriler içerdiğine bakalım.
Bu veritabanı NCBI üzerinden en fazla arama yapılan kısım diyebiliriz. Kabaca, biyolojik sistemlerde bulunan tüm etkileşimlere ait makaleler burada toplanır. Örneğin, bir araştırmacı, östrojen hormonunun kılcal damarların tamir edilmesindeki rolü hakkında bir sonuç bulursa, buna ait makale PUBMED’de yayınlanır.
Bahsi geçen etkileşimler moleküler düzeyde olmayabilir. Örneğin, prostat kanseri hastalarında, stres endişe ve depresyon gibi davranışların nasıl geliştiğine ait bir çalışma PUBMED’de yayınlanabilir. Sadece etkileşimler de değil, aynı zamanda yeni bulunan metotlar da burada yayınlanır. Örneğin beynin özel bölgelerindeki nöron yoğunluğunun bulunması için yeni bir metot geliştirilirse, bunun ile ilgili makale yine PUBMED’de yayınlanır. Özetle, incelediğiniz, merak ettiğiniz, bir biyolojik faktör (molekül, bir teknik ya da psikoloji kavramı vs.) hakkında daha önce yazılmış bir makale varsa bu makale PUBMED’de bulunur.
Adından anlaşıldığı gibi, özel bir protein hakkında bilgi almak için kullanacağınız bir veritabanı. Aradığınız proteinin kaç amino asitten oluştuğu, genomda hangi bölgede kodlandığı, yapısının kimler tarafından ve hangi çalışma ile açığa kavuştuğu, içerdiği amino asitlerin hangileri olduğu ve amino asit dizisi hakkında bilgileri alabilirsiniz.
Eğer özel bir genle ilgileniyorsanız; bu genin ya da bu gene ait bir tek ekzonun, bir virüsün tüm genomunun vs. sekansını bulmak için bu veritabanı kullanırsınız. Bu diziler, sekans yapılırken, restriksiyon enzimiyle kesim yapılacak bölgelerin tayininde, klonlama yapılmasında, benzer dizileri karşılaştırmada, bir örnekten elde edilen gende mutasyon-polimorfizm olup olmadığının taranmasında vs birçok çalışma sıkça kullanılıyor. (Bu veritabanına ait bir uygulamaya “Bir Genin DNA Dizisi Nasıl Bulunur?” başlıklı yazıdan ulaşabilirsiniz.)
Özetle, bir genin dizisine ihtiyacınız varsa, uğrayacağınız yer “Nucleotide” veritabanı. Örneğin, PAX2 geninin Nucleotide veritabanındaki sonucuna buradan bakalım. Sayfayı açtığınızda aşağı doğru inin. Karşınızda, PAX2 geninizin genetik kodu.
Expressed Sequence Tag’lerinin bulunduğu veritabanı. EST nedir peki? Ekspres edilen bir geni temsil eden cDNA, izole edilmesinden sonra, bu dizinin (genelde 5’ ucundan) ilk birkaç yüz bazının dizisi çıkarılır. Bu kısmi cDNA dizilerine EST deniyor. Bu ilk birkaç yüz baz, genom üzerinde kendine özgü bir yapı içeriyor. Bu yapıları ile genom üzerinde bir sınır işareti olarak görev görüyor.
Genom üzerinde özel bir gen aranacaksa, tüm geni aramak yerine sadece o gene ait EST’yi aramak çoğu zaman daha hızlı ve daha ucuz bir çözüm oluyor. EST veritabanında, şu ana kadar çıkarılmış EST yer alıyor. EST hakkında daha geniş bilgi için bu sayfayı ziyaret edebilirsiniz.
(The Genome Survey Sequences Database) adı verilen veritabanı aslında yukarıda anlattığım EST veritabanı ile aynı mantığı içeriyor. İlgili protein kodlayan gende, belirleyici olan ilk birkaç yüz bazın dizisini barındırıyor. Ancak bir farkla. GSS’de bulunan diziler cDNA üzerinde değil, doğrudan genom üzerinden elde ediliyor. Bu bağlamda mRNA üretmeyen bölgelere (mesela tekrarlı diziler) ait özel diziler de araştırılabiliyor.
Adından da anlaşılacağı üzere bir proteinin 3 boyutlu yapısını bulmak için kullanılan bir veritabanı. Burada arama yaptığınızda, ilgili proteinin 3 boyutlu yapısını, kaç adet domaini olduğunu, bu domainlerin proteinin hangi bölgelerinde bulunduğu görülebiliyor. Ayrıca 3B moleküler yapı çizen programlar için (Cn3D, RasMol gibi) aradığınız protein ile ilgili dosyaları indirebiliyorsunuz.
Genome veritabanı Archaea, Bacteria, Eukaryotae, Virüsler, Viroidler ana gruplarına ait canlıların genomlarını genel olarak incelenmesine olanak tanır. Aradığınız canlının genomunda kaç kromozom bulunduğunu, kromozomlarında bulunan önemli genleri ve bu genlerin yerlerini genel olarak görmenize olanak tanır.
Örneğin, “genome” veritabanında Homo sapiens diye aratırsak, insan türüne ait kromozomların bir listesini alırız. Bu kromozomlardan herhangi birine girdiğimizde o kromozoma ait ayrıntılı bilgilere kavuşuruz. Mesela buradan 22. kromozomumuza ait haritaya göz atabilirsiniz. Açılan sayfadaki terimlerin ne anlama geldiğini ileriki bölümlerde ele alacağım.
Okullarda “pathway” adıyla öğretilen tüm metabolik etkileşimlerin bulunduğu veritabanı. Bu veritabanını kullanarak, herhangi bir canlıdaki herhangi bir metabolik olayın işleyiş şemasını elde edebiliriz. Aynı zamanda, bu metabolik olayda hangi proteinlerin, genlerin ve diğer moleküllerin çalıştığını, bunların birbirlerini hangi yolla etkilediğini görebiliriz.
Örneğin, çalışmanız sırasında galaktoz metabolizmasının nasıl işlediğine dair ve bu işlemde hangi moleküllerin rol oynadığını merak ediyorsunuz. O halde “Biosystem” veritabanından “Galactose metabolism” olarak aratıp sonuç elde edebilirsiniz. Galactoz metabolizmasına ait sonuç sayfalarından birinin neye benzediğine buradan bakabilirsiniz.
Adından da tahmin edeceğiniz üzere, bu veritabanını kullanarak NCBI üzerinde bulunan kitaplar üzerinden arama yapabilirsiniz. Burada bulunan kitapları kısıtlama olmadan okuyabilirsiniz. İlgili kitaplarda bulunan tüm görsellere de ulaşmak mümkün.
Burada, dikkat etmeniz gereken bir nokta var. Kitaplara tıkladığınızda, içindekiler sayfası açılacaktır. Buradaki başlıklara tıklayarak ilgili bölüme gidebilirsiniz. Ancak Bazı kitapların yayıncıları, NCBI üzerinde başlıklara bağlantı vermesini istemediğini bildirdikleri için, bazı başlıkların bağlantısı bulunmayabiliyor. Bu sorunu çözmek için o başlığı “Arama Kutusunda” aramanız yeterli olacaktır. Bu şekilde aradığınızda o başlığa ulaşabilirsiniz.
Bu veritabanı temel olarak kanser vakalarının karyotip sonuçlarını barındırıyor. İçinde yaklaşık 40.000-50.000 arasında vaka kaydı var. Bu kayıtlar, kanser vakalarında, genomun hangi bölgelerinde kopma (breakpoint), hangi bölgelerinde birleşme (junction) olduğunu içeriyor. Siz de bu şekilde ilgilendiğiniz genom bölgesindeki kırılma/birleşmelerin daha önce kanser vakasına sebep olup olmadığını görebiliyorsunuz.
Örneğin, genomdaki 9. kromozomdaki 34. locus bölgesindeki kırılmaların daha önce kansere sebep olup olmadığına bakmak istiyorsunuz. O halde arama kutusuna 9q34 yazıyor ve aratıyorsunuz. Sonuç sayfasında, bu bölgede kırılmaya sahip olan kanser vakaları listeleniyor.
Conserved Domains, proteinlerdeki özellikle korunmuş kısımları bir hiyerarşi içinde listeleyen bir veritabanı. Bu korunmuş kısımlar, evrimsel süreç içinde aminoasit dizisini kıyasla koruması sebebiyle bu adı almaktadır. Örneğin, “X” kod adlı bir korunmuş kısım, farklı türlerde ve farklı proteinlerin içinde karşımıza çıkabilir. Bu veritabanı, farklı tür ve proteinlerdeki korunmuş kısımların, benzerliklerini göz önüne alarak, bir hiyerarşini oluşturuyor.
The database of Genotypes and Phenotypes olarak adlandırılan veritabanı, fenotip ve genotip arasındaki bağıntıları araştıran çalışmaların sonuçlarını barındırıyor. Bu sonuçlar, genlerin, hastalıkların işleyişlerindeki rolünü anlamak ve uygun teşhis ve tedavi uygulamalarının bulunması açısından önemli bir yere sahip.
Bu veritabanı, yapısal genomik varyasonları (Structural variation) içeriyor. Yapısal varyasyonlar, genom üzerinde 1 kilobazdan daha uzun DNA parçalarındaki büyük değişiklikleri barındırıyor. Bu değişiklikler, büyük DNA parçalarının genom üzerinde yer değiştirmesi, ters dönmesi veya silinmesi şeklinde gerçekleşebiliyor.
Yazar: Can Holyavkin
Biyo RSS: Dünya'dan ve Türkiye'den Popüler, Güncel Biyoloji Haberleri, Site ve Ürün Tanıtımları, İpuçları ve daha fazlası...
Yazıların kullanımı ve reklam vermek için iletişim sayfasından Biyo RSS'e ulaşabilirsiniz.
çok güzel bir çalışma.geçen yıl çok zorlanmıştım ncbi' ı kullanırken.daha da tam çözebilmiş değilim.devamını bekliyorum.ayrıca daha sonra expasy hakkında bir çalışma yaparsan ne güzel olur.ellerine sağlık.iyi çalışmalar.
Expasy, içerik açısından oldukça ayrıntılı, bir o kadar da kullanışlı bir veritabanı. Ayrı bir başlık altında inceleme yapmak oldukça yararlı olacaktır.
Öneriniz ve yorumunuz için teşekkürler…
tşkler devamınıda bekliyoruz
Ben de yorumunuz için teşekkür ederim.
En yakın zamanda, ikinci bölümü de bitirmeyi planlıyorum.