TEMEL KAVRAMLAR SÖZLÜĞÜ

KAVRAMANLAM
AdaptörAdaptör, DNA sekansının uçlarına ligasyon veya rapid kimyası ile bağlanan ve nanoporlardan geçerek okunacak DNA sekansının ipliklerinin ayrılmasında rol oynayan, ilgili dizinin nanopordan geçiş hızını belirleyen motor proteinlerini taşıyan bir oligonükleotit dizisidir.
Alfa ÇeşitlilikAlfa çeşitliliği, belirli bir alan veya habitattaki çeşitliliği ifade eder. Genellikle tür zenginliği (species richness) ve tür çeşitliliği (species diversity) açısından ölçülür. Bir numunedeki toplam farklı tür sayısına tür zenginliği, numunedeki mikroorganizmaların bulunma miktarlarına göre dağılımına ise tür çeşitliliği denir.
Ana Koordinatlar Analizi (PCoA)  Metrik çok boyutlu ölçekleme adıyla da bilinen PCoA, iki ya da üç boyutlu geometrik uzayda (Öklid uzayı olarakta isimlendirilebilinir) cisimlerin benzerlik veya farklılıklarını gösterir.  Çalışma prensibi, belirlenen öğenin iki ya da üç boyutlu uzayda bir konuma sahip olması ve tür/nesne göreceli bulunma açısından benzerlik ve farkılıkların hesaplanmasıdır. PCoA grafiğinin yorumlanması, esas olarak, belirlenen öğelerin diğer uzak öğelerden ziyade kendisine yakın olan öğelerle daha fazla benzerlik özelliği taşımasına dayanır.
AnnotasyonGenom anotasyonu, sekans verilerine anlam verme olarak adlandırılabilir. Genom anotasyonunda, genlerin yerleri belirlenir ve ardından kodlama bölgeleri ve işlevleri belirlenir. İlk olarak genomun proteinleri kodlamayan kısımları tanınır ve önceki bilgi sayesinde genom üzerindeki elementler tanımlanarak gen tahmini yapılır, son olarak bu elementlere kesin fonksiyonlar atanır. 
Antibiyotik Direnç GenleriBakterilerde antibiyotik direnci çeşitli mekanizmalarla sağlanabilir. Bunlar; antibiyotikleri metabolize eden enzimlerin üretilmesi, pompalar yardımıyla hücreden ilacın dışarı atılması, antibiyotiğin hücresel hedefinde bağlanmayı engelleyici modifikasyonlar olması, ilacın etkinliğini bypass edecek başka bir yolağın aktive edilmesi ve ilacın hücreye gireceği transmembran porlarının elimine edilmesidir. Bu değişikleri regüle eden genlere antibiyotik direnç genleri denir. 
BAMBAM (İkili Hizalama Haritası) dosyaları, bir referans genoma hizalanmış tüm okumaları içeren dosyalardır. BAM dosyaları bir başlık bölümü ve bir hizalama bölümü içerir. BAM dosyalarının başlık bölümü tüm dosya hakkında bilgi içerirken, hizalamalar bölümü okumaların adını, nükleotid dizisini, okuma kalitesini ve hizalama bilgilerini içerir.
BarkodlamaBarkodlama, barkod dizisi olarak adlandırılan oligonükleotit dizilerinin, hedef DNA sekanslarının uçlarına bağlanması sayesinde çok sayıda örneğin havuzlanmasını ve aynı anda dizileme cihazında okunmasını olanaklı kılan bir yöntemdir. Birden fazla barkodlu örnek havuzlanarak dizilemenin tek bir akış hücresinde gerçekleştirilmesini sağlar.
Baz çağırma (Basecalling)Oxford Nanopore dizileme platformunda, DNA ve RNA’lar nanoporlardan geçerken bir elektrik sinyali oluşturur. Bu elektrik sinyalini sinir ağı (neural network) kullanarak ATGC bazlarına dönüştürme işlemine “basecalling” denir. Bu işlem için Guppy gibi araçlar kullanılır.
Benignİyi huylu, benin. Bir genetik varyasyon ya da hücre ve dokunun hastalığa yol açmadığını belirtir.
Beta çeşitlilikBeta çeşitliliği için farklı türde tanımlamalar ve hesaplamalar mevcut olmakla birlikte, genellikle farklı iki habitattan elde edilen örnekler arasındaki tür çeşitliliği olarak ifade edilmektedir. Örneğin iki farklı göldeki mikroorganizmalar karşılaştırmak istendiğinde, beta çeşitlilik analizi yapılır.
BLASTBLAST, query olarak adlandırılan bilinmeyen bir DNA/RNA nükleotid dizisi ya da amino asit dizisinin NCBI gibi veri tabanlarındaki referans sekanslarla karşılaştırılması için kullanılan bir algoritmadır. Bu işlemin amacı araştırma konusu olan sekansın hangi türlere yakın olduğunun tespiti ya da direkt tür tanısıdır. 
BRIGReferans alınan genom ile örnek genom arasındaki benzerliği eş merkezli halkalar şeklinde görsel sağlayan ücretsiz erişim sağlayan bir platformdur. Oluşturulan eş merkezli halkalarda BLAST karşılaştırmaları, yüzdelik tanımlaması baz alınarak renklendirilir. Eş merkezli halkalar, iki ya da daha fazla cismin aynı merkezi ya da aynı ekseni paylaşmasına denir. Oluşturulan resimlerde, hizalanmış ortalama değer (read coverage), çakışan tekrarlı bölgeler (collapsed repeats), kesim noktaları (assembly breakpoints) gibi özelleştirilmiş ve/veya açıklamalı bilgiler içerebilir.
ContigBir contig, örtüşen küçük DNA parçalarının “bitişik” durumudur. Örtüşen DNA parçalarının daha uzun bir diziye birleştirilmesiyle oluşturulur. Diziler önce contig’lere ve son olarak da tam bir genomik diziye birleştirilir
Covarage (kaplam/kapsam)Yeni nesil sekanslama çalışmalarında “referans genom kaplamı”, bir örnek için alınan toplam okumaların veya tek bir nükleotit sekansın, hizzalandığı referans genomun ne kadarlık bir kısmını aydınlattığının yüzde cinsinden göstergesidir. “Depth of coverage (kapsam)” ise seçilen nükleotid dizisindeki her bir bazın (spesifik bir bazın) ortalama okuma sayısını ifade eder. Ortalama kapsam değeri, seçilen bölgedeki okuma sayısının bölgenin uzunluğuna bölünmesiyle elde edilir ve incelenen bölgedeki her bir nükleotid için ortalama okuma sayısını gösterir. 
Çoklu HizalamaBirden fazla diziyi karşılaştırmak için kullanılan bir yöntemdir. Bu teknikte, farklı örneklerden gelen çoklu diziler, farklılıklarına göre hizalanır ve karşılaştırılır.
De Novo Assembly (Flye)Flye, ONT ve PacBio tarafından oluşturulan tek molekül dizileme okumalarının işlenmesinde kullanılan bir de novo birleştirme aracıdır. Flye de novo birleştiricisi, 16S projelerinden memeli ve bitki genomları gibi büyük genomlara kadar çok çeşitli veri setlerinde kullanılabilir. Flye programlaması, kullanıcıların ham ONT veya PacBio verilerini karşıya yüklemelerini ve bunları cilalı kontigler olarak almalarını sağlayan tam bir pakettir. Flye, tekrar grafikleri oluşturur ve bunları yüksek kaliteli ve bitişik montajlar olarak birleştirir.
DendrogramDendrogram hiyerarşik kümelendirme sonucu elde edilen veri gruplarının ağaç şeklinde sunulan grafikleridir. Ağaçtaki her bir dal bir adım hiyerarşik kümelendirme sonucu elde edilen grubu temsil eder.
DepthYeni nesil sekanslama çalışmalarında depth terimi, çalışılan bölgede bulunan tek bir nükleotidin total okunma sayısını belirtmek için kullanılır. Allel depth, seçilen nükleotidin varyasyonlarının kaç okumada tespit edildiğini gösterir. Allel frekansı terimi ise allel depth değerinin total depth değerine bölünmesi ile elde edilir. 
Dizi HizalamaDNA veya protein dizilerinin iki temsilinin, en benzer elemanları yan yana olacak şekilde düzenlenmesine hizalama denir. Biyoinformatikle ilgili birçok iş, başarılı hizalamalara bağlıdır.
DNA MetilasyonuBir moleküle metil (-CH3) grubunun eklenmesidir. DNA metilasyonu, sitozin nükleotidine bir metil grubunun kovalent bağlanması sonucu 5-metilsitozin (5mC) molekülünün oluşmasıdır. DNA metilasyonu normal gelişimde büyük önemi olan bir epigenetik düzenleme tipidir ve bulunduğu konuma göre başta gen ekspresyonunun düzenlenmesi olmak üzere farklı moleküler işlevleri bulunur. 
EkzonEksonlar DNA veya RNA moleküllerinin amino asit kodlamak için bilgi içeren bölümleridir. Pre-mRNA, hem ekson hem de intron içerir, ancak mRNA olgunlaşması sırasında kodlamayan intronlar kesilir ve sadece kodlayan ekson dizileri olgun mRNA üzerinde kalır.
Fast5Bu dosya formatı, ONT platformu kullanılarak yapılan dizileme sonucunda üretilen ham sinyal verisini içermektedir. FAST5 dosya formatı, hiyerarşik Veri Formatı 5’i (HDF5) temel alır. Fast5 dosyasındaki ana veriler, nanoporlardan saniyede binlerce kez alınan ölçümler sonucunda oluşan ve “dalgalı çizgiler” olarak görünen verileri içerir.
FastqFastq, dizileme sonucunda oluşturulan başka bir dosya biçimidir. Nanopor dizilemede Fast5 dosyaları Guppy ile Fastq’a dönüştürülür. Fastq dosyası, her bir okuma için 4 satır bilgi içerir. İlk satır, başlık ve okuma hakkında bilgi içerir. İkinci satır dizinin kendisini içerir. Üçüncü satır ek bilgiler veya yalnızca “+” işareti içerir. Son olarak, dördüncü sıra, dizideki her bir baza karşılık gelen kalite skorunu göstermektedir.
Germline mutasyonlarıBu mutasyonlar sperm ya da yumurta hücresinde olan ve doğrudan ebeveynlerden çocuklara aktarılan mutasyonlardır. Embriyo gelişimi esnasında bu mutasyon tüm hücrelerde taşınır ve soydan soya aktarılır. Tüm kanserlerin yaklaşık %5-10’u germline mutasyonları sonucu gelişir ve bu kanserler herediter kanser sendromları olarak da adlandırılır
Hipotez testiBir popülasyon parametresini veya bir popülasyon olasılık dağılımını incelemek için bir örnekten alınan verileri kullanan bir tür istatistiksel çıkarımı ifade eder. İlk olarak, parametre veya dağıtım özelliği hakkında geçici bir varsayım oluşturulur. Bu ilk geçici varsayım, 0 hipotez olarak adlandırılır ve H0 ile gösterilir. Sıfır hipotezinin zıt anlamı olan alternatif bir hipotez (Ha ile gösterilir) üretilir. Hipotez test prosedürü, H0’ı reddetmek için örnek verileri kullanmayı içerir. H0 reddedilebilirse, istatistiksel sonuç sayesinde alternatif hipotez Ha doğru olarak ifade edilebilir.
HistonDNA’nın paketlenmesinde yapısal iskelet (scaffold) görevi gören küçük, bazik ve yüksek oranda korunmuş proteinlerdir. Yaklaşık 150 baz çifti uzunluğunda bir DNA parçası histon oktomerinin etrafına sarılarak kromatin yapısının alt birimi olan nüklozomları oluşturur. Histonlar, metilasyon, asetilasyon, fosforilasyon gibi translasyon sonrası modifikasyonlar ile gen aktivitesini düzenlerler. 
Histon AsetilasyonuHiston oktomerlerine asetil grubunun eklenmesidir. Asetil koenzimA’dan koparılan asetil grubunun histonlara transferi sonucunda, genellikle kromatinlerin aktif ökromatin yapısına geçmesi ile ilişkilendirilir
Histon MetilasyonlarıHiston oktomerlerine metil grubunun eklenmesidir. Histonlarda mono-di-tri metilasyon gözlemlenmektedir. Metil işaretinin sayısı ve konumuna bağlı olarak bu düzenlemeler gen ekspresyonunda artışa ya da genin susturulmasına sebep olabilir. 
İkincil MetabolitlerBir organizmanın gelişiminde veya çoğalmasında birincil dereceden etkisi bulunmayan ancak organizmaya selektif avantaj sağlayabilmek için üretilen bileşiklerdir. Örneğin; rekabet ettikleri diğer organizmaların gelişimlerini engelleyici yönden aktiviteleri olabilir. İkincil metabolitler antibiyotik üretimi gibi birçok medikal olarak önemli bileşiğin ana kaynağını oluştururlar.
İntronİntronlar genlerin amino asit kodlayamayan bölümleridir. Sadece ökaryotlar intron bölgelerini içerir, prokaryotlarda ise çok nadiren bulunur. pre-mRNA işlemesi esnasında intron bölgeleri olgun mRNA’den silinirler. İntronlar translasyona katılmamasına rağmen, örkaryotlarda alternatif splicing, gen ifadesini düzenleme, mRNA taşınmasının kontrolü gibi fonksiyonlara sahiptirler. 
Kalite SkoruKalite skoru, Phred skoru olarak da bilinen sekanslanan bir bazın ne kadar doğrulukta sekanslandığını belirten ve sekanslama cihazı tarafından üretilen bir değerdir. Bu değer, biyoinformatiksel analizlerin ileriki adımlarda dikkate alınır. Logaritmik bir değerdir, örneğin 30 phred skora sahip bir baz %99,90 oranında doğru okunmuştur.
KırpmaSıralama veri analizi hattındaki ilk adım, bir sıralayıcı tarafından oluşturulan okuma sıralarını değiştiren okuma kırpmadır. Ham okuma dizilerinde yaptığı değişiklikler, analiz hattının sonraki aşamalarının tümü üzerinde bir etkiye sahip olabilir.
Konsensus GenomBir konsensüs dizisi, ilişkili, hizalanmış dizileri temsil eden bir DNA, RNA veya protein dizisidir. Benzer sekansların konsensüs sekansı çeşitli şekillerde tanımlanabilir, ancak her lokasyondaki en yaygın nükleotit(ler) veya amino asit(ler) genellikle kullanılır.
MalignantKötü huylu, malin. Bir genetik varyasyon ya da hücre ve dokunun hastalığa yol açabileceğini belirtir.
Okuma HaritalamasıSıralama ile elde edilen okumaların her birinin karşılık gelen referans genomu ile karşılaştırılması işlemine okuma haritalaması denir. Her okuma ile referans genom arasında bir veya daha fazla hizalama elde edilebilir.
ORF (Open Reading Frame)Açık okuma çerçevesi. Stop kodon içermeyen ancak protein yapısındaki aminoasit bilgisini içeren DNA dizisidir. Özellikle prokaryotlarda açık okuma çerçevesi bilgisi ile kodlayan genlere ait dizi bilgisi elde edilebilir ve biyoinformatik analizlerde gen bölgelerinin öngörülmesinde önemli rol oynar.
QPCRGerçek zamanlı PCR olarak da bilinen QPCR, floresan boyalar yardımıyla hedeflenen genomik bölgeyi amplifiye etmek için kullanılan bir yöntemdir. Bu tekniğin klasik PCR’dan temel farkı, amplifiye edilen amplikonların gerçek zamanlı olarak ölçülmesidir. Temel prensip, amplikonlara bağlanan floresan boyaların hassas dedektörler tarafından algılanmasına dayanmaktadır.
Referansa HaritalamaOkumaların ilgili organizmanın referans genomuna haritalandırılması anlamına gelir. Bu süreçte, sekanslama platformlarından gelen okumalar, hedef referans genomunun karşılık gelen konumlarına hizalanır. Bu şekilde, ilgili organizmanın genomunun haritası oluşturulabilir.
Shotgun metagenomicsBu dizileme yönteminin amacı, topluluk bileşimini ve işlevini aydınlatmak için bir topluluktaki hedeflenmemiş hücrelerin genomlarını sıralamaktır. Bu yöntem, büyük mikrobiyal toplulukların varlığının yaygınlığı nedeniyle çok çeşitli alanlarda kullanılır. Örneğin, toprak mikrobiyotasının incelenmesi, bitki patojenlerinin anlaşılmasında ve tedavi edilmesinde ilerlemeler sağlamıştır
Somatik mutasyonlarBir insanın hayatı süresince, tek bir hücresinde çeşitli dış etkenlerin etkisiyle oluşan DNA hasarı sonucu ortaya çıkan mutasyonlardır. Sonradan gelişen bu mutasyonlar ebeveynlerden çocuklara aktarılan mutasyonlar değildirler. Görüldüğü hücre ve hücrenin çevresinde değişikliğe sebep olan bu mutasyonlar sonucu gelişen kanserlere sporadik kanserler denir. 
TBA (Temel Bileşen Analizi) Bir örnek setinde birden fazla değişken temel alınarak örnekler arasında karşılaştırmalar yapılabilir. Veri setindeki veriler, eksenlerin değişkenleri temsil ettiği koordinat sistemlerinde temsil edilebilirler. Boyutluluğu yüksek bir veri setinin analizi karmaşık olacağı için bu durumu gidermek amacıyla Temel Bileşen Analizi (TBA) vasıtasıyla boyut indirgemesi gerçekleştirilebilir. TBA, örnek setindeki varyansın maksimum olduğu bir vektörün ilk eksen olarak temel alınıp çizilmesiyle başlar. Bu eksen, verilerin uzaklıklarının karelerinin ortalamasının minimum olduğu bir doğru ya da verilerin dik izdüşümlerinin oluşturacağı doğru üzerindeki en uzak iki veri arasındaki mesafenin maksimum olduğu bir doğru olarak çizilir. Ardından, çizilen ilk eksene dik olup varyansın maksimum olduğu ikinci bir eksen çizilir. Bu prensip kendisinden önce çizilen eksenlere ortogonal olacak ve maksimum varyansa sahip olacak eksenlerin çizilmesiyle devam eder. Bu eksenler temel bileşenler olarak adlandırılır. Analizin karmaşıklığı, düşük yüzdeli varyans kaybı ile boyut indirgemesi yoluyla minimize edilmiş olur.
TelomerKromozomların uçlarında yer alan, DNA’yı degredasyon ve füzyon gibi mekanizmalardan koruyan DNA-protein yapılarıdır. Özellikle hücresel yaşlanma telomerlerin önemi bilinmektedir. Replikasyon esnasında DNA uçlarının tam olarak kopyalanamaması sonucu telomerler giderek kısalır.
Tümör Mutasyon Yükü (TMY) Bir tümör hücresinin genomundaki kodlayan bölge başına düşen mutasyon sayısı olarak tanımlanır. TMB’si yüksek olan tümörlerin immün checkpoint inhibitör terapilerine daha iyi yanıt verdiği bilinmektedir. 
Tüm Genom SekanslamaTüm genom sekanslama(WGS), bir organizmanın DNA dizisinin tamamını veya neredeyse tamamını bir kerede belirleme tekniğidir. Kullanılabilir bilgileri çıkarmak için karmaşık biyoinformatik çalışmaların gerekli olduğu büyük miktarda ham veri üretir. Çalışma, testin amacına bağlı olarak tüm genoma (tüm genom analizi, WGA), ekzoma (tüm ekzom analizi), bir gen alt kümesine odaklanabilir.
Evrensel PrimerlerSekanslanmak üzere vektör içine yerleştirilen DNA parçasının hemen öncesinde, vektör DNA’sına komplementer olarak dizayn edilmiş primerlerdir. Vektör-spesifik olduklarından, aynı tip vektör içine ligasyonu yapılmış tüm DNA parçalarının okumasında bu primerlerden faydalanılır.
UTR bölgesiÇevrilmeyen bölge (Untranslated Region). Mesajcı RNA’ların (mRNA) 3’ ve 5’ bölgelerinde bulunan ve proteine çevrilmeyen bölgelerdir. Bu bölgeler mRNA’nın stabilitesini, fonksiyonunu ve lokalizasyonunu kontrol ederek mRNA’nın translasyonunu regüle ederler.
Üst Alem (Domain): Taksonomideki en yüksek derece olan üst alem, bir organizmayı tanımlamak için kullanılan en geniş biyolojik sınıftır. Üç temel üst alem tanımlanmıştır: Bakteri, Arkea ve Ökarya.
varyans-polimorfizm-mutasyonKalıtım materyalinde (DNA/RNA) görülen her türlü değişiklik varyans olarak adlandırılır. Polimorfizm, popülasyonda yaygın olarak (en az görülen varyansın görülme sıklığı popülasyonun %1’i olmalıdır) görülen ve genellikle hastalıklarla ilişkilendirilmeyen genetik varyasyonlardır. Mutasyon ise polimorfizmden farklı olarak daha nadir ve anormal değişiklikler için kullanılan bir terimdir ve bir mutasyonun popülasyondaki frekansı arttığında polimorfizm olarak değerlendirilebilir.