Yeni nesil dizileme prensipleri

advertisement
1
2
3
4
5
6
7
8
Yeni Nesil Dizileme Prensipleri
Doç.Dr.Hüseyin Onay
Ege Üniversitesi Tıp Fakültesi Tıbbi Genetik AD
9
NGS
• Yeni Nesil Dizi Analizi
• Next Generation Sequencing
• Massively Parallel Sequencing
• Second Generation Sequencing
• Paired End Sequencing
Tarihçe
• En yaygın sekanslama teknolojisi
– Sanger sekanslama
– 1000-1200 bç
• HGP
– Shotgun sekanslama
• DNA’ nın enzimatik ya da mekanik olarak fragmanlara ayrılıp
sekanslama vektörlerine klonlanması
• Bireysel olarak okunan overlap diziler sayesinde insanın tüm
genomu dizilendi
• Massively Parallel Sequencing’ in temeli
Tarihçe
•
•
•
•
1977- Sanger sekanslama
1990- HPRT geni klonlandı
1996- ABI 310 piyasaya çıktı
1998-ABI 3700 piyasaya çıktı
– HGP çoğunlukla bu cihaz ile gerçekleştirildi
•
2001- ilk insan DNA’ sı konsensus dizisi
•
•
Sanger
Lander et al., 2001; Venter et al., 2001
•
2004- Roche 454
•
2007- İlk diploid insan genomu
•
•
•
•
Craig Venter
whole-genome shotgun sequencing
Levy et al., 2007
2008- İkinci diploid insan genomu
•
•
•
•
James D Watson
Roche 454
Wheeler et al., 2008
1,5 milyon $
Shendure J et al. Nature Biotechnology, 2008
NGS-2015
Steinbock LJ et al., Nanotechnology, 2015
NGS
İkinci Nesil Sekanslama Teknolojileri
• Roche GS-FLX 454
Genome Sequencer
– 454 sequencing
• ABI SOLiD analyzer
• Illumina Genome
Analyzer
– Solexa technology
Bench-top Sequencers
İllumina
Solexa Teknolojisi
İllumina
Solexa Teknolojisi
İllumina
Solexa Teknolojisi
Sequencing By Synthesis (SBS)
3’ 5’
Cycle 1:
Add sequencing reagents
First base incorporated
Remove unincorporated bases
A
T
G
C
C
G
T
Cycle 2-n: Add sequencing reagents and repeat
T
A
C
A
Detect signal
C
G
A
T
T
A
G
A
C
T
C
C
G
A
G
C
T
C
G
A
T
5’
All four labelled nucleotides in one
reaction
High accuracy
Base-by-base sequencing
No problems with homopolymer repeats
Clonal Single Molecule Array™ Technology
40 MILLION CLUSTERS
PER FLOW CELL
20 MICRONS
100 MICRONS
Base Calling
TG C TAC GAT …
1
2
3
4
5
6
7
TTTTTTTGT…
8
9
İllumina
SBS Teknolojisi
MiSeq
Uygulamalar
• DNA
–
–
–
–
Targeted Resequencing
De Novo Sequencing
Whole Exome Sequencing (WES)
Whole Genome Sequencing (WGS)
• RNA
–
–
–
–
Targeted Resequencing
mRNA Sequencing
Small RNA Sequencing
Total RNA Sequencing
• Methylation Sequencing
Hedef Zenginleştirme Metodları
Meldrum C et al. Clin Biochem Rev 2011
MiSeq
MiSeq Örnek Hazırlama
Indeksleme
PCR-Sample Pooling
Havuz 1
Havuz 2
Havuz 3
1+2+3+4+5
Havuz 4
Havuz 5
Pool 1 Grup No GEN ADI
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Pool 2 Grup No
1
2
3
4
5
P
o
o
l
1
BTD
HBB
PTPN11
MEFV
SRD5A2
OXT
OXT
OXTR
NPC1
GCK
MC4R
NPC2
CFTR
VHL
LOXL1
HNF1A
BCKDHB
SLC6A8
CD40
CD40L
BRCA1
BRCA2
EPM2A
RET
GEN ADI
BTD
HBB
PTPN11
MEFV
SRD5A2
22
23
24
25
Pool 2 Grup No
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
Pool 3 Grup No
1
2
3
P
o
o
l
2
BRCA2
EPM2A
RET
GEN ADI
BTD
HBB
PTPN11
MEFV
SRD5A2
OXT
OXT
OXTR
NPC1
GCK
MC4R
NPC2
GBA
GDF6
LOXL1
HNF1A
GCDH
SLC6A8
CD40
CD40L
BRCA1
BRCA2
LPL
RET
WFS1
GEN ADI
BTD
AR
FGFR2
24
25
26
27
Pool 3 Grup No
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
P
o
o
l
3
RET
WFS1
GEN ADI
BTD
AR
FGFR2
MEFV
WFS1
OXT
OXT
OXTR
NPC1
GCK
MC4R
NPC2
CAV3
SF1
LOXL1
HNF1A
RMRP
TACİ
CTSK
BRCA1
BRCA2
SERPİNA1
EPM2A
ELA2
RET
MiSeq Örnek Yükleme
NGS Akış Şeması
Sekanslama
Alingment
Görüntü işleme
Varyant deteksiyonu
Okuma
Filtreleme
Pabinger S et al. Briefings in Bioinformatics, 2013
NGS Dosya Türleri
Wangs S et al. Genomics and Informatics , 2013
NGS Dosya Türleri
• FASTAQ
– NGS raw datası
– FASTA sekans+kalite datası
– Wellcome Trust Sanger tarafından bulundu
• SAM/BAM
– Sequence Alignment/Map
– FASTAQ’ nun align edilmiş hali
– Varyant saptama algoritmalarına hazır format
– Kodlama şekilleri farklı
NGS Dosya Türleri
• VCF
– Variant Calling Format
– Align edilmiş dizideki varyantları gösterir
– Manifest dosyaya göre
MiSeq Kalite Kontrol
MiSeq Kalite Kontrol
MiSeq Kalite Kontrol
MiSeq Analiz
MiSeq Analiz
MiSeq Analiz
BRCA2 Geni K2729N
BTD Geni c.617_619delTTG
Sistemik Artefakt
NGS ve Nadir Hastalıklar
Booycott et al. Nat Rev Genet, 2013
Varyant Saptama Oranı
• WES
– Ortalama 12.000 varyant
• %90 veritabanlarında kayıtlı
• WGS
– Ortalama 5 milyon varyant
• 144.000 yeni
Pabinger S et al. Briefings in Bioinformatics, 2013
Kalıtılan Mutasyon Algoritması
Boycott et al. Nat Rev Genet, 2013
www.omictools.com
Üçüncü Nesil Sekanslama
• Helicos
– HeliScope
• Dünyadaki ilk DNA mikroskobu
• Pacific Biosciences
– SMRT (Single Molecule Real Time) sequencer
– DNA polimeraz flow cell’ e bağlı
– Her nükleotid eklenmesinde ışıma
Dördüncü Nesil Sekanslama
• Nanopore DNA sequencer
• Nükleotid etiketleme ve tespiti yok
• Ekzonükleazla kesilen baz nanopordan geçer
• Polimerizasyon yok
• 15 dakikada WGS
• Çok düşük maliyet
Ku CS et al. Expert Rev. Med. Devices, 2013
Oxford Nanopore Technologies
Download