PLoS One: Συνδυασμένη Στοχευμένες DNA αλληλουχίας σε μη μικροκυτταρικό καρκίνο του πνεύμονα (NSCLC) Χρησιμοποιώντας UNCseq και NGScopy, και RNA αλληλουχίας Χρησιμοποιώντας UNCqeR για την ανίχνευση γενετικών ανωμαλιών σε NSCLC


Αφηρημένο

Η πρόσφατη έγκριση FDA της πλατφόρμας MiSeqDx παρέχει μια μοναδική ευκαιρία για την ανάπτυξη στοχευμένων αλληλουχίας επόμενης γενιάς (NGS) πάνελ για τις ανθρώπινες ασθένειες, συμπεριλαμβανομένου του καρκίνου. Έχουμε αναπτύξει μια επεκτάσιμη, δοκιμασία στοχευμένες πάνελ που βασίζεται ονομάζονται UNCseq, η οποία περιλαμβάνει ένα πάνελ NGS πάνω από 200 σχετίζονται με τον καρκίνο γονίδια και ένα τυποποιημένο αγωγό κατάντη βιοπληροφορικής για ανίχνευση απλών μεταβολών νουκλεοτιδίου (SNV) καθώς και μικρές προσθήκες και διαγραφές (Indel ). Επιπλέον, αναπτύξαμε ένα νέο αλγόριθμο,

NGScopy

, σχεδιασμένο για δείγματα με αραιή κάλυψη αλληλούχιση για ανίχνευση μεγάλης κλίμακας παραλλαγές αριθμού αντιγράφων (CNV), παρόμοια με την ανθρώπινη SNP Array 6.0, καθώς και μικρής κλίμακας ενδογονιδιακές CNV . Συνολικά, εφαρμόσαμε αυτή τη δοκιμασία με 100 snap-κατεψυγμένα δείγματα καρκίνου του πνεύμονα που στερούνται του ίδιου του ασθενούς DNA βλαστικής σειράς (κοόρτης 07-0120 ιστού) και επικυρωμένα αποτελέσματα μας ενάντια αλληλουχίας Sanger, SNP Array, και δημοσιεύτηκε πρόσφατα ολοκληρωμένα DNA-seq /RNA-seq μας δοκιμασία, UNCqeR, όπου RNA-επόμενα δειγμάτων όγκου του ίδιου του ασθενούς επιβεβαίωσε SNV ανιχνεύεται από το DNA-seq, εάν είναι RNA-επόμενα βάθος κάλυψη ήταν επαρκής. Επιπλέον, εφαρμόσαμε την UNCseq δοκιμασία σε μια ανεξάρτητη συλλογή ιστό όγκου του καρκίνου του πνεύμονα με διαθέσιμα ίδιο ασθενή DNA βλαστικής σειράς (κοόρτη 11-1115 ιστού) και επιβεβαιώθηκε χρησιμοποιώντας αναλύσεις μεταλλάξεων πραγματοποιήθηκε σε CLIA-πιστοποιημένο εργαστήριο. Καταλήγουμε στο συμπέρασμα ότι UNCseq μπορεί να προσδιορίσει SNV, Indel, και CNV σε δείγματα όγκων λείπει βλαστική DNA με οικονομικά αποδοτικό τρόπο

Παράθεση:. Zhao Χ, Wang Α, Walter V, Patel NM, Eberhard DA, Hayward MC , et al. (2015), σε συνδυασμό Στοχευμένες DNA αλληλουχίας σε μη-μικροκυτταρικό καρκίνο του πνεύμονα (NSCLC) Χρησιμοποιώντας UNCseq και NGScopy, και RNA αλληλουχίας Χρησιμοποιώντας UNCqeR για την ανίχνευση γενετικών ανωμαλιών σε NSCLC. PLoS ONE 10 (6): e0129280. doi: 10.1371 /journal.pone.0129280

Ακαδημαϊκό Συντάκτης: Raffaele Α Calogero, Πανεπιστήμιο του Τορίνο, Ιταλία

Ελήφθη: 13, Ιανουαρίου του 2015? Αποδεκτές: 6η Μαΐου 2015? Δημοσιεύθηκε: 15 Ιουνίου του 2015

Copyright: © 2015 Zhao et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Δεδομένα Διαθεσιμότητα: Όλα τα σχετικά δεδομένα είναι εντός του Υποστηρίζοντας αρχεία πληροφοριών του χαρτιού και

Χρηματοδότηση:.. με την υποστήριξη του Καρκίνου NCI κλινικός ερευνητής Team Βραβείο Ηγεσίας (SJM) και το Πανεπιστήμιο του Ταμείου Έρευνας για τον Καρκίνο

Αντικρουόμενα συμφέροντα: Margaret L. Gulley είναι σύμβουλος για Illumina, Inc. Αυτό δεν αλλάζει την τήρηση των συγγραφέων να PLoS ONE πολιτικές για την ανταλλαγή δεδομένων και υλικών.

Εισαγωγή

Χρήση της αλληλουχίας επόμενης γενιάς (NGS) για τις μεγάλες -scale ανάλυση των αλλοιώσεων αλληλουχίας DNA σε ανθρώπινο ιστό, η οποία μπορεί να σχετίζεται με αιτιοπαθογένεση της νόσου, δεν είναι χρήσιμη μόνο σε βασικές επιστημονικές μελέτες, αλλά τώρα είναι μια καθιερωμένη εργαστηριακή τεχνική που χρησιμοποιείται στην κλινική ιατρική, ιδιαίτερα για την φροντίδα των ασθενών, με μακρινή μεταστατικού καρκίνου (που επισκοπείται στο [1]). Εφαρμογή της NGS ως πρότυπο κλινική εργαστηριακή δοκιμή είναι το επόμενο λογικό βήμα μετά την έγκριση του FDA πολλών πρώτης γενιάς αλληλουχίας που βασίζεται σύντροφος διαγνωστικές εξετάσεις κατά την τελευταία δεκαετία, που βελτιώνουν τη χρήση των στοχευμένων παραλλαγές του γονιδίου για τη διαχείριση διακριτούς υποτύπους του καρκίνου. Σύμφωνα με την έγκριση του FDA της πλατφόρμας MiSeqDx το Νοέμβριο του 2013, αλληλουχίας στοχευμένες πάνελ (TPS) είναι το επόμενο βήμα προς την εφαρμογή προσιτή, μικρής κλίμακας, NGS-based εργαστηριακή διάγνωση [2].

Έγκρισης

FDA ενός γενική πλατφόρμα για NGS έχει ενθαρρύνει επιμέρους εργαστήρια για την αντιμετώπιση των εγγενών προκλήσεις που συνδέονται με την ανάπτυξη των εν λόγω δοκιμών. Οι προκλήσεις αυτές αφορούν δημοσιονομικά θέματα, θέματα μεθοδολογίας και βέλτιστη βιοπληροφορικής αγωγών που προσφέρουν ένα λογικό συμβιβασμό μεταξύ της τεχνικής πολυπλοκότητας και της αποτελεσματικότητας του χρόνου. Από διάφορα εργαστήρια χειρίζονται τα θέματα αυτά με διαφορετικό τρόπο, τη διάδοση των πληροφοριών σχετικά με τις μεθόδους και τα χαρακτηριστικά απόδοσης ενός συγκεκριμένου προσδιορισμού εργαστήριο NGS-βάση είναι μια βάση για συζήτηση και αξιολόγηση των δυνατών και αδύνατων σημείων από την επιστημονική κοινότητα.

Σύμφωνα με αυτό , ένας αυξανόμενος αριθμός των εκθέσεων των εργαστηριακών μεθόδων NGS-based για την ανάλυση δειγμάτων κλινικής όγκου από διαφορετικά εργαστήρια για την κλινική απόφαση που δημοσιεύθηκαν πρόσφατα [1, 3-8]. Στο Πανεπιστήμιο της Βόρειας Καρολίνας στο Chapel Hill (UNC-CH), έχουμε αναπτύξει μια επεκτάσιμη δοκιμασία NGS (UNCseq) που περιλαμβάνει TPS του DNA που λαμβάνεται από όγκο και συμφωνημένα μη κακοήθεις δείγματα για μια ομάδα γονιδίων (ClinSeq) πάνω από 200 καρκινογόνες συνδεδεμένων γονιδίων που επιλέχθηκαν και ενημερώνεται ανά τρίμηνο από την Επιτροπή UNC για την ανακοίνωση της γενετικής έρευνας Αποτελέσματα (CCGR). Επιπλέον, UNCseq αναπτύξει μια τυποποιημένη κατάντη του αγωγού βιοπληροφορική, η οποία αυτή τη στιγμή χρησιμοποιείται για να παραγγείλετε επιβεβαιωτικές δοκιμασίες για την αναφορά κλινικά «προσβληθεί» γενετική εκδηλώσεις για τον θεράποντα ιατρό στο πλαίσιο ενός Institutional Review Board (IRB) -approved μελέτης (Σχήμα 1). Στην έκθεση αυτή, εμείς δοκιμάσουν την ικανότητά μας να εκτελέσει επιτυχώς αλληλούχιση Illumina HiSeq 2000 κατόπιν DNA εκχυλίζεται από δείγματα όγκων από ασθενείς με καρκίνο του πνεύμονα, συγκεκριμένα, το μη μικροκυτταρικό καρκίνο του πνεύμονα (NSCLC) υπότυπο. Επιπλέον, συνοψίζουμε την εμπειρία μας στην απόκτηση του δείγματος, παθολόγος-ελεγχθεί διάγνωση όγκων, εξαγωγή DNA, NGS, και αναλυτική επικύρωση των γενετικών αποτελεσμάτων. Τέλος, παρέχουμε την εμπειρία μας από την εφαρμογή αυτής της δοκιμασίας NGS που βασίζεται στην αναφορά των σωματικών μεταλλάξεων από το «πραγματικό κόσμο» δείγματα-τόσο snap-κατεψυγμένα (SF) και φορμόλη-σταθερές και εμπεδωθεί με παραφίνη (FFPE) -για διαγνωστικούς σκοπούς με την επικύρωση της αποτελέσματα σε CLIA-πιστοποιημένο εργαστήριο. Επιβεβαιώσαμε ότι TPS σε καλά σχολιασμένα κοόρτη καρκίνο του πνεύμονα δεν είναι μόνο μια περισσότερο ευαίσθητη μέθοδος από αλληλούχισης Sanger στην ανίχνευση SNV, αλλά και πιο ειδικά για τον εντοπισμό γενετικών ανωμαλιών σε γνωστά γονίδια σχετίζονται με τον καρκίνο με σημαντικές προγνωστικές και θεραπεία επιπτώσεις. Με την εκτέλεση βαθιά ανάλυση αλληλουχίας του cDNA που παρασκευάστηκε από RNA (RNA-seq) σε ένα υποσύνολο αυτών των δειγμάτων, επιβεβαιώσαμε επίσης αρκετές SNV ανιχνεύεται από τον προσδιορισμό της αλληλουχίας του DNA (DNA-seq), ανάλογα με το βάθος της κάλυψης από την RNA-seq και του μεταλλαγμένου συχνότητα αλληλόμορφου (MAF) από το DNA-seq. Λαμβάνοντας υπόψη το γεγονός ότι ταιριάζει κανονικό DNA δεν μπορεί να είναι πάντα διαθέσιμες, παρέχουμε συστηματική σύγκριση των SNV καλώντας αλγορίθμων χρησιμοποιώντας συμφωνημένα βλαστική έναντι συγκεντρωμένο φυσιολογικό DNA, και σε σχέση με την απλή γονοτυπική όγκου σε ένα υποσύνολο αυτών των δειγμάτων. Τέλος, παρουσιάζουμε ένα νέο αλγόριθμο,

NGScopy

(https://www.bioconductor.org/packages/release/bioc/html/NGScopy.html), για την ανίχνευση του γονιδιώματος-ευρεία CNV χρησιμοποιώντας δεδομένα TPS. Καταλήγουμε στο συμπέρασμα ότι η εργαστηριακή δοκιμασία μας NGS-βάση είναι ευαίσθητη, αλλά ειδικά, οικονομικά αποδοτική, ισχυρή, και τυποποιημένη, και διευκολύνει την κατάντη της βιοπληροφορικής ανάλυσης για την αξιολόγηση SNV, Indel, και CNV σε ένα χρόνο αποδοτική και κλινικά εύστοχος τρόπο.

(α) το έργο UNCseq είναι μια πρωτοβουλία που περιλαμβάνει τους κλινικούς ιατρούς και τους ασθενείς που ενδιαφέρονται να συμμετάσχουν σε μια μη θεραπευτική κλινική δοκιμή που διεξάγεται μέσω του Lineberger Περιεκτική Κέντρο Καρκίνου (IRB-εγκεκριμένο πρωτόκολλο 11-1115), καθώς και μια διεπιστημονική ομάδα ότι περιλαμβάνει κλινική και ερευνητική σχολή (ογκολόγων, παθολόγων, βιοπληροφορικής, και μοριακοί βιολόγοι) που δημιουργούν, κριτικά την αξιολόγηση, και να συζητήσουν τα δεδομένα NGS σε σχέση με το κλινικό ιστορικό των ασθενών και να επανεξετάσει προηγουμένως εντοπιστεί γενετικών ανωμαλιών για να καθοριστεί ποια είναι δυνητικά κλινικά προσφυγής και στοχευμένη για τους μεταγενέστερους επικύρωση χρησιμοποιώντας επικυρωμένες μεθόδους σε CLIA-πιστοποιημένο εργαστήριο. (Β) Ακολουθώντας τη συγκατάθεση να 11-1115, καρκινικούς ιστούς και περιφερικό αίμα συλλέγονται από ασθενείς με καρκίνο. Αιματοξυλίνη και ηωσίνη (Η & amp? Ε) -stained τα αντιπροσωπευτικά τμήματα ιστού από δείγματα όγκου (SF ή FFPE) αξιολογούνται από πιστοποιημένο παθολόγο για το ποσοστό των βιώσιμων όγκου /περιεχομένου στρώμα και η παρουσία /απουσία νέκρωσης (QC δείγματος). Εξάγεται DNA από δείγματα όγκων σε επεξεργασία μέσω διαφόρων σταδίων (κατακερματισμός, προετοιμασία βιβλιοθήκη DNA, σε λύση για την σύλληψη των θραυσμάτων DNA που μας ενδιαφέρει, μικρής κλίμακας ενίσχυση των συλληφθέντων θραύσματα DNA) πριν από την Illumina NGS. Τα δεδομένα που προκύπτουν συζητούνται σε διεπιστημονική σύσκεψη Μοριακής όγκου του Διοικητικού Συμβουλίου. Μετά την επικύρωση με CLIA-πιστοποιημένο εργαστήριο, αυτές οι γενετικές ανωμαλίες που αναφέρθηκαν στην προσωπική ηλεκτρονικά ιατρικά αρχεία των ασθενών.

Η

Υλικά και Μέθοδοι

Οι ασθενείς, οι όγκοι και Αξιολόγησης ιστοπαθολογική

Σύμφωνα με το IRB και το Γραφείο Ανθρωπίνων Έρευνας Ηθικής του Πανεπιστημίου της Βόρειας Καρολίνας στο Chapel Hill (UNC-CH), εγκεκριμένο πρωτόκολλο 07-0120, οι ασθενείς που υποβλήθηκαν σε βασική ιατρική φροντίδα (SOC) χειρουργική επέμβαση για πρωτοπαθή καρκίνο του πνεύμονα εντοπίστηκαν, που ακολουθείται από ανάκτηση του SF, αποθηκευμένων ιστούς όγκων (07-0120 όγκου κοόρτη ιστός? n = 100). Μια ξεχωριστή ομάδα ασθενών με καρκίνο του πνεύμονα που είχε γίνει ανθεκτική στη συνήθη συστηματικές θεραπείες είχε δώσει τη συγκατάθεσή του στο πλαίσιο της IRB και το Γραφείο Ανθρωπίνων Δεοντολογίας, UNC-CH εγκεκριμένο πρωτόκολλο 11 – 1115 (11-1115 όγκου ομάδα ιστού? N = 24). Γραπτή ενημερωμένη συγκατάθεση από το υποκείμενο ασθενείς λήφθηκε για τη χρήση αυτών των δειγμάτων στην έρευνα. Το πρωτόκολλο 11 με 1115 επιτρέπει την TPS της SF ή αρχειοθετούνται καρκινικών ιστών FFPE και βλαστικής σειράς DNA του ίδιου του ασθενούς για τον εντοπισμό γενετικών ανωμαλιών των προγνωστικών ή θεραπευτική σημασία χρησιμοποιώντας τη δοκιμασία UNCseq. Οι γενετικές ανωμαλίες που εντοπίστηκαν στο πλαίσιο της ανάλυσης UNCseq και έχουν πιθανή κλινική σημασία στη συνέχεια υποβάλλεται σε επικύρωση με CLIA-πιστοποιημένο εργαστήριο μόνο για την ομάδα ιστού 11-1115 όγκου (Σχήμα 1). Επιπλέον, το περιεχόμενο του όγκου για κάθε δείγμα και των δύο ομάδες εκτιμήθηκε με βάση ρουτίνας μικροσκοπική ανάλυση αντιπροσωπευτικών αιματοξυλίνη και ηωσίνη (Η & amp? Ε). -stained Τμήματα από γειτονικά όγκου από έναν παθολόγο (ΧΥ), ο οποίος ήταν τυφλός σε ασθενή ιστορία

DNA Βιβλιοθήκη Προετοιμασία και Capture

5 τμήματα μm πάχους του ιστού παρασκευάστηκαν από SF ή FFPE ιστούς όγκων. DNA απομονώθηκε χρησιμοποιώντας το Gentra Puregene Tissue Kit (QIAGEN, Valencia, CA). 3 μg DNA μετά διατέμνεται για 60-90 δευτερόλεπτα χρησιμοποιώντας το όργανο Covaris υπερήχων (E220) ακολουθώντας τις οδηγίες του κατασκευαστή (Covaris Inc., Woburn, ΜΑ). κλώνου-ειδική προετοιμασία Μη βιβλιοθήκη DNA πραγματοποιήθηκε χρησιμοποιώντας κιτ αντιδραστηρίου SureSelectXT Agilent με εμπλουτισμό έθιμο στόχος ακόλουθες συστάσεις του κατασκευαστή (Agilent Technologies Inc., Santa Clara, CA). DNA στη συνέχεια υποβλήθηκε για την επισκευή, οι τελικοί στίλβωση (αμβλύ άκρου ή A-προεξοχή), και απολίνωση των προσαρμοσμένων, single-άκρο προσαρμογείς. Οι βιβλιοθήκες στη συνέχεια σταματούν με βιοτινυλιωμένο δολώματα RNA σχεδιασμένο από την Agilent Technologies να διαχωρίσει εξονικές αλληλουχίες για μια λίστα συναίνεση των γονιδίων που σχετίζονται με τον καρκίνο. Πιο συγκεκριμένα, τα γονίδια επιλέχθηκαν με UNC CCGR από δημοσιεύσεις και από το ανανεώνεται περιοδικά Κατάλογος Σωματικά Μεταλλάξεις σε Καρκίνο (COSMIC) βάση δεδομένων [9], με βάση τη συχνότητα της μετάλλαξης (ες) σε συμπαγείς όγκους, τον πιθανό ρόλο τους στην ογκογόνο οδούς και δυνητική σημασία τους κατά του όγκου απόκριση σε αναστολείς μικρών μορίων. Αυτή η λίστα γονίδιο ενημερώνεται σε τριμηνιαία βάση από το UNC CCGR σύμφωνα με νέα έρευνα και την ιατρική ευρήματα [UNCseq ClinSeq εκδόσεις 4, 5 (07-0120 όγκου ομάδα ιστού), και την έκδοση 7 (11-1115 όγκου ομάδα ιστού)? S1 Πίνακας]. Ένα σύνολο γονιδιωματικής στόχων περιοχής που καλύπτει όλα τα εξώνια για κάθε γονίδιο αναπτύχθηκε με βάση το Πανεπιστήμιο της Καλιφόρνια στη Σάντα Κρουζ (UCSC) βάση δεδομένων γνωστό γονίδιο [10, 11]. Περιοχές των στοχοθετημένων εξώνια για τη σύλληψη είχαν επεκταθεί για να συμπεριλάβει 250 ζεύγη βάσεων (bp) των παράπλευρων αλληλουχιών σε εσονικές περιοχές να καλύψει πλήρως στοχευμένες γονίδια. Αυτά γονιδιωματική θέσεις παρείχε τη βάση για το σχεδιασμό των 120 νουκλεοτιδίων (nt) βιοτινυλιωμένο ολίγο σύλληψης για τη σύλληψη Agilent SureSelect χρησιμοποιώντας τη διαδικτυακή πύλη Agilent eArray (https://earray.chem.agilent.com/suredesign/). Κάθε κιτ στοχευμένες 3379 (ClinSeq v4), 3.323 (ClinSeq v5) ή 5997 (ClinSeq v7) περιοχές που εκτείνονται 2231841-bp για ένα σύνολο 228 γονιδίων (ClinSeq v4), 3451622-bp για ένα σύνολο 184 γονιδίων (ClinSeq v5) και 2820216-bp για ένα σύνολο 248 γονιδίων (ClinSeq v7) (S1 πίνακα). Σύλληψη του γραμμοκώδικα-και-συγκεντρωμένα ή μη συγκεντρωμένα βιβλιοθήκες υποβλήθηκε σε επεξεργασία από το SureSelect πρωτόκολλο Agilent.

Πριν από την υποβολή για NGS, βιβλιοθήκες DNA υποβλήθηκαν σε ένα πρωτόκολλο ελέγχου της ποιότητας σε τρία στάδια. συγκέντρωση του DNA μετρήθηκε χρησιμοποιώντας φθορόμετρο qubit 2.0 (Life Technologies, Grand Island, ΝΥ), την ποιότητα του DNA εκτιμήθηκε χρησιμοποιώντας DNA δοκιμασία 2100 Bioanalyzer υψηλή ευαισθησία της Agilent, και το μέγεθος του DNA προσδιορίστηκε με την αυτοματοποιημένο σύστημα ηλεκτροφόρησης Experion (BioRad, Hercules, CA) . Μία κανονικοποιημένη μοριακότητα για κάθε βιβλιοθήκη κατόπιν υπολογίστηκε με βάση το μέγεθος του DNA και τη συγκέντρωση. Βιβλιοθήκες συνενώθηκαν για να συμπεριλάβει 2-8 δείγματα ανά λωρίδα αλληλουχίας. Κάθε δεξαμενή αραιώθηκε σε 5,5 ρΜ, σύμφωνα με την βαθμίδα Illumina CBOT Cluster Γενιάς. Συνεργατικών Σχηματισμών στη συνέχεια δημιουργήθηκε χρησιμοποιώντας TruSeq SR Kit Cluster v.2 και φορτώθηκαν στο sequencer HiSeq 2000 (Illumina Inc., San Diego, CA). Αλληλουχίας με σύνθεση [12] πραγματοποιήθηκε με τη χρήση τυποποιημένων βιβλιοθήκες μονού δείκτη είτε μόνο ανάγνωση (07-0120) ή σε συνδυασμό τέλος κυττάρων (11 – 1.115) ροής με 100 κύκλους (ClinSeq 1 x 100-bp ή 2 x 100- bp, αντίστοιχα) και ένα ανάγνωσης δείκτης ( «barcode) που αποτελείται από 7 κύκλους προσδιορισμού αλληλουχίας με τη χρήση της χημείας V.3 Illumina TruSeq SBS. S2 πίνακας συνοψίζει τις βασικές διαφορές στην επεξεργασία του δείγματος και αλληλουχίας μεταξύ των κλάσεων ιστό του όγκου 07-0120 και 11 με 1.115.

DNA NGS Ανάλυση Δεδομένων Pipeline

Προεπεξεργασία, Προ-φιλτράρισμα, Ευθυγράμμιση, και φιλτράρισμα .

Ο αγωγός ανάλυση των δεδομένων φαίνεται στο σχήμα 1. Δεν σκέλος-μεροληψία θεωρήθηκε σε οποιοδήποτε από τα στάδια προ-επεξεργασίας. Πρώτες αλληλουχία διαβάζει αναλύθηκαν χρησιμοποιώντας το πακέτο CASAVA v.1.8 (Illumina) για να δημιουργήσει γραμμικό κώδικα διαβάζει και αναφέρθηκαν ως αρχεία FASTQ [13]. Εάν ισχύει, διαβάζει στη συνέχεια υποβλήθηκαν σε ποιότητα φιλτραρίσματος και προσαρμογέα-απογύμνωση χρησιμοποιώντας το FASTX-Toolkit (https://hannonlab.cshl.edu/fastx_toolkit/index.html). Η βαθμολογία Phred ποιότητα της βάσης κλήση (CallQ) κάθε νουκλεοτίδιο σε μια ανάγνωση ήταν τότε εξακριβώνεται αν για να τακτοποιήσει την ανάγνωση στα άκρα, όταν μια σειρά συνεχών νουκλεοτιδίων κατά μέσο όρο ανά βάση CallQ ≤ 20 ή ≤ 99% ακρίβεια. Η πρώτη ακολουθία διαβάζει αρχεία FASTQ στη συνέχεια ευθυγραμμίζεται με το ανθρώπινο γονιδίωμα Genome Consortium αναφοράς, την κατασκευή 37 (GRCh37? https://www.ncbi.nlm.nih.gov/assembly/GCF_000001405.13/), χρησιμοποιώντας είτε το Burrows- Wheeler Aligner [14] (BWA 0.6.2) για τη 07-0120 ομάδα ή το BWA-ΜΕΜ (έκδοση 0.7.4) για 11 – 1115 ομάδα. Διαβάζει στη συνέχεια ταξινομούνται και ευρετήριο χρησιμοποιώντας SAMtools (0.1.19-44428cd) [15]. Τοπική ευθυγράμμιση και την ποιότητα βασική βαθμολογία επαναβαθμονόμηση πραγματοποιήθηκαν χρησιμοποιώντας είτε το γονιδίωμα Ανάλυση Toolkit (GATK 2.6) και η δέσμη GATK πόρων (2.5) [16] στην 07-0120 ομάδα ή το ABRA (0.46) [17] σε 11 έως 1.115 ομάδα. Ρυθμίσεις παραμέτρων προεπιλογή χρησιμοποιήθηκαν με τα εργαλεία παραπάνω. Χαρτογραφήθηκαν διαβάζει περαιτέρω φιλτράρεται από την ποιότητα χαρτογράφηση πριν από κατάντη ανάλυση. Φιλτράρισμα έγινε με την επιβολή ελάχιστη βαθμολογία ποιότητας Phred της χαρτογράφησης ανάγνωσης (MapQ). Διαβάζει με χαμηλής ποιότητας χαρτογράφησης (MapQ & lt? 5, δηλαδή & lt? 70% ακρίβεια) αφαιρέθηκαν. Διάμεσος και η κατά προσέγγιση 95% διάστημα εμπιστοσύνης (περ. 95% CI) υπολογίστηκαν για on-στόχο διαβάζει για κάθε ομάδα όγκων και για κάθε έκδοση ClinSeq λεζάντα. Η διάμεση τιμή του διάμεσου RPKM ανά δείγμα (διαβάζει ανά περιφέρεια kilobase ανά εκατομμύριο στοχευμένες διαβάζει χαρτογραφηθεί) [18] χρησιμοποιήθηκε για να περιγράψει το μέσο διαβάζει ανά περιφέρεια.

Ποιοτικού Ελέγχου.

Βάθος, το εύρος της κάλυψης, καθώς και on-στόχο για το ποσοστό υπολογίστηκαν σύμφωνα με τους ορισμούς που αναφέρονται στο S1 Κείμενο.

Variant Calling.

Λόγω της αναδρομικής είσπραξης δείγμα της κλάσης του ιστού 07-0120 όγκου, DNA από ίδια-ασθενή φυσιολογικούς ιστούς (π.χ., το περιφερικό αίμα) δεν ήταν διαθέσιμος για να εξαγάγετε βλαστικής σειράς DNA. Για DNA ελέγχου, μπορούμε αντί αλληλουχία και συνενώθηκαν DNA που εξήχθη από 8 κανονικούς ιστούς (6 συκώτι και 2 μήτρα από συνολικά 4 ασθενείς) υπό παρόμοιες συνθήκες και πρωτόκολλα θεραπείας που εφαρμόζεται με αυτές για DNA-seq των δειγμάτων όγκου. Γενετικές παραλλαγές κλήθηκαν από deepSNV [19]. SNV ζητά από την δοκιμασία μας ήταν περαιτέρω εξευγενισμένα, χρησιμοποιώντας την προηγούμενη γνώση από ένα εξαιρετικά επιμεληθεί λίστα των 41 γονιδίων με 279 SNV και 91 θέσεις Indel που έχουν χρησιμοποιηθεί από το σύστημα OncoMap (έκδοση 4? Μια πηγή εμπειρογνώμονας σε επιμέλεια που ονομάζουμε «συντηρητική» λίστα ) [20] και η κοσμική βάση δεδομένων (έκδοση 66) με σχολιασμό μόνο σε καρκίνο του πνεύμονα. Καλούμε το COSMIC λίστα «λιγότερο συντηρητική», δεδομένου ότι αποτελείται από 18.722 γονίδια με 250.741 SNV και 4.949 θέσεις Indel? 265 από αυτές τις 18.722 γονίδια τα οποία δεν έχουν καμία γενωμική συντονίζει τις πληροφορίες από τις παραλλαγές αποκλείστηκαν [9]. Αξίζει να σημειωθεί ότι όλα τα γονίδια και SNV /θέσεις Indel του συστήματος OncoMap όλα σχολιασμένο κατάλογο «λιγότερο συντηρητική», και ως εκ τούτου, η τελευταία είναι επίσης αναφέρεται ως OncoMap συν COSMIC συστήματος.

Για την παραλλαγή κλήση στην ομάδα του όγκου 07-0120, ορίσαμε σημαντική SNV από το φιλτράρισμα κάθε μία από τις κλήσεις μετάλλαξης με τη χρήση του πακέτου «deepSNV» με Bonferroni προσαρμοσμένο

σ

-τιμή ≤ 0.001, MAF ≥ 0,005, μεταλλαγμένο αλληλόμορφο διαβάσετε καταμέτρηση ( MAC) σε όγκο ≥ 5, και η λογαριθμικά μετασχηματισμένο (αναλογία log

2) πιθανοτήτων (OR) [21] της MAC του κάθε επιμέρους δείγμα όγκου σε σχέση με την ομάδα των κανονικών δειγμάτων ≥ 4. με άλλα λόγια, οι πιθανότητες της κλήσης ένα SNV σε κάθε επιμέρους δείγμα όγκου ήταν ≥ 16 (δηλαδή, 2

4) φορές υψηλότερη σε σύγκριση με συγκεντρωμένο φυσιολογικό. Έχουμε επιλέξει αυτό το όριο MAF γιατί ήταν τουλάχιστον δύο φορές υψηλότερο από ό, τι προηγουμένως αναφερθεί σφάλμα αλληλουχίας των περίπου 0,001 με 0,002 [22]. Όσον αφορά το όριο της MAC, εμείς που αυθαίρετα σε 5, το οποίο είναι πιο αυστηρή από MAC & gt? 2 που είχε αναφερθεί στο παρελθόν [23]. Φιλτράρεται SNVs σχολιάστηκαν από ANOVAR (07/14/2014). Για να βελτιωθεί η εμπιστοσύνη στην κλήση απαράμιλλη όγκους, SNV περαιτέρω εξευγενισμένα χρησιμοποιώντας τη «συντηρητική» λίστα [24], καθώς και το «λιγότερο συντηρητική» λίστα.

Με βάση το γονίδιο-σοφός συσσωμάτωση της σημαντικής SNV που αναφέρονται ανωτέρω , κάθε μεμονωμένο γονίδιο στη συνέχεια εξετάστηκε κάτω από την μηδενική υπόθεση ότι ο ρυθμός μετάλλαξης σε όλον τον γονίδιο είναι σύμφωνα με τον ρυθμό μετάλλαξης υπόβαθρο, για να ληφθεί ένα

σ

-τιμή χρησιμοποιώντας ένα συμβατικό μοντέλο διωνυμική πιθανότητα [25] για να ρυθμίσετε ποσοστά μετάλλαξης για το μήκος του γονιδίου. Τέλος, το SMG έχουν αναφερθεί με τη χρήση του σημαντικού επιπέδου των μεταλλαγμένων γονιδίων για όλες τις ελεγχόμενες γονίδια με ποσοστό εσφαλμένης ανακάλυψη (FDR) ≤ 0,05. Indel κλήθηκαν από VarScan (2.3.6), με προεπιλεγμένη ρύθμιση.

Παραλλαγή κάλεσμα των δειγμάτων ιστού 11 με 1115 όγκου έγινε με την ενημερωμένη έκδοση του UNCseq αγωγού (Αύγουστος 2014). Πιο συγκεκριμένα, χρησιμοποιήσαμε το Strelka σωματικών παραλλαγή του καλούντος (2013) με τις προεπιλεγμένες ρυθμίσεις [26] για την ανίχνευση τόσο SNV και Indel με βαθμολογίες ποιότητας τουλάχιστον 30 για τους δύο, ANOVAR (έκδοση 7.14.2014) για να σχολιάσετε ανιχνεύονται παραλλαγές, και SAMtools /BCFtools (έκδοση 0.1.19-44428cd) για την κανονική χωρίς παραλλαγή κλήση. Για τη δημιουργία ενός «σύγχρονου συγκεντρωτική« κανονική DNA για αυτή την ομάδα ιστού του όγκου, δημιουργήσαμε για πρώτη φορά ένα «αφήστε-one-out» συγκεντρώνονται DNA που αποτελείται από όλα αλληλουχία διαβάζει από το διαθέσιμο βλαστικής σειράς DNA του 11 με 1.115 κλάσης, με εξαίρεση την αντιστοιχισμένη βλαστικής σειράς DNA για το συγκεκριμένο δείγμα. Με άλλα λόγια, για ένα δεδομένο i-th δείγμα όγκου, συγκεντρωμένο φυσιολογικό περιλάμβανε 23 κανονικών δειγμάτων από ασθενείς 1, 2, …, i-1, i + 1, …, n (n = 24). Ως ένα δεύτερο βήμα, η συνολική subsampled διαβάζει από το συγκεντρωμένο φυσιολογικό DNA για τη μείωση του υπολογιστικού χρόνου, και δημιουργείται ένα συγκρίσιμο μέγεθος της σύγχρονης βιβλιοθήκης για τη βέλτιστη στατιστική ανάλυση. Το S2 πίνακας συνοψίζει τις βασικές διαφορές στην ανάλυση βιοπληροφορικής μεταξύ των κλάσεων ιστό του όγκου 07-0120 και 11 με 1.115.

Ανίχνευση Copy Παραλλαγές Αριθμός.

Εμείς υπολογίζεται παραλλαγές αριθμού αντιγράφων του χρωμοσώματος-επίπεδο (CNV ) στην ομάδα ιστού 07-0120 όγκου χρησιμοποιώντας το βάθος ανάγνωσης. Λόγω της εγγενούς ετερογενή, διακόπτεται η κάλυψη του γονιδιώματος από την TPS, χρησιμοποιήσαμε ένα «περιορισμού που επιβάλλεται,« αλγόριθμο ευέλικτη παραθύρων για να εξασφαλιστεί μια ισορροπημένη σειρά διαβάζει ανά παράθυρο σε ολόκληρο το γονιδίωμα του πακέτου R /Bioconductor

NGScopy

(1.0.0). Για να καταστεί δυνατή η ανίχνευση του αριθμού αντιγράφων και στις δύο στοχευμένη και off-στοχευμένες περιοχές του γονιδιώματος, τα οποία έχουν συνήθως υψηλό και χαμηλό βάθος κάλυψη, αντίστοιχα, εκτός στόχου διαβάζει ( «φόντο διαβάζει») χρησιμοποιήθηκαν εκτός από on-στόχο. Δύο κριτήρια που ορίζονται ένα τέτοιο ευέλικτο παράθυρο. Κατ ‘αρχάς, για να εξασφαλίσει ακόμη διακύμανσης καθώς και επαρκή αριθμό διαβάζει ανά παράθυρο, το βάθος ανάγνωσης ανά παράθυρο στο συγκεντρωμένο φυσιολογικό δείγμα ελέγχου δεν ήταν λιγότερο από το 20x ανά δείγμα. Δεύτερον, ελάχιστο μέγεθος παραθύρου του διατηρήθηκε μέσα σε ένα εύρος καθορίζεται από τα χαρακτηριστικά κάλυψης, όπως σε γονιδιωματικές περιοχές με υψηλή πυκνότητα διαβάζεται, η χρήση των μικρών μεγεθών παράθυρο οδηγεί σε ένα «πριονωτό» undersmoothened σήματος. Για τη μελέτη αυτή, το ελάχιστο μέγεθος του παραθύρου που χρησιμοποιήθηκε ήταν 20 Kbp. Βιβλιοθήκη μέγεθος κανονικοποιημένη διαβάζει ανά παράθυρο τόσο για συγκεντρώνονται κανονικό έλεγχο και κάθε δείγμα όγκου μετρήθηκαν για τον υπολογισμό του όγκου /κανονική καταγραφή

2 αναλογία αριθμού αντιγράφων (CNR) ως τον σχετικό αριθμό αντιγράφων. Για να ληφθεί υπόψη για τον αριθμό αντιγράφων ουδετερότητα, εμείς κανονικοποιημένα δεδομένα μας ανά δείγμα όγκου με κεντράρισμα του διάμεσου των σχετικών αριθμών αντιγράφων σε μηδέν σε ολόκληρο το γονιδίωμα. Άμεση απεικόνιση χρησιμοποιήθηκε για την αξιολόγηση δομικές παραλλαγές σε όλη την γονιδίωμα. Τέλος, ο κατακερματισμός της έγινε από μια ετερογενή κρυμμένο μοντέλο Markov, που ονομάζεται BioHMM [27], το οποίο προσαρμόστηκε για τα δεδομένα NGS.

Για τον υπολογισμό του γονιδίου σε επίπεδο CNV στην ομάδα ιστού 07-0120 όγκου, χρησιμοποιήσαμε το βάθος του γονιδίου εξονίου-ειδική αλληλουχία διαβάζει με 1-bp ανάλυση. Υπολογίσαμε το σχετικό αριθμό αντιγράφων, ομοίως όπως παραπάνω, υπολογίζοντας το αρχείο καταγραφής

2 αναλογία βάθους ανάγνωσης ανά βάση του όγκου σε σχέση με συγκεντρωμένο φυσιολογικό έλεγχο.

Επικύρωση του DNA NGS δεδομένων από την RNA αλληλουχίας .

Agilent σκέλος ειδικό RNA με τη σύλληψη έγινε για προετοιμασία. αλληλούχιση RNA (RNA-seq) ανάλυση σε ολόκληρο το μεταγραφικό σε ένα υποσύνολο δείγματα όγκων από κοόρτη ιστό 07-0120 όγκου διεξήχθη επί Illumina GAII όπως περιγράφηκε προηγουμένως [28, 29]. Το πλήρες 76-bp, single-άκρο διαβάζει πρώτα ευθυγραμμίζεται με το γονιδίωμα αναφοράς ανθρώπου (hg19) με MapSplice [30]. SNV καλείται από το DNA επόμενα συνέχεια επικυρώθηκαν από την ανάλυση των δεδομένων RNA-επόμενα χρήση δύο ανεξάρτητων αλγορίθμων μετάλλαξη κλήση: η SAMtools (εντολή mpileup) /BCFtools [15] και δημοσιεύτηκε πρόσφατα RNAseq-ειδική μέθοδο μετάλλαξης καλώντας μας, UNCeqR [31].

DNA μη NGS Αναλύσεις.

για την ομάδα ιστού 07-0120 όγκου, έχουμε πραγματοποιήσει στο παρελθόν αλληλουχίας Sanger χρησιμοποιώντας αναλυτή DNA (ABI 3730xl, Applied Biosystems, Foster City, CA) για ανίχνευση μετάλλαξης επιλεγμένων εξώνια του

KRAS

γονιδίου καθώς και επιλεγμένα εξόνια των γονιδίων

BRAF

,

CDKN2A

,

EGFR

,

STK11

, και

TP53

. Επιπλέον, τα δείγματα από την ομάδα 07-0120 υποβλήθηκαν σε ανάλυση με τη χρήση του γονιδιώματος σε επίπεδο Ανθρώπινου SNP Array 6,0 μικροσυστοιχιών (Affymetrix, Santa Clara, CA) για την ανίχνευση CNV σε ένα υποσύνολο δειγμάτων καρκίνου του πνεύμονα μας [32]. SNP ανάλυση της σειράς για CNV πραγματοποιήθηκε με τη χρήση του ανοικτού κώδικα έκδοση του πακέτου R aroma.affymetrix 2.5.0 (https://cran.r-project.org/web/packages/aroma.affymetrix) και DNACopy έκδοση 1.30.0 (http: //www.bioconductor.org/packages/release/bioc/html/DNAcopy.html) για την επεξεργασία και ανάλυση δεδομένων CNV, αντίστοιχα.

διάστημα εμπιστοσύνης για ένα μέσο.

διάστημα εμπιστοσύνης ( CI) για διάμεση υπολογίστηκε όπως περιγράφηκε προηγουμένως [33].

Αποτελέσματα

κλινικοπαθολογική χαρακτηριστικά του 07-0120 και 11-1115 δείγματα ασθενούς

ιστούς όγκων από 100 και 24 ασθενείς με πρωτοπαθή καρκίνο του πνεύμονα συμπεριλήφθηκαν στην ανάλυση για τις ομάδες ιστό όγκου 07-0120 και 11 έως 1115, αντίστοιχα. Οι κλινικοπαθολογικοί χαρακτηριστικά για κάθε ομάδα παρουσιάζονται στον Πίνακα 1. Η στοχευμένη σύλληψη πάνελ χρησιμοποιώντας εκδόσεις ClinSeq 4 και 5 διεξήχθησαν σε 64 και 36 των δειγμάτων 07-0120 SF, αντίστοιχα, και ClinSeq έκδοση 7 εφαρμόστηκε σε όλα τα δείγματα 24 όγκων από το 11 -1115 ομάδα ιστού του όγκου. Το συγκεντρωμένο φυσιολογικό DNA ήταν διαθέσιμο για την ανάλυση της κοόρτης 07-0120 όγκου, ενώ συνδυάζεται βλαστικής σειράς DNA ήταν διαθέσιμο για την ομάδα 11 – 1115 όγκου. S1 Ο πίνακας δείχνει τη λίστα των γονιδίων των οποίων τα εξόνια αναλύθηκαν κατά την αλληλουχία ως μέρος των εκδόσεων ClinSeq 4, 5, και 7.

Η

Βιοπληροφορική ανάλυση του 07-0120 Δείγματα Ασθενών

Έχουμε λάβει μια συνολικά 2100991292 διαβάζει από όλα τα 64 δείγματα που αναλύθηκαν κατά την αλληλουχία χρησιμοποιώντας την έκδοση ClinSeq 4, και 591.549.582 διαβάζει από όλες τις 36 δείγματα που αναλύθηκαν κατά την αλληλουχία χρησιμοποιώντας την έκδοση ClinSeq 5. Όλα τα δείγματα που έχουν περάσει τον έλεγχο της ποιότητας με τη χρήση του FASTX-Toolkit. 93.96 ± 0.85% αυτών αναγνώσεις έγιναν μοναδικά αντιστοιχίζεται με το γονιδίωμα αναφοράς με MapQ ≥ 5, δηλ 1985916272 (94,5%) και 551493714 (93,2%) για ClinSeq 4 και 5, αντίστοιχα. Ο διάμεσος αριθμός των μοναδικά χαρτογραφηθεί (mapQ ≥ 5) διαβάζει ανά δείγμα ήταν 18.171.425 (περ. 95CI 16,442,697-27,015,601) και 14350546 (περ. 95CI, 13,786,985-15,363,758) για δείγματα αλληλουχήθηκαν σε εκδόσεις ClinSeq 4 και 5, αντίστοιχα. Ήμασταν σε θέση να ανακτήσει 71,6% (μέση τιμή? Περ. 95CI, 70,9% -72,5%) και 30,6% (μέση τιμή? Περ. 95CI, 29,9 – 31,4%) σε στοχευόμενα βάσεις με στοχευμένη στρατηγική σύλληψη πάνελ μας για ClinSeq έκδοση 4 και 5, αντίστοιχα. Η μετάβαση από ClinSeq έκδοση 4 έως 5 συνδέθηκε με αρκετές αλλαγές, συμπεριλαμβανομένων ad hoc σχεδιασμό των εναρκτήρων από τους ερευνητές, σε αντίθεση με τον πωλητή (Agilent), καθώς και νέες γονιδιωματικές περιοχές ενδιαφέροντος των οποίων η σύλληψη αποδοτικότητα και ικανότητα εύκολα αλληλουχία ήταν αμφισβητήσιμος. Ο διάμεσος του διάμεσου RPKM ανά δείγμα ήταν 452 (περ. 95CI, 448-458) και 446 (περ. 95CI, 440-454) για δείγματα αλληλουχήθηκαν χρησιμοποιώντας την έκδοση ClinSeq 4 και 5, αντίστοιχα. Ανάλυση /Indel SNV περιορίστηκε στις κοινές περιοχές του DNA για τις εκδόσεις ClinSeq 4 και 5, 1.190.667 βάσεις ανά δείγμα, ή 168 γονίδια, για τη σύγκριση μεταξύ των δειγμάτων. Για την ανάλυση αριθμού αντιγράφων, ολόκληρο το γονιδίωμα θεωρήθηκε, είτε on-στόχο ή όχι.

Μια κοινή στρατηγική για να ξεπεραστεί η εγγενής υψηλό ποσοστό σφάλματος των μέσων NGS και να εξασφαλίσει την επαρκή κάλυψη και των δύο αλληλομόρφων για κάθε χώρο παραλλαγή ή η ύπαρξη πολλαπλών κλώνων είναι ιδανική σειρά ατομικών γονιδιωμάτων στην 20-30x βάθος κάλυψη [34]. Τέτοια βάθος κάλυψη είναι επαρκής για ένα φυσιολογικό ιστό, ένα γενετικά ομοιογενές ιστό καρκίνου, όπως ο καρκίνος κυτταρικές σειρές, ή ιστό όγκου με ελάχιστη στρωματικά «μόλυνση», αλλά όχι για τους ιστούς του όγκου με ποικίλου βαθμού κυτταρικής ή /και μοριακή ετερογένεια (π.χ., υποκλώνους ποικίλης γονότυπος) (Σχήμα 1). Μια πρόσφατη μελέτη έδειξε ότι ένα βάθος 30x κάλυψη ήταν επαρκής για μια κατά προσέγγιση ευαισθησία 90% για να καλέσετε μεταλλάξεις σε κλάσματα αλληλόμορφο ≥ 0,2 [35]. Για τις τελευταίες αυτές περιπτώσεις, τουλάχιστον 50x βάθος κάλυψη είναι συνήθως χρησιμοποιείται για να καλέσετε μόνο νουκλεοτίδιο ή άλλες γενετικές παραλλαγές.

Για να καθοριστεί η βέλτιστη ισορροπία μεταξύ κόστους και το βάθος κάλυψη για τη στρατηγική μας TPS, εμείς αλληλουχία 2 (n = 24 δείγματα), 4 (n = 4), ή 8 δείγματα (n = 72) ανά κυψελίδα ροής λωρίδα. Όπως φαίνεται στο σχήμα 2, ένας στόχος συνολικό βάθος κάλυψη 50χ επετεύχθη όταν φορτώθηκαν μέχρι 8 δείγματα ανά λωρίδα. Τα μέσα ποσοστά της on-στόχου βάσεις που δεν έχει βάθος μικρότερο από 50χ κάλυψη για 2, 4, και 8 δείγματα ανά λωρίδα είναι 98%, 95%, 93%, αντίστοιχα? και 97%, 92%, 86%, αντίστοιχα, χωρίς βάθος λιγότερο από 100χ. Καταλήγουμε στο συμπέρασμα ότι 8 δείγματα ανά λωρίδα παρέχουν επαρκή οικονομικά και χρονικά αποτελεσματική κάλυψη (50x) στο πλαίσιο της στρατηγικής μας για την TPS.

Ορατή για κάθε δείγμα όγκου είναι το ποσοστό των στοχευμένων βάσεις που καλύπτονται σε δεδομένο βάθος κάλυψη (1x, 20x , 50x, 100x) και αλληλουχία κάτω από διαφορετικές ρυθμίσεις λωρίδα στο μέσο HiSeq 2000 (2, 4, και 8 DNA βιβλιοθήκες ανά λωρίδα, Lib /Ln).

η

Σύγκριση με SNV Κλήση Μεταξύ NGS και Sanger αλληλουχίας στις 07-0120 δείγματα ασθενούς

για να εκτιμηθεί κατά πόσον NGS είναι τουλάχιστον τόσο ευαίσθητο όσο αλληλουχίας Sanger στο SNV ζητώντας γνωστά hotspots μετάλλαξη, συγκρίναμε τα αποτελέσματα για την ανίχνευση του

KRAS

hot-spot SNV μεταξύ των δύο πλατφορμών αλληλούχισης. Έχουμε επιλέξει

KRAS

για την έρευνα αυτή γιατί φέρει αδιαμφισβήτητο hotspot σωματικά SNV για τον καρκίνο του πνεύμονα στα κωδικόνια 12 και 13, τα οποία έχουν προηγουμένως σαφώς προσδιορισμένες [36, 37]. Όπως φαίνεται στο Σχήμα 3, πάνελ Α και Β, χρησιμοποιώντας αγωγός NGS μας, εντοπίσαμε όλα SNV 8 hotspot προσδιορίζονται με ανάλυση αλληλουχίας Sanger. Επιπλέον, 8 επιπλέον SNV hotspot που δεν προσδιορίζονται με προσδιορισμό της αλληλουχίας Sanger κλήθηκαν επίσης μέσω αγωγού NGS μας. Όπως φαίνεται στο Σχήμα 3, πλαίσιο C, ούτε χαμηλή κάλυψη NGS ούτε χαμηλής καθαρότητας όγκου ήταν διαφορετική μεταξύ των 8 συμφωνηθεί και οι 8 αποκλίνοντος περιπτώσεις με NGS και αλληλούχιση Sanger (

ρ-τιμή

& gt? 0.1, δύο όψεων Wilcoxon τεστ). Σε σύγκριση με αλληλουχίας Sanger, NGS ήταν σε θέση να ανιχνεύσει τις

KRAS

μεταλλαγμένα αλληλόμορφα με σημαντικά χαμηλότερο MAF (

σ

-τιμή = 0.0006, διπλής όψης τεστ Wilcoxon? Σχήμα 3, πάνελ C). Είναι ενδιαφέρον ότι η MAF 4 ασύμφωνα περιπτώσεις (ID: 30, 65, 72, 60) είναι κάτω, αλλά πλησίον του 0,20, υποδηλώνοντας ότι αλληλούχιση Sander είναι λιγότερο ευαίσθητη για την ανίχνευση SNV με MAF ≤ 0,20, σύμφωνα με προηγούμενες αναφορές [38]. Η MAF από τις άλλες 4 αντιφατικά περιπτώσεις (ID: 97,56,38,70) είναι κοντά στο 0,05 ή κάτω, υποδεικνύοντας NGS ήταν σε θέση να συλλάβει SNV με πολύ χαμηλό MAF

(Α) χρωματογραφήματα αλληλουχίας (. Finch τηλεόραση ίχνος v1.4.0 θεατή) που λαμβάνεται από δύο παραδείγματα ιστό του όγκου δείχνει αντιστοιχία (δείγμα 24) ή ασυμφωνίας (δείγμα 38) στο

KRAS

SNV κλήση. (Β) SNV καταπλέουν σε hot-spot τόπους στο

KRAS

κωδικόνιο 12 και 13 για όλους τους 16 όγκους χρησιμοποιώντας μία από τις δύο στρατηγικές αλληλουχίας. Οι κλήσεις από Sanger και NGS χρωματιστά σε πορτοκαλί και μπλε, αντίστοιχα. Οι κλήσεις και από τις δύο πλατφόρμες χρωματιστό στο μισό πορτοκάλι και μισό μπλε. NGS βάθος κάλυψη, την καθαρότητα, και MAF εμφανίζονται επίσης. (C) Boxplots του MAF, την καθαρότητα των όγκων, και το βάθος της κάλυψης μεταξύ ασύμφωνα και συγκλίνουσες κλήσεις SNV εμφανίζονται (

σ

-τιμή = 0,0006, δύο όψεων τεστ Wilcoxon).

Η

για να εκτιμηθεί η ευαισθησία της NGS SNV καλώντας αλγορίθμου μας, εστιάσαμε στην πρώτη κωδικοποίηση εξόνιο του

KRAS (RefGene ID

:

NM_033360)

. Αυτό το 111-bp περιοχής του DNA (

CHR12

:

25

,

398

,

208-25

,

398

,

318

) περιέχει τις 6-bp θέσεις που αντιστοιχούν στις περιοχές hotspot στα κωδικόνια 12 και 13 (

CHR12

:

25

,

398

,

280-25

,

398

,

285

). Από τις υπόλοιπες 105 bp, υπάρχουν 52-bp θέσεις με παραλλαγές σχολιασμένο από OncoMap συν COSMIC σύστημα ή dbSNP, και 53-bp θέσεις, χωρίς παραλλαγές σχολιασμένη είτε OncoMap συν COSMIC σύστημα ή dbSNP [39]. PCR, αλυσιδωτή αντίδραση πολυμεράσης?

You must be logged into post a comment.