PLoS One: Υψηλή ακρίβεια Μετάλλαξη Ανίχνευση σε λευχαιμία σε ένα επιλεγμένο πάνελ των γονιδίων του καρκίνου


Αφηρημένο

Με την έλευση του πλήρους γονιδιώματος και αλληλούχιση ολόκληρου exome, κατάλογοι υψηλής ποιότητας περιοδικά μεταλλαγμένα γονίδια του καρκίνου γίνονται διαθέσιμες για πολλούς τύπους καρκίνου. Αύξηση της πρόσβασης στην τεχνολογία αλληλουχίας, συμπεριλαμβανομένων πάγκο-top sequencers, δίνουν την ευκαιρία για την εκ νέου ακολουθία ένα περιορισμένο σύνολο των γονιδίων του καρκίνου σε ένα ασθενή ομάδα με περιορισμένο χρόνο επεξεργασίας. Εδώ, έχουμε εκ νέου αλληλουχία ένα σύνολο γονιδίων του καρκίνου σε Τ-οξεία λεμφοβλαστική λευχαιμία κυττάρων (T-ALL) χρησιμοποιώντας τη σύλληψη ακολουθία Nimblegen σε συνδυασμό με τη Roche /454 τεχνολογίας. Πρώτον, ερευνήσαμε το πώς μπορεί να επιτευχθεί μια μέγιστη ευαισθησία και την ειδικότητα της ανίχνευσης μετάλλαξης μέσω μιας μελέτης σημείο αναφοράς. Δοκιμάσαμε εννέα συνδυασμούς διαφορετικών χαρτογράφησης και των μεθόδων παραλλαγή-κλήση, μεταβάλλεται η παραλλαγή καλώντας τις παραμέτρους, και σε σύγκριση με τις προβλεπόμενες μεταλλάξεις με ένα μεγάλο ανεξάρτητο σύνολο επικύρωσης που λαμβάνεται με τριχοειδή εκ νέου προσδιορισμό της αλληλουχίας. Βρήκαμε ότι ο συνδυασμός των δύο αλγορίθμων χαρτογράφησης, δηλαδή

BWA-ΝΔ

και

SSAHA2

, σε συνδυασμό με την κλήση αλγόριθμο παραλλαγή

Atlas-SNP2

αποδίδει την υψηλότερη ευαισθησία (95 %) και το υψηλότερο ειδικότητα (93%). Στη συνέχεια, εφαρμόσαμε αυτή αγωγού ανάλυση για τον εντοπισμό μεταλλάξεων σε ένα σύνολο 58 γονιδίων του καρκίνου, σε ένα πάνελ 18 Τ-όλες τις κυτταρικές σειρές και 15 T-όλα τα δείγματα ασθενών. Επιβεβαιώσαμε μεταλλάξεις στο γνωστό T-όλοι οι οδηγοί, συμπεριλαμβανομένων PHF6, NF1, FBXW7, Notch1, KRAS, ΕΡΑ, PIK3CA, και PTEN. Είναι ενδιαφέρον, βρήκαμε επίσης μεταλλάξεις σε διάφορα γονίδια του καρκίνου που δεν είχαν συνδεθεί με T-ALL πριν, συμπεριλαμβανομένων των JAK3. Τέλος, έχουμε εκ νέου αλληλουχία ένα μικρό σύνολο των 39 υποψηφίων γονιδίων και προσδιορίζονται επαναλαμβανόμενες μεταλλάξεις στο TET1, SPRY3 και SPRY4. Εν κατακλείδι, έχουμε δημιουργήσει μια βελτιστοποιημένη αγωγού ανάλυση για τη Roche δεδομένων /454 που μπορούν να εφαρμοστούν για να ανιχνεύσει με ακρίβεια μεταλλάξεις γονιδίων στον καρκίνο, η οποία οδήγησε στον εντοπισμό αρκετών νέων υποψήφιων μεταλλάξεις T-ALL οδηγό

Παράθεση:. Kalender Atak Ζ, De Keersmaecker Κ, Gianfelici V, Geerdens Ε, Vandepoel R, Pauwels D, et al. Μετάλλαξη Detection (2012) Υψηλή ακρίβεια σε λευχαιμία σε ένα επιλεγμένο πάνελ της γονίδια του καρκίνου. PLoS ONE 7 (6): e38463. doi: 10.1371 /journal.pone.0038463

Επιμέλεια: Jörg Δ Hoheisel, Deutsches Krebsforschungszentrum, Γερμανία

Ελήφθη: 28 του Δεκέμβρη 2011? Αποδεκτές: 5 Μαΐου του 2012? Δημοσιεύθηκε: 4, Ιουνίου, 2012

Copyright: © 2012 Kalender Atak et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Αυτό το έργο υποστηρίχθηκε από τη βελγική ομοσπονδιακή κυβέρνηση (σχέδιο Καρκίνου – Μεταγραφική έρευνα), η KU Leuven (χορηγήσουν GOA /11/010 για να J. Δροσίζει και PV? χορηγούν PF /10/016 SymBioSys να J. Δροσίζει και SA), το Ίδρυμα κατά καρκίνο (επιχορήγηση 2010 με 154 έως Α.Ε.), η FWO Φλάνδρας (G.0287.07, J. Δροσίζει), και το Ευρωπαϊκό Συμβούλιο Έρευνας (ΕΣΕ εκκίνησης επιχορήγησης σε J. Δροσίζει). ΚΔΚ είναι ένας μεταδιδακτορικός ερευνητής που χρηματοδοτείται από την FWO Φλάνδρας, PV είναι Ανώτερος Κλινικός ερευνητής που υποστηρίζονται από FWO Φλάνδρας, DP και βουλευτής χρηματοδοτούνται από Agentschap voor Innovatie πόρτα Wetenschap en Technologie. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:. Η υπαγωγή των WDG και HQ για να Γερμανική συλλογή μικροοργανισμών και καλλιεργειών κυττάρων GmbH δεν αλλάζει τήρηση των συντακτών σε όλες τις PLoS ONE πολιτικές για την ανταλλαγή δεδομένων και υλικών.

Εισαγωγή

αλληλούχισης επόμενης γενιάς (NGS) τεχνολογίες έχουν βελτιώσει σημαντικά την ικανότητα αλληλουχίας μας κατά τα τελευταία πέντε χρόνια. Έχουν σήμερα χρησιμοποιείται ευρέως για ερευνητικούς σκοπούς και αρχίζουν να βρίσκουν το δρόμο τους σε κλινικές εφαρμογές. Παρά το γεγονός ότι ολόκληρο το γονιδίωμα και προσεγγίσεις ολόκληρη αλληλουχίας exome υλοποιούνται επιτυχώς για τη χαρτογράφηση των γενωμική τοπία πολλών ανθρώπινων ασθενειών, δεν είναι ρουτίνα στρατηγικές για την ανίχνευση μοριακών ανωμαλιών λόγω του υψηλού κόστους, και μακρούς χρόνους κύκλου εργασιών (τρέχουν και οι χρόνοι ανάλυσης). Στοχευμένη εκ νέου προσδιορισμό αλληλουχίας, από την άλλη πλευρά, είναι ελκυστική σε ένα κλινικό περιβάλλον, λόγω του χαμηλότερου κόστους της αλληλουχίας, μικρότερο χρόνο αλληλουχίας και απλούστερη ανάλυση δεδομένων. Επιπλέον, δεδομένου ότι η ανακάλυψη των νέων γονιδίων του καρκίνου με αλληλούχιση ολόκληρου exome θα κορέσει σταδιακά και συγκλίνουν σε ένα σύνολο κοινά μεταλλαγμένα γονίδια σε ένα συγκεκριμένο καρκίνο, ο προσδιορισμός αυτών των μεταλλάξεων μπορεί να αποφέρει σημαντικές διαγνωστικές και προγνωστικές πληροφορίες.

Παρά την απαίτηση αρκετών ημερών για την παρασκευή της βιβλιοθήκης και τον εμπλουτισμό στόχο για όλες αυτές τις πλατφόρμες, η Roche /454 τεχνολογία προσφέρει τα πλεονεκτήματα της σύντομους χρόνους εκτέλεσης και χρονικά δεδομένα ανάλυσης. Επιπλέον, η πιο περιορισμένη έξοδος δεδομένων είναι επίσης ευεργετική για το χρόνο παράδοσης επειδή λιγότερα δείγματα ασθενών θα πρέπει να συλλέγονται για να γεμίσει μια ολόκληρη επιχείρηση αλληλουχίας. Με βάση αυτά τα πλεονεκτήματα της 454 πλατφόρμα για αλληλούχιση σχετικά μικρά σύνολα γονιδίων, έχουμε επενδύσει στη βελτιστοποίηση της βιοπληροφορικής αγωγών για τη χαρτογράφηση ανάγνωσης και παραλλαγή κάλεσμα των 454 διαβάζει, με στόχο για την εφαρμογή αυτή, τόσο για την έρευνα όσο και για κλινικούς σκοπούς. Έχουμε επικεντρώθηκε στην Τ κυτταρική οξεία λεμφοβλαστική λευχαιμία (Τ-ALL), ένα επιθετικό αιμοποιητικών καρκίνου που προκαλείται από κακοήθη μετασχηματισμό των αναπτυσσόμενων Τ-κυττάρων [1]. Ένα σύνολο 97 γονιδίων επιλέχθηκε για στοχευμένη αλληλούχιση. Το σύνολο αποτελούνταν από 58 καρκίνο γονιδίων [2] και 39 υποψήφια γονίδια συμπεριλαμβανομένων κινάσης τυροσίνης και τα γονίδια που κωδικοποιούν φωσφατάση, τροποποιητές χρωματίνης, και αρκετά γονίδια που ανήκουν στις οικογένειες των γνωστών γονιδίων του οδηγού του καρκίνου, όπως TET1-TET3, ή PIK3CB-PIK3CD-PIK3CG.

Για την ακριβή ανίχνευση παραλλαγή, ερευνήσαμε πολλές υφιστάμενων αγωγών ανάλυση και σύγκριση των επιδόσεων τους. Αν και η gsMapper λογισμικό σύντροφος χρησιμοποιείται ευρέως στην ανάλυση των 454 δεδομένων [3], [4], [5], διάφορες εναλλακτικές χαρτογράφηση και παραλλαγής καλώντας αλγόριθμοι έχουν αναπτυχθεί, όπως BWA-SW [6] και SSAHA2 [7] , BLAT [8] για τη χαρτογράφηση και SAMTools [9], VarScan [10], και Atlas-SNP2 [11] για την παραλλαγή κλήση. Li et al [6] εξέτασε τις μεγάλες νάρθηκες ανάγνωσης, και Shen et al [11] στην κριτική τους καλούντες παραλλαγή, ωστόσο, στη γνώση μας, καμία σύγκριση έχει γίνει με το συνδυασμό της χαρτογράφησης και παραλλαγή καλώντας αλγόριθμους στο πλαίσιο της ανακάλυψης μετάλλαξης .

Εδώ, αναλύονται και συγκρίνονται εννέα διαφορετικούς συνδυασμούς ενός χαρτογράφησης και παραλλαγή καλώντας αλγορίθμων και ιδιαίτερα διερευνηθεί σε ποιο βαθμό χαμηλές θέσεις κάλυψη μπορεί να συμπεριληφθεί στην παραλλαγή διαδικασία καλώντας για να αυξηθεί η ευαισθησία της ανίχνευσης μετάλλαξης. Στη συνέχεια, εφαρμόζουμε τη βελτιστοποιημένη αγωγού να εντοπίσει μεταλλάξεις σε ένα σύνολο 58 γονιδίων του καρκίνου και 39 υποψήφια γονίδια, σε 18 Τ-όλες τις κυτταρικές σειρές και 15 T-Όλα τα δείγματα των ασθενών, και να εντοπίσει επαναλαμβανόμενες μεταλλάξεις και στα δύο γνωστά και τα νέα προγράμματα οδήγησης.

Αποτελέσματα

Σύγκριση Χαρτογράφηση και Παραλλαγή Κλήση Μέθοδοι Roche /454 δεδομένων

το λογισμικό σύντροφος Roche

gsMapper

χρησιμοποιείται κυρίως για την ανάλυση των Roche /454 δεδομένα. Αυτό το λογισμικό ευθυγραμμίζει πρώτα τη διαβάζει στο γονιδίωμα αναφοράς και στη συνέχεια παραθέτει όλες τις θέσεις που είναι διαφορετικές από το γονιδίωμα αναφοράς (παραλλαγή κλήσης). Παρά το γεγονός ότι

gsMapper

καλές επιδόσεις σε διάφορες μελέτες [3], [4], [5], θέλαμε να αξιολογεί τις επιδόσεις της σε ρυθμίσετε τα δεδομένα μας και να διερευνήσει κατά πόσον θα μπορούσαμε να επιτύχουμε καλύτερη ακρίβεια και ορθότητα χρήση εναλλακτικών νάρθηκες και παραλλαγή καλούντες. Δοκιμάσαμε οκτώ διαφορετικούς συνδυασμούς μιας μακράς διαβάσετε aligner (BWA-ΝΔ, SSAHA2, BLAT) και μια παραλλαγή του καλούντος (SAMTools, VarScan, Atlas-SNP2) και σύγκριση των επιδόσεων τους με

gsMapper

.

κάθε αγωγός εφαρμόστηκε στην διαβάζει ελήφθη από επτά Τ-όλες τις κυτταρικές σειρές και η απόδοση του κάθε αγωγού αξιολογήθηκε από τους Sanger εκ νέου προσδιορισμό της αλληλουχίας του 210 υποψήφιων παραλλαγών που λαμβάνεται τυχαία από όλες προέβλεψε 8020 παραλλαγές (που περιέχει τόσο SNPs και μεταλλάξεις) από όλες οι σωληνώσεις. Ως μέτρο της απόδοσης του κάθε αγωγού, υπολογίσαμε το συντελεστή συσχέτισης Matthews (MCC), το οποίο είναι ένα μέτρο της ακρίβειας πρόβλεψης που υπολογίζεται με βάση τον αριθμό των προβλεπόμενων επιτυχία αληθώς θετικά και αληθινή αρνητικά βρεθεί με προσδιορισμό της αλληλουχίας Sanger (βλέπε Υλικά και Μέθοδοι). Όταν χρησιμοποιείτε τις προεπιλεγμένες ρυθμίσεις παραμέτρων (Πίνακας S1), η απόδοση των διαφορετικών αγωγών ήταν συγκρίσιμη, με μέση MCC 0,62, χωρίς εναλλακτικού αγωγού αποδίδουν καλύτερα από gsMapper (MCC 0,82) (Πίνακας S1).

σε μελέτες NGS, η παρουσία των διπλών αναγνώσεις (που προκαλείται από ένα στάδιο ενίσχυσης PCR κατά την παρασκευή βιβλιοθήκης) είναι μια πιθανή πηγή ψευδών θετικών απλή παραλλαγή νουκλεοτιδίου (SNV) πρόβλεψη [12]. Ως εκ τούτου, προσθέσαμε ένα επιπλέον βήμα για την αφαίρεση των διπλών διαβάζει χρησιμοποιώντας Picard, με αποτέλεσμα την αύξηση 2-24% σε MCC, ανάλογα με τον αγωγό, με μέσο όρο 0,73 MCC (Πίνακας S1). Αυτό έδειξε ότι διπλούν αφαίρεσης είναι ένα σημαντικό βήμα για την απόκτηση σωστές κλήσεις παραλλαγή.

Στη συνέχεια, βελτιστοποιείται περαιτέρω την απόδοση του κάθε αγωγού μεταβάλλοντας τον ελάχιστο απαιτούμενο αριθμό διαβάζει (το βάθος της κάλυψης, DOC) και η ελάχιστη απαιτούμενη παραλλαγή διαβάζει (συχνότητα αλληλόμορφου παραλλαγής, VAF). Αλλαγές στις όρια δήλωση συμμόρφωσης επηρέασε κυρίως την ευαισθησία, ενώ ποικίλα όρια νΑΡ επηρέασαν τις προβλέψεις όσον αφορά την εξειδίκευση (Σχήμα 1 Α, Πίνακας S2). Όλες οι σωληνώσεις που επιτεύχθηκε καλύτερη απόδοση τους, με κατώτατο όριο δήλωση συμμόρφωσης του 3, και με ελάχιστο όριο νΑΡ 0,20 (κατά περίπτωση) (Πίνακας S1-S2). Σε μια ύστατη προσπάθεια να ελαχιστοποιηθούν οι ψευδώς θετικές προβλέψεις, συνδυάσαμε τους δύο καλύτερους αλγόριθμους χαρτογράφηση σε ένα αγωγό, ο οποίος αυξήθηκε περαιτέρω την ευαισθησία στο 95% και η ειδικότητα 93%. Ο λόγος για αυτή την αύξηση της ακρίβειας είναι ότι ορισμένα προβλεπόμενη παραλλαγές που προκαλούνται από λανθασμένες χαρτογράφησης (Σχήμα S1) είναι τώρα φιλτράρονται. Αν και αυτή η τελική του αγωγού (SSAHA2 + BWA-SW + Atlas-SNP2) αποδίδει καλύτερα από ό, τι

gsMapper

(91,2% ευαισθησία και 90,8% ειδικότητα), η διαφορά δεν είναι μεγάλη και

gsMapper

μπορεί να θεωρηθεί ως ισχύει (και συχνά εύκολο στη χρήση) εναλλακτικό (Σχήμα 1 Β).

(Α) διαφορετικοί αγωγοί παρουσιάζουν διαφορετική ευαισθησία και ειδικότητα. Μεταβάλλοντας DoC και τα κατώφλια VAF στη διαδικασία παραλλαγή κλήση έχει μια πρόσθετη επίδραση επί τις προβλέψεις όσον αφορά την ευαισθησία και την ειδικότητα, αντίστοιχα. Κάθε αγωγός εκπροσωπείται με ένα διαφορετικό σύμβολο και την απόδοση του κάθε αγωγού (όσον αφορά την ευαισθησία και την ειδικότητα) χαράσσεται κάτω από ποικίλες δήλωση συμμόρφωσης και τα κατώτατα όρια νΑΡ. Σημειώστε ότι ο άξονας Χ αντιπροσωπεύει το ποσοστό ψευδώς θετικών (1-ειδικότητα). Σε αυτό το γράφημα ROC, όσο πιο κοντά το σημείο στο ανώτερο αριστερό σημείο του γραφήματος, τόσο καλύτερη είναι η ευαισθησία και η εξειδίκευση. Διαφορετικά χρώματα των συμβόλων δείχνουν την απόδοση του αγωγού κάτω από μεταβαλλόμενες όρια νΑΡ, και οι δύο σκιασμένα πλαίσια δείχνουν την απόδοση υπό μεταβαλλόμενες όρια δήλωση συμμόρφωσης. Το διάγραμμα δείχνει ότι (i) τη μείωση του ορίου DoC αυξάνει την ευαισθησία όλων των αγωγών, όπως υποδεικνύεται με το μπλε διακεκομμένη γραμμή? (Ii) αύξηση του ορίου νΑΡ αυξάνει την ειδικότητα με μια ελαφρά μείωση στην ευαισθησία, όπως αναφέρεται (στο παράδειγμα του BLAT + VarScan αγωγού) με την κόκκινη διακεκομμένη γραμμή? (Iii) ο αγωγός BWA-SW + SSAHA2 + Atlas-SNP2 έχει την καλύτερη απόδοση μεταξύ όλων των αγωγών σύμφωνα με δήλωση συμμόρφωσης = 3 & amp? ΝΑΡ = 0,20 κατώτατα όρια, όπως υποδεικνύεται με το κίτρινο βέλος. Ο αγωγός Roche υποδεικνύεται με ένα μαύρο σχήμα διαμαντιού δεδομένου ότι καμία αλλαγή των παραμέτρων έγιναν σε αυτό, και SAMTools SSAHA2 + SAMTools και BWA-SW + αγωγών ήταν γκρι χρώμα δεδομένου ότι δεν αλλάζει το όριο νΑΡ έγιναν σε αυτές. (Β) Ο συντελεστής συσχέτισης Matthews για κάθε αγωγού παρουσιάζεται για την βέλτιστη απόδοση του εν λόγω αγωγού (Πίνακας S1). Είναι ενδιαφέρον να σημειωθεί ότι η βέλτιστη απόδοση όλων των αγωγών, εκτός από τη Roche gsMapper, παρατηρήθηκε ένα όριο δήλωση συμμόρφωσης της 3.

Η

Ευρεία μεταλλάξεις σε γονίδια του καρκίνου σε 18 γραμμές Τ-κυττάρων ALL και 15 T-Όλα τα δείγματα των ασθενών

καρκίνου

Εμείς εφαρμοστεί η βελτιστοποιημένη αγωγού καθορίζεται πιο πάνω, που αποτελείται από τον συνδυασμό SSAHA2 + BWA-ΝΔ για τη χαρτογράφηση ανάγνωσης, και Atlas-SNP2 για παραλλαγή κλήση, να εντοπίσει μεταλλάξεις σε ένα πάνελ 58 » γονίδια «σε 18 Τ-όλες τις κυτταρικές σειρές και 15 πρωτοβάθμια T-όλα τα δείγματα ασθενών. Αυτό το σύνολο των γονιδίων αποτελείται από 13 οδηγούς Τ-ALL (Σχήμα 2.A.I) και 45 άλλα γονίδια που εμπλέκονται σε μια ποικιλία καρκίνων (Σχήμα 2.A.II). Όλα αυτά τα γονίδια είναι παρόντα στην Απογραφή [2] βάση δεδομένων των γονιδίων του καρκίνου εκτός από τα πρόσφατα ανακαλύφθηκε καρκινικά γονίδια ATOH1 και PHF6 [13], [14]. Δεδομένου ότι οι PHF6 μεταλλάξεις που εμπλέκονται στην T-ALL προσθέσαμε PHF6 στη λίστα των Τ-όλους τους οδηγούς.

Κωδικοποίηση μεταλλάξεις σε γνωστά γονίδια του καρκίνου (Α) και υποψήφια γονίδια (Β) υποδεικνύεται με διαφορετικούς κωδικούς χρωμάτων. Πίνακας Α περαιτέρω υποδιαιρείται σε γονίδια (Ι), που είναι γνωστό ότι είναι οδηγοί σε Τ-ALL, και (ii) τα γονίδια τα οποία έχουν επαναλαμβανόμενες σωματικές μεταλλάξεις σε διάφορους ανθρώπινους καρκίνους. Οι κυτταρικές σειρές που βρίσκεται στα αριστερά του πίνακα, και τα δείγματα των ασθενών που βρίσκονται προς τα δεξιά. Τα γονίδια που κατατάσσονται ανάλογα με τη συχνότητα των μεταλλάξεων της πρωτεΐνης μεταβολή στα δείγματα ασθενών.

Η

Ακολουθία διαβάζει χαρτογραφήθηκαν σε ολόκληρο το γονιδίωμα αναφοράς και εκείνων που διαβάζει ότι ο χάρτης με τα επιλεγμένα γονίδια διατηρούνται. Αυτό είχε ως αποτέλεσμα το 36% των αναφέρει ότι χάρτης με τις αλληλουχίες-στόχους κατά μέσο όρο, με μία μέση απόδοση 24.2X και 16.3X για κυτταρικές γραμμές και δείγματα ασθενούς, αντίστοιχα. Η ανάλυση των δεδομένων αλληλουχίας αποκάλυψε ότι εξώνια με πολύ χαμηλή κάλυψη είχαν σημαντικά υψηλότερο GC-περιεχόμενο σε σύγκριση με τα εξώνια με υψηλότερες κάλυψη (p-value 2.2e-16), ένα εύρημα σύμφωνο με μια προηγουμένως δημοσιευμένη μελέτη [15] (Εικόνα S2 ). Από τους 1565 εξώνια στοχευμένες σε αυτή τη μελέτη, 18 εξόνια είχαν καμία κάλυψη στις κυτταρικές γραμμές ή στα δείγματα ασθενούς (που αντιστοιχούν σε 8,710 bps)? και 15 εξώνια δεν είχε κάλυψη στα δείγματα ασθενών μόνο (που αντιστοιχούν σε 5197 bps). Κατά μέσο όρο, 94% και 86% των στοχευμένων εξώνια φτάσει σε ένα μέσο κάλυψης ίσο ή άνω του 3 για τις κυτταρικές σειρές και τα δείγματα των ασθενών, αντίστοιχα.

Διακύμανση καλώντας οδήγησαν σε 836 διαφορετικές παραλλαγές και μόνο νουκλεοτίδιο (SNVs) σε γνωστά γονίδια του καρκίνου σε όλα τα 33 δείγματα. Οι κυτταρικές σειρές είχαν σημαντικά περισσότερες SNVs στα γονίδια του καρκίνου από τα δείγματα των ασθενών (p-value & lt? 0.001)? κατά μέσο όρο, εντοπίστηκαν 153 SNVs ανά κυτταρική σειρά και 117 ανά δείγμα ασθενών. 56% της προβλεπόμενης SNVs αναφέρθηκαν σε dbSNP (https://www.ncbi.nlm.nih.gov/projects/SNP/) ή στο σχέδιο 1.000 Γονιδιώματα (https://www.1000genomes.org/) και ήταν αποκλείονται από περαιτέρω ανάλυση, ενώ τα υπόλοιπα 368 SNVs (Πίνακας S3) επηρεάζονται 55 από τα 58 αλληλουχία των γονιδίων του καρκίνου, κυρίως στα εξώνια (58,4%) και αμετάφραστες περιοχές (23,9%). Επιπλέον, υπήρχαν 8 SNVs επηρεάζουν θέσεις ματίσματος. Από τους εξονικούς SNVs, 14 αποτέλεσμα στην αύξηση ενός κωδικονίου στοπ (που ονομάζεται «να σταματήσει να αποκτήσουν» SNVs), 140 είναι μη συνώνυμες και τα υπόλοιπα 61 είναι συνώνυμα κωδικοποίησης παραλλαγές.

Για να επικυρώσετε τις μεταλλάξεις που βρέθηκαν στο κελί γραμμές, συγκρίναμε τα αποτελέσματά μας με μεταλλάξεις που καθορίζεται από το σχέδιο Cancer Cell γραμμής [16], το οποίο περιέχει έντεκα από 18 κυτταρικές γραμμές μας. Από τις 35 ογκογόνους μεταλλάξεις σημείου που βρέθηκαν στο έργο γραμμή Cancer Cell (που προσδιορίζεται με τριχοειδή αλληλούχιση) στα γονίδια που περιλαμβάνονται στον πίνακα μας, 31 ανακτήθηκαν από το αυτοματοποιημένο νέου αλληλούχιση επί Roche /454 χρησιμοποιώντας το SSAHA2 + BWA-SW + Atlas -SNP2 αγωγού ανάλυση, που αντιστοιχεί σε ποσοστό ανάκτησης 88,5% (Πίνακας S4). Σημειώστε ότι gsMapper ανακτηθεί 30 μεταλλάξεις από τα 35, με αποτέλεσμα ένα ποσοστό είσπραξης των 85,7%. Οι μεταλλάξεις που απείχαν από τη Roche /454 αλληλούχισης είτε λόγω της χαμηλής κάλυψης σε αυτές τις θέσεις (σε δύο από τα τέσσερα αναπάντητες μεταλλάξεις, τόσο σε Notch 1), ή σε χαμηλής ποιότητας παραλλαγή (μία μετάλλαξη ΤΡ53), ή σε σφάλματα προσδιορισμού αλληλουχίας (ένα μετάλλαξη Notch1 καλύπτεται κατά 10 διαβάζει, καμία από τις οποίες περιέχει το αλληλόμορφο παραλλαγής που αναφέρθηκαν από το έργο γραμμή Cancer Cell). Όσον αφορά την ειδικότητα, οι δύο αγωγοί απέδωσε καλά, για παράδειγμα το γονίδιο FBXW7 για την οποία βρίσκουμε ένα σημείο της πρωτεΐνης αλλάζοντας μετάλλαξη ακριβώς υπό τις ίδιες πέντε κυτταρικές σειρές, όπως το έργο γραμμή Cancer Cell (από τα έντεκα κοινών κυτταρικές σειρές). Εν κατακλείδι, η αυτοματοποιημένη εκ νέου ακολουθίας χρησιμοποιώντας Roche /454, είτε με τον αγωγό gsMapper ή του αγωγού SSAHA2 + BWA-SW + Atlas-SNP2, είναι σε πολύ μεγάλο βαθμό σε συμφωνία με μεταλλάξεις που βρέθηκαν με τριχοειδή αλληλουχίας.

Δεκατρείς από τις 58 καρκινικών γονιδίων έχουν συνδεθεί ειδικά με T-ALL, και προσδιορίσαμε πρωτεΐνη τροποποίηση μεταλλάξεις σε τουλάχιστον ένα από αυτά τα γονίδια σε όλες τις κυτταρικές σειρές και σε 10 δείγματα ασθενών (Σχήμα 2.AI). Από τα άλλα γονίδια 45 καρκίνος, 36 γονίδια μεταλλάχθηκαν (Σχήμα 2.A.II), εκ των οποίων 25 μεταλλάχθηκαν σε τουλάχιστον δύο δείγματα (κυτταρική γραμμή ή ασθενή). Τα γονίδια με τις περισσότερες μεταλλάξεις σε Τ-όλες τις κυτταρικές σειρές είναι Notch 1 (μη-συνώνυμη μετάλλαξη σε 9/18 κυτταρικές σειρές), TP53 (10/18), FBXW7 (7/18), και οι ΕΚΑ (5/18). Αυτά έχουν επίσης μεταλλάξεις σε δείγματα ασθενών, εκτός ΤΡ53, γεγονός που υποδηλώνει ότι μπορεί να είναι ευκολότερο να ληφθούν κυτταρικές σειρές από δείγματα με μετάλλαξη ΤΡ53 ή ΤΡ53 ότι μεταλλάξεις αποκτώνται σε κυτταρική καλλιέργεια [17].

Ταυτοποίηση Περιοδική JAK3 Μεταλλάξεις T-ALL

επόμενο προσδιοριστεί αν θα μπορούσαν να εντοπιστούν μεταλλάξεις στα γονίδια του καρκίνου που ήταν προηγουμένως δεν συνδέονται με T-ALL. Βρήκαμε πολλές τέτοιες μεταλλάξεις σε ΟΛΑ τα Τ κυτταρικές σειρές (Σχήμα 2.A.II), αλλά η απουσία τους στα δείγματα ασθενών αμφισβητεί τη σημασία τους για την παθογένεση της T-ALL.

Έχουμε εντοπίσει αρκετές μεταλλάξεις στο JAK2 και JAK3 στις δύο κυτταρικές σειρές και δείγματα ασθενών. Όλες οι κινάσες JAK, εκτός ΤΥΚ2 (βλέπε παρακάτω), είναι γνωστές ογκογονίδια στη λευχαιμία και ενεργοποίηση μεταλλάξεων και μετατοπίσεων που επηρεάζουν JAK1, JAK2 και JAK3 περιγράφηκαν σε πολλαπλές, κυρίως μυελοειδή, αιματολογικές κακοήθειες [18]. Μέχρι πρόσφατα, JAK1 ήταν το μόνο μέλος της οικογένειας JAK στην οποία έχουν σημειακές μεταλλάξεις έχουν περιγραφεί σε T-ALL [19]. Ωστόσο, σε ένα πρόσφατο άρθρο JAK3 κέρδος-of-λειτουργία μεταλλάξεις που περιγράφονται σε Τ-ALL του Elliott et al. [20]. Στη μελέτη μας, έχουμε προσδιορίσει 3 μη συνώνυμες κωδικοποίησης μεταλλάξεις σε 2 ασθενείς για JAK2 (TLE37 ασθενής είχε δύο μεταλλάξεις) και 4 μη συνώνυμες κωδικοποίησης μεταλλάξεις σε 1 ασθενή και 2 κυτταρικές σειρές (Supt1 κυτταρική σειρά είχε δύο μεταλλάξεις) για JAK3. (Πίνακας S3). αλληλουχίας Sanger επιβεβαίωσε ένα JAK2 και όλες τις παραλλαγές JAK3 (Πίνακας S5, Σχήμα 3.A-Β). Συμπληρωματικά αλληλούχιση Sanger όλων των εξωνίων των γονιδίων JAK2 και JAK3 σε 31 επιπλέον Τ-ΟΛΛ προσδιορίζονται 1 επιπλέον παραλλαγή JAK2 και 2 επιπλέον παραλλαγές JAK3 (Πίνακας S5, Σχήμα 3.A-Β). Έτσι, συνολικά, εντοπίσαμε μεταλλάξεις JAK2 σε 2 από 46 (4%) Τ-όλα τα δείγματα και 0 του 18 Τ-όλες τις κυτταρικές σειρές και οι μεταλλάξεις JAK3 σε 2 από 46 (4%) Τ-όλα τα δείγματα και 2 του 18 Τ-όλες τις κυτταρικές σειρές (Πίνακας S5, Εικόνα 3.AB). Για JAK2, και οι δύο μεταλλάξεις ήταν επίσης παρόντες σε ένα αντίστοιχο δείγμα ύφεση, ενώ όλες οι μεταλλάξεις ασθενή JAK3 ήταν σωματικά αποκτήθηκαν. Είναι ενδιαφέρον, TLE44 ασθενής έδειξε 2 μεταλλάξεις σωματικών σε ΙΑΚ3, δηλαδή A572T και M511I, τα οποία ανιχνεύθηκαν στην ίδια αλληλόμορφο (τα δεδομένα δεν παρουσιάζονται). Επιπλέον, η μετάλλαξη M511I έχει ανιχνευθεί πριν στην AML και υπερέκφραση αυτού του μεταλλαγμένου μετασχηματισμένων IL3 εξαρτώμενη 32D κύτταρα και επάγεται Τ-ALL σε ποντικούς [21]. Ότι η μετάλλαξη A572T δεν είχε περιγραφεί πριν, JAK3 A572 αμινοξέων βρέθηκε μεταλλαχθεί σε ένα V (μετάλλαξη A572V) σε Τ-κυττάρων λευχαιμίας, λεμφώματος Τ-κυττάρων, και AML, και αυτό A572V μεταλλαγμένη μετασχηματίζεται κυτοκίνης εξαρτώνται από αιμοποιητικά κύτταρα και επάγεται λευχαιμίας σε ποντίκια [21], [22], [23], [24].

(Α) χρωματογραφήματα αλληλουχίας Sanger που αντιστοιχεί σε επιβεβαίωσε παραλλαγές JAK2 /JAK3. (Β) δομή Τομέα των πρωτεϊνών JAK2 και JAK3 με την ένδειξη του μυθιστορήματος ανιχνεύονται παραλλαγές. Τα μη-σωματικά παραλλαγές σημειώνονται με αστερίσκο. (C) Sanger αλληλουχίες που δείχνουν τα παραδείγματα των παραλλαγών ΤΥΚ2 εντοπίσει σε Τ-όλες τις κυτταρικές σειρές ή σε δείγματα ασθενών λευχαιμία. (Δ) Σχηματική αναπαράσταση της δομής της πρωτεΐνης ΤΥΚ2 με ένδειξη όλων των νέων παραλλαγών ΤΥΚ2 ανιχνεύεται σε αυτή τη μελέτη. Τα μη-σωματικά παραλλαγές σημειώνονται με αστερίσκο.

Η

Αναγνώριση της Νέας ογκογονίδια και τα ογκοκατασταλτικά γονίδια σε Τ-ALL

Ψάχνοντας για νέα T-όλα τα γονίδια του οδηγού μπορεί να πραγματοποιείται από όλη την -exome αλληλουχίας ή άλλες προσεγγίσεις γονιδιώματος-ευρεία. Παρ ‘όλα αυτά, η Roche /454 πλατφόρμα σε συνδυασμό με σύλληψη αλληλουχία θα μπορούσε να είναι χρήσιμο σε μια προσέγγιση υποψηφίου γονιδίου. Σε στοχευμένη προσέγγιση εκ νέου προσδιορισμό της αλληλουχίας μας, 39 γονίδια που περιλαμβάνονται που δεν ήταν αιτιολογικά με τον καρκίνο, αλλά επιλέχθηκαν ως υποψήφια ογκογονίδια ή γονίδια καταστολής όγκων, λόγω της λειτουργίας τους (π.χ., κινάσες τυροσίνης και φωσφατάσες τυροσίνης) ή επειδή μέλη της οικογένειας είχαν εμπλέκονται στον καρκίνο (π.χ., ΤΥΚ2 για την οικογένεια JAK, TET1 επειδή TET2 είναι ένα γνωστό γονίδιο καρκίνου). Σχήμα 2.Β υποδεικνύει τις εξονικό και θέση ματίσματος μεταλλάξεις που παρατηρήθηκαν σε αυτά τα γονίδια και τα γονίδια κατατάχθηκαν σύμφωνα με την επανεμφάνιση των παραλλαγών αλλοίωση της πρωτεΐνης σε όλη δείγματα ασθενών.

Είναι ενδιαφέρον, 4 από τα δείγματα 15 αλληλουχία ασθενούς περιέχει μια παραλλαγή σε TET1. Η

ΤΕΤ

οικογένεια γονιδίων (

TET1

,

TET2

,

TET3

) των επιγενετικών ρυθμιστικών αρχών είναι σημαντική για τον τομέα αιματολογίας, λόγω της παρατήρησης του

TET2

μεταλλάξεις σε 10-25% των ασθενών με διάφορες ασθένειες μυελοειδή αιματολογικές [25], [26], [27]. Για να εκτιμηθεί καλύτερα η συχνότητα μετάλλαξης του

TET1

στο T-ALL, θα πραγματοποιηθεί συμπληρωματική αλληλουχίας Sanger του

TET1

σε όλες τις κυτταρικές γραμμές και δείγματα ασθενών και σε μια ομάδα 22 επιπλέον T-όλες τις περιπτώσεις . Συνολικά, αυτό οδήγησε στην ταυτοποίηση του

TET1

παραλλαγές σε 5/37 (13,5%) που αναλύθηκαν ασθενείς και σε 1/18 Τ-όλες τις κυτταρικές σειρές (Καρπασίας-45) (Πίνακας S6 και Σχήμα 4). Η σωματική κατάσταση του ανιχνεύεται

TET1

παραλλαγές επιβεβαιώθηκε για μία περίπτωση (H1297Y), όπου ένα δείγμα ύφεση ήταν διαθέσιμο. Ερευνήσαμε επίσης τις παραλλαγές στο

TET2

και

TET3

πήραν από 454 και εκτελούνται πρόσθετες αλληλουχίας Sanger για αυτά τα γονίδια.

TET2

παραλλαγές ανιχνεύθηκαν σε 2 κυτταρικές σειρές (Jurkat και KARPAS45) και ένα

TET3

παραλλαγή ανιχνεύθηκε στην κυτταρική σειρά CCRF-CEM, δεν T-Όλα τα δείγματα των ασθενών (0/46) έτρεφε απέκτησε TET2 ή TET3 μεταλλάξεις (Πίνακας S6).

(Α) Sanger χρωματογραφήματα αλληλουχίας που εκπροσωπούν confimed παραλλαγές TET1. (Β) Σχηματική αναπαράσταση της δομής της πρωτεΐνης TET1 με ένδειξη όλων των νέων παραλλαγών TET1 ανιχνεύεται σε αυτή τη μελέτη. Παραλλαγές ανιχνεύονται σε κυτταρικές σειρές που απεικονίζεται πάνω από την πρωτεΐνη TET1, παραλλαγές ανιχνεύθηκαν σε δείγματα ασθενών λευχαιμία είναι κάτω από την πρωτεΐνη TET1. Τα μη-σωματικά παραλλαγές σημειώνονται με αστερίσκο.

Η

Οι μεταλλάξεις στα γονίδια φωσφατάσης τυροσίνης, που δρουν ως αρνητικοί ρυθμιστές της σηματοδότησης της τυροσίνης, εντοπίστηκαν σε πολλά-ΟΛΕΣ Τ κυτταρικές σειρές αλλά και σε αρκετές T-ALL ασθενείς. Πρόσθετες μεταλλάξεις στα γονίδια SPRY, αρνητικοί ρυθμιστές του μονοπατιού RAS /ΜΑΡΚ, επίσης ανιχνεύθηκαν. Έχουμε εντοπίσει ένα ομόζυγο διακύμανση

SPRY3

σε ένα T-ALL δείγμα ασθενούς, και 3 μεταλλάξεις στο

SPRY4

(2 μεταλλάξεις σε κυτταρικές σειρές και 1 σωματικά απέκτησε μετάλλαξη σε ένα T-ALL δείγμα ασθενούς ). αλληλουχίας Sanger επιβεβαίωσε την παρουσία αυτών των μεταλλάξεων, αλλά δεν αποκάλυψε οποιεσδήποτε πρόσθετες μεταλλάξεις του SPRY3 /SPRY4 σε 22 επιπλέον T-όλες τις περιπτώσεις, φέρνοντας τη συχνότητα μετάλλαξης SPRY4 στο 1/37 Τ-ΟΛΛ και 2/18 Τ-όλες τις κυτταρικές σειρές (Πίνακας S7, Σχήμα 5).

(Α) Sanger χρωματογραφήματα που ακολουθεί που δείχνει επιβεβαίωσε παραλλαγές SPRY4. δομή (Β) Ο τομέας της πρωτεΐνης SPRY4 με ένδειξη της νέας ανιχνεύονται παραλλαγές.

Η

Τέλος, εντοπίζονται επίσης αρκετές μεταλλάξεις σε κινάσες της τυροσίνης (IGF1R, ΤΥΚ2, TNK1, και MST1R) και σχετίζονται πρωτεΐνες σηματοδότησης ( IRS2, SOCS3), αλλά η πλειοψηφία αυτών των μεταλλάξεων βρέθηκαν σε κυτταρικές σειρές, ενώ οι πρωτογενείς δείγματα ασθενών παρουσίασαν πολύ χαμηλότερη συχνότητα αυτών των μεταλλάξεων. Η πιο συχνά μεταλλαγμένο γονίδιο σε όλες τις κυτταρικές γραμμές και δείγματα ασθενούς ήταν το υπόστρωμα υποδοχέα ινσουλίνης 2 (IRS2) γονίδιο, που δείχνει μη συνώνυμες μεταλλάξεις κωδικοποίησης σε 6 κυτταρικές σειρές και σε ένα δείγμα ασθενούς. Επίσης, συχνά μεταλλάσσεται ήταν ΤΥΚ2, με μεταλλάξεις που παρατηρήθηκαν σε 6 κυτταρικές σειρές? μία παραλλαγή stop-κέρδος και 5 μη συνώνυμες παραλλαγές κωδικοποίησης. Παρά το γεγονός ότι κανένα από τα δείγματα 15 ασθενών πραγματοποιήθηκε μια μετάλλαξη στο ΤΥΚ2, θα μπορούσε να είναι παρούσα σε χαμηλή συχνότητα σε ασθενείς. Για να δοκιμάσετε αυτό, πραγματοποιήθηκε συμπληρωματική αλληλουχία των ΤΥΚ2 σε 93 T-ALL, 54 AML και 53 Β-όλα τα δείγματα ασθενών. Παρά την υψηλή συχνότητα των διακυμάνσεων ΤΥΚ2 σε Τ-όλες τις κυτταρικές σειρές, οι παραλλαγές ΤΥΚ2 εντοπίστηκαν μόνο σε 2 από 93 T-ALL και 1 των 54 περιπτώσεις AML (Πίνακας S5, Εικόνα 3.CD).

Στοιχεία για η συσσώρευση των ειδικών μεταλλάξεων κατά τη διάρκεια in vitro καλλιέργεια του Τ-όλες τις κυτταρικές σειρές

η συχνότητα μετάλλαξης των ΤΥΚ2 σε Τ-όλες τις κυτταρικές σειρές σε σύγκριση με πρωτογενή Τ-Όλα τα δείγματα ήταν σημαντικά διαφορετικές, με υψηλό ρυθμό μετάλλαξης της ΤΥΚ2 σε κυτταρικές σειρές, αλλά μόνο ένα χαμηλό ποσοστό μετάλλαξης σε πρωτογενή δείγματα. Για να προσδιοριστεί εάν αυτό μπορεί να οφείλεται στη συσσώρευση μεταλλάξεων ΤΥΚ2 κατά την διάρκεια καλλιέργειας των κυττάρων, εμείς αλληλουχία ΤΥΚ2 σε διαφορετικούς κλώνους της ίδιας-ALL Τ κυτταρική γραμμή (Πίνακας 1). Για την κυτταρική γραμμή CCRF-CEM, λάβαμε 5 διαφορετικούς υποκλώνους που συλλέχθηκαν κατά τη διάρκεια των χρόνων. Είναι ενδιαφέρον ότι, ενώ η παραλλαγή R1027H ήταν παρούσα σε όλα τα δείγματα που αναλύθηκαν, η παραλλαγή A35V ήταν παρούσα μόνο σε γραμμή μας και σε ένα επιπλέον κλώνο CCRF-CEM. Στην κυτταρική σειρά Karpas-45, η διακύμανση Q830 * ήταν παρόν σε 3 διαφορετικούς κλώνους. Αντίθετα, μόνο σειρά Jurkat μας περιείχε τη μετάλλαξη C192Y, ενώ αυτό ήταν απούσα σε 2 άλλοι κλώνοι διαθέσιμο σε DSMZ (www.dsmz.de) (Πίνακας 1). Αυτά τα δεδομένα προτείνουν ότι τουλάχιστον μερικές μεταλλάξεις ΤΥΚ2 αποκτήθηκαν κατά τη διάρκεια παρατεταμένης καλλιέργειας των κυττάρων, και έτσι είναι απίθανο να αντιπροσωπεύουν ένα ογκογόνο εκδήλωση σημαντική για την ανάπτυξη της λευχαιμίας

in vivo

. Επιπλέον, η ανάλυση των μετασχηματισμού ιδιότητες αυτών των μεταλλάξεων σε κύτταρα Ba /F3 δεν μπόρεσε να εντοπίσει σημαντικές διαφορές μεταξύ άγριου τύπου ΤΥΚ2 και παραλλαγών ΤΥΚ2 ανιχνεύθηκαν σε κυτταρικές γραμμές ή σε δείγματα ασθενών και δεν θα μπορούσε να δείξει οποιαδήποτε αυτοφωσφορυλίωση ΤΥΚ2 σε Τ-όλες τις κυτταρικές γραμμές που περιέχουν παραλλαγές ΤΥΚ2 (τα δεδομένα δεν παρουσιάζονται).

Αυτά τα δεδομένα επιβεβαιώνουν σημαντικές διαφορές μεταξύ των κυτταρικών γραμμών και των δειγμάτων πρωτογενούς ασθενή, η οποία μπορεί να αντικατοπτρίζει τη συσσώρευση μεταλλάξεων κατά τη διάρκεια

in vitro

κυτταρικής καλλιέργειας.

Συζήτηση

Έχουμε αποδείξει ότι η προσέγγιση στοχεύει αλληλουχίας με μια βελτιστοποιημένη ρύθμιση ανάλυσης μπορεί να χρησιμοποιηθεί για τον εντοπισμό ογκογόνων μεταλλάξεων. Αυτή η προσέγγιση θα μπορούσε να είναι ιδιαίτερου ενδιαφέροντος για την ανίχνευση σημειακών μεταλλάξεων σε μία σειρά σημαντικών ογκογονιδίων και καταστολείς όγκων ή άλλων σχετικών γονιδίων ασθενειών για τη διάγνωση, την πρόβλεψη πρόγνωση ή επιλογή θεραπείας. Τέτοιες πληροφορίες θα μπορούσαν να παραχθούν σε σχετικά σύντομο χρονικό διάστημα και με πρωτοφανή λεπτομέρεια. Ένα από τα σημαντικότερα πλεονεκτήματα έναντι της κλασικής αλληλούχισης Sanger είναι η υψηλότερη απόδοση αυτής της μεθόδου επιτρέπει ότι όλα τα εξώνια του γονιδίου ενός συνόλου αυτού του μεγέθους μπορεί εύκολα να αλληλουχηθεί. Ως εκ τούτου, η πλήρης πληροφορία αυτή παρέχεται και μπορεί να ανιχνευθεί σπάνιες παραλλαγές ή ακόμη και προηγουμένως άγνωστες μεταλλάξεις σε ένα συγκεκριμένο γονίδιο. Πράγματι, από τα 160 εξονικό και θέση ματίσματος παραλλαγές (με εξαίρεση τα 61 συνώνυμο παραλλαγές) ανιχνεύθηκαν στις κυτταρικές γραμμές και δείγματα ασθενών σε ολόκληρη την οθόνη μας τα γονίδια του καρκίνου, μόνο 40 βρίσκονται στην κοσμική βάση δεδομένων [16], εκ των οποίων 24 συνδέονται ειδικά με T-ALL. Αν και για μερικά γονίδια υφίστανται μετάλλαξη hotspots (π.χ. το KRAS G12, G13, Q61 μεταλλάξεις), η λειτουργία των περισσοτέρων γονιδίων καρκίνου μπορεί να επηρεαστεί από μεταλλάξεις σε διάφορες θέσεις. Ως εκ τούτου, για τα περισσότερα γονίδια του καρκίνου του χρειάζεται ολόκληρη η αλληλουχία κωδικοποίησης να είναι εκ νέου προσδιορισμό αλληλουχίας, και για αυτό η τεχνολογία Roche /454 είναι ιδιαίτερα κατάλληλη

Για την ανίχνευση μεταλλάξεων χρησιμοποιώντας αλληλούχιση επόμενης γενιάς -. Είτε να αντικαταστήσουν ή να συμπληρώσουν το μοριακό διάγνωση – είναι τυποποιημένες αγωγών βιοπληροφορικής ανάλυσης με πολύ μεγάλη ακρίβεια που απαιτείται. Μια τέτοια αγωγός αποτελείται από έναν αλγόριθμο χαρτογράφησης για την ευθυγράμμιση η αλληλουχία διαβάζει στο γονιδίωμα αναφοράς, μια παραλλαγή καλώντας αλγόριθμο για να προσδιορίσει τις διαφορές μεταξύ του δείγματος και της αναφοράς, και έναν αλγόριθμο φιλτραρίσματος παραλλαγή.

Συγκρίναμε πολλαπλούς συνδυασμούς χαρτογράφησης και παραλλαγή καλώντας αλγόριθμους, και διαπίστωσε ότι ο συνδυασμός δύο χαρτογράφους, δηλαδή SSAHA-2 και BWA-ΝΔ, που ακολουθείται από Atlas-SNP2 δίνει τα πιο ακριβή αποτελέσματα ανίχνευσης παραλλαγή. Προσθέτοντας δύο αλγορίθμους χαρτογράφησης φιλτράρει ψευδώς θετικά παραλλαγή προβλέψεις λόγω erronous χαρτογράφηση, και το μοντέλο σφάλμα Atlas-SNP2 επιτρέπει την εξάλειψη του αναφέρει ότι έχουν πολλαπλές καλύτερα παιχνίδια στο γονιδίωμα αναφοράς. Βρήκαμε επίσης ότι επιπλέον φίλτρα δεδομένων για το βάθος της κάλυψης και την παραλλαγή της συχνότητας αλληλόμορφου αυξηθεί περαιτέρω τόσο την ευαισθησία και την ειδικότητα της ανίχνευσης μεταβολής.

Συναντήσαμε αρκετούς τεχνικούς περιορισμούς κατά την ανάλυση των δεδομένων. Πρώτον, θα έπρεπε να αφαιρέσει διπλές αναγνώσεις που εισήγαγε μέτρα για την ενίσχυση PCR κατά τη διάρκεια της προετοιμασίας του δείγματος αφού έχουμε παρατηρήσει αυτά προκαλούν ψευδώς θετικά predicitons SNV. Δεύτερον, θα μπορούσαμε να προβλέψουμε μόνο SNVs, ενώ indels (μικρές ενθέσεις και εξαλείψεις) έπρεπε να αγνοηθεί δεδομένου ότι η εργασία μας (δεδομένα που δεν φαίνονται) και προηγούμενες μελέτες δείχνουν ότι 454 διαβάζει δεν είναι κατάλληλα για την ανίχνευση Indel λόγω του μεγάλου ποσού των ψευδώς θετικών αποτελεσμάτων [4]. Σε ένα διαγνωστικό περιβάλλον, όπου επιδιώκεται 100% ειδικότητα, είναι κρίσιμο να εντοπιστούν γονίδια ή περιοχές σε γονίδια που είναι επιρρεπείς σε απόκτηση indels και να σχεδιάσει εναλλακτικές δοκιμασίες για να τα ερευνήσει. Ομοίως, γονιδιωματική ανακατατάξεις είναι σημαντικές αιτίες της T-ALL αλλά απαιτούν συμπληρωματικές τεχνολογίες ανίχνευσης.

Πιστεύουμε ότι με τη χρήση της τεχνολογίας μεγάλη διαβάσει αλληλουχίας, όπως η Roche /454 ή το πιο πρόσφατο Pacific Bioscience, προσφέρει ιδιαίτερα πλεονεκτήματα σε σχέση με τόσο ευαισθησία και ειδικότητα της ανίχνευσης παραλλαγής. Πρώτον, μακρύ διαβάστε ευθυγράμμιση επιτρέπει την καλύτερη διάκριση μεταξύ πολύ παρόμοια γονίδια στο γονιδίωμα. Για παράδειγμα, ένα από τα γονίδια που επαν-αλληλουχία ήταν Notch 1, ένα γονίδιο με πολλαπλά ομόλογα (δηλαδή Notch2, NOTCH2Nl, NOTCH3 και NOTCH4). Ωστόσο, δεν παρατηρήθηκε διαβάζει χαρτογράφηση σε οποιαδήποτε από αυτές ομόλογα, παρόλο που χαρτογραφείται ο διαβάζει σε ολόκληρο το γονιδίωμα. Αυτό δείχνει ότι τόσο η σύλληψη αλληλουχία και η χαρτογράφηση ήταν ειδικά. Από την άλλη πλευρά, συναντήσαμε επίσης ένα παράδειγμα όπου η σύλληψη αλληλουχία δεν ήταν ειδική. Δηλαδή, το γονίδιο PMS2 είναι μία από τις στοχευμένες γονιδίων στη μελέτη μας, όμως παρατηρήσαμε διαβάζει χαρτογράφηση στο ψευδογονίδιο PMS2, PMS2CL, το οποίο περιέχει τα πρώτα έξι εξόνια του γονιδίου PMS2. Χάρη στη χρήση μακρών διαβάζει, αυτό δεν προκαλεί προβλήματα για την ανίχνευση παραλλαγή επειδή για κάθε γονίδιο το αντίστοιχο διαβάζει χαρτογραφηθεί

μοναδικά

στο σωστό γονίδιο, είτε PMS2 ή PMS2CL. Σημειώστε ότι η τεχνολογία δέσμευσης παρέχει επιπλέον νύξεις για να επιτευχθεί μεγαλύτερη ειδικότητα, διότι δεν είναι μόνο τα εξώνια που καλύπτονται από τη σύλληψη, αλλά και τα συνοδευτικά ιντρονικές περιοχές.

You must be logged into post a comment.