PLoS One: Μετάλλαξη Discovery στις περιφέρειες της Τμηματική Cancer Genome Ενισχύσεις με Conan-SNV: Ένα μείγμα Μοντέλο για την επόμενη γενιά αλληλουχίας των Όγκων


Αφηρημένο

αλληλούχισης επόμενης γενιάς έχει πλέον ενεργοποιηθεί μια οικονομικά αποδοτική απαρίθμηση του πλήρους μετάλλαξης συμπλήρωμα του γονιδιώματος στον όγκο συγκεκριμένα μόνο παραλλαγές νουκλεοτιδίου (SNVs). Οι πιο πρόσφατες υπολογιστικών και στατιστικών μοντέλων για την ανάλυση δεδομένων αλληλουχίας επόμενη γενιά, ωστόσο, δεν ευθύνονται για καρκίνο συγκεκριμένες βιολογικές ιδιότητες, συμπεριλαμβανομένου του αριθμού αλλαγές σωματικά αντίγραφο τμηματική (προσαρμογείς CNA) -που απαιτούν ειδική μεταχείριση των δεδομένων. Εδώ παρουσιάζουμε Conan-SNV (Copy Number σχολιασμένη SNV): ένας νέος αλγόριθμος για τη συναγωγή του ενιαίου παραλλαγές νουκλεοτιδίου (SNVs) που επικαλύπτονται αριθμό αντιγράφων αλλαγές. Η μέθοδος βασίζεται στην μοντελοποίηση την ιδέα ότι γονιδιωματικές περιοχές της τμηματικής αντιγραφή και ενίσχυση επάγουν μια παρατεταμένη χώρο γονότυπος όπου ένα υποσύνολο των γονότυπων θα εμφανίζουν βαριά λοξή αλληλικές κατανομές σε SNVs (και συνεπώς τα καθιστούν μη ανιχνεύσιμα με μεθόδους που αναλαμβάνουν διπλοειδίας). Έχουμε εισαγάγει την έννοια της μοντελοποίησης αλληλομόρφων μετράει από δεδομένα αλληλουχίας χρησιμοποιώντας ένα πάνελ μοντέλα Διωνυμικής μίγματος, όπου ο αριθμός των μειγμάτων για μια δεδομένη θέση στο γονιδίωμα έχει ενημερωθεί από μια διακριτή κατάσταση αριθμό αντιγράφων δίνεται ως είσοδος. Εφαρμόσαμε Κόναν-SNV σε ένα προηγουμένως δημοσιευθεί ολόκληρο το γονιδίωμα σύνολο δεδομένων κυνηγετικό όπλο που λαμβάνονται από μια λοβιακή καρκίνο του μαστού και να δείξει ότι είναι σε θέση να ανακαλύψει 21 πειραματικά επικυρώνεται σωματικά μη συνώνυμες μεταλλάξεις σε ένα lobular γονιδιώματος του καρκίνου του μαστού που δεν ανιχνεύθηκαν χρησιμοποιώντας τον αριθμό αντιγράφων αναίσθητη αλγόριθμοι ανίχνευσης SNV. Σημαντικά, η ανάλυση ROC δείχνει ότι η αυξημένη ευαισθησία του Conan-SNV δεν οδηγεί σε δυσανάλογη απώλεια ειδικότητας. Αυτό υποστηρίχθηκε επίσης από την ανάλυση της μια πρόσφατα δημοσιευμένη γονιδίωμα λεμφώματος με μια σχετικά ήρεμη καρυότυπο, όπου Conan-SNV έδειξε παρόμοια αποτελέσματα με άλλους καλούντες εκτός από τις περιοχές του κέρδους αριθμού αντιγράφων όπου παρέχεται αυξημένη ευαισθησία. Τα αποτελέσματά μας δείχνουν ότι το γονιδίωμά ασταθείς όγκους, αριθμός αντιγράφων σχολιασμό για την ανίχνευση SNV θα είναι κρίσιμης σημασίας για να χαρακτηρίσει πλήρως την μεταλλάξεων τοπίο των γονιδιωμάτων καρκίνο

Παράθεση:. Crisan Α, Γκόγια R, Ha G, Ding J, Prentice LM , Oloumi A, et al. (2012) Μετάλλαξη Discovery στις περιφέρειες της Τμηματική Cancer Genome Ενισχύσεις με Conan-SNV: Ένα μείγμα Μοντέλο για την επόμενη γενιά αλληλουχίας των όγκων. PLoS ONE 7 (8): e41551. doi: 10.1371 /journal.pone.0041551

Συντάκτης: Τσαντ Creighton, Baylor College of Medicine, Ηνωμένες Πολιτείες της Αμερικής

Ελήφθη: 30 Ιουνίου, 2011? Αποδεκτές: 27 Ιουν 2012? Δημοσιεύθηκε: 16 Αύγ 2012

Copyright: © Crisan et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Αυτό το έργο χρηματοδοτήθηκε από την καναδική μαστού Ίδρυμα Καρκίνου (υποτροφία για SPS), και τις καναδικές Ινστιτούτα του Πανεπιστημίου Υγείας Ερευνών της βρετανικής Κολομβίας /Simon Fraser University Βιοπληροφορική πρόγραμμα κατάρτισης (υποτροφία για AC). Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

οι πρόσφατες εξελίξεις στην μαζικά παράλληλη γονιδίωμα μικρής διαβάσετε μεθόδους αλληλούχισης (το λεγόμενο αλληλουχίας επόμενης γενιάς (NGS)) έχουν τοποθετηθεί ο στόχος της πλήρους οριοθέτησης των τοπίων γονιδιώματος του καρκίνου σε μονοψήφιους ανάλυση νουκλεοτιδίων στο πρακτικό απόσταση. Οι νέες μέθοδοι για την ανάλυση των δεδομένων μικρής διαβάσει ακολουθία που απαιτείται, ωστόσο, ιδίως εκείνων που είναι ικανά να αντιμετωπίσουν τις πολύπλοκες γονιδιωματική τοπία των όγκων. γονιδιώματα του καρκίνου υφίστανται διάφορες μορφές σωματικών εκτροπή, συμπεριλαμβανομένων των ενιαίων μεταλλάξεις νουκλεοτιδίων, μεταθέσεις, συγχωνεύσεις γονιδίων, διαγραφές, αναστροφές και τον αριθμό αντιγράφων γονιδιώματος τμηματική αλλοιώσεις (προσαρμογείς CNA). Πολλαπλές τύπους σωματικών εκτροπή αναφερθεί ότι εμφανίζεται μαζί: για παράδειγμα, Kadota et al. [1] που παρατηρήθηκε επαναλαμβανόμενες μεταλλάξεις στο

PIK3CA

στον καρκίνο του μαστού με αλληλόμορφο ειδικές ενισχύσεις του μεταλλαγμένου αλληλόμορφου στους ίδιους όγκους και πρότεινε ότι

PIK3CA

σημειακές μεταλλάξεις με ταυτόχρονη ενίσχυση CNA οδήγησε σε συνεργιστικές επιδράσεις ογκογόνο . Παρομοίως, Laframboise et al. [2] έδειξε αλληλόμορφο ειδική ενίσχυση των

EGFR

μεταλλαγμένα αλληλόμορφα σε ένα πνεύμονα καρκινική κυτταρική σειρά? παραδείγματα της ενίσχυσης συνυπάρχουσες με σωματικές μεταλλάξεις στο

MYC

[3],

HRAS

[4], και

MET

[5] έχουν επίσης παρατηρηθεί. Η συνύπαρξη του ενιαίου παραλλαγές νουκλεοτιδίου στις περιοχές της τμηματικής ενίσχυση αριθμού αντιγράφων θέτει ειδικά προβλήματα, διότι άγνωστος μίγματα αφθονίες αλληλόμορφου θα μπορούσε να προκύψει από την διαδικασία της ενίσχυσης τμηματικής ή /και μετέπειτα επιλογή, σε ορισμένες περιπτώσεις συγχητικές ερμηνεία. Αυτό συμβαίνει επειδή τα μίγματα των αλληλόμορφων σε οποιαδήποτε θέση μπορεί να είναι ασύμμετρη, με αποτέλεσμα μια αναχώρηση από τη θεωρητική συχνότητα (0,5) για ετερόζυγη παραλλαγές αναμένονται σε διπλοειδή γονιδιώματα. Το Σχήμα 1 δείχνει ένα παράδειγμα από το χρωμόσωμα 19 του γονιδιώματος λοβιακό καρκίνωμα μαστού αναφερόμενη στο Shah et al. [6] και απεικονίζει μια ασυμμετρία στην συχνότητα αλληλόμορφων μακριά από ετεροζυγωτίας οφείλεται σε αλληλόμορφο-ειδική ενίσχυση αριθμού αντιγράφων σε 19q. Τόσο η ανάλυση συχνότητας Β-αλληλόμορφο στην ανάλυση των δεδομένων συστοιχίας και αναλογία αλληλικές στα δεδομένα NGS υποστηρίζουν ένα μονο-αλληλόμορφης ενίσχυσης επί 19q σε αυτό το γονιδίωμα. Αναφέρουμε σε αυτό το χαρτί που αυτή η εκδήλωση φιλοξενεί 7 συν-υπάρχουσες μεταλλάξεις σωματικών (βλέπε αποτελέσματα) στα γονίδια (σχολιασμένο από την karyogram) που είναι μη ανιχνεύσιμα με αναλυτικές μεθόδους που αναλαμβάνουν διπλοειδίας. Ακριβείς και ευαίσθητες μεθόδους παραλλαγή καλώντας μπορεί, επομένως, να απαιτούν εννοιολογική συμπερίληψη συνυπάρχοντα αριθμού αντιγράφων τμηματική παραλλαγές (σωματικά ή βλαστική) στην ερμηνεία των μετρούμενων αλληλόμορφο συχνότητες από τα δεδομένα NGS. συστοιχίες γονοτυπική υψηλής πυκνότητας έχουν επιτρέψει για την ποσοτικοποίηση των συγκεκριμένων αλληλόμορφων CNAs ενσωματώνοντας αριθμό αντιγράφων με αλληλόμορφη γονότυπο. Αλγόριθμοι όπως QuantiSNP [7], Βανίλα Άις [8], Birdsuite [9], PennCNV [10] και ΠΙΚ-ΝΙΚ [11] μοντέλο αλληλόμορφο-ειδική προσαρμογείς CNA με την επέκταση του κράτους γονότυπο χώρο από τα συμβατικά τρία διπλοειδή γονότυπους: αα (ομόζυγο για τα μεγάλα αλληλόμορφο), αβ (ετερόζυγη) και ββ (ομόζυγο για ήσσονος σημασίας αλληλόμορφο). Για ενισχυμένες περιοχές ο αριθμός των πιθανών γονότυπων φυσικά επέκταση, για παράδειγμα, ένα τριπλοειδή χρωμόσωμα ή τμηματική αύξηση θα μπορούσε να έχει τις ακόλουθες γονότυπους:. Παρά τις γνώσεις που αποκτήθηκαν μέσω αυτών των μεθόδων, όλα είναι τελικά περιορίζεται από την ανάλυση και το πεδίο εφαρμογής του σχεδίου διάταξης. Το πιο σημαντικό, η ανακάλυψη νέων μεταλλάξεων σωματικών σημείο δεν είναι γενικά δυνατό με τις πλατφόρμες συστοιχία. αλληλουχίας επόμενη γενιά ξεπερνά αυτούς τους περιορισμούς, δεδομένου αλληλουχίας ολόκληρο το γονιδίωμα κυνηγετικό όπλο (WGSS) μπορούν να διερευνήσουν ολόκληρο το γονιδίωμα και να αποκαλύψει σωματικές μεταλλάξεις σε τόπους που δεν καλύπτονται από συστοιχίες. Επιπλέον, η συχνότητα των αλληλομόρφων σε ένα δεδομένο δείγμα είναι ένα ψηφιακό άσκηση καταμέτρηση των οποίων το δυναμικό εύρος δεν περιορίζεται από υβριδοποίηση και η ένταση φθορισμού του κορεσμού και της ευαισθησίας περιορισμών.

Μια σωματική ενίσχυση υψηλού επιπέδου του 19q βραχίονα επιβεβαιώνεται NGS, καθώς και τα δεδομένα Affymetrix SNP6.0. Οι νέες σωματικές παραλλαγές που ήταν μη ανιχνεύσιμη με samtools παραλλαγή του καλούντος ή SNVMix τονίζεται στην karyogram. Α) και Β) να αναφέρει τον αριθμό των πρώτων καταγραφής αντιγράφων και την ένταση β αλληλόμορφο, αντίστοιχα, για την κανονική DNA (από τον ίδιο τον ασθενή) σε Affymetrix SNP 6.0 συστοιχία. Μπλε χρώμα δείχνει διπλοειδή (ουδέτερη) αντίγραφο κατάσταση αριθμό? το φωτεινότερο το χρώμα του κόκκινου το υψηλότερο επίπεδο της ενίσχυσης. Οι τρεις διακριτές ζώνες στο (Β) δείχνει την παρουσία των αλληλίων που φιλοξενούν ένα από τα τρία διπλοειδή γονότυπους: ΑΑ, ΑΒ και ΒΒ. Γ) και Δ) δείχνει μεταστατικό αριθμό αντιγράφων του όγκου και b ένταση αλληλόμορφο αντίστοιχα. Η ενίσχυση υψηλού επιπέδου σχετικά με το 19q βραχίονα συνοδεύεται από Β αλληλόμορφο εντάσεις που δείχνουν την απουσία της μπάντας ΑΒ ετερόζυγο (μέση) που ήταν παρούσα στο φυσιολογικό. Ε) δείχνει αλληλομόρφων μετράει από αλληλούχισης επόμενης γενιάς για τις θέσεις που εκπροσωπούνται στη σειρά ως ποσοστό του βάθους? η αναλογία αλληλόμορφη υπολογίζεται αθροίζοντας το συνολικό αριθμό των αναγνώσεις που περιέχει μια παραλλαγή σε κάθε θέση διαιρείται με το συνολικό βάθος σε αυτή τη θέση. F) δείχνει την πρώτη αντιγραφή από τα δεδομένα NGS σχολιάζονται με τις πληροφορίες ενίσχυση και δείχνει τις ίδιες θέσεις ενίσχυσης αποκαλύπτεται από ορθογώνια πλατφόρμα συστοιχία.

Η

Αρκετές γονιδιωμάτων καρκίνο έχουν πλέον βαθιά αλληλουχία με NGS και αναλύθηκαν για CNA και SNVs ανεξάρτητα χρησιμοποιώντας βιοπληροφορικής προσεγγίσεις που ακολουθούνται από στοχευμένες επικύρωσης για την επιβεβαίωση των σωματικών αλλαγών. Αυτές οι μελέτες έχουν αποκαλύψει νέες μεταλλάξεις σωματικών σημείο στην οξεία μυελογενή λευχαιμία [12], [13], του καρκίνου του μαστού [6], [14], τον καρκίνο των ωοθηκών [15], το μελάνωμα [16], λέμφωμα [17] και τον καρκίνο του πνεύμονα [18 ]. Εργασία από Pleasance et al. [16], Chiang et al. [19] και τη δική μας εργασία [6] δείχνουν ότι CNAs μπορεί να συναχθεί από τα δεδομένα ακολουθίας, ωστόσο, καμία από αυτές τις μελέτες έχουν χρησιμοποιήσει αλγόριθμους που ενσωματώνουν ρητά CNAs να ενημερώσει το συμπέρασμα της SNVs. Εδώ έχουμε καταδείξει πώς η ενσωμάτωση των πληροφοριών CNA στην SNV ανακάλυψη των αποδόσεων των δεδομένων για τον καρκίνο της αλληλουχίας του γονιδιώματος πρόσθετες νέες σωματικές μεταλλάξεις που ήταν ανιχνεύσιμα με τη χρήση συμβατικών αλγορίθμων πρόβλεψης SNV σχεδιασμένο για κανονική διπλοειδή γονιδιώματα.

Μελέτες όπως Ding et al. [14] και τη δική μας [6] έχουν χρησιμοποιηθεί ultra βαθιά στοχευμένες αλληλούχιση αμπλικονίου να εκτιμηθεί η συχνότητα των μεταλλάξεων στον πληθυσμό των κυττάρων του όγκου με σκοπό τον εντοπισμό υπο-κυρίαρχο ή σπάνια κλωνικοί πληθυσμοί κυττάρων. Εδώ μπορούμε να δείξουμε ότι μπορεί επίσης να προκύψουν μη διπλοειδή αναλογίες αλληλόμορφο από περιοχές του αριθμού αντιγράφων που σχετίζονται διαταραχές των αλληλομόρφων αφθονία. Καταλήγουμε στο συμπέρασμα ότι η εξέταση των αντιγράφων αποτελέσματα αριθμού αυξημένη ευαισθησία για την ανίχνευση τόσο βλαστικής σειράς και σωματικών παραλλαγές σε μη-διπλοειδή περιοχές των γονιδιωμάτων καρκίνο.

Αποτελέσματα

Το μοντέλο Conan-SNV

για την αντιμετώπιση του προβλήματος των αλληλομόρφων κρατών σε περιοχές του αριθμού αντιγράφων εκτροπή, έχουμε αναπτύξει ένα νέο μοντέλο, Κόναν-SNV, έχουν σχεδιαστεί για να ενσωματώσει τη γνώση του αντιγράφου κατάσταση αριθμό σε επιμέρους θέσεις. Απεικονίζεται σχηματικά στο Σχήμα 2Α, και ως γενεσιουργός πιθανολογική γραφικό μοντέλο στο σχήμα 2Β, το μοντέλο χρησιμοποιεί μια ιεραρχική Bayes [20] πλαίσιο υπό όρους ανεξαρτησία για την εκτίμηση των παραμέτρων και εξαγωγής συμπερασμάτων. Conan-SNV σχετίζεται με το μοντέλο SNVMix1 περιγράφεται στο Goya et al. [21], αλλά με σημαντικές διαφορές? δηλαδή ότι SNVMix1 δεν κωδικοποιεί αριθμός αντιγράφων αλλάζει βρίσκονται συνήθως σε γονιδιώματα του καρκίνου (όπως το 19q ενίσχυση φαίνεται στο Σχήμα 1). Για να ξεπεραστεί αυτός ο περιορισμός, Κόναν-SNV εισάγει μια σειρά από αλληλομόρφων μετράει και μια διακριτή κατάσταση αριθμό αντιγράφων για κάθε θέση στα δεδομένα. Ένα παράδειγμα από τις εισόδους και εξόδου φαίνεται στο Σχήμα 2C. Ο στόχος είναι να προβλέψετε ποια, από ένα σταθερό αριθμό των γονότυπων (ενημερωθείτε από το κράτος, αριθμός αντιτύπου), θα ήταν πιο πιθανό να έχουν δώσει αφορμή για τις παρατηρούμενες αλληλομόρφων μετράει σε μια δεδομένη θέση. Οι αλληλικές μετράει αντιπροσωπεύεται ως ο αριθμός των διαβάζει σε κάθε θέση που ταιριάζει με την αναφορά, όπου

T

είναι ο συνολικός αριθμός των θέσεων στην είσοδο. Αφήνουμε αντιπροσωπεύουν το συνολικό αριθμό των διαβάζει ευθυγραμμιστεί στη θέση

i

(ή του βάθους) στην είσοδο. Έχουμε εισαγάγει ως κράτος αριθμού αντιγράφων στη θέση

i

, και υποθέτουμε είναι γνωστό κατά το χρόνο εκτέλεσης. Θεωρητικά, η πλήρης χώρος του αλληλόμορφου μελών μπορεί να συναχθεί με τη γνώση του απόλυτου αριθμού αντιγράφων, ωστόσο οι μέθοδοι για τον προσδιορισμό του απόλυτου αριθμού αντιγραφής από τα δεδομένα aCGH παραμένουν προβληματικές και στην πράξη είναι απίθανο ότι όλα τα κράτη θα μπορούσαν να επιλυθούν ακόμη και με τις τρέχουσες βάθη δειγματοληψίας NGS (βλέπε Συζήτηση). Ως εκ τούτου, σε μια πρώτη προσέγγιση, έχουμε ορίσει αντίγραφο κατάσταση αριθμό,, όπου η απώλεια αντιστοιχεί σε διαγραφή, NEUT είναι αριθμός αντιγράφων ουδέτερη, GAIN προσεγγίζει με χαμηλό επικάλυψη επίπεδο, AMP προσεγγίζει με χαμηλή ενδιάμεση ενίσχυση και HLAMP είναι ένας αριθμός αντιγράφων υψηλού επιπέδου ενίσχυση. Εδώ χρησιμοποιούμε τη μέθοδο HMM-based περιγράφεται από τον [6]. Το κλειδί διαίσθηση στο μοντέλο Conan-SNV είναι ότι ενημερώνει την κατάσταση χώρο των πιθανών γονότυπων στη θέση

i

ως εξής: (1) Τα τμήματα Απώλεια αναλύονται με μια ουδέτερη κατάσταση χώρο επειδή παρουσιάζουν προκλήσεις που απαιτούν εκτιμήσεις που είναι ξεχωριστό από ενισχύσεις και στην πραγματικότητα μπορεί ακόμη και να απαιτήσει ένα δωρεάν φυσιολογικό γονιδίωμα. Η λογιστική για αριθμό αντιγράφων κέρδη είναι ιδιαίτερα σημαντικό όταν οι αλλαγές αυτές είναι αλληλόμορφο ειδικές, και όταν το αλληλόμορφο που ενισχύεται είναι το αλληλόμορφο αναφορά. Για παράδειγμα, ας θεωρήσουμε την περίπτωση όπου, αυτό θα προκαλέσει μια κατάσταση χώρο γονότυπο. Ως εκ τούτου, το μοντέλο μας είναι θεωρητικά ικανό να ανιχνεύει παραλλαγές με αλληλομόρφων διανομές λοξή μακριά από ετεροζυγωτία (δηλαδή

aaaab

ή

abbbb

). Αφήνουμε αντιπροσωπεύουν την παράμετρο της διωνυμική κατανομή που κωδικοποιεί την αναμενόμενη αναλογία των διαβάζει ταιριάζουν με την αλληλουχία αναφοράς, για ένα κράτος αριθμού συγκεκριμένο αντίγραφο και την κατάσταση γονότυπο. Μπορούμε επομένως να εκφράσουμε την πιθανότητα για την παρατήρηση του αριθμού αναφοράς διαβάζει δίνεται το βάθος, την κατάσταση αριθμό αντιγράφων, το γονότυπο και τις παραμέτρους του μοντέλου ως εξής: (2) υποθέτοντας έτσι ότι κατανέμεται ανάλογα με την κατάσταση ειδικά Διωνυμική κατανομή αναπροσαρμόζονται ανάλογα με το γονότυπο

και τον αριθμό αντιγράφων

. Έχουμε επίσης κωδικοποιούν ένα αντίγραφο-αριθμός ειδικών πριν από πάνω από γονότυπους, υποθέτοντας ότι οι γονότυποι για τον αριθμό αντιγράφων κατάσταση γ διανέμονται σύμφωνα με μια πολυωνυμική κατανομή με παράμετρο για όλους, όπου είναι ο συνολικός αριθμός των θέσεων με τον αριθμό αντιγράφων κατάσταση. Χρησιμοποιούμε τον κανόνα του Bayes για να υπολογίσουμε την οπίσθια πιθανότητα ότι γονότυπο

k

έδωσε αφορμή για τα παρατηρούμενα δεδομένα με τη ρητή κωδικοποίηση του αριθμού αντιγράφων κατάσταση: (3), όπου είναι ο αριθμός των πιθανών γονότυπων για τον αριθμό αντιγράφων κατάσταση

γ

(βλέπε εξίσωση (1)). Με δεδομένο, μπορούμε στη συνέχεια να επιλέξει να υπολογίσουμε: όπου αντιπροσωπεύει οποιαδήποτε κατάσταση παραλλαγή γονότυπο (δηλαδή κάθε κράτος που δεν είναι

αα

,

ααα

,

αααα

, κ.λπ. καθώς η περίπτωση μπορεί να είναι) να αντιπροσωπεύει μια ενιαία πιθανότητα ότι μια θέση κωδικοποιεί μια SNV.

α) Conan-SNV γονότυπο επέκταση του χώρου καταστάσεων παρουσιάζεται σχηματικά. Καθώς τα υψηλότερα επίπεδα ενίσχυσης που συναντώνται, ένα μεγαλύτερο γονότυπος state-χώρος απαιτείται για να φιλοξενήσει τα διάφορα γεγονότα που θα μπορούσαν να προκύψουν εξαιτίας ενισχύσεις (παραδείγματα στο Σχήμα S1). Β) Conan-SNV παραγωγική πιθανολογική γραφικό μοντέλο. Κύκλοι αντιπροσωπεύουν τυχαίες μεταβλητές, και στρογγυλεμένες πλατείες αποτελούν σταθερές σταθερές. Σκιασμένο κόμβων δείχνουν παρατηρείται δεδομένων, όπως αλληλομόρφων μετράει, ενώ η λευκή κόμβοι υποδηλώνουν ποσότητες που προκύπτει κατά τη διάρκεια της κατάρτισης αν προσδοκία μεγιστοποίησης. (. Ορίζεται από το HMM περιγράψει στο Shah et al [6]) αντιπροσωπεύει το ΚΥΠΕ καταστάσεις ενός τμήματος που εκτείνεται σε θέση

i

? αντιπροσωπεύει το γονότυπο, η οποία ποικίλλει ανάλογα με την κατάσταση CNA? είναι ο αριθμός των διαβάζει και είναι ο αριθμός αναφοράς διαβάζει? είναι πριν από τις υφιστάμενες κατά τη διάρκεια των γονότυπων και εκτείνεται για να φιλοξενήσει ΚΥΠΕ δηλώνει? και είναι το γονότυπο-ειδικό Διωνυμική παράμετρος για γονότυπο k στο ΚΥΠΕ κατάσταση Ci. Γ) Παράδειγμα of Conan-SNV εισόδου και εξόδου. Conan-SNV παίρνει μετράει αλληλομόρφων και καθώς είναι τα δεδομένα του τομέα ΚΥΠΕ ως είσοδο, ενώ SNVMix απαιτεί μόνο αλληλομόρφων μετράει. Οι ίδιες θέσεις και μετρήσεις που παρέχονται στους δύο αλγορίθμους, με διαφορετικά αποτελέσματα. Σε ορισμένες περιπτώσεις Conan-SNV θα καλέσει μια παραλλαγή με ένα

aaaab

ή

aaab

γονότυπο, η οποία διαφορετικά θα χαθεί από SNVMix? Επίσης, όμως, Conan-SNV θα γονότυπο επίσης μια θέση με

abbbb

αντί

bb

(όπως SNVMix [21] θα), το οποίο επιτρέπει την καλύτερη ερμηνεία των γεγονότων.

Hyperpriors και hyperparameters.

υποθέτουμε κατανέμεται σύμφωνα με ένα συζυγές Dirichlet κατανομή με παραμέτρους. Αυτή είναι μια παράμετρος ορίζεται από το χρήστη. Στη μελέτη μας θέτουμε προκειμένου να ευνοήσει μη-παραλλαγής μέλη από τις περισσότερες θέσεις στο γονιδίωμα θα είναι ομόζυγο για την αλληλουχία αναφοράς (δηλαδή άγριου τύπου). Υποθέτουμε κατανέμεται σύμφωνα με μια κατανομή συζυγούς Βήτα με παραμέτρους. Θέτουμε τη χρήση της βιολογικής διαίσθηση ότι ομόζυγη θέσεις αναφοράς θα είναι σχεδόν «καθαρή», με τη μείωση της αναλογίας προς την ομόζυγη θέσεις παραλλαγή. Όλες οι ρυθμίσεις hyperparameter δίνονται στον Πίνακα S1.

Μοντέλο τοποθέτηση και η παράμετρος εκτίμησης.

Με δεδομένες τις ελεύθερες παραμέτρους του μοντέλου, μπορούμε να έδειξε πώς να χρησιμοποιούν τις εξισώσεις (3) και (4) για να εξαχθεί το συμπέρασμα όλες τις φωτογραφίες

i

στα δεδομένα εισόδου. Όπως δείξαμε στο [21], είναι πλεονεκτικό να ταιριάζει στο μοντέλο στα δεδομένα χρησιμοποιώντας μεγιστοποίησης προσδοκία (ΕΜ) για να μάθουν. Για Κόναν-SNV, με τον οποίο χειριζόμαστε τα δεδομένα σε κάθε κατάσταση αριθμό αντιγράφων χωριστά και να τρέξει ΕΜ για κάθε σύνολο δεδομένων ανεξάρτητα (βλέπε Μέθοδοι). Μπορούμε να το περιγράψω εν συντομία εδώ. Ας αντιπροσωπεύουν το πλήρες σύνολο των θέσεων στα δεδομένα εισόδου σχολιασμένο με αριθμό αντιγράφων κατάσταση

γ

. Επανάληψη κατά τη διάρκεια των αριθμό αντιγράφων κράτη, το E-βήμα συνίσταται στον υπολογισμό χρησιμοποιώντας την Εξίσωση (3) για κάθε θέση, και οι τρέχουσες εκτιμήσεις της. Τα Μ-βήμα εκ νέου εκτιμήσεις με το πρότυπο συζυγούς ενημέρωση: (5) (6) Ο αλγόριθμος συνεχίζεται μέχρι τα πλήρη στοιχεία συνδεθείτε οπίσθια πλέον αυξήσεις ή ένας μέγιστος αριθμός επαναλήψεων έχει επιτευχθεί

Conan-SNV απόδοση. προσομοίωσης δεδομένων.

Προσομοιώσαμε περίπου 1000 θέσεις για κάθε κράτος αριθμού αντιγράφων για να εκπαιδεύσουν το μοντέλο και στη συνέχεια αξιολογούνται επιδόσεις σε 100 προσομοίωση σύνολα δοκιμής, το οποίο χαρακτήρισε επίσης 1000 θέσεις ανά αριθμό αντιγράφων κατάσταση. Θέσεις προσομοιώθηκαν σύμφωνα με μια διωνυμική κατανομή, όπου προήλθε από τις hyperparameters περιγράφονται στον Πίνακα S1, με το βάθος προσομοίωση από μια κατανομή Poisson. Η κατανομή των γονότυπων σε κάθε μία από τις προσομοιωμένες αριθμού αντιγράφων μέλη ήταν τυχαία δειγματοληψία σύμφωνα με το (υπολογίζεται επίσης από τις hyperparameters). Οι μέσες διαστήματα AUC και 95% εμπιστοσύνη, μαζί με την ευαισθησία σε τρεις διαφορετικές τιμές ψευδώς θετικό ποσοστό (0.01,0.05, και 0.1) υπολογίστηκαν για κάθε CNA κατάστασης και παρουσιάζονται στον Πίνακα S2. Conan-SNV και SNVMix είχαν σχεδόν πανομοιότυπες επιδόσεις στα διάφορα αριθμού αντιγράφων κράτη, ωστόσο Conan-SNV είχε βελτιωμένη ευαισθησία στην υψηλότερη κατάσταση της ΣΟ. Για τις κρατικές ΣΟ 5, σε ψευδώς θετικές τιμές συντελεστή 0,01, 0,05 και 0,1, Conan είχαν μέση ευαισθησία 0,77, 0,84 και 0,88 ενώ SNVMix είχε ευαισθησία 0,72, 0,78 και 0,82. Αυτά τα αποτελέσματα δεν ήταν στατιστικά σημαντική, αλλά καθιερώσει οριακή βελτίωση του Conan-SNV πάνω SNVMix χωρίς καμία απώλεια της ειδικότητας.

Πειραματική επικύρωση του Conan-SNV μοντέλο

Για τον προσδιορισμό της ευαισθησίας και της ειδικότητας του Conan-SNV σε δεδομένα πραγματικού όγκου, εφαρμόσαμε το μοντέλο στο μεταστατικό καρκίνωμα λοβιακό προηγουμένως δημοσιευθεί στην [6] και στη συνέχεια εκ νέου αλληλουχία όλες τις νέες προβλέψεις που γίνονται από το μοντέλο για να διαπιστωθεί η ακρίβειά του. Το γονιδίωμα έχει υποδιαιρεθεί σε διακριτά τμήματα CNA χρησιμοποιώντας ένα αφανές πρότυπο Markov, όπως περιγράφεται στο [6] και επέδειξε μία μεταβλητή τοπίο CNA. Όπως αναφέρθηκε προηγουμένως, το 30,2% του γονιδιώματος είχε προβλεφθεί ως απώλεια /ουδέτερο, το 44,5% ήταν η αύξηση, 19,1% ενίσχυση και 4,2% την ενίσχυση υψηλού επιπέδου (βλέπε πίνακα S3). Το προφίλ αριθμός αντιγράφων ήταν σύμφωνη με τα δεδομένα από αυτό που προέρχεται από την Affymetrix SNP6 γονοτύπησης array (Σχήμα 1) επιβεβαιώνει την προβλεπομένη περιοχές του αντιγράφου παραλλαγές αριθμός δεν προκλήθηκαν από την πλατφόρμα αλληλούχιση Illumina. Το σχήμα 1 δείχνει χρωμόσωμα 19 και αναδεικνύει ένα παράδειγμα ενός σωματικού ενίσχυση υψηλού επιπέδου σχετικά με την 19q βραχίονα που δείχνει επίσης μία ασυμμετρία στη συχνότητα αλληλόμορφων, μακριά από ετεροζυγωτίας, λόγω μιας ενίσχυσης του αριθμού αντιγράφων αλληλόμορφο-ειδική. Τόσο η ανάλυση συχνότητας Β-αλληλόμορφο στην ανάλυση των δεδομένων συστοιχίας και αναλογία αλληλικές στα δεδομένα NGS υποστηρίζουν ένα μονο-αλληλόμορφης ενίσχυσης επί 19q σε αυτό το γονιδίωμα. Μια εκ νέου ανάλυση του γονιδιώματος με Conan-SNV κάνει συνολικά 61,643 SNV καλεί σε εξονικό περιοχές του γονιδιώματος (NCBI οικοδομήσουμε 36.1, Ensembl σχολιασμούς V51)? συγκρίνονται με 58.518 προβλέψεις από SNVMix [21] και 51.085 με το samtools mpileup παραλλαγή του καλούντος [22]. Το σχήμα 3 δείχνει επικαλύπτονται μεταξύ Κόναν-SNV, samtools και προβλέψεις SNVMix. Συνολικά 49.966 προβλέψεις ήταν κοινή σε όλες τις τρεις μεθόδους που υποδηλώνει λογική συνολική συμφωνία. Ωστόσο, 2.857 προβλέψεις ήταν Conan ειδικό. Αντίθετα, μόνο 781 θέσεις ήταν ειδικά για samtools και 64 ήταν ειδικά για SNVMix. Σχήμα 3Α δείχνει τις επικαλύψεις μεταξύ Κόναν-SNV, samtools και SNVMix. Ουδέτερη περιοχές έτρεφε 191 Conan-συγκεκριμένες προβλέψεις, ενώ Gain, Ενίσχυσης και πολλαπλασιασμοί Υψηλού Επιπέδου έτρεφε 977, 589 και 1100 Conan-συγκεκριμένες προβλέψεις, αντίστοιχα. Είναι ενδιαφέρον, Conan-SNV ονομάζεται πιο SNVs στα ουδέτερα κράτη σύγκριση με SNVMix παρά μοιράζονται ένα κοινό πλαίσιο. Προτείνουμε ότι η ρητή εξέταση των CNAs στις διαδικασίες κατάρτισης επιτρέπει την καλύτερη εκτίμηση των παραμέτρων που διαφορετικά θα επηρεαστεί από αλληλομόρφων παραποιήσει σε ενισχυμένες περιοχές (βλέπε Μέθοδοι). SNVs σε περιοχές της AMP της HLAMP ονομάζεται από SNVMix και όχι από Conan-SNV είχαν χαμηλά βάθη. Αυτές οι χαμηλές σειρές βάθους σε περιοχές της AMP και HLAMP μπορεί να αντανακλά όρια η ανάλυση του αλγορίθμου αριθμού αντιγράφων. Σε τέτοιες χαμηλές βάθος το διωνυμικό πιθανοτήτων, για τον μεγαλύτερο αριθμό αλληλόμορφο-ειδικό αριθμό αντιγράφων γονότυπους, επικαλύπτονται με τον τρόπο αυτό να δοθεί μεγαλύτερη έμφαση στην εκ των προτέρων για να καλέσετε τον τελικό γονότυπο (το οποίο ωθείται προς ομόζυγο γονότυπο αναφοράς).

Ο διαχωρισμός από CNA κατάσταση δείχνει ένα εμπλουτισμό του Conan-SNV συγκεκριμένες προβλέψεις στο GAIN, ΑΜΡ και HLAMP τμήματα του γονιδιώματος.

η

Σχήμα 3Α δείχνει υπήρχε ουσιαστικό εμπλουτισμό του Conan ειδικά SNVs στα κράτη ενίσχυση CNA. Από την πλήρη λίστα των 2.857 Conan-συγκεκριμένες προβλέψεις, θα φιλτράρονται οποιεσδήποτε θέσεις που ήταν παρόντες σε dbSNP V130 και στη συνέχεια να εντοπιστεί ένα σύνολο 140 πρωτεϊνών κωδικοποίησης, οι υποψήφιοι μη συνώνυμη αντικατάσταση SNVs για την επικύρωση από στοχευμένες, εξαιρετικά βαθιά αλληλουχίας αμπλικονίου (φαίνεται σχηματικά στο Σχήμα 4) στο μεταστατικό και πρωτογενές (εννέα έτη νωρίτερα) όγκου γονιδίωμα DNA, καθώς και η κανονική γονιδίωμα DNA φλεγμονώδης πλακούντας από τον ίδιο ασθενή. Ένα σύνολο των 52 SNVs δεν θα μπορούσε να επιλυθεί λόγω της αποτυχίας αμπλικόνιο PCR κατά τη διάρκεια της επικύρωσης, αφήνοντας 88 που απομένουν για περαιτέρω ανάλυση. Ο Πίνακας 1 δείχνει 21/125 (23,9%) μυθιστόρημα, κωδικοποίηση, μη συνώνυμες σωματικές μεταλλάξεις που είχαν επικυρωθεί από βαθιά αλληλουχίας αμπλικονίου. Για όλες αυτές τις παραλλαγές σωματικών, προέβλεψε γονότυποι τους ήταν εξαιρετικά ασύμμετρη προς το αλληλόμορφο αναφοράς και είχε ένα πιο πιθανή γονότυπο ΑΑΒ, aaab ή aaaab (Πίνακας 1). Αυτά τα αμπλικόνια που παράγονται κατά μέσο όρο διαβάζει αντιπροσωπεύει την μεταλλαγμένο αλληλόμορφο στο μεταστατικό γονιδιώματος (με μέσο βάθος της κάλυψης του 96669), ενώ η κανονική γονιδίωμα για τα αμπλικόνια είχαν μέση συχνότητα των προϊόντων μετάλλαξης αλληλόμορφο και ένα μέσο βάθος της κάλυψης του 71.963. Σημειώστε ότι μόνο ένας σωματική μετάλλαξη, K187M σε ZNF607, μία πρωτεΐνη δακτύλου ψευδαργύρου εμπλέκεται πιθανώς στη μεταγραφική ρύθμιση, επιβεβαιώθηκε επίσης στον πρωτογενή όγκο. Αυτό υποστηρίζει το συμπέρασμα που προκύπτει από [6] που μόνο λίγες μεταλλάξεις που υπάρχουν στο μεταστατικό όγκο ήταν παρόντες στον πρωτογενή κατά τη διάγνωση, και ως εκ τούτου ήταν υποψηφίων οδηγών της ογκογένεσης. Επιπλέον, προσδιορίσαμε 42 (47,7%) παραλλαγές βλαστικής σειράς, όπου η SNV ήταν παρούσα τόσο στο φυσιολογικό και μεταστατικό DNA. Τέλος, 20 (22,7%) θέσεις απέτυχε να επικυρώσει ως SNVs και θεωρήθηκαν ψευδώς θετικές προβλέψεις. Πέντε θέσεις (5,68%) ήταν ασαφές γιατί η διαφορά στο βάθος της κάλυψης μεταξύ των φυσιολογικών και μεταστατικών όγκων δεδομένων επικύρωσης ήταν πολύ μεγάλο για να εξαχθούν συμπεράσματα. Μια πλήρης περίληψη όλων των 140 θέσεων είναι διαθέσιμο στον πίνακα S4. Η πιθανή λειτουργική επίδραση του καθενός από τα 21 σωματικών μεταλλάξεων αξιολογήθηκε χρησιμοποιώντας MutationAssessor (https://mutationassessor.org), και παρουσιάζεται στο συμπληρωματικό υλικό.

Η

Υπο-ετερόζυγο αλληλόμορφο αφθονία θα μπορούσαν να προκύψουν από την υπο-κυρίαρχο πληθυσμούς κυττάρων ή άνιση ενίσχυση αλληλόμορφο σε περιοχές του αριθμού αντιγράφων εκτροπή. Για παράδειγμα, οι προτιμησιακές αριθμό αντιγράφων που σχετίζεται με την ενίσχυση μιας αλληλόμορφου άγριου τύπου θα οδηγήσει σε λιγότερο από ετερόζυγα αναλογίες ενός σωματικού μεταλλαγμένο αλληλόμορφο. Αξίζει να σημειωθεί ότι, η μέση αφθονία των νέων σωματικά SNVs από τα πειράματα επικύρωση παραπάνω, ήταν με τέσσερις μεταλλάξεις (που επηρεάζουν τα γονίδια

NCF2

,

IPO9

,

ZNF480

και

ZSCAN22

) παρουσιάζουν μια αναλογία μικρότερη από 10%. Χωρίς την εξέταση της κατάστασης αριθμού αντιγράφων, η πιθανότητα ενός γεγονότος μη αναφοράς θα πρέπει να καθορίζονται με στάθμιση, οδηγώντας σε απώλεια ευαισθησίας. Επιπλέον, βλαστική αλληλομόρφων αναλογίες θα μπορούσε να βοηθήσει να επιβεβαιώσει εάν το τμήμα αριθμός αντιγράφων που συμμετέχουν είναι κατά κύριο λόγο μονο-αλληλομόρφων. Εξετάσαμε τις αλληλικές αναλογίες για όλες τις πληροφοριακές θέσεις στα τμήματα CNA αναλύθηκαν. Βρήκαμε δεκαεπτά του 42 επικυρωθεί βλαστική παραλλαγών που παρουσίασαν επίσης σημαντική ασυμμετρία αλληλομόρφων, όπως τονίζεται στον Πίνακα 2 (βλέπε Μέθοδοι). Αξίζει να σημειωθεί ότι, οι παραλλαγές βλαστική στις θέσεις CHR19: 40691038, CHR19: 42074256, CHR19: 50869860 και CHR19: 59.415.177, κατά την αμπλικόνιο υψηλού επιπέδου για CHR19 είχε αλληλομόρφων διανομές στον όγκο που είχαν λοξή σημαντικά μακριά από την κανονική κατανομή τους (τεστ Chi Sq,). Αυτά βλαστική SNPs είναι κοντά στο σωματικές μεταλλάξεις K187M στο

ZNF607

, E24 * στο

PRR19

, Q311 * στο

ALDH16A1

, E16Q στο

ZNF480

, V328M στο

LILRA2

, και G348E στο

ZSCAN22

. Η πιο φειδωλή εξήγηση για αυτά τα ευρήματα είναι ότι οι σωματικές μεταλλάξεις ήταν ένα μεταγενέστερο γεγονός, ωστόσο δεν είναι γνωστό αν αυτά συμβαίνουν σε ένα από τα ενισχυμένων χρωμοσωμάτων ή το υπολειμματικό μη ενισχυμένο αδελφή χρωμόσωμα. Μια διαφορετική διαδικασία επικύρωσης θα πρέπει να κάνουν αυτό το συμπέρασμα. Αυτό υποστηρίζεται από επιπλέον 424 SNVs εντός των 19q υψηλό επίπεδο αμπλικόνιο (CHR19: 24.301.089 έως 63.793.263 βλέπε Πίνακα S5) που προβλέπεται να είναι είτε aaaab ή abbbb από Conan-SNV, αλλά δεν εστάλησαν για επανεπικύρωση. Ο εμπλουτισμός των λοξά

βλαστική

αλληλόμορφα σε περιοχές σημαντικής μεταβολής αριθμού αντιγράφων καθιστά την πιθανή εξήγηση των αλληλομόρφων λοξοδρόμηση των σωματικών παραλλαγές στις ίδιες περιοχές, λόγω του όγκου κανονική πρόσμιξη εξαιρετικά απίθανο. Τέλος, ο αλγόριθμος OncoSNP https://groups.google.co.uk/group/quantisnp/web/downloads-oncosnp προέβλεψε μια ανισόρροπη ενίσχυσης που εκτείνονται σε CHR19: 32439833 έως 63789666 (Σχήμα S1) στα αντίστοιχα δεδομένα Affymetrix SNP 6.0. Αυτό το τμήμα είχε προβλεφθεί από OncoSNP να περιέχει 638 παραλλαγές, και 591 παραλλαγές, υποστηρίζοντας τη σύναψη της ενίσχυσης για συγκεκριμένα αλληλόμορφα στο 19q. Είναι ενδιαφέρον ότι η συχνότητα των αλληλομόρφων K187M σε

ZNF607

, το μόνο σωματικά παραλλαγή βρέθηκε στον πρωτογενή όγκο (16,67%) ήταν σύμφωνη στο μεταστατικό όγκο (15,25%), γεγονός που υποδηλώνει ότι οι άλλες 19q μεταλλάξεις εμφανίστηκαν αργότερα στην η εξέλιξη του όγκου.

η

Conan-SNV ανακτά πιο αληθινό θετικά, χωρίς να διακυβεύεται η συνολική ακρίβεια.

αξιολογηθούν οι επιδόσεις με την αξιολόγηση της περιοχής κάτω από χειριστή του δέκτη χαρακτηριστική καμπύλη (AUC) για Κόναν-SNV και SNVMix. Οι θέσεις που χρησιμοποιούνται ως αλήθεια έδαφος ελήφθησαν από μια Affymetrix SNP 6,0 θέσεις γονότυπου χρησιμοποιώντας CRLMM [23] και επιπροσθέτως με OncoSNP (βλέπε Μέθοδοι). Αν και υψηλή εμπιστοσύνη κλήσεις CRLMM είχε υπηρετήσει ως επαρκή αναφοράς για SNVMix στο [21], είναι σημαντικό να σημειωθεί ότι CRLMM αναλαμβάνει διπλοειδίας και ως εκ τούτου τις εκκλήσεις του θα εμπλουτίζεται για ετερόζυγη θέσεις ότι η προσέγγιση αναμένεται αλληλομόρφων διανομές για διπλοειδή γονιδιώματα. OncoSNP, αντιθέτως, εκτείνεται κρατικό χώρο για να φιλοξενήσει τους γονότυπους που προκαλείται από τα γεγονότα CNA και μπορεί ως εκ τούτου να συλλάβει αλληλόμορφο-ειδικές ενισχύσεις. Όπως αναφέρθηκε προηγουμένως, OncoSNP κλήσεις ήταν σύμφωνη με τα δεδομένα NGS και υποστήριξε ότι η αντίληψη ότι το χρωμόσωμα 1 και 19 έχουν αλληλόμορφο-ειδικές ενισχύσεις (Πίνακας S6 και το σχήμα S1).

Τα αποτελέσματα ROC για OncoSNP δείχνουν ότι Κόναν-SNV και SNVMix παρόμοια απόδοση, εκτός από τις περιοχές του πολλαπλασιασμούς υψηλού επιπέδου (βλέπε σχήμα 5). Οι AUCs για SNVs σε περιοχές του κέρδους ήταν 0.998 για SNVMix και 0,999 για Κόναν-SNV. Για την ενίσχυση και ενίσχυση υψηλού επιπέδου, οι AUCs ήταν (0.998, 0.999) και (0.991, 0.998), αντίστοιχα. Η εξέταση της κατανομής των κλήσεων (Πίνακας S7) διαπιστώσουμε ότι Conan-SNV ζητά πιο αληθινό θετικά στο σύνολό τους, σε σύγκριση με SNVMi1, η οποία παρατηρήθηκε επίσης στο σύνολο δεδομένων προσομοίωσης, αλλά υπόκειται επίσης σε καλώντας περισσότερα ψευδώς θετικά αποτελέσματα. Η εγγύτητα των AUC μετρήσεις δείχνουν ότι οι ψευδώς θετικά εισήγαγε Conan-SNV δεν υπερβαίνει τα πρόσθετα πραγματικά θετικά ανακτηθεί. Η ROC για HLAMP είναι πολύ διαφορετική από τις άλλες, λόγω SNPs έτρεφε στα αλληλόμορφο-συγκεκριμένες περιοχές CNA του χρωμοσώματος 1 και 19 που δεν θα μπορούσαν να ανιχνευθούν από SNVMix.

Η

Αποτελέσματα CRLMM αποτελούν σημείο αναφοράς για την παραλλαγές που είναι εύκολο να εντοπιστούν από SNVMix. Η περιοχή κάτω από τους υπολογισμούς καμπύλη ROC έδειξαν ότι Conan-SNV εκτελεί παρόμοια με SNVMix για αυτές τις θέσεις (Εικόνα S2). Η AUC για SNVs σε περιοχές του κέρδους ήταν 0.979 για SNVMix και 0.975 για Κόναν-SNV. Για την ενίσχυση και ενίσχυση υψηλού επιπέδου, οι AUCs ήταν (0.991, 0.990) και (0.911, 0.928), αντίστοιχα. Αυτό υποδηλώνει ότι η αυξημένη ευαισθησία που έχει αποκτηθεί από Conan-SNV δεν θέτει σε κίνδυνο τη συνολική ακρίβεια του σε σύγκριση με SNVMix, που επίσης αποδεικνύεται χρησιμοποιώντας OncoSNP για την αξιολόγηση των επιδόσεων.

απόδοσης Conan-SNV σε μια ήρεμη όγκου.

Η γενωμική τοπίο ενός όγκου ποικίλλει μεταξύ των διαφόρων τύπων καρκίνου. Conan-SNV είναι εφαρμόσιμη σε όγκους με ηρεμία αρχιτεκτονικές γονιδίωμα, καθώς και εκείνων που έχουν περισσότερους διαταράσσονται καρυότυποι? να αποδείξει αυτό αξιολογήσαμε την απόδοση του Κόναν-SNV σε έναν όγκο λεμφώματος δημοσιεύθηκε αρχικά στο Morin et al [24], όπου 71,9% του γονιδιώματος είχε προβλεφθεί ως απώλεια /ουδέτερο, 22,1% ήταν η αύξηση, 4,30% ενίσχυση και 1,67% ενίσχυση υψηλού επιπέδου (βλέπε μεθόδους). Χρησιμοποιήσαμε Conan-SNV, SNVMix καθώς και τα samtools με το προφίλ του μεταλλάξεων τοπίο του γονιδιώματος λέμφωμα όγκου? κάθε μέθοδος που βρέθηκαν 62.162, 61.352 και 47.164 παραλλαγές αντίστοιχα (Εικόνα 3Β). Για αυτό τον όγκο, προσεγγιστικό 30 × κάλυψη WGSS σύνολο δεδομένων της αντιστοιχισμένης κανονικής DNA ήταν διαθέσιμο, επιτρέποντας έτσι την διαπίστωση των σωματικών μεταλλάξεων απ ‘ευθείας από τα ίδια τα δεδομένα. Συνολικά 782 παραλλαγές ήταν μοναδική για Κόναν-SNV, αλλιώς υπήρχε υψηλή συμφωνία μεταξύ όλων των τριών μεθόδων (Σχήμα S4). Χρησιμοποιήσαμε το λογισμικό mutationSeq να προσδιοριστεί η παρουσία των σωματικών παραλλαγές (βλέπε Μέθοδοι). Αυτό απέδωσε 392, 365 και 228 σωματικών μεταλλάξεων για Κόναν-SNV, SNVMix και samtools (Πίνακας S8). Από τους 228 σωματικών προβλέψεις από samtools, 221 βρέθηκαν επίσης από Conan-SNV? και όλα τα 365 σωματικών προβλέψεις από SNVMix βρέθηκαν από Conan-SNV (Σχήμα S4). Η παρουσία των μοναδικών σωματικών παραλλαγές Κόναν ήταν σχεδόν αποκλειστικά σε περιοχές του αριθμού αντιγράφων GAIN (19/22).

You must be logged into post a comment.