PLoS One: exome αλληλουχίας αποκαλύπτει Περιεκτική Γονιδιωματική Μεταβολές σε οκτώ Καρκίνος Γραμμές κυττάρων


Abstract

Είναι καλά τεκμηριωμένο ότι γενωμική αλλοιώσεις διαδραματίζουν ουσιαστικό ρόλο στην ογκογένεση, την εξέλιξη της νόσου και την ανταπόκριση των όγκων σε θεραπευτική παρέμβαση. Οι πρόοδοι των τεχνολογιών αλληλούχισης επόμενης γενιάς (NGS) παρέχουν πρωτοφανείς δυνατότητες για τη σάρωση γονιδιώματα για αλλαγές, όπως μεταλλάξεις, διαγραφές και τροποποιήσεις του αριθμού χρωμοσωμικό αντίγραφο. Ωστόσο, το κόστος της αλληλούχισης πλήρους γονιδιώματος εξακολουθεί να αποτρέπει τη συνήθη εφαρμογή των NGS σε πολλούς τομείς. Σύλληψη και αλληλούχιση των κωδικοποιητικά εξώνια των γονιδίων (η «exome») μπορεί να είναι μια οικονομικά αποδοτική προσέγγιση για τον εντοπισμό αλλαγών που οδηγούν σε μεταβολή των αλληλουχιών πρωτεΐνης. Εφαρμόσαμε μια τεχνολογία exome-αλληλούχιση (Roche Nimblegen σύλληψη σε συνδυασμό με 454 αλληλούχιση) για τον εντοπισμό παραλλαγή αλληλουχίας και μεταλλάξεις σε οκτώ χρησιμοποιείται συνήθως καρκινικές κυτταρικές γραμμές από μια ποικιλία προελεύσεων ιστού (Α2780, Α549, ΟοΙο205, GTL16, NCI-H661, MDA- ΜΒ468, PC3 και RD). Δείξαμε ότι αυτή η τεχνολογία μπορεί να προσδιορίσει με ακρίβεια παραλλαγή αλληλουχίας, παρέχοντας -95% συμφωνία με Affymetrix SNP Array 6,0 εκτελούνται στις ίδιες κυτταρικές σειρές. Επιπλέον, ανιχνεύονται 19 από τις 21 μεταλλάξεις που αναφέρονται στο Sanger COSMIC βάση δεδομένων για αυτές τις κυτταρικές σειρές. Εμείς εντόπισε ένα μέσο όρο 2.779 πιθανών διακυμάνσεων νέα αλληλουχία /μεταλλάξεις ανά κυτταρική σειρά, εκ των οποίων 1.904 ήταν μη συνώνυμες. Πολλοί μη-συνώνυμη αλλαγές εντοπίστηκαν στην κινάσες και γνωστά γονίδια σχετίζονται με τον καρκίνο. Επιπλέον επιβεβαιώσαμε ότι η ανάγνωση βάθος των δεδομένων αλληλουχίας exome μπορεί να χρησιμοποιηθεί για την εκτίμηση ενισχύσεις γονίδιο υψηλού επιπέδου και ταυτοποίηση ομόλογων διαγραφές. Συνοπτικά, έχουμε αποδείξει ότι αλληλούχιση exome μπορεί να είναι ένα αξιόπιστο και οικονομικά αποδοτικό τρόπο για τον εντοπισμό μεταβολές στην γονιδιώματα του καρκίνου, και έχουν δημιουργήσει έναν περιεκτικό κατάλογο γενωμικού μεταβολές στην κωδικοποιητικές περιοχές του οκτώ κυτταρικές γραμμές καρκίνου. Τα ευρήματα αυτά θα μπορούσαν να παρέχουν σημαντικές πληροφορίες σχετικά με μονοπάτια του καρκίνου και των μηχανισμών αντοχής σε θεραπείες κατά του καρκίνου

Παράθεση:. Chang H, Τζάκσον ΓΔ, Kayne PS, Ross-Macdonald PB, Ryseck RP, Siemers ΟΧΙ (2011) exome αλληλουχίας αποκαλύπτει Περιεκτική Γονιδιωματική Μεταβολές σε οκτώ Γραμμές Cancer Cell. PLoS ONE 6 (6): e21097. doi: 10.1371 /journal.pone.0021097

Επιμέλεια: Christian Schönbach, Kyushu Institute of Technology, Ιαπωνία

Ελήφθη: 27η Απριλίου του 2011? Αποδεκτές: 19η Μάη 2011? Δημοσιεύθηκε: 20 Ιουνίου 2011

Copyright: © 2011 Chang et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Το παρόν έργο υποστηρίχθηκε από την Bristol-Myers Squibb Co. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:. Οι συγγραφείς είναι οι τρέχουσες υπάλληλος της Bristol- Myers Squibb Co. η μελέτη αυτή δεν έχει σχέση με τα προϊόντα στην ανάπτυξη σε BMS ή διατίθενται στην αγορά προϊόντα με BMS. Αυτό δεν αλλάζει την τήρηση των συγγραφέων σε όλες τις PLoS ONE πολιτικές για την ανταλλαγή δεδομένων και υλικών.

Εισαγωγή

Όλα τα καρκινικά κύτταρα έχουν σωματικές μεταλλάξεις στο γονιδίωμά τους, όπως η ενιαία μεταλλάξεις νουκλεοτιδίων, παρεμβολές , διαγραφές, και η αύξηση του αριθμού αντιγράφων ή απώλεια. Genomic αλλοιώσεις στα καρκινικά κύτταρα να διαταράξει τις φυσιολογικές λειτουργίες και τις οδούς, όπως πολλαπλασιασμό και την απόπτωση, και είναι απαραίτητα για την γένεση του όγκου, την ανάπτυξη και μετάσταση. Επιπλέον, κάθε όγκου φέρει ένα μοναδικό συνδυασμό μεταλλάξεων στο γονιδίωμα του, οδηγώντας σε ετερογένεια στην πρόγνωση και αποκρίσεις σε θεραπευτική παρέμβαση του καρκίνου. περιορισμένη κατανόηση μας για τις πιο κοινές μεταλλάξεις έχει ήδη επηρεάσει θεραπευτικές αγωγές. Για παράδειγμα, η θεραπεία με αναστολείς μικρού μορίου του υποδοχέα του επιδερμικού αυξητικού παράγοντα (EGFR) έχει δειχθεί να ωφελήσει κυρίως ασθενείς με καρκίνο του πνεύμονα που φέρουν ορισμένες σωματικές μεταλλάξεις εις το γονίδιο EGFR τους [1], [2]. Παρομοίως, ορισμένες θεραπείες αντίσωμα που κατευθύνεται εναντίον του EGFR δείχνουν μόνο αποτελεσματικότητα στο υποσύνολο των ασθενών με καρκίνο παχέος με ένα γονίδιο KRAS άγριου τύπου [3], [4]. Βαθιά συστηματική χαρακτηρισμό των σωματικών μεταλλάξεων στο γονιδίωμα του καρκίνου υπόσχεται να είναι ένα ισχυρό εργαλείο τόσο για την κατανόηση μονοπάτια του καρκίνου και την ανάπτυξη στοχευμένων θεραπευτικών.

Κατά τη διάρκεια των δύο τελευταίων δεκαετιών, επικεντρώθηκε μελέτες για υποψήφια γονίδια έχουν οδηγήσει στην ταυτοποίηση των μεταλλάξεων που συμβαίνουν με υψηλή συχνότητα σε κρίσιμα γονίδια οδού καρκίνου όπως TP53, KRAS, και PTEN [5]. Τα τελευταία χρόνια, οι περιοχές κωδικοποίησης του μαστού, του πνεύμονα, του παχέος εντέρου, και γονιδιωμάτων όγκου στον εγκέφαλο αναλύθηκαν χρησιμοποιώντας τεχνολογίες που βασίζονται σε τριχοειδή αλληλούχιση. Αυτές οι προσπάθειες έχουν οδηγήσει στην ταυτοποίηση των αιτιολογικών μεταλλάξεων σε προηγουμένως δεν υπήρχαν υποψίες γονίδια όπως IDH1, αναδεικνύοντας τη δύναμη και τη σημασία της αμερόληπτη, γονιδιωματική κλίμακας ανακάλυψη μετάλλαξη [6], [7], [8]. Ωστόσο, μεγάλης κλίμακας τεχνολογίες προσδιορισμού αλληλουχίας με τριχοειδή βάση είναι χρονοβόρες και δαπανηρές, και επομένως δεν είναι εφικτή για την ευρύτερη χρήση.

αλληλούχιση επόμενης γενιάς (NGS) τεχνολογίες έχουν αυξήσει την απόδοση και μείωσε το κόστος της αλληλουχίας του DNA με πολλές τάξεις μεγέθους. Μια σειρά από μελέτες έχουν εφαρμοστεί τεχνολογίες NGS για την αποκωδικοποίηση γονιδιωμάτων καρκίνο, όπως συνοψίζεται στον πρόσφατες αξιολογήσεις [9], [10]. Ωστόσο, αλληλούχιση του ολόκληρο το γονιδίωμα είναι ακόμα οικονομικά απαγορευτικό για πολλές δυνητικά πολύτιμες εφαρμογές.

Μια εναλλακτική λύση για ολόκληρο μεθόδους γονιδίωμα είναι αλληλούχισης exome, η οποία καταγράφει και αλληλουχίες που κωδικοποιούν μόνο εξώνια στο γονιδίωμα. μεθόδους προσδιορισμού αλληλουχίας exome μπορεί να προσφέρει πληροφορίες αλληλουχίας για ένα μεγάλο μέρος της λειτουργικά σχετική γονιδιώματος σε αυξημένη κάλυψη και μειωμένο κόστος. Πρόσφατες μελέτες έχουν εφαρμοστεί με επιτυχία αλληλουχίας exome να προσδιορίσει την αιτιώδη μεταλλάξεις του Μέντελ ασθένειες [11], [12]. Μεγάλες πρωτοβουλίες γονιδιώματος του καρκίνου, όπως το έργο του καρκίνου Γονιδιώματος Atlas περιλαμβάνει επίσης αλληλουχίας exome ως μέρος της στρατηγικής τους για να χαρακτηρίσει τα γονιδιώματα του καρκίνου [13].

Οι πρωτεϊνικές κινάσες είναι η πιο πανταχού παρούσα οικογένεια των μορίων στα ανθρώπινα κύτταρα σηματοδότησης και να παίξει ουσιαστικό ρόλους στη ρύθμιση περισσότερες κυτταρικές λειτουργίες [14]. Δεδομένου ότι η οικογένεια της πρωτεϊνικής κινάσης είναι μια από τις πιο συχνά μεταλλαγμένο γονίδιο σε οικογένειες καρκίνους [5], έχει υποβληθεί σε αρκετές μελέτες εστιασμένες γονιδιωματική αλληλούχιση. Bardelli et al. διεξήγαγε την πρώτη συστηματική οθόνη μεταλλάξεων στο τυροσίνης υποδοχέα κινάσης υποοικογένεια πρωτεϊνικών κινασών, σε ορθοκολικό καρκίνο δείγματα [15]. Από τότε, οι μελέτες σε πρωτογενείς ιστούς και κυτταρικές σειρές έχουν εντοπίσει πολλές μεταλλάξεις σε κινάσες πρωτεϊνών σε πολλαπλές τύπους όγκων [16], [17], [18]. Το ενδιαφέρον για μεταλλάξεις των κινασών συνεχίστηκε με πρόσφατες μελέτες μετάλλαξη ανακάλυψη του γονιδιώματος σε επίπεδο [13], [19], [20].

μοντέλα γραμμή κυττάρων του ανθρώπινου καρκίνου έχουν διαδραματίσει έναν κρίσιμο ρόλο στην κατανόηση του καρκίνου μονοπάτια της νόσου, την αναγνώριση και την επικύρωση των γονιδίων στόχων του καρκίνου, και την ικανότητά μας να ελέγξουν πιθανούς αντικαρκινικά φάρμακα. Αυτές οι κυτταρικές σειρές φέρουν γενετικών μεταλλάξεων που κληρονόμησε από τους κύτταρα όγκου πηγή, αν και επιπλέον μεταλλάξεις μπορούν να αποκτηθούν κατά τη διάρκεια της ανάπτυξης κυτταρικής σειράς και το πέρασμα. Σε γενικές γραμμές, οι συγκρίσεις μεταξύ των κυτταρικών σειρών αποκαλύπτουν σημαντική ετερογένεια στην γενετικών μεταλλάξεων και αντικατοπτρίζουν μονοπάτια του καρκίνου είναι παρόμοια με εκείνα που βρέθηκαν σε πρωτογενείς όγκους. Για παράδειγμα, σύγκριση ενός πάνελ κυτταρικών γραμμών καρκίνου του μαστού με μια συλλογή από δείγματα πρωτογενούς μαστού έδειξε ότι η έκφραση των γονιδίων και αριθμό αντιγράφων προφίλ σε κυτταρικές σειρές αντικατοπτρίζουν εκείνα που βρέθηκαν τις πρωτογενείς όγκους [21]. Ομοίως, γενετικών μεταλλάξεων που αναφέρονται στην κοσμική βάση δεδομένων για κυτταρικές σειρές έχουν παρόμοια φάσματος με εκείνα πρωτογενείς όγκους [22]. Ως πρόσθετο μεγάλης κλίμακας αποτελέσματα αλληλουχίας του γονιδιώματος του όγκου είναι διαθέσιμες, υπάρχει μια αυξανόμενη ανάγκη για αντίστοιχα μοντέλα των κυττάρων να καθορίσουν τον τρόπο νέες παραλλαγές επηρεάζουν την λειτουργία της πρωτεΐνης. Ολοκληρωμένη χαρακτηρισμό της γονιδιωματικής μεταβολές σε καρκινικές κυτταρικές σειρές θα διευρύνει την κατανόηση της βιολογίας του καρκίνου, και θα μπορούσε επίσης να αποτελέσει τη βάση για την επιλογή των σχετικών μοντέλων κυτταρική γραμμή για να μελετηθεί μια συγκεκριμένη πτυχή της βιολογίας της νόσου του καρκίνου, ή για τη διαλογή ανταγωνιστές ορισμένων οδών καρκίνου.

για την αξιολόγηση των τεχνολογιών NGS και για τον χαρακτηρισμό γενετικών μεταλλάξεων σε κυτταρικές σειρές καρκίνου, έχουμε αναλύσει τα στοιχεία από την Roche Nimblegen exome σύλληψη συστοιχία και η Roche 454 NGS τεχνολογίες, εφαρμόζεται σε οκτώ χρησιμοποιούνται συνήθως κυτταρικές γραμμές που αντιπροσωπεύουν διάφορους βασικούς τύπους καρκίνου. Έχουμε αποδείξει ότι αλληλουχίας exome μπορεί να είναι ένα αξιόπιστο και οικονομικά αποδοτικό τρόπο για τον εντοπισμό γονιδιωματικής αλλαγές στο γονιδίωμα του καρκίνου, και δημιούργησε έναν περιεκτικό κατάλογο των γονιδιωματικής μεταβολές στην κωδικές περιοχές των κυτταρικών σειρών οκτώ καρκίνο.

Αποτελέσματα

σύλληψη exome και τα αποτελέσματα αλληλουχίας

σύλληψη exome και 454 τεχνολογίες αλληλουχίας εφαρμόστηκαν σε δείγματα DNA από οκτώ κυτταρικές σειρές καρκίνου (Α2780, Α549, ΟοΙο205, GTL16, NCI-H661, MDA-ΜΒ468, PC3 και RD, . όπως περιγράφεται στις μεθόδους Τα αποτελέσματα των αρχικών επεξεργασία δεδομένων συνοψίζονται στον πίνακα 1. για κάθε κυτταρική σειρά, περίπου 1,9 εκατομμύρια αλληλούχιση διαβάζει (ύψους 688 εκατ βάσεις? 98,5% του συνόλου των αλληλούχισης αναγνώσεις) θα μπορούσε να χαρτογραφηθεί με επιτυχία στο ανθρώπινο γονιδίωμα NCBI36 /hg18 συναρμολόγηση αναφοράς (https://www.ncbi.nlm.nih.gov). το μέσο μήκος αναγνώσεως σε όλες τις κυτταρικές σειρές που είναι 364 βάσεις, σύμφωνα με το μακρύ μήκος ανάγνωσης που αναφέρθηκαν για την τεχνολογία 454 αλληλούχιση. Κατά μέσο όρο, 89,5% της περίπου 180.000 εξόνια στην Nimblegen 2,1 Μ ανθρώπινη συστοιχία exome (περιφέρειες στόχος) καλύφθηκαν με ένα τουλάχιστον ανάγνωσης αλληλουχίας, και το μέσο βάθος Read Sequencing για όλες τις κυτταρικές σειρές είναι 7,3 σε περιοχές στόχους. Τα αποτελέσματα σύλληψη exome και αλληλουχίας είναι εντός του φυσιολογικού εύρους των επιδόσεων που ορίζει ο κατασκευαστής και είναι συγκρίσιμα με τα δημοσιευμένα αποτελέσματα χρησιμοποιώντας την ίδια τεχνολογία [23].

Η

Διαπιστώσαμε κατά μέσο όρο 14 340 παραλλαγές σειράς (διαφορές από το γονιδίωμα του ανθρώπου αναφοράς) ανά κυτταρική σειρά. Η πλειοψηφία αυτών των διαφορών είναι γνωστές πολυμορφισμοί σε κανονικό ανθρώπινο πληθυσμό (δηλαδή καταχωρημένη στη βάση δεδομένων NCBI dbSNP, την κατασκευή 130). Κατά μέσο όρο 2.779 παραλλαγές ανά κυτταρική σειρά δεν βρίσκονται στη βάση δεδομένων dbSNP, και ως εκ τούτου αντιπροσωπεύουν νέες παραλλαγές αλληλουχίας και /ή σωματικές μεταλλάξεις. Κατά μέσο όρο 1.904 από τις 2.779 νέες παραλλαγές είναι μη-συνώνυμα, δηλαδή δεν μεταβάλλεται κωδικόνιο ειδικότητα. Αυτές οι παραλλαγές είναι πιο πιθανό να αλλάξει τις λειτουργίες των πρωτεϊνών και να επηρεάσουν την κυτταρική φαινοτύπων.

Συμφωνία με τα αποτελέσματα του γονότυπου

Ως ένα άλλο μέσο για την εκτίμηση της ακρίβειας της αλληλουχίας exome, συγκρίναμε τα δεδομένα με τα αποτελέσματα του γονότυπου σε όλη την οκτώ κυτταρικές σειρές (Πίνακας 2). Η Array Affymetrix Genome-Wide Ανθρωπίνων SNP 6.0 είναι σχεδιασμένο να ανιχνεύει πληροφορίες γονότυπο για περίπου ένα εκατομμύριο γνωστές θέσεις SNP. Μπορεί επομένως να παρέχει ανεξάρτητη επαλήθευση των διακυμάνσεων που παρατηρήθηκαν στα δεδομένα ακολουθία exome. Για κάθε κυτταρική σειρά, εντοπίσαμε SNP Array 6,0 θέσεις με επιτυχημένες κλήσεις γονότυπο που επίσης καλύπτονται από τουλάχιστον δύο αλληλουχίας μοναδική exome διαβάζει. Η επικάλυψη απέδωσε μεταξύ 26.407 και 29.650 SNP θέσεις (ανάλογα με την κυτταρική γραμμή) για περαιτέρω ανάλυση. Συνολικά, υπήρχε ένας μέσος όρος 91% συμφωνία μεταξύ γονότυπου κλήσεις από το SNP σειρά 6.0 /Σπόροι για κατοικίδια πτηνά και αυτές που ορίζονται από αλληλούχιση exome. Στην κυτταρική σειρά RD, για παράδειγμα, 26.154 (91.5%) από 28.594 θέσεις SNP έχουν την ίδια κλήση γονότυπο (δηλαδή, ΑΑ, ΑΒ ή ΒΒ) από SNP συστοιχία 6,0 και με αλληλούχιση exome (Πίνακας 2).

αναμένεται ότι η ακρίβεια ανίχνευσης του γονότυπου με αλληλούχιση θα επηρεάζεται τόσο από το βάθος αλληλούχιση διαβάσει και με ετεροζυγωτία σε μία δεδομένη γονιδιωματική θέση. Υπολογίσαμε συμφωνία των κλήσεων γονότυπου σε βάθος ανάγνωσης αλληλουχίας διαφορά, και χωριστά για ομόζυγη ή ετερόζυγη SNPs. Όπως φαίνεται στο Σχήμα 1, συγκυρία είναι υψηλή για ομόζυγη SNPs (μέσος όρος 97%), ανεξάρτητα από αλληλούχιση διαβάσει βάθους. Συμφωνία για την ετερόζυγη αλληλόμορφα είναι χαμηλότερο, αλλά αυξάνει με το βάθος ακολουθία διαβάσει, ξεκινώντας με 31% συμφωνία σε βάθος ανάγνωσης των 3 και φτάνοντας & gt? 90% σε βάθος ανάγνωσης των 10 ή υψηλότερο. Στη θεωρία, αλληλούχιση DNA θραύσματα από μια περιοχή που περιέχει ένα ετερόζυγο SNP είναι μια διαδικασία τυχαίας δειγματοληψίας. Σε χαμηλότερες βάθος αλληλούχιση, υπάρχει μεγαλύτερη πιθανότητα να λείπει ένα από τα δύο αλληλόμορφα. Υπολογίσαμε το θεωρητικό ποσοστό ανίχνευσης και τα δύο αλληλόμορφα με αλληλούχιση σε διαφορετικά βάθη ανάγνωσης, υποθέτοντας κανένα σφάλμα στον προσδιορισμό της αλληλουχίας (Σχήμα 1, διακεκομμένη γραμμή). Σε χαμηλά βάθη ανάγνωσης, πειραματικές παρατηρήσεις μας είναι κοντά στη θεωρητική ρυθμό, δείχνοντας ότι η χαμηλή αντιστοιχία σε χαμηλά βάθη ανάγνωσης είναι πιθανό να οφείλεται στη διαδικασία δειγματοληψίας τυχαίου παρά την κακή ποιότητα των δεδομένων ακολουθίας.

Το γράφημα προβάλλει ένα οικόπεδο του μέσου όρου της αντιστοιχίας των κλήσεων γονότυπου που λαμβάνονται από το Array Affymetrix SNP 6.0 και από την αλληλούχιση exome, ως συνάρτηση της αλληλουχίας διαβάσει βάθη. Πλατεία δείκτες υποδεικνύουν αντιστοιχία σε ομόζυγη θέσεις, δείκτες διαμάντι δείχνουν συμφωνία με ετερόζυγο θέσεις. Η διακεκομμένη γραμμή δείχνει τη θεωρητική ταχύτητα ανίχνευσης ετερόζυγη θέσεις με ανάλυση αλληλουχίας (όπως περιγράφεται στις Μεθόδους). δείκτες τρίγωνο εμφανίζει μέσο αριθμό των ετερόζυγη SNP θέσεις ανά κύτταρο-γραμμή ως συνάρτηση της αλληλουχίας διαβάσετε βάθη (άξονας Υ στα δεξιά).

Η

Σύγκριση της αλληλουχίας exome με την κοσμική βάση δεδομένων των μεταλλάξεων του καρκίνου

Τα εξώνια που κωδικοποιεί την πρωτεΐνη και άμεση συνοδευτικών ακολουθίες ιντρονίου 61 κοινά γονίδια του καρκίνου έχουν προηγουμένως συστηματικά προσδιορίζεται σε περίπου 800 κυτταρικές σειρές από το Welcome Trust Sanger Institute, χρησιμοποιώντας τριχοειδή που βασίζεται αλληλουχίας [22]. Από τις οκτώ κυτταρικές σειρές σε αυτή τη μελέτη, όλα εκτός από ένα (GTL16) έχουν προβληθεί στο συγκεκριμένο έργο. Συγκρίναμε σωματικών πληροφορίες μετάλλαξη από την κοσμική βάση δεδομένων Sanger με τα αποτελέσματα αλληλούχισης exome μας για τις επτά κυτταρικές σειρές. Όπως φαίνεται στον Πίνακα 3, αλληλούχισης exome εκ νέου ανακαλύφθηκε περισσότερες από τις 21 μεταλλάξεις που αναφέρονται στην κοσμική βάση δεδομένων, συμπεριλαμβανομένων σημειακές μεταλλάξεις και μικρών εισαγωγής /διαγραφές. Οι δύο λείπουν περιπτώσεις οφείλονται στην έλλειψη κάλυψης αλληλουχίας στον τόπο του ενδιαφέροντος: η τεκμηριωμένη μετάλλαξη STK11 σε Α549 δεν είναι μετρήσιμο λόγω της έλλειψης του γονιδίου STK11 κάλυψη στα 2,1 Μ συστοιχίες ανθρώπινη exome Nimblegen, και το γονίδιο ΤΡ53 καλύπτεται από το Nimblegen σειρά αλλά δεν διαθέτει επαρκή διαβάζει στη γραμμή PC3 να εξακριβώσει σε αυτή τη μελέτη (υπάρχουν επαρκείς διαβάζει για το γονίδιο TP53 και σε άλλες γραμμές, όπως στον πίνακα 3).

η

Μεγάλες ομόζυγη διαγραφές, όπως η γνωστή διαγραφές του γονιδίου CDKN2A σε Α549 και Smad4 σε κύτταρα ΟοΙο205, δεν μπορεί να παρατηρηθεί άμεσα με αλληλούχιση exome. Αλλά μια διαγραφή των περιοχών του γονιδίου μπορεί να συναχθεί όπου το βάθος ανάγνωσης είναι μηδέν για αρκετές συνεχόμενες εξώνια (βλέπε επόμενη ενότητα για λεπτομερή συζήτηση). Όλες οι πέντε γονιδιωματικής διαγραφές αναφέρθηκε στην κοσμική βάση δεδομένων είναι αναγνωρίσιμα από τα αποτελέσματα αλληλουχίας exome (Πίνακας 3). Για παράδειγμα, στην Α549 κυτταρική γραμμή που παρατηρήσαμε 14 συνεχόμενες περιοχές γύρω γονίδιο CDKN2A με βάθος ανάγνωσης του μηδενός. Στη γραμμή κυττάρων ΟοΙο205, ένα τεκμηριωμένο διαγραφή 904 βάσεων στο γονίδιο Smad4 εκδηλώνεται ως 4 διαδοχικές περιοχές στόχους με βάθος ανάγνωσης του μηδενός.

Ανίχνευση ενισχύσεως γονιδίων και διαγραφή

Διαγραφές ή ενισχύσεις του χρωμοσωμικές τμήματα είναι κοινά αλλαγές στο γονιδίωμα του καρκίνου. Κατ ‘αρχήν, ο προσδιορισμός της αλληλουχίας διαβάσετε βάθος σε μια περιοχή θα πρέπει να είναι ανάλογη με τον αριθμό αντιγράφων του. Ωστόσο, το σχετικά μικρό βάθος ανάγνωση της παρούσας μελέτης θα μπορούσαν να δώσουν υπερβολική σημασία σε τυχαίες διακυμάνσεις σε βάθος ανάγνωσης. Μεταβλητότητα σε βάθος ανάγνωση θα μπορούσε επίσης να προκύψουν από τις τεχνικές πτυχές της διαδικασίας αλληλουχίας exome. Για παράδειγμα, η exome συλλαμβάνοντας συστοιχία μπορεί να ποικίλλει σε αποδόσεις για διαφορετικές περιοχές εξόνιο λόγω ποικιλόμορφη σύνθεση αλληλουχίας. Για να εκτιμηθεί η δυνατότητα εκτίμησης των πληροφοριών αριθμού αντιγράφων από τα δεδομένα αλληλουχίας exome μας, σε σύγκριση με μέσο όρο ακολουθία διαβάσει βάθη με τα δεδομένα αντιγράφων αριθμός εκτιμάται από την πλατφόρμα SNP6. Όπως φαίνεται στην εικόνα 2, υπάρχει μια θετική συσχέτιση μεταξύ της ακολουθίας διαβάσετε βάθος και αριθμό αντιγράφων, με Pearson συντελεστή συσχέτισης 0,41. Η διακύμανση σε βάθος ανάγνωση καθιστά δύσκολο να ανιχνεύσει με ακρίβεια χαμηλού επιπέδου αριθμού αντιγράφων αλλαγές. Από την άλλη πλευρά, θεωρούμε ότι είναι δυνατόν ακριβή ανίχνευση του γονιδίου ενισχύσεις υψηλού επιπέδου και ομόζυγη διαγραφές.

Μέση αλληλουχίας διαβάστε βάθη σε περιοχές σύλληψη σχεδιάστηκαν έναντι δεδομένων αριθμό αντιγράφων υπολογίζεται από Affymetrix SNP 6,0 δεδομένων, όπως περιγράφεται στο το τμήμα των μεθόδων. Η μπλε γραμμή δείχνει τη γραμμική παλινδρόμηση. Η coefficiency συσχέτισης Pearson (r = 0,41) της αλληλουχίας διαβάσετε βάθος και να αντιγράψετε τα δεδομένα αριθμός είναι τυπωμένος στο σχήμα.

Η

Ομόζυγη διαγραφή της περιοχής γονιδίου Smad4 έχει αναφερθεί στην κυτταρική σειρά MDA-ΜΒ468 ( Sanger COSMIC βάση δεδομένων) και επομένως είναι ενδεικτικό για τη σύγκριση των μεθόδων ανίχνευσης διαγραφή. Η αλληλούχιση διαβάσει βάθη των περιοχών εξονίου σε γονίδιο Smad4 και γύρω περιοχή προσδιορίστηκαν για MDA-ΜΒ468 και σχεδιάστηκαν σύμφωνα με χρωμοσωμική θέση τους (Σχήμα 3Α). Δεκαέξι συνεχόμενες περιοχές εξόνιο στο χρωμόσωμα 18 έχουν βάθος ανάγνωσης μηδέν στα δεδομένα για MDA-ΜΒ468. Οι γονιδιωματικές θέσεις των 16 περιφερειών εξόνιο είναι από 46.75 MB έως 46.86 MB, η οποία εκτείνεται το γονίδιο Smad4. Για σύγκριση, πραγματοποιήσαμε ανάλυση αριθμού αντιγράφων της συστοιχίας Affymetrix SNP 6,0 δεδομένων, όπως περιγράφεται στην ενότητα μεθόδων. Για MDA-ΜΒ468, αυτή η ανάλυση έδειξε μια ομόζυγη διαγραφή του γονιδιωματικής περιοχής 46,76 – 46,86 Mb στο χρωμόσωμα 18 (Εικόνα 3Β), σε καλή συμφωνία με τα αποτελέσματα από την ανάλυση βάθους ανάγνωσης.

Α. Οικόπεδα δεδομένων βάθους ανάγνωσης σε συνεχόμενες εξώνια γύρω από την περιοχή του γονιδίου Smad4 για χρωμοσωμικές 18. Η μπλε γραμμή δείχνει αλληλουχίας διαβάσει δεδομένα βάθους για MDA-ΜΒ468, και το ροζ γραμμή δείχνει το μεσαίο αλληλουχίας διαβάσει βάθος οκτώ κυτταρικές σειρές. B. αριθμού αντιγράφων δεδομένων από Affymetrix SNP6 δεδομένα τσιπ γύρω από την περιοχή του γονιδίου Smad4 επί χρωμοσωμικό 18. Η μαύρη γραμμή δείχνει τα δεδομένα τμηματικό αριθμό αντιγράφων (αναλογία log2 σε φυσιολογικά δείγματα) που παράγεται από τη δέσμη aroma.affymetrx σε R, όπως περιγράφεται στην ενότητα μεθόδους τμήμα.

η

Ένα βάθος ανάγνωσης μηδέν θα μπορούσε να προκύψει από τα τεχνικά ζητήματα, όπως ο σχεδιασμός καθετήρα στη συστοιχία Nimblegen 2.1 Μ. Στην πραγματικότητα, εντοπίσαμε 2.513 περιοχές εξόνιο που έχουν βάθος ανάγνωσης μηδέν για όλες τις κυτταρικές σειρές 8 (Πίνακας S1). Ωστόσο, δεδομένου ότι η διάμεση διαβάσει βάθος σε όλες τις κυτταρικές σειρές 8 είναι μεγαλύτερη από το μηδέν για όλες τις 16 περιοχές εξονίου (Σχήμα 3Α), είναι απίθανο ότι η παρατηρούμενη βάθος του μηδέν στην κυτταρική σειρά MDA-ΜΒ468 οφείλεται σε συστηματική παράλειψη της δέσμευσης exome. Τυχαία διακύμανση σε βάθος ανάγνωση είναι ένας άλλος λόγος για την έλλειψη κάλυψης αλληλουχίας. Στην κυτταρική σειρά MDA-ΜΒ468, υπάρχουν 17.161 εξόνιο περιοχές με βάθος ανάγνωσης του μηδενός (από 194.706 σύνολο περιοχών, εξαιρουμένων των 2.513 περιοχές που αναφέρονται παραπάνω). Είναι εξαιρετικά απίθανο ότι 16 συνεχόμενες περιοχές εξόνιο γύρω γονίδιο Smad4 θα έχουν βάθος ανάγνωσης μηδέν οφείλεται σε τυχαία διακύμανση (p = 1.3e-17, η οποία υπολογίζεται από την διωνυμική κατανομή).

Θα ήταν επίσης σε θέση να αποκαταστήσει -Εντοπισμός τεκμηριωθεί προηγουμένως γεγονότα ενίσχυση γονιδίου χρησιμοποιώντας τα δεδομένα βάθους ανάγνωσης. Για παράδειγμα, η ενίσχυση του EGFR1 στην κυτταρική σειρά MDA-ΜΒ468 έχει τεκμηριωθεί με φθορισμό in situ υβριδισμού και με ποσοτική PCR [24]. Παρατηρήσαμε ότι οι 53 περιφέρειες εξόνιο γύρω από το γονίδιο EGFR στο χρωμόσωμα 7 έχουν πολύ υψηλή βάθη ανάγνωσης στα δεδομένα MDA-ΜΒ468 (Σχήμα 4Α? Οι εξώνια μεταξύ 55,58 έως 55,73 Mb έχουν ένα μέσο βάθος ανάγνωση του 107). Μας ανάλυση αριθμού αντιγράφων της συστοιχίας Affymetrix SNP υποδεικνύονται επίσης 6.0 δεδομένα ότι η περιοχή του γονιδίου EGFR είναι ιδιαίτερα ενισχυμένο στη γραμμή MDA-ΜΒ468 (Σχήμα 4Β, γονιδιωματική περιοχή 55,48 – 55,81 Mb).

A. Οικόπεδα δεδομένων βάθους ανάγνωσης σε συνεχόμενες εξώνια γύρω από την περιοχή του γονιδίου EGFR σε χρωμοσωμικές 7. Η μπλε γραμμή δείχνει αλληλουχίας διαβάσει δεδομένα βάθους για MDA-ΜΒ468, και η ροζ γραμμή δείχνει το μεσαίο βάθος ανάγνωσης αλληλουχίας των οκτώ κυτταρικών σειρών. B. αριθμού αντιγράφων δεδομένων από Affymetrix SNP6 δεδομένα τσιπ γύρω από την περιοχή του γονιδίου EGFR σε χρωμοσωμικό 7. Η μαύρη γραμμή δείχνει τα δεδομένα τμηματικό αριθμό αντιγράφων (αναλογία log2 σε φυσιολογικά δείγματα) που παράγεται από τη δέσμη aroma.affymetrx σε R, όπως περιγράφεται στην ενότητα μεθόδους τμήμα.

Η

Μυθιστόρημα μη συνώνυμες παραλλαγές σε πρωτεϊνικών κινασών

Από μεταλλάξεις σε κινάσες πρωτεΐνης έχουν σημαντικούς ρόλους στη βιολογία του καρκίνου, επιλέξαμε να εξετάσουμε τα δεδομένα ακολουθίας για πρωτεϊνικών κινασών και την εστίαση σε μη-συνώνυμη παραλλαγές, οι οποίες παράγουν υποκαταστάσεις αμινοξέων που μπορεί να έχουν λειτουργικές συνέπειες. Όπως σημειώνεται παραπάνω, ο προσδιορισμός αλληλουχίας exome αποκάλυψε περίπου 2.000 νέες μη συνώνυμες παραλλαγές σε κάθε μία από τις οκτώ κυτταρικές σειρές. Μετά την εφαρμογή μίας αυστηρής φίλτρο (όπως περιγράφεται στις Μεθόδους), μεταξύ 199 να 479 γονίδια έχουν νέα μη συνώνυμες παραλλαγές, ανάλογα με την κυτταρική σειρά (Πίνακας S2). Η Nimblegen 2,1 Μ συστοιχία σύλληψης που χρησιμοποιούνται σε αυτή τη μελέτη περιλαμβάνονται εξόνια για 440 από τα 518 πρωτεϊνικές κινάσες στο ανθρώπινο γονιδίωμα (Πίνακας S3) [25]. Σε κάθε κυτταρική σειρά, κατά μέσο όρο 122 μη συνώνυμες παραλλαγές ανιχνεύθηκαν σε κινάσης γονίδια. Μετά την απομάκρυνση πιθανόν παραλλαγές βλαστικής σειράς (που βρίσκεται στο dbSNP) και εφαρμόζοντας μια αυστηρή φίλτρο που περιγράφεται ανωτέρω, κάθε κυτταρική σειρά έχει ένα μέσο όρο οκτώ κινάσες με μη συνώνυμες παραλλαγές (Πίνακας 4). Αυτές οι παραλλαγές αλληλουχίας σε πρωτεϊνικές κινάσες που αναφέρονται στον Πίνακα 5. Οι περισσότερες από αυτές τις παραλλαγές ακολουθίας δεν αναφέρονται στην κοσμική βάση δεδομένων ή αναφέρονται στη βιβλιογραφία, αλλά πολλά έχουν ανεξάρτητη επιβεβαίωση. Για παράδειγμα, εντοπίσαμε EGFR παραλλαγή A1048V στο γαστρικό κυτταρική σειρά GTL16. Η ίδια παραλλαγή στην EGFR έχει αναφερθεί στο γαστρικό κυτταρική γραμμή ΜΚΝ45 [26], η οποία είναι η γονική κυτταρική γραμμή του GTL16 [27]. Ένα δεύτερο παράδειγμα είναι η παραλλαγή R796S του γονιδίου του υποδοχέα της ινσουλίνης (INSR) στην κυτταρική σειρά RD (Πίνακας 5). Είχαμε προηγουμένως εντοπιστεί αυτή την παραλλαγή στο RD κυτταρική σειρά με τη χρήση της τεχνολογίας των τριχοειδών αλληλουχίας (τα δεδομένα δεν παρουσιάζονται).

Η

Συζήτηση

Η ανάλυση των δεδομένων από οκτώ διαφορετικές γραμμές δείχνει καρκινικών κυττάρων ότι η Roche Nimblegen και 454 τεχνολογίες αλληλουχίας exome μπορεί να εφαρμοστεί με επιτυχία για τον εντοπισμό μεταβολών σε περιοχές του γονιδίου κωδικοποίησης. Από δεδομένα προσδιορισμού αλληλουχίας με ένα μέσο όρο 7,3 φορές κάλυψη, οι παραλλαγές από το γονιδίωμα αναφοράς NCBI36 ταυτοποιήθηκαν σε περίπου 8% (14.340 περιφέρειες) όλων των περιοχών στόχου στη συστοιχία σύλληψη exome. Ενώ η πλειοψηφία αυτών των παραλλαγών μπορεί να επιβεβαιωθεί στη βάση δεδομένων dbSNP, κατά μέσο όρο 0,16% (2779) των συνολικών περιοχών στόχου φέρει μια νέα παραλλαγή.

Μια σύγκριση των SNP γονότυπο κλήσεις από αλληλούχιση exome με τα στοιχεία που προκύπτουν από την Affymetrix Genome-Wide Ανθρωπίνων SNP Array 6.0 έδειξε ότι υπάρχει μεγάλη αντιστοιχία μεταξύ των δύο τεχνολογικές πλατφόρμες. Η συμφωνία είναι 97% για την ομόζυγη χώρους, και κυμαίνεται από 30% έως & gt? 90% σε ετερόζυγη θέσεις, με ακρίβεια εξαρτάται από την αλληλούχιση διαβάσει βάθος. Η ανάλυσή μας της σχέσης μεταξύ βάθος ανάγνωση και τη δύναμη της ανίχνευσης πρότεινε ότι τουλάχιστον δέκα φορές διαβάσει το βάθος είναι απαραίτητη για την αξιοπιστία ανίχνευση δύο αλληλόμορφα σε ετερόζυγη sites. Τα αποτελέσματα αυτά παρέχουν καθοδήγηση στο σχεδιασμό των μελλοντικών προγραμμάτων γονιδιώματος.

Για το επτά εξετάζονται κυτταρικές σειρές που είναι επίσης παρούσα στην κοσμική βάση δεδομένων, δείχνουμε ότι 19 από 21 γνωστές μεταλλάξεις μπορούν να επαναχρησιμοποιηθούν ανακαλύφθηκε από τον προσδιορισμό της αλληλουχίας exome. Δύο μεταλλάξεις που περιγράφηκαν προηγουμένως έλειπαν λόγω έλλειψης κάλυψης αλληλουχίας. Σε μία περίπτωση, αυτό οφειλόταν στην ελλιπή κάλυψη του ανθρώπινου exome στο Nimblegen 2.1 Μ συστοιχία σύλληψη, υποδεικνύοντας την ανάγκη για βελτιώσεις στο σχεδιασμό του πίνακα.

Με την επιτυχή εκ νέου προσδιορισμό της ενίσχυσης του EGFR και την ομόζυγη διαγραφή Smad4 στην κυτταρική σειρά MDA-ΜΒ468, έχουμε αποδείξει ότι ο αριθμός αντιγράφων αλλαγές μπορεί να συναχθεί από τα δεδομένα βάθους ανάγνωσης αλληλουχίας. Ωστόσο, λόγω της στοχαστικής φύσεως του βάθους ανάγνωσης αλληλουχίας και πιθανόν ανωμαλίες στη διαδικασία exome σύλληψη, σε γενικές γραμμές δεν είναι δυνατό να εκτιμηθεί αξιόπιστα πληροφορίες αριθμού αντιγράφων από τα δεδομένα μας. Εφαρμόζοντας την τεχνολογία για περισσότερα δείγματα θα βοηθήσει να βελτιώσουν την ικανότητά μας να εκτιμούμε και να διορθώσει για συστηματικών τάσεων στην πλατφόρμα, και αυξάνοντας το βάθος της αλληλουχίας διαβάζει θα μειώσει τη διακύμανση που οφείλεται σε τυχαία διακύμανση διαβάσετε αριθμό.

Για να φέρετε το πλαίσιο στο γονιδιακό παραλλαγή που προσδιορίζονται στην παρούσα μελέτη, επιλέξαμε να επικεντρωθεί σε πρωτεϊνικές κινάσες ως ενδεικτικό τάξη. Στην εργασία αυτή, εντοπίσαμε με υψηλή εμπιστοσύνη τουλάχιστον τέσσερις νέες κινάσες παραλλαγή πρωτεΐνης σε κάθε κυτταρική σειρά. Τα περισσότερα από τα νέα παραλλαγές αλληλουχίας σε πρωτεϊνικές κινάσες που προσδιορίζονται στην παρούσα μελέτη δεν έχουν προηγουμένως αναφερθεί, και πιθανώς αντικατοπτρίζει την υψηλή ποικιλότητα του γονιδιωματική μεταβολή σε καρκίνο. Τα αποτελέσματά μας επεκτείνουν τη γνώση των παραλλαγών αλληλουχίας σε πρωτεϊνικές κινάσες και άλλα πιθανά γονίδια σχετίζονται με τον καρκίνο. Αυτές οι νέες παραλλαγές μπορεί να είναι είτε βλαστικής σειράς SNPs δεν έχει ακόμη δημοσιευθεί στη βάση δεδομένων dbSNP, ή σωματικές μεταλλάξεις σε αυτά τα καρκινικά κύτταρα. Αρκετά μεγάλης κλίμακας έργα αλληλουχίας του ανθρώπινου γονιδιώματος που βρίσκεται σε εξέλιξη θα επεκτείνει την αναγνώριση της βλαστικής σειράς SNPs και να βοηθήσει να κατηγοριοποιήσει τη φύση των νέων παραλλαγών που βρέθηκαν σε όγκους.

Εν κατακλείδι, δείξαμε ότι αλληλουχίας exome μπορεί να είναι μια αξιόπιστη και οικονομικά -Η προσέγγιση για τον εντοπισμό γονιδιωματικής μεταβολές σε καρκινικές κυτταρικές σειρές, και προτείνει τρόπους για την περαιτέρω βελτίωση των τεχνολογιών exome-αλληλουχίας για εφαρμογές στον τομέα της γονιδιωματικής καρκίνο. Μια πλήρης κατάλογος των γονιδιωματικής αλλαγές στις κωδικές περιοχές των κυτταρικών σειρών οκτώ καρκίνο δημιουργήθηκε, η οποία θα πρέπει να συμβάλει όχι μόνο στη γνώση μας για αυτά τα μοντέλα ειδικότερα, αλλά και στην κατανόηση της γονιδιωματικής καρκίνο και της βιολογίας του καρκίνου γενικότερα.

Υλικά και Μέθοδοι

Παρασκευή DNA

Α2780, Α549, ΟοΙο205, GTL16, NCI-H661, MDA-ΜΒ468, PC3 και RD κυτταρικές σειρές είχαν αρχικά ληφθεί από την ATCC. Οι κυτταρικές σειρές αναπτύχθηκαν σε RPMI 1640 (Gibco) με 10% θερμο-απενεργοποιημένο εμβρυϊκό βόειο ορό (FBS? Cellgro) με την εξαίρεση της RD (επιπλέον 25 mM HEPES) και Α549 (F12 του Ham (Gibco), με 10% FBS). Γονιδιακού DNA (10 μg) παρασκευάστηκε από QIAamp DNA Mini Kit (Qiagen) χρησιμοποιώντας πρωτόκολλα των κατασκευαστών, και παρέχονται στον αλληλουχίας Κέντρο Roche 454.

exome Σύλληψη και Next-Generation Sequencing

exome σύλληψη και αλληλούχιση επόμενης γενιάς διεξήχθη από τη Roche NimbleGen και Roche 454 Life Science σύμφωνα με τα πρωτόκολλα του κατασκευαστή. Γονιδιακού DNA συνελήφθη στο Nimblegen Ακολουθία Σύλληψη Ανθρωπίνων exome 2.1 Μ Array, η οποία έχει 197.218 συνολική περιοχές (περιοχές δέσμευσης) που καλύπτει περίπου 175.278 εξώνια και περιοχές miRNA (περιφέρειες στόχου, μεγάλη περιοχή στόχος μπορεί να αποτελείται από αρκετές περιοχές δέσμευσης). Για κάθε κυτταρική γραμμή, δεν σταματούν DNA υποβλήθηκε σε καθορισμό αλληλουχίας με δύο τρεξίματα της τεχνολογίας Sequencing 454 GS FLX Titanium.

Array-based γονοτυπικός και αριθμού αντιγράφων Ανάλυση

Δύο κλάσματα των 250 ng γονιδιωματικού DNA ανά δείγματος υπέστησαν πέψη με ένζυμα περιορισμού NspI και StyI, αντίστοιχα. Τα προϊόντα προέκυψαν συνδέθηκαν με τις αντίστοιχες προσαρμογείς και ενισχύθηκε με PCR. Τα επισημασμένα προϊόντα PCR υβριδοποιήθηκε με τον Affymetrix Genome-Wide Ανθρώπινα SNP Array 6.0 σύμφωνα με τις συστάσεις του κατασκευαστή. Ο αλγόριθμος Σπόροι για κατοικίδια πτηνά [28] εφαρμόζονται σε Affymetrix Power Tools Package (APT) Λογισμικό (έκδοση 1.10.0) χρησιμοποιήθηκε για τον προσδιορισμό του γονότυπου. Για την ανάλυση αριθμού αντιγράφων, τα αρχεία Cel υποβλήθηκαν σε επεξεργασία με τη χρήση του πακέτου aroma.affymetrix [29] για το R-project. Κατάτμηση των κανονικοποιημένων δεδομένων αριθμό πρώτων αντίγραφο έγινε με τον αλγόριθμο CBS [30] εφαρμόζονται στο πακέτο aroma.affymetrix

Βιοπληροφορική ανάλυση

Το ανθρώπινο γονιδίωμα NCBI36 /συναρμολόγησης αναφορά hg18 (http: /. /www.ncbi.nlm.nih.gov/genome/guide/human/release_notes.html#b36) χρησιμοποιήθηκε ως πλαίσιο για όλες τις αναλύσεις. επεξεργασίας αλληλουχίας δεδομένων, τη χαρτογράφηση στο ανθρώπινο γονιδίωμα, και την αρχική κλήσεις μεταβολής από την αλληλουχία αναφοράς διεξήχθησαν από την Roche 454 Life Science χρησιμοποιώντας λογισμικό GS Mapper Αναφοράς (Roche Inc.). Για να χαρακτηριστεί ως μια παραλλαγή από την αλληλουχία του γονιδιώματος αναφοράς, πρέπει να υπάρχουν τουλάχιστον δύο ανεξάρτητες διαβάζει ότι 1) δείχνουν τη διαφορά, 2) έχουν τουλάχιστον 5 βάσεις και στις δύο πλευρές της διαφοράς, και 3) έχουν μερικές άλλες διαφορές απομονωμένη αλληλουχία σε η ανάγνωση. Παραλλαγές που προσδιορίζονται ως «υψηλή εμπιστοσύνη» υπέκειντο σε αυστηρότερη φίλτρο, που απαιτεί τουλάχιστον τρεις ανεξάρτητες διαβάζει με την παραλλαγή περιλαμβάνει τουλάχιστον το 40% του συνόλου των ανεξάρτητων διαβάζει καλύπτει τη γονιδιωματική θέση αλληλόμορφο. Για τον εντοπισμό μη-συνώνυμη παραλλαγές, ο αντίκτυπος της κάθε παραλλαγής για μεταφραζόμενη αλληλουχία της πρωτεΐνης εκτιμήθηκε με τη χαρτογράφηση γενωμική συντεταγμένες του πίσω γονίδια στη συλλογή REFSEQ [31] απελευθερώσει 37, και τον εντοπισμό των αλλαγών στην ειδικότητα κωδικόνιο.

Εμείς υπολογίζεται το θεωρητικό ποσοστό ανίχνευσης σε ετερόζυγο θέσεις ως συνάρτηση του διαφορετικού βάθους ως εξής: Ν αλληλουχίας διαβάζει καλύπτουν ένα ετερόζυγο θέση θα μπορούσε να θεωρηθεί ως τυχαία δειγματοληψία από τα δύο αλληλόμορφα επαναλαμβάνεται Ν φορές, έτσι πρέπει να ακολουθήσει την διωνυμική κατανομή. Υποθέτοντας ότι το αλληλόμορφο Α αναφερθεί στο γονιδίωμα αναφοράς του ανθρώπου και των αλληλόμορφο Β είναι το αλληλόμορφο παραλλαγή, θα απαιτήσει τουλάχιστον δύο αλληλουχίας διαβάζει με το αλληλόμορφο Β για την κήρυξη ανίχνευση αλληλόμορφο Β, η πιθανότητα ανίχνευσης και τα δύο αλληλόμορφα Α και Β σε ένα ετερόζυγο θέση μπορεί να υπολογιστεί ως: PAB = 1-P1-P2. P1 είναι η πιθανότητα εύρεσης 0 ή 1 ανάγνωσης με το Α αλληλόμορφο στο Ν αλληλουχίας διαβάζει σύμφωνα με την διωνυμική κατανομή, η οποία θα οδηγήσει σε μια κλήση γονότυπο ΑΑ. P2 είναι η πιθανότητα εύρεσης Ν διαβάζει με το αλληλόμορφο Β στο Ν αλληλουχίας διαβάζει σύμφωνα με την διωνυμική κατανομή, η οποία θα οδηγήσει σε μια κλήση γονότυπο ΒΒ.

Υποστήριξη Πληροφορίες

Πίνακα S1. περιοχές

Ενίσχυση του Όγκου που έχουν βάθος μηδέν ανάγνωσης σε όλες τις κυτταρικές σειρές 8

doi:. 10.1371 /journal.pone.0021097.s001

(XLS)

Πίνακας S2.

Όλα τα νέα μη συνώνυμες παραλλαγές σε οκτώ κυτταρικές γραμμές

doi:. 10.1371 /journal.pone.0021097.s002

(XLS)

Πίνακα S3.

440 γονίδια πρωτεϊνικής κινάσης που καλύπτονται από την Nimblegen πίνακα 2.1 Μ σύλληψη

doi:. 10.1371 /journal.pone.0021097.s003

(XLS)

Ευχαριστίες

ευχαριστώ Charles Tilford και Jansen Lim για τη βοήθειά τους στην παροχή γονιδιωματική συντεταγμένες για τα γονίδια στο ανθρώπινο γονιδίωμα. Ευχαριστούμε επίσης Roche NimbleGen και η Roche 454 Life Science για την εκτέλεση σύλληψη exome, 454 GS FLX Titanium αλληλουχίας τρέχει, και την επεξεργασία των δεδομένων.

You must be logged into post a comment.