PLoS One: βλαστικής σειράς Μεταβολή στον Καρκίνο-Ευαισθησία γονίδια σε ένα υγιές, ancestrally Διάφορα Cohort: Συνέπειες για Ατομική Γονιδιώματος Sequencing


Αφηρημένο

Η τεχνολογική πρόοδος σε συνδυασμό με τη μείωση του κόστος φέρνοντας ολόκληρο το γονιδίωμα και αλληλούχιση ολόκληρη exome πιο κοντά στη ρουτίνα κλινική χρήση. Ένα από τα εμπόδια για την κλινική εφαρμογή είναι ο μεγάλος αριθμός των παραλλαγών άγνωστης σημασίας. Για τα γονίδια του καρκίνου-ευαισθησίας, η δυσκολία στην ερμηνεία την κλινική συνάφεια των γονιδιωματικών παραλλαγών επιδεινώνεται από το γεγονός ότι τα περισσότερα από αυτό που είναι γνωστό για αυτές τις παραλλαγές προέρχεται από τη μελέτη των ιδιαίτερα επιλεγμένους πληθυσμούς, όπως ασθενείς με καρκίνο ή τα άτομα με οικογενειακό ιστορικό του καρκίνου. Η γενετική παραλλαγή σε γνωστά γονίδια του καρκίνου-ευαισθησία στο γενικό πληθυσμό δεν έχει χαρακτηριστεί μέχρι σήμερα. Για την αντιμετώπιση αυτού του κενού, έχουμε προφίλ του nonsynonymous γενωμική μεταβολή σε 158 γονίδια εμπλέκονται αιτιολογικά στην καρκινογένεση, χρησιμοποιώντας υψηλής ποιότητας σειρές ολόκληρο το γονιδίωμα από ένα ancestrally ποικιλόμορφη ομάδα των 681 υγιή άτομα. Βρήκαμε ότι όλα τα άτομα φέρουν πολλαπλές παραλλαγές που μπορεί να επηρεάσουν την ευαισθησία του καρκίνου, με μέσο όρο 68 παραλλαγές ανά άτομο. Από τους 2.688 αλληλόμορφων παραλλαγών που προσδιορίζονται στην ομάδα αυτή, οι περισσότεροι είναι πολύ σπάνια, με το 75% βρίσκονται σε μόνο 1 ή 2 άτομα στον πληθυσμό μας. Αλληλόμορφων συχνότητες κυμαίνονται μεταξύ προγονική ομάδες, και υπάρχουν 21 παραλλαγές για τις οποίες ο ελάχιστο αλληλόμορφο σε ένα πληθυσμό είναι η κύρια αλληλόμορφο άλλο. Λεπτομερής ανάλυση ενός επιλεγμένου υποσυνόλου 5 κλινικά σημαντικών γονιδίων του καρκίνου,

BRCA1

,

BRCA2

,

KRAS

,

TP53

, και

PTEN

, επισημαίνει τις διαφορές μεταξύ των παραλλαγών βλαστικής σειράς και ανέφερε σωματικών μεταλλάξεων. Το σύνολο δεδομένων μπορεί να εξυπηρετήσει έναν πόρο της γενετικής ποικιλομορφίας στα γονίδια του καρκίνου-ευαισθησία σε 6 ομάδες καταγωγή, ένα σημαντικό θεμέλιο για την ερμηνεία του κινδύνου καρκίνου από την προσωπική αλληλουχίες γονιδιώματος

Παράθεση:. Bodian DL, McCutcheon JN, Kothiyal P, Huddleston KC, Iyer RK, Vockley JG, et al. (2014) βλαστικής γραμμής Διακύμανση του Καρκίνου-Ευαισθησία γονίδια σε ένα υγιές, ancestrally Διάφορα Cohort: Συνέπειες για Ατομική Genome Sequencing. PLoS ONE 9 (4): e94554. doi: 10.1371 /journal.pone.0094554

Επιμέλεια: Paolo Peterlongo, IFOM, Fondazione Istituto di FIRC Oncologia Molecolare, Ιταλία

Ελήφθη: 25 Σεπτεμβρίου 2013? Αποδεκτές: 17 Φεβρουαρίου, 2014? Δημοσιεύθηκε: 11 Απριλίου 2014

Copyright: © 2014 Bodian et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Αυτή η έρευνα χρηματοδοτήθηκε εξ ολοκλήρου από το Σύστημα Υγείας Inova. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:. JN McCutcheon σήμερα απασχολούνται από Life Technologies και δεν κατέχει διπλώματα ευρεσιτεχνίας ή απόθεμα η εταιρία. Αυτό δεν αλλάζει την τήρηση των συγγραφέων να PLoS ONE πολιτικές για την ανταλλαγή δεδομένων και υλικών.

Εισαγωγή

Προκαταβολές σε τεχνολογίες αλληλουχίας και μείωση του κόστους καθιστώντας ολόκληρη γονιδιώματος (ΠΓΣ) και αλληλουχίας ολόκληρη exome (WES) όλο και περισσότερο προσιτή και μπορεί να επιτρέψει τη μετάβαση από ερευνητικές εφαρμογές και η γονιδιωματική των καταναλωτών για την καθημερινή κλινική φροντίδα. Ωστόσο, η ευρεία αποδοχή στην κλινική έχει παρακωλυθεί κατά κύριο λόγο από τους περιορισμούς στις τρέχουσες γνώσεις μας για την κλινική σημασία των ανιχνεύονται παραλλαγές ακολουθίας.

Στην ογκολογία, WGS /WES σήμερα χρησιμοποιείται κυρίως για τον εντοπισμό σωματικές μεταλλάξεις στους όγκους. Οι βλαστικής σειράς παραλλαγές επηρεάζουν την προδιάθεση του καρκίνου ή την εξέλιξη της νόσου συνήθως προσδιορίζονται από στοχευμένες επανεύρεση της αλληλουχίας των γονιδίων ενδιαφέροντος, όπως

BRCA1

και

BRCA2

. Όπως γίνεται ευρύτερα υιοθετηθεί WGS /WES, ανάλυση διακύμανσης βλαστικής σειράς θα κινηθεί από μόνο γονίδιο προσεγγίσεις για αναλύσεις που βασίζονται σε πολλαπλά γονίδια που σχετίζονται με τον καρκίνο, και το δοκιμαζόμενο πληθυσμό θα επεκταθεί από άτομα υψηλού κινδύνου στο γενικό πληθυσμό.

Η ερμηνεία αυτών των δεδομένων απαιτεί την κατανόηση της μεταβολής σε γονίδια κινδύνου που σχετίζεται με τον καρκίνο σε υγιή άτομα, η οποία είναι σε μεγάλο βαθμό μη χαρακτηρισμένο. Οι περισσότερες γνώσεις βλαστική διακύμανση καρκίνο ευαισθησία γονίδια έχει έρθει από άτομα που έχουν ιατρικός λόγος να αλληλουχία [1], και έτσι δεν είναι αντιπροσωπευτικό του γενικού πληθυσμού. Άλλες πληροφορίες έχει έρθει από κυτταρικές σειρές και ζωικά μοντέλα και όχι πρωτογενή κύτταρα του ασθενούς [2]. Τα άτομα που μελετήθηκαν είναι κυρίως της ευρωπαϊκής καταγωγής [1], [3], αλλά αμφότερες οι αλληλουχίες του γονιδιώματος και του κινδύνου καρκίνου διαφέρουν μεταξύ των ομάδων καταγωγή [4]. Επιπλέον, μελέτες έχουν επικεντρωθεί στην αλληλόμορφα ευαισθησίας υψηλής διεισδυτικότητας, αλλά ο καρκίνος είναι γενικά το αποτέλεσμα των συνδυασμένων επιπτώσεων της χαμηλής έως αλληλόμορφα κινδύνου μέτρια διεισδυτικότητα και περιβαλλοντικών παραγόντων [5].

Ο στόχος αυτής της μελέτης είναι να χαρακτηριστεί η διακύμανση γονίδια του καρκίνου-ευαισθησία σε ένα γενικό πληθυσμό. Για την επίτευξη αυτού του στόχου, έχουμε προφίλ του nonsynonymous διακύμανση 158 γονίδια του καρκίνου με τη χρήση δεδομένων από υψηλής ποιότητας σειρές ολόκληρο το γονιδίωμα από ένα ancestrally ποικιλόμορφη ομάδα των 681 ατόμων. Έχουμε, επίσης, χαρακτηρίζεται λεπτομερώς τις παραλλαγές σε πέντε γονίδια ιδιαίτερο κλινικό ενδιαφέρον,

BRCA1

,

BRCA2

,

KRAS

,

TP53

, και

PTEN

. Τα αποτελέσματα μπορεί να χρησιμεύσει ως σημείο αναφοράς για τη διακύμανση των 158 καρκίνου ευαισθησία γονιδίων στο γενικό πληθυσμό και έχουν σημαντικές επιπτώσεις για την ερμηνεία της κλινικής WGS /WES.

Μέθοδοι

Δήλωση Ηθικής

τα άτομα προσλήφθηκαν στο Inova Fairfax νοσοκομείο κατά τη διάρκεια 2011-2012 και έχουν εγγραφεί σε κλινική μελέτη του Inova Translational Medicine Institute με τίτλο «Μοριακή μελέτη του πρόωρου τοκετού.» Όλοι οι συμμετέχοντες στη μελέτη με την προϋπόθεση έγγραφη συγκατάθεση για τη χρήση των αλληλουχιών γονιδιώματος τους ερευνητικούς σκοπούς. Η «Μοριακή μελέτη του πρόωρου τοκετού» εγκρίθηκε από το Διοικητικό Συμβούλιο Institutional Review του Συστήματος Υγείας Inova και του Διοικητικού κριτική Δυτική Θεσμική (# 1124761). Οι αναλύσεις που αναφέρονται εδώ ήταν μέρος μιας έρευνας του ρόλου των γονιδίων του καρκίνου ευαισθησία στην αιτιολογία του πρόωρου τοκετού, μια περιοχή της έρευνας υποκινούνται από τις ομοιότητες μεταξύ της κύησης και κακοήθειας [6], [7].

Οι συμμετέχοντες

Η ομάδα για την ανάλυση αυτή αποτελείται από 681 ενήλικες από 352 οικογένειες, που αποτελείται από 337 άνδρες ηλικίας 18-50 (διάμεση τιμή 34) και 344 γυναίκες ηλικίας 18-44 (διάμεση τιμή 32). Κανένα από τα άτομα που είναι συγγενείς πρώτου βαθμού, όπως επιβεβαιώνεται από γονιδιωματική ανάλυση. Η χώρα γέννησης των θεμάτων και οι γονείς τους αυτο-αναφερθεί. Η ομάδα είναι αντιπροσωπευτικό του πληθυσμού της Βόρειας Βιρτζίνια και του πληθυσμού από τον τοκετό στο Inova Fairfax Νοσοκομείο από τη φυλή, την εθνικότητα και την κοινωνικοοικονομική κατάσταση [8]. Περίπου το ένα τρίτο των υποκειμένων (34% των ανδρών και το 35% των γυναικών) εντάχθηκαν στη μελέτη ως γονείς ενός πρόωρου νεογνού, και τα δύο τρίτα ως πλήρη όρος ελέγχους. Δεν παρατηρήθηκε σημαντική συσχέτιση μεταξύ των παραλλαγών γονιδίων του καρκίνου και τη διάρκεια καθεστώς βρέθηκε.

Αυτο-έκθεση ερωτηματολόγια και νοσοκομειακών ιατρικών αρχείων εξετάστηκαν για το καθεστώς του καρκίνου. Τρία άτομα είχαν μια διάγνωση καρκίνου πριν από την εγγραφή τους: ένας άνδρας με καρκίνο του νεφρού, ένας άνδρας με καρκίνο του άγνωστου τύπου, και μία γυναίκα με καρκίνο του μαστού. Κανένας από τους συμμετέχοντες ανέφεραν μια προσωπική και οικογενειακή ιστορία ενδεικτική μιας εξαιρετικά διεισδυτικό καρκίνο προδιαθέτουν μετάλλαξη βλαστικής σειράς, δηλαδή πρώιμη ηλικία έναρξης ή /και πολλαπλές επηρεάζονται τα μέλη της οικογένειας.

Δείγματα και αλληλούχιση

Σύνολο δείγματα αίματος συλλέχθηκαν από όλα τα άτομα σε BD Vacutainer K2-EDTA σωλήνες. εκχύλιση Γονιδιωματικό DNA πραγματοποιήθηκε στο QiaSymphony αυτοματοποιημένη εξολκέα DNA χρησιμοποιώντας το κιτ DNA Midi (QIAGEN Inc., Valencia, CA). Τα δείγματα εστάλησαν σε Συμπληρώστε Genomics (Mountain View, CA) για ολόκληρη την αλληλούχιση του γονιδιώματος, τη συναρμολόγηση και παραλλαγή καλώντας [9], [10]. Αλληλούχιση διεξήχθη με την τεχνολογία συστοιχίας του DNA nanoball. αλληλουχίες γονιδιώματος συναρμολογήθηκαν με εκδόσεις Συνέλευση Pipeline Complete Genomics », 2.0.0-2.0.3 χρησιμοποιώντας το NCBI χτίσει 37 συναρμολόγησης (hg19) αναφορά του ανθρώπινου γονιδιώματος [11]. στατιστικές κάλυψη υπολογίστηκαν χρησιμοποιώντας το βάρος αθροίσματος βάθος κάλυψη ακολουθία. Κατά μέσο όρο, το 70% του κάθε γονιδιώματος και το 80% κάθε exome είχε & gt? 40x κάλυψη. Παραλλαγές από τα αρχεία masterVar από όλα τα γονιδιώματα συγχωνεύθηκαν σε ένα ενιαίο αρχείο ΤΚΚ v4.1 με mkvcf (β) από τα εργαλεία σουίτα CGA, έκδοση 1.6.0.

σχολιασμούς Gene υπολογίστηκαν με μια τροποποιημένη έκδοση του πακέτο λογισμικού GLU, έκδοση 1.0b3-prerelease4 [12], χρησιμοποιώντας γονιδίωμα συντεταγμένες εξώνια, μεταγραφές και περιοχές κωδικοποίησης από το UCSC γονιδίωμα Browser πίνακα knownGene [13]. Προβλεπόμενη αλλαγές αλληλουχία πρωτεΐνης υπολογίστηκαν μεταφράζοντας την κωδικοποιητική περιοχή του κάθε μεταγραφήματος και την αναφορά. Προστέθηκαν Πρόσθετες σχολιασμούς από dbSNP 137 [14], COSMIC έκδοση 65 [15], HGMD Professional 2012,3 (BIOBASE), και PolyPhen-2 [16], [17] χρησιμοποιώντας το εργαλείο ANNOVAR [18]. PolyPhen-2 βαθμολογίες & gt? 0,85, μεταξύ 0.85 και 0.15, και & lt?. 0.15 κωδικοποιήθηκαν ως «πιθανώς επιζήμια», «ενδεχομένως επιζήμια» και «καλοήθη», αντίστοιχα [17]

φιλτράρισμα Ποιότητας

κλήσεων γονότυπου διηθούνται για την αξιοπιστία χρησιμοποιώντας ένα μοντέλο πρόβλεψης εκπαιδεύονται σε 341 τυχαία επιλεγμένα παραλλαγές καρκίνο-γονίδιο που επικυρώθηκαν με προσδιορισμό της αλληλουχίας Ion Torrent. κτίριο μοντέλο έγινε με Weka-3-6 [19] χρησιμοποιώντας τις προεπιλεγμένες παραμέτρους εκτός όπως σημειώνεται. Χαρακτηριστικά επιλέχθηκαν από τον αλγόριθμο BestFirst από την ποιότητα των πληροφοριών που παρέχονται από το γονότυπο Complete Genomics. παράμετροι Φιλτράρισμα προσδιορίστηκαν χρησιμοποιώντας την απόφαση J48 αλγόριθμος δέντρο με 10-πλάσια διασταυρούμενης επικύρωσης. Η προκύπτουσα μοντέλο ενσωματώνει δύο τύπους φίλτρων: ένα φίλτρο θέση και ένα φίλτρο γονότυπο. Το φίλτρο θέση αποκλείει όλες τις παραλλαγές στη γονιδιωματική περιοχές με συνολικό ποσοστό κλήση σε όλη την ομάδα της & lt? 80% ή με μέση κλασματική βάθος αλληλόμορφο ≤0.295. Οι μάσκες φίλτρου γονότυπο κλήσεις με ένα ελάχιστο βάθος αλληλόμορφο ≤11. Βασισμένο σε 10-πλάσια διασταυρωμένης επικύρωσης, τα ποσοστά σφάλματος για γονότυπους που περνά αυτά τα φίλτρα, υπολογίζεται ότι είναι & lt? 1,3% για ψευδώς αρνητικά και & lt? 2,3% για false positives

Γονίδια και παραλλαγές

το Cancer Gene Απογραφής, μια επιμέλεια συλλογή από 487 γονίδια με μεταλλάξεις αιτιολογικά εμπλακεί σε ογκογένεση από δείγματα πρωτογενούς ασθενή [20], είχε κατεβάσει από την ιστοσελίδα του Sanger Center (9/2012). Να επικεντρωθεί σε παραλλαγές που θα μπορούσαν να επηρεάσουν την ευαισθησία του καρκίνου λόγω προβλεπόμενες αλλαγές πρωτεΐνη-ακολουθία, αποκλείσαμε τα γονίδια για τα οποία η αιτιώδης συνάφεια με τον καρκίνο ήταν ανώμαλη έκφραση και όχι μετάλλαξη, κρατώντας μόνο τα γονίδια που περιλαμβάνονται στην απογραφή λόγω εσφαλμένου νοήματος, πλαισίου, μάτισμα, ή μεταλλάξεις ανοησίες. Συμπεριλάβαμε τα δύο γονίδια με γνωστές μεταλλάξεις βλαστικής γραμμής καρκίνο προδιαθέσεως, καθώς και γονίδια για τα οποία μόνο σωματικών ογκογονικές μεταλλάξεις ευρίσκονται σήμερα γνωστά, αφού παραλλαγή βλαστικής σειράς σε γονίδια με σωματικές μεταλλάξεις μπορούν επίσης να επηρεάσουν τον καρκίνο ευαισθησία [20]. Τόπους παραλειφθεί από ή διφορούμενο αντιστοιχίζονται με το συγκρότημα αναφοράς αποκλείστηκαν, αφήνοντας 158 γονίδια ενδιαφέροντος.

Παραλλαγές ορίζονται ως διαφορές ακολουθία από την αναφορά, όπως υπολογίζεται από τον αγωγό WGS. Μια παραλλαγή κατηγοριοποιήθηκε ως πλαισίου, ανοησία, ή συναρμογής τόπου διαταράσσοντας αν είχε προβλέψει ότι η επίδραση σε οποιαδήποτε από τις σχολιασμένη μεταγραφές που συνδέονται με ένα γονίδιο του καρκίνου. Αλληλόμορφο συχνότητες υπολογίστηκαν από τους κληθέντες γονότυπους. Σπάνιες παραλλαγές ορίζονται ως παραλλαγές με μικρές συχνότητα αλληλόμορφου (MAF) & lt? 1%, και οι κοινές παραλλαγές αυτών με MAF & gt?. 5%

Το μήκος κωδικοποίησης ενός γονιδίου ορίζεται ως ο συνολικός αριθμός των βάσεων προέβλεψε να μεταφραστεί σε οποιαδήποτε από τις μεταγραφές που συνδέονται. Ποσοστά ανά-γονιδίου μεταβλητότητα, που απεικονίζεται ως ο αριθμός των παραλλαγών ανά kilobase (kb), υπολογίστηκαν ως η κλίση της γραμμής παλινδρόμησης από τον αριθμό των παραλλαγών σε κάθε γονίδιο που κωδικοποιεί για το μήκος.

Τα αποτελέσματα από την ανά οι-γονίδιο αναλύσεις που παρουσιάζονται για ένα σύνολο πέντε βασικών γονιδίων ως παραδείγματα τα ευρήματα από όλα τα 158 γονίδια. Επελέγησαν Αυτά τα γονίδια, δεδομένου ότι είναι πολύ γνωστά γονίδια του καρκίνου που μπορεί να μεταφέρει κλινικά σχετικές μεταλλάξεις. Το σύνολο 5-γονιδίου περιλαμβάνει τόσο μικρές πρωτεΐνες με λίγες παραλλαγές και μεγάλες πρωτεΐνες με πολλές παραλλαγές, και οι δύο ογκοκατασταλτικά γονίδια και ογκογονίδια.

Εκχώρηση της παθογένειας και την επιστροφή των αποτελεσμάτων

Παραλλαγές ταξινομήθηκαν ως παθογόνων αν υπήρχαν: (1) πολλαπλές εκθέσεις πρωτογενούς παθογένειας, (2) δεν εκθέσεις με στοιχεία εις βάρος παθογένειας, και (3) μοριακή δεδομένα που να αποδεικνύουν αρνητικές συνέπειες. Παθογόνων παραλλαγές από τους συμμετέχοντες στη μελέτη που συναίνεσε να επιστρέψει αποτελέσματα επικυρώθηκαν με προσδιορισμό της αλληλουχίας Sanger και στη συνέχεια αναφέρθηκε στην διεπιστημονική επιτροπή τυχαία ευρήματα για την αξιολόγηση και την επικοινωνία με τον γιατρό του ατόμου ρεκόρ.

επισήμανση Προγόνων και τη συχνότητα αλληλόμορφου αναλύει

συντελεστές πρόσμικτο εκτιμήθηκαν για κάθε υποκείμενο με πρόσμιξη [21] με τη χρήση της διαδικασίας που περιγράφεται από Libiger και Schork [22]. Αλληλόμορφο συχνότητες για 6 προγονικό πληθυσμό – Αφρικής, της Ευρώπης, Native American, της Ανατολικής Ασίας, της Κεντρικής Ασίας, και Oceanic – υπολογίστηκαν με μια ομάδα αναφοράς που αποτελείται από 16.443 πολυμορφισμούς μονού νουκλεοτιδίου (SNPs) [22]. Για να εκχωρήσετε τα άτομα στην ομάδα μας για να υποπληθυσμών, τα άτομα ήταν συγκεντρωμένα με βάση υπολογίζονται οι συντελεστές πρόσμιξη τους. Η καταγωγή αντιπροσωπεύεται από κάθε ομάδα ορίστηκε ως η γεωγραφική περιοχή της αυτο-αναφερόμενη χώρα γέννησης της πλειοψηφίας των ατόμων, με εξαίρεση τις Ηνωμένες Πολιτείες. Οι χώρες της Αφρικής και της Αφρικής και της Ευρωπαϊκής clusters διακρίνεται από το βαθμό ανάμιξη, με την Αφρικανική σύμπλεγμα πιο κοντά στην Αφρικανική προγονικό πληθυσμό. Προγόνων ομάδες ορίζεται μόνο για τις ομάδες με τουλάχιστον 20 άτομα, προκειμένου να υπολογίσει αλληλόμορφο συχνότητες σε βήματα του 5% ή και λιγότερο για όλες τις γονιδιωματικές θέσεις συμπεριλαμβανομένων και εκείνων για τα φυλετικά χρωμοσώματα. Μικρότερες συστάδες συγκεντρώθηκαν σε μια ομάδα «Άλλα», η οποία είχε αποκλειστεί από τους υπολογισμούς της συχνότητας αλληλόμορφο, δεδομένου ότι δεν αποτελεί καταγωγή με βάση τον πληθυσμό. Για τα υπόλοιπα 6 υποπληθυσμών, στατιστικά σημαντικές διαφορές σε MAF υπολογίστηκαν είτε από την δοκιμασία chi-τετράγωνο ή ακριβές τεστ του Fisher. Η δοκιμή χ-τετράγωνο χρησιμοποιήθηκε για τις παραλλαγές για τις οποίες όλες οι αναμενόμενες τιμές ήσαν & gt? 1, και την ακριβή του Fisher δοκιμή με προσομοιωμένο ρ-τιμές χρησιμοποιήθηκε για όλες τις άλλες παραλλαγές [23]. Παραλλαγές για τις οποίες το κύριο αλληλόμορφο σε ένα πληθυσμό είναι ο ανήλικος αλληλόμορφο σε άλλο πληθυσμό είναι εκείνες για τις οποίες η ελάχιστη συχνότητα σε κάθε ομάδα είναι & lt? 0.5, η μέγιστη συχνότητα είναι & gt? 0,5, και οι δύο τιμές είναι σημαντικά διαφορετική από την άλλη και από 0.5 από ακριβείς δοκιμές μονόπλευρη Fisher. Για όλες τις στατιστικές δοκιμασίες, p-τιμές & lt? 0,05 θεωρήθηκαν σημαντικές

Πρόσθετα λογισμικού και βάσεων δεδομένων

Οι στατιστικές αναλύσεις πραγματοποιήθηκαν με R έκδοση 2.15.0 [24].. VCFtools 0.1.10 [25] και plink έκδοση 1.07 [26] χρησιμοποιήθηκαν για να προ-διεργασία τα δεδομένα παραλλαγή για τον υπολογισμό ανάμιξη. δομές πρωτεΐνης εμφανίζονται με Jmol [27]. Η έκδοση της βάσης δεδομένων ClinVar 2013-8 [28], ένα αρχείο των σχέσεων μεταξύ των παραλλαγών που βρέθηκαν σε δείγματα και φαινοτύπων ασθενούς, ζητήθηκε η γνώμη για τις εκθέσεις της κλινικής σημασίας. Επιπλέον, το Breast Cancer Information πυρήνα (BIC) (έκδοση: 02.20.13) εξετάστηκε για κλινικές εκθέσεις του

BRCA1

και

BRCA2

παραλλαγές

. διαθεσιμότητα των δεδομένων

Όλες οι εκδόσεις που αναφέρονται στην παρούσα έκδοση παρατίθενται στον πίνακα S1 στο αρχείο S1 και έχουν κατατεθεί σε ClinVar με αριθμούς προσχώρησης SCV000083899 – SCV000086586. Οι ερευνητές που ενδιαφέρονται για την ανταλλαγή των δεδομένων γονιδιωματικής καλούνται να επικοινωνήσουν με το αντίστοιχο συγγραφέα.

Αποτελέσματα

παραλλαγές του καρκίνου γονίδιο είναι διαδεδομένη σε ένα γενικό πληθυσμό

Για να μελετηθεί η γενετική παραλλαγή στο γονίδια του καρκίνου-ευαισθησία σε μία ομάδα εκπρόσωπος της γενικής, ancestrally ποικίλο πληθυσμό, αναλύσαμε ολόκληρη αλληλουχίες γονιδιώματος από τους συμμετέχοντες σε ένα προ-μακροπρόθεσμη μελέτη έρευνα γέννηση. Η ομάδα αποτελείται από 681 γενικά υγιείς ενήλικες αναπαραγωγικής ηλικίας, 49% άνδρες και 51% γυναίκες, κανένας από τους οποίους ανέφεραν μια προσωπική και οικογενειακή ιστορία ενδεικτική της εξαιρετικά διεισδυτικό καρκίνο προδιαθέτουν μεταλλάξεις βλαστικής σειράς.

Χρησιμοποιήσαμε αυτή ομάδα στο προφίλ της διακύμανσης βλαστικής σειράς ενός συνόλου 158 γονίδια για τα οποία οι αλλαγές πρωτεΐνη-αλληλουχία είναι αιτιολογικά εμπλακεί σε ογκογένεση. Οι περιοχές κωδικοποίησης αυτών των 158 γονιδίων είναι καλά καλύπτονται στο γονιδιωματικό δεδομένα, με κάλυψη μέση ανά γονίδιο του 58Χ (εύρος: 21x-84Χ), και με 99,99% των θέσεων αλληλουχία σε & gt? 10 άτομα (Σχήμα S1) . Αυτό το επίπεδο κάλυψης είναι επαρκές για υψηλής ποιότητας παραλλαγή κλήση, αλλά δεν την κλινική διάγνωση [29]. Εμείς επικεντρώθηκε σε μικρό, nonsynonymous παραλλαγές – υποκαταστάσεις, παρεμβολές, και διαγραφές -. Αφού βλαστικής σειράς διακυμάνσεις στα καρκινικά-ευαισθησία γονίδια είναι ως επί το πλείστον αυτού του τύπου [20]

Μεταξύ των 681 ατόμων που παρατηρήσαμε 2688 προβλεπόμενη πρωτεΐνη που επηρεάζουν παραλλαγές στα 158 γονίδια του καρκίνου-ευαισθησίας (Πίνακας S1 στο αρχείο S1). Οι περισσότερες από τις παραλλαγές είναι πολύ σπάνιες – 65% βρίσκονται σε μόνο ένα άτομο και 75% σε 2 ή λιγότερα, με MAF & lt? 0,22%. Πρόσφατες μελέτες για τη διαφοροποίηση στο σύνολό exomes [30] και σε οικογένειες γονιδίων [31] διαπίστωσε επίσης την πλειοψηφία των σπάνιων παραλλαγών. Οι σπάνιες παραλλαγές πιστεύεται ότι συμβάλλει σημαντικά στην αιτιολογία της κοινή ασθένεια [32], και τις στρατηγικές για την ιεράρχηση των παραλλαγών της νόσου από WGS συχνά περιλαμβάνουν ένα φίλτρο συχνοτήτων από την κοινή παραλλαγές. Σαράντα τρία τοις εκατό (43%), ή 1166, των παραλλαγών είναι νέα (όχι σε dbSNP), όλα με MAFs μεταξύ 0,07% και 1,4%. Αυτά τα δεδομένα υποστηρίζουν τον ισχυρισμό ότι το σύνολο σχεδόν των κοινών παραλλαγών σε πληθυσμούς που σχετίζονται με εκείνες του γονιδιώματος Έργου 1000 έχουν ανακαλυφθεί, αλλά ότι πολλές σπάνιες παραλλαγές δεν έχουν ακόμη εντοπιστεί [33].

Υγιή άτομα φέρουν πολλαπλές καρκίνο -γονίδιο παραλλαγές

Κάθε άτομο στην ομάδα φέρνει πολλαπλά nonsynonymous παραλλαγές στα γονίδια του καρκίνου susceptiblity, με μέσο όρο 68 παραλλαγές ανά άτομο (εύρος: 49 – 97) (Εικόνα 1Α), και το 99% των ατόμων μεταφέρουν σπάνιες παραλλαγές (διάμεση τιμή: 6 σπάνιες παραλλαγές, εύρος: 0-32). Κανένας από τους συμμετέχοντες έχουν παραλλαγές σε όλα τα 158 γονίδια? Αντ ‘αυτού, οι παραλλαγές κατανέμονται σε ένα υποσύνολο των γονιδίων 30-59 (μέση τιμή = 40) (Σχήμα 1Β), η οποία ποικίλλει ανάλογα με άτομο (βλέπε παρακάτω). Για μια ένδειξη για το αν αυτές οι παραλλαγές μπορεί να είναι κλινικά σημαντική, όλες οι παραλλαγές είχαν ανατεθεί σε τρεις μη αποκλειστική κατηγορίες με βάση τα σχόλια που σχετίζονται με πιθανές επιπτώσεις στην ευαισθησία του καρκίνου: (1) των παραλλαγών που αναφέρονται στο HGMD ως πιθανώς σχετίζεται με τη νόσο, (2) παραλλαγές πιθανό να έχουν βλαβερή επίδραση στη λειτουργία της πρωτεΐνης, δηλαδή μετατόπιση πλαισίου, ανοησίες, και συρραφής τόπου παραλλαγές, και (3) όλων των άλλων nonsynonymous παραλλαγές. Χρησιμοποιούμε την τελευταία κατηγορία να εκπροσωπεί παραλλαγές αγνώστου σημασίας (VU για), με τις επιφυλάξεις ότι η κλινική επίδραση ορισμένων παραλλαγών μπορεί να είναι γνωστή, αλλά δεν σταματούν σε HGMD, και ότι οι παραλλαγές ανατεθεί στην HGMD και δηλητηριώδη τάξεις μπορούν επίσης να έχουν άγνωστες συνέπειες για ευαισθησίας στον καρκίνο. Συνολικά, 80 παραλλαγές που παρατηρήθηκε στην ομάδα ταξινομήθηκαν ως επιβλαβή (22 ανοησίες, 42 πλαισίου, 16 ματίσματος τόπου διαταραχές), 326 σχολιάστηκαν ως πιθανώς σχετίζεται με τη νόσο σε HGMD και 2297 είναι μονάδων οχήματος (Πίνακας S1 στο S1 αρχείου). Τα θέματα της μελέτης έχουν κατά μέσο όρο 14 HGMD παραλλαγές (εύρος: 4-25), 2 παραλλαγές στο επιβλαβή τάξη (εύρος: 0-4), και 52 μονάδων οχήματος (εύρος: 34-78) (Εικόνα 1Α). Οι αριθμοί των παραλλαγών στα τρία άτομα που ανέφεραν παρελθόν διάγνωση του καρκίνου δεν ήταν ακραία τιμών για οποιαδήποτε από τις τάξεις παραλλαγή. Αν και είναι πιθανό ότι οι δηλητηριώδεις παραλλαγές προκύπτουν από αλληλούχηση ή σφάλμα σχολιασμό, βρίσκοντας προφανώς επιζήμια παραλλαγές σε υγιή άτομα δεν είναι απροσδόκητο [34].

(Α) Boxplot του συνολικού αριθμού των παραλλαγών, ο αριθμός των παραλλαγών που παρατίθενται στο HGMD, ο αριθμός των πιθανών επιβλαβή παραλλαγές, και ο αριθμός των παραλλαγών του αγνώστου σημασίας ανά άτομο για καρκίνο που σχετίζεται με τα γονίδια. (Β) κατανομή του αριθμού των γονιδίων του καρκίνου με τουλάχιστον μία nonsynonymous παραλλαγή ανά άτομο.

Η

αλληλόμορφων συχνοτήτων των παραλλαγών του καρκίνου γονίδιο είναι καταγωγής εξαρτώμενη

αλληλόμορφων συχνοτήτων μπορεί να διαφέρουν μεταξύ των πληθυσμών και οι διαφορές αυτές μπορεί να έχουν σημαντικές ιατρικές επιπτώσεις [35]. Προκειμένου να διαπιστωθεί αν κάποια από τις παραλλαγές του καρκίνου του γονιδίου της πρωτεΐνης που επηρεάζουν στην ομάδα μας διαφέρουν σε συχνότητα μεταξύ των ομάδων καταγωγή, θα ανατεθεί σε κάθε άτομο σε έναν υποπληθυσμό χρησιμοποιώντας τα γονιδιακά δεδομένα. Μια ομάδα 16.443 δεικτών που αντιπροσωπεύουν 6 προγονική ομάδες που συνδέονται με την ευρωπαϊκή, της Αφρικής, της Ανατολικής Ασίας, της Κεντρικής Ασίας, Native American, και Oceanic πληθυσμών [22] χρησιμοποιήθηκε για τον υπολογισμό των αναλογιών πρόσμιξη για κάθε άτομο. Περίπου οι μισοί (49%) των ατόμων που είχαν ανατεθεί μη μηδενικό συντελεστή για πολλαπλούς πληθυσμούς, γεγονός που αντανακλά διάφορους βαθμούς πρόσμιξη ή γενετική καταγωγή ατελώς αποτυπώνεται από το υπόδειγμα. Υποπληθυσμών ορίστηκαν από την ομαδοποίηση των θεμάτων στις υπολογιζόμενες αναλογίες πρόσμιξη. Συστάδες με λιγότερα από 20 άτομα συγκεντρώθηκαν σε μια ομάδα «Άλλα» και περιλαμβάνουν τη Μέση Ανατολή, αναμεμιγμένο Eurasians, και άλλοι άγνωστης φόντο.

Οι επτά που προκύπτουν ομάδες παρατίθενται στον Πίνακα 1 και οι συντελεστές πρόσμιξη του μέλους τα άτομα που απεικονίζονται στο Σχήμα 2. για λόγους ευκολίας, χρησιμοποιούμε τα ονόματα των ομάδων (Ευρώπης, της Αφρικής, κλπ) για να δηλώσει προγονική γενετικό υπόβαθρο και όχι γεωγραφική περιοχή γέννησης ή την εθνικότητα. Οι υποπληθυσμοί αντιστοιχούν σε 78-100% αφρικανικής καταγωγής για τις χώρες της Αφρικής υποπληθυσμό, 79-100% ασιατική καταγωγή Ανατολή για την ασιατική υποπληθυσμό Ανατολή, 79-100% της Κεντρικής Ασίας καταγωγή του πληθυσμού της Κεντρικής Ασίας, και 83-100% ευρωπαϊκή καταγωγή για το Ευρωπαϊκή υποπληθυσμό. Το σύμπλεγμα με άτομα του 13-75% αφρικανικής καταγωγής και 21 έως 87% ευρωπαϊκή καταγωγή ονομάστηκε Αφρικής-Ευρώπης. Οι αναλογίες πρόσμιξη διακρίνουν την Αφρικανική υποπληθυσμό (≥78% Αφρικής) από την Αφρικανική-Ευρωπαϊκή αποτέλεσμα της ομάδας από ένα σημείο διακοπής στα δεδομένα και είναι συγκρίσιμες με τις αναλογίες της κυρίαρχης καταγωγή της Ανατολικής Ασίας, της Κεντρικής Ασίας και ευρωπαϊκές ομάδες (≥79 %, ≥79%, ≥83%, αντίστοιχα). Ο Ισπανικός υποπληθυσμός περιλαμβάνει ποικίλες προσμίξεις των ιθαγενών της Αμερικής και της Ευρωπαϊκής καταγωγή με 0-50% αφρικανικής καταγωγής. Αυτά τα δύο και τριών δρόμων προσμίξεις αντανακλά τη δημογραφική ιστορία της Λατινικής Αμερικής [36].

Οι αναλογίες μείγματος των 6 προγονικό πληθυσμό (χρώματα) εμφανίζονται για όλα τα άτομα σε κάθε μία από τις 7 ομάδες που ορίζονται στο ομάδα (πάνελ). (Α) Ευρωπαϊκή (Β) της Κεντρικής Ασίας (C) της Ανατολικής Ασίας (D) της Αφρικής (Ε) της Αφρικής και της Ευρώπης (F), Ισπανόφωνος (G) Άλλα. Κόκκινο: Ευρωπαϊκό, Μπλε: Κεντρικής Ασίας, Κυανό: Ανατολικής Ασίας, Κίτρινο: Αφρικής, Πράσινο: Native American, Ματζέντα:. Ωκεανία

Η

Οι υποπληθυσμών καταγωγή με βάση διαφέρουν ως προς τον αριθμό του καρκίνου -γονίδιο παραλλαγές ανά άτομο (Σχήμα 3) (p & lt? 2.2e-16 με ANOVA). Ευρωπαίοι τείνουν να έχουν λιγότερες παραλλαγές (μέσος όρος = 64,5) και Αφρικανούς περισσότερο (μέσος όρος = 84, 30% υψηλότερο από ό, τι οι Ευρωπαίοι), σύμφωνα με τις εκτιμήσεις του γονιδιώματος σε επίπεδο [37]. Ο αριθμός των παραλλαγών στις χώρες της Αφρικής-Ευρωπαϊκής άτομα είναι ενδιάμεσος μεταξύ Αφρικανών και Ευρωπαίων. Της Αφρικής, της Αφρικής και της Ευρώπης, της Ασίας και υποπληθυσμών Ανατολή έχουν περίπου διπλάσιες νέες παραλλαγές ανά άτομο ως Ευρωπαίοι, και την Κεντρική Ασιάτες έχουν τριπλό περισσότερο (Πίνακας 2). Η διαπίστωση ότι η Κεντρική Ασιάτες έχουν περισσότερες νέες παραλλαγές ανά άτομο από ό, τι οι Αφρικανοί, οι οποίοι έχουν υψηλότερο συνολικό αριθμό των παραλλαγών του καρκίνου-γονιδίου (Σχήμα 3), μπορεί να αντανακλά μια προκατάληψη σε πληθυσμούς που έχουν αλληλουχία και υποστηρίζει τις προσπάθειες που στοχεύουν στην αύξηση της πολυμορφίας των οι πληθυσμοί του δείγματος σε βάσεις δεδομένων ακολουθίας.

Η κατανομή του αριθμού των nonsynonymous γονιδίων ανά θέμα για κάθε ένα από τα 6 υποπληθυσμών καταγωγή που βασίζεται.

Η

Ο αριθμός των δηλητηριώδη παραλλαγές ανά άτομο είναι επίσης σημαντικά διαφορετική μεταξύ προγονική ομάδες (ρ & lt? 4ε-4 με ANOVA? Πίνακας 2). Μέσοι όροι κυμαίνονται από 1,8 σε Ευρωπαίους και Ασιάτες Ανατολής σε 2,2 στην Κεντρική Ασιάτες. Για HGMD παραλλαγές, υπάρχει επίσης μια στατιστικά σημαντική διαφορά μεταξύ των ομάδων (p & lt? 9ε-4 με ANOVA), με την Ανατολική Ασία έχουν τις λιγότερες παραλλαγές κατά μέσο όρο καταγράφονται σε αυτή την βάση δεδομένων (Πίνακας 2). Ωστόσο, οι διαφορές στους αριθμούς των επιβλαβή και HGMD παραλλαγές είναι μικρή και μια σύνδεση με την καταγωγή πρέπει να εξεταστεί σε ένα ευρύτερο ομάδα.

Οι διαφορές μεταξύ των ομάδων καταγωγή αντικατοπτρίζονται επίσης στις συχνότητες αλληλόμορφων παραλλαγών του καρκίνου του γονιδίου . Πίνακας S1 στις λίστες S1 αρχείου αλληλόμορφο συχνότητες σε κάθε μία από τις ομάδες του πληθυσμού για το πλήρες σύνολο των 2.688 παραλλαγές. Δεκατέσσερα αλληλόμορφα έχουν συχνότητες & gt? 50% σε όλες τις υποπληθυσμούς (Πίνακας S2 σε S1 File), γεγονός που υποδηλώνει ότι η αλληλουχία αναφοράς φέρει ένα ελάχιστο αλληλόμορφο σε αυτές τις θέσεις. Αναλύσαμε τις διαφορές στις συχνότητες του πληθυσμού αλληλόμορφο για κοινές παραλλαγές, δεδομένου ότι οι περισσότερες σπάνιες παραλλαγές βρέθηκαν σε ένα μόνο άτομο. Μεταξύ των 223 παραλλαγές με συχνότητα & gt? 5% σε οποιαδήποτε από τις 6 ομάδες καταγωγή που βασίζεται, 216 έχουν αλληλόμορφο συχνότητες που διαφέρουν μεταξύ των υποπληθυσμών (Πίνακας S3 σε File S1). Από αυτούς, το 43% βρίσκονται σε όλες τις έξι υποπληθυσμών και 58 είναι ειδικά για μία από τις τέσσερις ομάδες καταγωγή με χαμηλότερους βαθμούς πρόσμιξη, 49 Αφρικανούς, 2 στην Κεντρική Ασιάτες, 6 στην Ανατολική Ασιάτες, και 1 στους Ευρωπαίους. Υπάρχουν επίσης 21 παραλλαγές στις οποίες ο ανήλικος αλληλόμορφο σε ένα πληθυσμό είναι η κύρια αλληλόμορφο σε άλλο (Πίνακας 3), από τις οποίες έχουν καταγωγή εξαρτώμενη συχνότητες έχουν αναγνωριστεί προηγουμένως για τουλάχιστον 3,

ERBB2

c.3508C & gt? G (p.Pro1170Ala) [38],

TP53

c.215C & gt? G (p.Pro72Arg) [39], και

BRCA1

c.2612C & gt? T (p.Pro871Leu) [ ,,,0],40]. Λίγα είναι γνωστά για την κλινική σημασία αυτών των 21 παραλλαγές. Τέσσερις,

TP53

c.215C & gt? G (p.Pro72Arg) [41],

BRCA1

c.2612C & gt? T (p.Pro871Leu) [42],

ΕΚΒΒ2

c.3508C & gt? G (p.Pro1170Ala) [43], και

FLT3

c.680C & gt? T (p.Thr227Met) [44], [45] έχουν συνδεθεί με την ανάπτυξη καρκίνου ή για να ανταπόκριση στη θεραπεία. Ωστόσο, αυτές οι ενώσεις είναι συνήθως μικρή επίδραση ή προέρχονται από μικρά δείγματα? ως εκ τούτου, χρειάζεται περισσότερη δουλειά για να δημιουργήσει μια σαφής σχέση. Εάν αυτές οι ενώσεις επικυρώνονται, που δείχνουν τη σημασία της εξέτασης καταγωγή κατά την επιλογή επιλογές θεραπείας για τους ασθενείς.

Η

Per-γονιδιακή παραλλαγή

Στη συνέχεια αναλύσαμε τις παραλλαγές σε μια βάση ανά-γονιδίου για να καθοριστεί ποια γονίδια είναι περισσότερο ή λιγότερο πιθανό να έχουν παραλλαγές αναφέρονται από WGS υγιών ατόμων. Το φορτίο παραλλαγή για κάθε ένα από τα 158 γονίδια που παρατίθενται στον πίνακα S4 στο S1 αρχείου. Τέσσερα γονίδια –

SRSF2

,

U2AF1

,

MAP2K4

, και

GNAQ

– δεν έχουν nonsynonymous παραλλαγές στην ομάδα μας, 36 γονίδια έχουν παραλλαγές σε λιγότερες από 10 άτομα, και 35 έχουν παραλλαγές σε πάνω από τα μισά από τα άτομα (Εικόνα 4Α). Ο περιορισμός της ανάλυσης σε μόνο σπάνιες παραλλαγές, 154 (97,5%) των γονιδίων παρουσιάζουν διακύμανση σε τουλάχιστον ένα άτομο (Σχήμα 4Β). Κατά μέσο όρο, ένα γονίδιο του καρκίνου έχει σπάνιες παραλλαγές στο 4% του πληθυσμού μας, με μια σειρά από 0% έως 18% (0-125 άτομα). Μεταξύ των γονιδίων με σπάνιες παραλλαγές στα περισσότερα άτομα είναι

BRCA1

,

BRCA2

,

APC

,

MLL2

, και

MLL3

, τα γονίδια τα οποία συνήθως μεταλλαγμένα σε καρκίνους.

BRCA1

,

BRCA2

, και

APC

είναι καλά μελετηθεί λόγω της παρουσίας των συχνών, παθογόνων μεταλλάξεων.

MLL2

και

MLL3

έχουν πρόσφατα ανακαλυφθεί να μεταλλαχθεί σε ένα ευρύ φάσμα τύπων όγκου [46], και η επικράτηση της παρατηρούμενης διακύμανσης προτείνει να μπορούν να δικαιολογήσουν περισσότερο σε βάθος μελέτη.

Κατανομή του αριθμού των ατόμων με μια παραλλαγή ανά γονίδιο για (Α) όλες τις παραλλαγές (Β) σπάνιες παραλλαγές.

Η

Η επικράτηση της διακύμανσης σε κάθε γονίδιο συσχετίζεται με τον αριθμό των παραλλαγών. Εξήντα τοις εκατό (60%) της μεταβλητότητας εξηγείται από την κωδικοποίηση μήκους (Σχήμα 5), μια τάση που σημειώθηκε στο παρελθόν για όλα τα ενιαία νουκλεοτιδίων παραλλαγές exome κλίμακα [30]. Το συνολικό ποσοστό του ~ 6 παραλλαγής θέσεων ανά kb του αλληλουχίας κωδικοποίησης είναι συγκρίσιμη με την προβλεπόμενη παραλλαγή ποσοστό ανακάλυψη για έναν πληθυσμό του μεγέθους της κοόρτης μας [31]. Η πιο μεταβλητό γονίδιο είναι

TNFRSF14

, με 39 θέσεις ανά παραλλαγή kb (Πίνακας S4 στο File S1).

Ο αριθμός των παραλλαγών nonsynonymous εναντίον συνολικός αριθμός των βάσεων που κωδικοποιεί για κάθε ένα από τα 158 γονίδια του καρκίνου-ευαισθησία.

Η

Η ανά-γονίδιο μεταβλητότητα μπορεί επίσης να εξαρτάται από τον τύπο του γονιδίου καρκίνου. Τρεις τύποι έχουν περιγραφεί: ογκογονίδια, ογκοκατασταλτικά γονίδια, και τα γονίδια προδιάθεση [46]. Οι τελευταίες είναι γονίδια για τα οποία οι μεταλλάξεις βλαστικής γραμμής μπορεί να προδιαθέτουν σε καρκίνο, αλλά τα οποία έχουν λίγες σωματικές μεταλλάξεις. Τα ογκοκατασταλτικά γονίδια και ογκογονίδια έχουν περίπου 5 παραλλαγές ανά kb της αλληλουχίας κωδικοποίησης, ενώ τα γονίδια προδιάθεσης έχουν περίπου 8 παραλλαγές /kb, παρόμοιο με το ποσοστό για όλα τα γονίδια. Η διαφορά είναι στατιστικά σημαντική, με p & lt? 0,012 από ANCOVA. Το χαμηλότερο ποσοστό μεταβλητότητας για τα ογκογονίδια και τα ογκοκατασταλτικά γονίδια μπορεί να υποδεικνύει μεγαλύτερη εξελικτική πίεση.

Χαρακτηρισμός της διακύμανσης εντός βασικά γονίδια

Εκτός από τις συχνότητες αλληλόμορφου του πληθυσμού και βιβλιογραφικές αναφορές του συνεταιρίζεσθαι νόσου, η ανάλυση των η επίδραση θα μπορούσε να έχει κάθε παραλλαγή για τη δομή και τη λειτουργία της κωδικοποιημένης πρωτεΐνης μπορεί να παρέχει πληροφορίες σχετικές με την πρόβλεψη του κινδύνου καρκίνου. Εμείς απεικονίζουν το γονίδιο-ειδικά ευρήματα με ένα σύνολο 5 γνωστά γονίδια του καρκίνου κλινικής σημασίας,

BRCA1

,

BRCA2

,

TP53

,

KRAS

και

PTEN

. Οι παραλλαγές και αλληλόμορφο συχνότητες που αναφέρονται στον πίνακα S1 στο S1 αρχείου.

BRCA1 και BRCA2

BRCA1

και

BRCA2

είναι οι δύο μεγάλες καρκίνο του μαστού γονίδια ευαισθησίας. Οι βλαστικής σειράς μεταλλάξεις σε κάποιο από αυτά τα ογκοκατασταλτικά γονίδια που σχετίζονται με κληρονομικό καρκίνο μαστού και σύνδρομο του καρκίνου των ωοθηκών, το οποίο ανέρχεται περίπου στο 2-8% των περιπτώσεων καρκίνου του μαστού σε όλο τον κόσμο [47]. Στην ομάδα μας, το 92% των ατόμων που φέρουν nonreference αλληλόμορφα σε ένα ή και τα δύο από αυτά τα γονίδια (εκτός από ομόζυγο γονότυπους παραλλαγή στο χρωμόσωμα 13 θέση 32.929.387 σε

BRCA2

στο οποίο η αλληλουχία αναφοράς έχει μια σπάνια έλασσον αλληλόμορφο): 498 άτομα με παραλλαγές στο

BRCA1

και 482 με

BRCA2

παραλλαγές. Σπάνιες παραλλαγές είναι επίσης διαδεδομένη, με το 27% του πληθυσμού που φέρει σπάνια παραλλαγών σε τουλάχιστον ένα από αυτά τα δύο γονίδια.

Οι περισσότερες από τις παραλλαγές σε αυτά τα δύο γονίδια είναι σπάνια, με το 83% των 46 παραλλαγές σε

BRCA1

και το 91% των 86 παραλλαγές στο

BRCA2

έχει MAF & lt? 1%. Οι 4 κοινές παραλλαγές στο

BRCA1

-c.2612C & gt? T (p.Pro871Leu), c.3113A & gt? G (p.Glu1038Gly), c.3548A & gt? G (p.Lys1183Arg), και c.4837A & gt ? G (p.Ser1613Gly) -Όλα δείχνουν την καταγωγή που εξαρτώνται από τις συχνότητες αλληλόμορφο.

You must be logged into post a comment.