PLoS One: Ταυτοποίηση και χαρακτηρισμός του Καρκίνου Μεταλλάξεις στα ιαπωνικά αδενοκαρκίνωμα πνεύμονα χωρίς αλληλουχίας του φυσιολογικά αντίστοιχα ιστών


Αφηρημένο

Αναλύσαμε τα δεδομένα αλληλουχίας ολόκληρου exome από 97 ασθενείς ιαπωνική αδενοκαρκίνωμα του πνεύμονα και προσδιόρισε διάφορες υποθετικές γονίδια και τα μονοπάτια σχετίζονται με τον καρκίνο. Ιδιαίτερα, παρατηρήσαμε ότι ο καρκίνος που σχετίζονται με τα πρότυπα μετάλλαξης ήταν σημαντικά διαφορετικό μεταξύ των διαφόρων εθνοτικών ομάδων. Όπως έχει ήδη αναφερθεί, οι μεταλλάξεις στο γονίδιο EGFR ήταν χαρακτηριστικά με τους Ιάπωνες, ενώ εκείνες στο γονίδιο KRAS ήταν πιο συχνές σε Καυκάσιους. Επιπλέον, κατά τη διάρκεια της ανάλυσης αυτής, βρήκαμε ότι ειδική για τον καρκίνο σωματικές μεταλλάξεις μπορούν να ανιχνευθούν χωρίς αλληλούχιση φυσιολογικά αντίστοιχα ιστό. 64% από τις παραλλαγές βλαστικής σειράς θα μπορούσαν να αποκλειστούν χρησιμοποιώντας συνολικά 217 εξωτερικών ιαπωνική σύνολα δεδομένων exome. Δείχνουμε επίσης ότι μια παρόμοια προσέγγιση μπορεί να χρησιμοποιηθεί για άλλους τρεις εθνοτικές ομάδες, αν και η διακριτική εξουσία εξαρτάται από την εθνική ομάδα. Έχουμε αποδείξει ότι το γονίδιο ΑΤΜ και το γονίδιο PAPPA2 θα μπορούσαν να προσδιοριστούν ως γονίδια σχετίζονται με τον καρκίνο πρόγνωση. Με παρακάμπτοντας την αλληλούχιση του φυσιολογικού ιστού ομολόγους, αυτή η προσέγγιση παρέχει ένα χρήσιμο μέσο όχι μόνο τη μείωση του χρόνου και του κόστους της αλληλούχισης, αλλά και την ανάλυση των δειγμάτων αρχείο, για τις οποίες τα κανονικά αντίστοιχά ιστός δεν είναι διαθέσιμα.

Παράθεση: Suzuki Α, Mimaki S, Yamane Υ, Kawase Α, Matsushima Κ, Suzuki M, et al. (2013) Ταυτοποίηση και Χαρακτηρισμός του Καρκίνου Μεταλλάξεις σε Ιαπωνικά αδενοκαρκίνωμα πνεύμονα χωρίς αλληλουχίας του φυσιολογικά αντίστοιχα ιστού. PLoS ONE 8 (9): e73484. doi: 10.1371 /journal.pone.0073484

Επεξεργαστής: Η Sunny Sun, Ινστιτούτο Μοριακής Ιατρικής, Ταϊβάν

Ελήφθη: 22, Μαρτίου 2013? Αποδεκτές: 19, Ιουλίου 2013? Δημοσιεύθηκε: 12 Σεπτεμβρίου 2013

Copyright: © 2013 Suzuki et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Αυτό το έργο υποστηρίχθηκε από τον αριθμό των αρχείων JSP KAKENHI Grant 24300345. η εργασία αυτή υποστηρίζεται επίσης από MEXT KAKENHI Grant αριθμός 221S0002. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

Η έλευση της τεχνολογίας προσδιορισμού αλληλουχίας επόμενης γενιάς έχει διευκολύνει σε μεγάλο βαθμό την ανίχνευση και τον χαρακτηρισμό των γενετικών παραλλαγών στο ανθρώπινο γονιδίωμα. Πιο εντυπωσιακά, αυτό το είδος της μελέτης έχει οδηγήσει τα γονιδιώματα Έργου 1000 [1,2], η οποία έχει ως στόχο να παρέχει ένα ολοκληρωμένο χάρτη του ανθρώπινου γενετικές παραλλαγές σε διάφορα εθνικά υπόβαθρα. Ωστόσο, επειδή αλληλούχιση ολόκληρου του γονιδιώματος είναι ακόμη δαπανηρή, ο προσδιορισμός της αλληλουχίας των περιοχών ολόκληρο εξόνιο χρησιμοποιώντας μεθόδους σύλληψης υβριδοποίησης (αλληλούχιση exome) [3-5] χρησιμοποιείται ευρέως για την διαλογή για γονίδια που σχετίζονται με κληρονομικές ασθένειες. Με αλληλούχιση exomes από υγιών και ασθενών ατόμων και τη σύγκρισή τους, τα γονίδια που είναι υπεύθυνα για πολλές ασθένειες έχουν αναγνωριστεί [6], συμπεριλαμβανομένου του συνδρόμου Miller [7,8] και οικογενή υπερκαλιαιμική υπέρταση [9]. Μαζί με την πρόοδο που έχει επιτευχθεί στον προσδιορισμό της αλληλουχίας exome, ο όγκος της βλαστικής σειράς πολυμορφισμού ενός νουκλεοτιδίου (SNP) τα δεδομένα που έχουν καταχωρηθεί στο dbSNP αναπτύσσεται με ταχείς ρυθμούς για διάφορους πληθυσμούς [10].

αλληλουχίας exome παρέχει ένα ισχυρό εργαλείο για μελέτες του καρκίνου, καθώς και. Πράγματι, ένας αριθμός από χαρτιά έχουν δημοσιευτεί που περιγράφουν την ταυτοποίηση και τον χαρακτηρισμό του ενιαίου παραλλαγών νουκλεοτιδίων (SNVs) που συμβαίνουν σωματικώς σε καρκίνους και υπάρχουν υπόνοιες ότι είναι υπεύθυνη για την καρκινογένεση και την ανάπτυξη της νόσου [11]. Το Διεθνές Cancer Genome Consortium (ICGC) συλλέγει exome στοιχεία για το σωματικό SNVs που είναι παρούσα σε περισσότερες από 50 μορφές καρκίνου ως μέρος μιας διεθνούς προσπάθειας συνεργασίας [12-14]. Ο καρκίνος Γονιδιώματος Atlas (TCGA) έχει αναπτύξει ένα μεγάλο σύνολο δεδομένων γονιδιωματική, συμπεριλαμβανομένων exomes για υψηλής ποιότητας καρκίνωμα των ωοθηκών, που έχει χρησιμοποιηθεί για να ανιχνεύσει σημαντικά μεταλλαγμένων γονιδίων, συμπεριλαμβανομένων των ΤΡ53, BRCA1 και BRCA2 [15]. Έχουν επίσης εντοπιστεί διάφορα γονιδιωματικής εκτροπές και απορυθμισμένη μονοπάτια που μπορούν να ενεργούν ως θεραπευτικοί στόχοι.

Στις περισσότερες μελέτες σε εξέλιξη καρκίνου exome, έχουν κανονική τους ομολόγους του ιστού έχουν αλληλουχία παράλληλα με καρκινικό ιστό [15-19]. Αυτό υποτίθεται ότι είναι αναγκαία, διότι οι παραλλαγές βλαστική πρέπει να εξαιρεθούν από το πλήρες σύνολο των SNVs για τον εντοπισμό των σωματικών SNVs που είναι μοναδικά σε καρκίνους. Ωστόσο, ο προσδιορισμός της αλληλουχίας του φυσιολογικού ιστού ομολόγους αυξάνει το κόστος και το χρόνο της ανάλυσης. Επίσης, σε ορισμένες περιπτώσεις, είναι δύσκολο να ληφθεί κανονικός ομολόγους ιστό. Επιπλέον, παραμένει ασαφές το πώς ακριβώς βλαστική SNVs μπορεί να αποκλειστεί χρησιμοποιώντας φυσιολογικό exomes ιστού. Για την εξαίρεση συντηρητικά SNVs βλαστικής σειράς, βάθη αλληλουχία τους και ακρίβειες μπορεί να χρειαστεί να είναι μεγαλύτερες από αυτές που λαμβάνονται από τα exomes καρκίνο.

Σε αυτή τη μελέτη, δημιουργήθηκαν και αναλύθηκαν 97 καρκίνος exomes από ασθενείς Ιαπωνικά αδενοκαρκίνωμα του πνεύμονα. Μπορούμε επίσης να αποδεικνύουν ότι σωματικά SNVs μπορεί να εμπλουτιστεί σε ένα επίπεδο που είναι επαρκές για την περαιτέρω στατιστικές αναλύσεις ακόμη και εν απουσία της αλληλουχίας του φυσιολογικά αντίστοιχα ιστού. Για να διαχωρίσετε την βλαστική από τα σωματικά SNVs, πρέπει πρώτα σύγκριση των προτύπων διακύμανση μεταξύ ενός exome καρκίνου με φυσιολογικό exomes ιστού των 96 άλλων ασθενών. Προσπαθήσαμε επίσης να προβεί σε παρόμοια αμοιβαία σύγκριση αποκλειστικά αξιοποιώντας exomes καρκίνο, χωρίς την εξέταση των exomes της κανονικής τους ομολόγους ιστού. Είναι αλήθεια ότι αν παραλειφθεί εντελώς αλληλούχιση φυσιολογικό ιστό, θα θέλαμε διστακτικά αδιαφορία σωματικών μεταλλάξεων που συμβαίνει ακριβώς στο ίδιο γονιδιωματικό θέση σε πολλαπλές μορφές καρκίνου. Ωστόσο, οι πρόσφατες εργασίες έχουν διευκρινιστεί ότι η εν λόγω κοινόχρηστο SNVs είναι πολύ σπάνιες [15,20-22]. Επιπλέον, πολλά από αυτά τα αναδρομικά μεταλλάξεις έχουν καταχωρηθεί στα καρκινικά σωματικά βάσεις δεδομένων μετάλλαξη όπως Sanger COSMIC [23,24], και αυτές οι επαναλαμβανόμενες SNVs μπορούν να ανακτηθούν από μελέτες παρακολούθησης εν μέρει με τη χρήση των δεδομένων από τους φυσιολογικούς ιστούς. Για να κατανοήσουμε τη μοναδική φύση του κάθε καρκίνο, μια στατιστική ανάλυση των διακριτών SNVs τεκμαίρεται ότι είναι απαραίτητη εκτός από την ανάλυση των κοινών SNVs.

Σε αυτή τη μελέτη, δείχνουμε ότι είναι δυνατόν να προσδιοριστούν τα πρώτοι υποψήφιοι για τα γονίδια και τις οδούς που σχετίζονται με τον καρκίνο, ακόμη και χωρίς την αλληλούχιση μιας κανονικής ομόλογό ιστό. Δείχνουμε ότι αυτή η προσέγγιση είναι χρήσιμη όχι μόνο για τη μείωση του κόστους της αλληλούχισης, αλλά και για τη βελτίωση της πιστότητας των δεδομένων. Θα πρέπει να είναι επίσης χρήσιμο για την ανάλυση παλιό αρχείο δειγμάτων, των οποίων η κανονική τους ομολόγους ιστός δεν είναι πάντα διαθέσιμα. Εδώ, περιγράφουμε μια πρακτική και οικονομικά αποδοτική μέθοδος για να επισπεύσει τον καρκίνο αλληλουχίας exome.

Αποτελέσματα και Συζήτηση

Χαρακτηρισμός SNVs χρησιμοποιώντας το σύνολο δεδομένων

97 exome

Πρώτον, δημιουργήθηκαν και αναλύθηκαν οι αλληλουχίες ολικής exome από 97 ασθενείς ιαπωνική αδενοκαρκίνωμα του πνεύμονα. δεδομένα exome συλλέχθηκαν τόσο από τον καρκίνο και φυσιολογικό ιστό ομολόγους, που χωρίζονται από τη σύλληψη λέιζερ μικροδιατομής. Καθαρίσαμε το εξονικό DNA (exomes) και δημιούργησε 76-ζεύγη βάσεων-end διαβάζει χρησιμοποιώντας την πλατφόρμα Illumina GAIIx. Περίπου 30 εκατομμύρια χαρτογραφηθεί αλληλουχίες ελήφθησαν από κάθε δείγμα, παρέχοντας 74 × κάλυψη των περιοχών στόχου? 93% των περιφερειών στόχου είχε 5 κάλυψη × (Σχήμα S1 στο αρχείο S1). Burrows-Wheeler Aligner (BWA) [25] και το γονιδίωμα Ανάλυση Toolkit (GATK) [26,27] χρησιμοποιήθηκαν για τον εντοπισμό SNVs (Εικόνα S2 σε S1 αρχείου). Μόνο SNVs που ανιχνεύθηκαν σε καρκινικούς ιστούς και δεν έδειξε στοιχεία επιλέχθηκαν διακύμανση στους φυσιολογικούς ιστούς για περαιτέρω ανάλυση.

Το ληφθέν σύνολο δεδομένων χρησιμοποιήθηκε για να χαρακτηρίσει τα μοτίβα μετάλλαξης ειδική για τον καρκίνο (Πίνακας S3 σε S1 File). Υπολογίσαμε τον εμπλουτισμό των SNVs μέσα σε συγκεκριμένα γονίδια, πεδία πρωτεΐνης, λειτουργικές κατηγορίες, και μονοπάτια. Ψάξαμε για τα γονίδια με σωματικά SNVs σημαντικά εμπλουτισμένη σε ιαπωνικά αδενοκαρκίνωμα του πνεύμονα. Όπως φαίνεται στον Πίνακα S4 στο File S1, αρκετά γονίδια ταυτοποιήθηκαν ως σημαντικά μεταλλαχθεί. Ειδικότερα, ψάξαμε για τομείς που είναι εμπλουτισμένα με SNVs και το λιμάνι γνωστές μεταλλάξεις σχετίζονται με τον καρκίνο στην κοσμική βάση δεδομένων. Συνολικά, 11 γονίδια εντοπίστηκαν (Ρ & lt? 0,02, Πίνακας 1). Για παράδειγμα, η ομολογία Dbl (DH) περιοχή γονιδίου PREX1 [28] εμπλουτίστηκε με SNVs (

P

= 0,00071). Ωστόσο, στο γονίδιο PREX2 [29], η πλεκστρίνης ομολογία (ΡΗ) εμπλουτίστηκε με SNVs (

P

= 0,011) (Σχήμα 1Α και Β). Τόσο η PREX1 και τα γονίδια PREX2 ενεργοποιήσετε την ανταλλαγή του ΑΕΠ σε GTP για την οικογένεια Rho των GTPases και τις περιοχές DH /PH είναι απαραίτητη για την ανταλλαγή νουκλεοτιδίων GTPases και τη ρύθμιση του [30-32]. Επιπλέον, αναλύσαμε τα πρότυπα έκφρασης αυτών των γονιδίων χρησιμοποιώντας μια βάση δεδομένων γονιδιακής έκφρασης του καρκίνου, GeneLogic (Σχήμα S3 κατά αρχείου S1). Τα επίπεδα έκφρασης του PREX1 και PREX2 δεν ενισχύθηκαν σε αδενοκαρκίνωμα του πνεύμονα, αλλά βελτιώθηκαν σε ευρεία ποικιλία καρκίνων, η οποία εν μέρει υποδεικνύεται σε προηγούμενες μελέτες [33]. Οι SNVs στα PREX1 και PREX2 γονίδια, τα οποία συμπυκνώνονται στο κεντρικό πεδία σηματοδότησης του, θα μπορούσαν να ενισχύσουν τις δραστηριότητες σε αυτά τα γονίδια, και έτσι λειτουργικά μιμείται την αυξημένη έκφραση αυτού του γονιδίου σε μερικούς διαφορετικούς τύπους καρκίνων. Οι υποψήφιοι γονίδιο του καρκίνου που σχετίζονται με προσδιορίζονται από αυτό το σύνολο δεδομένων που παρατίθενται στον Πίνακα 1.

Η

Αριθμός SNVs

Gene

Domain

Domain

Gene

P-value

*

EGFR

†IPR001245:Serine-threonine/tyrosine-protein kinase34374.4e-21KRAS

† IPR001806: Ras GTPase678.0e-6TNNIPR003961: Ινωδονεκτίνης, τύπου III455.2e-5TP53

† IPR008967: p53-όπως παράγοντα μεταγραφής, DNA-binding20239.5e-5PREX1IPR000219: Δίκλινα ομολογία (DH ) domain450.00071DNAH7IPR004273: δυνεΐνης βαριά chain570.0025FSTL5IPR011044: Quinoprotein αφυδρογονάση αμίνη, βήτα αλυσίδα-like770.0043NRXN3IPR008985: Concanavalin Α-όπως λεκτίνη /glucanase570.0063PREX2IPR001849: πλεκστρίνης homology370.011FER1L6IPR008973: C2 ασβεστίου /περιοχή πρόσδεσης λιπιδίων, CaLB360.013COL22AIPR008985: Concanavalin Α-όπως λεκτίνη /glucanase360.015Table 1. Κατάλογος των εντοπισθέντων πιθανών γονιδίων που σχετίζονται με τον καρκίνο

*

P

& lt.? 0.02

† Αναφέρθηκαν στο Cancer Gene Απογραφή [11]. Σημειώστε ότι τα γονίδια κορυφή του πίνακα έχουν αναφερθεί στο παρελθόν ότι σχετίζονται με αυτόν τον τύπο του καρκίνου, ενώ οι περισσότεροι από αυτούς είναι νέες πιθανές γονίδια σχετίζονται με τον καρκίνο. CSV Λήψη CSV

SNVs στο PREX1 (Α) και PREX2 τα γονίδια (Β) αντιπροσωπεύονται στα κουτιά. Οι πρωτεϊνικές περιοχές στις οποίες οι εμπλουτισμοί των SNVs ήταν στατιστικά σημαντικές εκπροσωπούνται σε κουτιά πορτοκαλί (επίσης βλέπε Υλικά και Μέθοδος). DH-τομέα: Δίκλινα ομολογία (DH) τομέα? PH: πλεκστρίνης τομέα ομολογία? D: DEP τομέα? P:. ΡΟΖ /DHR /GLGF

Η

Επίσης, ο εμπλουτισμός της οδού αναλύει τη χρήση της βάσης δεδομένων KEGG [34] ανιχνεύεται επίσης πολλές υποθετικές σχετίζονται με τον καρκίνο μονοπάτια. Οι πανομοιότυπες οδούς που παρατίθενται στον Πίνακα 2. Είναι ενδιαφέρον ότι η ενδομητρίου μονοπάτι καρκίνος [35] ανιχνεύθηκε σε αυτή την ανάλυση εμπλουτισμού (

P

= 3.1e-15, Σχήμα 2Α). Αυτή η οδός περιλαμβάνει σημαντικά σχετίζονται με τον καρκίνο οδούς, για παράδειγμα, την οδό σηματοδότησης ΜΑΡΚ και την οδό ΡΙ3Κ /ΑΚΤ. Γι ‘αυτό το μονοπάτι, συγκρίναμε τα πρότυπα μετάλλαξη μεταξύ των ιαπωνικών δεδομένων μας και εκείνων της προηγούμενης μελέτης του αδενοκαρκινώματος του πνεύμονα σε Καυκάσιους [21]. Βρήκαμε ότι οι SNVs στο γονίδιο EGFR ήταν τέσσερις φορές συχνότερα στον ιαπωνικό πληθυσμό από ό, τι μεταξύ Καυκάσιων πληθυσμούς (Σχήμα 2Β, αριστερό πάνελ). μεταλλάξεις του EGFR ήταν συχνά συμβαίνουν σε μη καπνιστής, γυναικεία και Ασιάτες ασθενείς του αδενοκαρκινώματος του πνεύμονα [36], το οποίο είναι ένα μοριακό στόχο του αντικαρκινικού φαρμάκου,

gefitinib

[20,37,38]. Αντιστρόφως, KRAS μεταλλάξεις, οι οποίες είναι επίσης πολύ γνωστές μεταλλάξεις σχετίζονται με τον καρκίνο [39], ήταν περισσότερο από τέσσερις φορές συχνές μεταξύ των Καυκάσιων (Σχήμα 2Β, κεντρικό φύλλο). Ωστόσο, δεν είναι όλα τα μετάλλαξης σχέδια είναι διαφορετικά μεταξύ των πληθυσμών. Για παράδειγμα, TP53 έτρεφε μεταλλάξεις σε δύο σύνολα δεδομένων με παρόμοια συχνότητα (Εικόνα 2Β, δεξί πάνελ).

KEGG ID

ορισμό Διαδρομή

Αριθμός των καρκίνων με SNVs

P-value

*

hsa05213Endometrial cancer723.1e-15hsa04320Dorso-κοιλιακού άξονα formation484.4e-15hsa05219Bladder cancer624.9e-14hsa05223Non-μικροκυτταρικό καρκίνο του πνεύμονα cancer667.1e-12hsa05214Glioma706.5e-11hsa05218Melanoma701.3e-9hsa05212Pancreatic cancer686.9e-9hsa05215Prostate cancer714.3e-7hsa05216Thyroid cancer361.1e -6hsa04520Adherens junction593.7e-6hsa05210Colorectal cancer531.8e-5hsa04012ErbB σηματοδότησης pathway642.6e-5hsa05120Epithelial κυτταρικής σηματοδότησης στο

Helicobacter pylori

infection534.8e-5hsa04540Gap junction600.00024hsa04912GnRH σηματοδότησης pathway610.0011hsa05217Basal κυττάρων carcinoma410.0020hsa05222Small πνεύμονα cancer520.0069hsa05220Chronic μυελοειδή leukemia460.010hsa05160Hepatitis C670.012hsa05014Amyotrophic πλευρική σκλήρυνση (ALS) πέψη 360.014hsa04977Vitamin και absorption200.015hsa05416Viral myocarditis400.028hsa04512ECM-υποδοχέα interaction470.034hsa02010ABC transporters290.035hsa04510Focal adhesion780.037hsa05412Arrhythmogenic δεξιάς κοιλίας (ARVC) 400.039Table 2. Κατάλογος των εντοπίζονται πιθανές καρκινογόνες που σχετίζονται με οδούς

*

P

& lt.? 0.05 CSV Λήψη CSV

(Α) μοτίβα μετάλλαξη στο ενδομήτριο οδό καρκίνου που ανιχνεύθηκε κατά την ανάλυση εμπλουτισμού φαίνονται. Το μέγεθος του κύκλου αντιπροσωπεύει τον πληθυσμό των καρκίνων που φιλοξενούν τις SNVs στο αντίστοιχο γονίδιο (ποσοστό δείχνεται επίσης στο περιθώριο). Οι SNVs σε αυτή τη μελέτη και την εξωτερική σύνολο δεδομένων σε Καυκάσιους πληθυσμούς που φαίνεται στο κόκκινο και μπλε κύκλοι, αντίστοιχα. Δ.Π .: συχνότητες μετάλλαξης δεν ήταν διαθέσιμα. (Β) Σύγκριση της αναλογίας μετάλλαξης του EGFR, KRAS και TP53 γονιδίων μεταξύ των δύο συνόλων δεδομένων. Οι p-τιμές υπολογίστηκαν με το τεστ δύο δειγμάτων για την ισότητα των αναλογιών.

Η

ασάφεια στον προσδιορισμό SNV της κανονικής τους ομολόγους ιστού

Κατά την προαναφερθείσα ανάλυση, διακρίσεις βλαστική παραλλαγών που χρησιμοποιούν το φυσιολογικά αντίστοιχα ιστό. Ένας αριθμός SNVs αρχικά ταυτοποιηθεί ως σωματικά βρέθηκαν επίσης να είναι παρόντες σε φυσιολογικούς ιστούς, έτσι, ήταν ψευδή θετικά κλήσεις υπό τις επικυρώσεις με οπτική επιθεώρηση των αλληλουχιών χαρτογραφηθεί και αλληλούχιση Sanger. Για να εξεταστεί η αιτία αυτού του προβλήματος, θα επιθεωρούνται τα σφάλματα σε τυχαία επιλεγμένα 26 καρκίνων και φυσιολογικών ιστών τους. Κατά μέσο όρο σε κάθε καρκίνο, είκοσι πέντε τοις εκατό των σωματικών υποψηφίων SNV βρέθηκαν να είναι ψευδώς θετικά (Σχήμα 3). Σε αυτές τις περιπτώσεις, η κάλυψη αλληλουχία και την ποιότητα της κανονικής ομόλογό δεν ήταν επαρκείς. Πράγματι, οι αλληλουχίες που υποστηρίζουν ο ένας τον SNV και αυτές οι ιδιότητες ήταν σημαντικά διέφερε μεταξύ του καρκίνου και φυσιολογικούς ιστούς. Αν και αύξησε τον συνολικό αριθμό των διαβάζει στους φυσιολογικούς ιστούς, ήταν δύσκολο στην πράξη να καλύψουν όλα τα γενωμικού θέσεις (Σχήμα S4 στο File S1). Μια περίληψη των επικυρώσεων SNV βλαστικής σειράς παρουσιάζεται στον Πίνακα S5 στο S1 αρχείου.

υποψήφιοι σωματικά SNV ταυτοποιήθηκαν με τη χρήση 26 exomes καρκίνο και κάθε φυσιολογικό ομόλογό του. Η σωστή σωματική SNVs και ψευδώς θετικά αποτελέσματα παρουσιάστηκαν σε ροζ και μπλε γραμμές, αντίστοιχα. Οι 26 καρκίνοι που χρησιμοποιούνται για την ανάλυση ταξινομήθηκαν από την αύξηση του συνολικού αριθμού των SNVs (άξονας x).

Η

Ωστόσο, παρατηρήσαμε ότι κάποιοι είχαν αναγνωριστεί σωστά ως SNVs βλαστική στις εξωτερικές exomes αναφοράς. Είκοσι πέντε exomes μας επέτρεψε να αποκλείσει οκτώ ψευδώς θετικά κλήσεις σε κάθε καρκίνο. Αυτό εγείρει την πιθανότητα ότι οι SNVs από τους άλλους ασθενείς μπορούν να χρησιμοποιούνται ως υποκατάστατα για να αυξήσετε το βάθος και την ποιότητα της αλληλουχίας.

Εξαιρουμένων SNVs βλαστικής σειράς με την εξέταση της αμοιβαίας επικαλύψεις των exomes άλλων προσώπων »

Για να ελέγξετε περαιτέρω αυτή η δυνατότητα, θα εξεταστεί κατά πόσον οι αναλύσεις του καρκίνου exome θα ήταν δυνατή χωρίς αλληλουχίας της κανονικής ομόλογό του ιστού του κάθε καρκίνου. Κατ ‘αρχάς, θα αξιολογηθεί ο βαθμός στον οποίο οι SNVs βλαστικής σειράς θα μπορούσαν να διακριθούν με τη χρήση εξωτερικών exomes. Για το σκοπό αυτό, χρησιμοποιήσαμε τα 97 ζεύγη καρκίνου-κανονική σύνολα δεδομένων exome για το σύνολο δεδομένων επικύρωσης. Βρήκαμε ότι θα μπορούσαμε να ανιχνεύσει 54% των βλαστικής σειράς SNVs χρησιμοποιώντας τις 96 κανονικές exomes ιστού από την εξωτερική αναφοράς (Σχήμα 4Α). Έχουμε επεκτείνει περαιτέρω το σύνολο δεδομένων διήθησης χρησιμοποιώντας τα εξωτερικά διαθέσιμη 73 ιαπωνικά δεδομένα exome και 48 in-house ιαπωνική σύνολα δεδομένων exome. Συνολικά, ήμασταν σε θέση να αφαιρέσει το 64% των βλαστικής σειράς SNVs, χρησιμοποιώντας συνολικά 217 Ιάπωνες σύνολα δεδομένων exome από άλλα άτομα, χωρίς αλληλούχιση κανονικές ομόλογό του κάθε καρκίνου (Εικόνα 4Α). Η παρέκταση του γραφήματος έδειξε επίσης ότι 1350 και 2000 δείγματα θα απαιτείται για την απομάκρυνση του 90% και 95% των βλαστικής σειράς SNVs, αντίστοιχα. Αναμένουμε ότι μια τέτοια μέγεθος του δείγματος θα είναι διαθέσιμες στο εγγύς μέλλον λαμβάνοντας υπόψη την τρέχουσα ταχεία επέκταση της ανάλυσης exome.

(Α) Η δύναμη της ανίχνευσης SNVs βλαστική εξετάζει την αμοιβαία επικάλυψη μεταξύ άλλων ιαπωνικών ατόμων. Ευαισθησίας αντιπροσωπεύει το ποσοστό των SNVs βλαστική ανιχνεύεται σωστά. Τα σύνολα δεδομένων που χρησιμοποιούνται για τον αποκλεισμό των SNVs βλαστική εμφανίζονται στον άξονα x. Το ένθετο αντιπροσωπεύει την προβολή του γραφήματος. Διαρρύθμιση καμπύλη του γραφήματος δεικνύεται επίσης. (Β) διακριτική εξουσίες των τριών διαφορετικών εθνοτικών ομάδων για τα SNVs βλαστικής σειράς σε 97 ιαπωνικές καρκίνους. Οι ευαισθησίες για την ανίχνευση βλαστική SNVs φαίνεται από τα ακόλουθα χρώματα? πράσινο: Κινέζικα? μωβ: Γιορούμπα? πορτοκαλί:. Καυκάσιος

Η

αξιολογηθεί περαιτέρω εάν η ίδια φιλτραρίσματος θα μπορούσε να γίνει από μόνο χρησιμοποιώντας exomes καρκίνο. Έχουμε λάβει ουσιαστικά τα ίδια αποτελέσματα (Σχήμα S5 σε File S1). Εμφανή προειδοποίηση αυτής της προσέγγισης είναι ότι αυτό θα αγνοήσει περίπου 3% των σωματικών SNVs περιοδικά που συμβαίνουν (Σχήμα S5 στο αρχείο S1, μπλε). Ωστόσο, όπως προαναφέρθηκε, βρήκαμε ότι οι εν λόγω επαναλαμβανόμενες SNVs ήταν πολύ σπάνια [15,19] και οι περισσότεροι από αυτούς που προέρχονται από αμφίβολες σωματικά SNVs, τα οποία εμπόδια στους φυσιολογικούς ιστούς. Θεωρούμε επίσης ότι οι περισσότερες από αυτές τις επαναλαμβανόμενες SNVs, αν υπάρχουν, μπορούν να αναλυθούν χωριστά από αλληλούχιση έναν περιορισμένο αριθμό φυσιολογικών ιστών.

Φιλτράρισμα έξω SNVs βλαστικής σειράς με την εξέταση της αμοιβαίας επικαλύψεις για διαφορετικές εθνοτικές ομάδες και για τις σπάνιες SNPs

θα εξεταστεί κατά πόσον SNVs σε άλλα εθνικά υπόβαθρα θα μπορούσαν να χρησιμοποιηθούν ως εξωτερικά σύνολα δεδομένων για το φιλτράρισμα. Έχουμε λάβει τα στοιχεία exome από άτομα διαφόρων εθνοτικών υποβάθρων από την Γονιδιώματος 1000. Χρησιμοποιήσαμε αυτά τα σύνολα δεδομένων exome να αποκλείσει τις SNVs βλαστικής σειράς που εντοπίστηκαν στα ιαπωνικά καρκίνους. Βρήκαμε ότι η διακριτική εξουσία ήταν σημαντικά χαμηλότερη σε σύγκριση με exomes από την ιαπωνική πληθυσμούς. Επομένως, αυτά τα σύνολα δεδομένων δεν ήταν κατάλληλες για το σκοπό αυτό (Σχήμα 4Β). Εξετάσαμε, επίσης, και διαπίστωσε ότι οι exomes σε κάθε εθνική ομάδα ήταν χρήσιμο να διακρίνει τα SNVs βλαστική στην αντίστοιχη ομάδα (Σχήμα S6, S7 και στον Πίνακα S6 στο S1 αρχείου)

Εμείς, στη συνέχεια, εξέτασε σε ποιο βαθμό., ελάσσονες παραλλαγές βλαστικής γραμμής θα μπορούσε να καλυφθεί με αυτή την προσέγγιση στον ιαπωνικό πληθυσμό. Αξιολογήσαμε την ευαισθησία της διαδικασίας φιλτραρίσματος για τα SNVs στους 97 καρκίνους (Σχήμα S8 σε S1 File). Βρήκαμε ότι το 88% των βλαστική SNVs εμφανίζονται σε περισσότερους από πέντε τοις εκατό των 97 exomes θα μπορούσε να ανιχνευθεί με τη χρήση των 73 εξωτερικών ιαπωνική σύνολα δεδομένων. Για τους SNVs συμβαίνουν σε 1% των καρκίνων 97, 19% θα μπορούσε να αποκλειστεί.

Χρησιμοποιώντας το ακατέργαστο σύνολο δεδομένων για το χαρακτηρισμό που σχετίζονται με τον καρκίνο SNVs και μονοπάτια

Στο σύνολό τους, με 217 Ιάπωνες exomes χρησιμοποιούνται για διήθηση, το 36% των SNVs βλαστικής σειράς παρέμεινε αφιλτράριστο. Παρ ‘όλα αυτά, θεωρήσαμε ότι μπορεί να είναι ακόμη δυνατό να χρησιμοποιηθεί το ακατέργαστο σύνολο δεδομένων SNV ως μία πρώτη προσέγγιση για τον εντοπισμό και την ανάλυση των γονιδίων του καρκίνου που σχετίζονται και υποψηφίους οδό. Για την επικύρωση αυτή την ιδέα, συγκρίναμε τα αποτελέσματα του εμπλουτισμού αναλύσεων μεταξύ του αργού σύνολο δεδομένων και τις εκλεπτυσμένες σωματικά σύνολα δεδομένων SNV, οι οποίες δημιουργήθηκαν από τα ζεύγη καρκίνου-κανονική exomes.

Τα περισσότερα από τα πιθανά γονίδια και τα μονοπάτια που σχετίζονται με τον καρκίνο τα οποία εντοπίστηκαν από την εκλεπτυσμένη σύνολο δεδομένων ήταν επίσης παρόντες στο ακατέργαστο σύνολο δεδομένων (πίνακες S7 και S8 στο S1 αρχείου). Το παράδειγμα του γονιδίου TNN, η οποία αναφέρθηκε ως δείκτης του στρώματος του όγκου [40-42], παρουσιάζεται στο Σχήμα S9 σε S1 αρχείου. Σε αυτή την περίπτωση, ακόμη και με τις βλαστικής σειράς SNVs, τα οποία ήταν μη φιλτραρισμένο στην ακατέργαστη σύνολο δεδομένων (υποδεικνύεται με μαύρα στο Σχήμα S9 στον Ι1 File), ο εμπλουτισμός των σωματικών SNVs στον τομέα αυτό ήταν στατιστικά σημαντική. Συνολικά, εννέα γονίδια τα οποία προσδιορίζονται ως κατέχουσες σχετίζονται με τον καρκίνο SNVs από την εκλεπτυσμένη σύνολο δεδομένων ανιχνεύθηκαν επίσης στο ακατέργαστο σύνολο δεδομένων. Από την άλλη πλευρά, δύο γονίδια από την εκλεπτυσμένη σύνολο δεδομένων δεν αντιπροσωπεύονταν στο ακατέργαστο σύνολο δεδομένων. Στην ανάλυση οδό, ταυτοποιήσαμε 26 σχετίζονται με τον καρκίνο οδοί που εντοπίστηκαν από την εκλεπτυσμένη σύνολο δεδομένων. Επιπλέον, 19 μονοπάτια επίσης εκπροσωπούνται στο ακατέργαστο σύνολο δεδομένων, καθώς και το εκλεπτυσμένο σύνολο δεδομένων. Η επικάλυψη μεταξύ των συνόλων δεδομένων συνοψίζονται στον Πίνακα 3. Θα πρέπει να σημειωθεί ότι στατιστικά εμπλουτισμό αναλύσεις ήταν δυνατή ακόμη και στην τρέχουσα κάλυψη του συνόλου δεδομένων φίλτρου. Με την εκτεταμένη εξωτερική σύνολο δεδομένων, θα ήταν πιο πρακτικό να υποβάλλουν οι υποψήφιοι με τα αποτελέσματα των επικυρώσεων αλληλουχίας Sanger, καθώς και την άρση των εναπομενόντων SNVs βλαστικής σειράς.

Η Αριθμός προσδιορίζονται genes/pathways

Crude

*

Refined

Overlap

Genes16119Pathways232619Table 3. Σύγκριση των αποτελεσμάτων στον εμπλουτισμό αναλύσεις μεταξύ του αργού και εκλεπτυσμένο σύνολο δεδομένων.

* ταυτοποιήθηκαν χρησιμοποιώντας το ακατέργαστο σύνολο δεδομένων.

† Προσδιόρισε χρησιμοποιώντας το εκλεπτυσμένο σύνολο δεδομένων.

‡ Σημαντικές τόσο ακατέργαστα και εξευγενισμένα σύνολα δεδομένων. CSV Λήψη CSV

Αναγνώριση πρόγνωση σχετικών γονιδίων με τη χρήση του αργού σύνολο δεδομένων

Ως ένας από τους σημαντικότερους στόχους των μελετών καρκίνου exome, διερευνήσαμε εάν μπορεί να εντοπισθεί μεταλλάξεις που επηρεάζουν προγνώσεις του καρκίνου με τη χρήση αργού σύνολο δεδομένων ( Πίνακας S9 και το Σχήμα S10 σε S1 File). Στην ανάλυση Kaplan-Meier, επτά ασθενείς που μεταφέρονται SNVs στο γονίδιο ΑΤΜ (Σχήμα 5Α) έδειξε στατιστικά σημαντική κακή πρόγνωση (

P

= 9.6e-6, Σχήμα 5Β). Τρεις SNVs στο γονίδιο ΑΤΜ ήταν σημαντικά εμπλουτισμένη με τη φωσφατιδυλοϊνοσιτόλης 3/4-κινάση καταλυτική περιοχή (

P

= 0,014). ATM ανιχνεύει βλάβη του DNA και φωσφορυλιώνει ΤΡ53, η οποία, με τη σειρά της, επικαλείται διάφορες κυτταρικές αποκρίσεις, όπως επιδιόρθωση του DNA, διακοπή αύξησης και απόπτωση, και συλλογικά προλαμβάνει την εξέλιξη του καρκίνου (Σχήμα S11 σε File S1) [43,44].

(Α) SNVs στο γονίδιο ΑΤΜ. Οι SNVs που εντοπίστηκαν στην αρχική διαλογή και εκείνων που απομένει μετά την επικύρωση αλληλουχίας Sanger του ομολόγου κανονικού ιστού εμφανίζονται σε μαύρο και κόκκινο χρώμα, αντίστοιχα. TAN: συντήρηση τελομερή μήκους και επιδιόρθωση του DNA ζημιά? PI3_PI4 κινάσης: φωσφατιδυλινοσιτόλης 3- /4-κινάση, καταλυτική. (Β) επιβίωση ανάλυση ασθενών με και χωρίς ΑΤΜ SNVs. Τα σύνολα δεδομένων πριν και μετά την επικύρωση αλληλουχίας Sanger αντιπροσωπεύονται από μαύρες και κόκκινες γραμμές, αντίστοιχα. Η στατιστική σημαντικότητα υπολογίστηκε χρησιμοποιώντας μια δοκιμασία log-rank (

P

& lt? 0,05). Σημειώστε ότι οι διαφορές επιβίωσης για τα άτομα με SNVs στο μη Sanger επικυρωμένα σύνολο δεδομένων ήταν σημαντικές πριν από την επικύρωση Sanger. (C, D) Αποτελέσματα παρόμοια ανάλυση όπως αυτή που περιγράφεται στο Α και Β για το γονίδιο PAPPA2. Σε αυτήν την περίπτωση, οι ασθενείς με τις SNVs έδειξε καλύτερη πρόγνωση. ConA όπως υπο: Concanavalin Α-όπως λεκτίνη /γλυκανάσης, υποομάδα? Ν: Notch dimain? Πεπτιδάσης M43:. Πεπτιδάσης M43, εγκυμοσύνη συνδέεται πλάσματος-Α

Η

Θα εξεταστεί επίσης αν άλλα συχνά μεταλλαγμένα γονίδια που συνδέονται με την καλύτερη ή χειρότερη πρόγνωση. Βρήκαμε ότι οι ασθενείς με μεταλλάξεις PAPPA2 έδειξαν παρατεταμένους χρόνους επιβίωσης (

P

= 0,026, Σχήμα 5C και D). PAPPA2 proteolyzes ΙΟΡΒΡ5 [45,46], η οποία είναι ένας ανασταλτικός παράγοντας για IGFs [47]. Μεταλλάξεις στο γονίδιο PAPPA2 μπορεί να οδηγήσει στην συσσώρευση του ΙΟΡΒΡ5, και η μείωση που προκύπτει στη σηματοδότηση του IGF μπορεί να επηρεάσει τον πολλαπλασιασμό των καρκινικών κυττάρων [48]. Και πάλι, θα πρέπει να σημειωθεί ότι και για τα δύο γονίδια ΑΤΜ και PAPPA2, η στατιστική σημασία της προγνωστικής διαφορά παρέμεινε τόσο πριν (μαύρη γραμμή) και μετά (κόκκινη γραμμή) τα υπόλοιπα μεταλλάξεις βλαστικής σειράς απομακρύνθηκαν, το οποίο ελέγχθηκε με ανάλυση αλληλουχίας Sanger (Εικόνα 5Β, D και Πίνακας S10 στην S1 αρχείου).

Συμπεράσματα

Έχουμε εντοπίσει και να χαρακτηρίζονται τα SNVs στο αδενοκαρκίνωμα του πνεύμονα σε ένα ιαπωνικό πληθυσμό. Περαιτέρω βιολογικές αξιολογήσεις των ανακάλυψαν SNVs θα περιγραφούν αλλού. Ειδικότερα, οι πληροφορίες των μεταγραφικό και επιγονιδιώματος θα πρέπει να είναι σημαντική για την περαιτέρω αναλύσεις των γονιδιωμάτων καρκίνο, δεδομένου ότι θα ρίξει νέο φώτα για τη βιολογία του καρκίνου (Πίνακας S1) [49]. Σε αυτή τη μελέτη, παρουσιάσαμε επίσης μια χρήσιμη προσέγγιση για την ανάλυση των exomes καρκίνου, χωρίς την ανάγκη για την αλληλουχία του ομολόγου φυσιολογικό ιστό. Πιστεύουμε ότι η προσέγγιση μειώνει όχι μόνο τα εμπόδια του κόστους, του χρόνου και την πιστότητα των δεδομένων στην ανάλυση exome, αλλά επιτρέπει επίσης την ανάλυση των δειγμάτων exome αρχείου, για το οποίο η κανονική τους ομολόγους του ιστού δεν είναι πάντα διαθέσιμες.

Υλικά και Μέθοδοι

Ηθική δήλωση

Όλα τα δείγματα συλλέχθηκαν ακολουθώντας το πρωτόκολλο (και γραπτή συγκατάθεση), τα οποία εγκρίθηκαν από επιτροπή δεοντολογίας στο Εθνικό Κέντρο Καρκίνου, Ιαπωνία (Αλληλογραφία: Katsuya Tsuchihara? [email protected]).

επιλογή υπόθεση και την προετοιμασία του DNA

Όλα τα υλικά ιστού ελήφθησαν από ασθενείς ιαπωνική αδενοκαρκίνωμα του πνεύμονα με το κατάλληλα ενημερωμένη συγκατάθεση. επιλέχθηκαν χειρουργικά δείγματα αδενοκαρκινώματος του πνεύμονα πρωτοβάθμια με μήκος διαστάσεις άνω των 3 cm. Τα στοιχεία για τους 52 ασθενείς που είχαν υποτροπές και άλλες κλινικές πληροφορίες σχετικά με τις 97 περιπτώσεις που παρουσιάζονται στον Πίνακα S11 στην S1 αρχείου. Όλες οι 97 καρκίνο και φυσιολογικούς ιστούς εκχυλίσθηκαν από δείγματα μεθανόλη-καθορίζεται από τη σύλληψη λέιζερ μικροδιατομής. καθαρισμός του DNA πραγματοποιήθηκε με τη χρήση ενός σταθμού εργασίας EZ1 Σύνθετη XL Ρομποτικό με Κιτ ιστού EZ1 DNA (Qiagen).

Ολόκληρο-exome αλληλουχίας

Χρησιμοποιώντας 1 μg του απομονωμένου DNA, έχουμε ετοιμάσει βιβλιοθήκες exome-αλληλουχίας χρησιμοποιώντας το σύστημα TARGET SureSelect εμπλουτισμού (Agilent Technologies) σύμφωνα με το πρωτόκολλο του κατασκευαστή. Το συλληφθέν DNA αλληλουχήθηκε από την πλατφόρμα Illumina Genome Analyzer IIx (Illumina), αποδίδοντας 76-βάσεων ζεύγη-άκρο διαβάζει.

Σωματικά SNV

ανίχνευση

Οι μέθοδοι που χρησιμοποιήθηκαν για την ανίχνευση της SNVs, συμπεριλαμβανομένων BWA, SAMtools [50] και GATK, παρουσιάζονται στο Σχήμα S2 σε S1 αρχείου. Χρησιμοποιώντας δεδομένα από το NCBI dbSNP χτίσει 132 και μία ιαπωνική γονιδίωμα [51], οι μεγάλες βλαστική SNVs αποκλείστηκαν. Επιπλέον, σπάνια βλαστική SNVs απορρίφθηκαν χρησιμοποιώντας 97 exomes από την κανονική τους ομολόγους ιστό, 73 Ιάπωνες exomes παρέχονται από τα γονιδιώματα Έργου 1000 (τα στοιχεία phase1 exome, 20110521) και 48 in-house ιαπωνικό exomes. Έχουμε επικυρωμένες επίσης ένα τμήμα των συνόλων δεδομένων SNV από τον προσδιορισμό της αλληλουχίας του Sanger των ιστών καρκίνου και φυσιολογικά αντίστοιχα ιστός τους (Σχήμα S12 σε S1 File).

Ταυτοποίηση των εξαιρετικά μεταλλαγμένα γονίδια

Διαπιστώσαμε γονίδια τα οποία ήταν σημαντικά εμπλουτισμένη με SNVs με τον υπολογισμό του αναμενόμενου αριθμού των καρκίνων με SNVs στο γονίδιο. Το μήκος του συνόλου των CDS περιοχές εκπροσωπήθηκε στο

Ν

(περίπου 30.8 Μ βάσεις). Όταν ένας ασθενής έτρεφε συνολικά

m

SNVs, η πιθανότητα ότι ο ασθενής λιμάνια SNVs στο γονίδιο

t

(μήκος:

ν

) υπολογίστηκε ως

P

:

P

m

,

t

,

n

=

1

(

1

m

N

)

n

The άθροισμα των

P

σε 97 καρκίνους εκπροσωπήθηκε στο αναμενόμενο αριθμό των καρκίνων με SNVs στο γονίδιο

t

. Οι p-τιμές της παρατηρούμενης αριθμό υπολογίστηκαν από την συνάρτηση πιθανότητας Poisson χρησιμοποιώντας R ppois.

Στατιστική προσέγγιση για τον εμπλουτισμό αναλύσεις

Για να εξετάσει τον εμπλουτισμό των μεταλλάξεων σε περιοχές λειτουργικής πρωτεΐνης, έχουμε χαρτογραφηθεί η SNVs σε τομείς που χρησιμοποιούν InterProScan [52] και να τους ανατεθεί στον Κατάλογο σωματικών μεταλλάξεων Καρκίνου (COSMIC). Αναλύσαμε τον εμπλουτισμό των SNVs στις ίδιες περιοχές, όπως οι μεταλλάξεις που δόθηκαν από την κοσμική. Οι p-τιμές για τις παρατηρούμενες μεταλλάξεις σε αυτούς τους τομείς υπολογίστηκαν με τη χρήση υπεργεωμετρική κατανομές τους (R phyper). Εν συντομία, τα πεδία στα οποία τα SNVs εμπλουτίστηκαν στατιστικά σημαντικά από επιλέχθηκαν από τον αναμενόμενο αριθμό SNVs στο δεδομένο μήκος του τομέα. Για την εκτίμηση της αναμενόμενης αριθμό, ο συνολικός αριθμός των SNVs ανήκουν στο γονίδιο διαιρέθηκε με το μήκος του γονιδίου. Για την ανάλυση αυτή, χρησιμοποιήσαμε τα γονίδια που φιλοξενούν πέντε ή περισσότερα SNVs στην περιοχή κωδικοποίησης και τρία ή περισσότερα SNVs στον τομέα.

Σας έχουν ανατεθεί SNVs σε πορείες, όπως περιγράφεται από την Εγκυκλοπαίδεια του Κιότο γονιδίων και γονιδιωμάτων (KEGG) και υπολογίζονται οι εμπλουτισμοί των SNVs στα μονοπάτια. Ο ρυθμός μετάλλαξης

M

αντιπροσώπευε την αναλογία του μέσου αριθμού των μεταλλαγμένων γονιδίων με το συνολικό αριθμό των γονιδίων (17175), που χρησιμοποιήθηκαν στη μελέτη μας. Η αναμενόμενη τιμή για τον αριθμό των καρκίνων με SNVs στην οδό

t

ορίστηκε

λ

και υπολογίζεται από το ρυθμό μετάλλαξης

M

και ο αριθμός των γονιδίων στην οδό

n

ως follows:

λ

t

,

n

=

{

1

(

1

M

)

n

}

×

97

The p-value για την παρατηρούμενη αριθμό των καρκίνων με SNVs στην οδό

t

υπολογίστηκε από τη συνάρτηση πιθανότητας Poisson χρησιμοποιώντας R ppois.

Εκτίμηση της διακριτικής εξουσίας για τον αποκλεισμό των SNVs βλαστικής σειράς με την εξέταση της αμοιβαίας επικαλύψεις

Είμαστε εκτιμάται η διακριτική εξουσία για τον αποκλεισμό της βλαστικής σειράς SNVs από την εξέταση εκείνων που προέρχονται από άλλες μη-καρκινικές exomes. Βλαστικής σειράς SNVs από 97 σε συνδυασμό με όγκο κανονικής exomes χρησιμοποιήθηκαν ως σύνολα δεδομένων αναφοράς. Έως 217 δείγματα (96 κανονικός exomes ιστού από τους άλλους και 121 επιπλέον Ιαπωνικά exomes) επιλέχθηκαν τυχαία, και ανιχνεύθηκαν ευαισθησίες και εξειδικεύσεις τους για την ανίχνευση των SNVs βλαστικής σειράς με τη λήψη του μέσου όρου των είτε όλους τους συνδυασμούς ή ένα υποσύνολο περίπου 10.000 συνδυασμούς . Εκτιμήσαμε επίσης τη διακριτική εξουσία με τα δεδομένα από τα γονιδιώματα Έργου 1000 για τέσσερις εθνοτικές ομάδες (73 JPT, 90 CHS, 81 YRI και 64 CEU) χρησιμοποιώντας παρόμοιες δοκιμές. ακολουθίες σε ολόκληρο exome (τα δεδομένα phase1 exome, 20110521) ελήφθησαν από την τοποθεσία FTP στο γονιδιώματος Έργου 1000.

Kaplan-Meier καμπύλες

χρησιμοποιήθηκε η μέθοδος Kaplan-Meier για να ελέγξετε το σχέσεις των παρατηρούμενων μεταλλάξεων στο χρόνο επιβίωσης, και οι υπολογισμοί διεξήχθησαν χρησιμοποιώντας το πακέτο λογισμικού R. Αλλαγές στα ποσοστά επιβίωσης που συσχετίστηκαν με SNVs εξετάστηκαν χρησιμοποιώντας το τεστ log-rank (R survdiff).

Πρόσβαση στα δεδομένα

Πλήρης πρώτες σύνολα δεδομένων θα μοιραστούν με τους ερευνητές, κατόπιν αιτήματος. Οι πληροφορίες των σωματικών μεταλλάξεων στα αντίστοιχα γονιδιωματική συντεταγμένες έχει παρασχεθεί στον Πίνακα S2.

Υποστήριξη Πληροφορίες

αρχείου S1.

Τα στοιχεία S1 στο S12 και πίνακες S3 σε S11 περιλαμβάνονται.

doi: 10.1371 /journal.pone.0073484.s001

(PDF)

Πίνακα S1.

Η σύγκριση του συνόλου δεδομένων μας με την άλλη διαφορετική μελέτη. Έχουμε την προϋπόθεση ότι η σύγκριση του συνόλου δεδομένων μας με τα γονίδια που εντοπίζονται στην άλλη διαφορετική μελέτη με δεδομένα μεταγραφικό και επιγονιδιώματος σε καρκίνους του πνεύμονα

doi:. 10.1371 /journal.pone.0073484.s002

(XLSX)

Πίνακας S2 .

Ο κατάλογος των σωματικών μεταλλάξεων που προσδιορίζονται από την εκλεπτυσμένη σύνολο δεδομένων.

You must be logged into post a comment.