PLoS One: Intra-Gene μεθυλίωσης του DNA Η μεταβλητότητα είναι ένα κλινικά ανεξάρτητος προγνωστικός δείκτης σε καρκίνους των γυναικών


Αφηρημένο

Έχουμε εισαγάγει ένα μέτρο μυθιστόρημα ανά γονιδίου της ενδο-γονιδίου μεταβλητότητα μεθυλίωση του DNA (IGV) με βάση την πλατφόρμα Illumina Infinium HumanMethylation450, η οποία είναι προγνωστική ανεξάρτητα από γνωστούς προγνωστικούς παράγοντες της κλινικής έκβασης. Χρησιμοποιώντας IGV, αντλούμε ένα ισχυρό γονίδιο πίνακα προγνωστικών υπογραφή για τον καρκίνο των ωοθηκών (OC,

n

= 221), η οποία επικυρώνει σε δύο ανεξάρτητα σύνολα δεδομένων από Mayo Clinic (

n

= 198) και TCGA (

n

= 358), με την έννοια του

p

= 0,004 και στις δύο σειρές. Το OC προγνωστικός υπογραφή γονίδιο του πίνακα αποτελείται από τέσσερις ομάδες γονιδίων, τα οποία αντιπροσωπεύουν διακριτές βιολογικές διεργασίες. Δείχνουμε οι μετρήσεις IGV αυτών των ομάδων γονιδίων είναι πιο πιθανό μια αντανάκλαση ενός μίγματος ετερογένειας ενδοογκική και παράγοντα μεταγραφής (TF) σύνδεση /δραστηριότητα. IGV μπορεί να χρησιμοποιηθεί για να προβλέψει την κλινική έκβαση σε ασθενείς ξεχωριστά, παρέχοντας ένα υποκατάστατο αναγνώσεως των διεργασιών της νόσου είναι δύσκολο να μέτρο

Παράθεση:. Bartlett ΤΕ, Jones Α, Goode EL, Fridley BL, Cunningham JM, Berns EMJJ, et al. (2015) Ενδο-Gene μεθυλίωσης του DNA Η μεταβλητότητα είναι ένα κλινικά ανεξάρτητος προγνωστικός δείκτης σε καρκίνους των γυναικών. PLoS ONE 10 (12): e0143178. doi: 10.1371 /journal.pone.0143178

Επιμέλεια: Dajun Deng, το Πανεπιστήμιο του Πεκίνου Αντικαρκινικό Νοσοκομείο και το Ινστιτούτο, ΚΙΝΑ

Ελήφθη: 5 Οκτ 2015? Αποδεκτές: 30η Οκτωβρίου του 2015? Δημοσιεύθηκε: 2η Δεκεμβρίου 2015

Copyright: © 2015 Bartlett et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Δεδομένα Διαθεσιμότητα: δεδομένα μεθυλίωσης του DNA για το σύνολο δεδομένων κύρια OC αναλύονται εδώ έχουν κατατεθεί στο Gene Expression Omnibus (GEO) υπό τον αριθμό πρόσβασης GSE72021

Χρηματοδότηση:. το έργο αυτό χρηματοδοτήθηκε (MW, AJ) από το έβδομο πρόγραμμα πλαίσιο της Ευρωπαϊκής Ένωσης ( FP7 /2007-2013) στο πλαίσιο αριθμός της σύμβασης επιδότησης 305428 (Έργο EpiFemCare), από το Εθνικό Ινστιτούτο για την πανεπιστημιακή έρευνα Υγείας College του Λονδίνου Νοσοκομεία Βιοϊατρικής Κέντρο Ερευνών, και από την έκκληση Εύα και το Ευρωπαϊκό Δίκτυο Μεταγραφική έρευνα στην Γυναικολογικής Ογκολογίας (ENTRIGO) του της Ευρωπαϊκής Εταιρείας Γυναικολογικής Ογκολογίας (ESGO). ΤΕΒ λάβει χρηματοδότηση από το Μηχανικών και Φυσικών Επιστημών Συμβούλιο Έρευνας του Ηνωμένου Βασιλείου (ESPRC) και το Βρετανικό Συμβούλιο Ιατρικής Έρευνας (MRC) μέσω UCL Complex. ELG έλαβε χρηματοδότηση από τον Fred C. και Katherine Β Ίδρυμα Andersen, ΝΙΗ χορηγεί R01-CA122443, P50-CA136393 (η Mayo Clinic καρκίνου των ωοθηκών SPORE) και Ρ30-CA15083. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Συντομογραφίες : BRCA, ο καρκίνος του μαστού διηθητικό καρκίνωμα? DNAM, μεθυλίωση του DNA? ΕΚ, ο καρκίνος του ενδομητρίου? ΚΩΔΙΚΟΠΟΙΗΣΗ, Εγκυκλοπαίδεια των στοιχείων του DNA? FDR, ποσοστό εσφαλμένης ανακάλυψη? ΙΘ, ετερογένεια εντός του όγκου? OC, ο καρκίνος των ωοθηκών? IGV, Intra γονίδιο μεταβλητότητα της μεθυλίωσης του DNA? TCGA, ο καρκίνος Genome Atlas? TF, παράγοντας μεταγραφή? UCEC, της μήτρας corpus ενδομητρικό καρκίνωμα

Εισαγωγή

Οι διαφορές στη μεθυλίωση του DNA επίπεδα (DNAM) είναι από τις πρώτες αλλαγές στην ανθρώπινη καρκινογένεση [1] και είναι το σήμα κατατεθέν του καρκίνου [2], προσφέροντας το δυναμικό για νέες στρατηγικές για την πρόβλεψη της βιολογίας του καρκίνου και την έκβαση. Οι επιγενετικές διαφορές που αυτές οι αλλαγές προκαλούν είναι πιο σταθερά από ό, τι οι διαφορές στο επίπεδο έκφρασης γονιδίου. επίπεδα έκφρασης γονιδίου, όπως μετράται από RNA, υπόκεινται σε περιοδικές και παροδικές μεταβλητότητα (όπως ημερήσια διακύμανση και αστάθεια mRNA), τα οποία δεν ισχύουν για DNAM. Προσδιορισμός αξιόπιστοι δείκτες διαφορές στα πρότυπα DNAM μπορεί να παρέχει μια πολύτιμη μολύβδου για την ανάπτυξη με βάση το DNA βιοδείκτες του καρκίνου σε ιστό και τα σωματικά υγρά.

Ο καρκίνος των ωοθηκών (OC) και καρκίνου του ενδομητρίου (ΕΚ) είναι η πιο κοινή γυναικολογική καρκίνους [3]. Μόνο ένας στους τρεις ασθενείς με προχωρημένο στάδιο OC επιβιώσει για πέντε χρόνια μετά την αρχική τους διάγνωση [4]. Πολύ λίγα είναι γνωστά για OC βιολογία και πώς να χειριστούν αυτή την ασθένεια θεραπευτικά. αλλαγές DNAM είναι σημαντικές στον καρκίνο [5]? η επιγονιδίωμα είναι μια διασύνδεση μεταξύ του γονιδιώματος και το περιβάλλον [6, 7], και ως εκ τούτου DNAM αλλαγές μπορούν να μετρήσουν την έκθεση σε περιβαλλοντικούς παράγοντες κινδύνου του καρκίνου. DNAM βιοδείκτες που αντιπροσωπεύουν ένα υποκατάστατο για μοτίβα αλληλεπίδρασης γονιδίου έχουν προηγουμένως συσχετιστεί με την κλινική έκβαση σε μια ευρεία ποικιλία καρκίνων [8], καθώς επίσης και ειδικά σε καρκίνους των γυναικών [9].

δείγμα σε δείγμα μεταβλητότητα του DNAM σε συγκεκριμένες γονιδιακές θέσεις εντοπισμού είναι γνωστό ότι είναι σημαντική στην ανάπτυξη του καρκίνου [10, 11], και έχει πρόσφατα αποδειχθεί ότι η αύξηση της ενδο-γονίδιο μεταβλητότητα του DNAM (IGV), ένα μέτρο της εντός δείγματος μεθυλίωση μεταβλητότητα ( Σχήμα 1α), σχετίζεται σε μεγάλο βαθμό με καρκινικούς ιστούς σε σύγκριση με τους υγιείς [12]. Διαφορική μεθυλίωση είναι η συνήθως χρησιμοποιούμενη μέθοδος με την οποία τα επίπεδα μεθυλίωσης σύγκριση μεταξύ των ιστών, φαινοτύπων και πειραματικές συνθήκες (ισοδύναμα προς διαφορική έκφραση γονιδίων). Εδώ, έχουμε αναπτύξει ένα προγνωστικό υπογραφής που βασίζεται σε IGV η οποία είναι ανεξάρτητη από γνωστά κλινικά προγνωστικά χαρακτηριστικά, και δείχνουν ότι αυτή η IGV προγνωστική υπογραφή είναι πιθανό ένα υποκατάστατο ανάγνωση αντανακλώντας ένα μείγμα ενδο-όγκου ετερογένεια και μεταγραφικού παράγοντα (TF) σύνδεση /δραστηριότητα .

(α) το επίπεδο της μεθυλίωσης μέση πάνω από μια συγκεκριμένη γενετική περιοχή υπολογίζεται ξεχωριστά για την TSS200 (υποστηρικτής) και γονιδιώματος περιοχές του σώματος γονίδιο. Το μπλε καμπύλης δηλώνει τη νέα θέση της κόκκινης καμπύλης μετά μιας πρόσθετης παγκόσμιο μετατόπιση επίπεδο μεθυλίωση, η οποία μπορεί να οφείλεται σε τεχνολογικές ή άλλες πειραματικές παράγοντες, και η διαφορά μεταξύ των οριζοντίων κόκκινο και μπλε γραμμές (μέσα επίπεδα) απεικονίζει το αποτέλεσμα αυτής της μετατόπιση στο μέσο επίπεδο μεθυλίωσης. (Β) Η μεταβλητότητα ενδο-μεθυλίωση του γονιδίου (IGV) υπολογίζεται από τη μεταβολή γύρω από το επίπεδο μεθυλίωσης μέση τιμή, δηλαδή, από τις διακεκομμένες κάθετες γραμμές, και παρομοίως υπολογίζεται χωριστά για την TSS200 και γονιδιωματικές περιοχές του σώματος γονιδίου. Οι κάθετες πράσινες γραμμές αλλάξει πολύ λίγο σε σχέση με τις κάθετες κόκκινες γραμμές, που δείχνουν ότι μια τέτοια συνολική πρόσθετο αλλαγή στην μέση στάθμη της μεθυλίωσης έχει πολύ μικρότερη επίδραση στην IGV, το οποίο, ως εκ τούτου αναφέρεται ως «αυτο-βαθμονόμηση μέτρο».

Αποτελέσματα

σύγκριση της πρόβλεψης ευρωστία της ανά-γονιδίου μέτρα μεθυλίωση στα δεδομένα

για να εκτιμηθεί η αποτελεσματικότητα και η ευρωστία της IGV σε σύγκριση με τα μέσα επίπεδα μεθυλίωσης, συγκρίναμε τέσσερις εκατοστιαίες μέτρα μεθυλίωση του γονιδίου, με βάση την μέση στάθμη μεθυλίωση και IGV (Σχήμα 1). Για κάθε γονίδιο, υπολογίσαμε τη μέση στάθμη της μεθυλίωσης και IGV, ξεχωριστά για τον υποκινητή (TSS200) και περιοχές του σώματος γονίδιο, χρησιμοποιώντας τις προδιαγραφές της πλατφόρμας Illumina Infinium HumanMethylation450 των CpGs σε αυτές τις περιοχές για κάθε γονίδιο. Θεωρήσαμε διαφορετικές γονιδιωματικές περιοχές χωριστά, επειδή προτύπων μεθυλίωσης διαφέρουν σημαντικά από το ένα γονιδιωματική περιοχή στην άλλη, και το αποτέλεσμα του επιπέδου μεθυλίωσης στη γονιδιακή ρύθμιση ποικίλλει ανάλογα με γονιδιωματική περιοχή. Τα τέσσερα μέτρα συγκρίναμε, έχουν ως εξής:

TSS200 μέση μεθυλίωση

TSS200 IGV

το σώμα Gene σημαίνει μεθυλίωση

το σώμα Gene IGV

Έχουμε λάβει γονιδίωμα-ευρεία προφίλ DNAM, μέσω της πλατφόρμας Illumina Infinium HumanMethylation450, από 218 στοιχειώδη δείγματα OC. Για καθένα από τα τέσσερα μέτρα που περιγράφονται, χρησιμοποιήσαμε «ελαστικό δίχτυ» [13, 14] για να βρουν μια προγνωστική επιλογή των γονιδίων. Ελαστική δίχτυ έχει βρεθεί να είναι η βέλτιστη μέθοδος γραμμικής μοντελοποίησης για τον εντοπισμό ομάδων γονιδίων τα οποία δρουν μαζί σαν μέρος μιας κοινής βιολογικής διαδικασίας [15]. Είναι μια μέθοδος παλινδρόμησης που «επιλέγει» το σύνολο των γονιδίων που το μοντέλο τα δεδομένα καλύτερα, προσπαθώντας να συμπεριλάβει όσο το δυνατόν λιγότερα γονίδια στο μοντέλο του δυνατού, διασφαλίζοντας παράλληλα ότι το μοντέλο προβλέπει το αποτέλεσμα του ενδιαφέροντος όσο το δυνατόν ακριβέστερα. Με τον τρόπο αυτό, το απορρίπτει γονίδια τα οποία δεν παρέχουν χρήσιμες πληροφορίες, ή που παρέχουν επαναλαμβανόμενες πληροφορίες. Καθώς ο στόχος μας είναι να βρούμε ένα ελάχιστο σύνολο των γονιδίων που θα χρησιμοποιηθεί ως προγνωστικός υπογραφή, είναι σημαντικό να σημειωθεί ότι μεταξύ αυτών των γονιδίων, θα υπάρχουν ομάδες γονιδίων για τα οποία IGV τους περιέχει περιττές ή επικαλυπτόμενες πληροφορίες, και θα υπάρξουν ομάδες γονίδια για τα οποία IGV περιέχει συμπληρωματικές πληροφορίες για κάθε γονίδιο. Ως εκ τούτου, επιλέξαμε να χρησιμοποιήσετε το ελαστικό δίχτυ τεχνική για να διακρίνει με ακρίβεια ένα τέτοιο μη-περιττές ομαδοποίηση των γονιδίων ως ελάχιστη έξυπνη σειρά από πάρα πολλές δυνατότητες, γονιδιώματος μεγάλη. Σημειώνουμε ότι, ενώ η μεθοδολογία αυτή μπορεί να φαίνεται περίπλοκο σε αυτό το πλαίσιο, απλούστερη μεθοδολογία δεν θα είναι σε θέση να διακρίνουν αυτές τις φειδωλή ομάδες γονιδίων στα οποία οι επικαλύψεις και περιττές πληροφορίες διατηρούνται στο ελάχιστο.

Είμαστε αξιολόγησε την αποτελεσματικότητα του ανά γονίδιο μέτρα μεθυλίωση ως προγνωστικοί μέτρα από τυχαία διαίρεση των δεδομένων σε δύο μέρη: ένα «σύνολο εκπαίδευσης», και ένα «σύνολο ελέγχου». Ελαστική Net χρησιμοποιήθηκε για την επιλογή γονιδίων και ταιριάζουν σε ένα μοντέλο στο σύνολο εκπαίδευσης, καθώς και τη δυνατότητα αυτής της επιλογής γονιδίων και το μοντέλο για την πρόβλεψη τυφλά αποτέλεσμα την επιβίωση των ασθενών (προσαρμοσμένο για την κλινική συμπαράγοντες) αξιολογήθηκε χρησιμοποιώντας το τεστ-σετ. Αυτό επαναλήφθηκε 2001 φορές, και ορίστηκαν σημαντικά προγνωστικά επιλεγμένες ομάδες γονιδίων, σύμφωνα με ποσοστό εσφαλμένης ανακάλυψη (FDR) ρυθμίζεται [16]

σ

-τιμή (δηλαδή, FDR

q

-τιμή) Να προσπαθήσουμε να βρούμε κάποιες απαντήσεις στο ερώτημα αυτό, πρέπει πρώτα να υποτεθεί ότι η ετερογένεια εντός του όγκου μπορεί να είναι μια αντανάκλαση της IGV. Το θέμα της ετερογένειας ενδο-όγκου αυτή τη στιγμή λαμβάνει μεγάλη προσοχή, αποκαλύπτοντας πολύ χωρική και χρονική ποικιλομορφία στην γονιδιωματική διαδικασίες στο πλαίσιο των επιμέρους όγκων [22]. Στην ιδανική περίπτωση, το DNA methylome των μεμονωμένων κυττάρων από το ίδιο δείγμα όγκου θα πρέπει να αναλυθούν για να αντιμετωπιστεί αυτό το ζήτημα. Ως εναλλακτική προσέγγιση, που χρησιμοποιούμε εδώ cross-δείγμα διακύμανση μεθυλίωσης (δηλαδή, σημαίνει μεθυλίωση διακύμανση των ατομικών CpGs μιας συγκεκριμένης περιοχής του γονιδίου-σώματος), ως μέτρο της ενδο-όγκου μεθυλίωση ετερογένεια, προκειμένου να αξιολογήσει τον τρόπο αυτό μεταβάλλεται ως λειτουργία της IGV (Σχήμα 4α). Cross-δείγμα μεθυλίωση μεταβλητότητα είναι επίσης ένα μέτρο του πόσο παρόμοια τα προφίλ μεθυλίωσης είναι για το γονίδιο, σε όλη δείγματα. Αν cross-δείγμα μεθυλίωση μεταβλητότητα ήταν μια αντανάκλαση της IGV, όπως IGV αυξήσεις, θα περιμέναμε να δούμε μια σταθερά αυξανόμενη cross-δείγμα διακύμανση μεθυλίωσης (Σχήμα 4β, αναμένεται ανάλογη εφαρμογή). Ωστόσο, αντί να βλέπουμε ένα μοτίβο στο οποίο για χαμηλή IGV, cross-δείγμα μεθυλίωση διακύμανση αυξάνεται, ενώ για την υψηλή IGV, cross-δείγμα μεθυλίωση διακύμανση μειώνεται και πάλι και είναι πολύ χαμηλό για τις υψηλότερες τιμές IGV. Προκειμένου να επικυρώσει περαιτέρω το θέμα, αναλύσαμε δύο πρόσθετα σύνολα δεδομένων, για τα οποία έχουν ληφθεί αρκετά δείγματα από διαφορετικές περιοχές του ίδιου του καρκίνου. Το πρώτο πρόσθετο σύνολο δεδομένων προέρχεται από ενδομητρίου καρκίνων, όπου ανεξάρτητα δείγματα ελήφθησαν από 2 ή 3 πρωτογενείς θέσεις καρκίνο και μεταστατική, σε κάθε ένα από 10 ασθενείς (Σχήμα 4c, μία καμπύλη βέλτιστης προσαρμογής δείχνεται ανά ασθενή). Το δεύτερο προέρχεται από καρκίνους του προστάτη, όπου 8 ανεξάρτητα δείγματα ελήφθησαν από τον ίδιο όγκο, από καθένα από πέντε ασθενείς με καρκίνο [23] (Εικόνα 4d, μία καμπύλη ανά ασθενή). Το μοτίβο αυτών των καμπυλών είναι σχεδόν ταυτόσημη με τις μελέτες ετερογένεια ενδοογκική, στην κύρια μελέτη OC οποία χρησιμοποιείται για να προσδιορίσει την προγνωστική υπογραφή OC (Σχήμα 4β), και στα βασικά δείγματα από το TCGA καρκίνου του μαστού διηθητικό καρκίνωμα (BRCA) σύνολο δεδομένων (4ε σχήμα). Η επικάλυψη των γονιδίων σε όλες τις περιοχές αυτών των οικοπέδων είναι επίσης ιδιαίτερα σημαντική σε όλη σύνολα δεδομένων (Σχήμα 4f-4h).

(α) η μεταβλητότητα Cross-δείγμα της μεθυλίωσης (ετερογένεια Intra-όγκου) και IGV υπολογίζονται σε διαφορετικές και συμπληρωματικές κατευθύνσεις. Ο θερμικός χάρτης εμφανίζει το προφίλ μεθυλίωση ενός μοναδικού γονιδίου (οριζόντιος άξονας), απέναντι πολλαπλά δείγματα (κάθετος άξονας). (Β) – (ε) Ένα χαρακτηριστικό μοτίβο (ετερογένεια ενδο-όγκου) υψηλής cross-δείγμα μεταβλητότητα όταν IGV είναι χαμηλή, και αντιστρόφως, παρατηρείται συστηματικά σε διάφορες μελέτες: (β) Κύρια OC δεδομένων-set, (γ ) Ο καρκίνος του ενδομητρίου ενδο-όγκου ετερογένεια των δεδομένων-set, (δ) τον καρκίνο του προστάτη ενδο-όγκου ετερογένεια των δεδομένων-set, (ε) BRCA βασικό σύνολο δεδομένων. (Στ) – (η) Η επικάλυψη των γονιδίων σε κάθε περιοχή του (β) με γονίδια σε ισοδύναμες περιοχές του (γ) – (ε) είναι ιδιαίτερα σημαντική. Στο (γ) και (δ), με κάθε γραμμή αναφέρεται σε δείγματα από έναν ασθενή, και είναι μια καλύτερη προσαρμογή της καμπύλης ισοδύναμο με αυτό που φαίνεται στο (β) και (ε). Στο (β), οι πιθανότητες-αναλογίες και

p-τιμές

στην κορυφή του οικοπέδου δείχνουν εμπλουτισμό των γονιδίων του κάθε cluster, είτε πλευρά του διάμεσου IGV της προγνωστικής υπογραφής. Συντομογραφίες:. ΙΘ (ετερογένεια ενδο-όγκου), OC (καρκίνωμα των ωοθηκών), BRCA (καρκίνου του μαστού διηθητικό καρκίνωμα)

Η

Τα γονίδια της υπερ συμπλέγματος 1 είναι κάπως υπερεκπροσωπούνται στο αριστερό μισό του σχήματος 4β, όπου IGV είναι χαμηλότερη, και cross-δείγμα μεθυλίωση ετερογένεια είναι συνήθως υψηλότερη. Αυτό υποδηλώνει ότι η αυξημένη IGV αυτών των γονιδίων που σχετίζονται με την ετερογένεια ενδο-όγκου. Ωστόσο, τα γονίδια των συστάδων υπερ 2 και υπογλυκαιμίας 2 πτώση κυρίως στην περιοχή της υψηλής και χαμηλής IGV μεθυλίωση μεταβλητότητα cross-δείγμα (προς τα δεξιά του Σχ 4b). Αυτό σημαίνει ότι, για τα γονίδια από αυτά τα συμπλέγματα, τα προφίλ μεθυλίωση τους τείνουν να είναι παρόμοια σε διαφορετικά δείγματα από το ίδιο όγκο, ή από διαφορετικούς όγκους. Στην περίπτωση του συμπλέγματος υπερ 2, αυτό αντιστοιχεί σε υψηλή μεταβλητότητα μεθυλίωση εντός ενός απλού γονιδίου σε κακή προγνωστική περιπτώσεις, και ότι αυτή η μεταβλητότητα είναι σταθερά παρόμοια σε όλο τον όγκο και μεταξύ όγκων. Ως εκ τούτου, τα γονίδια του συμπλέγματος υπερ 2 παρουσιάζουν υψηλό IGV σε κακή προγνωστική περιπτώσεις, ακόμη φαίνεται να είναι ανεξάρτητη από την ετερογένεια ενδο-όγκου. Ως εκ τούτου, εικάζουν ότι η αυξημένη IGV αυτών των γονιδίων είναι ένας όγκος κυττάρων εγγενή φαινόμενο, ανεξάρτητα από την ετερογένεια ενδο-όγκου. Αυτό σημαίνει ότι η IGV προγνωστικοί υπογραφή συνδυάζει μέτρα της ετερογένειας ενδο-όγκου, με εκείνες των ανεξάρτητων, καρκινικών κυττάρων εγγενή φαινόμενα. Σημειώνουμε ότι οι όροι «υπερ» και «hypo», εδώ σχετίζονται με την αλλαγή, και όχι απόλυτο επίπεδο. Για παράδειγμα, S1 σχήμα δείχνει ότι η συστάδα υπογλυκαιμία 2 έχει την υψηλότερη IGV κάθε συμπλέγματος? Ωστόσο, η IGV αυτού του συμπλέγματος είναι στην πραγματικότητα χαμηλότερο σε φτωχές σε σύγκριση με καλή προγνωστική περιπτώσεις.

Τα γονίδια που καθορίζει υπογλυκαιμία cluster 1 έχει την υψηλότερη μέση cross-δείγμα μεθυλίωση μεταβλητότητα (Σχήμα 4), καθώς και η υψηλότερη μέση τιμή επίπεδο μεθυλίωσης (S2 σχήμα), και η χαμηλή IGV των 1 γονίδια υπογλυκαιμία σχετίζεται με κακή πρόγνωση. Κατά την πρώτη, φαίνεται δύσκολο να εξηγήσουμε ότι η κακή προγνωστική καρκίνοι έχουν χαμηλότερο IGV στα γονίδια hypo1, αλλά αυτά τα γονίδια hypo1 αντιπροσωπεύουν επίσης υψηλό δείγμα δείγμα μεθυλίωση ετερογένεια. Για να το εξηγήσουμε αυτό, χρησιμοποιήσαμε ένα μέτρο της CpG-CpG μεθυλίωση μεταβλητότητα, την οποία ονομάζουμε την μέση παράγωγο [12], η οποία υπολογίζεται ως η μέση απόλυτη διαφορά στα επίπεδα μεθυλίωσης μεταξύ γειτονικών CpGs του γονιδίου-σώμα ενός γονιδίου, σε ένα μόνο δείγμα. Η συστοιχία Illumina HumanMethylation 450K μετρά τα επίπεδα μεθυλίωσης των συγκεκριμένων τόπων CpG, κατά μέσο όρο, σε μεικτό-up δείγμα των πολλών κυττάρων. Σχήμα 5α και 5β δείχνει δύο παραδείγματα για το πώς υψηλής μεθυλίωσης μεταβλητότητα στο επίπεδο ενός κυττάρου μπορεί να εκδηλωθεί με μετρήσεις που αποκτήθηκαν με τη χρήση αυτής της τεχνολογίας.

Η σειρά 450K παρέχει μετρήσεις μεθυλίωση από μια μικτή-up δείγμα των πολλαπλών κυττάρων. (Α) Ένα παράδειγμα ενός προτύπου μεθυλίωσης η οποία είναι εξαιρετικά μεταβλητή, με παρόμοιο τρόπο σε κύτταρα. Αυτό οδηγεί σε χαμηλή ετερογένεια cross-δείγμα, και την υψηλή IGV, όπως σε υπερ σύμπλεγμα 2. (β) ένα παράδειγμα ενός σχεδίου μεθυλίωσης η οποία είναι εξαιρετικά μεταβλητή, αλλά σε ένα ετερογενές τρόπο σε κύτταρα. Αυτό οδηγεί σε υψηλή ετερογένεια μεταξύ των δειγμάτων, ωστόσο το καθαρό αποτέλεσμα του μέσου όρου των προφίλ μεθυλίωσης σε όλη την συγχέονται δείγμα των πολλών κυττάρων δίνει μια μέτρηση με χαμηλή IGV, όπως στην υπο σύμπλεγμα 1. (γ) ένα μέτρο της CpG-CpG μεθυλίωση μεταβλητότητα , που υπολογίζεται ως ο μέσος παράγωγο, ή τη μέση απόλυτη διαφορά στο επίπεδο μεθυλίωσης μεταξύ γειτονικών CpGs. (Δ) Η μεταβλητότητα της μέσης-παράγωγο μέτρο σε όλη δείγματα ποσοτικοποιεί την ετερογένεια της μεθυλίωσης μεταβλητότητας CpG-CpG. Cluster υπερ 2 είναι χαμηλή σύμφωνα με το (δ), και ως εκ τούτου αντιστοιχεί σε ένα μοτίβο όπως (α). υπογλυκαιμία Cluster 1 είναι υψηλή σύμφωνα με το (δ), και ως εκ τούτου, αντιστοιχεί σε ένα μοτίβο όπως (β).

Η

Στο παράδειγμα του σχήματος 5α, βλέπουμε ότι υπάρχει μικρή κυττάρου-κυττάρου ετερογένεια, αν και υπάρχουν πολλά μεταβλητότητα μέσα σε ένα γονίδιο. Ως εκ τούτου, αυτό οδηγεί σε μετρήσεις υψηλής IGV, και χαμηλή διασταυρούμενη δείγμα μεθυλίωση μεταβλητότητα, όπως βλέπουμε σε υπερ σύμπλεγμα 2. Στη συνέχεια Εικ 5β δείχνει ένα παράδειγμα στο οποίο υπάρχουν πολλά κυττάρου-κυττάρου μεταβλητότητα, καθώς και πολύ μεταβλητότητα μέσα σε ένα γονίδιο . Το αποτέλεσμα είναι ότι το cross-δείγμα μεθυλίωση μεταβλητότητα των μετρήσεων πίνακα είναι υψηλή, αλλά επειδή «κατά μέσο όρο έξω» το εξαιρετικά μεταβλητό προφίλ μεθυλίωσης σε όλη την μικτή-up κύτταρα στο δείγμα, το καθαρό αποτέλεσμα είναι μια μέτρηση με χαμηλή IGV. Να εξετάσει αν αυτή η υπόθεση είναι εύλογη, χρησιμοποιούμε τη μέση παράγωγο μέτρο των CpG-CpG μεθυλίωση μεταβλητότητα (Σχήμα 5γ). Με την εξέταση του τρόπου ετερογενή αυτή η μεταβλητότητα CpG-CpG είναι όλη δείγματα (Σχήμα 5d), είμαστε σε θέση να επιβεβαιώσει ότι στα γονίδια της υπογλυκαιμίας συμπλέγματος 1, η μεθυλίωση μεταβλητότητα CpG-CpG τείνει να είναι πιο διαφορετικές μεταξύ διαφορετικών κυττάρων από ό, τι σε οποιαδήποτε άλλη συστάδα , όπως φαίνεται από την υψηλή διακύμανση των μέσων παράγωγα μετρήσεις. Είμαστε επίσης σε θέση να επιβεβαιώσουν από το Σχ 5d που στα γονίδια του συμπλέγματος υπερ 2, η μεθυλίωση μεταβλητότητα CpG-ΟρΟ τείνει να είναι λιγότερο διαφορετική μεταξύ διαφορετικών κυττάρων από ό, τι σε οποιοδήποτε άλλο σύμπλεγμα, όπως υποδεικνύεται από τη χαμηλή διακύμανση της μέσης παραγώγου. Ως εκ τούτου, τα δεδομένα αυτά υποστηρίζουν το μοντέλο που φαίνεται στο Σχήμα 5α και 5β για τα γονίδια στο σύμπλεγμα υπερ 2 και υπογλυκαιμία 1, αντίστοιχα.

Λειτουργική ρόλο της δραστηριότητας μεταγραφή παράγοντα στην IGV

Όπως τα γονίδια που περιλαμβάνουν σύμπλεγμα υπερ 2 φαίνεται να δείχνουν την ίδια IGV στα περισσότερα κύτταρα του όγκου, αλλά η υψηλή IGV του υπερ συμπλέγματος 2 γονίδια που σχετίζεται με κακή πρόγνωση, θεωρούμε το σύμπλεγμα υπερ 2 IGV να είναι «συνεπής καρκινικών κυττάρων εγγενές φαινόμενο» , η οποία είναι πιθανό να ρυθμίζεται με διαφορική πρόσδεση των παραγόντων μεταγραφής (TF). Επομένως, εξετάσαμε σύνδεσης προς τις περιοχές του σώματος του γονιδίου από τα γονίδια προγνωστικών υπογραφή OC TF, και δοκιμάστηκε η συσχέτιση της έκφρασης TF με την IGV των γονιδίων που συνδέονται προς (σε ένα σύνολο TCGA των βασικών καρκίνων του μαστού). Βρήκαμε ότι κάθε προγνωστικό σύμπλεγμα υπογραφή παρουσιάζει το δικό της ξεχωριστό μοτίβο του TF δέσμευσης (Σχήμα 6α), το οποίο μπορούμε να υποθέτουν συνδέεται με τις βιολογικές διαδικασίες που είναι υπεύθυνες για το χαρακτηριστικό μοτίβο της IGV που παρατηρείται σε αυτό το σύμπλεγμα.

(α ) Λάθος ποσοστό ανακάλυψη προσαρμόζεται

σ

-τιμές και τις αποδόσεις-αναλογίες (OR) δείχνουν τον εμπλουτισμό της δέσμευσης των συγκεκριμένων μεταγραφικών παραγόντων (ΤΡ), στις περιοχές του σώματος γονιδίου από τα γονίδια του κάθε cluster. TFs για τα οποία δεσμεύουν σημαντικά πάνω ή κάτω από εμπλουτισμένο (ακριβής δοκιμασία του Fisher, FDR

q

& lt? 0,05) έχουν πράσινο χρώμα και κόκκινο, αντίστοιχα. (Β) ΤΡ τα οποία δείχνουν σημαντικά πιο θετική συσχέτιση με IGV των γονιδίων που συνδέονται προς, σε σύγκριση με τα γονίδια που δεν συνδέονται προς. (Γ) ΤΡ τα οποία δείχνουν σημαντικά πιο αρνητική συσχέτιση με IGV των γονιδίων που συνδέονται προς, σε σύγκριση με τα γονίδια που δεν συνδέονται προς. (Δ) ΤΡ που είναι σημαντικές σύμφωνα με την (α) και είτε (β) ή (γ)? TFs με γνωστές ενδιαφέρον σημειώνονται με παραπομπή στη σχετική μελέτη. Η έλλειψη εμπλουτισμού σύνδεσης προς τα γονίδια του hypo2 συμπλέγματος TF, είναι μια αντανάκλαση του μικρού αριθμού (19) των γονιδίων σε αυτό το σύμπλεγμα.

Η

δεσμευτικό παράγοντα Μεταγραφή πληροφοριών ιστοσελίδα, που λαμβάνεται από την ΚΩΔΙΚΟΠΟΙΗΣΗ ( Encyclopedia of DNA Elements) σχεδίου [24], ήταν διαθέσιμος για τις περιοχές του σώματος γονίδιο όλων των γονιδίων που αντιπροσωπεύεται στην συστοιχία Illumina HumanMethylation 450K, για 55 παράγοντες μεταγραφής. Δοκιμάσαμε κάθε μία από αυτές 55 ΤΡ, για σημαντικά αυξημένη ή μειωμένη σύνδεση με τα γονίδια του κάθε προγνωστικού συμπλέγματος υπογραφή. Cluster υπογλυκαιμία 2 αποτελείται μόνο από 19 γονίδια, και ως εκ τούτου δεν θα περιμέναμε να δούμε πολλές σημαντικές συσχετίσεις, λόγω του μικρού μεγέθους του δείγματος. Αλλά έχει ενδιαφέρον, για σύμπλεγμα υπερ 2 (που αποτελείται από τα γονίδια των οποίων η μεθυλίωση επίπεδα λίγο μεταβάλλονται σε όλη την όγκους, αλλά εμφανίζουν υψηλότερα IGV), βλέπουμε ότι το 20% (11/55) των TFs δοκιμαστεί δείχνουν πολύ πιο δεσμευτικό για αυτά τα γονίδια από ό, τι αναμενόταν, ενώ 16 % δείχνουν σημαντικά λιγότερο δεσμευτική από το αναμενόμενο. Για τις συστάδες γονιδίων για τα οποία DNAM ποικίλλει ανάλογα με /εντός των όγκων και έχουν γενικά χαμηλή IGV (clusters υπερ 1 και υπογλυκαιμία 1), δεν είναι μια ενιαία ΤΡ έδειξε υψηλότερη από την αναμενόμενη δεσμευτικές, ενώ το 27% και το 38% των TFs δείχνουν χαμηλότερα από το αναμενόμενο σύνδεση με τα γονίδια που περιλαμβάνουν υπερ cluster 1 και υπογλυκαιμία 1, αντίστοιχα. Αυτό είναι σύμφωνο με την ιδέα ότι tf πρόσδεσης εμπλέκεται σε διακριτές και διαφορετικές διαδικασίες που συνδέονται με IGV και μεθυλίωση ετερογένεια μέσα σε ένα δείγμα.

Επίσης, θέλαμε να δοκιμαστεί η πραγματική συσχέτιση της έκφρασης των ΤΡ με IGV των γονιδίων δεσμεύονται σε, και τα γονίδια δεν συνδέονται προς, γονιδιώματος κλίμακα. Για να γίνει αυτό, χρησιμοποιήσαμε ένα σύνολο TCGA των βασικών καρκίνων του μαστού, για τα οποία υπάρχουν στοιχεία 450k μεθυλίωση καθώς και τα δεδομένα έκφρασης. Έχουμε ήδη δημιουργήσει ένα υψηλό βαθμό ομοιότητας στην συμπεριφορά των προγνωστικών γονιδίων υπογραφή μας σε OC και αυτές TCGA BRCA βασικά δείγματα (Σχήμα 4). Περαιτέρω, έχει αποδειχθεί πλήρως από την κοινοπραξία TCGA ότι η υψηλής ποιότητας ορώδες των ωοθηκών και της μήτρας και BRCA καρκίνοι είναι εξαιρετικά μοριακά παρόμοια [25]. Σχήμα 6β και 6γ δείχνουν TFs με σημαντικά πιο θετική και πιο αρνητική, συσχέτιση με IGV των γονιδίων που συνδέονται προς, σε σύγκριση με τα γονίδια δεν το κάνουν. Είναι ενδιαφέρον ότι οι δύο πιο υψηλή θέση μεταγραφικούς παράγοντες, σύμφωνα με αυξημένη θετική συσχέτιση της έκφρασης τους με IGV σε δεσμευμένο γονίδια,

Rad21

και

Brg1

(

SMARCA4

), είναι και τα δύο μέρη της χρωματίνης τροποποίηση συγκροτήματα που παρουσιάζει ενδιαφέρον για να ανακόψει την ταυτότητα των κυττάρων [26, 27]. Ειδικότερα,

Brg1

(

SMARCA4

) έχει αποδειχθεί πρόσφατα ότι έχουν ιδιαίτερη σημασία για τον καρκίνο των ωοθηκών μικρό-κυττάρων [28-30]. Η επικάλυψη μεταξύ του ΤΡ που δείχνουν σημαντικά διαφορετικά πρότυπα σύνδεσης σε σχέση με τα γονίδια προγνωστικούς υπογραφή OC, και το οποίο TFs οθόνη μεταβάλλονται σημαντικά συσχέτιση της έκφρασης τους με IGV των γονιδίων που συνδέονται προς, φαίνεται στο Σχ 6δ. Πολύ σχετική λεπτομέρεια έχει ήδη αναφερθεί για τις περισσότερες από αυτές τις TFs (αναφορές σημειώνεται στο σχήμα): είτε δεσμευτική τους επηρεάζεται από μεθυλίωση (ή

αντίστροφα

), ή ασχολούνται με αναδιαμόρφωσης χρωματίνης σε βλαστικά κύτταρα . Οι TFs φαίνεται στο σχήμα 6δ είναι σημαντικά για τις διεργασίες που εξηγούν την εξέλιξη της νόσου, οι οποίες συνδέονται με το οργανωμένο έγκλημα προγνωστικούς υπογραφή μας (οι TFs με γνωστές ενδιαφέρον υποδεικνύεται με αναφορά στη σχετική μελέτη [26, 31-40]). Ως εκ τούτου, έχουμε υποθέτουν ότι IGV, το OC προγνωστική πίνακα γονίδιο υπογραφή μας, αντιπροσωπεύει ένα υποκατάστατο μέτρο για τη δράση και το ρόλο τους στον μετασχηματισμό της νόσου.

Σύλλογος των προγνωστικών CpGs υπογραφή με CpG νησιά και τις περιοχές ενισχυτή

Η θέση του σε σχέση με CpGs CpG νησίδες (CGIs) είναι γνωστό ότι είναι ένας σημαντικός καθοριστικός παράγοντας της λειτουργικός ρόλος αυτών των CpGs [41]. Δοκιμάσαμε για τον εμπλουτισμό των ανιχνευτών σχολιασμένη στις περιφέρειες CGI «νησί», «ακτή» και «ράφι» μεταξύ όλων των γονιδίων του σώματος σχολιασμένη ανιχνευτές, καθώς και ανιχνευτές σχολιασμένη στη γονιδιακή φορείς των γονιδίων των προγνωστικών υπογραφή μας, και από τις τέσσερις συστάδες . Ενώ βρήκαμε ότι οι ανιχνευτές σώματος γονίδιο συνολική μειωθεί σημαντικά για τους ανιχνευτές σε αυτές τις περιοχές CGI, το αντίθετο ίσχυε για γονιδιακή φορείς των προγνωστικών υπογραφή μας (βλ συμπληρωματικοί πίνακες σε S1 αρχείου). Αυτή η επίδραση φαίνεται να οφείλεται σε μεγάλο βαθμό από το δεύτερο σύμπλεγμα. Αυτό δείχνει μια εξέχοντα ρόλο για CpG νησίδες στις σχετικές περιοχές των γονιδίων των προγνωστικών υπογραφή μας.

Θέση του CpGs σε σχέση με ενισχυτή περιοχές είναι επίσης γνωστό ότι είναι σχετικά με το λειτουργικό ρόλο των CpGs. Ελέγξαμε εάν υπήρχε εμπλουτισμό των χώρων μεθυλίωσης σχολιασμένη να ενισχυτές σε φορείς του γονιδίου σε γενικές γραμμές, διαπιστώνοντας ότι δεν υπάρχει, όπως θα αναμενόταν. Στη συνέχεια, ελέγξαμε τον εμπλουτισμό ενισχυτή ομοίως στους προγνωστικούς φορείς του γονιδίου της υπογραφής, και των φορέων του γονιδίου των επιμέρους σχηματισμών.

You must be logged into post a comment.