PLoS One: Από την επαναληψιμότητα της TCGA καρκίνου των ωοθηκών microRNA Προφίλ


Αφηρημένο

Η κακή ρύθμιση microRNA (miRNA) έκφρασης είναι μια καθιερωμένη χαρακτηριστικό του καρκίνου στον άνθρωπο. Ωστόσο, ο ρόλος των συγκεκριμένων miRNAs τον προσδιορισμό των αποτελεσμάτων του καρκίνου παραμένει ασαφής. Χρησιμοποιώντας Επίπεδο 3 στοιχεία έκφρασης από το Cancer Genome Atlas (TCGA), εντοπίσαμε 61 miRNAs που σχετίζονται με τη συνολική επιβίωση σε 469 ωοθηκών καρκίνους προφίλ με μικροσυστοιχιών (ρ & lt? 0,01). Εμείς εντόπισε επίσης 12 miRNAs που σχετίζονται με την επιβίωση, όταν miRNAs έχουν προφίλ στα ίδια δείγματα χρησιμοποιώντας Next Generation Sequencing (miRNA-Seq) (p & lt? 0,01). Παραδόξως, μόνο 1 miRNA μεταγραφή σχετίζεται με την επιβίωση του καρκίνου των ωοθηκών και στα δύο σύνολα δεδομένων. Οι αναλύσεις μας υποδεικνύουν ότι αυτή η διαφορά οφείλεται στο γεγονός ότι τα επίπεδα miRNA που αναφέρθηκαν από τις δύο πλατφόρμες συσχετίζονται ανεπαρκώς, ακόμη και μετά από διόρθωση για πιθανά ζητήματα εγγενή να σηματοδοτήσει αλγόριθμους ανίχνευσης. Διορθώσεις για ψευδή ανακάλυψη και microRNA αφθονία είχαν ελάχιστη επίδραση σε αυτή τη διαφορά. Περαιτέρω έρευνα δικαιολογείται

Παράθεση:. Wan Υ-W, Mach CM, Allen GI, Άντερσον ML, Liu Ζ (2014) Από την επαναληψιμότητα της TCGA καρκίνου των ωοθηκών microRNA προφίλ. PLoS ONE 9 (1): e87782. doi: 10.1371 /journal.pone.0087782

Συντάκτης: Amanda Ewart Toland, Πολιτειακό Πανεπιστήμιο του Οχάιο Medical Center, Ηνωμένες Πολιτείες της Αμερικής

Ελήφθη: 6 του Νοεμβρίου του 2013? Αποδεκτές: 1η Ιανουαρίου του 2014? Δημοσιεύθηκε: 29 του Γενάρη του 2014

Copyright: © 2014 Wan et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Αυτό το έργο στηρίζεται εν μέρει μέσω των Συνεργατική πρόοδοι στην Βιοϊατρική Πληροφορική Πρόγραμμα Σπόρων Χρηματοδότηση στο Ken Kennedy Ινστιτούτο Πληροφορικής στο Πανεπιστήμιο Rice που υποστηρίζονται από το John και η Ann Ταμείο Ντερ Υπολογιστικής Βιοϊατρική και μέσω του Κέντρου Υπολογιστικής και Ολοκληρωμένες Ιατροβιολογικών Ερευνών Πρόγραμμα Σπόρων Χρηματοδότηση σε Baylor College of Medicine. GA υποστηρίζεται επίσης εν μέρει από τον οργανισμό NSF DMS-1209017. ZD υποστηρίζεται από το Χιούστον Βιοπληροφορικής Κληροδοτήματος και NSF DMS-1263932. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

τα microRNAs (miRNAs) είναι ενδογενείς μεταγραφές RNA που ρυθμίζουν ποικίλες μορφές της γονιδιακής έκφρασης [1]. Τα περισσότερα ανθρώπινα miRNAs μεταγραφεί όσο πρόδρομες ουσίες γνωστές ως pri-miRNAs. Ξεκινώντας στον πυρήνα, PRI-miRNAs υποβληθεί σε μια σειρά γεγονότων επεξεργασίας που οδηγούν τελικά στην κυτταροπλασματική απελευθέρωση των ώριμων μεταγραφών ~ 22 νουκλεοτίδια σε μήκος. Ώριμη miRNAs καταλύουν μεταγραφική αναστολή από απ ‘ευθείας σύνδεση με αγγελιαφόρο RNA (mRNA που) και την προώθηση της υποβάθμισης τους [2]. Πρόσφατα στοιχεία δείχνουν ότι miRNAs μπορεί να αναστείλει τη μετάφραση ανεξάρτητα από την ικανότητά τους να επάγουν αποικοδόμηση mRNA.

Μοτίβα έκφρασης miRNA έχουν εκτεταμένα προφίλ σε ανθρώπινους ιστούς. Είναι πλέον σαφές ότι απορυθμισμένη έκφραση miRNA είναι ένα χαρακτηριστικό πολλών διαφορετικών καρκίνων, συμπεριλαμβανομένων των καρκινωμάτων του μαστού, των ωοθηκών και του πνεύμονα [3] – [5]. Ωστόσο, για τον καθορισμό των μηχανισμών με τους οποίους μεμονωμένα miRNAs συμβάλει στην έκβαση του καρκίνου εξακολουθεί να αποτελεί βασική πρόκληση για τους βιολόγους που ελπίζουν να εκμεταλλευτούν τη δύναμή τους. Πρόσφατα, ο καρκίνος Genome Atlas Consortium (TCGA) ανέφερε ότι οι καρκίνοι των ωοθηκών ομαδοποιούνται σε διακριτές μοριακές υποτύπους με βάση τα πρότυπα τους γονιδίων και microRNA έκφραση [6]. Ωστόσο, έχουμε ανακαλύψει μια ανησυχητική έλλειψη συνοχής μεταξύ των προφίλ microRNA (miRNA) έκφραση που χρησιμοποιήθηκε αρχικά από τον TCGA και μετέπειτα προφίλ της έκφρασης των miRNAs που δημιουργούνται από αυτή την ομάδα για τα ίδια δείγματα καρκίνου των ωοθηκών χρησιμοποιώντας miRNA-Seq. Δεδομένου ότι αυτές οι παρατηρήσεις αμφισβητούν την εγκυρότητα των υποκειμένων των δεδομένων, προτείνουν, επίσης, ότι οι επιστημονικές ανακαλύψεις που βασίζονται αποκλειστικά σε αυτά τα δεδομένα θα πρέπει να ερμηνεύονται με προσοχή.

Αποτελέσματα

Για να οριοθετηθούν miRNAs που σχετίζονται με τον καρκίνο των ωοθηκών επιβίωση των ασθενών , πραγματοποιήσαμε μια μονοπαραγοντική ανάλυση παλινδρόμησης κατά Cox, χρησιμοποιώντας Επίπεδο 3 δεδομένων TCGA miRNA για 469 ωοθηκών καρκίνους προφίλ χρησιμοποιώντας τεχνολογία μικροσυστοιχιών Agilent. αρχική ανάλυση παλινδρόμησης περαιτέρω εξευγενισμένα με τη χρήση της διαδικασίας Benjamini-Hochberg (BH) για την προσαρμογή για πολλαπλές υπόθεση των δοκιμών [7]. Βρήκαμε ότι οι 16 ώριμη miRNAs σχετίζονται με την επιβίωση του καρκίνου των ωοθηκών (FDR & lt? 0,01) (Εικόνα 1Α). Από αυτά, miR-505, miR-652 και miR-551b * αποδείξουν τις πιο ισχυρές ενώσεις. Οι αναλογίες κινδύνου (HR) υπολογίζεται για αυτά τα miRNAs ήταν -1,73, -1.8 και 9.3, αντίστοιχα. Το αποτέλεσμα αυτό υποδεικνύει ότι καθένα από αυτά τα miRNAs πιθανώς παίζει ένα σημαντικό ρόλο στον προσδιορισμό της επιβίωσης του καρκίνου των ωοθηκών.

οικόπεδα P-τιμή μονοπαραγοντική παλινδρόμησης Cox για microRNAs που σχετίζονται με την επιβίωση των ωοθηκών καρκίνου που έχουν αναγνωριστεί από μικροσυστοιχιών (Α) ή miRNA-Seq (Β) δεδομένων. P-value & lt? 0,01 (συνεχής γραμμή). Ποσοστό εσφαλμένης ανακάλυψη (FDR) & lt? 0.1 (διακεκομμένη γραμμή). Σε αμφότερες τις Α & amp? Β, μπλε κουκκίδες δείχνουν miRNAs που σχετίζονται με την επιβίωση από σειρά miRNA, ενώ κόκκινες κουκίδες δείχνουν miRNAs που σχετίζονται με την επιβίωση από miR-Seq. Πράσινα αστέρια είναι miRNAs που σχετίζονται με την επιβίωση και στα δύο σύνολα δεδομένων. (C) το ποσοστό των επικαλυπτόμενων miRNAs μεταξύ της συστοιχίας και της πλατφόρμας επόμενα NGS σε διαφορετικό κατώτατο όριο cut-off για την p-τιμές Cox, BH προσαρμοστεί FDR, και Storey q-αξίες.

Η

Για να επικυρώσετε τις παρατηρήσεις αυτές, είμαστε δίπλα ανακρίθηκε ένα δεύτερο σύνολο δεδομένων της έκφρασης των miRNAs που δημιουργείται για τους ίδιους δείγματα καρκίνου των ωοθηκών χρησιμοποιώντας Next Generation Sequencing (miRNA-Seq). Το έργο των ωοθηκών καρκίνο TCGA είναι μοναδικό στο ότι η έκφραση των miRNAs έχει δημιουργηθεί προφίλ χρησιμοποιώντας τόσο συστοιχία miRNA και miRNA-Seq. Αυτά τα τεχνικά ξεχωριστές πλατφόρμες δημιουργούν μια μοναδική ευκαιρία για την επικύρωση ανακαλύψεις που έγιναν χρησιμοποιώντας ένα σύνολο δεδομένων εναντίον του άλλου. Στην ιδανική περίπτωση, τα αποτελέσματα που λαμβάνονται θα πρέπει να συσχετίζονται καλά. Χρησιμοποιώντας την ανάλυση αναλογικών κινδύνων κατά Cox, βρήκαμε ότι οι 4 miRNA μεταγραφές που σχετίζονται με την επιβίωση, όταν miRNAs έχουν προφίλ σε καρκίνους των ωοθηκών χρησιμοποιώντας miRNA-Seq σε ταυτόσημο επίπεδο FDR (Εικόνα 1Β). Δεν υπάρχει επικάλυψη μεταξύ των αποτελεσμάτων που λαμβάνονται από αυτές τις δύο πλατφόρμες, παρά το γεγονός ότι και τα δύο σύνολα δεδομένων δημιουργήθηκαν από τα ίδια δείγματα.

Για να καθοριστεί αν η μικροσυστοιχία και πλατφόρμες Next Gen θα δώσει πιο συνεπή αποτελέσματα, όταν αναλύεται χρησιμοποιώντας μια χαλαρή όριο, μειώσαμε το όριο p-τιμή που χρησιμοποιείται για τις αναλύσεις μας σε 0,01. Αυτό οδήγησε σε περισσότερα miRNAs σημαντική συσχέτιση με την επιβίωση των ασθενών και στα δύο σύνολα δεδομένων. Για παράδειγμα, ταυτοποιήσαμε 61 miRNAs από τα δεδομένα που παράγονται χρησιμοποιώντας την πλατφόρμα συστοιχία. Ωστόσο, οι αναλογίες κινδύνου που υπολογίζεται για τις 12 miRNAs που προσδιορίζονται από το miRNA-Seq δεδομένων είναι όλα πολύ κοντά στο 1.0. Μόνο miR-652 συνδέεται με την επιβίωση τόσο στην miRNA-Seq και σύνολα δεδομένων μικροσυστοιχιών. Για να διορθωθεί για πολλαπλές δοκιμές υπόθεση, έχουμε προσαρμοστεί π-αξίες μας μοντέλο Cox, χρησιμοποιώντας τη διαδικασία Benjamini-Hochberg [7]. Μετά την ολοκλήρωση αυτών των αναλύσεων, δεν miRNAs συσχετίζεται με την επιβίωση και στα δύο σύνολα δεδομένων, όταν το ποσοστό εσφαλμένης ανακάλυψη ορίστηκε στο 10%.

Για να προσδιοριστεί αν η επιλογή μιας διαδικασίας πολλαπλών προσαρμογής υπόθεση συμβάλλει σε αυτά τα αποτελέσματα, έχουμε εκ νέου αναλύθηκαν τα δεδομένα TCGA χρησιμοποιώντας μία διαδικασία εκτίμησης εναλλακτική τιμή Q [8]. Επιπλέον, υπολογίσαμε το ποσοστό των επικαλυπτόμενων miRNAs σε διαφορετικές FDR ή p-τιμή αποκοπής. Τα αποτελέσματά μας δείχνουν ότι ο περιορισμένος αριθμός των επικαλυπτόμενων miRNAs μεταξύ των δύο πλατφόρμες είναι ανεξάρτητη από την επιλογή της διαδικασίας πολλαπλών προσαρμογής υπόθεση ή cut-off όρια (Σχήμα 1C).

Για να διαλευκανθεί πιθανές αιτίες για αυτήν την απροσδόκητη διαφορά, εμείς εξέτασε την αναπαραγωγιμότητα της έκφρασης miRNA μεταξύ των δύο αρχείων TCGA που περιγράφουν αυτά τα δεδομένα. συντελεστές συσχέτισης Pearson (r) υπολογίστηκαν για κάθε ένα από τα 359 ώριμα ανθρώπινα miRNAs για τους οποίους Επίπεδο 3 δεδομένων έκφραση ήταν διαθέσιμη τόσο στα miRNA-Seq και μικροσυστοιχιών βάσεις δεδομένων. Βρήκαμε ότι οι συντελεστές συσχέτισης για τα επίπεδα των επιμέρους miRNAs που αναφέρθηκαν από κάθε τεχνική ποικίλλει ευρέως. Για παράδειγμα, miR-505 είναι το miRNA πιο δυναμικά που σχετίζονται με την έκβαση των ασθενών στις αναλύσεις μας τα στοιχεία array miRNA (HR = -1,7, p & lt? 9ε-5). Ωστόσο, όταν αξιολογούνται χρησιμοποιώντας δεδομένα αλληλουχίας, η αναλογία κινδύνου για mir-505 ήταν 0,998 (p = 0.03). Επίπεδα miR-505 μετρήθηκαν με miRNA-συστοιχίας και miRNA-Seq δεδομένων συσχετίζονται μόνο μέτρια (r = 0,59) (Σχήμα 2Β). Διαφορές παρατηρήθηκαν επίσης σε έναν αριθμό άλλων miRNAs που έχουν προηγουμένως εμπλακεί στον καρκίνο των ωοθηκών, όπως miR-143 [9]. Ο συντελεστής συσχέτισης για miR-143 σε αναλύσεις μας ήταν 0,39 (Σχήμα 2C). Ένα άλλο miRNA καλά μελετηθεί σε καρκίνο των ωοθηκών είναι miR-141, το οποίο έχει προηγουμένως αναφερθεί για στόχευση ρ38α και ρυθμίζουν την απόκριση του οξειδωτικού στρες [10], [11]. Ωστόσο, η συσχέτιση μεταξύ των επιπέδων του miR-141 στην TCGA μικροσυστοιχιών και miRNA-Seq δεδομένων έκφρασης είναι μόνο 0,32 (Σχήμα 2D). Συνολικά, βρήκαμε ότι οι συντελεστές συσχέτισης για ~72% των miRNAs προφίλ και στα δύο σύνολα δεδομένων ήταν ≤0.5 (Σχήμα 3Α, 3Γ), που αφορούν κακή επαναληψιμότητα. Μόνο το 22% των mRNAs μετρήθηκε με Agilent μικροσυστοιχιών και Illumina HiSeq χρησιμοποιώντας τα ίδια δείγματα καρκίνου των ωοθηκών συσχετίζονται ανεπαρκώς (r≤0.5? Εικόνα 3Β, 3C). Έτσι, η διαφορά αναφέρουμε εδώ φαίνεται να περιορίζεται στο σύνολο δεδομένων TCGA miRNA.

(Α) miR-98, (Β) miR-505 (C) miR-143 και (Δ) miR-141.

η

(Α) Ιστόγραμμα των συντελεστών συσχέτισης για μεμονωμένες miRNAs μετράται με miRNA-Seq και σειρά miRNA. (Β) Ιστόγραμμα των συντελεστών συσχέτισης για mRNAs προφίλ από Illumina HiSeq και σειρά mRNA. (Γ) Η εμπειρική αθροιστική συνάρτηση κατανομής (ECDF) της συσχέτισης μεταξύ της συστοιχίας και της αλληλουχίας των miRNA (μαύρο), φιλτράρεται miRNA (χρώμα) και του mRNA (γκρι) μετρήσεις. Σχεδόν 72% των miRNAs αποδείξει συντελεστή συσχέτισης ≤0.5, ενώ το 22% των RNAs έχουν ≤0.5 συντελεστή συσχέτισης. Όταν φιλτράρονται με βάση το επίπεδο έκφρασης, το ποσοστό των miRNAs με συσχέτισης ≤0.5 κορεσμένα σε 56%.

Η

Μια πιθανή αιτία για την κακή επαναληψιμότητα μπορεί να είναι ο αλγόριθμος ανίχνευσης σήματος που χρησιμοποιείται για να αναφέρουν τα επίπεδα έκφρασης των miRNAs. Τα δεδομένα επιπέδου 3 TCGA miRNA αναφερθεί σε δύο μορφές. Η πρώτη, χαρακτηρισμένη ως «Ποσοτικοποίηση των δεδομένων», αναφέρει επίπεδα για τα ατομικά ανθρώπινα miRNAs. Ωστόσο, ένα από τα πλεονεκτήματα του miRNA-Seq είναι ότι οι μεταγραφές που ανακτώνται με αυτή την τεχνική μπορεί να χαρτογραφηθεί με ακρίβεια. Ένα δεύτερο αρχείο, χαρακτηρισμένα ως «Ισόμορφης Data,» έχει επίσης δοθεί στη δημοσιότητα από το TCGA. Αυτό εκθέσεις αρχείο διαβάσετε μετράει για μεταγραφές, σύμφωνα με γονιδιωματική θέση τους. Στο πλαίσιο αυτού του αρχείου, οι μεταγραφές που προσδιορίζονται είτε ως ώριμο miRNA, miRNA * (3ρ τα χέρια του ανθρώπινου miRNAs), στέλεχος-βρόχο μεταγραφή ή πρόδρομο. Παρόλο που εργάζονται μέσω αυτού στοιχείων, μάθαμε ότι τα επίπεδα miRNA αναφερθεί στο αρχείο TCGA ποσοτικοποίηση περιλαμβάνουν διαβάσετε μετράει για τις πρόδρομες ουσίες των miRNAs, καθώς και ώριμη miRNAs. Επειδή πρόδρομοι των miRNAs σήμερα πιστεύεται ότι στερούνται βιολογική δραστηριότητα, η συμπερίληψη των πρόδρομων ουσιών με αριθμούς για την ώριμη miRNAs θα μπορούσε να συγχύσει την επιβίωση αναλύσεις. για την αντιμετώπιση αυτού του ζητήματος, βρίσκαμε διαβάσετε μετράει για ώριμη miRNAs μόνο από το αρχείο δεδομένων ισομορφή και επαναλαμβανόμενες αναλύσεις μας. Ωστόσο, η αναλογία των συντελεστών συσχέτισης miRNA ≤0.5 παρέμειναν τόσο υψηλό όπως 71%, παρά τη χρήση αυτού ορίζεται ακριβέστερα δεδομένα.

Μια δεύτερη πιθανή εξήγηση για την παρατηρούμενη διαφορά θα μπορούσε να είναι ότι οι συσχετίσεις μεταξύ των μέτρων της έκφρασης miRNA εξαρτώνται από τη συχνότητα με την οποία εκφράζονται ατομικά μεταγραφές miRNA. Αν ναι, σπάνια εκφράζεται miRNAs μπορεί να αναφερθεί από ένα ή δύο από τις πλατφόρμες που χρησιμοποιούνται στο προφίλ έκφρασης των miRNAs τυχαία ή ανακριβώς. Για να διερευνήσουν αυτή την υπόθεση, έχουμε εκ νέου υπολογίζονται οι συντελεστές συσχέτισης για κάθε miRNA τα οποία προσδιορίζονται από δύο πλατφόρμες μετά αποκλείοντας κάθε μεταγραφή στο σύνολο δεδομένων miRNA-Seq με ανάγνωσης μετράνε λιγότερο από 5. Αυτό μείωσε τον αριθμό των διακριτών miRNAs διαθέσιμα για ανάλυση στο miRNA- επόμενα αρχείο δεδομένων από 705 σε 380. Ωστόσο, το ποσοστό των miRNAs με συντελεστές συσχέτισης ≤ 0,5 μειώθηκε επίσης από 72% σε 56%. Ομοίως απομάκρυνση κακώς εκφράζεται μεταγραφές από την πισίνα του mRNAs προφίλ με Illumina HiSeq μειώνει το ποσοστό των mRNAs του οποίου συσχετισμού συντελεστές ≤0.5 από 22% έως 20%. Αυτές οι παρατηρήσεις δείχνουν ότι τα προβλήματα ανίχνευση σπάνια εκφράζεται miRNA μπορεί να επηρεάσουν την ικανότητα ή το ένα ή και τα δύο πλατφόρμες να αναφέρουν αξιόπιστα έκφραση των miRNAs. Ωστόσο, το γεγονός ότι περισσότερο από το ήμισυ των miRNA μεταγραφές είχε ακόμη συντελεστών συσχέτισης ≤0.5 ακόμα και μετά από διόρθωση για το θέμα αυτό δείχνει ότι κακώς εκφράζεται μεταγραφές δεν είναι αποκλειστικά υπεύθυνοι για τα ασύμφωνα μοτίβα έκφρασης των miRNAs που αναφέρθηκαν από τις δύο πλατφόρμες.

για να διερευνήσουν το θέμα περισσότερο σε βάθος, θα υπολογίζεται το εύρος των log2 μετατραπεί επίπεδα έκφρασης για όλα τα microRNAs στα δύο σύνολα δεδομένων. Έχουμε επίσης αναπτύξει έναν αλγόριθμο που μας επέτρεψε να ποικίλει το όριο της έκφρασης αποδεκτή για συμπερίληψη για ανάλυση από μια ελάχιστη τιμή (0) με τη μέση τιμή log2 μετασχηματισμένο επίπεδο έκφρασης όλων των μεταγράφων. Για κάθε όριο, μπορούμε μόνο θεωρείται microRNAs που εκφράζεται πάνω από το όριο και υπολογίστηκαν εκ νέου τη συσχέτιση μεταξύ των δύο πλατφόρμες. Αυτή η ανάλυση αποκαλύπτει ότι ο αποκλεισμός των miRNA μεταγραφές εκφράζονται λιγότερο συχνά από ό, τι ο μέσος όρος βελτιώνει μόνο ελαφρά τη συνολική συσχέτιση μεταξύ των δύο πλατφόρμες που χρησιμοποιούνται στο προφίλ έκφρασης των miRNAs (Σχήμα 3C). Όπως παρουσιάζεται γραφικά, διαπιστώσαμε ότι το 71% του miRNA επιδεικνύουν συσχέτιση μικρότερη από 0,5, χωρίς τη χρήση οποιουδήποτε φιλτραρίσματος. Με τη χρησιμοποίηση ενός φίλτρου επίπεδο έκφρασης όπως περιγράφεται, βρήκαμε ότι το ποσοστό των μεταγράφων με συντελεστές συσχέτισης μεταξύ των δύο πλατφόρμες κορεσμένο σε 56%. Αυτή εξακολουθεί να είναι πολύ υψηλότερο από το 22% που παρατηρήθηκε με συστήματα προφίλ έκφρασης του mRNA.

Συζήτηση

Προς μεγάλη μας έκπληξη, οι αναλύσεις μας δείχνουν ότι τα microRNAs που σχετίζονται με την επιβίωση στον καρκίνο των ωοθηκών εξαρτάται σε μεγάλο βαθμό από το αν δείγματα προφίλ από το TCGA χρήση μικροσυστοιχιών ή miRNA-Seq. Οι αναλύσεις μας δείχνουν ότι υπάρχει αυτή η διαφορά επειδή miRNA-Seq και μικροσυστοιχιών έχουν δημιουργήσει πολύ διαφορετικά προφίλ έκφρασης των miRNAs, ακόμη και αν τα δεδομένα με βάση τα ίδια δείγματα καρκίνου των ωοθηκών. Δεν έχουμε σήμερα μια σαφή εξήγηση για το γιατί miRNA προφίλ έκφρασης που αναφέρθηκαν από την TCGA είναι ασύμφωνα. Ωστόσο, η κατανόηση αυτή την ασυμφωνία, τελικά, θα είναι σημαντικό για να προσδιοριστεί ποιο miRNAs αν υπάρχουν είναι σημαντικές για τον προσδιορισμό των αποτελεσμάτων του καρκίνου των ωοθηκών.

Μια ποικιλία των τεχνολογιών των μικροσυστοιχιών DNA έχουν προηγουμένως επικυρωθεί από τους ερευνητές εξετάζουν στο πλαίσιο της πλατφόρμας και cross-platform αναπαραγωγιμότητα [ ,,,0],12] – [14]. Spearman συντελεστές συσχέτισης που αναφέρθηκαν σε αυτές τις μελέτες κυμαίνεται από 0,59 να 0,94 με μέση τιμή 0,82. Αυτά τα αποτελέσματα είναι παρόμοια με αυτό που έχουμε παρατηρήσει για συσχετισμούς μεταξύ των προτύπων της γονιδιακής έκφρασης προφίλ χρησιμοποιώντας μικροσυστοιχίες και πλατφόρμες Illumina HiSeq από την TCGA. Τόσο miRNA-Seq και τεχνολογίες μικροσυστοιχιών συνδέονται με πολλαπλούς τεχνικούς περιορισμούς που θα μπορούσαν να ευθύνονται για τις διαφορές που έχουμε παρατηρήσει. Για παράδειγμα, διασταυρούμενη υβριδοποίηση είναι μια καλά αναγνωρισμένη ζήτημα που μπορεί να μειώσει την ειδικότητα του σήματος όταν profiling μεταγραφές RNA με μικροσυστοιχιών [15]. Ωστόσο, φαίνεται απίθανο ότι διασταυρούμενη υβριδοποίηση είναι μια κύρια αιτία της απόκλισης που παρατηρήσαμε, καθώς ο αριθμός των αντιγράφων συσχετίζεται με την επιβίωση κατά συστοιχία είναι μεγαλύτερος από τον αριθμό που σχετίζεται με την επιβίωση κατά miRNA-Seq. Μια εναλλακτική εξήγηση θα μπορούσε να είναι ότι ο αλγόριθμος εξόρυξης σήμα που χρησιμοποιείται για την ανάλυση των δεδομένων miRNA-Seq δεν αναφέρει με ακρίβεια τα επίπεδα των miRNAs. Σε γενικές γραμμές, miRNA-Seq επιτρέπει την ακριβή χαρτογράφηση μεταγραφή με πολύ μεγαλύτερη εμπιστοσύνη. Ο αλγόριθμος εξόρυξης σήματος που χρησιμοποιείται σήμερα από την TCGA να αναφέρουν τα επίπεδα των miRNAs περιλαμβάνει ανάγνωσης μετράει τόσο για ένα ώριμο miRNA και το αντίστοιχο πρόδρομο του. Οι αναλύσεις μας υποδεικνύουν ότι οι πρόδρομοι αντιπροσωπεύουν λιγότερο από το 1% του συνόλου των μετρήσεων miRNA στο αρχείο ισομορφή TCGA. Αυτό πιθανότατα αντικατοπτρίζει τη χρήση μέγεθος κλασματοποιήθηκε RNA για την προετοιμασία βιβλιοθηκών για miRNA-Seq [5]. Έτσι, η συμπερίληψη ή τον αποκλεισμό τους στις αναλύσεις του συνόλου δεδομένων TCGA πιθανόν έχει μικρή σχέση με τα οποία miRNAs που σχετίζονται με την επιβίωση του καρκίνου των ωοθηκών.

Συλλογικά, οι παρατηρήσεις αυτές υπογραμμίζουν την επείγουσα ανάγκη για σαφώς καθορισμένες αλγορίθμους για την επεξεργασία σημάτων που παράγονται από miRNA-Seq και μεταγραφικό πλατφόρμες προφίλ. Η κατανόησή μας είναι ότι οι ίδιες αναλύσεις πραγματοποιήθηκαν από TCGA για άλλους καρκίνους, συμπεριλαμβανομένου του παχέος εντέρου, του μαστού και του πνεύμονα [16] – [18]. Επειδή έκφραση miRNA σε αυτές τις άλλες μορφές καρκίνου δεν έχει δημιουργηθεί προφίλ με μικροσυστοιχία, δεν είναι δυνατόν να επαναλάβουμε τις αναλύσεις μας για να προσδιοριστεί αν η διαφορά αναφέρουμε παρατηρείται σε άλλους καρκίνους. Τελικά, συνεπή και αξιόπιστη γονιδιακά δεδομένα είναι ζωτικής σημασίας για την κατασκευή ελέγξιμες υποθέσεις και την επίτευξη του πλήρους δυναμικού της TCGA. Οι παρατηρήσεις μας προσδιορίσει ένα σημαντικό κίνδυνο των οποίων οι ερευνητές θα πρέπει να γνωρίζουν, δεδομένου ότι χρησιμοποιούν τα δεδομένα TCGA miRNA για να μελετήσει τον καρκίνο των ωοθηκών. Για σύντομο χρονικό διάστημα, η γνώση αυτού του κινδύνου υπογραμμίζει την ανάγκη για την επικύρωση παρατηρήσεις που γίνονται με ένα ή δύο από TCGA miRNA σύνολα δεδομένων. Ωστόσο, για τη μακροπρόθεσμη, επίλυση αυτής της διαφοράς θα είναι σημαντική για τον προσδιορισμό των πιο αποτελεσματική πλατφόρμα και την εξαγωγή του σήματος αλγορίθμων για προφίλ έκφρασης των miRNAs ως μέρος της μεγάλης κλίμακας γονιδιωματικής προσπάθειες προφίλ.

Υλικά και Μέθοδοι

Gene Expression και microRNA δεδομένων

Επίπεδο δεδομένων 3 τεκμηριώνουν τα πρότυπα της γονιδιακής έκφρασης για 296 ωοθηκών δείγματα καρκίνου του προφίλ χρησιμοποιώντας συστοιχίες Agilent G4502A και Illumina HiSeq είχαν κατεβάσει από την πύλη δεδομένων TCGA. δεδομένων έκφραση microRNA Επίπεδο 3 επίσης ανακτηθούν για 469 ωοθηκών δείγματα καρκίνου του προφίλ χρησιμοποιώντας τον πίνακα Agilent 4X15k και miRNA-Seq. Επίπεδο 3 δεδομένων miRNA προφίλ από miRNA-Seq ανακτήθηκαν τόσο από την ποσοτικοποίηση των miRNAs και ισομορφή αρχεία που είναι διαθέσιμα στην πύλη δεδομένων TCGA μαζί με μετα-συμπλήρωση του κάθε συνόλου δεδομένων. Δικαίωμα πρόσβασης σε όλα τα δεδομένα ελήφθησαν από την Επιτροπή για την πρόσβαση δεδομένων για το National Center for Biotechnology Information γονότυποι και φαινοτύπων Database (dbGAP) των Εθνικών Ινστιτούτων Υγείας.

Survival Αναλύσεις

Κωδικοποιημένος επιβίωση των ασθενών δεδομένα που προέρχονται από το αρχείο κλινικές πληροφορίες TCGA. Ένα μοντέλο αναλογικών κινδύνων κατά Cox χρησιμοποιήθηκε για την εκτίμηση συσχέτιση μεταξύ των επιπέδων των επιμέρους miRNAs. επιβίωση των ασθενών υπολογίστηκε ως χρόνος σε μήνες έχει παρέλθει από την ημερομηνία της διάγνωσης μέχρι την ημερομηνία της τελευταίας επαφής.

Στατιστικές Αναλύσεις

συντελεστές βαθμό συσχέτισης Spearman του, ιστογράμματα, και η εμπειρική αθροιστική κατανομή υπολογίστηκαν και σχεδιάστηκαν για κάθε miRNA και γονίδιο χρησιμοποιώντας r. δεδομένα αλληλουχίας ήταν log μετασχηματίστηκαν για τη σχεδίαση. Τόσο η άμεση μετράει ανάγνωσης και μετράει ομαλοποιηθεί σύμφωνα με τα εκατομμύρια των miRNAs εξετάστηκαν ως μέρος των αναλύσεων μας. Όλες οι αναλύσεις πραγματοποιήθηκαν με τη χρήση τόσο ωμά και ομαλοποιημένη μετράει ανάγνωσης αναφερθεί ως μέρος των TCGA miRNA-Seq σύνολα δεδομένων.

Ευχαριστίες

Οι συγγραφείς εκφράζουν την ευγνωμοσύνη αναγνωρίζουν ανακοίνωση David Wheeler, Rehan Akban, Gordon Robertson και Andy Chu σχετικά TCGA miRNA αλγορίθμων ανάλυσης δεδομένων.

You must be logged into post a comment.