PLoS One: αποποίησης διαταραγμένο microRNA ρυθμιστικών δικτύων στον Καρκίνο Χρησιμοποιώντας Ιεραρχική Gene Συν-Έκφραση Υπογραφές


Αφηρημένο

Τα microRNAs (miRNAs), μια κατηγορία ενδογενών μικρών ρυθμιστικών RNAs, παίζουν σημαντικό ρόλο σε πολλές βιολογικές και φυσιολογικές διαδικασίες. Οι διαταραχές ορισμένων miRNAs, τα οποία συνήθως ονομάζεται ως ογκο-microRNAs (ογκο-Mirs), συνδέονται σημαντικά με πολλαπλά στάδια του καρκίνου. Παρά το γεγονός ότι εκατοντάδες miRNAs έχουν ανακαλυφθεί, τα ενόχλησή ρυθμιστικών δικτύων miRNA και οι λειτουργίες τους είναι ακόμη πλήρως κατανοητό στον καρκίνο. Αναλύοντας τα πρότυπα έκφρασης των γονιδίων στόχων miRNA είναι μια πολύ χρήσιμη στρατηγική για να συναγάγει τα ενόχλησή δίκτυα miRNA. Ωστόσο, λόγω της πολυπλοκότητας των μεταγραφικό καρκίνου, οι τρέχουσες μέθοδοι αντιμετωπίζουν συχνά χαμηλή ευαισθησία και να αναφέρουν μερικές υποψήφιοι ογκο-miR. Εδώ, έχουμε αναπτύξει μια νέα μέθοδο, που ονομάζεται miRHiC (ανάλυση εμπλουτισμό των στόχων miRNA στην Ιεραρχική υπογραφές γονίδιο Co-έκφραση), για να συναγάγει τα ενόχλησή ρυθμιστικών δικτύων miRNA χρησιμοποιώντας τις ιεραρχικές υπογραφές συν-έκφραση σε μεγάλης κλίμακας σύνολα δεδομένων γονιδιακής έκφρασης του καρκίνου. Η μέθοδος μπορεί να συμπεράνει υποψήφιοι ογκο-miR και τα δίκτυα στόχο τους, που συνδέονται μόνο με υπο-συστάδες των διαφορικά εκφρασμένων γονιδίων σε πρόστιμο κλίμακες της ιεραρχίας συν-έκφραση. Σε δύο πραγματικά δεδομένα του καρκίνου του πνεύμονα και του καρκίνου στο ήπαρ, miRHiC αποκάλυψε αρκετές γνωστές ογκο-Mirs και γονιδίων-στόχων τους (όπως miR-26, miR-29, miR-124, miR-125 και miR-200) και, επίσης, εντοπίστηκαν πολλά νέα υποψήφιοι (όπως miR-149, το οποίο συνάγεται στους δύο τύπους καρκίνου). Χρησιμοποιώντας ιεραρχική υπογραφές γονίδιο συν-έκφραση, miRHiC μπορεί να αυξήσει σημαντικά την ευαισθησία για την συναγωγή των ενόχλησή ρυθμιστικών δικτύων miRNA στον καρκίνο. Όλα τα σενάρια Perl των miRHiC και τα λεπτομερή έγγραφα διατίθενται ελεύθερα στο διαδίκτυο σε https://bioinfo.au.tsinghua.edu.cn/member/jgu/miRHiC/

Παράθεση:. Gu J, Xuan Z (2013) τεκμηρίωση της Διαταραγμένα microRNA ρυθμιστικών δικτύων στον Καρκίνο Χρησιμοποιώντας Ιεραρχική Gene υπογραφές Co-έκφραση. PLoS ONE 8 (11): e81032. doi: 10.1371 /journal.pone.0081032

Συντάκτης: Joaquin Dopazo, Centro de Investigacion Principe Felipe, Ισπανία

Ελήφθη: May 29, 2013? Αποδεκτές: 9 Οκτωβρίου του 2013? Δημοσιεύθηκε: 20 του Νοέμβρη του 2013

Copyright: © 2013 Gu, Xuan. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Αυτό το έργο υποστηρίζεται από το Εθνικό πρόγραμμα βασικής έρευνας της Κίνας [2012CB316503], Εθνικό Ίδρυμα Φυσικών Επιστημών της Κίνας [61005040, 61370035], Εθνικό Ινστιτούτο Υγείας [U01 ES017166] και Tsinghua Εθνικό Εργαστήριο του Ιδρύματος Cross-πειθαρχία Επιστήμης Τεχνολογίας Πληροφορικής και Επικοινωνιών. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

τα microRNAs (miRNAs) είναι μια κατηγορία από μικρά (~ 22 nt) ρυθμιστικών RNAs, τα οποία παίζουν σημαντικό ρόλο σε πολλές βασικές βιολογικές και φυσιολογικές διαδικασίες, όπως η ανάπτυξη του εμβρύου, την εξέλιξη του καρκίνου και ανοσολογική απόκριση. Περίπου 1400 miRNAs έχουν ταυτοποιηθεί σε ανθρώπινο και περισσότερο από 30% τα γνωστά γονίδια που κωδικοποιούν πρωτεΐνες δυνητικά ρυθμίζονται από εξελικτική διατηρημένη miRNAs [1], [2]. Οι διαταραχές ορισμένων miRNAs, που συνήθως ονομάζεται ως ογκο-microRNAs (ογκο-Mirs, συμπεριλαμβανομένων τόσο ογκογόνο και όγκου κατασταλτική miRNAs στην παρούσα μελέτη), έχουν αναφερθεί ότι σχετίζονται σημαντικά με πολλαπλά στάδια του καρκίνου. Αλλά μέχρι τώρα, λίγα μόνο από τα εκατοντάδες miRNAs συνδέονται με τις πολύπλοκες dys ρυθμιζόμενες κυτταρικές διεργασίες στον καρκίνο. Υπάρχει μεγάλη ανάγκη για να συμπεράνει τις ενόχλησή ρυθμιστικών δικτύων miRNA και οι λειτουργίες τους στον καρκίνο [3].

Για να συμπεράνουμε την ενόχλησή κανονιστικού δικτύου miRNA, μια δημοφιλής στρατηγική είναι να αναλύσει miRNA γονίδιο στόχο σύνολο εμπλουτισμοί σε διαφορικά εκφραζόμενο γονίδιο υπογραφές. Αυτό περιλαμβάνει πολλές αναπτυγμένες μεθόδους, όπως σετ γονιδίων ανάλυση με υπερ-γεωμετρική δοκιμής (HG-test, ή ακριβές τεστ Fisher)? GSEA (γονίδιο που ανάλυση εμπλουτισμού) [4], [5]? FAME (λειτουργική κατανομή των miRNAs μέσω εμπλουτισμού) [6]? και miRBridge [7], η οποία υποθέτουν ότι οι σετ γονίδιο στόχο εμπλουτισμοί αντανακλούν τις διαταραχές του ανάντη δυνάμεις ρύθμισης miRNA τους. Όμως, λόγω της πολυπλοκότητας των μεταγραφικό καρκίνου, οι μέθοδοι αυτές παρουσιάζουν συνήθως χαμηλή ευαισθησία της συναγωγής των υποψηφίων ογκο-miR (εδώ, η «ευαισθησία» σημαίνει κυρίως τον αριθμό των συναχθεί υποψηφίων ογκο-miR κάτω από ένα συγκεκριμένο επίπεδο στατιστικής σημαντικότητας).

Ο καρκίνος είναι μια πολλαπλών σταδίων και μικτή διαδικασία, συνήθως περιλαμβάνει πολλά ιεραρχικά οργανωμένη υπο-διαδικασίες ρυθμίζονται σε πολλαπλές κλίμακες [8]. Οι κανονισμοί miRNA δείχνουν επίσης την ιδιότητα της πολυ-κλίμακας [9]: λίγες miRNAs, τα οποία βοηθούν τον προσδιορισμό των τύπων κυττάρων ή κυτταρικών κράτη, καταστέλλουν εκατοντάδες γονιδίου-στόχου εκφράσεις για να διατηρήσουν τύπο κυττάρων ή κυτταρικών κατάσταση συγκεκριμένο προφίλ έκφρασης, όπως miR-124 στον εγκέφαλο και miR-1, miR-133 σε μυς [10], [11], [12]? Ωστόσο, πολλά άλλα miRNAs μπορούν να ρυθμίζουν μόνο κάποιες συγκεκριμένες διαδικασίες με στόχο μια μικρή ομάδα στενά συνδεδεμένων γονιδίων. Ο πρώην είδος των υποψηφίων ογκο-Mirs μπορεί εύκολα να προσδιοριστεί αναλύοντας τον εμπλουτισμό των γονιδίων στόχων τους στο σύνολο των διαφορικά εκφρασμένων γονιδίων, αλλά οι τελευταίοι συχνά αναπάντητες από τις υπάρχουσες μεθόδους που οφείλονται σε ανεπαρκή εμπλουτισμοί του γονιδίου στόχου στο διαφορικά εκφρασμένων γονίδια ή στις υπογραφές συν-έκφραση χρησιμοποιώντας προκαθορισμένα cutoffs ομοιότητα.

σε αυτή τη μελέτη, πρότεινε μια νέα στρατηγική για να συναχθεί η ογκο-Mirs και διαταραγμένο ρυθμιστικών δικτύων τους. Αυτή η στρατηγική λαμβάνει υπόψη της πολυ-κλίμακας και ιεραρχικά οργανωμένη κανονιστικών δομών στα διαφορικά εκφρασμένων γονιδίων χρησιμοποιώντας πληροφορίες γονίδιο συν-έκφρασης, και αποσαφηνίζει τις κλίμακες της ιεραρχίας γονίδιο συν-έκφραση για να αναλύσει το σύνολο εμπλουτισμό του γονιδίου-στόχου miRNA. Η μέθοδος μας, που ονομάζεται ως miRHiC (ανάλυση εμπλουτισμός των στόχων miRNA σε ιεραρχική υπογραφές γονίδιο Συν-έκφραση), μπορεί να συναγάγει τα διαταραγμένο ρυθμιστικά δίκτυα miRNA στον καρκίνο με την ανάλυση των εμπλουτισμοί των συνόλων γονιδίου στόχου miRNA στην ιεραρχική υπογραφές γονίδιο συν-έκφρασης. Αυτές οι υπογραφές γονίδιο συστάθηκε με ιεραρχική ομαδοποίηση γονιδίων συν-έκφραση, ένας κοινός τρόπος για να διαχωριστούν τα μικτά σήματα σε προφίλ γονιδιακής έκφρασης σε διαφορετικά επίπεδα συσχέτισης. Σε miRHiC, το σύνολο του γονιδίου-στόχου miRNA δεν απαιτείται να εμπλουτίζεται σε όλο το σύνολο των διαφορικά εκφραζόμενων γονιδίων αλλά εντός οποιασδήποτε υπογραφή στο πρόστιμο κλίμακα της ιεραρχίας γονιδίου συν-έκφρασης. Εκτός από την υψηλότερη ευαισθησία για την συναγωγή των υποψηφίων ογκο-Mir, ένα άλλο πλεονέκτημα της λαμβάνοντας υπόψη τις πληροφορίες γονίδιο συν-έκφραση είναι η μείωση των θορύβων συναγωγής των αντίστοιχων διαταραγμένο γονίδια στόχους: τα «διάσπαρτα» διαφορικά εκφραζόμενα γονίδια με μικρή ομοιότητα σχήμα έκφρασης σε άλλα γονίδια , τα οποία είναι πιο πιθανό να είναι «ψευδής» στόχους miRNA λόγω θορύβους έκφραση [13], αποκλείονται κατά τη διάρκεια της ανάλυσης. Σε δύο μεγάλης κλίμακας σύνολα δεδομένων γονιδιακής έκφρασης του καρκίνου, miRHiC προσδιορίζονται με επιτυχία αρκετές γνωστές ογκο-Mirs και, επίσης, συνάγεται πολλούς νέους υποψηφίους.

Υλικά και Μέθοδοι

miRNA γονιδίων στόχων

miRNAs και γονιδίων στόχων τους (τα miRNAs από την ίδια οικογένεια συγχωνεύονται ως ένα μόνο στοιχείο) έχουν εξαχθεί από τη βάση δεδομένων TargetScan (v6.2) [1], [2]. Ένα γονίδιο θεωρήθηκε ως στόχος ενός miRNA, εάν το γονίδιο περιέχει τουλάχιστον μία συντηρημένη προβλεπόμενη θέση δέσμευσης miRNA σε 3′-UTR της. Και η συνοψίζονται βαθμολογία πλαίσιο (αρνητική βαθμολογία μέτρηση της δύναμης ρύθμισης miRNA-στόχου ή εμπιστοσύνης, που παρέχονται από TargetScan) καταγράφηκε για κάθε ζεύγος miRNA-στόχο. Στη συνέχεια, θα επιλύονται οι βαθμολογίες πλαίσιο στο

K

επίπεδα: όλα τα ζεύγη miRNA-στόχοι ταξινομούνται ανάλογα με τα αποτελέσματα πλαίσιό τους σε φθίνουσα σειρά (τα ζεύγη κατατάσσονται στην κορυφή έχουν τη μικρότερη περιεκτικότητα κανονισμού) και την discretized βαθμολογία για την το ζεύγος miRNA-στόχο με βαθμό

r

ορίστηκε ως:

s

= 1+

β

[

rK

/

N

]. Αυτό σημαίνει ότι οι πρώτες 1 /

K

ζεύγη miRNA-στόχο έχουν χαμηλότερο σκορ 1, ενώ το τελευταίο 1 /

K

ζευγάρια έχουν υψηλότερη βαθμολογία 1+

β

(

K

-1). Σύμφωνα με τον διαιτητή. [6],

K

έχει οριστεί ως 5 και

β

ως 3 σε αυτή τη μελέτη.

Οι ελέγχου miRNA σύνολα γονιδίου στόχου παρήχθησαν από διμερούς γραφήματος με βάση τυχαία μετάθεση των ζευγών miRNA-στόχος με τα ίδια discretized βαθμολογίες αλλά διατηρώντας τα μεγέθη όλων των συνόλων γονιδίου στόχου. Αυτού του είδους η αυστηρή διαδικασία αντιμετάθεσης μπορεί να δημιουργήσει τις ελέγχου miRNA σύνολα γονιδίου στόχου που διατηρούν τις στατιστικές ιδιότητες πολύ καλύτερη από την τυχαιοποίηση χωρίς περιορισμούς [6].

δεδομένα γονιδιακής έκφρασης του καρκίνου

Δοκιμάζουμε miRHiC για δύο μεγάλης κλίμακας σύνολα δεδομένων γονιδιακής έκφρασης του καρκίνου κατεβάσει από τη βάση δεδομένων NCBI GEO: 1) καρκίνος του πνεύμονα (LUC) σύνολο δεδομένων, GSE19804 συμπεριλαμβανομένων 60 ζεύγη καρκίνου και παρα-καρκίνου δείγματα? και 2) του ηπατοκυτταρικού καρκίνου (ΗΚΚ) σύνολο δεδομένων, GSE22058 συμπεριλαμβανομένων 96 ζεύγη καρκίνου και παρα-καρκίνου δείγματα. Για να αποφύγετε τους θορύβους στο ταπεινούς εκφραζόμενα γονίδια, κρατήσαμε μόνο τα γονίδια των οποίων η έκφραση τιμές κατατάσσουν στην κορυφή των 10.000 σε τουλάχιστον 30% δείγματα σε κάθε σύνολο δεδομένων. Στη συνέχεια, οι διαφορικά εκφραζόμενα γονίδια ταυτοποιήθηκαν με τιμή-ρ & lt? 0,0001 με χρήση t-test (οι ρ-τιμές ήταν πολλαπλές δοκιμές ρυθμίζεται με διόρθωση BH). Εντοπίσαμε 3397 και 5699 διαφορικά εκφρασμένων γονιδίων για LUC και HCC σύνολα δεδομένων, αντίστοιχα

miRHiC:. Εμπλουτισμό ανάλυση των στόχων miRNA σε υπογραφές Co-έκφραση Ιεραρχική γονιδίου

miRHiC προτάθηκε να συναγάγει την ενόχλησή miRNA ρυθμιστικά δίκτυα στον καρκίνο με την ενσωμάτωση του ιεραρχικά οργανωμένη πληροφορίες συν-έκφραση των διαφορικά εκφραζόμενων γονιδίων: πρώτον, οι ιεραρχικές υπογραφές γονίδιο συν-έκφραση καθορίστηκαν με ομαδοποίησης των διαφορικά εκφραζόμενων γονιδίων με βάση την κατά ζεύγη συσχετισμούς γονίδιο συν-έκφραση? τότε το σύνολο του εμπλουτισμού του γονιδίου-στόχου miRNA αναλύθηκε σε όλη την ιεραρχική υπογραφές συν-έκφραση? και, τέλος, μια δοκιμή μετάθεση χρησιμοποιήθηκε για να εκτιμηθεί η στατιστική σημασία του εμπλουτισμού (Σχήμα 1)

Στο πρώτο στάδιο, τα διαφορικά εκφραζόμενων γονιδίων συνενώθηκαν ως υπογραφές ιεραρχική γονίδιο συν-έκφρασης.? Στη συνέχεια, το πιο σημαντικό εμπλουτισμό της σειράς γονιδίου-στόχου miRNA βρέθηκε σε όλη την ιεραρχική υπογραφές? και, τέλος, μια δοκιμή μετάθεση χρησιμοποιήθηκε για να εκτιμηθεί η εμπειρική ρ-τιμή του εμπλουτισμού.

Η

1) Πάρτε τις ιεραρχικές υπογραφές γονίδιο συν-έκφραση.

Κατ ‘αρχάς, η μέση σύνδεση ιεραρχική ομαδοποίηση εφαρμόζεται για να συγκεντρωθούν τα διαφορικά εκφραζόμενα γονίδια βασίζονται σε ζεύγη συσχετισμούς συν-έκφραση τους. Για να μειώσετε τους θορύβους που προκαλούνται από κακώς συσχετίζεται γονίδια, η ιεραρχική ομαδοποίηση διακόπτεται εάν η συσχέτιση του γονιδίου συν-έκφραση είναι πολύ χαμηλή: χρησιμοποιήσαμε τη συσχέτιση με z-score 0,52 ως αποκοπής σε αυτή τη μελέτη (για p-value 0,3? Z- βαθμολογία για κάθε δεδομένο επίπεδο συσχέτισης υπολογίζεται χρησιμοποιώντας το μετασχηματισμό Fisher). Αυτή η αποκοπή δείχνει μερικές επιρροές από τα αποτελέσματα: για το σύνολο δεδομένων LUC, όταν ο αποκοπής z-score άλλαξε 0,3 έως 0,9 βήμα 0,1, η ιεραρχική ομαδοποίηση σταμάτησε σχεδόν στην ίδια θέση. Στη συνέχεια, εξάγαμε τις υπογραφές γονίδιο συν-έκφραση (συστάδες σταθερό γονίδιο συν-έκφραση) σε διαφορετικές κλίμακες συσχέτιση διατρέχοντας την ιεραρχία συν-έκφραση από φύλλο προς ρίζα (ο συσχετισμός μειώνεται και το μέγεθος των υπογραφών αυξάνεται όταν διέρχονται από την ιεραρχία από φύλλο στο root). Οι λεπτομέρειες του αλγορίθμου εξόρυξης υπογραφή δίνεται στο εγχειρίδιο χρήσης μέσω της ιστοσελίδας miRHiC.

2) Αναλύστε τα σετ γονίδιο στόχο miRNA εμπλουτισμοί στην ιεραρχική υπογραφές γονίδιο συν-έκφραση.

Για το

ι

-ου υπογραφή γονίδιο συν-έκφραση της ιεραρχίας, μπορούμε να βρούμε τις επικαλυπτόμενες γονιδίων μεταξύ της υπογραφής (συμβολίζεται ως

S

ι

) και το

i κατασκευαστής – ου miRNA σύνολο του γονιδίου-στόχου (συμβολίζεται ως

Τ

i

), και στη συνέχεια να υπολογίσει την ανεπεξέργαστη βαθμολογία εμπλουτισμό αθροίζοντας τα διακριτοποιούνται TargetScan βαθμολογίες (δείτε τις λεπτομέρειες της διακριτοποίησης σκορ στο παραπάνω τμήμα) της επικαλύπτονται γονίδια για

i

-ου miRNA:

η τιμή p

p

ij

για αυτό εμπλουτισμό εκτιμήθηκε εξετάζοντας τα αποτελέσματα του εμπλουτισμού

ES

ij

(

r

) 10.000 μέγεθος-ταιριάζει τυχαίο έλεγχο miRNA σύνολα γονίδιο στόχο:

Μετά από να πάρει τις εμπλουτισμοί σε όλες τις υπογραφές συν-έκφραση του γονιδίου ιεραρχική (

ι

= 1, 2, …), η

P

-score

P

i

για το

i

-ου miRNA ήταν υπολογίζεται ως το p-value από τις πιο σημαντικές εμπλουτισμό:.

το

P

-score χρησιμοποιήθηκε για να μετρηθεί το γονίδιο στόχος εμπλουτισμό miRNA σε όλη την ιεραρχία του γονιδίου συν-έκφραση

3) Υπολογίστε τη στατιστική σημασία του

P

-score Βασισμένο εμπλουτισμούς.

το

P

-score είναι η ελάχιστη ενός συνόλου π-αξιών, έτσι δεν είναι ομοιόμορφα κατανεμημένη κατά μήκος 0~1 (μεροληπτεί σε 0). Δεν μπορεί να χρησιμοποιηθεί άμεσα για τη μέτρηση της στατιστικής σημαντικότητας του εμπλουτισμού. Και πάλι, θα χρησιμοποιηθούν για δοκιμή μετάθεση για την εκτίμηση της στατιστικής σημαντικότητας της P-score: οι P-score

P

i

(

r

) 10.000 γονιδιακού ελέγχου μεγέθους συμφωνημένα στόχο miRNA σύνολα υπολογίστηκαν σύμφωνα με τα παραπάνω βήματα? και η εμπειρική ρ-τιμή

p

i

για την P-score

P

i

υπολογίστηκε ως:

Η εμπειρική τιμή p

ρ

i

χρησιμοποιήθηκε για τη μέτρηση της στατιστικής σημαντικότητας των miRNA σετ εμπλουτισμού του γονιδίου-στόχου σε όλη την ιεραρχική υπογραφές γονίδιο συν-έκφρασης. Για να διορθώσετε την πολλαπλή δοκιμή, fdrtool χρησιμοποιήθηκε για τον υπολογισμό του

q

-τιμές, σύμφωνα με τις εμπειρικές ρ-τιμές [14].

Συγκρίσεις με άλλες μεθόδους

miRHiC ήταν σε σύγκριση με τον Gene set ανάλυση εμπλουτισμού (GSEA) και σειρά γονιδίων ανάλυση με υπερ-γεωμετρική δοκιμή (HG-test). GSEA είναι μια ευρέως χρησιμοποιούμενη μέθοδος για την συναγωγή των ενόχλησή σύνολα γονιδίων με τη λήψη των συνεχών αξιών και τις πληροφορίες κατάταξης των διαφορικών γονιδιακή έκφραση [5]. Κατά τη σύγκριση με miRHiC GSEA, οι φορές αλλαγές γονιδιακή έκφραση μεταξύ καρκίνου και φυσιολογικά δείγματα χρησιμοποιήθηκαν σε GSEA και του ιδίου γονιδίου στόχου μέθοδος σετ μετάθεση miRNA χρησιμοποιήθηκε για τον υπολογισμό των εμπειρικές ρ-τιμές.

GSEA και HG- χρήση της δοκιμής διαφορετικά υπολογιστικά μοντέλα για τη μέτρηση σύνολο γονιδίων εμπλουτισμούς με miRHiC. Για απ ‘ευθείας δοκιμή της πλεονέκτημα της χρήσης της ιεραρχικής πληροφορίες γονίδιο συν-έκφραση, χρησιμοποιήθηκαν οι διαφορικά εκφραζόμενων γονιδίων ως η μόνη υπογραφή και έτρεξε miRHiC σε αυτό. Για τη σαφή παρουσίαση, ονομάσαμε αυτή την προσέγγιση ως (ανάλυση εμπλουτισμός των στόχων miRNA σε διαφορικά εκφραζόμενων γονιδίων) miRDeG.

Εκτός ιεραρχική ομαδοποίηση,

k

-means ομαδοποίησης είναι ένα άλλο που χρησιμοποιούνται συνήθως αλγόριθμο για να παράγει το γονίδιο υπογραφές συν-έκφρασης. Ο αλγόριθμος μπορεί να στεγανοποιήσει όλα τα διαφορικά εκφρασμένων γονιδίων σε

k

μη επικαλυπτόμενες ομάδες. Σε αντίθεση με ιεραρχική ομαδοποίηση,

k

-means είναι δύσκολο να αποκλείσει τα κακώς συσχετίζεται γονίδια θέτοντας κάθε όριο. Σε σύγκριση, χρησιμοποιήσαμε

k

-means (

k

έχει οριστεί σε 5 ή 10), για να πάρει τις υπογραφές συν-έκφραση του γονιδίου. Στη συνέχεια, εκτελέστε την ίδια διαδικασία για να αναλύσει τα εμπλουτισμοί στόχο miRNA στις δημιουργούνται υπογραφές με διαφορετικές

k

. Ονομάσαμε αυτή την προσέγγιση ως miRKM (miRKM5 και miRKM10) στην παρακάτω ενότητα.

Αποτελέσματα

Η εκτίμηση των εμπειρικές τιμές p χωρίς προκατάληψη από miRHiC

Για να αποδείξει ότι miRHiC δεν έχουν το πρόβλημα της υπερ-εκτίμηση των στατιστικών σημασίες, δημιουργήσαμε 100 μέγεθος αντιστοίχιση συνόλων γονίδιο στόχος ελέγχου για κάθε miRNA, και στη συνέχεια υπολογίζεται κατανομές των εμπειρικών ρ-τιμές για εμπλουτισμό τους στην ιεραρχική γονίδιο υπογραφές συν-έκφρασης χρησιμοποιώντας miRHiC . Αν miRHiC δεν έχει καμία προκατάληψη για την εκτίμηση των εμπειρικές ρ-τιμές, οι p-τιμές αυτών των έλεγχο των miRNAs σύνολα γονίδιο στόχος θα πρέπει να είναι ομοιόμορφα κατανεμημένα μεταξύ 0~1. Όπως ήταν αναμενόμενο, τα αποτελέσματα έδειξαν ότι οι εμπειρικές ρ-τιμές είναι ομοιόμορφα κατανεμημένα (Σχήμα 2). Μια άλλη πιθανή προκατάληψη επηρεάζει εμπειρική ρ-τιμή προκαλείται από τα διαφορετικά μεγέθη των συνόλων γονιδίου-στόχου miRNA: μερικοί miRNAs έχουν περισσότερα από 1.000 γονίδια-στόχους, ενώ μερικά έχουν μόνο λιγότερο από 50 γονίδια-στόχους. Υπολογίσαμε βαθμό συσχέτισης του Spearman μεταξύ των μεγεθών και των αντίστοιχων εμπειρικές ρ-τιμές των συνόλων γονιδίων. Η συσχέτιση είναι -0,015 (p-αξία αυτής της συσχέτισης & gt? 0.05), η οποία πρότεινε ότι οι εμπειρικές ρ-τιμές δεν επηρεάζονται από τα μεγέθη του γονιδίου σύνολα. Με βάση αυτές τις αναλύσεις, μπορούμε να συμπεράνουμε ότι miRHiC δεν έχει καμία προκατάληψη για την εκτίμηση των εμπειρικές ρ-τιμές.

Η

συμπερασμάτων για την ενόχλησή ρυθμιστικών δικτύων miRNA στον καρκίνο

miRHiC να συμπεράνουμε ογκο-Mirs και διαταραγμένο στόχο ρυθμιστικών δικτύων τους, αναλύοντας το σύνολο γονίδιο στόχο τον εμπλουτισμό miRNA σε ιεραρχική υπογραφές γονίδιο συν-έκφραση στον καρκίνο. Στις δύο μεγάλης κλίμακας σύνολα δεδομένων γονιδιακής έκφρασης του καρκίνου του πνεύμονα (LUC) και ηπατοκυτταρικό καρκίνο (HCC), miRHiC συναχθεί 9 και 8 διαταράσσονται miRNAs ή ογκο-Mirs, αντίστοιχα, με τιμή Q & lt? 0,1. Σύμφωνα με την ίδια Q-τιμή αποκοπής, οι τρεις σε σύγκριση μεθόδων, GSEA, HG-test και miRDeG δεν συναχθεί κανένα υποψήφιο. Παρά το γεγονός ότι miRKM συναχθεί κάποια υποψηφίους (για LUC σύνολο δεδομένων, miRKM5 /10 τεκμαιρόμενη 3/4 των υποψηφίων? Και για HCC σύνολο δεδομένων, miRKM5 /10 τεκμαιρόμενη 6/3 των υποψηφίων), αυτοί οι αριθμοί είναι ακόμη λιγότερο από ό, τι miRHiC και τα περισσότερα από τα συμπεράσματα miRKM καλύπτονται από miRHiC. Τα αποτελέσματα λεπτομέρειες παρέχονται στον Πίνακα S1. Μεταξύ όλων των 17 συμπεράσματα από miRHiC, 9 υποστηρίζονται από την άμεση λειτουργική αποδεικτικά στοιχεία σε λογοτεχνίες (LUC: miR-26, miR-29, miR-125, miR-130, miR-145 και miR-200? HCC: miR-21, miR -124 και miR-125). Αυτά τα αποτελέσματα δείχνουν ότι miRHiC μπορεί να βελτιώσει σημαντικά την ευαισθησία της ογκο-miR συμπεράσματα (Πίνακας 1). Λαμβάνοντας υπόψη την ετερογένεια των μεταγραφικό καρκίνου, bootstrapping αναδειγματοληψία υλοποιήθηκε για να ελέγξετε τη σταθερότητα των συμπερασμάτων. Για LUC, 6 από 9 υποψήφιοι μπορούν να επανειλημμένα συναχθεί σε περισσότερες από 50 πειράματα αναδειγματοληψία% (MIR-125, miR-149, miR-340 και miR-200 είναι σταθερά συναχθεί σε περισσότερο από το 80% των πειραμάτων). Για HCC, 5 από τους 8 υποψηφίους μπορεί να επαναληφθεί συναχθεί (miR-125 και miR-149 είναι σταθερά συναχθεί σε περισσότερο από το 60% των πειραμάτων).

Η

Με την εξέταση των στοχευμένων υπογραφές του τεκμαιρόμενη ογκο -miRs, βρήκαμε ότι έχουν διαφορετικά επίπεδα γονιδίου συν-εκφράσεις στις ιεραρχίες (Σχήμα 3). Οι λειτουργίες που σχετίζονται με αυτές τις υπογραφές (οι εμπλουτισμένες όρους GO των υπογραφών σχολιασμένο από τον David εργαλείο στο διαδίκτυο [15]) είναι σημαντικά σχετίζονται με διαφορετικά χαρακτηριστικά του καρκίνου, συμπεριλαμβανομένου του κυτταρικού κύκλου, μείωση της οξείδωσης, ανοσολογική απόκριση, την επιδιόρθωση του DNA, κυτταρική προσκόλληση και αγγείωση ανάπτυξη (Πίνακας 2). Τα αποτελέσματα αυτά δείχνουν ότι πολλά miRNAs που συνδέονται με τον καρκίνο μέσα από διαφορετικές επιμέρους ρυθμιστικών προγραμμάτων. Για παράδειγμα, miR-200 είναι γνωστή ως σημαντικός ρυθμιστής της αγγειογένεσης (όρος παιδί της «ανάπτυξης αγγειακού συστήματος»). Υπάρχουν αρκετές πειραματικές επικυρωθεί γονιδίων στόχων για την αγγειογένεση, συμπεριλαμβανομένων ZEB1 και ΚΟΚ [16], [17], [18], υπάρχουν στην τεκμαιρόμενη ενόχλησή miR-200 ρυθμιστικών δικτύων σε LUC σύνολο δεδομένων. MiR-200 μπορεί να ρυθμίζει την αγγειογενετική διακόπτη στον καρκίνο του πνεύμονα μέσω αυτών των γονιδίων στόχων. Στον καρκίνο στο ήπαρ, miR-21 είχε προβλεφθεί για τη ρύθμιση «ανοσολογική απόκριση» με τη στόχευση CD69, STAT3, CCL20 και Smad7, στην οποία STAT3 και Smad7 είναι σημαντικά μόρια σηματοδότησης για ανοσολογική απόκριση.

Α) είναι για τον καρκίνο του πνεύμονα και Β) για τον καρκίνο στο ήπαρ. Οι κόμβοι κύκλο αντιπροσωπεύουν τις υπογραφές γονίδιο συν-έκφραση (το ClusterlO: Μέγεθος). Οι κόμβοι διαμάντια αντιπροσωπεύουν τις τεκμαιρόμενη ογκο-Mirs. Οι αριθμοί στις άκρες αντιπροσωπεύουν τα μεγέθη των γονιδίων στόχων miRNA επικαλύπτονται με τις αντίστοιχες υπογραφές γονίδιο συν-έκφραση.

Η

Διαταραγμένα miR-149 υπο-δίκτυα μοιράζονται οι δύο τύποι καρκίνων

Οι ογκο-Mirs συναχθεί σε πολλούς καρκίνους μπορεί να παίζει πιο σημαντικό ρόλο στην έναρξη και την ανάπτυξη του καρκίνου. Δύο miRNAs, miR-125 και miR-149 είχαν συναχθεί από miRHiC και στους δύο τύπους καρκίνων. Για την τεκμαιρόμενη ενόχλησή miR-125 ρυθμιστικών δικτύων, υπάρχουν μόνο τρεις κοινούς στόχους (CDK16, TOMM40 και KIAA1522), γεγονός που υποδηλώνει ότι το miR-125 μπορεί να ρυθμίζει διαφορετικά μονοπάτια στους δύο τύπους καρκίνων. Ενώ για το miR-149, ενόχλησή ρυθμιστικών δικτύων της παρουσιάζουν σημαντική στόχο επικάλυψη με ένα κοινό υπο-δικτύου, συμπεριλαμβανομένων των 14 κοινών στόχων. Και οι 14 στόχοι είναι σταθερά υπερ-εκφράζεται σε ιστούς καρκίνου (Σχήμα 4).

Οι μέσες λογαριθμικά μετασχηματισμένων φορές μεταβολές των κοινών γονιδίων στόχων φαίνονται επίσης στον πίνακα παρακάτω.

Η

MiR-149 είναι ένα θηλαστικό συντηρημένη miRNA. Μερικές μελέτες δείχνουν ότι οι miR-149 γενετικούς πολυμορφισμούς που σχετίζονται με τον κίνδυνο εμφάνισης καρκίνου [19], [20]. Η έκφρασή του είναι επιγενετική σιγήσει DNA υπερ-μεθυλίωση σε καρκίνο του παχέος εντέρου [21]. Αλλά οι miR-149 ρυθμιστικών δικτύων είναι ακόμη πλήρως κατανοητό στον καρκίνο. Οι συναχθεί ενόχλησή δίκτυα παρέχουν σημαντικές γνώσεις του miR-149 κανονισμούς: οι περισσότεροι από τους υψηλούς στόχους εμπιστοσύνης (με υψηλή βαθμολογία TargetScan) στον κοινόχρηστο υπο-δίκτυο συνδέονται με ορισμένες θεμελιώδεις βιολογικές διεργασίες, όπως SRPK1 (σερίνη /παράγοντα ματίσματος πλούσια σε αργινίνη κινάση 1) και CCT3 (σαπερονίνης περιέχουν TCP1, υπομονάδα 3). SRPK1 κωδικοποιεί μια πρωτεΐνη κινάση σερίνης /αργινίνης ειδικά για το SR (σερίνη /πλούσια σε αργινίνη τομέα) οικογένεια παραγόντων ματίσματος. SRPK1 ρυθμίζεται αυξητικά στον καρκίνο του πνεύμονα και πολλούς άλλους τύπους καρκίνου [22], [23]. CCT3 είναι μια υπομονάδα ενός μοριακού συνοδού πρωτεΐνης (σαπερονίνης σύμπλοκο που περιέχει TCP1) βοηθώντας φορές ακτίνης /τουμπουλίνης και μπορεί να ρυθμίσει θετικά κυτταρικού κύκλου [24], [25]. CCT3 υπερέκφραση αναφέρεται επίσης ότι σχετίζεται με καρκίνο του παχέος εντέρου [26] και ο καρκίνος του ήπατος [27]. Έτσι, miR-149 μπορεί να λειτουργήσει ως καταστολέας του καρκίνου με τη στόχευση αυτών των ογκογονιδίων.

Συζήτηση

Αναλύοντας miRNA σύνολο εμπλουτισμό του γονιδίου-στόχου σε διαφορικά εκφρασμένα γονίδια του προφίλ γονιδιακής έκφρασης σε μεγάλη κλίμακα μπορεί να προωθήσει σε μεγάλο βαθμό μας αντιλήψεις των ενόχλησή τους κανονισμούς miRNA. Όμως, λόγω της πολυπλοκότητας των μεταγραφικό καρκίνου, είναι δύσκολο να συμπεράνουμε τα ενόχλησή τους κανονισμούς miRNA με την απλή ανάλυση του γονιδίου-στόχου miRNA που εμπλουτισμό σε όλη την διαφορικά εκφρασμένων γονιδίων. Σε αυτή τη μελέτη, έχουμε αναπτύξει miRHiC να συναγάγει τα ενόχλησή ρυθμιστικών δικτύων miRNA στον καρκίνο με την ενσωμάτωση των πληροφοριών που συν-έκφραση ιεραρχική γονιδίου σε ανάλυση σετ εμπλουτισμό του γονιδίου-στόχου miRNA. Τα αποτελέσματα έδειξαν ότι miRHiC έχουν πολύ μεγαλύτερη ευαισθησία για τις συνέπειες από τις μεθόδους που χρησιμοποιούνται συνήθως, όπως HG-test, GSEA και miRDeG (FAME), εκ των οποίων όλοι δεν χρησιμοποιούν την ιεραρχική πληροφορίες γονίδιο συν-έκφραση. Πάνω από το 50% των συναχθεί ογκο-Mirs έχουν εκτεταμένη βιβλιογραφία υποστηρίζει και το γονίδιο που συν-εκφράσεις υπογραφές στόχο αυτών των miRNAs σχετίζονται σημαντικά σε πολλαπλές χαρακτηριστικά του καρκίνου. Πρόσφατες μελέτες δείχνουν επίσης ότι το γονίδιο συν-εκφράσεις μπορούν να παρέχουν σημαντικές πληροφορίες για τον εντοπισμό των «πραγματικό» γονιδίων-στόχων των miRNAs στην αντίστοιχη βιολογική διαδικασία [13], [28], τα οποία δείχνουν ότι τα γονίδια-στόχους επικαλύπτονται με τις εμπλουτισμένες υπογραφές συν-έκφραση είναι πιο πιθανό οι πραγματικοί στόχοι στον καρκίνο. Παρά το γεγονός ότι miRHiC βελτίωσε την ευαισθησία για την εξαγωγή συμπερασμάτων για την ογκο-Mirs και διαταραγμένο δίκτυα στόχο τους, μερικά γνωστά ογκο-Mirs, όπως miR-126 στον καρκίνο του πνεύμονα και miR-122 στο ηπατοκυτταρικό καρκίνωμα, είχαν χαθεί. Αυτές οι χαμένες υποθέσεις προτείνουν ότι πρέπει να αναπτυχθούν για την αναγνώριση του ογκο-Mirs του οποίου τον ρυθμιστικό δίκτυα δεν μπορεί να εξηγηθεί από τις εμπλουτισμοί του γονιδίου-στόχου σε διαφορική υπογραφές γονιδιακής έκφρασης άλλων υπολογιστικών μοντέλων.

Τα μήκη των 3′-UTRs είναι έντονα συσχετίζεται με τον αριθμό των στοχευμένων miRNAs και τις βαθμολογίες πλαίσιο. Τα εμπλουτισμένα υπογραφές μπορούν σημαντικά να μεροληπτεί σε αυτά με τα πλέον 3′-UTRs. Κατά τη χρήση της δοκιμής υπερ-γεωμετρία για την ανάλυση των εμπλουτισμούς συνόλων γονιδίου στόχου miRNA, βρήκαμε ότι οι υπογραφές στο στόχαστρο των συναχθεί miRNAs έχουν πολύ μεγαλύτερη μέση μήκη 3′-UTRs. Ωστόσο, όπως FAME [6], miRHiC χρησιμοποίησαν τη μέθοδο διμερούς γραφήματος με βάση μετάθεση, η οποία μπορεί να μειώσει σε μεγάλο βαθμό αυτή την προκατάληψη: ο μέσος όρος των μηκών των 3′-UTRs των γονιδίων στις υπογραφές στόχο των συναχθεί ογκο-Mirs είναι 1314 nt και 1449 nt για τα σύνολα δεδομένων LUC και HCC, αντίστοιχα, όχι περισσότερο από αυτά τα μήκη των διαφορικά εκφρασμένων γονιδίων (1424 nt και 1470 nt, αντίστοιχα).

miRHiC παρέχει μια γενική στρατηγική για να αναλύσει τους κανονισμούς miRNA χρησιμοποιώντας ιεραρχική υπογραφές . Διαφορετικές ιεραρχικές μέθοδοι ομαδοποίησης μπορεί να χρησιμοποιηθεί για να πάρει τις ιεραρχικές υπογραφές γονίδιο συν-έκφραση. Εκτός από το γονίδιο συν-έκφραση, οι λειτουργικές και ρυθμιστικές αλληλεπιδράσεις μεταξύ γονιδίων (όπως αλληλεπιδράσεις πρωτεΐνης-πρωτεΐνης, μεταγραφική νομοθεσία και βιβλιογραφία συν-περιστατικών) μπορούν περαιτέρω να ενσωματωθούν να καθορίσει τις ιεραρχικές υπογραφές γονιδίου. Εμείς θα δοκιμάσει συνεχώς τη στρατηγική miRHiC χρησιμοποιώντας διαφορετικά είδη εφαρμογών.

Για να πάρετε την καλύτερη σύνολα ελέγχου των συνόλων γονιδίου-στόχου miRNA, miRHiC χρησιμοποίησε το διμερούς γραφήματος με βάση μετάθεση. Αλλά αυτή η μέθοδος μετάθεση είναι χρονοβόρα. Επίσης, το υπολογιστικό φορτίο είναι υψηλό για τον υπολογισμό των εμπειρικών ρ-τιμές σε μια ένθετη τρόπο σε ολόκληρη την ιεραρχική υπογραφές γονίδιο συν-έκφρασης. Σκοπεύουμε να αναπτύξουμε γρηγορότερα αλγόριθμο για να μειωθούν οι περιττές υπολογισμοί για την εκτίμηση των p-τιμές στο μέλλον.

Υποστήριξη Πληροφορίες

Πίνακα S1.

Τα λεπτομερή αποτελέσματα των miRHiC, GSEA, HG-test, miRDeG και miRKM

doi:. 10.1371 /journal.pone.0081032.s001

(XLSX)

Ευχαριστίες

ευχαριστούμε τον Δρ Xiaotu Ma και τον καθηγητή Yanda Li για εκτενείς συζητήσεις. Ευχαριστούμε Rui Fu και Chao ίδιος για την ανάπτυξη λογισμικού και την επικύρωση.

You must be logged into post a comment.