PLoS One: Ο εντοπισμός του καρκίνου Ειδικά Λειτουργικά Σχετικές miRNAs από Gene Expression και miRNA-to-Gene Δίκτυα χρήση κανονικοποιημένης Regression


Αφηρημένο

Ο εντοπισμός microRNA υπογραφές για τους διάφορους τύπους και υποτύπους του καρκίνου μπορεί να οδηγήσει σε βελτιωμένη ανίχνευση, το χαρακτηρισμό και την κατανόηση του καρκίνου και μας κινούνται προς πιο εξατομικευμένες στρατηγικές θεραπείας. Ωστόσο, χρησιμοποιώντας διαφορική έκφραση microRNA του (όγκου έναντι φυσιολογικό) για να καθορίσουν αυτές τις υπογραφές μπορεί να οδηγήσει σε ανακριβή προβλέψεις και χαμηλή επεξηγηματικότητας λόγω της θορυβώδους φύσης των δεδομένων έκφρασης miRNA. Παρουσιάζουμε μια μέθοδο για την επιλογή των βιολογικά ενεργών microRNAs χρησιμοποιώντας δεδομένα γονιδιακής έκφρασης και microRNA-προς-γονίδιο δίκτυο αλληλεπίδρασης. Η μέθοδος μας βασίζεται σε μια γραμμική παλινδρόμηση με ελαστικό δίχτυ νομιμοποίησης. Οι προσομοιώσεις μας δείχνουν ότι, με τη μέθοδό μας, οι δραστικές miRNAs μπορούν να ανιχνευθούν με μεγάλη ακρίβεια και η προσέγγισή μας είναι ισχυρή σε υψηλά επίπεδα θορύβου και πληροφορίες που λείπουν. Επιπλέον, τα αποτελέσματα μας σε πραγματικά δεδομένα για το γλοιοβλάστωμα και του καρκίνου του προστάτη επιβεβαιωθεί από μετρήσεις έκφραση microRNA. Η μέθοδός μας οδηγεί στην επιλογή των δυνητικά λειτουργικά σημαντικό microRNAs. Οι ενώσεις του μερικά από τα εντοπιστεί miRNAs μας με τους μηχανισμούς του καρκίνου έχουν ήδη επιβεβαιωθεί και σε άλλες μελέτες (υποξία που σχετίζονται με HSA-mir-210 και την απόπτωση που σχετίζονται με HSA-mir-296-5p). Έχουμε επίσης εντοπίσει πρόσθετα miRNAs που δεν είχαν προηγουμένως μελετηθεί στο πλαίσιο του καρκίνου, αλλά είναι συνεκτικά προέβλεψε ως ενεργά με τη μέθοδό μας και μπορεί να απαιτούν περαιτέρω διερεύνηση. Ο κώδικας είναι διαθέσιμος στο Matlab και R και μπορείτε να το κατεβάσετε σε https://www.cs.toronto.edu/goldenberg/Anna_Goldenberg/Current_Research.html

Παράθεση:. Mezlini AM, Wang Β, Deshwar Α, Morris Q, Goldenberg Α (2013) Προσδιορισμός του καρκίνου Ειδικά Λειτουργικά Σχετικές miRNAs από Gene Expression και miRNA-to-Gene Δίκτυα χρήση κανονικοποιημένης παλινδρόμησης. PLoS ONE 8 (10): e73168. doi: 10.1371 /journal.pone.0073168

Επιμέλεια: Xin Yuan-Γκουάν, το Πανεπιστήμιο του Χονγκ Κονγκ, Κίνα

Ελήφθη: 28 Μάρ 2013? Αποδεκτές: 18 του Ιούλ 2013? Δημοσιεύθηκε: 2, Οκτωβρίου 2013

Copyright: © 2013 Mezlini et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Δεν υπάρχει τρέχουσα εξωτερικές πηγές χρηματοδότησης για τη μελέτη αυτή

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

Ως εξαιρετικά διατηρημένη σημαντικό παράγοντα της μετα-μεταγραφικής ρύθμισης , οι microRNAs πιστεύεται ότι έχει σημαντικό αντίκτυπο στην έκφραση γονιδίων και ως εκ τούτου στις περισσότερες βιολογικούς μηχανισμούς και λειτουργίες. Η σχέση μεταξύ miRNAs και του καρκίνου αποτέλεσε το αντικείμενο πολλών πρόσφατων μελετών και αξιολογήσεις [1] – [4]. Η πεποίθηση ότι η αλλαγή του προφίλ miRNA δεν είναι μόνο ένας παριστάμενος συνέπεια του καρκίνου, αλλά μπορεί επίσης να έχει ενεργό ρόλο σε αυτό, ενοποιείται με αρκετές παρατηρήσεις. Κατ ‘αρχάς, miRNA δεδομένα έκφρασης παρουσιάζει συνοχή και δραστικές αλλαγές στα επίπεδα έκφρασης μεταξύ των καρκινικών ιστών και υγιείς ομολόγους τους. Δεύτερον, έχει παρατηρηθεί ότι πολλές miRNAs βρίσκονται επί του γονιδιώματος σε περιοχές που είναι επιρρεπείς σε CNVs /διαγραφές στον καρκίνο [5]. Τέλος, και το σημαντικότερο, έχουν πολλές miRNAs έχει αποδειχθεί ότι έχουν άμεση επίδραση στους μηχανισμούς σχετίζονται με τον καρκίνο, όπως η απόπτωση [6], του πολλαπλασιασμού [7], η αγγειογένεση [8] και μετάσταση [9].

Διαφορική ανάλυση του προφίλ έκφρασης miRNA στον καρκίνο vs μόνος υγιή ιστό μπορεί να οδηγήσει σε ένα μεγάλο αριθμό ψευδών θετικών λόγω της θορυβώδους φύσης των δεδομένων έκφρασης miRNA. Επιπλέον, έχουμε κακή γνώση του πόσο απόκλισης στην έκφραση ενός συγκεκριμένου miRNA μπορεί να επάγει λειτουργικά σχετικές αλλαγές στη γονιδιακή έκφραση. Είναι πιθανό ότι το προφίλ της γονιδιακής έκφρασης είναι ιδιαίτερα ευαίσθητη ακόμη και σε μικρές αλλαγές στις ποσότητες ορισμένων miRNAs », ενώ δραστικές αλλαγές σε άλλες miRNAs δεν έχουν σημαντικές επιπτώσεις στο περιβάλλον.

Οι προηγούμενες μέθοδοι για την ανίχνευση σημαντικό miRNAs στον καρκίνο κάνει μια σειρά βασικών παραδοχών. Για παράδειγμα, RegulatorInference [10] είναι μια πολύ πρόσφατη μέθοδος που έχει ως στόχο να βρει τα δραστικά miRNAs μέσω μιας προσέγγισης παλινδρόμησης. Υποθέτει σιωπηρά ότι όλα τα γονίδια που επηρεάζονται από αριθμό αντιγράφων διακυμάνσεις στο ίδιο γραμμικό τρόπο και ότι η επίδραση μιας miRNA σε ένα γονίδιο-στόχος είναι γραμμικός στον αριθμό των θέσεων δέσμευσης. Επιπλέον, RegulatorInference χρησιμοποιεί δεδομένα έκφρασης των miRNAs να προεπιλέξει δυνητικά ενεργό miRNAs, αν και αυτό το βήμα είναι προαιρετικό. Στο [11], τη γονιδιακή έκφραση, την έκφραση των miRNAs και το δίκτυο αλληλεπίδρασης γονιδίων-γονιδίου χρησιμοποιούνται για να κατασκευάσουν ένα υποθετικό σύνθετο δίκτυο επιρροής miRNA-στόχο με miRNA συντελεστές επιρροής που υπολογίζονται με βάση miRNA άμεση /έμμεση επίδραση στην γονιδίων και γονιδιακών γονίδιο σχολιασμένο αλληλεπιδράσεις.

Σε αυτή την εργασία, παρουσιάζουμε μια μέθοδο για την πρόβλεψη λειτουργικά σχετικών miRNAs από τα δεδομένα διαφορική γονιδιακή έκφραση χρησιμοποιώντας πληροφορίες αλληλεπίδραση miRNA γονιδίων και της έκφρασης του mRNA μόνο. Σε αντίθεση με τις προηγούμενες μεθόδους, δεν χρησιμοποιούμε τα δεδομένα έκφρασης των miRNAs στις προβλέψεις μας και δεν κάνουμε υποθέσεις σχετικά με το πώς διαφορετικές miRNAs, CNVs ή αλληλεπιδράσεις μπορεί να επηρεάσει διαφορετικά γονίδια. Η ιδέα είναι να επιλέξετε ένα σύνολο miRNAs υπεύθυνη για τις περισσότερες από τις αλλαγές που παρατηρούνται στην έκφραση γονιδίων που βασίζεται σε προγενέστερη γνώση ανύπαρκτη miRNA γονιδίων αλληλεπιδράσεις χωρίς επιπλέον παραδοχές σχετικά με τα πλεονεκτήματα αυτών των αλληλεπιδράσεων. Η προσέγγισή μας βασίζεται σε ένα μοντέλο παλινδρόμησης για τη διαφορική γονιδιακή έκφραση. Προσθέσαμε ένα ελαστικό δίχτυ νομιμοποίησης [12] για την αποφυγή overfitting το υψηλό επίπεδο θορύβου στα δεδομένα και επιλέξτε ένα ελάχιστο σύνολο των ενεργών miRNAs. Τα δεδομένα διαφορικής έκφρασης miRNAs χρησιμοποιείται μόνο για σκοπούς επικύρωσης. Με την έκταση της γνώσης μας, αυτή είναι η πρώτη προσέγγιση για να καθορίσει ενεργό miRNAs στον καρκίνο από τα δεδομένα γονιδιακής έκφρασης μόνο (δεν υπάρχουν στοιχεία miRNA) και ως εκ τούτου μπορούμε να αξιολογήσουμε την απόδοσή μας, χρησιμοποιώντας δεδομένα διαφορική έκφραση των miRNAs από τους ίδιους τους ασθενείς.

οι προσομοιώσεις μας δείχνουν ότι η μέθοδός μας είναι ισχυρή σε διάφορους τύπους θορύβου και των δεδομένων που λείπουν και ότι είναι σε θέση να προβλέψει τις σχετικές miRNAs εφ ‘όσον οι αλλαγές της γονιδιακής έκφρασης εισόδου είναι, τουλάχιστον, εν μέρει λόγω των miRNAs. Χρησιμοποιήσαμε τα δεδομένα μας σε 157 ασθενείς με γλοιοβλάστωμα και 111 ασθενείς με καρκίνο του προστάτη και προέβλεψε πολλά αποτελέσματα σχετικών miRNAs που επιβεβαιώθηκαν με μετρήσεις έκφρασης των miRNAs σε αυτούς τους ίδιους τους ασθενείς.

Τα αποτελέσματά μας σε πραγματικά δεδομένα προσδιορίζονται miRNAs των οποίων οι ρόλοι είχαν προηγουμένως επικυρωθεί καρκίνου, όπως mir-210 και mir-296-5p, μαζί με άλλες δυνητικά σημαντικές miRNAs: mir-1, mir-154, mir-339-3p, mir-539, mir-561, mir-607 στο γλοιοβλάστωμα και ΜΙΚ 143 *, mir-30γ-2 *, mir-330-3p, mir-526b και mir-939 στον καρκίνο του προστάτη.

Μέθοδοι

1 προ-επεξεργασία δεδομένων

Ένα μεγάλο ποσοστό της μεταβλητότητας στο γονίδιο /μετρήσεις έκφρασης των miRNAs σε διαφορετικά δείγματα όγκων οφείλεται στα διαφορετικά επίπεδα της μόλυνσης με τα υγιή κύτταρα. Τυπικά σε ένα ιστό όγκου αποτελείται από τα υγιή κύτταρα του οποίου το γονίδιο /σήμα έκφρασης miRNA θα διαταράσσουν το σήμα του καρκίνου σε διαφορετικό βαθμό για τα διάφορα δείγματα (ασθενείς).

Χρησιμοποιούμε Isopure [13] για την εκχύλιση του καθαρισμένου καρκίνος σηματοδοτούν για όλους τους ασθενείς. Αυτό δίνει μια καλύτερη συνοχή μεταξύ των ασθενών με καρκίνο και πιο ακριβή αποτελέσματα για την πρόβλεψη των miRNAs.

2 Κανονικοποιημένη διαφορικό υπολογισμό της έκφρασης

Αφού έχουμε καθαρίσει τα στοιχεία του όγκου, παίρνουμε το αρχείο καταγραφής των μετρήσεων του γονιδίου σε ασθενείς και στους μάρτυρες. Στη συνέχεια, για κάθε ασθενή υπολογίζουμε την κανονικοποιημένη διαφορικής έκφρασης για ένα γονίδιο ή ένα miRNA σύμφωνα με το [14] 🙁 1) Όπου Ε και Υ είναι αντίστοιχα η αρχική και η κανονικοποιημένη έκφραση του γονιδίου για τον ασθενή, η και m είναι αντίστοιχα ο αριθμός υγιών ελέγχων και ασθενών με καρκίνο και είναι ο μέσος όρος και η διακύμανση της έκφρασης για την εν λόγω γονιδίου στα υγιείς ελέγχους. Ο όρος τιμωρεί τα γονίδια που έχουν υψηλή διακύμανση μεταξύ των ασθενών με καρκίνο. Το ίδιο εξομάλυνση χρησιμοποιείται για τα δεδομένα miRNA να αποκτήσουν διαφορική έκφραση των miRNAs για όγκο vs υγιή δείγματα όταν χρησιμοποιούμε την έκφραση των miRNAs για σκοπούς επικύρωσης. Ενεργή miRNAs

3 Επιλογή

Έχουμε καθορίσει τον κατάλογο των δραστικών miRNAs επιλέγοντας miRNAs που θα έπρεπε να είναι ενεργό για να παρατηρούμε το πρότυπο έκφρασης του mRNA αλλαγή σε ολόκληρη την γονιδιώματος. Πιο συγκεκριμένα, το μοντέλο της αλλαγής του γονιδιώματος-ευρεία στα επίπεδα έκφρασης του mRNA ως άθροισμα της άγνωστης επιρροές miRNA. Οι επιρροές έχουν μη μηδενική εισφορά για όλες τις miRNAs που στοχεύουν ένα συγκεκριμένο γονίδιο. Χρησιμοποιούμε το δίκτυο miRNA-προς-γονίδιο για πληροφορίες γονιδίου στόχου και αντιπροσωπεύουν το ως μήτρα. Έχουμε λάβει το δίκτυο από το Ευρωπαϊκό Ινστιτούτο Βιοπληροφορικής (ww.ebi.ac.uk/enright-srv/microcosm/cgi-bin/targets/v5/download. Pl), η οποία παρέχεται ένα σύνολο γονιδίων στόχων για κάθε miRNA (711 miRNAs, 16.799 γονίδια και 470.000 στα άκρα). Αν δεν υπάρχει διακριτή επίδραση της μεταβολής της έκφρασης των miRNAs για την αλλαγή της έκφρασης των στόχων », η επίδραση εκτιμάται ότι είναι μηδενική. Οι επιρροές miRNA εκτιμάται σε κάθε ασθενή βάση. Αν η προβλεπόμενη επιρροή miRNA είναι μη μηδενική και έχει το ίδιο πρόσημο σε όλη πλειοψηφία των ασθενών, υποθέτουμε ότι η δεδομένη miRNA είναι ενεργός και μπορεί να είναι ένας σημαντικός παράγοντας για μία δεδομένη ασθένεια. Το διάγραμμα ροής για τη μέθοδο μας αποτυπώνεται στο Σχήμα 1 και η σύνθεση δίνεται παρακάτω: (2)

Μπορούμε να προβλέψουμε τις ενεργές miRNAs για κάθε ασθενή ξεχωριστά, τότε θα διερευνήσει τη συνοχή των ενεργών miRNAs σε όλη ασθενείς.

η

Matrix αλληλεπιδράσεων microRNA γονιδίων ορίζεται ως εξής: (3)

οι αρνητικές τιμές στη μήτρα δείχνουν ότι τα miRNAs συνήθως κάτω-ρύθμιση της γονιδιακής έκφρασης. Δεδομένου ότι οι πληροφορίες σχετικά με το πόσο ένα συγκεκριμένο miRNA επηρεάζει μια δεδομένη γονίδιο δεν είναι διαθέσιμη, οι συντελεστές στο διάλυμα αντιπροσωπεύουν την «επιρροή» του miRNAs στην γονιδιακή έκφραση προφίλ παρά miRNAs διαφορική έκφραση (δηλαδή κατά πόσο η μεταβολή στη γονιδιακή έκφραση του στόχοι miRNA μπορεί να αποδοθεί σε αυτό το συγκεκριμένο miRNA). δείχνει δύο πράγματα: 1) κατά πόσον miRNA ήταν ενεργός ()? και 2) με ποιο τρόπο αυτό επηρέασε την έκφραση, δηλαδή αν τα γονίδια στόχου είναι υπερ-εκφράζεται σε καρκινικό ιστό σε σύγκριση με φυσιολογικό ιστό υποδηλώνοντας ότι τα επίπεδα miRNA είχαν εξαντληθεί () ή υπο-εκφράζεται αναφέροντας την υπερβολική έκφραση του δεδομένου miRNA () .

Αν η επίδραση ενός ενεργού miRNA είναι το ίδιο πρόσημο με παρατηρείται απόκλιση miRNA έκφραση του συγκεκριμένου ασθενούς, μπορούμε να πούμε ότι η πρόβλεψη miRNA έχει επικυρωθεί από τις μετρήσεις miRNAs.

Επειδή θέλουμε για να αποφευχθεί υπερπροσαρμογής και να ενθαρρύνει τα μοντέλα με ένα μικρό αριθμό των ενεργών miRNAs (απλούστερη μοντέλα με λίγες μόνο ενεργό miRNAs είναι πιο εύκολο να ερμηνεύσει και να είναι βιολογικά πιο σχετικές), χρησιμοποιούμε ένα ελαστικό δίχτυ ποινή τύπου. Η προκύπτουσα αντικειμενική συνάρτηση για την ελαχιστοποίηση είναι: (4), όπου και οι ελαστικές καθαρά παραμέτρους, η επιλογή των παραμέτρων που συζητούνται παρακάτω. Ελαστική καθαρό πέναλτι επιλέγεται εδώ επειδή είναι σε θέση να αποφύγει μερικές από τους περιορισμούς που ενδέχεται να αντιμετωπίσετε χρησιμοποιώντας μια απλή ποινή όπως στο [10]. Για παράδειγμα, όταν έχουμε υψηλή συσχέτιση μεταβλητών (miRNAs με πολλά στόχων στο κοινό) μια ποινή θα τείνουν να επιλέξετε μία μεταβλητή στην τύχη και να αγνοήσετε τα υπόλοιπα, ενώ ελαστικό δίχτυ θα επιλέξετε όλες τις σχετικές μεταβλητές.

4 Επιλογή των παραμέτρων (cross επικύρωση)

Οι παράμετροι της ελαστικής καθαρών καθορίζουν την αραιότητας της λύσης: ο αριθμός των miRNAs που προβλέπεται να ενεργά την οδήγηση τα γονίδια διαφορική έκφραση. Για τον προσδιορισμό, χρησιμοποιήσαμε το σταυρό πλαίσιο επικύρωσης που προτείνεται στο [12] (Εφαρμογή διατίθεται σε συσκευασία glmnet R). Τα Αποδεκτά αποτελέσματα λαμβάνονται με αντιστοιχεί στην ελάχιστη πρόβλεψης σφάλματος χρησιμοποιώντας 10-πλάσια σταυρό επικύρωσης. Επιλέγοντας το υψηλότερο που αντιστοιχεί σε σφάλμα πρόβλεψης 1 τυπικό σφάλμα συν το ελάχιστο προγνωστική σφάλμα μπορεί να οδηγήσει σε πιο ακριβή αποτελέσματα σε προσομοιώσεις με χαμηλότερα επίπεδα θορύβου. Ωστόσο, συχνά δίνει υπερβολικά αραιή λύσεις, όταν το σφάλμα πρόβλεψης έχει υψηλή διακύμανση και ως εκ τούτου, χρησιμοποιούμε την ελάχιστη σύμβαση σφάλμα πρόβλεψης σε αυτές τις περιπτώσεις. Στα αποτελέσματά μας, έχουμε καθορίσει η ίδια για όλους τους ασθενείς να είναι ο μέσος όρος επιλεγμένη τιμή σε όλη ασθενείς. Για την επιλογή του επαναλάβαμε το σύνολο του πειράματος (προσομοίωση και πραγματικά δεδομένα) με διαφορετικές τιμές (0,1, 0,25, 0,5) και καμία σημαντική διαφορά παρατηρήθηκε για τις τελικές προβλεπόμενες miRNAs, έτσι θέτουμε μας να 0.25 για όλα τα πειράματα.

Αποτελέσματα

1 προσομοιώσεις και την ευρωστία στο θόρυβο

Κατ ‘αρχάς, θα δοκιμαστεί η ικανότητα της μεθόδου μας για να επιλέξετε το σωστό υποσύνολο της έκφρασης των γονιδίων-οδήγηση miRNAs μεταξύ του συνόλου όλων των miRNAs, και την ικανότητα να προσδιορίσει τις σωστές επιρροές για τις επιλεγμένες miRNAs (σημάδι στο (2)). Για να το κάνουμε αυτό, έχουμε επιλέξει τυχαία 30 miRNAs να είναι οι ενεργές miRNAs οδήγηση των αλλαγών της γονιδιακής έκφρασης και αποδίδεται μεγάλη θετική ή αρνητική μέσες τιμές έκφρασης σε αυτούς (απόλυτη τιμή ομοιόμορφα επιλέγονται από και σημάδι που λαμβάνεται με αμερόληπτη ρίψη κέρματος). Εμείς εκχωρηθεί μηδενικές μέσες τιμές για όλες τις άλλες miRNAs που δεν προσομοιώνονται ως δραστικές. Στη συνέχεια προσομοιώνεται 100 ασθενείς με προφίλ διαφορική έκφραση miRNA επικεντρώνεται γύρω από τις εν λόγω μέσες τιμές (κατανομή Gauss με δεδομένη μέση και τυπική απόκλιση 0,5). Ως αποτέλεσμα, παίρνουμε για κάθε ασθενή ένα σύνολο μετρήσεων διαφορικής έκφρασης miRNA στην οποία τα 30 miRNAs προσομοιωθεί ως δραστικό θα σταθερά εκφράζονται διαφορικά και όλα τα άλλα miRNAs θα αντιπροσωπεύει ένα θόρυβο. Τέλος, για κάθε ασθενή πολλαπλασιάσουμε τα miRNA προσομοίωση μέτρα διαφορική έκφραση από το δίκτυο αλληλεπίδρασης miRNA γονίδιο (μήτρα στην Εξίσωση 2) ​​για να ληφθεί προσομοίωση μέτρα διαφορική γονιδιακή έκφραση (Αυτό το βήμα θα αναφέρεται στη συνέχεια ως το βήμα διαφορική γονιδιακή προσομοίωσης έκφραση). Το δίκτυο που χρησιμοποιείται εδώ είναι το ίδιο με εκείνο που αναφέρεται στο τμήμα 2.3, που παράγονται από το Ευρωπαϊκό Ινστιτούτο Βιοπληροφορικής σύλληψη αλληλεπιδράσεις μεταξύ 711 miRNAs και 16.799 γονίδια, η διάμεση miRNA έχει περίπου 650 πιθανούς γονιδίων στόχων.

Ο στόχος αυτής της πειράματος είναι να δοκιμαστεί εάν το πρόβλημα μπορεί να λυθεί, παρά το γεγονός ότι τα miRNAs έχουν συχνά εκατοντάδες επικαλυπτόμενων πιθανών στόχων και ότι οι πολλαπλές miRNAs μπορεί να έχει αντίθετα αποτελέσματα επί των επιπέδων γονιδιακής έκφρασης.

Τρέξαμε χίλια προσομοιώσεις παράγουν δεδομένα ως περιγράφεται παραπάνω. Βρήκαμε ότι σε περιπτώσεις, ήμασταν σε θέση να προσδιορίσει το ακριβές τυχαία επιλεγμένο υποσύνολο των miRNAs οδήγηση τις αλλαγές στη γονιδιακή έκφραση και προβλέψετε σωστά όλα τα σήματα επιρροή. Στην πράξη, αυτό σημαίνει ότι η μέθοδος μας δουλεύει σωστά για κάθε δείγμα σε πραγματικά δεδομένα, όπου διαφορική έκφραση miRNAs είναι υπεύθυνη για ένα σχετικά υψηλό ποσοστό της διαφορικής έκφρασης του mRNA. Αυτό σημαίνει επίσης ότι η συνέπεια με την οποία ομάδες γονιδίων είναι πάνω /κάτω εκφράζεται είναι ένα αρκετά ισχυρό σήμα για την ανίχνευση ενεργών miRNAs ακόμα κι αν διαφορετικά miRNAs μπορεί να έχει αντίθετα αποτελέσματα σε κοινά γονίδια-στόχους.

Στη συνέχεια ελέγξαμε την ευρωστία του μεθόδους μας για τους διάφορους τύπους θορύβου. Εξετάσαμε την επίδραση των τεσσάρων τύπων του θορύβου που θα μπορούσε να κάνει αυτό το πρόβλημα πιο δύσκολο να επιλυθούν:

Εμείς αντιπροσώπευαν τις διαρθρωτικές θορύβου (ψευδώς αρνητικές αλληλεπιδράσεις) στο δίκτυο miRNA-γονιδίου, με την προσθήκη τυχαία άκρες πριν από την προσομοίωση διαφορική γονιδιακή έκφραση και στη συνέχεια, χρησιμοποιώντας το αρχικό δίκτυο miRNA-γονίδιο για τις προβλέψεις, με αποτέλεσμα κάποιες από τις πληροφορίες miRNA επιρροή που χρησιμοποιούνται για την παραγωγή των δεδομένων έλειπε κατά το στάδιο πρόβλεψης.

Εμείς αντιπροσώπευαν εσφαλμένη ακμές (ψευδώς θετικές αλληλεπιδράσεις) στο miRNA γονιδίων δίκτυο αφαιρώντας τυχαία άκρες πριν από την προσομοίωση διαφορική γονιδιακή έκφραση. Το αρχικό δίκτυο miRNA γονιδίων εξακολουθεί να χρησιμοποιείται στις προβλέψεις.

Θα προσομοίωση της επίδρασης των μη παρατηρούμενων αλληλεπιδράσεων γονιδίων-γονιδίου για την έκφραση των γονιδίων (χρησιμοποιούμε το δίκτυο αλληλεπίδρασης πρωτεΐνης-πρωτεΐνης).

αυξάνουν τα επίπεδα του θορύβου στα δεδομένα έκφρασης (με την προσθήκη θορύβου Gauss με 0-μέση τιμή και διακύμανση ανάλογο με τα επίπεδα έκφρασης) να λογοδοτήσει για άλλους μηχανισμούς μεταβολή γονιδιακής έκφρασης σε καρκίνο, όπως ο αριθμός αντιγράφων παραλλαγές.

η

το Σχήμα 2 δείχνει την επίδραση της μοντελοποίησης λείπουν /ανακριβείς πληροφορίες στο δίκτυο miRNA-γονιδίου. Παρατηρούμε ότι η μέθοδος είναι σε θέση να ανιχνεύσει περίπου το σωστό υποσύνολο των miRNAs, ακόμη και όταν υποθέτουμε των miRNA γονιδίων σχολιασμένη αλληλεπιδράσεις είναι λάθος (αφαιρούμε των ακμών στο γράφημα του δικτύου κατά τη διάρκεια της έκφρασης βήμα προσομοίωσης γονίδιο) ή όταν υποθέτουμε την σχολιασμοί περιέχουν μόνο το ήμισυ των αλληλεπιδράσεων σε πραγματικό miRNA γονιδίων (προσθέτουμε ακμές κατά την έκφραση βήμα προσομοίωσης γονιδίου). Υπάρχουν ενδείξεις ότι η μέθοδος είναι πιο ισχυρή σε πληροφορίες που λείπουν (Ψευδώς αρνητικό άκρα) από ό, τι σε λανθασμένες πληροφορίες (Ψευδώς θετικά άκρα), που σημαίνει ότι είναι προτιμότερο να χρησιμοποιήσει συντηρητική δίκτυα σε αυτό το πλαίσιο. Το Σχήμα 3, δείχνει την ευρωστία της μεθόδου σε υψηλά επίπεδα θορύβου στη γονιδιακή έκφραση. Ο θόρυβος της γονιδιακής έκφρασης είναι παραμετροποιημένη από τη μεταβλητή που ελέγχει την ισχύ του θορύβου: για κάθε γονίδιο, η διακύμανση του τελευταίου τύπου του θορύβου πολλαπλασιάζεται με το μέσο επίπεδο της έκφρασης (δίνει έναν τύπο διακύμανση Poisson). Τέλος, ο θόρυβος αλληλεπίδραση γονίδιο-γονίδιο ελέγχεται από τη μεταβλητή διάχυση ως εξής: (5)

(Α) Ευαισθησία και (Β) η ακρίβεια της μεθόδου στην πρόβλεψη των miRNAs έκφρασης των γονιδίων-οδήγηση όταν μεταβάλλοντας οι αναλογίες εσφαλμένων άκρα και λείπουν τα άκρα του δικτύου αλληλεπιδράσεων miRNA-Gene (διαγραφή άκρες /τοποθετήστε νέα άκρα). Όλα τα miRNA επίσης προβλέπεται να έχει τη σωστή κατεύθυνση της επιρροής (κατασταλτικών vs επίδραση ογκογονίδιο).

Η

(Α) Ευαισθησία και (Β) η ακρίβεια της μεθόδου στην πρόβλεψη των γονιδίων-έκφραση-οδήγηση miRNAs όταν μεταβάλλοντας το επίπεδο του θορύβου γονίδιο-αλληλεπιδράσεων (μέσω της παραμέτρου διάχυσης) και την ένταση του θορύβου στο επίπεδο διαφορική γονιδιακή έκφραση (μέσω της μεταβλητής). Όλα προέβλεψε miRNAs έχουν τις σωστές ενδείξεις επιρροής.

Η

Πού είναι ο φορέας διαφορική γονιδιακή έκφραση, είναι το γονίδιο γονίδιο άμεση μήτρα αλληλεπίδραση και είναι η μήτρα με τις αλληλεπιδράσεις γονιδίων-γονιδίου δεύτερης τάξης (δεύτερο γείτονες σειρά το γονίδιο γονίδιο εκπροσώπηση δίκτυο αλληλεπιδράσεων). Αυτό σημαίνει ότι μια έκφραση του γονιδίου επηρεάζει σε κάποιο βαθμό την έκφραση των γονιδίων που αλληλεπιδρούν (άμεση γείτονες) και σε μικρότερο βαθμό τα γονίδια αλληλεπιδρούν με τους άμεσους γείτονές (δεύτερης τάξης γείτονες). Το δίκτυο αλληλεπίδραση γονιδίων-γονίδιο που χρησιμοποιείται εδώ είναι ένα υποσύνολο της συνδυασμένης ανθρώπινου δικτύου κατεβάσετε από την ιστοσελίδα Biogrid. Θα καταγράφει πληροφορίες για τα 16.799 γονίδια που υπάρχουν στο δίκτυο miRNA γονιδίων μας και περιέχει 85.590 άκρες. Το Σχήμα 3 δείχνει ότι η ικανότητα της μεθόδου μας για να ανακτήσει τις πραγματικές miRNAs είναι υψηλή ακόμη και παρουσία άλλων επιρροών, όπως επηρεάζει αλληλεπιδρώντων γονιδίων, τα οποία το μοντέλο μας δεν αντιπροσωπεύουν. αποτελέσματα της προσομοίωσης μας δείχνουν ότι η μέθοδός μας είναι ισχυρή σε διάφορα είδη θορύβου.

2 Ανάλυση των δεδομένων για τον καρκίνο

κριτήρια

2.1 Αξιολόγηση.

Με τη μέθοδό μας, είχαμε προβλέψει η λειτουργική σχετικών miRNAs και η επίδρασή τους στην έκφραση των γονιδίων από τα δεδομένα γονιδιακής έκφρασης διαφορική πολύμορφο γλοιοβλάστωμα και του προστάτη. Δεδομένου ότι οι προβλέψεις μας είναι σε μια βάση ανά-ασθενή, επιλέγουμε εκείνα τα miRNAs που είχαν προβλεφθεί ενεργός () με την ίδια κατεύθυνση επιρροής σε περισσότερους από των ασθενών. Αυτά τα miRNAs είναι πιο πιθανό να αντικατοπτρίζει μια πραγματική βιολογική κοινό μηχανισμό στον καρκίνο, δεδομένου ότι είχαν προβλεφθεί με συνέπεια ως ενεργά με τη μέθοδο μας σε ένα μεγάλο αριθμό ανεξάρτητων ασθενών. Στη συνέχεια θα εξετάσουμε τις μετρήσεις έκφραση miRNAs για τους ίδιους τους ασθενείς. Αν διαφορική έκφραση των ενεργών miRNAs »έχουν τα ίδια συμπτώματα όπως προβλέπεται επιρροές τους σε περισσότερες από των ασθενών, θεωρούμε τους επικυρώνονται με μετρήσεις των miRNAs.

Στα δεδομένα διαφορική έκφραση των miRNAs, μερικοί miRNAs είναι συνεκτικά υπερ- ή υπο-εκφράζεται σε όλη ασθενείς και κάποιες άλλες δεν είναι. Εκτιμούμε τη σημασία της ενεργού miRNA μας καθορίζεται από τον υπολογισμό του p-value:. Η πιθανότητα που έχει ως καλή ή καλύτερα αποτελέσματα επικύρωσης από τη μέθοδο μας, εάν οι προβλέψεις miRNAs ήταν τυχαία

Υπολογίζουμε ότι η τιμή p από την πρώτη επιλέγοντας ένα τυχαίο υποσύνολο των miRNAs από τα δεδομένα, με το σετ μέγεθος ίσο με τον αριθμό των miRNAs προβλεφθεί ως ενεργός με τη μέθοδο μας. Στη συνέχεια, μπορούμε να εκχωρήσετε τυχαία την κατεύθυνση της επιρροής (πινακίδες) σε αυτά τα επιλεγμένα miRNAs. Τέλος, εκτιμούμε το ποσοστό αυτών των τυχαίων προβλέψεις που έχουν επικυρωθεί από τις μετρήσεις των miRNAs χρησιμοποιώντας τα δεδομένα miRNA που αντιστοιχούν στις ίδιες μελετηθεί ασθενείς (α miRNA επικυρώνεται αν είναι συνεκτικά υπερεκφράζεται /υπο-εκφράζεται όταν σημάδι επιπτώσεις της είναι αντίστοιχα θετική /αρνητικός). Επαναλαμβάνουμε το πείραμα αυτό 10.000 φορές. Η τιμή p είναι το ποσοστό των τυχαίων πειραμάτων με υψηλότερο ποσοστό επικύρωσης από την πρόβλεψη μεθόδου μας. Ένα μικρό αρκετά ρ-τιμή υποδεικνύει ότι οι miRNAs επιλέγονται με τη μέθοδο μας δεν ήταν τυχαία και ότι πιθανόν υπάρχει μια λειτουργική σημασία σε σχέση με τον καρκίνο που υποδεικνύεται από το συνοχή στην έκφραση miRNA /γονιδίου διαμέσου των ασθενών.

2,2 γλοιοβλάστωμα .

Τα δεδομένα γονιδιακής έκφρασης γλοιοβλαστώματος παρήχθη από Broad Institute χρησιμοποιώντας το Affymetrix HT_HG-U133A πειραματικό σχεδιασμό. Περιέχει 157 περιπτώσεις όγκων και 10 ελέγχους. Τα στοιχεία αυτά σε συνδυασμό με την έκφραση των miRNAs που χρησιμοποιούμε για την επικύρωση είναι διαθέσιμα στην ιστοσελίδα TCGA.

Μετά τον καθαρισμό των δεδομένων γονιδιακής έκφρασης (βλέπε τμήμα 2.1) και μετατρέποντάς το σε κανονικοποιημένη διαφορική έκφραση (βλέπε ενότητα 2.2), προβλέψαμε 11 miRNAs ενεργά σε περισσότερες από των ασθενών. Από αυτές τις 11 miRNAs προβλέψεις, 7 επικυρώθηκαν από το διαθέσιμο έκφρασης των miRNAs (επαληθεύεται σε περισσότερες από τις περιπτώσεις) και 2 άλλοι ελέγχθηκαν σε περισσότερες από τις περιπτώσεις. Αυτά τα αποτελέσματα αντιστοιχούν σε μια τιμή p 0,0005 (βλέπε Ενότητα 3.2.1 για περισσότερες λεπτομέρειες). Το Σχήμα 4 δείχνει τα miRNAs συνεκτικά προβλεφθεί διαμέσου των ασθενών. Μεταξύ των miRNAs που είχαν προβλεφθεί και να επιβεβαιωθεί, βρήκαμε mir-210, mir-339-3p, mir-561, mir-1, mir-154, mir-539, mir-607.

Το ροζ είναι για υπερεκφράζεται miRNAs και το μπλε είναι για υπο-εκφράζεται. Κάθε στήλη αντιπροσωπεύει έναν ασθενή και κάθε σειρά, μία miRNA.

Η

miR-210 επάγεται από την υποξία και στο παρελθόν εντοπιστεί ως ανεξάρτητος δείκτης για διάφορους καρκίνους (μαστού [15], το πάγκρεας [16], το κεφάλι και του λαιμού [17]). Είναι, επίσης, αναφέρεται ως ρυθμιστής για την έκφραση του γονιδίου Normoxic η οποία εμπλέκεται στην έναρξη του όγκου [18]. Εμείς προέβλεψε ως ενεργό και επιβεβαίωσε δραστηριότητα υπερέκφραση του χρησιμοποιώντας παρατηρείται δεδομένων σε γλοιοβλάστωμα.

Επίσης, προέβλεψε και επιβεβαίωσε την υπερέκφραση του mir-339-3p, και το υπό-έκφραση mir-1, mir-154, mir-539, mir-561 και mir-607. Προς το παρόν δεν υπάρχει καμία γνώση για τις λειτουργικές τους ρόλους αυτών των miRNAs στον καρκίνο. Περαιτέρω πειράματα επικύρωσης που απαιτούνται για την καλύτερη κατανόηση της λειτουργίας αυτών των miRNA σε γλοιοβλάστωμα. mir-548b-5P, mir-548c-3ρ, mir-548c-5P επίσης προβλέψει σχεδόν σε όλους τους ασθενείς, ακόμη και αν τα σύνολα γονίδιο στόχο τους ήταν πολύ διαφορετικά, αλλά επικυρώθηκαν μόνο σε αντίστοιχα, των περιπτώσεων.

καρκίνο

2.3 του προστάτη.

Τα στοιχεία καρκίνου του προστάτη παρήχθη από το Memorial Sloan-Kettering Cancer Center (MSKCC) και είναι διαθέσιμο από GEO υπό τον αριθμό ένταξης GSE21032. Το δεδομένων περιέχει πληροφορίες για 111 ασθενείς και 28 ελέγχους για τα οποία είναι διαθέσιμα τόσο το γονίδιο και τα δεδομένα έκφρασης των miRNAs.

Μετά την προεπεξεργασία των δεδομένων γονιδιακής έκφρασης για να ληφθεί το καθαρισμένο ομαλοποιημένη διαφορική έκφραση και τη χρήση της μεθόδου μας για να προβλέψουμε σύνολα των ενεργών miRNAs για κάθε ασθενή, επιλέξαμε 10 miRNAs: 7 από αυτά τα miRNAs επικυρώθηκαν με τα παρατηρούμενα δεδομένα έκφρασης των miRNAs σε περισσότερους από τους ασθενείς, επιβεβαιώνοντας την κατεύθυνση της επιρροής miRNA. Μια άλλη miRNA: mir-574-5p είχε επικυρωθεί το των ασθενών. Αυτά τα αποτελέσματα αντιστοιχούν σε μια στατιστικά σημαντική p-τιμή.

Μεταξύ των miRNAs που είχαν προβλεφθεί και να επιβεβαιωθεί, mir-210 ήταν υπερ-εκφράζεται παρόμοια με τα ευρήματά μας στα δεδομένα γλοιοβλάστωμα, και mir-296-5p ( υπερεκφράζεται) είχε προηγουμένως συσχετίζονται με την απόπτωση του ανεξάρτητου από ανδρογόνο καρκίνου του προστάτη κύτταρα [19] Mir-143 * προβλέφθηκε και επιβεβαιώθηκε από τα παρατηρηθέντα δεδομένα ως υπο-εκφράζεται σε όλους τους ασθενείς, αλλά δεν είχε προηγουμένως αναφερθεί ως ένας δείκτης του καρκίνου στη βιβλιογραφία . Ομοίως mir-30γ-2 *, mir-526b, mir-330-3p και mir-939 (όλο το προβλέψει και να επιβεβαιωθεί ως υπερ-εκφράζεται) ήταν σποραδικά αναφέρονται ως διαφορικά εκφρασμένων miRNAs στη λογοτεχνία του καρκίνου, αλλά χωρίς στερεά πειραματικές αποδείξεις για τον χαρακτηρισμό τους ακριβής ρόλους σε καρκίνους ακόμα.

Τέλος, Mir-569 και Mir-607 είχαν προβλεφθεί στην πλειονότητα τόσο καρκίνου του προστάτη και ασθενείς γλοιοβλαστώματος αλλά επικυρώθηκαν μόνο σε γλοιοβλάστωμα επειδή δεν μετρήθηκαν στα δεδομένα του καρκίνου του προστάτη. Ομοίως, mir-574-5p είχε προβλεφθεί σε δύο σύνολα δεδομένων, αλλά οι μετρήσεις του δεν ήταν διαθέσιμα για τους ασθενείς γλοιοβλάστωμα, ως εκ τούτου, επιβεβαιώθηκε μόνο στον καρκίνο του προστάτη.

Η γενική σύνοψη των αποτελεσμάτων μας με τα υψηλότερα ποσοστά επικύρωση στον καρκίνο του προστάτη και γλοιοβλάστωμα περιγράφονται στο Σχήμα 4.

Συζήτηση

στην εργασία αυτή παρουσιάσαμε την πρώτη μέθοδο που προβλέπει ενεργό miRNAs στον καρκίνο από τα δεδομένα miRNA γονιδίων κανονιστικού δικτύου και την έκφραση του mRNA χωρίς να στηρίζονται σε η έκφραση miRNA ίδια. Χρησιμοποιούμε ελαστικές-net-τακτοποιηθεί πλαίσια της παλινδρόμησης, για να κάνει τις προβλέψεις σθεναρά. Δεδομένου ότι τα δεδομένα έκφρασης του mRNA είναι συχνά άμεσα διαθέσιμος, η μέθοδος μας μπορεί να χρησιμοποιηθεί για να καθοδηγήσει την ανάλυση των miRNAs ιεραρχώντας τους για μελλοντικά πειράματα. Εμείς επικυρωμένης μεθόδου μας χρησιμοποιώντας τόσο προσομοίωσης και πραγματικά δεδομένα σε συνδυασμό με τις μετρήσεις της έκφρασης των miRNAs να επιβεβαιώσουν τα ευρήματά μας. Οι προσομοιώσεις μας έδειξαν ότι η μέθοδος μας εντοπίζει δυναμικά ενεργό miRNAs και την κατεύθυνση της επιρροής τους (καταστολείς ή ογκογονίδια) στα παγκόσμια πρότυπα γονιδιακής έκφρασης. Τα αποτελέσματά μας σε πραγματικά δεδομένα έδειξαν δυνητικά σημαντικό miRNAs στο γλοιοβλάστωμα και του προστάτη, μερικές από τις οποίες έχουν ήδη επικυρωθεί σε προηγούμενες μελέτες (Η υποξία που σχετίζονται mir-210 και η απόπτωση προστάτη καρκινικών κυττάρων που σχετίζονται με mir-296-5p) και άλλοι για τους οποίους ο ακριβής ρόλο στον καρκίνο μένει να καθοριστεί.

μελλοντικές βελτιώσεις της μεθόδου μας είναι στενά συνδεδεμένη με την καλύτερη μοντελοποίηση του θορύβου στα δεδομένα. Για παράδειγμα, λαμβάνοντας υπόψη τις αλλαγές έκφρασης που προκαλούνται από χρωμοσωμικές παραλλαγές ή να αντιγράψετε παραλλαγές αριθμό στον καρκίνο του θα βοηθήσει να απομονωθεί η επίδραση των λειτουργικά σχετικών miRNAs, ειδικά αν ο αντίκτυπος αυτών των μεταβολών στη γονιδιακή έκφραση είναι επακριβώς κατανοητός και διαμορφώθηκε στο μέλλον. Καλύτερα αποτελέσματα μπορούν επίσης να επιτευχθούν αν έχουμε μια σταθερή μοντέλο των αλληλεπιδράσεων γονιδίων-γονίδιο που μπορεί να αλλάξει την έκφραση ανεξάρτητα από τα miRNAs.

You must be logged into post a comment.