PLoS One: Ολοκληρωμένη ανάλυση της κανονικής Long διαγονιδιακές μη-κωδικοποίησης RNAs στον καρκίνο του προστάτη


Abstract

Πρόσφατα, μεγάλοι αριθμοί κανονικών ανθρώπινων ιστών έχουν προφίλ για μη-κωδικοποίησης RNAs και πάνω από δεκατέσσερις χιλιάδες μακράς διαγονιδιακή μη κωδικοποιητική RNAs (lincRNAs) βρέθηκε εκφράζεται σε φυσιολογικούς ανθρώπινους ιστούς. Οι ακόμα να καθοριστούν οι λειτουργικούς ρόλους των συνήθων αυτών lincRNAs (nlincRNAs) στη ρύθμιση των γονιδίων που κωδικοποιούν πρωτεΐνες υπό κανονικές συνθήκες και ασθένεια βιολογία. Εδώ, έχουμε προφίλ δύο RNA-seq σύνολα δεδομένων συμπεριλαμβανομένου του καρκίνου και συμφωνημένα μη νεοπλαστικά ιστοί από 12 άτομα από διαφορετικά δημογραφία τόσο κωδικοποίησης γονιδίων και nlincRNAs. Βρίσκουμε 130 nlincRNAs ρυθμίζεται σημαντικά σε καρκίνο, με 127 ρυθμίζονται προς την ίδια κατεύθυνση στα δύο σύνολα δεδομένων. Είναι ενδιαφέρον ότι, σύμφωνα με την Illumina Body Χάρτης, σημαντικός αριθμός από αυτές τις nlincRNAs εμφανίζουν έκφραση αρχική μηδενική σε φυσιολογικούς ιστούς προστάτη αλλά είναι ειδικά για άλλους ιστούς όπως του θυρεοειδούς, των νεφρών, του ήπατος και των όρχεων. Ένας αριθμός των μετοχών τόπους οργανωμένη nlincRNAs με κωδικοποίηση γονίδια, τα οποία είναι είτε συν-ρυθμίζονται ή αντίθετα οργανωμένη σε όλα τα δείγματα καρκίνου που μελετήθηκαν εδώ. Για παράδειγμα, σε όλα τα δείγματα του καρκίνου i) την nlincRNA, TCONS_00029157, και ένα γειτονικό παράγοντας καταστολής όγκου, SIK1, είναι και τα δύο κάτω ρυθμίζονται? ii) διάφορα θυρεοειδούς ειδική nlincRNAs στη γειτονιά του θυρεοειδούς-ειδικό γονίδιο ΤΡΟ, είναι και οι δύο επάνω ρυθμισμένη? και iii) την TCONS_00010581, μια ισομορφή HEIH, ρυθμίζεται προς τα κάτω, ενώ το γειτονικό γονίδιο ΕΖΗ2 είναι επάνω ρυθμισμένο στον καρκίνο. Αρκετές nlincRNAs από καρκίνο του προστάτη που σχετίζεται χρωμοσωμικό τόπο, 8q24, είναι επάνω ρυθμισμένη σε καρκίνο μαζί με άλλα συναφή γονίδια του καρκίνου του προστάτη είναι γνωστή συμπεριλαμβανομένων pCAT-1, PVT1, και pCAT-92. Παρατηρούμε ότι υπάρχει σημαντική κλίση προς τα πάνω ρύθμιση της nlincRNAs με τόσο υψηλές όσο 118 από 127 up-ρυθμίζονται σε καρκίνο, αν και ο κανονισμός της κωδικοποίησης γονιδίων λοξή προς τα κάτω ρύθμιση. Λαμβάνοντας υπόψη ότι όλες οι αναφερθεί καρκίνου που σχετίζονται lincRNAs (clincRNAs) ωθείται προς τα πάνω ρύθμιση, καταλήγουμε στο συμπέρασμα ότι αυτή η προκατάληψη μπορεί να είναι λειτουργικά σχετικές

Παράθεση:. Bawa P, Zackaria S, M Verma, Gupta S, Srivatsan R, Chaudhary Β, et al. (2015) Ολοκληρωμένη ανάλυση της κανονικής Long διαγονιδιακές μη-κωδικοποίησης RNAs στον καρκίνο του προστάτη. PLoS ONE 10 (5): e0122143. doi: 10.1371 /journal.pone.0122143

Ακαδημαϊκό Επιμέλεια: Xia Li, Χαρμπίν Ιατρικό Πανεπιστήμιο, ΚΙΝΑ

Ελήφθη: 13 Νοεμβρίου του 2014? Αποδεκτές: 10η Φεβρουαρίου του 2015? Δημοσιεύθηκε: May 1, 2015

Copyright: © 2015 Bawa et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Δεδομένα Διαθεσιμότητα: Όλα τα σχετικά δεδομένα είναι εντός του Υποστηρίζοντας αρχεία πληροφοριών του χαρτιού και

Χρηματοδότηση:. η μελέτη χρηματοδοτήθηκε από το Τμήμα Βιοτεχνολογίας, η κυβέρνηση της Ινδίας? Τμήμα Πληροφορικής, Κυβέρνηση της Ινδίας? DST-γροθιά, Κυβέρνηση της Ινδίας? και του Τμήματος Πληροφορικής, Κυβέρνηση της Karnataka. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

Η υπόσχεση του Πρόγραμμα του Ανθρώπινου Γονιδιώματος ήταν να παραδώσει τις εκατοντάδες χιλιάδες των πρωτεϊνών για χρήση ως στόχοι φαρμάκων. Ωστόσο, προς έκπληξη όλων, μεγάλης κλίμακας προσπάθειες σχολιασμό από μεγάλες κοινοπραξίες, όπως είναι το έργο ΚΩΔΙΚΟΠΟΙΗΣΗ [1], η οποία εκδόθηκε δεκάδες χιλιάδες φαρμακευτικών στόχων της ένα διαφορετικό είδος? μη-κωδικοποίησης RNAs. Είναι τώρα γνωστό ότι η πλειοψηφία των ανθρώπινου γονιδιώματος μεταγράφεται, ακόμη και αν μόνο ένα μικρό κλάσμα μεταφράζεται σε πρωτεΐνες. Είναι πλέον κατανοητό ότι ένας μεγάλος αριθμός των μη-κωδικοποίησης RNAs, τόσο μακρύ και κοντό, παίζουν κρίσιμους ρόλους στο συγκρότημα ρύθμιση του σχετικά μικρού αριθμού κωδικοποίησης πρωτεϊνών που είναι απαραίτητες για τη ζωή.

Από τους διαφορετικούς τύπους μη-κωδικοποίησης RNAs, μακρύ διαγονιδιακές μη-κωδικοποίησης RNAs (lincRNA) είναι ελκυστικά επειδή μπορούν εύκολα να ανακαλυφθεί με υψηλή εμπιστοσύνη από τα υπάρχοντα RNA-επόμενα σύνολα δεδομένων και συσχετίζεται με τις πληροφορίες της γονιδιακής έκφρασης από το ίδιο σύνολο δεδομένων με τη χρήση των υφιστάμενων εργαλείων βιοπληροφορικής. Πιο πρόσφατα, δεκάδες χιλιάδες lincRNAs έχουν ανακαλυφθεί από RNA-seq σύνολα δεδομένων από διαφορετικές φυσιολογικούς ανθρώπινους ιστούς, εδώ για να αναφέρεται nlincRNAs, όπως ο χάρτης Illumina Φορέα [2]. δεν έχουν ακόμη καθοριστεί οι λειτουργικές τους ρόλους αυτών των nlincRNAs.

Παρά το γεγονός ότι lincRNAs είναι νέα για τη βιολογία του καρκίνου και των μοριακών μηχανισμών τους ακόμα στα σπάργανα, αρκετές ανασκοπήσεις έχουν ήδη εμφανιστεί στη βιβλιογραφία λεπτομερώς την πρόοδο σε αυτό το περιοχή μέχρι σήμερα [3] [4]. Από τους περίπου 60+ lincRNAs που έχει αποδειχθεί ότι συνδέεται με διάφορους τύπους καρκίνου, πλειοψηφία τους τα επάνω ρυθμισμένη σε καρκίνο [3] [4] και μόνο λίγα lincRNAs φαίνεται να είναι ρυθμίζεται προς τα κάτω σε δείγματα καρκίνου, συμπεριλαμβανομένου GAS5 [5] και MEG3 [6].

Πρόσφατες εκθέσεις που συνδέουν τα επίπεδα έκφρασης των lincRNA με καρκίνο του προσφέρουν μια εξαιρετική ευκαιρία για τη δημιουργία λειτουργικού ρόλου της lincRNAs στη ρύθμιση της γονιδιακής έκφρασης. Ένα από τα πιο εξαντλητική αναζήτηση για lincRNAs σχετίζεται με τον καρκίνο του προστάτη περιλαμβάνουν, ταυτοποίηση 121 lincRNAs, που ονομάζεται PCATs (Prostate Cancer Associated μεταγραφές) ανακαλύφθηκε από 102 ασθένεια στρωματοποιημένη ιστούς του προστάτη και κυτταρικές σειρές [7]. Από αυτές, pCAT-1 αναστολή με siRNA φαίνεται να μειώνουν τον πολλαπλασιασμό των celllines εκφράζουν υψηλά επίπεδα-pCAT-1. Από τη δημοσίευση της παρούσας έκθεσης, pCAT-1 υπερ-έκφραση έχει δειχθεί ότι είναι ένας βιοδείκτης σε καρκίνο του παχέος εντέρου [8]. Πιο πρόσφατα, lincRNAs από RNA-seq δεδομένα από ένα μεγάλο αριθμό δειγμάτων καρκίνου του πνεύμονα από το κοινό αποθετήριο έχει χρησιμοποιηθεί για τον εντοπισμό 111 καρκίνο του πνεύμονα σχετίζεται lincRNAs, που ονομάζεται LCALs [9]. Η προκατάληψη του lincRNAs προς τα πάνω ρύθμιση στον καρκίνο απαιτεί ανάκριση.

Είναι δελεαστικό να συμπεράνουμε ότι η προκατάληψη προς τα πάνω ρύθμιση της lincRNAs στον καρκίνο, στις προσπάθειες μεγάλης κλίμακας που αναφέρονται παραπάνω, μπορεί να προκύπτει από την πρακτική της ανακάλυψης lincRNAs από δείγματα καρκίνου. Εδώ, ο στόχος μας ήταν να εκτελέσει μια ολοκληρωμένη ανάλυση τόσο της κωδικοποίησης και μη-κωδικοποίησης nlincRNAs (lincRNAs ανακαλύφθηκε από φυσιολογικούς ανθρώπινους ιστούς) σε πολλαπλές RNA-επόμενα σύνολα δεδομένων που σχετίζονται με τον καρκίνο του προστάτη από το δημόσιο αποθετήριο τόσο διεύθυνση αυτή προκατάληψη και να ανακαλύψουν νέες συρρύθμιση των γονιδίων και nlincRNAs.

Υλικά και Μέθοδοι

Σύνολα δεδομένων που χρησιμοποιούνται

Έχουμε χρησιμοποιήσει δύο RNA-επόμενα σύνολα δεδομένων από το NCBI δημόσιο αποθετήριο που παράγεται από δύο ανεξάρτητες ομάδες με αναγνωριστικά ένταξη της SRP002628 και ERP000550. Όπως φαίνεται στον Πίνακα 1, οι 5 όγκους κανονική ζεύγη από SRP002628 και 7 από ERP000550 σύνολα δεδομένων εξετάζονται στην παρούσα μελέτη, είτε επειδή οι αντίστοιχες ζεύγη δεν ήταν διαθέσιμοι για ορισμένα άτομα ή το βάθος της αλληλούχισης δεν ήταν συμβατά για να ληφθούν καλές στατιστικές. Αυτά τα δύο σύνολα δεδομένων προέρχονται από δύο διαφορετικές δημογραφικά στοιχεία. Για παράδειγμα, οι ασθενείς επιλέγονται για την παραγωγή δεδομένων στο πλαίσιο της προσχώρησης ERP000550 είναι κινεζικής προέλευσης και, παρόλο που η δημογραφία των ασθενών στο σύνολο δεδομένων SRP002628 δεν είναι γνωστή, είναι ασφαλές να υποθέσουμε ότι τα άτομα που θεωρούνται ότι παράγουν δεδομένα εντός της ένταξης SRP002628 δεν είναι Κινέζοι . Ο Πίνακας 1 δίνει το βάθος, μεμονωμένα αναγνωριστικά ένταξη και τα ποσοστά χαρτογράφηση για κάθε δείγμα σε αυτά τα σύνολα δεδομένων.

Η

Για προφίλ γνωστών και νέων lincRNAs χρησιμοποιήσαμε GENCODE (https://www.gencodegenes.org/) και lincRNA-κατάλογο (https://www.broadinstitute.org/genome_bio/human_lincrnas/?q=lincRNA_catalog). Επίσης, για την ανάλυση της έκφρασης των γονιδίων που έχουμε χρησιμοποιήσει το πρόγραμμα περιήγησης πίνακα από τη διεύθυνση URL https://genome.ucsc.edu/cgi-bin/hgTables για hg19 με διαδρομή ως γονίδια REFSEQ και μορφή εξόδου ως κρεβάτι.

Για την αρχική τιμή έκφραση της κωδικοποίησης δεδομένων γονιδίων που έχουμε χρησιμοποιήσει και τα δύο E-mtab-513 με 16 και E-mtab-1733 με 27 φυσιολογικούς ανθρώπινους ιστούς από την έκφραση Atlas κάτω ArrayExpress. Σε αυτή τη μελέτη έχουμε χρησιμοποιήσει μια τιμή FPKM μικρότερη του 0,5 για να κάνουν την αρχική τιμή null κλήσεις και FPKM τιμή μεγαλύτερη από 100 να τους καλέσει ιστο-ειδική.

Μέθοδος που χρησιμοποιείται για τον υπολογισμό της έκφρασης μεταγραφή

επιλεγμένα σύνολα δεδομένων χαρτογραφήθηκαν σε hg19 γονιδίωμα αναφοράς χρησιμοποιώντας Bowtie [10] με ποσοστό χαρτογραφημένες φαίνονται στον πίνακα 1. για το διαβάζει κάτω από την προσχώρηση SRP002628 όλο το μήκος του διαβάζει, το οποίο είναι 36μερούς, χαρτογραφήθηκαν. Ωστόσο, για διαβάζει υπό ERP000550 25 βάσεων κόπηκαν από τα δύο άκρα του ο διαβάζει μήκους 90 που οδηγεί σε χαρτογράφηση του 40μερή από τη μέση. Το εργαλείο coverageBed από BEDTools χρησιμοποιήθηκαν για την εξαγωγή καταμέτρηση ανά μεταγραφή ανά δείγμα, χρησιμοποιώντας τα αρχεία σχολιασμών και lincRNA-κατάλογο που αναφέρεται στην παραπάνω ενότητα. Αυτά τα μεμονωμένα αρχεία καταμέτρηση συγκεντρώθηκαν σε ένα τραπέζι με τις σειρές που εκπροσωπούν μεταγραφές.

Πληροφορική διαφορική έκφραση

Για τον υπολογισμό διαφορική έκφραση επιλέξαμε δύο ευρέως χρησιμοποιούμενα πακέτα R καταμέτρηση που βασίζεται, Edger [11] και DESeq [12]. Αν και αυτές οι δύο μέθοδοι είναι πολύ παρόμοια διαφέρουν στη χρήση της διασποράς. Η edger πακέτο χρησιμοποιεί ενιαίο κοινό παράγοντα διασποράς, σε αντίθεση με ένα εύκαμπτο εκτίμηση της διασποράς που χρησιμοποιείται από το πακέτο DESeq. Η σημαντική διάκριση του Edger είναι ότι είναι αντι-συντηρητική σε χαμηλά εκφρασμένα γονίδια και πιο συντηρητική σε εξαιρετικά εκφραζόμενα γονίδια. Όπου, όπως, το ευέλικτο μοντέλο διασποράς που χρησιμοποιούνται από DESeq επιτρέπει μικρότερο μεροληψία στην επιλογή των γονιδίων με βάση τα επίπεδα έκφρασης τους. Με αυτό τον τρόπο DESeq και Edger αλληλοσυμπληρώνονται στην επιλογή των διαφορικά εκφρασμένων γονιδίων. Με άλλα λόγια Edger είναι πιο ευαίσθητη σε ακραίες τιμές, όπου, όπως DESeq είναι λιγότερο ευαίσθητη σε ακραίες τιμές, αλλά παρέχει το αποτέλεσμα μέσω της δυναμικής περιοχής [13].

DESeq και Edger τόσο δέχεται ένα αντιπαραβάλλονται αρχείο μετράνε ως είσοδο και παράγουν μόνο σ -τιμή και συνδεθείτε πολλαπλή μεταβολή ανά μεταγραφή ανά σύνολο δεδομένων που αντιπροσωπεύουν τη συνολική κατάσταση διαφορική έκφραση των μεταγραφών στο αρχείο σχολιασμών μεταξύ δύο δεδομένων κρατών, όγκου και συμφωνημένα μη νεοπλασματικών ιστών. Για να αποκτήσετε τον καρκίνο συγκεκριμένες μεταγραφές που είναι στατιστικά σημαντικές χρησιμοποιήσαμε μια οριακή τιμή p μικρότερη από 0,05 και κοιλιακούς (log φορές αλλαγή βάσης 2) μεγαλύτερο από 1,0 για την κωδικοποίηση των γονιδίων και μεγαλύτερο από 0,59 για nlincRNAs. Η μεταβολή στα κριτήρια φιλτραρίσματος που επιλέγεται για φορές η αλλαγή είναι να αντανακλούν τα σχετικά χαμηλότερα επίπεδα έκφρασης nlincRNA σε σχέση με την κωδικοποίηση των γονιδίων που αναφέρονται στη βιβλιογραφία [2].

Ομαδοποίηση heatmap

Για την παραγωγή θερμικούς χάρτες μας μεταχειρισμένα Pearson Συντελεστής συσχέτισης και για δενδρογράμματα χρησιμοποιήσαμε Ευκλείδεια απόσταση χρησιμοποιώντας «pheatmap» και λειτουργίες »hclust» από την Ε στατιστικό πακέτο αντίστοιχα. Για να παραχθεί θερμικούς χάρτες για τα δείγματα μεταξύ συνόλων δεδομένων επιπλέον εξομάλυνση όφειλε να λογοδοτήσει για τη μεταβολή της διασποράς των επιπέδων έκφρασης των γονιδίων μεταξύ συνόλων δεδομένων που προέρχονται από διαφορετικά πρωτόκολλα προετοιμασίας του δείγματος που χρησιμοποιούνται από διαφορετικούς ερευνητές. Αν και οι τιμές RPKM υπολογίζονται για την ομαλοποίηση των επιπέδων έκφρασης απέναντι δείγματα, αυτό κανονικοποίηση είναι επαρκής για να λαμβάνουν υπόψη μεταβολές στις πρωτόκολλο προετοιμασία του δείγματος. Ομαλοποίηση από σειρές, που εκπροσωπούν μεταγραφές, μεταξύ συνόλων δεδομένων διαιρώντας τους κατά μέσο γραμμή χρησιμοποιήθηκε για να χειριστεί την απόκλιση της διασποράς μεταξύ των δύο συνόλων δεδομένων που απορρέουν από τις διαφοροποιήσεις στα πρωτόκολλα παρασκευής του δείγματος. Μια τέτοια προσέγγιση έχει ήδη εφαρμοστεί σε πακέτο DESeq για δείγματα μέσα σε ένα δεδομένο σύνολο δεδομένων [12].

Εκκαθάριση των συνόλων δεδομένων

Για να δείξουμε ότι τα δύο σύνολα δεδομένων που επιλέγονται είναι κατάλληλα για προφίλ μη-κωδικοποίησης RNAs , τα επίπεδα έκφρασης των γνωστών lincRNAs, τα οποία αναφέρονται ως εμπλέκονται στον καρκίνο, έχουν προφίλ κατά μήκος των δύο RNA-Seq σύνολα δεδομένων που επιλέγεται για αυτή τη μελέτη. Έχουμε εντοπίσει ότι αρκετές καρκίνο του προστάτη που σχετίζεται lincRNAs είναι πάνω ρυθμισμένα σε ένα όγκο-ειδικό τρόπο και στις δύο αυτές σειρές δεδομένων. Για παράδειγμα, pCAT-1, ένας καρκίνος του προστάτη που σχετίζεται lincRNA από τον γονιδιακό τόπο έρημο σε χρωμόσωμα 8q24 είναι σημαντικά πάνω ρυθμισμένα σε όλα τα δείγματα όγκων από τις δύο συνόλων δεδομένων σε σύγκριση με παρακείμενες μη νεοπλασματικών ιστών. Αρκετές άλλες προστάτη και άλλων ειδική για τον καρκίνο lincRNAs, όπως PVT1, PCA3, CCAT-1 pCAT-92, pCAT-114, pCAT-120, pCAT-19, pCAT-27, PCAT38, pCAT-39, pCAT-43, PCAT -59, pCAT-72, pCAT-80, και pCAT-83 βρίσκονται επίσης να είναι προς τα πάνω ρυθμισμένα σε αμφότερες τις ομάδες δεδομένων σε ένα ειδικό για καρκίνο μόδας. Τα ευρήματα αυτά, όχι μόνο επικυρώνει τη χρήση αυτών των δύο συνόλων δεδομένων για nlincRNA προφίλ, αλλά παρέχουν πρόσθετες επικύρωσης για αυτά τα νεόκοπων lincRNAs στον καρκίνο του προστάτη.

Gene Δίκτυο

δίκτυο γονιδίων σε αυτό το χειρόγραφο που έχει δημιουργηθεί από GeneMANIA, ένα πακέτο κάτω Cytoscape [14].

Αποτελέσματα και Συζήτηση

profiling γονιδίων που κωδικοποιούν

προφίλ γονιδιακής έκφρασης των δύο RNA-επόμενα σύνολα δεδομένων, SRP002628 [15] και ERP000550 [16], πραγματοποιήθηκαν με τη χρήση δύο συνήθως χρησιμοποιούμενων πακέτα στατιστική ανάλυση R, edger [11] και DESeq [12]. Τα γονίδια με ρ-τιμές μικρότερες από 0,05 και απόλυτη αλλαγές log φορές (βάση 2) ​​μεγαλύτερο από 1.0 που χρησιμοποιείται για να κάνει μια κλήση ότι ένα γονίδιο ρυθμίζεται σε καρκίνο του προστάτη. Συγκλίνουσες αριθμοί σημαντικά γονιδίων που ρυθμίζονται σε κάθε στάδιο του αγωγού ανάλυση παρουσιάζεται στο Σχήμα 1. Χρησιμοποιώντας edger, 4449 και 5034 μεταγραφές που βρέθηκαν διαφορικά ρυθμίζονται από τα δύο σύνολα δεδομένων, SRP002628 και ERP000550 αντίστοιχα. Από αυτές, 1358 μεταγραφές που αντιπροσωπεύουν 786 γονίδια βρίσκονται συνήθως ρυθμίζονται μεταξύ των δύο συνόλων δεδομένων με 302 γονίδια ρυθμισμένα προς τα πάνω και 455 γονίδια ρυθμισμένα προς τα κάτω στον καρκίνο. Είναι ενδιαφέρον, μόνο 29 γονίδια έδειξε απέναντι πρότυπο έκφρασης στα δύο σύνολα δεδομένων. Ομοίως, χρησιμοποιώντας το πακέτο DESeq 2942 και 4260 μεταγραφές που προσδιορίζονται ως διαφορικά ρυθμίζεται με καρκίνο του προστάτη από τα δύο σύνολα δεδομένων, SRP002628 και ERP000550 αντίστοιχα. Οι 881 κοινές μεταγραφές αντιπροσωπεύουν 497 γονίδια, που ρυθμίζονται σε καρκίνο του προστάτη με 180 γονίδια επάνω και 313 γονίδια ρυθμισμένα προς τα κάτω. Και πάλι, μόνο 4 γονίδια που εμφανίζουν αντίθετη ρύθμιση στα δύο σύνολα δεδομένων με βάση αγωγού DESeq.

Η

Ο κατάλογος των διαφορικά εκφρασμένων γονιδίων (βαθμούς με) από τα δύο σύνολα δεδομένων με τη χρήση των δύο μεθόδων, edger και DESeq, είναι εισηγμένη στο S1 πίνακα, τα οποία περιέχουν 366 κωδικοποίησης γονιδίων με 117 πάνω και 249 κάτω-ρυθμίζονται σε καρκίνο του προστάτη. Είναι ενδιαφέρον ότι, με την εξαίρεση ενός μόνο γονιδίου, όλα ρυθμίζονται προς την ίδια κατεύθυνση και στα δύο σύνολα δεδομένων καρκίνο (Σχήμα 2). Στο σχήμα 2, φαίνεται επίσης ότι η σειρά-wise ομαλοποιημένων τιμών RPKM από τους δύο σύνολα δεδομένων για το σύνολο των 366 βαθμούς με, συστάδες όλα τα 12 καρκίνος και 12 κανονικά δείγματα σε δύο διακριτές υποδιαιρέσεις. Επίσης φαίνεται στο σχήμα 2, είναι η ομαδοποίηση των πέντε επιπλέον δείγματα από την προσχώρηση ERR000550, που δεν χρησιμοποιούνται στην εξόρυξη την υπογραφή, στις αντίστοιχες κλάδων.

Η

μελέτες εμπλουτισμού Gene στα 366 γονίδια υποδηλώνει αδρανοποίηση των γονιδίων και στις δύο 17q21 και 19q13 τόπους, οι οποίες και οι δύο αναφέρονται ως επιδεκτικότητα καρκίνου του προστάτη loci [17], [18], [19]. Το σχήμα 3 δείχνει το δίκτυο γονίδιο για τόπους 17q21 και 19q13. Είναι ενδιαφέρον ότι, τα γονίδια απενεργοποιούνται 17q21, συμπεριλαμβανομένων KRT15, ​​ITGA, AOC3, HOXB3, RND2, SGCA, WFKKN2, ARHGAP27, NGF, και NOG, εμπλέκονται σε κυττάρου-κυττάρου αλληλεπίδραση, κυτταροσκελετική αναδιοργάνωση, εξω-κυτταρική μήτρα και κυτταρικό θάνατο? έλλειψη της οποίας θα μπορούσε να πείσει επιθηλιακά σε μεσεγχυματικά μετασχηματισμό και τη μετανάστευση.

Η

Profiling nlincRNAs

Ένα σύνολο δεκατεσσάρων χιλιάδων τριακόσιες πενήντα τρεις (14.353) lincRNAs, που αναφέρεται εδώ ως nlincRNAs, έχει αναφερθεί ότι εκφράζεται σε διάφορους φυσιολογικούς ανθρώπινους ιστούς [2]. Από αυτές, υπάρχουν 9600 nlincRNAs που δείχνουν πολύ χαμηλές ενδείξεις της μεταγραφής στον προστάτη φυσιολογική και τόσο χαμηλά όσο 196 nlincRNAs αναφέρονται ως ειδικές για ιστούς του προστάτη.

Όπως φαίνεται στο σχήμα 1, με τη χρήση edger, 1140 (773 μέχρι και 367 κάτω-ρυθμιζόμενες) και 1702 (1258 επάνω και 444 κάτω-ρυθμιζόμενες) nlincRNAs θα βρεθούν διαφορικά ρυθμίζονται από τα δύο σύνολα δεδομένων, SRP002628 και ERP000550, αντίστοιχα. Από αυτά, 316 nlincRNAs (252 έως και 42 κάτω) είναι συνήθως ρυθμίζονται σε καρκίνο του προστάτη και στις δύο σύνολα δεδομένων. Παρόμοια ανάλυση με τη χρήση του αγωγού DESeq οδήγησε σε 576 (383 και 193 προς τα κάτω) και 988 (867 και 121 προς τα κάτω) nlincRNAs ρυθμίζονται στον καρκίνο του προστάτη και στα δύο σύνολα δεδομένων, SRP002628 και ERP000550, αντίστοιχα. Ο αριθμός των κοινώς διαφορικά ρυθμιζόμενης nlincRNAs και στα δύο σύνολα δεδομένων, χρησιμοποιώντας το πακέτο DESeq είναι 135 με 124 πάνω και 9 κάτω-ρυθμίζονται σε καρκίνο.

Ο αριθμός των nlincRNAs που βρίσκονται διαφορικά ρυθμίζονται σε καρκίνο και στα δύο σύνολα δεδομένων χρησιμοποιώντας τόσο Edger και τις μεθόδους DESeq, είναι 130 με 118 ανάντη, κατάντη 9 και τόσο χαμηλά όσο 3 αντίθετα ρυθμιζόμενη. Το σχήμα 4 δείχνει την heatmap των 127 nlincRNAs, απαριθμούνται στο Πίνακα S2, που ρυθμίζονται διαφορικά στον καρκίνο. Με την εξαίρεση του C13_5, ένα από το δείγμα καρκίνου από την ένταξη SRP002628, οι 127 nlincRNAs επιτρέπουν ομαδοποίηση όλων των καρκίνου και φυσιολογικά δείγματα στις αντίστοιχες κλάδων. Χρησιμοποιώντας ανάλυση κύριων συνιστωσών, που φαίνεται στο Σχήμα 4, επιβεβαιώνεται ότι C13_5 είναι πιο φυσιολογικό-όπως.

Η

Από τα 127 διαφορετικά νομοθετικά nlincRNAs, 58 έχουν μηδενική βασική έκφραση σε προστάτη φυσιολογικό ιστό σύμφωνα τόσο με in-house προσπάθειες και η έκθεση του Ινστιτούτο Broad [2]. Από αυτές τις nlincRNAs, πολλοί είναι όρχεις-ειδικά και ένας αριθμός από αυτούς είναι θυρεοειδούς-ειδικά. Όπως φαίνεται στον S2 Πίνακα, προφίλ αυτών nlincRNAs στον προστάτη κυτταρικές γραμμές από RNA-seq σύνολο δεδομένων με αναγνωριστικά προσχώρηση SRP004637 [7], αποκαλύπτουν ότι 12 από τα 58 παρουσιάζουν σημαντική έκφραση σε ένα ή περισσότερα από τα τρία celllines προστάτη. Αυτή η τάση παρατηρείται στον καρκίνο του προστάτη συσχετισμένη γονίδια που κωδικοποιούν όπως ΕΖΗ2 [20], η οποία είναι διαφορικά επάνω ρυθμισμένη σε δείγματα καρκίνου από τα δύο σύνολα δεδομένων εμφανίζει την αρχική τιμή null έκφραση σε προστάτη. Επίσης, όπως φαίνεται στο S3 Πίνακα, πολλοί ανέφεραν καρκίνο του προστάτη που σχετίζεται lincRNAs, όπως pCAT-1, PCA3, pCAT-92, pCAT-114, pCAT-120-pCAT-27, pCAT-38, PCAT43, PCAT72, και pCAT-80 [7], οι οποίες είναι επίσης διαφορικά πάνω ρυθμισμένα σε καρκίνο και στις δύο σύνολα δεδομένων, δεν έχει επικαλυπτόμενα nlincRNAs σύμφωνα UCSC κομμάτια.

υπάρχουν πολλοί nlincRNAs από το χρωμόσωμα 8q24 τόπο, που αναφέρονται στον πίνακα 2, τα οποία εκφράζονται σε φυσιολογικά ανθρώπινους ιστούς. Ενώ ένας αριθμός nlincRNAs μετοχικού εξώνια με γνωστά lincRNAs, όπως PVT1 και CCAT1, αρκετοί άλλοι συμπεριλαμβανομένων TCONS_00014535 (BC042052, CASC11), TCONS_00015171 (BC106081), TCONS_00015167 (PCAT2), TCONS_00015170 και TCONS_00015168 (JX003871), TCONS_00015498, TCONS_00015165 και TCONS_00015166 είναι μυθιστόρημα nlincRNAs που είναι διαφορικά πάνω ρυθμισμένα σε καρκίνο του προστάτη σε τουλάχιστον ένα από τα δύο σύνολα δεδομένων που χρησιμοποιούνται σε αυτή τη μελέτη. Και πάλι, πολλές από αυτές είναι ειδικές για τους όρχεις και το συκώτι και δεν εκφράζεται σε φυσιολογικό προστάτη.

Η

Co-ρύθμιση των lincRNAs και των γειτονικών γονιδίων

Όπως φαίνεται στο σχήμα 5, 15 διαφορικά ρυθμιζόμενη nlincRNAs έξω από το 127 είναι κοντά στο 12 διαφορετικά γονίδια ρυθμίζονται σε διάφορα χρωμοσώματα. Πίνακας 3 παρέχει τη σημασία της nlincRNAs και των αντίστοιχων κωδικοποίησης γονιδίων τους. Για παράδειγμα, η nlincRNA, TCONS_00029157, και ένας γνωστός παράγοντας καταστολής όγκου, SIK1, και οι δύο κάτω ρυθμίζονται σε όλα τα δείγματα καρκίνου. Μειωμένη έκφραση SIK1 συσχετίζεται με κακή πρόγνωση σε δύο μεγάλα σύνολα δεδομένων για τον καρκίνο του μαστού του ανθρώπου και συνδέεται με p53-εξαρτώμενη anoikis που μπορούν να απευθύνονται κατά τη διάρκεια tumerogenesis [21].

Η

Ο θυρεοειδής ειδικές ΤΡΟ γονίδιο είναι επάνω ρυθμισμένο σε καρκίνο του προστάτη, μαζί με μερικές θυρεοειδούς ειδική nlincRNAs, TCONS_00004663-4666 και TCONS_00004668-4669. ΤΡΟ είναι ένα από τα γονίδια που είναι γνωστό ότι σχετίζονται με το οξειδωτικό στρες. Έχει αποδειχθεί ότι τα επιθηλιακά φακός αυξητικό παράγοντα προερχόμενο από ρ75 (LEDGF) σε PC3, έχει ως αποτέλεσμα την αλλαγή στην έκφραση της ΤΡΟ [22]. Η αλλαγή αυτή είναι πιθανό να παίζει ένα προστατευτικό ρόλο έναντι του οξειδωτικού στρες και χημειοθεραπευτικά φάρμακα.

TCONS_00010581, μια ισομορφή HEIH, το οποίο είναι γνωστό ότι είναι προς τα πάνω ρυθμισμένα σε ηπατοκυτταρικό καρκίνωμα [23], είναι η εγγύτητα των γονίδιο ΕΖΗ2 του Polycomb συμπλόκου-2 [24] το γονίδιο ΕΖΗ2 βρίσκεται επίσης πάνω ρυθμισμένα σε όλα τα δείγματα του καρκίνου σε σύγκριση με παρακείμενες μη νεοπλασματικών ιστών και στα δύο σύνολα δεδομένων.

Α όρχεις-ειδική nlincRNA, TCON_00025002, είναι στη γειτονιά του γονιδίου TOX3 στο χρωμόσωμα 16, οι οποίες είναι και οι δύο πάνω ρυθμισμένα σε μια ειδική για τον καρκίνο της μόδας στη μελέτη μας. TOX3 είναι υψηλή σε πρωτεΐνες πλαίσιο ομάδας κινητικότητας που εμπλέκονται στη διαμεσολάβηση ασβέστιο-εξαρτώμενη μεταγραφή. TOX3 χάρτες με τη γνωστή θέση ευαισθησίας τριπλά αρνητικό καρκίνο του μαστού? μια μετάλλαξη σε αυτό το τόπο στον εμπλέκονται στην ανάπτυξη του καρκίνου του μαστού [25]. Ένας SNP στο γονίδιο TOX3 εμπλέκεται επίσης σε παγκρεατικά [26] και τον καρκίνο του πνεύμονα [27].

Προστατικό ειδικό nlincRNAs, TCONS_00017728 και TCONS_00010086, βρίσκονται να είναι στην περιοχή του GATA3 και ADAMTS19 γονιδίων αντίστοιχα. Και οι τέσσερις, συμπεριλαμβανομένης της nlincRNAs και τα γονίδια, τα κάτω ρυθμίζονται με καρκίνο ειδικό τρόπο σε αυτή τη μελέτη. GATA3 είναι ένας σημαντικός παράγοντας μεταγραφής που είναι γνωστό ότι εμπλέκονται στη ρύθμιση των ανδρογόνων του γονιδίου PSA [28]. Ένα παγκόσμιο πρότυπο μεθυλίωσης στο ευαίσθητο στα ανδρογόνα και ανδρογόνα ανεξάρτητο καρκίνο του προστάτη εμφανίζει μια σημαντική διαφορά στο πρότυπο μεθυλίωσης σε GATA3 κάτω από αυτές τις δύο προϋποθέσεις [29]. βιοψίες όγκων και διάφορες καρκινικές κυτταρικές γραμμές έχουν δείξει υψηλά επίπεδα έκφρασης του ADAMTS19 σε οστεοσαρκώματα [30].

Λίγα ήπατος-ειδική nlincRNAs, TCONS_00014531, TCONS_00015169 και TCONS_000015171, είναι όλα τα επάνω ρυθμισμένη σε καρκίνο του προστάτη σε αυτό μελέτη μαζί με το γειτονικό POU5F1 ψευδογονίδιο, η οποία είναι γειτονική προς myc τόπο στη μείζονα θέση ευαισθησίας του καρκίνου του προστάτη σε 8q24 [31]. Ένα άλλο ειδικό ήπατος TCONS_00016903 αντιπαρατίθεται στο γονίδιο EGFL7, τόσο καταγράφεται ως κάτω-ρυθμίζονται στην ανάλυσή μας. Σε αντίθεση με τα ευρήματά μας EGFL7 έχει αποδειχθεί ότι έχει αυξημένη έκφραση σε διάφορους τύπους καρκίνου, συμπεριλαμβανομένου του καρκίνου του πνεύμονα, ο καρκίνος του μαστού, ο καρκίνος του προστάτη και ηπατοκυτταρικό καρκίνωμα [32]. Ωστόσο, υπήρξε μια αναφορά ενός microRNA, miR-126, το οποίο βρίσκεται εντός του ιντρονίου του EGFL7, η οποία φαίνεται να ρυθμίζεται προς τα κάτω σε καρκινικές κυτταρικές σειρές και σε πρωτογενή κύστη και όγκους του προστάτη [33].

Μεταξύ των πιο ενδιαφέροντα nlincRNAs, TCONS_00028940, στη γειτονιά του γονιδίου TMPRSS2, είναι ιδιαίτερα εκφράζονται διαφορικά σε όλα τα δείγματα που μελετήθηκαν καρκίνο εδώ. Η γονιδιακή σύντηξη TMPRSS2-ERG είναι μία από τις πιο ευρέως διαδεδομένη χρωμοσωματικών αναδιατάξεων σε καρκινώματα [34], αν και το γονίδιο TMPRSS2 δεν εκφράζεται σε καρκίνο ειδικό τρόπο σε δείγματα που μελετήθηκαν εδώ Θεωρούμε ότι αυτό nlincRNA δείχνει σημαντική έκφραση σε VCAP και όχι σε PC3 και LnCaP.

Συμπέρασμα

Πρόσφατα, πάνω από δεκατέσσερις χιλιάδες lincRNAs έχουν ανακαλυφθεί από μεγάλο αριθμό κανονικών ανθρώπινων ιστών, γεγονός που υποδηλώνει ότι αυτές οι κανονικές lincRNAs (nlincRNAs) παίζουν ένα ρόλο στην κανονική βιολογία . Μπορεί να υποτεθεί ότι nlincRNAs με γονίδιο ρυθμιστικές λειτουργίες υπό κανονικές συνθήκες μπορεί να είναι πράγματι ρυθμίζεται προς τα κάτω σε καρκίνο. Για το σκοπό αυτό, εδώ έχουμε προσπαθήσει να πάρει δύο ανεξάρτητα δημιουργείται RNA-επόμενα σύνολα δεδομένων από διαφορετικές δημογραφικά ομάδα στο προφίλ τόσο κωδικοποίησης γονιδίων και πρωτεϊνών nlincRNAs. Έχουμε εντοπίσει 127 nlincRNAs που δεν ρυθμίζονται μόνο σημαντικά σε δείγματα καρκίνου από τα δύο σύνολα δεδομένων, αλλά θα μπορούσε να χρησιμοποιηθεί για να συγκεντρωθούν τα στοιχεία από τα δείγματα, που δεν έχουν χρησιμοποιηθεί σε αυτή τη μελέτη, από τα συμφραζόμενα της νόσου. Σε αντίθεση με την υπόθεσή μας, των χαρακτηριστικών των γονιδίων κωδικοποίησης και nlincRNAs υποδηλώνει ότι η πλειοψηφία των nlincRNAs είναι πάνω ρυθμισμένα σε καρκίνο παρότι 2 γονίδια που κωδικοποιούν φορές περισσότερο πρωτεΐνη ρυθμίζονται προς τα κάτω στον καρκίνο. Αυτό, σε συνδυασμό με την ενεργοποίηση πολλών μη-κωδικοποίησης γονιδίων σε 8q24 και αδρανοποίηση των πολλών κωδικοποίησης γονιδίων σε 17q21 και 19q13 τόπους θα πρότεινα συστημάτων ενεργοποίησης επίπεδο πολλών nlincRNAs κατά την διάρκεια του καρκίνου.

Έχουμε βρει ότι ένας αριθμός γονιδίων που κωδικοποιούν και nlincRNAs ειδικά για άλλους ιστούς με μηδενική έκφραση βασικής γραμμής σε ιστό του προστάτη είναι πάνω ρυθμισμένα σε καρκίνο του προστάτη. Ίσως αυτά τα γονίδια και nlincRNAs είναι υπεύθυνη για την απώλεια της κυτταρικής ταυτότητας που οδηγούν σε tumerogenesis. Για τις γνώσεις μας, αυτή είναι η πρώτη προσπάθεια στο προφίλ nlincRNAs μαζί με την κωδικοποίηση των γονιδίων στον καρκίνο. Πιστεύουμε ότι η προσέγγιση που χρησιμοποιείται εδώ για λειτουργικό χαρακτηρισμό της nlincRNAs θα επιτρέψει στους ερευνητές να προωθήσει την κατανόηση του ρόλου των nlincRNAs στην κανονική και την ασθένεια της βιολογίας, σε γενικές γραμμές.

Υποστήριξη Πληροφορίες

Πίνακα S1. Γονίδια διαφορικά ρυθμίζεται σε δείγματα καρκίνου από τα δύο σύνολα δεδομένων που προσδιορίζονται με τη χρήση δύο αγωγών ανάλυση DESeq και edger.

Στήλες 2-5 δίνει τις μέσες τιμές p και διπλώστε την αλλαγή που προέρχονται από DESeq και Edger αγωγού τόσο για SRP002628 και ERP000550.

Doi : 10.1371 /journal.pone.0122143.s001

(XLS)

S2 πίνακα. Λίστες p-value και διπλώστε αλλαγής για όλους τους nlincRNAs διαφορικά ρυθμίζεται σε δύο σύνολα δεδομένων που χρησιμοποιούν και τις δύο μεθόδους.

Πίνακας παραθέτει τα γειτονικά γονίδια, μαζί με τις αντίστοιχες π-αξία τους και διπλώστε αλλαγή στα δύο σύνολα δεδομένων. Τρεις τελευταίες στήλες παραθέτει τις τιμές RPKM για αυτές τις lincRNAs σε τρεις celllines προστάτη

doi:. 10.1371 /journal.pone.0122143.s002

(XLS)

S3 πίνακα. Λίστες p-value και συνδεθείτε φορές αλλαγή για γνωστό lincRNAs που ρυθμίζονται διαφορικά σε δύο σύνολα δεδομένων μαζί με το καθεστώς των πρακτικών επικάλυψη με nlincRNAs στο πρόγραμμα περιήγησης UCSC

doi:. 10.1371 /journal.pone.0122143.s003

(XLS)

Ευχαριστίες

Οι συγγραφείς επιθυμούν να αναγνωρίσουν το Τμήμα Βιοτεχνολογίας, Νέο Δελχί, Ινδία για την υποστήριξη των SS μέσω του Ramalingaswamy Fellowship (Ref No: BT /HRD /35/02 /17/2009). Συγγραφείς αναγνωρίζουν επίσης το Τμήμα Πληροφορικής, Κυβέρνηση της Ινδίας, για την υποστήριξή τους προς το ίδρυμα κάτω από το «Κέντρο Αριστείας στη Βιοπληροφορική Κατάρτισης και Έρευνας». Οι συγγραφείς επιθυμούν να αναγνωρίσουν DST-γροθιά, η κυβέρνηση της Ινδίας και του Τμήματος Πληροφορικής, Κυβέρνηση της Karnataka, για τις επιχορηγήσεις υποδομής προς IBAB.

You must be logged into post a comment.