PLoS One: RNA-Seq αποκαλύπτει σωμάτια συναρμογής και Proteasome Γονίδια ως πιο συνεπής μεταγραφές σε ανθρώπινα κύτταρα του καρκίνου


Αφηρημένο

Η ακριβής ποσοτικοποίηση της γονιδιακής έκφρασης από qRT-PCR βασίζεται στην εξομάλυνση κατά ένα εκφράζεται σταθερά γονίδιο ελέγχου. Ωστόσο, τα γονίδια ελέγχου σε κοινή χρήση συχνά ποικίλλουν σε μεγάλο βαθμό μεταξύ των δειγμάτων, ιδιαίτερα στον καρκίνο. Η έλευση της τεχνολογίας αλληλουχίας Next Generation προσφέρει τη δυνατότητα για την καλύτερη επιλέξτε γονίδια ελέγχου με το λιγότερο κύτταρο σε κύτταρο μεταβλητότητα σε επίπεδα σταθερής κατάστασης μεταγραφής. Εδώ αναλύουμε τα transcriptomes των 55 δειγμάτων λευχαιμίας να εντοπίσει τις πιο συνεπείς γονίδια. Αυτή η λίστα είναι εμπλουτισμένη για τα συστατικά του πρωτεασώματος (ex.

PSMA1

) και σωμάτια συναρμογής (ex.

SF3B2

), και περιλαμβάνει επίσης τον παράγοντα έναρξης της μετάφρασης

EIF4H

, και πολλές ετερογενείς γονίδια πυρηνικής ριβονουκλεοπρωτεΐνης (ex.

HNRNPL

). Έχουμε επικυρωθεί η συνοχή των νέων γονιδίων από τον έλεγχό μας το 1933 ο καρκίνος και φυσιολογικούς ιστούς χρησιμοποιώντας δημοσίως διαθέσιμα δεδομένα RNA-επόμενα, και η χρησιμότητά τους στην ανάλυση qRT-PCR είναι σαφώς

Παράθεση:. MacRae Τ, Sargeant Τ, Lemieux S, Hébert J, Deneault Ε, Sauvageau G (2013) RNA-Seq αποκαλύπτει σωμάτια συναρμογής και Proteasome γονίδια ως πιο συνεπής μεταγραφές σε ανθρώπινα κύτταρα του καρκίνου. PLoS ONE 8 (9): e72884. doi: 10.1371 /journal.pone.0072884

Συντάκτης: Robert W. Sobol, Πανεπιστήμιο του Pittsburgh, Ηνωμένες Πολιτείες της Αμερικής

Ελήφθη: 3 του Απρίλη 2013? Αποδεκτές: 22 Ιουλ 2013? Δημοσιεύθηκε: 17 του Σεπτεμβρίου 2013

Copyright: © 2013 MacRae et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Αυτό το έργο υποστηρίχθηκε από επιχορηγήσεις από Genome Κεμπέκ (https://www.genomequebec.com/en) και Γονιδιώματος του Καναδά (https://www.genomecanada.ca) στην GS, JH, SL και Brian Wilhelm. έργο TS που κατέστη δυνατή μέσω του Victorian Στήριξης Υποδομών Πολιτειακή Κυβέρνηση και Αυστραλιανή Κυβέρνηση NHMRC IRIISS. έρευνα TS υποστηρίχθηκε από NHMRC πρόγραμμα επιχορήγησης (1.016.647). Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:. Η εργασία αυτή χρηματοδοτήθηκε από Genome Κεμπέκ και Γονιδιώματος του Καναδά. Οι χρηματοδότες δεν έχουν κανένα οικονομικό συμφέρον σε αυτή την έρευνα. Δεν υπάρχουν προϊόντα στην ανάπτυξη ή την εμπορία προϊόντων που να δηλώνουν. Οι συγγραφείς έχουν υποβάλει πρόσφατα μια προσωρινή αίτηση διπλώματος ευρεσιτεχνίας με τίτλο «Μέθοδοι και γονίδια για την ομαλοποίηση της γονιδιακής έκφρασης» (ΗΠΑ Αύξων .: 61 /774,271? Ημερομηνία κατάθεσης 7 Μαρτίου του 2013). Αυτό δεν αλλάζει την τήρηση των συγγραφέων σε όλες τις PLoS ONE πολιτικές για την ανταλλαγή δεδομένων και υλικών, όπως περιγράφεται λεπτομερώς σε απευθείας σύνδεση στον οδηγό για τους συγγραφείς.

Εισαγωγή

Η κανονικοποίηση των μέτρησαν τα επίπεδα του γονιδίου της συμφέρον έναντι εκφράζεται σταθερά γονίδιο ελέγχου είναι η πιο σημαντική δράση που οδηγεί στην ακρίβεια στην ποσοτική αντίστροφης μεταγραφάσης PCR πειράματα (qRT-PCR). Ωστόσο, ενώ τα επίπεδα γονίδιο ελέγχου μπορεί να ποικίλλει σημαντικά ανάλογα με τα δείγματα που χρησιμοποιούνται, είναι συνήθως επιλέγονται με βάση αποκλειστικά σε σύμβαση [1] – [6]. Η έλευση του RNA-αλληλουχίας (RNA-seq): Next Generation Sequencing (NGS) χιλιάδες transcriptomes των ανθρώπινων δειγμάτων προσφέρει νέες δυνατότητες για τον εντοπισμό και την επιλογή γονιδίων ελέγχου που παρουσιάζουν τη χαμηλότερη διακύμανση εντός του συνόλου του δείγματος για τον υπολογισμό της σχετικής γονιδιακής έκφρασης με τη χρήση του μέθοδος ddCt.

Λευχαιμία και άλλα δείγματα του καρκίνου είναι επιρρεπείς σε υψηλότερες μεταβλητότητα έκφρασης γονιδίου σε σύγκριση με τους φυσιολογικούς ιστούς λόγω κλωνική επιλογή και γενετική αστάθεια. Με δεδομένο το αυξημένο ενδιαφέρον προφίλ έκφρασης και ταυτοποίηση των γονιδίων σήμανσης σε θέματα καρκίνου για εξατομικευμένη ιατρική, υπάρχει σαφής ανάγκη για βέλτιστη εξομάλυνση των δεδομένων γονιδιακής έκφρασης με τον εντοπισμό των γονιδίων ελέγχου με την ελάχιστη δυνατή διακύμανση.

Προηγούμενες μελέτες έχουν γίνεται προσπάθεια να καθορίσει την καλύτερη ενδογενή γονίδια ελέγχου που βασίζεται σε δημόσια διαθέσιμα δεδομένα μικροσυστοιχιών [7], [8]. Σε τέτοιες μελέτες, τα δεδομένα μικροσυστοιχιών από πολλαπλούς ιστούς και συνθήκες αναλύθηκαν προκειμένου να προσδιοριστούν τα γονίδια των οποίων η έκφραση μεταβάλλεται το λιγότερο, αποκαλύπτοντας κυρίως ριβοσωμικές γονιδίων που κωδικοποιούν πρωτεΐνη. Next Generation τεχνολογία αλληλουχίας (NGS) έχει πλέον αντικατασταθεί μικροσυστοιχίες ως ο χρυσός κανόνας σε σφαιρική ανάλυση γονιδιακής έκφρασης. Η ανάλυση της γονιδιακής έκφρασης από NGS έχει πολλά πλεονεκτήματα σε σχέση με τις μικροσυστοιχίες, συμπεριλαμβανομένου ενός υψηλότερου δυναμική περιοχή και λιγότερο ευαισθησία στην τεχνική παραλλαγή [9] – [13]. Οι τιμές έκφρασης που συνήθως χρησιμοποιούνται για την RNA-seq κανονικοποιούνται για το μήκος του γονιδίου και του συνολικού αριθμού των διαβάζει για κάθε δείγμα (Διαβάζει Ανά κιλοβάσεων του μεταγραφήματος ανά εκατομμύριο χαρτογραφηθεί ως εξής: RPKM) [9], επιτρέποντας την εύκολη σύγκριση μεταξύ συνόλων δεδομένων. Ως εκ τούτου, το RNA επόμενα εξόρυξης δεδομένων παρέχει μια ιδανική μέθοδος για τον εντοπισμό των πιο συνεπείς γονίδια για χρήση ως ενδογενή ελέγχους.

Εδώ έχουμε εκμεταλλευτεί RNA-επόμενα δεδομένα από μια ομάδα 55 λευχαιμίας δείγματα των ασθενών, καθώς και 8 δημόσια διαθέσιμες RNA -SEQ σύνολα δεδομένων από τον καρκίνο Genome Atlas (TCGA), (https://cancergenome.nih.gov/) για τον καλύτερο εντοπισμό ενδογενών γονιδίων ελέγχου. Πρέπει πρώτα να αποδείξει τη μεταβλητότητα των τυποποιημένων γονιδίων ελέγχου καθώς και τους υποψηφίους που προτείνονται από την ανάλυση των δεδομένων των μικροσυστοιχιών. Εντοπίζουμε νέα γονίδια ελέγχου με χαμηλότερη διακύμανση σε πολλές καρκίνο και κανονικούς τύπους ιστών, αποκαλύπτοντας κυρίως γονίδια που εμπλέκονται στις διαδικασίες μάτισμα του RNA και την υποβάθμιση των πρωτεϊνών. Στη συνέχεια καταδεικνύουν την αποτελεσματικότητα μιας επιλογής αυτών των γονιδίων σε qRT-PCR. Αυτή η νέα ομάδα σε μεγάλο βαθμό συνεπής γονίδια ελέγχου θα είναι πολύ χρήσιμη στο μέλλον την παρακολούθηση της έρευνας και της νόσου του καρκίνου.

Υλικά και Μέθοδοι

Τα δείγματα ασθενών

δείγματα λευχαιμίας που χρησιμοποιούνται στην Leucégène τα δεδομένα που συλλέχθηκαν από το Κεμπέκ λευχαιμία Τράπεζας με πληροφόρησε γραπτή συγκατάθεση και έγκριση του σχεδίου από το Διοικητικό συμβούλιο Έρευνας Ηθικής του Maisonneuve-Rosemont Νοσοκομείο και Πανεπιστήμιο του Μόντρεαλ, όπως περιγράφεται [14]. δείγματα αίματος ανθρώπινου ομφάλιου λώρου συλλέχθηκαν από υγιείς εθελοντές από Hema-Québec με ενημέρωσε γραπτή συγκατάθεση και έγκριση του σχεδίου από το Διοικητικό Συμβούλιο Έρευνας Ηθικής του Ste. Justine Νοσοκομείο και Πανεπιστήμιο του Μόντρεαλ.

RNA-επόμενα

RNA-επόμενα διεξήχθη όπως περιγράφεται [14]. Τα στοιχεία που συζητήθηκαν στην παρούσα έκδοση έχουν κατατεθεί στο Gene Expression NCBI του Omnibus [15] και είναι προσβάσιμα μέσω του αριθμού ένταξη GEO Σειρά GSE48173 (https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc = GSE48173).

qRT-PCR

Ολικό RNA απομονώθηκε από λευχαιμικά και κύτταρα CD34 + αίματος ομφάλιου λώρου με τη χρήση διαλύματος ΤπζοΙ, σύμφωνα με το πρωτόκολλο του κατασκευαστή (Invitrogen /Life Technologies, Burlington, ΟΝ, Καναδάς ). Ανθρώπινα κύτταρα CD34 + αίματος ομφάλιου λώρου απομονώθηκαν από το συνολικό αίμα του ομφάλιου λώρου, χρησιμοποιώντας το καλώδιο RosetteSep αίμα Kit CD34 προ-εμπλουτισμού, ακολουθούμενο από το CD34 Cord Blood + Επιλογή κιτ EasySep του Ανθρώπου, σύμφωνα με τις οδηγίες του κατασκευαστή (StemCell Technologies, Vancouver, BC, Καναδάς), αποδίδοντας 70 -86% CD34 +. CD34 + μυελού δείγματα αίματος από πέντε διαφορετικά άτομα χρησιμοποιήθηκαν αμέσως για αντίστροφη μεταγραφή. Επιπλέον, CD34 + δείγματα αίματος ομφάλιου λώρου από δώδεκα επιπλέον άτομα ταξινομήθηκαν χρησιμοποιώντας FACS Aria κύτταρο διαλογέα (Becton-Dickinson, San Jose, CA, USA) για να κρατήσει μόνο CD34_APC + /CD45RA_PE- κύτταρα (Αντισώματα: Becton-Dickinson, San Jose, CA, USA ) πριν προχωρήσετε με αντίστροφη μεταγραφή. Αντίστροφη μεταγραφή του ολικού RNA πραγματοποιήθηκε με τη χρήση MMLV αντίστροφης μεταγραφάσης και τυχαίων εξαμερών σύμφωνα με τις οδηγίες του κατασκευαστή (Invitrogen /Life Technologies, Burlington, ΟΝ, Canada). δοκιμασίες έκφρασης έγιναν για τη μέτρηση των επιπέδων έκφρασης των γονιδίων με τη χρήση 2 × Fast Master Mix (Applied Biosystems /Life Technologies, Burlington, ON, Καναδάς), πρότυπο εκκινητές (Invitrogen /Life Technologies, Burlington, ON, Καναδάς) και έναν ειδικό καθετήρα από την Οικουμενική Probe Βιβλιοθήκη (Roche Diagnostics, Laval, QC, Καναδάς). Αντιδράσεις qRT-PCR έγιναν σχετικά με την ABI 7900HT Fast Real-Time PCR System (Applied Biosystems /Life Technologies, Burlington, ON, Καναδάς). Για RQ (σχετική ποσοτικοποίηση) υπολογισμούς, από ένα δεδομένο δείγμα δοκιμής, η Ct (κύκλος κατωφλίου) τιμές για κάθε γονίδιο κανονικοποιήθηκαν στο γονίδιο ελέγχου (DCT = Ct-στόχοι – Ct Control) και σε σύγκριση με τη μέση DCT από το CD34 + αίματος ομφάλιου δείγματος (βαθμονομητή) χρησιμοποιώντας τη μέθοδο ddCt (ddCT = DCT δείγμα – dCt Calibrator? RQ = 2∧-ddCt). συνθήκες ποδηλασίας qRT-PCR ήταν ως εξής: 2 λεπτά στους 50 ° C και 10 λεπτά στους 95 ° C, που ακολουθείται από 40 κύκλους των 15 δευτερολέπτων στους 95 ° C και 1 λεπτό στους 59 ° C

Αποτελέσματα

η μεταβλητότητα που χρησιμοποιούνται συνήθως γονίδια ελέγχου στα δεδομένα RNA-επόμενα

Για τις μελέτες αυτές, κάναμε χρήση δεδομένων RNA-επόμενα ελήφθη στο έργο Leucégène μας, η οποία εξαγοράστηκε από μια ομάδα 55 ασθενών Λευχαιμία δείγματα (43 AML, 12 ALL) από Κεμπέκ λευχαιμία κυττάρων Τράπεζα (BCLQ). Αναλύσαμε περαιτέρω RNA-seq δεδομένα από διάφορους καρκίνους και οι συναφείς φυσιολογικούς ιστούς, συμπεριλαμβανομένων των AML, του μαστού, του πνεύμονα, του παχέος εντέρου και των νεφρών, όλα διαθέσιμα στο κοινό από τον καρκίνο Γονιδιώματος Atlas (TCGA). Το συνδυασμένο σύνολο δεδομένων TCGA αντιπροσωπεύει τα δεδομένα από ένα σύνολο 1933 ασθενών (207 φυσιολογικός ιστός και 1726 δείγματα καρκινικού ιστού) (Πίνακας S1).

Για να εκτιμηθεί το γονίδιο της συνέπειας της έκφρασης, εξετάσαμε τη μεταβλητότητα στις τιμές RPKM μεταξύ διαφορετικών ασθενών δείγματα σε ένα δεδομένο σύνολο δεδομένων RNA-seq. Αυτό επιτεύχθηκε με τον υπολογισμό του συντελεστή διακύμανσης (CV) και της μεταβολής μέγιστης αναδίπλωσης (MFC) για κάθε γονίδιο σε πολλαπλά δείγματα εντός κάθε σύνολο δεδομένων? όπου CV αντιπροσωπεύει την τυπική απόκλιση διαιρούμενη με τη μέση RPKM, και MFC αντιπροσωπεύει τη μέγιστη RPKM διαιρούμενο με την ελάχιστη τιμή RPKM.

Αναλύσαμε πρώτα τη συνέπεια έκφραση της 19ης χρησιμοποιούνται συνήθως γονίδια ελέγχου στην Leucégène και η συνδυασμένη TCGA σύνολα δεδομένων. Πρότυπο γονίδια ελέγχου κατατάσσονται από το χαμηλότερο στο υψηλότερο CV (Πίνακας 1). Χρησιμοποιώντας αυτή την προσέγγιση, βρήκαμε ότι η πιο συνεπής συχνά χρησιμοποιούμενη γονίδιο ελέγχου, και στις δύο ομάδες δεδομένων, ήταν Protein Binding ΤΑΤΑ (

ΤΒΡ

), αποδίδοντας ένα CV ίση με 22,8 ή 44,9% και MFC ίσο με 2,5 ή 12.2, σε Leucégène ή συνδυασμένα σύνολα δεδομένων TCGA, αντίστοιχα. Ableson (

ABL1

), ένα γονίδιο ελέγχου που χρησιμοποιούνται συνήθως για δείγματα λευχαιμίας, έδωσε μια ελαφρώς χαμηλότερη βιογραφικό στη συνδυασμένη σύνολο δεδομένων TCGA (39,8%), αλλά είχε ένα υψηλό MFC (26,9). Η πλειοψηφία που χρησιμοποιούνται συνήθως γονίδια ελέγχου παρουσίασαν μεταβλητότητα, με τιμές που κυμαίνονται CV 27,2 έως 69,1% σε Leucégène (διάμεση τιμή CV = 42,6%), και 47,0 έως 116,2% στα συνδυασμένα δεδομένα TCGA (διάμεση τιμή CV = 61,4%). Όχι απροσδόκητα, διαπιστώσαμε ότι η μεταβλητότητα των γονιδίων ήταν υψηλότερη στη συνδυασμένη δεδομένα TCGA, το οποίο αντιπροσωπεύει μια πιο διαφοροποιημένη συλλογή των δειγμάτων από πέντε διαφορετικούς τύπους καρκίνου και τρεις διαφορετικούς φυσιολογικούς τύπους ιστών. Αυτή μεγαλύτερο βαθμό διακύμανσης στη συνδυασμένη δεδομένων TCGA ήταν πιο εμφανής στις αξίες MFC, οι οποίες επηρεάζονται περισσότερο σημαντικά από ακραίες διαφορές της έκφρασης σε μεμονωμένα δείγματα. τιμές MFC κυμαινόταν 2,5 έως 31,7 φορές σε Leucégène (διάμεσος = 8,3), και 12,2 έως 639,5 φορές τα συνδυασμένα δεδομένα TCGA (διάμεσος = 84,0).

Η

Εμείς εξεταστεί περαιτέρω η συνοχή έκφραση της 12 υποψήφιες γονίδια ελέγχου που προσδιορίζονται από de Jonge

et al.

[7], όπως είναι οι εκφράζονται πιο σταθερά γονίδια σε μια συλλογή πειραμάτων μικροσυστοιχιών. Αυτή η λίστα γονίδιο αποτελείται από 10 γονίδια που κωδικοποιούν ριβοσωμικές πρωτεΐνες, καθώς και

SRP14

και

OAZ1

(Πίνακας 2). Χρησιμοποιώντας την παραπάνω προσέγγιση, βρήκαμε ότι οι υποψήφιοι που προσδιορίζονται από τα δεδομένα μικροσυστοιχιών έδειξαν μεταβλητότητα παρόμοιες με εκείνες των τυποποιημένων γονίδια καθαριότητας, με διάμεσο βιογραφικό ίση με 48,5 ή 51,6% και μέση τιμή MFC ίσο με 8,3 ή 44,5, σε Leucégène ή σε συνδυασμό TCGA σύνολα δεδομένων, αντίστοιχα. Η πιο συνεπής γονίδιο από αυτή τη λίστα ήταν Σήματος Αναγνώριση Σωματιδίων 14 kDa (

SRP14

). Αξίζει να σημειωθεί ότι, ενώ αυτά τα γονίδια που παρουσιάζονται παρόμοια διακύμανση των δεδομένων Leucégène που σε σύγκριση με τα συνήθως χρησιμοποιούμενα γονίδια ελέγχου, αυτοί απέδειξαν να είναι ελαφρώς λιγότερο μεταβλητή στο συνδυασμένο σύνολο δεδομένων TCGA. Ωστόσο, υπήρχε ακόμη σημαντική μεταβλητότητα εντός των δεδομένων TCGA, η οποία έδειξε% τιμές CV έως 82,0 για

RPS16

, και τις αξίες MFC έως 1208.3 για

RPL9

.

Η

Επιλογή της βελτιωμένης γονίδια ελέγχου από Leucégène RNA-επόμενα δεδομένα

για να διαπιστώσετε βελτιωμένη γονίδια ελέγχου με την πιο συνεπή έκφραση, ιδρύσαμε cut-offs για την% CV και MFC που ήταν χαμηλότερες από τις τιμές που λήφθηκαν για την πλειοψηφία των γονιδίων που χρησιμοποιούνται συνήθως ελέγχου. Εντός του συνόλου δεδομένων Leucégène, αναλύσαμε ολόκληρη την μεταγραφικό των 21.892 γονιδίων και επιλέγονται εκείνα τα οποία είχαν CV% λιγότερο από 25 και ένα MFC μικρότερη από 5, για δύο διαφορετικές περιοχές της έκφρασης: μέση RPKM μεγαλύτερο ή μικρότερο από 100 (αλλά μεγαλύτερη από 25). Τα γονίδια αυτά, στη συνέχεια, κατατάσσονται από το χαμηλότερο στο υψηλότερο% CV (Πίνακας 3). Χρησιμοποιώντας αυτά τα κριτήρια, εντοπίσαμε 20 γονίδια υποψήφια ελέγχου με μέση επίπεδα RPKM μεγαλύτερο από 100, και τα γονίδια ελέγχου 99 υποψήφιος με μέση επίπεδα RPKM λιγότερο από 100 (πίνακας 3 περιέχει τα καλύτερα 20 γονίδια? Ο πλήρης κατάλογος είναι διαθέσιμος στον πίνακα S2). Ο πλήρης κατάλογος των 119 γονιδίων με τις περιγραφές τους είναι διαθέσιμες στον πίνακα S4. Από αυτές, επιλέξαμε 15 γονίδια για επικύρωση με βάση την υψηλή κατάταξη τους στα δεδομένα Leucégène, καθώς επίσης και έχοντας σχετικά συνεπή έκφραση στα διάφορα σύνολα δεδομένων TCGA (Πίνακας S3). Τα πρόσφατα εντοπίστηκαν γονίδια υποψήφια ελέγχου είναι:

HNRNPK, PCBP2, SLC25A3, GNB1, HNRNPL, SRP14

(RPKM & gt? 100)? και

PSMD6, PSMA1, PSMF1, VPS4A, SF3B2, EIF4H, ZNF207, UBE2I

(RPKM & lt? 100). EIF4H είχαν ελαφρώς υψηλότερη έκφραση στα διάφορα σύνολα δεδομένων TCGA, και ως εκ τούτου, περιλαμβάνονται στον πίνακα των γονιδίων με την υψηλότερη έκφραση για τις επόμενες αναλύσεις.

Η

Λειτουργική ομαδοποίηση των γονιδίων ελέγχου υποψήφιος

αξιολόγησε την λειτουργική ταξινόμηση του ολόκληρη τη λίστα μας από 119 γονίδια που εντοπίστηκαν από το σύνολο δεδομένων Leucégène χρησιμοποιώντας τον DAVID αλγόριθμο [16], [17] (Πίνακας S5). Είναι ενδιαφέρον ότι, ένα σημαντικό μέρος αυτών των εξαιρετικά συνεπής γονίδια έπεσε σε δύο κύριες λειτουργικές κατηγορίες: (. Ex

SF3B2

) μάτισμα RNA /επεξεργασία, με εμπλουτισμό βαθμολογία 5,92? και η δραστηριότητα λιγάσης πρωτεασώματος /ουβικιτίνης, με εμπλουτισμό βαθμολογία 5,76 (ex.

PSMA1

).

Εκκαθάριση των νέων γονιδίων ελέγχου σε άλλα σύνολα δεδομένων καρκίνου του RNA-επόμενα

Η συνοχή έκφραση των γονιδίων 15 υποψήφιες ελέγχου εξετάστηκε περαιτέρω σε 8 διαφορετικά σύνολα δεδομένων από TCGA, που αντιπροσωπεύουν 6 διαφορετικούς τύπους καρκίνου και φυσιολογικά δείγματα ιστού, καθώς επίσης και σε φυσιολογικά δεδομένα αίμα του ομφάλιου λώρου λαμβάνεται με Leucégène (Πίνακας S1). Τα γονίδια ελέγχου 15 υποψήφιος αποδείχθηκε ότι εκφράζεται πολύ σταθερά σε όλες τις 4 σύνολα δεδομένων των φυσιολογικών ιστών, κάθε αποδίδοντας ένα CV μικρότερη ή ίση με 25%, και ένα MFC μικρότερη ή ίση με 10 (Πίνακας S3). Αξίζει να σημειωθεί, τα υποψήφια γονίδια έδειξαν υψηλότερη συνοχή στα δείγματα αίματος 17 CD34 + μυελού (εμπλουτισμένο φυσιολογικών αρχέγονων και προγονικών κυττάρων), που το καθένα απέδωσε CVs μικρότερη ή ίση με 15%, και ΜΡΟ λιγότερο από 2. Εντός των συνόλων δεδομένων όγκου, εμείς παρατηρήθηκε πιο μεταβλητότητα, με το υψηλότερο CV είναι 42% για το

SLC25A3

στον καρκίνο του νεφρού, και η υψηλότερη MFC είναι 24 για

SF3B2

στον καρκίνο του μαστού. Ωστόσο, η πλειονότητα των υποψηφίων γονιδίων εμφάνισαν χαμηλότερα μεταβλητότητα σε όλα τα σύνολα δεδομένων, σε σύγκριση με το πρότυπο γονίδια καθαριότητας. Προσδιορίσαμε μια βαθμολογία για κάθε υποψήφιο γονίδιο με βάση τον αριθμό των συνόλων δεδομένων που αναλύθηκαν (10 συνολικά), στο οποίο το βιογραφικό σημείωμα και τις αξίες MFC τηρούνται αρχικά κριτήρια επιλογής μας (CV & lt? 25%, MFC & lt? 5). Τα γονίδια στη συνέχεια κατατάσσονται σύμφωνα με αυτό το σύστημα βαθμολόγησης. Υπολογίσαμε επίσης τη μεταβλητότητα της έκφρασης των γονιδίων υποψήφιων ελέγχου χρησιμοποιώντας το συνδυασμένο σύνολο TCGA δεδομένα (Εικόνα 1 και Πίνακας 4). Όπως και με το πρότυπο γονίδια ελέγχου, μπορούμε τήρησε πιο μεταβλητότητα σε σχέση με τα επιμέρους σύνολα δεδομένων, γεγονός που αντικατοπτρίζει την ποικιλομορφία των τύπων ιστών που περιλαμβάνονται. Παρ ‘όλα αυτά, τα 15 από τα υποψήφια γονίδια που εμφανίζονται συνέπεια που ήταν μεγαλύτερη από την πλειονότητα από τα κοινώς χρησιμοποιούμενα γονίδια ελέγχου. Οι τιμές CV ήταν όλοι χαμηλότερο από εκείνο του

TBP

, ωστόσο,

UBE2I

και

SF3B2

απέδωσε τιμές CV ελαφρώς υψηλότερο από ό, τι

ABL1

. Μόνο

SF3B2

έδωσε ένα MFC υψηλότερο από αυτό των

ABL1

(Πίνακας 4). Η πλειοψηφία των υποψήφιων γονιδίων είχαν τιμές CV στο χαμηλότερο 5

ου quantile και το υπόλοιπο έπεσε κάτω από το 25

ου ποσοστημόριο, σε αντίθεση με το πρότυπο γονίδια ελέγχου, εκ των οποίων HPRT1 και GAPDH ήταν στην πραγματικότητα πιο μεταβλητή από το ήμισυ τα γονίδια υπάρχουν σε παρόμοια επίπεδα έκφρασης (Σχήμα 1).

η μέση έκφραση αντιπροσωπεύει το μέσο όρο όλων των τιμών RPKM για ένα δεδομένο γονίδιο σε όλον τον συνδυασμένο σύνολο δεδομένων TCGA (1933 δείγματα). Συντελεστής μεταβολής ισούται με την τυπική απόκλιση διαιρούμενη με τη μέση RPKM. Κάθε κουκίδα αντιπροσωπεύει ένα μόνο γονίδιο: μικρές γκρι τελείες αντιπροσωπεύουν ολόκληρο το μεταγραφικό? σκούρο και ανοιχτό πράσινο κουτιά αντιπροσωπεύουν νέα γονίδια ελέγχου με την έκφραση μεγαλύτερο ή μικρότερο από 100 RPKM, αντίστοιχα? κόκκινα κουτιά αντιπροσωπεύουν τις υποδεικνυόμενες πρότυπο γονίδια ελέγχου. Καμπυλωτό μπλε γραμμές αντιπροσωπεύουν το 5

ου, 25

ου, 50

ου και 75

ου ποσοστιαίων του συντελεστή μεταβλητότητας για δεδομένο επίπεδο έκφρασης (από πιο σκοτεινές και στο πιο μικρό) υπολογίζεται πάνω από τα παράθυρα του 2000 κατετάγη γονίδια επίκεντρο για μια δεδομένη μέση τιμή RPKM.

η

σε γενικές γραμμές, τα 15 πρόσφατα επιλεγμένα γονίδια ελέγχου εμφανίσει ένα μεγαλύτερο βαθμό συνέπειας στην έκφραση του γονιδίου σε σύγκριση με τα συνήθως χρησιμοποιούμενα γονίδια ελέγχου, όπως καθορίζεται από την RNA -SEQ. Τα γονίδια υψηλότερη κατάταξη, όπως καθορίζεται από την κατοχή χαμηλό συντελεστή μεταβλητότητας (CV) και μέγιστη μεταβολή φορές (MFC) οι τιμές στα περισσότερα σύνολα δεδομένων που αναλύονται είναι: HNRNPL και ZNF207, με υψηλό και μέσο έκφρασης κυμαίνεται, αντίστοιχα

QPCR επικύρωση νέων γονιδίων ελέγχου

για να αξιολογηθεί η αποτελεσματικότητα των νέων εντοπίστηκαν γονίδια ελέγχου για την ποσοτική ανάλυση RT-PCR (qRT-PCR), έχουμε αναπτύξει δοκιμασίες για τους υποψηφίους χρησιμοποιώντας την Οικουμενική Probe Βιβλιοθήκη (Roche ) (Πίνακας S6). Νέες δοκιμασίες σχεδιάστηκαν ώστε να καλύπτουν τα όρια ιντρονίου, και δοκιμάστηκαν για βέλτιστη απόδοση με τυπική ανάλυση καμπύλης.

SRP14

αποκλείστηκε λόγω της αδυναμίας να σχεδιάσει μια δοκιμασία που εκτείνονται ιντρόνιο. qRT-PCR διεξήχθη για κάθε μία από τις 14 νέα γονίδια, καθώς επίσης και για 5 πρότυπο γονίδια ελέγχου (

GAPDH, ACTB, ΤΒΡ, HPRT1, ABL1

), σε cDNA από ένα πάνελ 14 δείγματα λευχαιμίας (10 AML, 4 ALL) συν ένα δείγμα CD34 + καλώδιο του αίματος (χρησιμοποιώντας ίσες ποσότητες RNA). Η μέση συνοχή έκφραση (Μ) του κάθε γονιδίου υπολογίστηκε χρησιμοποιώντας τον αλγόριθμο GeNorm [18] (Σχήμα 2). Με qRT-PCR, όλα τα 14 από τα πρόσφατα εντοπίστηκαν γονίδια ελέγχου είχαν χαμηλότερες τιμές Μ από τα standard γονίδια ελέγχου, επιβεβαιώνοντας ότι εκφράστηκαν με μεγαλύτερη συνέπεια στα δείγματα λευχαιμίας, σε συμφωνία με τα δεδομένα RNA-επόμενα, με

EIF4H

και

PSMA1

είναι η πιο συνεπής σε αυτή την πειραματική συνθήκη.

Μέση συνέπειας έκφρασης (Μ) υπολογίστηκε με τον αλγόριθμο GeNorm [18] με βάση qRT-PCR για την υποδεικνυόμενη γονίδιο ελέγχου σε ένα πάνελ από 14 δείγματα λευχαιμίας και ένα δείγμα αίματος του ομφάλιου λώρου. Χαμηλότερες τιμές Μ αφορούν γονίδια που αποδείχθηκε ότι έχουν πιο σταθερά επίπεδα έκφρασης σε όλα τα δείγματα που χρησιμοποιήθηκαν.

Η

Αν και είναι ευρέως θεωρείται ότι το RNA-επόμενα δεδομένων συσχετίζεται καλά με τα δεδομένα qRT-PCR, υπάρχουν λίγα στοιχεία διαθέσιμες για την αντιμετώπιση αυτού του θέματος. Ως εκ τούτου, αξιολόγησε την έκφραση του

CD33

και

FLT3

(τα δεδομένα δεν φαίνονται) στα ίδια 15 λευχαιμία και το αίμα ομφάλιου λώρου δείγματα προκειμένου να αποδείξει συσχέτιση μεταξύ του RPKM και Ct τιμές δέλτα (DCT) για το γονίδιο αυτό. Αυτά τα δύο γονίδια επιλέχθηκαν λόγω της γνωστής τους μεταβλητότητα της έκφρασης σε λευχαιμία. Οι τιμές Ct δέλτα για κάθε δείγμα υπολογίστηκαν χρησιμοποιώντας είτε ένα πρότυπο γονίδιο ελέγχου (

GAPDH

), ή ένα πρόσφατα εντοπίστηκαν γονίδιο ελέγχου (

HNRNPL, EIF4H, PSMA1, ή SF3B2

). ανάλυση συσχέτισης Spearman του

CD33

δεδομένων έκφρασης κατέδειξε υψηλή συσχέτιση μεταξύ RPKM και DCT (ρ = -0,9714 έως -0,9893 για

EIF4H

), εκτός εάν

GAPDH

χρησιμοποιήθηκε ως το γονίδιο ελέγχου (ρ = -0.775) (Σχήμα 3). Ανάλυση με

FLT3

έδειξε παρόμοια συσχέτιση. Ο χαμηλότερος βαθμός συσχέτισης μεταξύ RPKM και dCt όταν χρησιμοποιούν το

GAPDH

ως γονίδιο ελέγχου καταδεικνύει τη σημασία της σωστής επιλογής γονιδίων ελέγχου σε πειράματα qRT-PCR.

dCt αντιπροσωπεύει τη διαφορά μεταξύ της τιμής Ct του

CD33

και εκείνη της ενδεικνυόμενης γονίδιο ελέγχου, για ένα δεδομένο λευχαιμικών δείγμα, μετρήθηκε με qRT-PCR. RPKM χαράσσεται σε λογαριθμική κλίμακα-2 και αντιπροσωπεύει το Διαβάζει Ανά κιλοβάσεων του μεταγραφήματος ανά εκατομμύριο χαρτογραφηθεί διαβάζει λαμβάνονται για κάθε δείγμα λευχαιμικών από την RNA-seq. ρ αντιπροσωπεύει το συντελεστή συσχέτισης Spearman μεταξύ του RPKM και την dCt που λαμβάνεται με την υποδεικνυόμενη γονίδιο ελέγχου.

Η

Για να αντιμετωπιστεί περαιτέρω τη σημασία της σωστής επιλογής γονιδίων ελέγχου στην ανάλυση qRT-PCR, υπολογίσαμε τη σχετική ποσοτικοποίηση ( RQ) τιμές για εκφράζεται σταθερά γονίδιο (

EIF4H

), χρησιμοποιώντας είτε

GAPDH

ή

HNRNPL

για εξομάλυνση (Σχήμα 4). Όπως ήταν αναμενόμενο, το RQ του

EIF4H

μεταβάλλεται πολύ λίγο μεταξύ των δειγμάτων λευχαιμία όταν

HNRNPL

χρησιμοποιήθηκε ως γονίδιο ελέγχου (CV = 14%? MFC = 1.6). Ωστόσο, οι τιμές RQ των ίδιων δειγμάτων υπολογίζεται χρησιμοποιώντας το

GAPDH

ποικίλη όσο 10,7 φορές, με τιμές RQ κυμαίνονται 0,22 – 2,29 (CV = 88%). Εξομάλυνση με το

GAPDH

είχε ως αποτέλεσμα έως και 5,3 φορές διαφορά στο

EIF4H

έκφρασης μέσα σε μεμονωμένα δείγματα, σε σύγκριση με το

HNRNPL

εξομάλυνση. Τα ευρήματα αυτά υπογραμμίζουν τη σημασία της χρήσης πιο συνεπής γονίδια ελέγχου, όπως προσδιορίζονται στην παρούσα μελέτη σε ανάλυση qRT-PCR, και την περαιτέρω επικύρωση πρόσφατα εντοπίστηκαν γονίδια από τον έλεγχό μας.

RQ αντιπροσωπεύει σχετική ποσοτικοποίηση του

EIF4H

καθορίζεται από qRT-PCR, που υπολογίζεται χρησιμοποιώντας τη μέθοδο ddCt είτε με

GAPDH

ή

HNRNPL

ως το γονίδιο ελέγχου, σε σχέση με το δείγμα CD34 + λώρου (CB). Ο άξονας Χ δείχνει την λευχαιμικών δείγμα ID. CV (εκφραζόμενη ως ποσοστό) υποδεικνύει το συντελεστή διακύμανσης και ισούται με το τυπική απόκλιση διαιρούμενη με τη μέση RQ του CD33 υπολογίζεται χρησιμοποιώντας την ενδεικνυόμενη γονίδιο ελέγχου. MFC (μέση φορές μεταβολής) αντιπροσωπεύει τη μέγιστη διαιρείται με ελάχιστη τιμή RQ.

Η

Συζήτηση

Η αξιολόγηση της γονιδιακής έκφρασης με ποσοτική RT-PCR (qRT-PCR) βασίζεται στην εξομάλυνση με ένα ενδογενές γονίδιο ελέγχου, με αποτέλεσμα την σχετική ποσοτικοποίηση του γονιδίου ενδιαφέροντος. Οι περισσότεροι ερευνητές χρησιμοποιούν ένα μόνο γονίδιο ελέγχου, η επιλογή των οποίων είναι συχνά βασίζεται αποκλειστικά σε σύμβαση [3], [6]. Τα γονίδια ελέγχου που χρησιμοποιούνται συνηθέστερα είχαν αρχικά επιλεγεί λόγω των υψηλών επιπέδων έκφρασής τους σε όλους τους ιστούς και όχι χαμηλή μεταβλητότητα μεταξύ ιστών τους [6]. Ωστόσο, πολυάριθμες μελέτες έχουν δείξει ότι αυτά τα γονίδια μπορεί να ποικίλλει σημαντικά [1] – [5], χύτευση έτσι αμφιβολίες για την ακρίβεια των σχετικών τιμών ποσοτικοποίησης

Ενώ πολλές μελέτες έχουν γίνει σε προσπάθειες να προσδιοριστεί καλύτερες μεθόδους για. εξομάλυνση της έκφρασης των γονιδίων [6], [18] – [20], οι περισσότεροι ερευνητές εξακολουθούν να επιλέγουν να χρησιμοποιούν τη μέθοδο ddCt με ένα ή δύο γονίδια ελέγχου, χωρίς την κατάλληλη επικύρωση των εν λόγω ελέγχων. Υπήρξαν σχετικά λίγες μελέτες που αποσκοπούν στον εντοπισμό νέων γονιδίων ελέγχου των οποίων η έκφραση επίπεδα είναι πιο συνεπής από εκείνα σε κοινή χρήση, όπως παρουσιάζεται εδώ. Ένα ζευγάρι από μελέτες που έχουν γίνει με αυτόν τον κοινό στόχο στηρίχθηκε σε δεδομένα μικροσυστοιχιών μετα-ανάλυση [7], [8], ενώ η μελέτη μας χρησιμοποιεί τα δεδομένα της επόμενης αλληλουχίας γενιάς. Και οι δύο αυτές μελέτες εντοπίζονται κυρίως ριβοσωμικής πρωτεΐνης (

RP

) που κωδικοποιούν τα γονίδια, ενώ η ανάλυσή μας δεν αποκάλυψε γονίδια από αυτή την οικογένεια. Στην πραγματικότητα, δείχνουμε εδώ ότι οι ειδικές γονίδια RP περιγράφεται από de Jonge

et al.

[7] είναι παρόμοια με εκείνη των τυποποιημένων γονίδια ελέγχου σε σχέση με την μεταβλητότητα τους στην γονιδιακή έκφραση, όπως προσδιορίζεται από RNA- seq.

RP

γονίδια αντιπροσωπεύουν την πιο εντόνως εκφρασμένα ομάδα γονιδίων (περίπου το 50% των 100 πιο υψηλά εκφραζόμενα γονίδια στα δεδομένα RNA-seq αναλύθηκαν, τα δεδομένα δεν παρουσιάζονται). Ως εκ τούτου, μια πιθανή εξήγηση για την ασυμφωνία μεταξύ των αναλύσεων που εκτελούνται για μικροσυστοιχιών εναντίον δεδομένων RNA-επόμενα θα μπορούσε να είναι ότι ο κορεσμός του σήματος φθορισμού σε μικροσυστοιχίες έχει οδηγήσει σε μια ψευδή εντύπωση της συνέπειας. Ενώ ο υπολογισμός RPKM μικρής γονιδίων (όπως

RP

γονίδια) μπορεί να είναι επιρρεπής σε υψηλότερες τεχνικές μεταβλητότητα από ό, τι καιρό γονίδια, σε υψηλά επίπεδα έκφρασης αυτή η επίδραση είναι μικρή, και το βιογραφικό σημείωμα κυριαρχείται από βιολογική ποικιλία. Στην πραγματικότητα, οι τιμές CV για

RP

γονίδια στη συνδυασμένη σύνολο δεδομένων TCGA έδειξε μια δίκαιη κατανομή σε όλα τα επίπεδα έκφρασης (τα δεδομένα δεν δείχνονται), υποδηλώνοντας ότι δεν υπάρχει προκατάληψη για τα γονίδια RP στα δεδομένα RNA-seq.

RNA-seq ανάλυση έχει πολλά πλεονεκτήματα σε σχέση με μικροσυστοιχίες για την ανάλυση των παγκόσμιων γονιδιακής έκφρασης. Πιο συγκεκριμένα, επειδή RNA-seq διαβάζει είναι ψηφιακά και όχι αναλογικά, υπάρχει πολύ χαμηλό σήμα υποβάθρου, και ουσιαστικά δεν ανώτερο όριο για την ανίχνευση, με αποτέλεσμα ένα πολύ μεγαλύτερο δυναμικό εύρος [9] – [13], [21]. Μελέτες έχουν αποκαλύψει ένα υψηλότερο βαθμό τεχνικής αναπαραγωγιμότητας με RNA-seq πάνω μικροσυστοιχίες [9], [10], και ότι τα επίπεδα έκφρασης του RNA-seq συσχετίζονται καλύτερα με τα δεδομένα qRT-PCR, ανεξάρτητα από την πλατφόρμα προσδιορισμού αλληλουχίας που χρησιμοποιείται [21]. δεδομένα μικροσυστοιχιών είναι ευαίσθητη σε σφάλματα που προκύπτουν από αντικείμενα υβριδισμό, ο κορεσμός του σήματος φθορισμού, και απαιτεί πολύπλοκη ομαλοποίηση [10] – [12]. RNA-επόμενα παρακάμπτει αυτά τα θέματα? Ωστόσο, άλλες πιθανές πηγές για λάθη υπάρχουν, όπως το μήκος του γονιδίου προκατάληψη, μεροληψία στις αλληλουχίας των πλούσιων σε GC περιοχές, τα τεχνικά ζητήματα στο πλαίσιο της προετοιμασίας της βιβλιοθήκης, ή σφάλματα στη χαρτογράφηση ανάγνωση [10], [12]. RNA-seq δεν περιορίζεται επίσης από την προηγούμενη γνώση του μεταγραφικό που μελετάται, επιτρέποντας την ταυτοποίηση νέων μεταγραφές και SNPs.

Εδώ έχουμε εντοπίσει συνολικά 119 γονίδια των οποίων η έκφραση είναι πιο συνεπής από την κοινώς χρησιμοποιούνται ελέγχου γονίδια σε ένα πάνελ από 55 δείγματα λευχαιμίας, όπως προσδιορίζεται από την RNA-seq. Λειτουργική ταξινόμηση αυτών από τον David αποκάλυψε δύο κύριες ομάδες εμπλουτισμού: (. Ex

PSMA1, PSMF1, UBE2I

) γονίδια που εμπλέκονται στα μονοπάτια της υποβάθμισης του πρωτεασώματος /ουβικιτίνης, και τα γονίδια που εμπλέκονται στην RNA μάτισμα και επεξεργασία (π.χ.

SF3B2

,

SRSF9

). Εκτός από αυτά τα λειτουργικά συμπλέγματα, βρήκαμε 12 γονίδια που εμπλέκονται στην μεταγραφή και 7 εμπλέκονται στην μετάφραση (ex.

EIF4H

). Μια εξέχουσα ομάδα γονιδίων που εντοπίζονται (n = 8) είναι οι ετερογενείς πυρηνική ριβονουκλεοπρωτείνες (ex.

HNRNPL, HNRNPK

), μερικά από τα οποία συμμετέχουν επίσης στις παραπάνω κυτταρικές διεργασίες. Αξίζει να σημειωθεί ότι η μελέτη από Popovici

et al.

[8] Επίσης, εντοπίστηκαν δύο

hnRNP

γονίδια, γονίδιο υπομονάδας ενός πρωτεασώματος,

Ουμπικουϊτίνη Β

και

C

και

EIF4H

ως έχει σε μεγάλο βαθμό συνεπής έκφραση σε όλη σύνολα δεδομένων για τον καρκίνο των μικροσυστοιχιών δέκα μαστού. Σε συμφωνία με τις μελέτες από de Jonge και Popovici, εντοπίσαμε επίσης

SRP14

ως ένα καλό γονίδιο ελέγχου. Παρά το γεγονός ότι

SRP14

ήταν ένα ισχυρό υποψήφιο, ήμασταν σε θέση να σχεδιάσει ένα ιντρόνιο-που εκτείνονται σε δοκιμασία qRT-PCR για αυτό, και δεν ήταν, επομένως, περιλαμβάνονται στα πειράματα επικύρωσης μας.

Από τα 119 γονίδια επιλέγεται από τα δεδομένα RNA-seq λευχαιμία, 14 επιλέχθηκαν με βάση την συνοχή τους σε άλλα σύνολα δεδομένων RNA-seq (TCGA) για την επικύρωση από qRT-PCR. Αυτό ήταν απαραίτητο να αντιπροσωπεύουν δυνητικές μεροληψίες εγγενείς στη διαδικασία RNA-seq, όπως η επιλογή του πολυ-Α + RNA, cDNA κατακερματισμό και την προετοιμασία της βιβλιοθήκης, καθώς και των δυνατοτήτων μεροληψίες εισήχθη bioinformatically [12]. Παρ ‘όλα αυτά, εμείς επιβεβαίωσε ότι όλα τα 14 γονίδια που εξετάστηκαν αποδείχθηκε να είναι πιο συνεπής από qRT-PCR σε μια επιλογή από 14 δείγματα λευχαιμίας από τα standard γονίδια ελέγχου. Επιπλέον, έχουμε δείξει ότι οι τιμές που λαμβάνονται με RPKM RNA-seq συσχετίζονται καλά με τις τιμές που λαμβάνονται με dCt qRT-PCR, και ότι αυτή η συσχέτιση είναι εξαρτάται από το γονίδιο ελέγχου που χρησιμοποιείται για τον υπολογισμό DCT. Μπορούμε επίσης να αποδεικνύουν σαφώς τις συνέπειες της επιλογής του γονιδίου σωστού ελέγχου σε πειράματα qRT-PCR, δεδομένου ότι για τον υπολογισμό των σχετικών αξιών ποσοτικοποίησης (RQ) του

EIF4H

(μια ιδιαίτερα συνεπή γονιδίου από την RNA-επόμενα) ποικίλλει σημαντικά όταν

GAPDH

χρησιμοποιήθηκε σε αντίθεση με το νέο μας έλεγχο,

HNRNPL

.

Ποσοτική RT-PCR χρησιμοποιείται όλο και περισσότερο για διαγνωστικούς και την ασθένεια σκοπούς παρακολούθησης, όπως η αξιολόγηση της ελάχιστης υπολειμματικής νόσου (MRD) στη λευχαιμία. Με δεδομένη την εξαιρετικά ευαίσθητη φύση αυτών των δοκιμασιών, είναι υψίστης σημασίας να χρησιμοποιήσετε το καλύτερο δυνατό γονίδιο ελέγχου για την ομαλοποίηση. Ableson (

ABL1

) έχει προηγουμένως αποδειχθεί ότι είναι η πιο συνεπής γονίδιο ελέγχου εξετάστηκαν για ανίχνευση MRD [22]. Ωστόσο, τα γονίδια ελέγχου προσδιορίζονται εδώ όλα αποδειχθεί ότι είναι πιο συνεπής από

ABL1

τόσο από την RNA-επόμενα και qRT-PCR δειγμάτων λευχαιμία, που τους καθιστά ιδανικούς υποψηφίους για χρήση σε MRD.

Παρά το γεγονός ότι τα γονίδια ελέγχου που παρουσιάζονται εδώ επελέγησαν αρχικά λόγω της συνοχή τους σε δείγματα λευχαιμίας, έχουμε επιλέξει εκείνα τα οποία ήταν επίσης σχετικά σταθερή σε άλλους τύπους καρκίνου, καθώς και των συναφών φυσιολογικά δείγματα, επεκτείνοντας έτσι δυνητικά χρησιμότητα τους ως γενικές γονίδια ελέγχου για τις περισσότερες ανθρώπινους ιστούς. Με βάση τις μελέτες επικύρωσης μας, αναμένουμε ότι η νέα έλεγχοι μας θα ξεπεράσουν τις τυπικές γονίδια ελέγχου σε μια ευρεία ποικιλία τύπων δείγματος. Ωστόσο, για άλλους τύπους καρκίνου, καλύτερα γονίδια έλεγχος μπορεί να υπάρχει, η οποία θα μπορούσε να προσδιοριστεί χρησιμοποιώντας την ίδια προσέγγιση που χρησιμοποιείται εδώ. Θα είναι σημαντικό για τους ερευνητές για την επικύρωση των νέων αυτών ελέγχων πριν από τη χρήση τους με πιο διαφορετικούς τύπους ιστών.

Θα ήταν ενδιαφέρον να αξιολογηθεί περαιτέρω η συνοχή των νέων γονιδίων από τον έλεγχό μας στο ποντίκι ή άλλο μοντέλο οργανισμούς. Μέχρι σήμερα, υπάρχει λιγότερη διαθέσιμη στο κοινό διαθέσιμο για τύπους μη-ανθρώπινο κύτταρο RNA-seq δεδομένων. Παρά το γεγονός ότι ομάδες όπως η Εγκυκλοπαίδεια του DNA Elements (ΚΩΔΙΚΟΠΟΙΗΣΗ) Κοινοπραξία παρέχουν εύκολη πρόσβαση σε έναν πλούτο των δεδομένων NGS με πολλούς τύπους κυττάρων ποντικού εκπροσωπούνται [23], τα περισσότερα πειράματα RNA-επόμενα έχουν μόνο 2-3 επαναλήψεις, σε αντίθεση με το μεγάλο αριθμό των ανθρώπινων δειγμάτων που χρησιμοποιούνται στα σύνολα δεδομένων του καρκίνου Γονιδιώματος Atlas (TCGA). Καθώς η τεχνολογία NGS γίνεται όλο και πιο ευρέως διαθέσιμα, μπορεί σύντομα να είναι εφικτό να εκτιμήσει τη συνέπεια αυτών των γονιδίων ελέγχου σε άλλους οργανισμούς.

Εν κατακλείδι, έχουμε κάνει χρήση των δεδομένων RNA-επόμενα για τον εντοπισμό 14 νέων γονιδίων ελέγχου με συνεπής έκφραση σε διάφορους τύπους καρκίνου. Αυτά τα γονίδια, συμπεριλαμβανομένων των

HNRNPL

,

EIF4H

και

PSMA1

, επικυρώθηκαν από qRT-PCR για χρήση ως γονίδια ελέγχου σε λευχαιμία.

Υποστήριξη Πληροφοριών

Πίνακας S1.

Τα σύνολα δεδομένων ΚΝΑ-seq αναλύθηκαν σε αυτή τη μελέτη. Leucégène, τα δεδομένα RNA-επόμενα δημιουργείται σε συνεργασία μεταξύ της λευχαιμίας Τράπεζα του Κεμπέκ και της διευκόλυνσης Γονιδιωματική πυρήνα στο Ινστιτούτο για την Έρευνα στην Ανοσολογία και καρκίνος (IRIC)? . TCGA, ο καρκίνος Γονιδιώματος Atlas Data Portal (https://cancergenome.nih.gov/)

doi: 10.1371 /journal.pone.0072884.s001

(XLSX)

Πίνακας S2.

You must be logged into post a comment.