PLoS One: Προσδιορισμός των ανθρώπινων γονιδίων Χονγκ Κονγκ και Μελέτη κανονισμού γονιδιακής έκφρασης για τον καρκίνο από Transcriptomics Ανάλυση Δεδομένων


Abstract

Η ρύθμιση της έκφρασης του γονιδίου είναι απαραίτητη για ευκαρυωτικούς οργανισμούς, όπως κινεί τις διαδικασίες της κυτταρικής διαφοροποίησης και της μορφογένεσης, που οδηγεί στη δημιουργία διαφορετικών τύπων κυττάρων σε πολυκύτταρους οργανισμούς. RNA-αλληλουχίας (RNA-Seq) παρέχει στους ερευνητές με ένα ισχυρό σύνολο εργαλείων για το χαρακτηρισμό και την ποσοτικοποίηση των μεταγραφικό. Πολλά διαφορετικά σύνολα δεδομένων ανθρώπινου ιστού /κυττάρου μεταγραφικό προέρχονται από RNA-Seq τεχνολογία είναι διαθέσιμη στις πόρο δημόσια δεδομένα. Το βασικό ζήτημα εδώ είναι πώς να αναπτύξει μια αποτελεσματική μέθοδο ανάλυσης για την εκτίμηση ομοιότητες πρότυπο έκφρασης μεταξύ των διαφορετικών καρκινικών ιστών και των αντίστοιχων φυσιολογικών ιστών τους. Ορίζουμε το μοτίβο έκφρασης του γονιδίου από τρεις κατευθύνσεις: 1) το εύρος της έκφρασης, η οποία αντανακλά τη γονιδιακή έκφραση on /off κατάσταση, και κυρίως τις ανησυχίες εκφράζονται παντού γονίδια? 2) γονίδια χαμηλή /υψηλή ή σταθερό /μεταβλητό έκφρασης, με βάση το επίπεδο της γονιδιακής έκφρασης και την παραλλαγή? και 3) τη ρύθμιση της γονιδιακής έκφρασης στο επίπεδο δομή γονιδίου. Η ανάλυση διασποράς δείχνει ότι προτύπου έκφρασης του γονιδίου είναι υψηλότερη σχετίζεται με φυσιολογική κατάσταση και όχι ιστό χωρική απόσταση. Δύο σετ των ανθρωπίνων καθαριότητας γονίδια (HK) ορίζεται σύμφωνα με τους τύπους των κυττάρων /ιστών, αντίστοιχα. Για να χαρακτηριστεί το μοτίβο έκφρασης του γονιδίου στο επίπεδο έκφρασης του γονιδίου και παραλλαγή, μπορούμε κατ ‘αρχάς ισχύουν βελτιωμένη K-σημαίνει αλγόριθμο και ένα μοντέλο διακύμανση γονιδιακής έκφρασης. Διαπιστώνουμε ότι σχετίζονται με τον καρκίνο γονίδια ΗΚ (ένα γονίδιο HK είναι ειδική στην ομάδα του καρκίνου, ενώ δεν είναι σε φυσιολογική ομάδα) εκφράζονται υψηλότερες και περισσότερο μεταβλητή σε κατάσταση καρκίνου από σε κανονικές συνθήκες. Καρκίνος που σχετίζεται με τα γονίδια HK προτιμούν να ΑΤ-πλούσια γονίδια, και είναι εμπλουτισμένη σε λειτουργίες που συνδέονται με ρύθμιση του κυτταρικού κύκλου και αποτελούν μερικές υπογραφές του καρκίνου. Η έκφραση των γονιδίων μεγάλης αποφεύγεται επίσης στην ομάδα του καρκίνου. Οι μελέτες αυτές θα μας βοηθήσουν να καταλάβουμε ποιες κυττάρων τύπου ειδικά πρότυπα της γονιδιακής έκφρασης διαφέρουν μεταξύ των διαφορετικών τύπων κυττάρων, και ιδιαίτερα για τον καρκίνο

Παράθεση:. Chen Μ, Xiao J, Zhang Ζ, Liu J, Wu J, Yu J (2013) Προσδιορισμός των ανθρώπινων γονιδίων Χονγκ Κονγκ και Μελέτη κανονισμού γονιδιακής έκφρασης για τον καρκίνο από Transcriptomics Ανάλυση δεδομένων. PLoS ONE 8 (1): e54082. doi: 10.1371 /journal.pone.0054082

Επιμέλεια: Ρατζίβ Samant, Πανεπιστήμιο της Αλαμπάμα στο Μπέρμιγχαμ, Ηνωμένες Πολιτείες της Αμερικής

Ελήφθη: 19 του Ιούλη 2012? Αποδεκτές: 6 Δεκέμβρη του 2012? Δημοσιεύθηκε: 31, Ιανουαρίου 2013

Copyright: © 2013 Chen et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Αυτή η μελέτη υποστηρίχθηκε από μια επιχορήγηση (2012AA020409) από τα εθνικά προγράμματα υψηλής Τεχνολογίας Έρευνας και Ανάπτυξης (863 Program), το Υπουργείο Επιστήμης και Τεχνολογίας της Λαϊκής Δημοκρατίας της Κίνας? και επιχορηγήσεις από το Εθνικό Ίδρυμα Επιστημών της Κίνας (Νο 31101063, Αρ 31271386 και Οχι, 31000584). Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

ρύθμιση γονιδιακής έκφρασης περιέχει την διαδικασία που τα κύτταρα και οι ιοί χρησιμοποιούν για να ρυθμίζουν τον τρόπο ότι οι πληροφορίες στα γονίδια μετατρέπεται σε γονιδιακά προϊόντα, τα περισσότερα εκ των οποίων είναι γονίδια που κωδικοποιούν πρωτεΐνες [1] – [3]. ρύθμιση γονιδιακής έκφρασης είναι απαραίτητη για ευκαρυωτικούς οργανισμούς [4], επειδή οδηγεί τις διαδικασίες της κυτταρικής διαφοροποίησης και της μορφογένεσης [5]. Αυτό οδηγεί στη δημιουργία διαφορετικών τύπων κυττάρων σε πολυκύτταρους οργανισμούς, όπου διαφορετικοί τύποι κυττάρων μπορούν να διαθέτουν διαφορετικά προφίλ γονιδιακής έκφρασης, αν και όλοι έχουν την ίδια αλληλουχία γονιδιώματος [6]. Μια σημαντική πρόκληση στην τρέχουσα έρευνα είναι το πώς να καθορίσει τον τρόπο ρύθμισης της γονιδιακής έκφρασης. Βασισμένο σε πλάτος γονιδιακή έκφραση [7] – [9], τα γονίδια μπορούν να χωριστούν σε γονίδια που εκφράζονται παντού [6] – [10], κοντά γονίδια καθολική HK, και τα ειδικά ιστού γονίδια /κυττάρου-ειδική. Με βάση το επίπεδο έκφρασης του γονιδίου, το γονίδιο μπορεί να προσδιοριστεί ως μια χαμηλή /υψηλή έκφραση γονιδίων [11], και ως σταθερά /έκφρασης γονιδίου μεταβλητής [12] – [13]. δομή του γονιδίου είναι ένας σημαντικός παράγοντας ρύθμισης για την έκφραση των γονιδίων. Αποτελείται κυρίως από τη σύνθεση γονιδιακή δομή, την οργάνωση δομή του γονιδίου, παραλλαγή γονιδίου, κατηγορίες πρωτεΐνης, κυτταρική δομή, κυτταρικές διεργασίες, και μοριακοί μηχανισμοί [10], [14] – [25].

RNA-Seq είναι γίνεται όλο και πιο δημοφιλής βιοτεχνολογίας, λόγω της μέτρησης της μεταγραφής του σε κυρίαρχη ακρίβεια και υψηλής απόδοσης για την ανίχνευση ασθενώς εκφραζόμενα γονίδια [10] – [11], [15], [26]. Λόγω των δραματικών εξελίξεις στην RNA-Seq, δεδομένων μεταγραφικό αυξηθεί ταχέως [25] – [27] στη βάση δεδομένων SRA. Σε προηγούμενες μελέτες της εξέλιξης του καρκίνου και γονιδιακή έκφραση μηχανισμούς ρύθμισης που βασίζεται σε δεδομένα μικροσυστοιχιών [28] – [30], οι ερευνητές κυρίως έναντι της γονιδιακής έκφρασης σε κατάσταση καρκίνου εναντίον κανονική κατάσταση με τα ίδια πρωτότυπα. Αυτή η μέθοδος θα μπορούσε να λείπει πολλές πραγματικά up-ρυθμίζονται διαφορετική έκφραση (DE) γονίδια από τη διαδικασία ομαλοποίησης [31], αγνοώντας το μηχανισμό που βασίζεται σε καρκίνο. Σε αυτή τη μελέτη, επιλέγουμε 12 φυσιολογικά δείγματα και 9 δείγματα καρκίνου για να εξερευνήσετε το γενικό μηχανισμό ρύθμισης της γονιδιακής έκφρασης του καρκίνου από τα δεδομένα μεταγραφικό RNA-Seq. Ορίζουμε το πρότυπο έκφρασης γονιδίου από τρεις κατευθύνσεις και χαρακτηρίζουν τον καρκίνο γονίδια HK να παρατηρήσει ρύθμιση της γονιδιακής έκφρασης σε κύτταρα καρκίνου. Αυτή η έρευνα θα μας βοηθήσει να κατανοήσουμε τα βασικά ρυθμιστικά γονίδια και την παθογένεση του καρκίνου.

Υλικά και Μέθοδοι

RNA-Seq μεταγραφικό σύνολο δεδομένων

RNA-Seq δείγματα υπό φυσιολογικές και τον καρκίνο προϋπόθεση επιλέγονται για τον εντοπισμό γονιδίων Χονγκ Κονγκ. Τα δύο βασικά στοιχεία υπόψη για την επιλογή, την ποσότητα και τον κορεσμό των επιλεγμένων δειγμάτων. Αν και RNA-Seq δείγματα είναι ογκώδη στην πόρων δημόσιων δεδομένων, τα χρήσιμα δείγματα για την κανονική vs καρκίνο συγκριτική ανάλυση είναι περιορισμένες. Αν είχαμε συμπεριλάβει περισσότερα ακόρεστα δείγματα, θα πρέπει να οδηγήσει σε υψηλότερο ποσοστό ψευδώς αρνητικών προκαλείται κυρίως από χαμηλή γονίδια αφθονία. Έχουμε λάβει συνολικά 37 διαφορετικά δεδομένα ανθρώπινου ιστού /κυττάρου γραμμή transcriptomics από τη δημόσια βάση δεδομένων SRA (Πίνακας S1), 22 δείγματα φυσιολογικού και 15 δείγματα καρκίνου. Στη συνέχεια επιλέγουμε δείγματα με criterions ως εξής: 1) την άρση όλων των μικτών δειγμάτων κυτταρικές σειρές, επειδή η μέθοδος συγκέντρωση θα καλύψει διαφορική αφθονία γονιδιακής έκφρασης? 2) αφαίρεση κυτταρικές σειρές δειγμάτων με ειδική επεξεργασία, διότι οι μηχανισμοί ρύθμισης είναι διαφορετικά κάτω από διαφορετικές φυσιολογικές συνθήκες? 3) το φιλτράρισμα σοβαρή ακόρεστα σύνολα δεδομένων? 4) την επιλογή των πλέον κορεσμένο δείγμα, εάν υπήρχαν επαναλήψεις, εμείς δεν προτιμούν ολοκλήρωσης που θα προκαλέσουν υψηλότερο ποσοστό ψευδώς αρνητικών? 5) την επιλογή των δειγμάτων που προέρχονται από Illumina Γονιδιώματος αναλυτή, το πιο δημοφιλές μέσο αλληλουχίας, εδώ προσπαθούμε να μειώσει την αρχική διαφορά μεταξύ των διαφόρων πλατφορμών αλληλουχίας. Τέλος, παίρνουμε 12 φυσιολογικούς ιστούς και 9 κυτταρικές σειρές καρκίνου για περαιτέρω ανάλυση. Οι φυσιολογικοί ιστοί στην ανάλυσή μας περιλαμβάνουν λιπώδη, του εγκεφάλου, εγκεφαλικό φλοιό, του παχέος εντέρου, του μαστού, του νεφρού, του ήπατος, του πνεύμονα, λεμφαδένα, καρδιά, όρχεις, και σκελετικούς μύες. Και καρκινικές κυτταρικές γραμμές περιλαμβάνουν Κ562, DLD-1, HepG2, GM12878, λέμφωμα, ΒΤ474, MCF7, ΜΒ435 και Τ47ϋ στη σημερινή RNA-Seq σύνολα δεδομένων (Πίνακας S1). Κ562 είναι ένα αθανατοποιημένη κυτταρική σειρά που παράγεται από ένα θηλυκό ασθενή με χρόνια μυελογενή λευχαιμία (CML). DLD-1 είναι ένα παχέος εντέρου κυτταρική γραμμή αδενοκαρκινώματος καλλιεργήθηκαν υπό 21% οξυγόνο με μη στόχευση siRNA επιμολυσμένα. HepG2 είναι μία κυτταρική γραμμή που προέρχεται από ένα αρσενικό ασθενή με καρκίνωμα του ήπατος. GM12878 είναι μια λεμφοβλαστοειδή κυτταρική γραμμή που παράγεται από το αίμα ενός θηλυκού δότη με μετασχηματισμό EBV. Λέμφωμα είναι ένα κύτταρο Ramos Β. Οι άλλες κυτταρικές σειρές είναι όλες οι κυτταρικές σειρές καρκίνου του μαστού που προέρχεται από επεμβατικές πόρου καρκινώματα (ATCC). MCF-7, ΒΤ474 και T47D είναι οιστρογόνο-θετικούς υποδοχείς προγεστερόνης και θετικούς υποδοχείς? MD435 είναι αρνητική και για τους δύο. Τα υψηλής ποιότητας αρχεία CEL των ανθρώπινων δεδομένων μικροσυστοιχιών για HG-U133A επιλέγονται από AffayExpress (E-mtab-27) [32] (Πίνακας S2) για τη σύγκριση.

Μετά από διήθηση τυχαία μεταγραφές, επιλέγουμε 28.778 ανθρώπινα REFSEQ κωδικοποίησης της πρωτεΐνης μεταγραφές (RefGene της βάσης δεδομένων σχολιασμό UCSC, 4 Ιαν, 2010 ενημέρωση), και να συγκεντρωθούν σε 18.874 τόπους ανθρώπινης όπως περιγράφηκε προηγουμένως [9]. Οι 13.038 γονίδια (69,08%) με πολυ-ισομορφές και 5836 (30,92%) με γονίδια μονού ισομορφή που χρησιμοποιείται για περαιτέρω ανάλυση. Για τη χαρτογράφηση της μεταγραφής σύνολα δεδομένων σε αναφορά γονιδιωματική αλληλουχία GRCH37 (hg19) τους, θα χρησιμοποιούν το λογισμικό χαρτογράφησης MAQ [33] κατεβάσει από UCSC. Στη συνέχεια, σχολιασμός των αποτελεσμάτων της χαρτογράφησης συγκρίνεται με RefGene.

Το μοντέλο ανάλυσης δεδομένων μεταγραφικό

αφθονία γονιδιακής έκφρασης κανονικοποιούνται ως πυκνότητα ανάγνωσης, δηλαδή, διαβάζει ανά βάσεων (kb) της αλληλουχίας κωδικοποίησης (CDS ) ανά εκατομμύριο διαβάζει (RPKM), σε δεδομένα RNA-seq ότι ένα εκατομμύριο δυνατότητα αντιστοίχισης διαβάζει σε ένα πείραμα [34]. Και η έκφραση ενός γονιδίου ορίζεται ως το άθροισμα των εκφράσεων όλων των ισομορφών που ανήκουν σε αυτό το γονίδιο [11]. Για να υπολογίσουμε με ακρίβεια το επίπεδο γονιδιακής έκφρασης, παραθέτουμε ένα μοντέλο κατανομής Poisson για να εκτιμηθεί η έκφραση ισομορφών [11]. Λαμβάνοντας υπόψη το κόστος του χρόνου, είμαστε απολύτως απαιτούν μια ανάγνωση πέφτει σε ένα εξόνιο με παραμελεί εξόνιο διασταύρωση πληροφοριών.

Για να προσδιορίσετε αν ένα γονίδιο εκφράζεται ή όχι, η οριακή τιμή φόντο της γονιδιακής έκφρασης πραγματοποιείται χρησιμοποιώντας μια προηγούμενη μέθοδο η οποία συντονίζεται ψευδώς θετικό ποσοστό (

FPR

) και ψευδώς αρνητικό ποσοστό (

FNR

) [10]. Στο έγγραφο αυτό, ορίζουμε θετική σύνολο ως γονίδια με διαβάζει πτώση σε εξώνια του, και αρνητικές σύνολο ως γονίδια με διαβάζει πτώση σε διαγονιδιακές περιοχές. Μία παρατηρούμενη τιμή της έκφρασης, η οποία είναι μεγαλύτερη από το όριο φόντο χαρακτηρίζεται ως θετική, και το αντίθετο έχει επισημανθεί ως αρνητική. Στη συνέχεια, παίρνουμε αυτά τα δύο ορισμούς,, (

FP_count

σημαίνει την περίληψη της διαγονιδιακές μετράει περιοχής για την αξία έκφραση μεγαλύτερο από το υπόβαθρο, εν αντιθέσει ως

TN_count

.

FN_count

σημαίνει ότι η περίληψη του αριθμού των γονιδίων ως γονίδιο εκφράζει, αλλά η αξία έκφραση μικρότερη από το υπόβαθρο, αντίθετα ως

TP_count

).

Ταυτοποίηση των γονιδίων έκφρασης χαμηλής και υψηλής μπορεί απεικονίζουν πρότυπο έκφρασης γονιδίου σε ένα δείγμα, και δυναμικά αλλοίωση του επιπέδου έκφρασης γονιδίου μεταξύ ιστών /κυτταρικές σειρές αντικατοπτρίζουν την εσωτερική αντίδραση της ρύθμισης γονιδιακής έκφρασης. Προηγούμενες μελέτες συνήθως χωρίζονται επίπεδο έκφρασης του γονιδίου σε διάφορα χρονικά διαστήματα, και επισημαίνονται δύο ακραίες γονίδια ως χαμηλής και υψηλής, αντίστοιχα [11]. Ο ορισμός αυτός είναι κάπως αυθαίρετος, επειδή μετριέται επίπεδο γονιδιακής έκφρασης, ανεξάρτητα από το πρότυπο έκφρασης γονιδίου. Εν τω μεταξύ, το επίπεδο έκφρασης απόκλιση των γειτονικών γονιδίων επίπεδο έκφρασης σε δύο διαδοχικές υποομάδες μπορεί να είναι ασθενώς. Καθοδηγείται από αυτό το κίνητρο, έχουμε κατ ‘αρχάς να εφαρμόζεται η βελτιωμένη K-means αλγόριθμο για τον εντοπισμό όρια χαμηλή και υψηλή έκφραση δυναμικά, που διαιρούν εκφρασμένα γονίδια σε τρεις κατηγορίες: τα γονίδια χαμηλή έκφραση (LEG), μέτρια γονίδια έκφρασης (MEG), και τα γονίδια υψηλής έκφρασης ( HEG). Ως προς ένα δείγμα, χαμηλό όριο έκφραση ορίζεται ως η μέση τιμή της αξίας έκφρασης γονιδίου σε μέγιστη LEG και ελάχιστης τιμής της γονιδιακής έκφρασης σε MEG. Για την ανάλυση του γονιδίου διακύμανση πρότυπο έκφρασης μεταξύ των διαφορετικών δειγμάτων, ορίζουμε ένα ενιαίο χαμηλό όριο έκφραση ως τη μέση αξία των κατώτατων ορίων χαμηλή έκφραση όλων των δειγμάτων ». Υψηλό όριο έκφρασης για ένα δείγμα προσδιορίζεται ως η μέση τιμή της μέγιστης τιμής της γονιδιακής έκφρασης σε MEG και ελάχιστες τιμές της γονιδιακής έκφρασης σε HEG. Και η ενιαία κατώφλι υψηλή έκφραση είναι η διάμεσος τιμή όλων των δειγμάτων. Η μέθοδος βασίζεται στην ατομική πρότυπο κατανομής γονιδιακής έκφρασης ενός δείγματος για την ταυτοποίηση γονιδίων χαμηλή και υψηλή έκφραση με δυναμική μέτρηση. Και εγγυάται τη μέγιστη απόσταση του επιπέδου έκφρασης των γονιδίων των δύο διαδοχικών υποομάδων.

Η βελτιωμένη K-means αλγόριθμο αναθέτει κάθε εκφραζόμενα γονίδια στο σύμπλεγμα των οποίων κέντρο βάρους είναι το πλησιέστερο ως K-means αλγόριθμο κάνουν. Αλλά απόσταση δύο στοιχείων ορίζεται ως η απόλυτη τιμή της διαφοράς των δύο τιμών γονιδιακής έκφρασης. Κέντρο βάρους ορίζεται ως η αξία έκφραση του μεσαίου γονιδίου στο σύμπλεγμα της διαλογής γονιδίων σύμφωνα με την αξία γονιδιακής έκφρασης. Αυτό είναι διαφορετικό από αλγόριθμος K-μέσα ορίζεται ως μέση αριθμητική. Έχουμε προετοιμαστεί γονίδιο σύνολο δεδομένων έκφρασης σε μια μορφή σημείο (

x

,

y

), όπου

x

είναι η αξία της γονιδιακής έκφρασης και y είναι αντίστοιχη καταμέτρηση γονίδιο της. Ο αλγόριθμος περιγράφεται περίπου ως εξής:

Μετασχηματισμός

x

αξία από τον τύπο, όπου

n

είναι μετατρέψει παράγοντα και προκαθορισμένη τιμή της είναι 1.

Ορίστε τον αριθμό των cluster

K

(= 3).

τυχαία επιλογή

K

στοιχεία από το σημείο που ως κέντρα βάρους των συστάδων.

Εκχώρηση κάθε σημείο στο πλησιέστερο σύμπλεγμα κέντρο βάρους.

Re-compute

K

νέα κέντρα βάρους του συμπλέγματος.

Πηγαίνετε στο 4) έως ότου η ανάθεση δεν έχει αλλάξει πια.

Ως αποτέλεσμα, εκφραζόμενα γονίδια χωρίζονται σε 3 κατηγορίες: LEG, MEG, και HEG. Θέτουμε φυσιολογικά αποτελέσματα της ομάδας ως πρότυπο ελέγχου. Οι μέσες τιμές των χαμηλών κατώτατων ορίων και υψηλών κατώτατων ορίων σε 12 φυσιολογικούς ιστούς που όπως τελικά χαμηλό όριο και υψηλό όριο για όλους τους ιστούς /κυτταρικές σειρές.

Χρησιμοποιούμε την διακύμανση του επιπέδου έκφρασης του γονιδίου που απεικονίζουν παραλλαγή της γονιδιακής έκφρασης, όπως προηγούμενες μελέτες έκαναν [35] – [37]. Οι υψηλές τιμές της έκφρασης, η οποία μπορεί να ενισχύσει παραλλαγή, συμβάλλουν στη διακύμανση πιο άμεσα, ενώ οι μικρές τιμές της γονιδιακής έκφρασης επηρεάζουν διακύμανση ασθενέστερη, η οποία μπορεί να υποκρύπτει πραγματική μεταβολή. Έτσι, οι τιμές γονιδιακή έκφραση κατατάσσεται ως 1, 2, ή 3, για να αντιπροσωπεύουν το επίπεδο έκφρασης του γονιδίου ως χαμηλή, μέτρια ή υψηλή, αντίστοιχα. Χρησιμοποιούμε αυτές τις αναπαραστάσεις, αντί της τιμής των πρώτων γονιδιακής έκφρασης για να εκτιμηθεί το πρότυπο γονιδιακής παραλλαγής έκφρασης. Για κάθε γονίδιο, υπολογίζουμε συντελεστής αξίας διακύμανσης (

CV

) με βάση την κατάταξη της γονιδιακής έκφρασης, όπου

μ

είναι αριθμητικός μέσος όρος των βαθμών γονιδιακής έκφρασης όλων των δειγμάτων ιστών /κυττάρων γραμμής σε ένα γονίδιο;

σ

είναι η τυπική απόκλιση του βαθμού γονιδιακής έκφρασης σε ένα γονίδιο, το οποίο είναι ο αριθμητικός μέσος όρος του τετραγώνου της απόκλισης του βαθμού γονιδιακής έκφρασης από την αριθμητική της σημαίνουν. Θέτουμε επίσης φυσιολογική ομάδα σαν τον έλεγχο.

Προτείνουμε μια πλοκή MDAD να χαρακτηρίσει τη διαφορά του προτύπου έκφρασης γονιδίων σε κατάσταση καρκίνου εναντίον κανονική κατάσταση, με βάση την ευρέως χρησιμοποιούμενη οικόπεδο ΜΑ. Μ Απόσταση (MD) και μια απόσταση (AD) οποιουδήποτε γονιδίου σε οικόπεδο MDAD ορίζονται όπως και, αντίστοιχα, όπου το

max

αξία είναι η μέγιστη τιμή της έκφρασης γονιδίων εντός όλων των κανονικών δειγμάτων ιστών /κυττάρων γραμμή, και

min

αξία είναι η ελάχιστη έκφραση του γονιδίου (αλλά & gt? 0) στο πλαίσιο όλων των κανονικών δειγμάτων ιστών /κυττάρων γραμμή?

max

αξία είναι η μέγιστη τιμή της γονιδιακής έκφρασης μέσα σε όλα τα δείγματα καρκινικού ιστού /κυτταρική σειρά, και

min

αξία είναι η αξία έκφραση ελάχιστη γονιδίου (αλλά & gt? 0) στο πλαίσιο όλων των ιστών του καρκίνου /δείγματα κυτταρική σειρά.

MD

αντικατοπτρίζει τη διαφορά της κατανομής της γονιδιακής έκφρασης μεταξύ της κατάστασης του καρκίνου και κανονική κατάσταση, και

μ.Χ.

αντικατοπτρίζει τη διαφορά της σχετικής μέσο επίπεδο μεταξύ της κατάστασης του καρκίνου και κανονική κατάσταση. Χρησιμοποιούμε MDAD οικόπεδο, με ένα αντιστοιχισμένο Wilcoxon signed-rank test [38], για να συγκρίνουν τη διαφορά της από κοινού ή το επίπεδο έκφρασης του καρκίνου που σχετίζονται με HK γονιδίων μεταξύ φυσιολογικών και καρκινικών κατάσταση.

MD

& lt? 0 σημαίνει ότι η κατανομή γονιδιακής έκφρασης σε κατάσταση καρκίνου είναι ευρύτερο από ότι στην κανονική κατάσταση, και

μ.Χ.

& lt? 0 σημαίνει την έκφραση του γονιδίου σε σχέση με το μέσο επίπεδο στην κατάσταση του καρκίνου είναι υψηλότερα από ό, τι ότι σε κανονικές συνθήκες. Για να συγκρίνετε τα αρχικά επίπεδα μέγιστης και ελάχιστης έκφρασή τους κάτω από τον καρκίνο και φυσιολογική κατάσταση, μπορούμε επίσης να υπολογίσει

maxR

και

minR

ως ο λόγος της μέγιστης και ελάχιστης τιμής της έκφρασης στην κανονική vs codintion καρκίνο (,) . Αν μια τιμή αναλογία είναι 0, ένα γονίδιο μετατρέψει μόνο στην κατάσταση του καρκίνου? αν μια τιμή αναλογίας τοποθετεί στο [0, 1], ακραία τιμή έκφραση σε κανονική κατάσταση είναι μικρότερη από ότι στην κατάσταση του καρκίνου, αν μια τιμή αναλογίας τοποθετεί στο [1, ∞], ακραία τιμή έκφραση σε φυσιολογικούς ιστούς είναι μεγαλύτερη από ότι στον καρκίνο κατάσταση.

Η συσχέτιση Spearman του προφίλ γονιδιακής έκφρασης χρησιμοποιείται για να καθορίσει την ομοιότητα πρότυπο έκφρασης διαφορετικών ιστών /κυττάρων. Με βάση το βαθμό της ομοιότητας, μια ιεραρχική σύμπλεγμα με πληροφορίες συσχετισμού διεξάγεται με τη χρήση του λογισμικού R. Εξομάλυνση των μικροσυστοιχιών χρήση δεδομένων MAS5.0 [39] αλγόριθμο με Έκφραση λογισμικό Console ™ (p-value ανίχνευσης 0,05). ανάλυση του εμπλουτισμού της λειτουργίας των διαφόρων τύπων γονιδίων HK γίνεται με τον David (βάση δεδομένων για το σχολιασμό, Οπτικοποίηση, και Ολοκληρωμένων Discovery) [40].

Αποτελέσματα

μοντέλο ανάλυσης για τα δεδομένα μεταγραφικό RNA-Seq

RNA-Seq έχει ισχυρή ικανότητα να ανιχνεύει χαμηλή μεταγραφές αφθονία με πρωτοφανή ακρίβεια και την υψηλής απόδοσης σε πολύ χαμηλότερο κόστος περιλαμβάνει με άλλες μεθόδους. Τώρα έχει γίνει το πιο ευρέως χρησιμοποιούμενη τεχνολογία transcriptomics αλληλούχιση [11], [41]. Ένα κοινό ερώτημα σε ανάλυση δεδομένων RNA-Seq είναι πώς να καθορίσει τον αριθμό των γονιδίων που εκφράζονται σε ένα δείγμα. Για την εξάλειψη της μόλυνσης και των σφαλμάτων που προκαλούνται από τα πειράματα και τα μέσα, κλπ, έχουμε εντοπίσει το επίπεδο έκφρασης μεταξύ εξώνια και διαγονιδιακές περιοχές να συντονίσουν

FPR

και

FNR

(βλέπε Υλικά και Μέθοδοι) χρησιμοποιώντας το μέθοδος που παράγονται σε μια προηγούμενη μελέτη [10]. Τα κατώτατα όρια φόντο της γονιδιακής έκφρασης για μεμονωμένα δείγματα που υπάγονται στο 0,13 με 0,41 RPKM. Θέτουμε μια μέση τιμή των 0,25 RPKM (Σχήμα S1) ως το κατώφλι φόντο της γονιδιακής έκφρασης για περαιτέρω ανάλυση. Στη συνέχεια, χρησιμοποιούμε ένα μοντέλο Poisson να ασχοληθεί με την εκτίμηση της έκφρασης ισομορφή και να βελτιώσετε την αξία της γονιδιακής έκφρασης με τη συσσώρευση όλων των τιμών ισομορφές έκφραση σε ένα γονίδιο [11].

Ορισμός των γονιδίων HK

δείγματα μας είναι χωρίζονται σε δύο ομάδες φυσιολογικό: 12 φυσιολογικούς ιστούς και κυτταρικές σειρές καρκίνου του 9, τα στοιχεία φαίνονται στον πίνακα 1. Η ανάλυση συστάδων δεικνύει ότι τα πρότυπα γονιδιακής έκφρασης είναι ιδιαίτερα σχετικές με φυσιολογική κατάσταση και όχι ιστού χωρική απόσταση (Σχήμα 1). Προβλέπουμε ότι υπάρχουν ορισμένα κοινά μοτίβα ρύθμιση σε καρκινικά κύτταρα, όπως τη σειρά του σχετικά με τη ρύθμιση /off και χαμηλή /υψηλή ή σταθερή /μεταβλητή προσαρμογής, τα οποία διατηρούν απεριόριστες ικανότητα πολλαπλασιασμού τους. Εδώ, ορίζουμε τα γονίδια HK σε δύο ξεχωριστές ομάδες, φυσιολογικά γονίδια Χονγκ Κονγκ και τον καρκίνο γονίδια Χονγκ Κονγκ, ώστε να αντικατοπτρίζει την έκφραση του γονιδίου on /off κατάσταση σε διάφορες φυσιολογική κατάσταση. Προηγούμενη μελέτη για την ιεραρχική ομαδοποίηση των εννέα βιβλιοθήκες του πνεύμονα SAGE έδειξε επίσης σαφή διαχωρισμό των όγκων και φυσιολογικών δειγμάτων [42].

Spearman συσχέτιση των προφίλ γονιδιακής έκφρασης χρησιμοποιείται για να καθορίσει την έκφραση του γονιδίου προφίλ ομοιότητα των 21 διαφορετικών ιστών /κύτταρα. Μια ιεραρχική ανάλυση συστάδων με πληροφορίες συσχέτισης δείχνει 2 clusters:. 12 φυσιολογικούς ιστούς και 9 καρκινικές κυτταρικές σειρές

Η

Ορίζουμε πέντε τύποι γονιδίων Χονγκ Κονγκ, σύμφωνα με το πρότυπο έκφρασης των γονιδίων τους σε φυσιολογικά ή /και κατάσταση του καρκίνου: 1) τα γονίδια κανονικό μοναδικό Χονγκ Κονγκ, συγκεκριμένο γονίδιο HK εμφανίζεται μόνο σε κανονική ομάδα, δεν HK γονιδίου στην ομάδα του καρκίνου? 2) σχετίζονται με τον καρκίνο γονίδια HK, ειδικό γονίδιο HK εμφανίζεται μόνο στην ομάδα του καρκίνου, δεν HK γονίδιο στην κανονική ομάδα? 3) Το μερίδιο HK γονίδια, γονίδια HK εκφράζεται τόσο στα φυσιολογικά όσο και του καρκίνου της ομάδας? 4) φυσιολογικά γονίδια Χονγκ Κονγκ, Χονγκ Κονγκ γονιδίων που εκφράζονται σε όλη την κανονική ομάδα, περιλαμβάνει φυσιολογικό μοναδικά γονίδια Χονγκ Κονγκ και το μερίδιο των γονιδίων HK? 5) τα γονίδια του καρκίνου του Χονγκ Κονγκ, HK γονίδια που εκφράζονται σε ολόκληρη την ομάδα του καρκίνου, περιλαμβάνει σχετιζόμενη με καρκίνο γονίδια ΧΚ και μερίδιο γονίδια HK.

Ως προς την φυσιολογική ομάδα, που επιλέγεται 12 φυσιολογικούς ιστούς καλύψει συνδετικό ιστό, μυϊκό ιστό, το σώμα περιοχή και 6 ανθρώπινα συστήματα ταξινόμησης, συμπεριλαμβανομένων ουρογεννητικό σύστημα, το πεπτικό σύστημα, το αναπνευστικό σύστημα, ΑΙΜΑΤΙΚΟΥ και το ανοσοποιητικό σύστημα, το κεντρικό νευρικό σύστημα, και το καρδιαγγειακό σύστημα (σύστημα Endocrine δεν καλύπτεται, Εικόνα S2). Με βάση αυτά τα 12 φυσιολογικούς ιστούς, εκτιμούμε ότι υπάρχουν 8831 φυσιολογικά γονίδια HK (κωδικοποιεί την πρωτεΐνη γονίδια HK) κλάσμα γονιδίου .Η HK είναι 47%, η οποία είναι συνεπής με δύο προηγούμενες εκθέσεις: 40% [9] και 42% [10 ]. Η τελευταία έρευνα πραγματοποιήθηκε επίσης με δεδομένα RNA-Seq, αλλά ο Daniel Ramsköld και οι συνεργάτες του, που ορίζονται γονίδια HK χωρίς να διακρίνει κανονική ή καρκίνο ομάδα. 8041 γονίδια HK ταυτοποιήθηκαν με 24 ανθρώπινους ιστούς /κυτταρικές σειρές (10 φυσιολογικούς ιστούς και 4 καρκινικές κυτταρικές σειρές θεωρούνται επίσης στη μελέτη μας), συμπεριλαμβανομένων των 7.695 γονιδίων που κωδικοποιεί την πρωτεΐνη, 277 lncR, και 69 άγνωστα γονίδια δεν υπάρχει στην γονιδιωματική αλληλουχία αναφοράς GRCH37, hg19 [10]. Τα γονίδια HK επικαλύπτονται μεταξύ Daniel Ramsköld

et al.

‘S εργασία και φυσιολογικά γονίδια μας HK είναι 7004 (Σχήμα S3). Και το μοναδικό γονίδιο HK στον ορισμό μας (1827) προέρχεται κυρίως από την κανονική-μοναδικό γονίδιο HK (1253), το οποίο εμφανίζεται μόνο ως γονίδια HK σε κανονικές συνθήκες. Από Daniel Ramsköld και οι συνεργάτες του χρησιμοποίησαν 4 καρκινικές κυτταρικές σειρές, αυτή η διαφορά της ταυτοποίησης γονιδίων HK παρουσιάζεται στη μελέτη μας είναι αρκετά λογικό. Οι περισσότεροι από καθορισμένων 8831 φυσιολογικών γονιδίων HK μας εκφράζονται παντού σε όλες τις 19 διαθέσιμες φυσιολογικά δείγματα, 12 εκ των οποίων έχουν επιλεγεί για την κανονική ορισμός γονίδιο HK, 7 από αυτά φιλτράρονται από criterions παρουσιάζεται στο Υλικά και Μέθοδοι (Σχήμα S4A, Πίνακας S1). Το «ποσοστό εσφαλμένη ανίχνευση» προκαλείται κυρίως από μη-κορεσμό των φιλτραρισμένων δειγμάτων. Αυτό σημαίνει ότι η ακρίβεια των γονιδίων HK ορίζεται από 12 φυσιολογικούς ιστούς είναι αρκετά υψηλή για την περαιτέρω ανάλυση

Current δείγματα καρκίνος αντιπροσωπεύουν περιοχή του σώματος και τρεις ανθρώπινες ταξινομική συστήματα ευρέως διερευνηθεί, μεταξύ των οποίων:. Ουρογεννητικό σύστημα, το πεπτικό σύστημα, και ΑΙΜΑΤΙΚΟΥ και το ανοσοποιητικό σύστημα (Εικόνα S2, Πίνακας S1). επιλέγεται 9 καρκινικές κυτταρικές γραμμές μας καλύπτουν τα περισσότερα από αυτά, εκτός από το δείγμα ουρογεννητικό σύστημα, το οποίο διηθείται από τα μη-κορεσμό και την επιλογή της πλατφόρμας criterions. Το κλάσμα του καρκίνου γονίδιο είναι HK 38% στη γονιδιακή έκφραση εύρος του 9. Ορίσαμε 7084 καρκίνος γονίδια ΧΚ και τα περισσότερα από αυτά είναι παρόντα σε φυσιολογική ομάδα (Σχήμα 2Α), το οποίο σχηματίζει την κοινή ομάδα HK. Οι εν λόγω κοινόχρηστο 6237 HK γονίδια θα μπορούσαν να είναι αναγκαία γονίδια για ένα κύτταρο, τα οποία διατηρούν τις βασικές λειτουργίες σε διαφορετικές φυσιολογική κατάσταση. γονίδια του καρκίνου του Χονγκ Κονγκ είναι λιγότερο από ό, τι φυσιολογικά γονίδια HK γιατί ο καρκίνος απαιτείται λιγότερη ενεργοποιημένη γονίδια (Πίνακας S1). Αλλά ο καρκίνος απαιτείται υψηλότερο κλάσμα πισίνα mRNA [10], [26] για τη μείωση των καρκινικών κυττάρων μεταγραφικό εξειδίκευση [26]. Αυτό επιτρέπει την εστίαση στην ολοκλήρωση των απλών κυτταρικού πολλαπλασιασμού. Περίπου 88,65% των γονιδίων του καρκίνου HK εκφράζονται παντού σε όλα τα δείγματα καρκίνου 13, συμπεριλαμβανομένων 4 φιλτραρισμένα δείγματα (Πίνακας S1, Εικόνα S4B). Το «ποσοστό ψευδών ανίχνευσης» του καρκίνου γονιδίων HK προκαλείται κυρίως από την ακορεστότητα των φιλτραρισμένων δειγμάτων. Αυτό το αποτέλεσμα δείχνει ότι αν και οι τρέχουσες 9 δείγματα καρκίνος δεν μπορεί να αντιπροσωπεύει διάφορους τύπους καρκίνου, η ταυτοποίηση του καρκίνου γονιδίων HK μπορεί να χρησιμοποιηθεί στη γονιδιακή έκφραση μελέτη μοτίβο των καρκινικών κυττάρων.

Γονίδια

HK ορίζεται χωριστά από δύο φυσιολογικές ομάδες: 12 φυσιολογικούς ιστούς και 9 καρκινικές κυτταρικές σειρές. (Β) Οι διαφορετικοί τύποι γονίδιο HK λειτουργικό εμπλουτισμό. «Καρκίνος» σημαίνει τον καρκίνο γονίδια HK, συντομογραφία κατάληξη «C» ακολουθεί όρος λειτουργία απεικόνισης? «Ο καρκίνος που σχετίζεται με» σημαίνει συγκεκριμένα γονίδια HK στην κατάσταση του καρκίνου, συντομογραφία κατάληξη «CA» ακολουθεί τη λειτουργία όρος εικόνα? «Κοινό» μέσα επικαλύπτονται γονίδια HK σε κανονικές και καρκίνο συνθήκες, συντομογραφία κατάληξη «S» ακολουθεί τη λειτουργία όρος εικόνα? «Normal-μοναδικό» σημαίνει συγκεκριμένα γονίδια HK σε κανονική κατάσταση, συντομογραφία κατάληξη «NU» ακολουθεί όρος λειτουργία απεικόνισης? «Normal» σημαίνει φυσιολογικά γονίδια HK, συντετμημένο ως κατάληξη «Ν» ακολουθεί τη λειτουργία όρος απεικονίσεων.

Η

Ένα HK γονίδιο είναι τυπικά ένα συστατικό γονίδιο που απαιτείται για τη διατήρηση της βασικής κυτταρικής λειτουργίας, και είναι βρίσκονται σχεδόν σε όλα τα ανθρώπινα κύτταρα [7], [43]. Για να χαρακτηρίσουμε φυσιολογικών και καρκινικών λειτουργίες των γονιδίων Χονγκ Κονγκ, συγκρίνουμε κυτταρικής γονιδιακής εμπλουτισμού της λειτουργίας και μονοπάτια σήμα. Όπως δείχνει το Σχήμα 2Β, τα καρκινικά γονίδια HK εμπλουτισμένο σε μοριακή λειτουργία και βιολογικών διαδικασιών. γονίδια του καρκίνου του HK συμμετέχουν σε κυτταρικό κύκλο, την αντιγραφή του DNA, την επισκευή ασυμφωνία, και μονοπάτι της απόπτωσης, κλπ, για να απαντήσει στην εμφάνιση όγκων. Φυσιολογικά γονίδια HK τείνουν να ενταχθούν σε βασικές οδούς (Πίνακας 2).

Η

Χαρακτηρισμός των κοινών γονιδίων HK πρότυπα έκφρασης

Για να χαρακτηρίζουν το επίπεδο της γονιδιακής έκφρασης και την παραλλαγή που οδηγεί σε γονιδιακή έκφραση πρότυπα ορισμό, εμείς πρώτον ισχύουν βελτιωμένη K-means αλγόριθμο και την υιοθέτηση βελτιωμένων συντελεστών γονιδιακή έκφραση της διακύμανσης (

CV

, βλέπε Υλικά και Μέθοδοι για λεπτομέρειες) μοντέλο. Προηγούμενες μελέτες συνήθως ορίζεται 100 γονίδια RPKM οι τιμές κατωφλίου υψηλή έκφραση και το 1 RPKM για χαμηλή έκφραση βασίζεται σε οκτώ κάδους log-κλίμακας [11]. Ο βελτιωμένος αλγόριθμος K-means προσδιορίζει όρια από ένα άτομο μοτίβο γονιδίων κατανομή έκφρασης. Με βάση τον υπολογισμό αυτού του αλγορίθμου, τιμές κατωφλίου χαμηλή έκφραση είναι 0,66 – 1,22 RPKM και τιμές κατωφλίου υψηλή έκφραση είναι 8,58 έως 19,99 RPKM (Πίνακας 3). Θέτουμε μια μέση τιμή των 1,06 RPKM για χαμηλό όριο και διάμεση τιμή των 12,72 RPKM για υψηλό όριο στην κανονική κατάσταση ως πρότυπο για περαιτέρω ανάλυση (Σχήμα S5). Να διακρίνει μια κατάσταση μεταβολής της γονιδιακής έκφρασης, εφαρμόζουμε μια βελτιωμένη γονιδιακής έκφρασης

CV

μοντέλο. Η

CV

τιμές σε φυσιολογικά όρια ομάδα μηδέν έως 0,54. Q1 (ένα τέταρτο) και Q3 (τρία τέταρτα)

CV

τιμές στην κανονική ομάδα είναι 0,14 και 0,26, οι οποίες χαρακτηρίζονται ως σταθερές και μεταβλητές τιμές κατωφλίου έκφρασης, αντίστοιχα (Σχήμα S6). Έτσι, θα έχουμε συνολικά τρεις καταστάσεις της μεταβολής της γονιδιακής έκφρασης, σταθερή (0 & lt?

CV

≤0.14), μέτρια μεταβλητή (0,14 & lt?

CV

≤0.26), και μεταβλητή (

CV

& gt?. 0,26)

η

είναι γνωστό ότι ορισμένα γονίδια που εκφράζουν σταθερά μεταξύ των ιστών, ενώ άλλοι εκφράζουν ποικιλοτρόπως στην κανονική κατάσταση. Αυτό το φαινόμενο υπάρχει και σε γονίδια HK [12] – [13], [35]. Με βάση την έκφραση του γονιδίου

CV

μοντέλο, διαπιστώνουμε ότι περισσότερα γονίδια HK στον καρκίνο τείνουν να είναι μέτρια μεταβλητή εκφράζεται γονίδια (Εικόνα 3Α). Έχουμε προσπαθήσει να διερευνήσει τους τρόπους με τους οποίους το καθεστώς διακύμανσης γονιδιακή έκφραση ρυθμίζεται να ασχοληθεί με την εμφάνιση ενός όγκου. Έτσι, συγκρίνουμε 6237 μοιράστηκε γονίδια HK να απεικονίζουν την προσαρμογή τους. Περισσότερο από το ήμισυ των αλλαγών κατάστασης μεταβολής έκφραση γονιδίων κοινόχρηστο HK »μεταξύ της κανονικής και του καρκίνου κατάσταση. Όπως φαίνεται στο Σχήμα 3Β, σχεδόν τα δύο τρίτα της σταθερής κοινόχρηστα γονιδίων HK υπό κανονικές συνθήκες αλλαγή έως μέτρια μεταβλητή κατάστασης υπό τον όρο καρκίνο. Το ένα τρίτο της μέτριας μεταβλητής μοιράζονται γονίδια HK σε κανονική κατάσταση να γίνει σταθερή μοιράζονται γονίδια HK σε κατάσταση καρκίνου. Περίπου το ήμισυ των μεταβλητών κοινόχρηστο γονιδίων HK σε κανονικές συνθήκες αλλάξουν το καθεστώς παραλλαγή έκφραση τους έως μέτρια μεταβλητή σε κατάσταση καρκίνου (Σχήμα 3Β). Ένα κύτταρο είναι ικανό να ρυθμίζει πρότυπο γονιδιακής έκφρασης της να είναι κυρίως μέτρια μεταβλητή έκφραση σε καρκινικά φυσιολογική κατάσταση.

Υπάρχουν τρεις καταστάσεις γονίδιο παραλλαγή έκφρασης, Constant, συντετμημένο ως κατάληξη «C» στο (Β), και μέτρια μεταβλητή, συντομογραφία Μέτρια στο (Α) και κατάληξη «Μ» στο (Β), και μεταβλητό, συντομογραφία κατάληξη «V» στο (Β).

η

Για τη μέτρηση της ρύθμισης της γονιδιακής έκφρασης και έκφραση του γονιδίου ρύθμιση κατάστασης μεταβολή στην κατάσταση του καρκίνου, προτείνουμε ένα MDAD (βλέπε Υλικά και Μέθοδοι) οικόπεδο με ένα αντιστοιχισμένο Wilcoxon signed-rank test [38] σε όλα τα κοινά HK γονίδια (Εικόνα 4Α) και την κοινή γονίδια HK σε τρεις υποτύπους κατάσταση παραλλαγή (Σχήμα 4Β, C, D). Όλα τα ζεύγη Wilcoxon signed-rank τιμές αναλυτικά τεστ παρουσιάζονται στον Πίνακα 4. γονίδια Shared HK εκφράζουν υψηλότερα στον καρκίνο από ό, τι σε φυσιολογικούς ιστούς, με βάση το πραγματικό πλάτος της έκφρασης (

MD

, p-value είναι 4.34E-33 ) και η ενδιάμεση τιμή (

μ.Χ.

, p-value είναι 0). Τα προηγούμενα δεδομένα μικροσυστοιχιών έδειξαν ότι τα ανθρώπινα γονίδια του καρκίνου μπορεί να είναι ευρέως up-ρύθμιση [31]. Ζεύγη Wilcoxon signed-rank test p-τιμές

MD

στις τρεις γονίδιο υποτύπους παραλλαγή έκφρασης είναι 4.24E-67, 0.11 και 0.59, αντίστοιχα. P-τιμές

μ.Χ.

είναι πολύ χαμηλότερα με τις τιμές των 3.15E-160, 2.62E-126, και 3.65E-183 (Πίνακας 4). Όπως φαίνεται στο σχήμα 4 φαίνεται, οι περισσότεροι μοιράζονται γονίδια HK «

μ.Χ.

και

MD

τιμές είναι μικρότερες από 0 που σημαίνει ότι τα γονίδια εκφράζουν υψηλότερα σε κατάσταση καρκίνο από ό, τι στην κανονική κατάσταση. Έτσι, στην κατάσταση του καρκίνου, ένα κύτταρο ρυθμίζει κυρίως σταθερή κοινόχρηστα γονίδια HK να εκφράσουν υψηλότερη να ενεργήσει η εμφάνιση του σήματος του καρκίνου

MD

& lt?. 0 σημαίνει ότι το πλάτος ανοίγματος της γονιδιακής έκφρασης σε κατάσταση καρκίνου είναι μεγαλύτερη από ότι στην κανονική κατάσταση, και

μ.Χ.

& lt? 0 σημαίνει η έκφραση του γονιδίου σε σχέση με το μέσο επίπεδο στην κατάσταση του καρκίνου είναι υψηλότερα από ότι στην κανονική κατάσταση. Σύμφωνα με κοινόχρηστο-φυσιολογική καταστάσεις παραλλαγή HK γονίδια έκφρασης, μοιράζονται τα γονίδια HK χωρίζονται σε τρεις υποκατηγορίες, σταθερή, μέτρια μεταβλητή και μεταβλητή εκφράζεται μοιράζονται γονίδια HK. Ζεύγη Wilcoxon rank test υπογραφεί χρησιμοποιείται εδώ για να μετρηθεί ρύθμιση γονιδιακής έκφρασης και την έκφραση του γονιδίου ρύθμιση κατάσταση παραλλαγή. (Α) Όλα τα κοινόχρηστα γονίδια HK. (Β) Κοινή σταθερή εκφρασμένων γονιδίων HK. (C) Κοινό μέτρια μεταβλητή εκφράζεται γονίδια HK. (D) κοινή μεταβλητή εκφραζόμενα γονίδια HK.

Η

μετρηθεί η αναλογία της γονίδια για τα οποία καρκινικών κυττάρων ρυθμίζουν επίπεδο έκφρασης του γονιδίου να είναι υψηλότερη από ότι στην κανονική φυσιολογική κατάσταση. Για να γίνει αυτό, υπολογίζουμε μετράει γονιδίων που έχουν μέγιστες τιμές αναλογία (

maxR

) και ελάχιστες τιμές δείκτη (

minR

) ≤1 (βλέπε Υλικά και Μέθοδοι). Όταν

minR

≤1, υπάρχουν 73,47% των κοινών γονιδίων HK συσσωρευμένη? όταν

maxR

≤1, υπάρχουν 67,79% των κοινών γονιδίων HK συσσωρευμένη (Σχήμα 5Α, Πίνακας 5). Θεωρούμε, επίσης, τα κύτταρα ρυθμίζουν τα επίπεδα γονιδιακής έκφρασης σε κατάσταση καρκίνου που συνδυάζει με πληροφορίες γονιδιακή παραλλαγή της έκφρασης. Όταν

minR

≤1, υπάρχουν 78,24% των κοινών γονιδίων HK σε συνεχή κατάσταση, 65,10% των κοινών γονιδίων HK σε μέτρια μεταβλητή κατάστασης, και 80.16% των κοινών γονιδίων HK στη μεταβλητή κατάστασης συσσωρεύονται. Και όταν

maxR

≤1, εκείνοι αριθμός είναι 70,17%, 62,30% και 73,53% σε αυτές τις τρεις υποτύπους παραλλαγή έκφρασης (Σχήμα 5Β, C, D, Πίνακας 5). Τα στοιχεία δείχνουν ότι οι περισσότεροι μοιράζονται γονίδια HK είναι μέχρι ρυθμίζονται συνδυασμό με καθεστώς διακύμανσης της γονιδιακής έκφρασης σε κατάσταση καρκίνου.

Μέχρι δηλώνει άξονα y

maxR

με εύρος [0, 3], και προς τα κάτω y δηλώνει -άξονα

minR

με εύρος [0, 3]. Για την ενίσχυση του σχήμα, θέσαμε την τιμή αναλογία με 3,00 αν μια τιμή αναλογία είναι μεγαλύτερη από 2,50. Όσον αφορά την εσωτερική γράφημα ένθετο, το μπλε καμπύλη δείχνει τις συσσωρευμένες

maxR

? και η πράσινη καμπύλη δείχνει τις συσσωρευμένες

minR

. Και οι δύο αντιστοιχούν στο αριστερό άξονα y σημαίνει αθροιστική μέτρηση γονιδίου. Δικαίωμα άξονα y υποδηλώνει ατομική καταμέτρηση γονίδιο (εμφανίζεται ως Λόγος Gene Count), το οποίο αντιστοιχεί σε ένα κόκκινο

maxR

καμπύλη κατανομής και κυανό

minR

καμπύλη κατανομής. Εμείς μετρηθεί η αναλογία της γονίδια για τα οποία καρκινικών κυττάρων ρυθμίζουν επίπεδο έκφρασης του γονιδίου να είναι υψηλότερη από ότι στην κανονική φυσιολογική κατάσταση. (Α) Όλα τα κοινόχρηστα γονίδια HK.

You must be logged into post a comment.