PLoS One: Επάνω: Μια Trend-του-Νόσος-Εξέλιξη Διαδικασία λειτουργεί καλά για την ταυτοποίηση των γονιδίων του καρκίνου από το Multi-μέλος Cohort Gene Expression δεδομένων για τα Ανθρώπινα παχέος Cancer


Αφηρημένο

Αξίζει να σημειωθεί εκφρασμένων γονιδίων που προέρχονται από γονιδιακής έκφρασης μικροσυστοιχιών δεδομένα έχουν αποδειχθεί πολύ χρήσιμες για την ταυτοποίηση γενετικών βιοδείκτες των ασθενειών, συμπεριλαμβανομένου του καρκίνου. Ωστόσο, προκύπτουν μια ασθένεια που σχετίζεται συμπέρασμα από μια λίστα των διαφορικά εκφρασμένων γονιδίων έχει αποδειχθεί λιγότερο από απλή. Σε μια ασθένεια συστήματα όπως ο καρκίνος, το πώς τα γονίδια αλληλεπιδρούν μεταξύ τους πρέπει να έχει σημασία, όπως ακριβώς και το επίπεδο της γονιδιακής έκφρασης. Εδώ, σε μια νέα προσέγγιση, χρησιμοποιήσαμε τις ιδιότητες της εξέλιξης του δικτύου και της νόσου των μεμονωμένων γονιδίων σε κατάσταση ειδικά δίκτυα αλληλεπίδρασης γονιδίων-γονίδιο (GGINs) για να επιλέξετε τα γονίδια του καρκίνου για την ανθρώπινη καρκίνο του παχέος εντέρου (CRC) και να αποκτήσουν ένα πολύ υψηλότερο ποσοστό επιτυχίας των γνωστών γονίδια του καρκίνου, σε σύγκριση με μεθόδους που δεν βασίζονται στη θεωρία του δικτύου. Κατασκευάσαμε GGINs με την ενσωμάτωση των δεδομένων των μικροσυστοιχιών γονιδιακής έκφρασης από πολλαπλές καταστάσεις – υγιή ελέγχου (NOR), αδένωμα (Ade), φλεγμονώδη νόσο του εντέρου (IBD) και CRC – με βάση την αλληλεπίδραση μεταξύ πρωτεϊνών και Gene Ontology. Εμείς παρακολουθούνται αλλαγές στις μοίρες δίκτυο και συντελεστές ομαδοποίηση των μεμονωμένων γονιδίων στα GGINs ως η νοσηρή κατάσταση αλλάζει από το ένα στο άλλο. Από αυτά που έχουμε υποθέσει τις κρατικές ακολουθίες Ούτε-Ade-CRC και Νορ-IBD-CRC οι οποίοι εμφάνισαν μια τάση (νόσος) εξέλιξη (TOP) προς την CRC, και επινόησε μια κορυφαία διαδικασία για την επιλογή των γονιδίων του καρκίνου για CRC. Από τους 141 υποψηφίους που επελέγησαν χρησιμοποιώντας κορυφή, περίπου 50% είχαν λογοτεχνία στήριξης, όπως τα γονίδια του καρκίνου, σε σύγκριση με ποσοστά επιτυχίας από 20% έως 30% για τις τυποποιημένες μεθόδους που χρησιμοποιούν μόνο τα δεδομένα γονιδιακής έκφρασης. Μεταξύ των γονιδίων του καρκίνου 16 υποψήφιος που κωδικοποιείται παράγοντες μεταγραφής, 13 ήταν γνωστό ότι είναι ογκογόνα και τρεις ήταν νέα: CDK1, SNRPF, και ILF2. Εντοπίσαμε 13 του 141 προβλέψει τα γονίδια του καρκίνου του ως υποψήφιος δείκτες για την έγκαιρη ανίχνευση του CRC, 11 και 2 στα Ade και IBD μελών, αντίστοιχα

Παράθεση:. Chung FH, Lee HH-C, Lee HC (2013 ) Πάνω: Ένα Trend-του-Νόσος-εξέλιξη Διαδικασία λειτουργεί καλά για την ταυτοποίηση των γονιδίων του καρκίνου από το Multi-μέλος Cohort Gene Expression δεδομένων για τα Ανθρώπινα τον καρκίνο του παχέος εντέρου. PLoS ONE 8 (6): e65683. doi: 10.1371 /journal.pone.0065683

Επιμέλεια: Frank Emmert-Streib, Βασιλικό Πανεπιστήμιο του Μπέλφαστ, Ηνωμένο Βασίλειο

Ελήφθη: 4 του Δεκέμβρη 2012? Αποδεκτές: 26 Απρίλη του 2013? Δημοσιεύθηκε: 14, Ιουνίου, 2013

Copyright: © 2013 Chung et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Αυτό το έργο υποστηρίχθηκε από το Εθνικό Επιστημονικό Συμβούλιο (ROC) χορηγεί NSC 100 με 2.911-Ι-008-001 (για το Κέντρο Δυναμικά βιοδείκτες και Translational Medicine, οι εθνικές κεντρικές Πανεπιστήμιο) και NSC 99-2911-Ι-008-100, και η Cathy Γενικό Νοσοκομείο-εθνικές κεντρικές Πανεπιστήμιο Grant 99CGH-NCU-Α3. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

Καρκίνος του παχέος εντέρου (CRC) είναι η τέταρτη κύρια αιτία θανάτου από καρκίνο σε όλο τον κόσμο, αλλά κατατάσσονται σε υψηλότερη θέση στις οικονομικά πιο ανεπτυγμένες κοινωνίες. Όπως και άλλα είδη καρκίνου, CRC είναι μια ασθένεια συστήματα, πρόδηλη πολλαπλών λειτουργικών διαταραχών στα οιδηματώδης κύτταρα. Παγκόσμια γονιδιακής έκφρασης χρησιμοποιώντας ολιγομερείς μικροσυστοιχίες DNA έχει χρησιμοποιηθεί ευρέως για να αποκτήσουν γνώσεις όσον αφορά τις υποκείμενες μηχανισμούς για πολύπλοκες ασθένειες, συμπεριλαμβανομένου του CRC [1], [2]. Προηγούμενες μελέτες επί της έκφρασης των γονιδίων έδωσαν διακριτές προοπτικές για τη μοριακή αιτιολογία του CRC [3] – [6]. Η επικάλυψη μεταξύ δημοσιεύθηκε υπογραφές γονίδιο από διάφορες μελέτες για CRC έτειναν να είναι μικρή. Από νωρίς αναγνωρίστηκε την ταυτοποίηση διαφορικά εκφραζόμενων γονιδίων (βαθμούς με) σε δύο δείγματα κοόρτη ήταν μία δυνητικά χρήσιμη προσέγγιση [7] – [9]. Αντλώντας ένα συμπέρασμα από ένα μακρύ κατάλογο βαθμούς με Ωστόσο, είναι ένα δύσκολο έργο και μπορεί να οδηγήσει σε πολύ διαφορετικά αποτελέσματα [10]. σύνολα γονίδιο ανάλυση, μια μέθοδος που βασίζεται στο

priori

βιολογικές πληροφορίες όπως οντολογία γονιδίων (GO) και του Κιότο Εγκυκλοπαίδεια γονιδίων και γονιδιωμάτων (KEGG) στις μονάδες που είναι λειτουργικά σχολιασμένη [10], ικανοποιεί μερικώς την πρόκληση. Το σκεπτικό για αυτή την προσέγγιση, η οποία ομάδων βαθμούς με σε λειτουργικά υποσύνολα χρησιμοποιώντας GO ή KEGG (ή κάτι ισοδύναμο), προέρχεται από την παρατήρηση ότι τα περισσότερα γονίδια λειτουργούν ως μέρος μιας ομάδας και όχι μεμονωμένα [11]. Ωστόσο, επειδή οι ίδιες-ομάδα γονιδιωματική προφίλ είναι γνωστό ότι είναι εξαιρετικά ετερογενής, προ-ομαδοποιημένα σύνολα γονιδίου μπορεί να μην αντικατοπτρίζουν την πραγματική ομαδοποίηση σε μία ομάδα υπό μελέτη. Επιπλέον, η πλειοψηφία των ανθρώπινων γονιδίων δεν έχουν ακόμα εκχωρηθεί μια σαφή οδό ή σύμπλοκο πρωτεΐνης [12].

Διάφορες αιτίες CRC έχουν αποκαλυφθεί, αλλά η παγκόσμια τοπίο για δυναμικά χαρακτηριστικά των διεργασιών καρκινογένεση παραμένει ασαφής. αλληλεπιδράσεων μεταξύ πρωτεϊνών (PPIs) είναι θεμελιώδεις για βιολογικές διεργασίες, και τα δίκτυα αλληλεπίδρασης πρωτεΐνης (PINs) παροχή ενός γενικού ακόμη στατική άποψη των κυτταρικών μηχανισμών στο κελί. Δυναμικά χαρακτηριστικά των κωδικών PIN μπορεί να αποκαλυφθεί μέσω της ενσωμάτωσης των προφίλ γονιδιακής έκφρασης των δεδομένων ΠΠΑ [13]. Γονιδίων με συσχετισμένες επίπεδα έκφρασης σε διάφορες φυσιολογικές καταστάσεις ή πάνω από τα άτομα σε μια ομάδα είναι πιθανό να εμπλέκονται σε παρόμοιες λειτουργίες ή κυτταρικές διεργασίες. Για παράδειγμα, τα γονίδια που ρυθμίζονται από έναν κοινό παράγοντα μεταγραφής αναμένεται να έχουν συσχετισθεί γονιδιακή έκφραση. Ένα δίκτυο αλληλεπίδρασης γονιδίων (GGIN) κατασκευάζεται με την ενσωμάτωση των δεδομένων γονιδιακής έκφρασης με δεδομένα ΠΠΑ αποσκοπεί σε ένα χάρτη αλληλεπίδρασης των βιο-μορίων που δείχνουν συν-ρυθμιστικών σχέσεων, ενώσεις συν-έκφραση, κατάντη φυσική αλληλεπίδραση μεταξύ πρωτεϊνών που κωδικοποιούνται από τα «αλληλεπιδρώντας» γονίδια και πιθανόν άλλες σχέσεις μεταξύ γονιδίων [14]. Πολλές μέθοδοι που χρησιμοποιούν, για παράδειγμα, ο συντελεστής συσχέτισης [15], [16], την αμοιβαία πληροφόρηση [17], [18], προσομοιωμένη ανόπτηση [19], και αντίστροφη μηχανική προσεγγίσεις [20], [21] έχουν εφαρμοστεί για να επαν- κατασκευάσει GGINs για δεδομένα γονιδιακής έκφρασης μεγάλης κλίμακας μοντέλο οργανισμούς, συμπεριλαμβανομένης της ζύμης και του ανθρώπου. Αρκετές μελέτες κατέδειξαν την εξαγωγή των δυναμικών ιδιοτήτων του κατάσταση-ειδικών δικτύων, με την ενσωμάτωση προτύπων γονίδιο συν-έκφραση και τη φυσική πρωτεΐνη αλληλεπιδράσεις [13], [22], [23].

Με τον καρκίνο είναι μια ασθένεια των συστημάτων, συστημική οι αλλαγές σε ένα καρκινικό κύτταρο κατά την διάρκεια της εξέλιξης του καρκίνου αναμένεται να μετρήσιμα πρόδηλο σε αλλαγές που συμβαίνουν στα GGINs κατασκευάστηκε από δεδομένα που λαμβάνονται σε διάφορες καταστάσεις της ασθένειας. Μια σημαντική αιτία του καρκίνου είναι σειριακά συσσωρευμένη μεταλλάξεις γονιδίων [24]. Πρόσφατες συστηματικών ελέγχων των γονιδιωμάτων καρκίνο έχουν αποκαλύψει ένα σημαντικό αριθμό λειτουργικά ετερογενή γονιδίων, ή κόμβους, που είναι μεταλλαγμένα σε όγκους παχέος εντέρου [25] – [27]. Επειδή τα γονίδια πλήμνη είναι σημαντικές στη λειτουργία ενός κυττάρου, υποθέσαμε ότι μία αλλαγή στην κατάσταση ενός γονιδίου πλήμνη είχε υψηλότερη πιθανότητα από ένα μέσο γονιδίου σε αντανακλώντας την διακοπή λειτουργική αλλαγή στο κύτταρο. Έτσι, ένα γονίδιο κόμβο σε μια κανονική κατάσταση, που έγινε ένα γονίδιο μη-κόμβος πρέπει να έχει μια μεγαλύτερη πιθανότητα στο αντανακλά μια απώλεια ασθένειες που συνδέονται με τη λειτουργία των κυττάρων, ενώ το αντίθετο μπορεί να αντανακλά μια αύξηση στην κυτταρική λειτουργία.

Εδώ , κατασκευάσαμε GGINs για τις τέσσερις φυσιολογικές καταστάσεις – κανονική (NOR), ορθοκολικού αδενώματος (Ade), φλεγμονώδη νόσο του εντέρου (IBD), και CRC – με την ενσωμάτωση των δεδομένων γονιδιακής έκφρασης από τέσσερα αντίστοιχα σύνολα των μικροσυστοιχιών ομάδα με Ανθρώπινη πρωτεΐνη Βάση δεδομένων αναφοράς (HPRD ) [28]. Σε μια δεδομένη κατάσταση, δύο γονίδια που υποτίθεται ότι «αλληλεπιδρούν», αν υπάρχουν εντάσεις έκφρασης σχετίζεται σε μεγάλο βαθμό και αν οι πρωτεΐνες που κωδικοποιούνται από το ζεύγος ήταν γνωστοί για να αλληλεπιδράσουν. Χρησιμοποιώντας τα GGINs κατασκευάσαμε, επινοήσαμε κορυφή (η τάση της εξέλιξης) διαδικασία, σύμφωνα με την οποία τα γονίδια των οποίων τα πτυχία και οι συντελεστές ομαδοποίησης [29] GGINs αλλάξει σε αρμονία με την τάση της εξέλιξης του καρκίνου, ή, τα γονίδια που δεν είναι κέντρα στην Ούτε δικτύου, αλλά να γίνει κόμβους στο δίκτυο CRC, επιλέχθηκαν ως δυνητικά γονίδια του καρκίνου.

Εφαρμόσαμε την κορυφή διαδικασία για τις κρατικές ακολουθίες Ούτε-Ade-CRC και Νορ-IBD-CRC και επιλεγμένα γονίδια με στατιστική σημαντικότητα (μετάθεση δοκιμή

σ

-τιμή & lt? 0.001) παρόμοια με εκείνα που λαμβάνονται με συμβατικές μεθόδους, όπως eBayes και SAM. Ωστόσο, τα γονίδια που επιλέγονται από κορυφαίους είχε ένα πολύ υψηλότερο ποσοστό επιτυχίας (-50%,

σ

-τιμή & lt? 0.001) των γνωστών γονιδίων του καρκίνου από ό, τι τα ποσοστά χτύπημα που λαμβάνεται με eBayes και SAM (~ 20%,

p-τιμή

~ 0,5). Επειδή ToP στήριξε την ανάλυσή του σε στοιχεία από μια σειρά κρατών, που θα χρησιμοποιηθεί επίσης για τον εντοπισμό δυνητικών βιοδείκτες για την έγκαιρη διαγνωστική ανίχνευση της CRC στο Ade και στα κράτη IBD.

Υλικά και Μέθοδοι

δείγματα και μικροσυστοιχίες

Τα στοιχεία που παρέχονται από τον όμιλο Γκιορφί [30] σχετικά με το προφίλ της γονιδιακής έκφρασης του γονιδιώματος σε επίπεδο από δείγματα ιστών από 53 ανθρώπους ασθενείς αξιολογήθηκαν από την HG-U133 Plus 2.0 πλατφόρμα μικροσυστοιχίες (Affymetrix, Santa Clara), η οποία Λίστα 18.267 γονίδια, είχαν κατεβάσει από γονιδιακής έκφρασης Omnibus (GEO) βάση δεδομένων (ένταξη GEO όχι. GSE4183). Οι συστοιχίες έγιναν από τους ιστούς των ασθενών ομαδοποιούνται σε τέσσερις φυσιολογικές καταστάσεις των κατεψυγμένων παχέος βιοψία: 8 για Εξάλλου, και 15 κάθε για Ade, IBD, και CRC, αντίστοιχα. Βιοψίες κόλον ελήφθησαν κατά τη διάρκεια της ρουτίνας ενδοσκοπική επέμβαση πριν από τη θεραπεία [31]. Η ακρίβεια των τιμών έκφρασης μικροσυστοιχιών επικυρώθηκαν από TaqMan RT-PCR δοκιμασία [30]. Η ανάλυση των δεδομένων των μικροσυστοιχιών πραγματοποιούνται σε αυτό το έργο διεξήχθησαν στην Ε περιβάλλον (έκδοση 2.12.0).

Επιλογή Σημαντικές βαθμούς με

επιλεγεί Σημαντικά εκφράζονται γονίδια χρησιμοποιώντας την Ανάλυση Σημασία του αλγορίθμου μικροσυστοιχίες ( SAM) [9] και μονόδρομη ανάλυση διακύμανσης (ANOVA) [32]. Τα στατιστικά κατώφλια για το

σ

-τιμή των Φοιτητών

t-test

και διπλώστε την αλλαγή που χρησιμοποιούνται στη SAM προσδιορίστηκαν χρησιμοποιώντας δημοσιεύονται σε πραγματικό χρόνο τα αποτελέσματα PCR σε 84 γονίδια [30] (Σχήμα S1) . Χρησιμοποιήσαμε δύο τρόπους: (1) το δύο-class λειτουργία αταίριαστο για την επιλογή των γονιδίων των οποίων σημαίνει επίπεδο έκφρασης ήταν σημαντικά διαφορετική σε δύο ομάδες δειγμάτων (ανάλογη με την μεταξύ των θεμάτων

t-test

) και (2) η πολυ -θα θεωρεί τρόπος για την επιλογή γονιδίων των οποίων η μέση έκφραση ήταν διαφορετικό σε ένα σύνολο δειγμάτων μεγαλύτερο από δύο (ανάλογη με μονόδρομη ANOVA). Τα εμπειρικά στατιστικά Bayes (eBayes) χρησιμοποιήθηκε ως εναλλακτική λύση στατιστικό μοντέλο. Για μια ανασκόπηση αυτών των αλγορίθμων δείτε στο [33]. FDRs [34] υπολογίστηκαν με τη χρήση τόσο του Student

t

-ΜΕΛΕΤΕΣ και ANOVA τεστ χρησιμοποιώντας τυχαία μετάθεση στο SAM μέσω του πακέτου R «siggenes».

Κατασκευή GGIN

Πρωτεΐνη -πρωτεΐνη αλληλεπίδρασης (PPI) πληροφορίες για 30.047 εγγραφές πρωτεΐνη και 39.194 αλληλεπιδράσεις είχε κατεβάσει από HPRD [28] και ενσωματώθηκαν με δεδομένα γονιδιακής έκφρασης συγκεκριμένων μικροσυστοιχιών κράτος να κατασκευάσει GGINs, ένα για κάθε κράτος. Για μια δεδομένη κατάσταση και ένα όριο Pearson

σ

-τιμή (βλέπε παρακάτω)

σ

0, συμπεριλάβαμε ένα ζευγάρι γονιδίων στο GGIN εάν: (1) η

σ

-τιμή για το ζευγάρι δεν ήταν μεγαλύτερη από ό, τι

σ

0? (2) το ζεύγος πρωτεΐνη που κωδικοποιείται από το γονίδιο ζεύγος συνδέθηκε στα δεδομένα ΡΡΙ. Για μια δεδομένη κατάσταση και ένα σύνολο δεδομένων μικροσυστοιχιών, συντελεστής συσχέτισης ενός κατά Pearson (PCC) μεταξύ κάθε γονίδιο-ζεύγος υπολογίστηκε με βάση τις εντάσεις σε όλη την ομάδα για το ζεύγος. Δηλαδή, αν ένα σύνολο

n

μικροσυστοιχίες χρησιμοποιείται για τον υπολογισμό, η PCC είναι ότι μεταξύ δύο σετ

n

εντάσεις. Στατιστική συμπερασματολογία με βάση PCC έγινε με δοκιμές μετάθεση και

t

-statistics. Καλούμε μια

σ

-τιμή αντιστοιχεί σε ΔΕΗ ένα Pearson

σ

-τιμή. ιδιότητες του δικτύου είναι

n

εξαρτώμενη. Τα αποτελέσματα που δίνονται είναι για τα δίκτυα 8-δείγμα. Για την 8-δείγμα Ούτε το ένα δίκτυο κατασκευάστηκε (για κάθε

σ

0). Για κάθε ένα από τα άλλα τρία 15-δείγμα μέλη, 100 δίκτυα κατασκευάστηκαν, έκαστο από ένα οκτώ-δείγμα σύνολα τυχαία επιλεγμένους από τα 15 δείγματα. Χρησιμοποιούμε βασικής ορολογίας δικτύου. Λέμε ένας κόμβος

i

με βαθμό

k

i

έχει

k

i

γείτονες. Ο συντελεστής ομαδοποίησης

C

ενός κόμβου είναι ο λόγος του αριθμού των συνδέσεων

e

μεταξύ των γειτόνων της degree-

k

κόμβος με τον αριθμό των πιθανών αυτών των συνδέσμων:

C

= 2

e

/(

k

(

k

-1)) [29]. Διατάξεις για τα δίκτυα έγιναν χρησιμοποιώντας την πλατφόρμα ανοικτού κώδικα Cytoscape (έκδοση 2.7.0) μέσω της λειτουργίας διάταξης «άνοιξη-ενσωματωμένο άκρη-σταθμισμένη». Προεπιλεγμένη παράμετροι τιμές χρησιμοποιήθηκαν, εκτός από το ότι ο «αριθμός των επαναλήψεων» για κάθε κόμβο αυξήθηκε στα 200, και «δύναμη» άλλαξε σε 1500 για την αποφυγή συγκρούσεων. Το plug-in «GOlorize» [35] χρησιμοποιήθηκε για να εκχωρήσει αυτόματα τα χρώματα σε κόμβους γονίδιο να αναδείξει εμπλουτισμένο όρους γονίδιο-οντολογίας. Το χρώμα και το πλάτος ενός άκρου χρησιμοποιήθηκαν για να δείξει ένδειξη και τη δύναμη του συσχετισμού, αντίστοιχα? κόκκινη (μπλε) για θετική (αρνητική) συσχέτιση.

Λειτουργική Υπο-δίκτυα και FFN

Τα γονίδια σε κάθε κράτος-συγκεκριμένες GGIN διατέθηκαν για υπερεκπροσωπούνται βιολογικές λειτουργίες, όπως ορίζεται στο GO όρος ένωση [36]. Εμπλουτισμός αναλύσεις βασίζονται σε όρους υπεργεωμετρική δοκιμής [37] έγιναν χρησιμοποιώντας τα GOstats πακέτο R [38] κατεβάσει από την ιστοσελίδα Bioconductor [39]. Βασίζονται σε λειτουργικό γονίδιο θέτει ένα GGIIN μειώθηκε σε FFN για ευκολότερη οπτική επιθεώρηση.

Cancer Gene Discovery

Το Top διαδικασία (Σχήμα 1) που εφαρμόζεται πάνω και ToP + SAM (TPS) διαδικασίες για την επιλογή με την ακολουθία Nor-Χ-CRC (Χ = Ade ή IBD, ανάλογα με την περίπτωση μπορεί να είναι) αποτελείται από τα εξής βήματα: (1) Κατασκευάστε GGINs για Εξάλλου, το Χ, και CRC χρησιμοποιώντας ένα όριο Pearson

p

– τιμή & lt? 0,01. (2) Επιλέξτε ένα γονίδιο εάν: (α) φαίνεται σε ένα τουλάχιστον GGIN? (Β) τουλάχιστον ένα GGIN ικανοποιεί βαθμό

D

& gt? 4 και συντελεστή ομαδοποίησης

C

& gt? 0? (Γ) του

D

και

C

αύξηση κατά μήκος της ακολουθίας (αλλά κανένας περιορισμός έχει οριστεί για το ζεύγος Nor-X). (3) αποτελούν ξεχωριστή κατηγορία για προέβλεψε γονίδια του καρκίνου που κωδικοποιούν βασικούς παράγοντες μεταγραφής. Στο πλαίσιο της διαδικασίας TPS, ένα επιπλέον βήμα φιλτραρίσματος πρόσθεσε: (4) Περιορίστε τα επιλεγμένα γονίδια να είναι μια DEG (προσαρμοσμένο

σ

-τιμές & lt? 0,05, διπλώστε την αλλαγή & gt? 1.5 ή & lt? 1 /1.5) σε τουλάχιστον στο X εναντίον Ούτε ή CRC εναντίον Ούτε

DEG, διαφορικά εκφρασμένων γονιδίων.? PPIN, δίκτυο αλληλεπίδρασης πρωτεΐνης-πρωτεΐνης. Κουτιά στη δεξιά στήλη δείχνουν πώς η προβλεπόμενη ογκογόνο γονίδιο CDC6 πληροί τα υψηλά κριτήρια: το υπο-δίκτυο αλληλεπίδρασης γονιδίων-γονιδίων που σχετίζονται με αυτό αυξάνεται σημαντικά η κατάσταση της προόδου από την κανονική μέσω αδένωμα να CRC

Η

Hit Τιμή γονίδια του καρκίνου του

Hit ρυθμός ορίστηκε ως η αναλογία των επιλεγμένων γονιδίων πλευρά φαίνεται δίδεται ως ένα γονίδιο του καρκίνου που σχετίζονται με

CancerGenes

[40] προς το συνολικό αριθμό των επιλεγμένων γονιδίων, δίδεται ως ποσοστό.

CancerGenes

απαριθμεί εμπειρογνωμόνων σχολιασμένη γονίδια που σχετίζονται με τον καρκίνο από το δημόσιο κλειδί βάσεις δεδομένων, συμπεριλαμβανομένων Cellmap.org (https://cancer.cellmap.org), Εηίτεζ Gene [41], και Sanger ΚΕΔ [42], και σχόλια του καρκίνου [24], [42] – [44]. Σύνολο 3.165 γονίδια συλλέχθηκαν και διάφορα είδη πηγών (π.χ., το γονίδιο του καρκίνου, ογκοκατασταλτικό γονίδιο σταθερότητα,

κλπ.

) Ήταν όλα συμπεριλαμβάνονται στον υπολογισμό ποσοστό επιτυχίας. Επειδή η Affymetrix HG-U133 Plus πλατφόρμα σειρά 2.0 απαριθμεί 18.267 γονίδια και

CancerGenes

απαριθμεί 3.165 γονίδια, μια τυχαία επιλογή των γονιδίων θα δώσει ένα ποσοστό επιτυχίας κοντά στο 20%.

τυχαιοποίηση

Πραγματοποιήσαμε δύο είδη τυχαίοι. Τύπου 1: Ξεχωριστά για κάθε γονίδιο, αγωνίζομαι για τις εντάσεις στο σύνολο των συστοιχιών. Σε κάθε περίπτωση τυχαιοποίησης, διεξήχθη ένα σκούπισμα πάνω από όλα τα γονίδια. Αυτή η διαδικασία διατηρεί τη διανομή της έντασης για κάθε γονίδιο αλλά καταστρέφει τη συσχέτιση ένταση μεταξύ των ζευγών γονιδίων. Τύπου 2: εκχωρήσει τυχαία ζεύγη γονιδίων για κάθε σύνδεση σε ένα δίκτυο. Η διαδικασία διατηρημένη τον αριθμό των συνδέσεων, αλλά όχι η τοπολογία του δικτύου. Σε κάθε τυχαιοποίηση, πραγματοποιήθηκε ένα σκούπισμα πάνω από όλες τις συνδέσεις στο δίκτυο. Αυτή η διαδικασία διατηρεί τον αριθμό των συνδέσεων, αλλά όχι την τοπολογία του, το δίκτυο. Προσπαθήσαμε ένα τρίτο, τύπου 3, τοπολογία-διατήρηση τυχαιοποίηση σε δίκτυα, στην οποία η τοπολογία έμεινε αμετάβλητη, αλλά τα γονίδια τυχαιοποιήθηκαν σε κόμβους σε ένα δίκτυο. Αυτό αποδείχθηκε ότι δεν είναι μια αληθινή τυχαιοποίηση.

Επιλογή Μαρκαδόροι για πρώιμη διαγνωστική ανίχνευση του CRC

βιοδείκτες για την έγκαιρη ανίχνευση της κατάστασης Ade επιλέχθηκαν από το σύνολο γονίδιο TPS για την Nor-Ade -CRC ακολουθία (βλέπε αποτελέσματα) εκείνα που έχουν πέντε φορές ή περισσότερο αύξηση (δικτύου) πτυχίο από Ούτε να Ade και να είναι ένα DEG με ένα

σ

-τιμή & lt? 0,0001 σε Ade εναντίον Ούτε. Ομοίως για βιοδείκτες για την έγκαιρη ανίχνευση της κατάστασης IBD, με IBD αντικατάσταση Ade

Αποτελέσματα

Σημαντικές διαφορικά εκφραζόμενων γονιδίων

Η συνολική δέσμη επιλεγμένων 2.666 βαθμούς με (FDR & lt.? 0.001, Μαθητή

t-test

(στο SAM)

σ

-τιμή & lt? 0,05, διπλώστε την αλλαγή & gt? 1.5? Σχήμα S1) ήταν οι βαθμούς με ένωση ξεχωριστά επιλέγονται από τρεις κατάσταση ζεύγη? ADE εναντίον NOR, 1652 γονίδια? CRC εναντίον NOR, 1100 γονίδια? IBD εναντίον NOR: 1629 γονίδια. Οι βαθμούς με ταξινομήθηκαν ανάλογα με GO σε έντεκα λειτουργικές ενότητες: αντιγραφή του DNA, την επιδιόρθωση του DNA, του κυτταρικού κύκλου, του πολλαπλασιασμού των κυττάρων, τον μεταβολισμό RNA, μεταγραφή, μετάφραση, η απόπτωση, μεταγωγή σήματος, το ανοσοποιητικό σύστημα, η προσκόλληση των κυττάρων (Πίνακας S1). Ένας χάρτης της θερμότητας που παράγεται από την αμφίδρομη χωρίς επίβλεψη μέθοδο ιεραρχικής ομαδοποίησης (Εικόνα S2) δείχνει την κατάτμηση σε δύο μέρη του CRC, αντικατοπτρίζοντας σχετική ετερογένεια στα δείγματα του καρκίνου. Ωστόσο, καμία δυσκολία στην εξόρυξη CRC συγκεκριμένες βαθμούς με είχε συναντήσει.

Ασθένεια Δίκτυα ήταν μεγαλύτερα και πιο σύνθετα, και CRC Δίκτυο είχαν υψηλότερη πολυπλοκότητα

Αποτελέσματα για GGINs που δίνονται είναι για τα δίκτυα 8-δείγμα. Υπήρχε ένας GGIN αλλά 100 GGINs για κάθε μία από τις καταστάσεις ασθένειας κατασκευάστηκαν (βλέπε Μέθοδοι). Ο αριθμός των γονιδίων και (γονίδιο-γονίδιο) συνδέσεων τόσο ελαττώνεται καθώς μειώνεται η Pearson

σ

-τιμή κατωφλίου

σ

0 [45] σε κατασκευάζεται GGINs (Εικόνα 2), όπως αναμενόταν . Για δεδομένη

σ

0 και οι αριθμοί των γονιδίων και σύνδεση αυξήθηκε στην εξέλιξη Ούτε να Ade με IBD /CRC. αριθμός γονίδιο στο δίκτυο IBD ήταν ελαφρώς μεγαλύτερη από ό, τι CRC, αλλά ο αριθμός κρίκος CRC ήταν σημαντικά μεγαλύτερη από IBD. Οι κατανομές βαθμό των τεσσάρων δικτύων υπάκουσε ισχύ νόμων. Από την άποψη της πολυπλοκότητας του δικτύου (Πίνακας 1), τα τέσσερα δίκτυα ανήκει σε τρεις ομάδες, σε αύξουσα σειρά πολυπλοκότητας: Ούτε, Ade και IBD, και CRC. Και τα τέσσερα δίκτυα που αποτελούνται από συνδεδεμένα υπο-δίκτυα, ή συμπλέγματα. Τα τρία δίκτυα νόσου κάθε κυριαρχείται από ένα τεράστιο σύμπλεγμα, το οποίο περιέχει (κατά μέσο όρο) 760, 971, και 1388 γονίδια, για Ade, IBD, και CRC, αντίστοιχα. Το Ούτε δίκτυο δεν έχει ένα τεράστιο σύμπλεγμα? δύο μεγαλύτερες συστάδες είχαν αντίστοιχα 219 και 73 γονιδίων.

Αριθμός γονίδια (Α) και των αλληλεπιδράσεων γονιδίων-ζεύγος (Β) στα συγκεκριμένα δίκτυα της νόσου, όπως λειτουργίες της Pearson

p-τιμή

όριο,

σ

0, στις 8-δείγμα γονίδιο-δίκτυα των ασθενών που ανήκουν στις τέσσερις state-τύπους: Ούτε, Ade, IBD, και CRC. Τα μη-Ούτε αποτελέσματα κατά μέσο όρο πάνω από 100 τυχαία σύνολα 8-δείγμα. Οι ράβδοι σφάλματος υποδεικνύουν τυπικές αποκλίσεις. Οι αστερίσκοι πάνω (κάτω) οι καμπύλες δίνουν

σ

τιμαί των σπουδαστών δύο δείγματος

t-test

μεταξύ CRC και IBD (CRC και NOR): *

p

– τιμή & lt? 10

-4? **

σ

-τιμή & lt? 10

-8? ***

σ

-τιμή & lt? 10

-12? ****

σ

-τιμή & lt?. 10

-16

Η

CRC Δίκτυο είχε την υψηλότερη πολυπλοκότητα και ήταν ποιοτικά διαφορετικό από το Δίκτυο IBD

Το ποσοστό των hub-όπως τα γονίδια αυξάνεται με τη βαρύτητα της νόσου (Εικόνα 3? βλέπε Εικόνα S3 για ένα σετ GGINs). Για παράδειγμα, λιγότερο από 0.5% από τα γονίδια στο Ούτε, αλλά περισσότερο από 10% σε CRC, είχαν βαθμούς υψηλότερη από 11? μόνο CRC είχε σημαντικό αριθμό γονιδίων με πτυχία 16 ή υψηλότερο? μόνο CRC είχε ένα μη αμελητέο ποσοστό των γονιδίων με βαθμούς μεγαλύτερη από 16, ενώ κατέχει το υψηλότερο επίπεδο του συντελεστή ομαδοποίησης. Αν και πολύ μεγαλύτερο, η πολυπλοκότητα του δικτύου IBD ήταν παρόμοια με εκείνη του Ade. IBD είχαν περισσότερα γονίδια των βαθμών μέχρι 5 από CRC, αλλά λιγότερους κόμβους υψηλό βαθμό και πολύ λιγότερες κόμβους με υψηλούς βαθμούς και συντελεστές μεγάλο ομαδοποίησης (Σχήμα 3).

Genes του βαθμού 1 δεν φαίνονται. Ο συντελεστής ομαδοποίησης ενός γονιδίου του βαθμού 2 είναι είτε 0 ή 1. Οι αστερίσκοι υποδεικνύουν

σ

-τιμές (από Wilcoxon τεστ κατάταξης ποσό) σε σχέση με Ούτε: *

σ

-τιμή & lt? 0,05 ? **

σ

-τιμή & lt?. 0.01

Η

Μεγέθη Σετ Γονιδιακή Λειτουργικές Ενότητες σε FFNs αυξήθηκε γενικά με νόσο Σοβαρότητα

FFNs μειώθηκαν από GGINs μέσω βαθμούς με χώρισμα σύμφωνα με GO όρους (Σχήμα 4? βλέπε πίνακα S2 για ανάλυση εμπλουτισμό GO για τις λειτουργικές μονάδες). Μεγέθη των λειτουργικών ενοτήτων σε FFNs γενικά αυξάνεται με τη βαρύτητα της νόσου (Εικόνα S4). Οι σχέσεις Ούτε & lt? CRC και Ade & lt? CRC που πραγματοποιήθηκε για όλες τις 11 λειτουργίες (το «& lt?» Σύμβολο αναφέρεται στα μεγέθη σε αριθμούς γονίδιο λειτουργικών μονάδων, με το ρ-τιμή μικρότερη από 10

-4). Η σχέση Ούτε & lt? Ade & lt? CRC που πραγματοποιήθηκε σε 10 από τις 11 λειτουργίες (η λειτουργία του ανοσοποιητικού συστήματος ήταν η εξαίρεση), με την τάση να είναι ιδιαίτερα ισχυρή για το μεταβολισμό του RNA, μεταγραφή, επιδιόρθωση του DNA, αντιγραφή του DNA και του κυτταρικού κύκλου. Σε σύγκριση, η σχέση Ούτε & lt? IBD πραγματοποιήθηκε μόνο σε έξι λειτουργίες: μετάφραση, προσκόλληση κυττάρου, τον πολλαπλασιασμό των κυττάρων, το ανοσοποιητικό σύστημα, τη μεταγωγή σήματος και την απόπτωση. Η σχέση Ούτε & lt? Ade & lt? IBD δεν κατέχει με καλή στατιστική υποστήριξη σε οποιαδήποτε από τις λειτουργίες

Οι κόμβοι είναι λειτουργικές ενότητες όνομά του από άποψη Γονιδιακή Οντολογία.. Λειτουργικές μονάδες που περιέχουν λιγότερο από 70 γονίδια δεν φαίνονται. Η διάμετρος μιας μονάδας κλίμακες με το λογάριθμο του αριθμού των γονιδίων στη λειτουργική μονάδα. Το χρώμα σκιά ενός δομοστοιχείου υποδεικνύει τον αριθμό των αλληλεπιδράσεων γονίδιο-γονίδιο ενδο-υπομονάδα ανά γονίδιο. Το πάχος του άκρου υποδεικνύει τον αριθμό των αλληλεπιδράσεων γονιδίων-γονιδίου μεταξύ μονάδα.

Η

Ade-CRC Ζεύγος είχαν σημαντικά μεγαλύτερη Inter-FFN Ποσοστό Διασταυρώσεις Λειτουργικής Σετ Σύνδεσμος

Για κάθε λειτουργία σε ένα FFN κατάλογο των εν λειτουργία συνδέσεων, δηλαδή αλληλεπιδράσεων μεταξύ δύο γονιδίων στη λειτουργική μονάδα, κατασκευάστηκε, και το ποσοστό Inter-FFN διασταυρώσεις των σύνδεσμος συνόλων υπολογίστηκαν (Σχήμα 5). Η τομή Ade-CRC ξεχώρισε ως μια ακραία τιμή σε σχέση με τις άλλες πέντε διασταυρώσεις. Για όλες σχεδόν τις λειτουργικές ενότητες οι πέντε διασταυρώσεις στενά συσσωρεύονται σε τιμές συνήθως το μισό μέγεθος των αντίστοιχων διασταυρώσεων Ade-CRC. Σε σχέση με τις άλλες πέντε διασταυρώσεις οι διασταυρώσεις Ade-CRC είχε

σ

-τιμές των & lt? 10

-2 σε όλες, αλλά μία από τις λειτουργίες (κυτταρική προσκόλληση), και & lt? 10

– 3 σε επτά λειτουργίες (Σχήμα 5). Μια παρόμοια μεταχείριση των τομών Ade-IBD διαπίστωσε ότι όλες οι λειτουργίες είχαν

σ

-τιμές κοντά στη μονάδα. Η σχετικά μεγάλη επικάλυψη μεταξύ DEG σετ από Ade και CRC έχει σημειωθεί πριν [46] – [48]

0 Για μια δεδομένη λειτουργική μονάδα, το ποσοστό επικάλυψης εκφράζεται ως η αναλογία του αριθμού των συνδέσεων (. που ανήκουν σε αυτή την ενότητα) που είναι κοινές στα δύο δίκτυα στον αριθμό των συνδέσεων στο μικρότερο εταίρο. Οι αστερίσκοι υποδεικνύουν

p-τιμές

από Student ένα δείγμα του

t-test

της τομής Ade-CRC έναντι των άλλων πέντε διασταυρώσεις: για *, ** και ***, em

σ

-τιμή & lt?. 10

-2, 10

-3 και 10

-4, αντίστοιχα

Η

Παραδείγματα από τα κορυφαία γονίδια

μια κορυφαία γονίδιο που απαιτείται για να έχουν σύνδεση του δικτύου της και την πολυπλοκότητα αυξήθηκαν αισθητά κατά μήκος ενός κράτους ακολουθία. Τέσσερα παραδείγματα τέτοιων γονιδίων που παράγοντες κώδικας μεταγραφής (ΤΡ) ήταν οι τρεις γονίδια ILF2, CDK1, και SNRPF, επιμέλεια τόσο από την επάρ- και IBD-αλληλουχίες και MCM10, αποκλειστικά από τη ΙΒϋ-αλληλουχία (Σχήμα 6). Σε κάθε περίπτωση, η προβλεπόμενη γονίδιο ήταν ένας κόμβος χαμηλού βαθμού στον σχετικά μικρό Ούτε δικτύου, έγινε ένα μέτριο κόμβο σε ένα αισθητά αναπτυχθεί δίκτυο Ade ή IBD (ή και τα δύο, ανάλογα με την περίπτωση μπορεί να είναι), και, τέλος, μια υπερ-κόμβο στο μεγάλο και σύνθετο δίκτυο CRC.

Μερική δίκτυα στα οποία οι τέσσερις κορυφαίες γονίδια ILF2 (πάνω αριστερά), CDK1 (κάτω αριστερά), SNRPF (πάνω δεξιά), και MCM10 (κάτω δεξιά) ανήκουν ξεχωριστά στην Ούτε, δικτύων ade, IBD και CRC. Σε κάθε περίπτωση, το μέγεθος της μονάδας συνδέεται με την κορυφή του γονιδίου αυξάνει κατά μήκος της εθνικής ακολουθία Nor-Ade-CRC ή Nor-IBD-CRC, ή και τα δύο. Κομβικές κωδικό χρώματος τελειώματα: υπερ-έκφραση, κόκκινο? υπο-έκφραση, μπλε? ουδέτερο, μαύρο. Κομβικό κωδικό χρώματος για τις λειτουργίες GO: κυτταρικού κύκλου, πράσινο? RNA splicing, μοβ? επιδιόρθωσης του DNA, καφέ? αναδιαμόρφωσης χρωματίνης και την τροποποίηση των ιστονών, κίτρινο.

Η

ανακάλυψη γονιδίων του καρκίνου χρησιμοποιώντας τη διαδικασία ToP

Η κορυφαία διαδικασία εφαρμόζεται στο Nor-Ade-CRC (ή απλά Ade) και ούτε -IBD-CRC (ή IBD) ακολουθίες για να επιλέξετε τα γονίδια του καρκίνου, δίνοντας λίστες των 389 και 381 γονίδια, αντίστοιχα, με 373 γονίδια που εμφανίζονται και στις δύο λίστες (Πίνακας S3, Εικόνα S5A). Η διαδικασία απέδωσε 134 TPS και 74 γονίδια από τις αλληλουχίες Ade και IBD, αντίστοιχα, με το 67 κοινή και στις δύο λίστες (Πίνακας S4, Εικόνα S5B). Σε σύγκριση, η κορυφή επιλεγεί μόνο 7 και 4 γονιδίων, αντίστοιχα, από την CRC-Ade-Nor και CRC-IBD-Nor αλληλουχίες και TPS μείωσε τα σύνολα σε null σύνολα (τα δεδομένα δεν παρουσιάζονται), επιβεβαιώνοντας οι δύο αλληλουχίες δεν εμφάνισαν οποιαδήποτε τάση προς μια κατάσταση ασθένειας. Εφαρμογή των eBayes και SAM με τα κατώτατα όρια

σ

-τιμή & lt? 0,05 και απόλυτη πολλαπλή μεταβολή & gt? 1.5 απέδωσε DEG λίστες των 2648 και 2666 γονίδια, αντιστοίχως. Ενώ κάθε ένα από τα βήματα προς την κορυφή διαδικασία είχε σημαντικό αντίκτυπο στη μείωση του αποθέματος των υποψηφίων γονιδίων, η απαίτηση ToP γονίδιο ήταν ο κύριος περιοριστικός παράγοντας. Για την ακολουθία Ade η απαίτηση ότι τα γονίδια κωδικοποιούν πρωτεΐνες που αναφέρονται HPRD μείωσε τον αριθμό των υποψηφίων από 18.267 σε 9.122? ότι ανήκε σε μία από τις σχετικές GGINs, με 3.556? ότι ήταν μια κορυφαία γονίδιο, με 389? ότι ήταν μια DEG από SAM, στο 134. Για την ακολουθία IBD οι δύο πρώτες μειώσεις ήταν οι ίδιες, και τα αντίστοιχα τρία τελευταία αριθμοί ήταν 3.074, 381, και 74 (Σχήμα S6). Δοκιμές

μεταθέσεων

Το

σ

-τιμές για τις δοκιμές μετάθεση από την τυχαιοποίηση των όλες τις επιλεγμένες λίστες γονίδια ήταν & lt? 0.001 (Σχήμα 7Α). Οι αριθμοί (τυπική απόκλιση σε παρένθεση) των eBayes και SAM βαθμούς με το 1000 τύπου 1 τυχαίοι (βλέπε Μέθοδοι) ήταν 228,81 (13.93) και 255,31 (25,57), αντίστοιχα (Σχήμα S7A-Β). Επειδή τυχαία καταστρέφονται συσχέτιση της έντασης μεταξύ των γονιδίων, τα 1000 τυχαίοι απέδωσε μόνο 0,42 (1,2) γονίδια (Σχήμα S7C), καθιστώντας την κατασκευή του δικτύου αδύνατη. Για την κορυφή διαδικασία γονίδιο έντασης σχετίζεται υποβλήθηκε σε τύπου-1 τυχαιοποίηση και γονίδιο-link συνδέεται, προς τον τύπο-2 (βλέπε Μέθοδοι). Το 1000 τυχαίοι οι αριθμοί των γονιδίων που επιλέγονται από την κορυφή και TPS για την ακολουθία Ade ήταν 29.09 (τυπική απόκλιση 8,18) και 8,31 (3,36), αντίστοιχα (Σχήμα S8A-Β)? αντίστοιχος αριθμός για την ακολουθία IBD ήταν 28.01 (8,15) και 6,58 (2,91) (Σχήμα S8C-D).

δοκιμές τυχαιοποίηση είναι τύπου 1 για eBayes και SAM, και τύπου-2 για την κορυφή και την κορυφή + SAM (βλέπε Μέθοδοι). (Α) αριθμός γονιδίων που επιλέγονται. (Β) Ποσοστό των γονιδίων που απαριθμούνται στο

CancerGenes

[40] βάση δεδομένων μεταξύ εκείνων που επιλέγονται στο (Α). ***

σ

-τιμή & lt? 0,001 για τη δοκιμή μετάθεση από την τυχαιοποίηση? **

σ

-τιμή & lt? 0,01? *,

σ

-τιμή & lt?. 0.05

Η

Hit Τιμές για γνωστά γονίδια του καρκίνου του

Κατανομή των ποσοστών χτύπημα για γνωστούς που σχετίζονται με τον καρκίνο γονίδια σε γονίδιο που επιλέξατε στο 1000 τυχαιοποίηση των συμβατικών μεθόδων (eBayes και SAM? Σχήμα S7D-Ε) και την κορυφή μεθόδους που βασίζονται (Ade-κορυφή, Ade-TPS, IBD-top, και IBD-TPS? Σχήμα S8E-H) έχουν όλα μέσους όρους στο 19% -23 % εύρος, μια αναμενόμενη τιμή ενόψει των 3.165 σχετίζονται με τον καρκίνο γονίδια μεταξύ των 18.267 γονίδια σε μια συστοιχία HG-U133 Plus 2.0. Τα ποσοστά χτύπημα των πραγματικών περιπτώσεων (δοκιμή μετάθεση

σ

-τιμή από την τυχαιοποίηση σε παρένθεση) ήταν 23% (0,422), 22% (0.547), 47% (& lt? 0.001), 50% (0.008) , 51% (0,008) και 54% (& lt? 0.001), αντίστοιχα (Σχήμα 7Β). Σε σύγκριση, το μέσο ποσοστό επιτυχίας των επιλεγμένων γονιδίων σε όλες τις δοκιμές τυχαιοποίηση ήταν περίπου 20% (Σχήμα S8). Τα ποσοστά επιτυχίας των κορυφαίων 134 γονίδια από eBayes και SAM ήταν 27% και 33%, αντίστοιχα (Σχήμα 8). Η συνδυασμένη λίστα Ade και IBD TPS είχε 141 προβλέψει τα γονίδια του καρκίνου, εκ των οποίων 67 προήλθε αποκλειστικά από Ade, 67 ήταν κοινές για Ade και IBD, και 7 προήλθε αποκλειστικά από IBD (Πίνακας S3). GO εμπλουτισμός ανάλυση έδειξε ότι οι όροι GO πυρηνικής αυλό, τον κυτταρικό κύκλο και νουκλεοζίτη πρόσδεση ήταν οι πιο εμπλουτισμένο, με τη συμμετοχή 51%, 33% και 34%, αντίστοιχα, των γονιδίων (Πίνακας 2). Εξήντα επτά από τα 141 γονίδια ήταν γνωστά γονίδια του καρκίνου, εκ των οποίων 27, 39 και 1, αντίστοιχα, ήρθε μόνο από Ade, ήταν κοινά για Ade και IBD, και ήρθε από IBD μόνο (Πίνακας S4).

TF μη-όγκου σημαίνει ότι δεν περιλαμβάνονται στο

CancerGenes

. (Α) Σε σύνολο γονιδίων που επιλέγονται από στατιστικό όριο. (Β) Σε κορυφή 134 γονίδια σε γονίδιο σετ. Οι αριθμοί που δίνονται παραπάνω μπάρες δείχνουν συνολικό αριθμό γονιδίων στο σύνολο.

Η

γονίδια του καρκίνου του CRC και Transcription Factors

Σαράντα οκτώ από τα 141 γονίδια είχαν αναφερθεί ότι είναι CRC γονίδια του καρκίνου , εκ των οποίων 15, 32 και 1, αντίστοιχα, ήρθε από Ade μόνο, ήταν κοινά για Ade και IBD, και από IBD μόνο (Πίνακας 3). Το ποσοστό του παράγοντα μεταγραφής (TF) που κωδικοποιεί τα γονίδια μεταξύ των επιλεγμένων γονιδίων μεταβάλλεται ανάλογα με τη μέθοδο που χρησιμοποιήθηκε (Σχήμα 8Α). Στην περίπτωση των κορυφαίων 134 γονίδια, ο αριθμός των γονιδίων ΤΡ κυμαίνονταν από 10 σε 17 (Σχήμα 8Β). Μεταξύ των 141 γονίδια TPS, 16 ήταν μεταγραφικού παράγοντα (TF) που κωδικοποιεί (Πίνακας 4), εκ των οποίων 12 έχουν περιληφθεί στο

CancerGenes

[40] και 11, συμπεριλαμβανομένων των 3 που δεν αναφέρεται στο

CancerGenes

, είχε αναφερθεί στη βιβλιογραφία ως CRC συνδέονται (Πίνακας 3). PML, που αναφέρονται στο

CancerGenes

και αναφέρονται στην βιβλιογραφία ως σχετικές CRC, ήταν η μόνη TF μεταξύ των 16 ΤΡ που προήλθε αποκλειστικά από την ακολουθία IBD? οι τέσσερις TFs CEBPB, E2F5, MYC και RUVBL1 ήταν κοινή τόσο για τις ακολουθίες Ade και IBD? το υπόλοιπο 11 προήλθε αποκλειστικά από την ακολουθία Ade (Πίνακας 4).

Η

βιοδείκτες για την πρώιμη διαγνωστική ανίχνευση του CRC

Μεταξύ των 141 προβλέψει TPS γονίδια του καρκίνου 13 προσδιορίστηκαν ως δείκτες για την πρώιμη διάγνωση του CRC? 11 για την ανίχνευση της κατάστασης Ade, εκ των οποίων 9 προήλθε αποκλειστικά από την αλληλουχία Ade και 2 ήταν κοινή και στις δύο ακολουθίες, και 2, για την ανίχνευση της κατάστασης IBD και επίσης κοινή και στις δύο αλληλουχίες (Πίνακας 5). Σε κάθε περίπτωση ο υποψήφιος είτε δεν εμφανίζονται ή εμφανίζονται ως ένα γονίδιο single-link στο (η) Ούτε (δίκτυο), αλλά άνθισε σε ένα που έχει πέντε ή περισσότερες συνδέσεις και έντονα εκφράζεται (

σ

-τιμή & lt ?. 0.0001) σε Ade ή IBD, ανάλογα με την περίπτωση μπορεί να είναι, και προχώρησε για να γίνει ένα σημαντικό κόμβο στη CRC

η

Συζήτηση

οι περισσότεροι αισθητή για τα GGINs ήταν ότι τα μεγέθη τους και πολυπλοκότητα μεγάλωσε με τη σοβαρότητα της νόσου (Σχήμα 2) σε αύξουσα σειρά: Ούτε, Ade, IBD, και CRC. Το δίκτυο IBD είχαν ελαφρώς περισσότερα γονίδια, αλλά πολύ λιγότερες συνδέσεις από CRC.

You must be logged into post a comment.