PLoS One: Η ταξινόμηση Δέκα τύποι σοβαρών καρκίνων Βασισμένο σε αντίστροφη φάση Προφίλ Πρωτεΐνη Array


Αφηρημένο

Συγκέντρωση τεράστια σύνολα δεδομένων των γονιδιωμάτων καρκίνο απαιτεί πιο αποτελεσματική και αυτόνομη διαδικασίες για την ταξινόμηση των τύπων καρκίνου και να ανακαλύψετε μερικά απαραίτητα γονίδια για να διακρίνουν διαφορετικούς καρκίνους. Επειδή η έκφραση της πρωτεΐνης είναι πιο σταθερό από την έκφραση του γονιδίου, επιλέξαμε συστοιχία αντίστροφης πρωτεΐνη φάσης (RPPA) δεδομένα, μια ισχυρή και εύρωστη προσέγγιση υψηλής απόδοσης που βασίζονται σε αντισώματα για στοχευμένη πρωτεωμικής, για την εκτέλεση της έρευνας μας. Σε αυτή τη μελέτη, προτείναμε ένα υπολογιστικό πλαίσιο για την ταξινόμηση των δειγμάτων των ασθενών σε δέκα κύριους τύπους καρκίνου με βάση τα στοιχεία RPPA χρησιμοποιώντας το ΠΕΑ (Sequential ελάχιστη βελτιστοποίηση) μέθοδο. Μια προσεκτική διαδικασία επιλογής χαρακτηριστικό χρησιμοποιήθηκε για να επιλέξετε 23 σημαντικών πρωτεϊνών από το σύνολο των 187 πρωτεϊνών από mRMR (ελάχιστο πλεονασμού Μέγιστη Συνάφεια Feature Selection) και IFS (Στοιχειώδες Δυνατότητα επιλογής) στο σύνολο εκπαίδευσης. Με τη χρήση των 23 πρωτεΐνες, που κατατάσσονται με επιτυχία τις δέκα τύπους καρκίνου με ένα MCC (Matthews Συντελεστής Συσχέτισης) 0,904 στο σύνολο εκπαίδευσης, αξιολογούνται από 10 φορές διασταυρωμένης επικύρωσης, και ένα MCC από 0,936 σε μια ανεξάρτητη σειρά δοκιμών. Διεξήχθη περαιτέρω ανάλυση αυτών των 23 πρωτεϊνών. Οι περισσότερες από αυτές τις πρωτεΐνες μπορεί να παρουσιάσει τα χαρακτηριστικά του καρκίνου? Chk2, για παράδειγμα, παίζει σημαντικό ρόλο στον πολλαπλασιασμό των καρκινικών κυττάρων. Η ανάλυσή μας από αυτές τις 23 πρωτεΐνες προσδίδει αξιοπιστία στη σημασία αυτών των γονιδίων ως δεικτών της ταξινόμησης του καρκίνου. Πιστεύουμε, επίσης, τις μεθόδους και τα ευρήματά μας μπορεί να ρίξει φως σχετικά με τα ευρήματα των ειδικών βιοδεικτών διαφόρων τύπων καρκίνων

Παράθεση:. Zhang PW, Chen L, Huang Τ, Ζανγκ Ν Κονγκ ΧΥ, Cai YD (2015) ταξινόμηση Δέκα τύποι σοβαρών καρκίνων Βασισμένο σε αντίστροφη φάση Profiles πρωτεΐνη Array. PLoS ONE 10 (3): e0123147. doi: 10.1371 /journal.pone.0123147

Ακαδημαϊκό Επιμέλεια: Lukasz Κουργκάν, Πανεπιστήμιο της Αλμπέρτα, Καναδάς

Ελήφθη: 20 Οκτωβρίου, 2014? Αποδεκτές: 24, Φεβ 2015? Δημοσιεύθηκε: 30, Μαρτίου 2015

Copyright: © 2015 Zhang et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Δεδομένα Διαθεσιμότητα: Όλα τα σχετικά δεδομένα είναι εντός του Υποστηρίζοντας αρχεία πληροφοριών του χαρτιού και

Χρηματοδότηση:. η εργασία αυτή χρηματοδοτήθηκε από το Εθνικό Πρόγραμμα βασικής Έρευνας της Κίνας (2011CB510102, 2011CB510101), και το Εθνικό Ίδρυμα Φυσικών Επιστημών της Κίνας (31371335, 81171342, 81201148 , 61401302), Πρόγραμμα Καινοτομίας της Σαγκάης Δημοτική Επιτροπή Παιδείας (12ZZ087), η χορήγηση του «The First-class Πειθαρχία των Πανεπιστημίων στη Σαγκάη», Tianjin Ερευνητικό Πρόγραμμα του Ιδρύματος Εφαρμογών και Advanced Technology (14JCQNJC09500), το Εθνικό Ίδρυμα Ερευνών για το Διδακτορικό πρόγραμμα της Ανώτατης Εκπαίδευσης της Κίνας (20130032120070, 20120032120073) και του Ιδρύματος Ανεξάρτητη Καινοτομίας του Πανεπιστημίου Tianjin (60302064, 60302069). Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

Προσδιορισμός ειδική για τον καρκίνο γονίδια που εμπλέκονται στην ογκογένεση και την εξέλιξη του καρκίνου είναι ένας από τους σημαντικότερους τρόπους για να κατανοήσουν τις παθοφυσιολογικές μηχανισμούς των καρκίνων και για να βρείτε θεραπευτικοί στόχοι φαρμάκων. Πολλές προσπάθειες έχουν γίνει για να εντοπίσει βιοδείκτες του καρκίνου με τη χρήση προφίλ γονιδιακής έκφρασης [1]. Ωστόσο, η ευρωστία των βιοδεικτών μικροσυστοιχιών που προέρχονται από πολύ φτωχές [2]? Αυτό είναι εν μέρει επειδή η ευρωστία μπορεί να επηρεάζεται εύκολα στα επίπεδα γονιδιακής έκφρασης από μικρές περιβαλλοντικές αλλαγές. Χωρίς την αξιολόγηση των επιπέδων έκφρασης πρωτεΐνης, δεν θα υπήρχε κανένας τρόπος για να απεικονίσουν τις αιτίες του πολλαπλασιασμού και της διαφοροποίησης του όγκου. Ως εκ τούτου, η καλύτερη κατανόηση των μεταφραστικών μελών αυτών των γονιδιωμάτων θα μας φέρει ένα βήμα πιο κοντά στην εξεύρεση πιθανών φαρμακευτικών στόχων και να απεικονίζουν off-στόχο επιπτώσεις στην θεραπεία του καρκίνου.

array πρωτεΐνη αντίστροφης φάσης (RPPA) είναι ένα ισχυρό και ισχυρή προσέγγιση υψηλής απόδοσης που βασίζονται σε αντισώματα για στοχευμένη πρωτεομική που μας επιτρέπει να εκτιμηθεί ποσοτικά η έκφραση της πρωτεΐνης στόχου σε μεγάλα σύνολα δείγμα [3]. Σε αυτή τη διαδικασία, οι αναλύτες δείγμα ακινητοποιείται σε στερεά φάση, και τα αναλύτη-ειδικά αντισώματα που χρησιμοποιούνται στην φάση διαλύματος. Μέσα από τη χρήση δευτερογενών tagging και την ενίσχυση του σήματος για την ανίχνευση συνδεδεμένων αντισωμάτων, πρωτεΐνες μπορεί να μετρηθεί. Σε σύγκριση με τις συμβατικές πρωτεΐνη ποσοτικά μεθόδους, όπως κηλίδωση Western ή ELISA, τα πλεονεκτήματα της RPPA περιλαμβάνουν: μεγάλης κλίμακας ποσοτικοποίηση της πρωτεΐνης, υψηλή ευαισθησία, και μικρές απαιτήσεις όγκου του δείγματος [4]. Ενώ φασματομετρία μάζας, που συνήθως χρησιμοποιείται για την ποσοτικοποίηση του αριθμού των θέσεων φωσφορυλίωσης ή φωσφοπεπτίδια, απαιτεί περαιτέρω πέψη πρωτεΐνη, πεπτίδιο κλασμάτωση και ο εμπλουτισμός φωσφοπεπτιδίου μετά από εκχύλιση πρωτεΐνη, RPPA μπορεί να ποσοτικοποιήσει άμεσα την εκχυλισμένη πρωτεΐνη [5]. Η εφαρμογή των RPPA έχει εκτενώς επικυρωθεί και για τις δύο κυτταρικές γραμμές και δείγματα ασθενών [6], και απεικονίζει μηχανιστική ιδέες πίσω από ασθένειες.

Επί του παρόντος, οι τύποι του καρκίνου χαρακτηριστεί από ανατομικές θέσεις όπου βρίσκονται, όπως του πνεύμονα του καρκίνου, ο καρκίνος του μαστού, κλπ Είτε αυτά τα ονόματα θα μπορούσε να παρουσιάσει πρωτεομική λειτουργία τους δεν έχει καθοριστεί μέχρι τώρα. Αν και υπήρξαν κάποιες μεθόδους για να βρείτε τις υπογραφές βιοδείκτη για συγκεκριμένους τύπους καρκίνου, υπάρχει ακόμη λίγη έρευνα που κάνει ότι θεωρεί διαφορετικούς τύπους καρκίνου στο σύνολό της, προκειμένου να προσδιοριστούν παρόμοια ή διακριτά πρωτεομική πρότυπα έκφρασης και τα χαρακτηριστικά τους κατάταξη.

σε αυτή τη μελέτη, προτείναμε μια υπολογιστική ροής εργασίας για να χρησιμοποιήσετε με επιτυχία 23 πρωτεΐνες για να ταξινομήσει τα δείγματα ασθενών σε δέκα βασικούς τύπους καρκίνου. Πρώτον, χωρίστηκαν τυχαία τα 3467 δείγματα από δέκα τύπους καρκίνων σε ένα σύνολο εκπαίδευσης με 2775 δείγματα και μια ανεξάρτητη δοκιμή που με 692 δείγματα. Οι αναλογίες του κάθε τύπου καρκίνου ήταν παρόμοια στο σύνολο εκπαίδευσης και την ανεξάρτητη σειρά δοκιμών. Στη συνέχεια, με το σύνολο εκπαίδευσης, όλα τα χαρακτηριστικά για τη διάκριση ομάδες ανάλογα με τα κριτήρια (τουλάχιστον για Πλεονάζον Προσωπικό Μέγιστη Συνάφεια Feature Selection) mRMR. Με 10 φορές διασταυρωμένης επικύρωσης για το σύνολο εκπαίδευσης, το ΠΕΑ (Sequential ελάχιστη βελτιστοποίηση) και το IFS (Στοιχειώδες Δυνατότητα επιλογής) [7] μέθοδοι χρησιμοποιήθηκαν για να επιλέξετε ένα βέλτιστο σύνολο χαρακτηριστικών γνωρισμάτων. Ένα σύνολο 23 πρωτεϊνών που επιλέγονται από το σύνολο εκπαίδευσης. MCC τους (Matthews Συντελεστής Συσχέτισης) για το σύνολο εκπαίδευσης ήταν 0.904 αξιολογούνται από 10 φορές σταυρό επικύρωση και MCC τους στην ανεξάρτητη σειρά δοκιμών ήταν 0.936. μέθοδοι μας θα μπορούσε να παράσχει ιατρούς με γνώση των βασικών διακριτών βιοχημικών χαρακτηριστικών των τύπων καρκίνου και θα μπορούσε να ρίξει νέο φως στις ανακαλύψεις των ειδικών βιοδεικτών διαφορετικών τύπων καρκίνου.

Υλικά και Μέθοδοι

Σύνολα Δεδομένων

Τα στοιχεία RPPA είχαν κατεβάσει από το TCPA (ο καρκίνος Proteome Atlas) βάση δεδομένων [8] (https://app1.bioinformatics.mdanderson.org/tcpa/_design/basic/download.html κάτω Pan-Cancer 11 RBN ), το οποίο περιείχε πρωτεομική έκφραση του 3467 ασθενείς με καρκίνο σε 11 τύπους καρκίνου (Πίνακας 1). Επειδή COAD (αδενοκαρκίνωμα του παχέος εντέρου) και READ (αδενοκαρκίνωμα του ορθού) μοιράζονται παρόμοιες παθολογίες και αναλύθηκαν μαζί στο TCGA (The Cancer Genome Atlas) του παχέος εντέρου και του ορθού μελέτη για τον καρκίνο [9], συνδυάσαμε τα δείγματα COAD και διαβάστε μαζί ως «αδενοκαρκίνωμα του παχέος εντέρου και ορθού δείγματα αδενοκαρκινώματος ». Ως εκ τούτου, δέκα τύπους καρκίνου αναλύθηκαν στην παρακάτω βήματα.

Η

Επειδή δεν είχαμε μια διαφορετική ομάδα για να κάνει επικύρωση πολυκεντρική, έχουμε τυχαία χωρίζονται τα 3467 δείγματα σε μια εκπαίδευση που με 2775 δείγματα και ανεξάρτητη δοκιμή που με 692 δείγματα. Η αναλογία των δειγμάτων εκπαίδευσης πάνω από τα δείγματα της δοκιμής ήταν περίπου 4: 1 και κρατήσαμε το ποσοστό κάθε τύπου καρκίνου περίπου το ίδιο με το σύνολο εκπαίδευσης και την ανεξάρτητη σειρά δοκιμών. Η περιγραφή των δέκα τύπων καρκίνου και μεγέθη των δειγμάτων τους σε δίδονται στον Πίνακα 1. Τα σύνολα δεδομένων κατάρτισης και δοκιμής του S1 File.

Κάθε δείγμα περιείχε 187 πρωτεΐνες των οποίων τα επίπεδα έκφρασης μετρήθηκαν με πρωτεΐνη αντίστροφης φάσης array (RPPA). RPPA είναι μια συστοιχία πρωτεΐνη που επιτρέπει τη μέτρηση των επιπέδων έκφρασης πρωτεΐνης σε ένα μεγάλο αριθμό δειγμάτων ταυτόχρονα με ποσοτικό τρόπο, όταν είναι διαθέσιμα υψηλής ποιότητας αντισωμάτων [4]. Τα επίπεδα έκφρασης πρωτεΐνης 187 θεωρήθηκαν ως 187 χαρακτηριστικά που πρέπει να χρησιμοποιούνται για τις ταξινομήσεις τύπο καρκίνου σε αυτήν την μελέτη.

επιλογή Feature

Τα επίπεδα έκφρασης πρωτεϊνών 187 δεν μπορούν όλα να συμβάλλουν εξίσου στην ταξινόμηση . Η μέθοδος μέγιστο ενδιαφέρον ελάχιστο πλεονασμού (mRMR) [10-13] χρησιμοποιήθηκε για να ταξινομήσει τη σημασία των 187 χαρακτηριστικών στο σετ εκπαίδευσης. Τα 187 λειτουργίες μπορεί να παραγγελθεί με τη χρήση αυτής της μεθόδου ανάλογα με τη σημασία του κάθε χαρακτηριστικού στο στόχο και σύμφωνα με την απόλυση μεταξύ των ίδιων χαρακτηριστικών.

Ας Ω δηλώνει το σύνολο των 187 χαρακτηριστικά, ενώ Ω

s

συμβολίζει το ήδη επιλεγμένο σύνολο χαρακτηριστικών που περιλαμβάνει χαρακτηριστικά m και Ω

t

δηλώνει το να-να-επιλεγμένο σύνολο χαρακτηριστικών που περιλαμβάνει n χαρακτηριστικά. Το ενδιαφέρον για τον

D

της δυνατότητας

στ

στο Ω

t

με τα μαθήματα του καρκίνου

γ

μπορεί να υπολογιστεί από:

(1)

Και η απόλυση

R

της δυνατότητας

στ

στο Ω

t

με τα ήδη επιλεγμένα χαρακτηριστικά Ω

s

μπορεί να υπολογιστεί από:

(2)

Για να αποκτήσετε τη λειτουργία

στ

ι

στο Ω

t

με μέγιστο ενδιαφέρον με τις τάξεις του καρκίνου

γ

και ελάχιστο πλεονασμό με τα ήδη επιλεγμένα χαρακτηριστικά Ω

s

, η Εξίσωση (1) και η εξίσωση (2) συνδυάζονται καθώς η mRMR λειτουργίας:

(3)

Η αξιολόγηση χαρακτηριστικό θα συνεχίσει 187 γύρους. Μετά από αυτές τις αξιολογήσεις, έναν πίνακα κατάταξης λειτουργία

S

με τη μέθοδο mRMR μπορούν να ληφθούν:

(4)

Ο δείκτης χαρακτηριστικό h δείχνει τη σημασία της δυνατότητας. Ένα χαρακτηριστικό με μικρότερο δείκτη h ανέφερε ότι είχε μια καλύτερη trade-off μεταξύ της μέγιστης ενδιαφέρον και το ελάχιστο πλεονασμό, και μπορεί να συμβάλλει περισσότερο στην κατάταξη.

Με βάση τον πίνακα κατάταξης χαρακτηριστικό στον πίνακα mRMR , υιοθετήσαμε τη μέθοδο της τμηματικής δυνατότητα επιλογής (IFS) [14, 15] για να καθορίσουν το βέλτιστο σύνολο χαρακτηριστικών γνωρισμάτων, ή ένας που επιτυγχάνει την καλύτερη απόδοση ταξινόμησης. Για την εκτέλεση αυτής της μεθόδου, χαρακτηριστικά στον πίνακα mRMR προστέθηκαν ένα προς ένα από τα υψηλότερα σε χαμηλότερη κατάταξη.

Όταν είχε προστεθεί ένα άλλο χαρακτηριστικό, ένα νέο χαρακτηριστικό που δημιουργήθηκε. Και έχουμε 187 σύνολα χαρακτηριστικό, και το i-οστό χαρακτηριστικό σετ είναι:

(5)

Με βάση κάθε ένα από τα 187 σύνολα χαρακτηριστικό, οι ταξινομητές έχουν κατασκευαστεί και ελεγχθεί για την κατάρτιση, οι οποίες με την επικύρωση 10 φορές σταυρό . Με Matthews Συντελεστής Συσχέτισης (MCC) 10 φορές σταυρό επικύρωσης υπολογίζεται με σύνολο εκπαίδευσης, παίρνουμε ένα τραπέζι IFS με τον αριθμό των χαρακτηριστικών και των επιδόσεων τους.

S

βέλτιστη είναι η βέλτιστη σύνολο χαρακτηριστικών γνωρισμάτων που επιτυγχάνει την υψηλότερη MCC στο σύνολο εκπαίδευσης. Επιτέλους, το μοντέλο χτίστηκε με χαρακτηριστικά από το

S

βέλτιστη σε σύνολο εκπαίδευσης και αυξημένα στο σύνολο ελέγχου.

μεθόδων πρόβλεψης

Εμείς χωρίζονται τυχαία το σύνολο στοιχεία που σε ένα σύνολο εκπαίδευσης και μια ανεξάρτητη σειρά δοκιμών. Το σύνολο εκπαίδευσης περαιτέρω χωρισμένο σε 10 ίσου μεγέθους κατατμήσεις. Η 10-πλάσια διασταυρωμένης επικύρωσης για το σύνολο εκπαίδευσης εφαρμόστηκε για να επιλέξετε τα χαρακτηριστικά και την κατασκευή του μοντέλου πρόβλεψης. Η κατασκευάστηκε μοντέλο πρόβλεψης δοκιμάστηκε στην ανεξάρτητη σειρά δοκιμών. Το πλαίσιο του μοντέλου κατασκευής και αξιολόγησης φαίνεται στο σχήμα 1.

Κατ ‘αρχάς, έχουμε χωριστεί τυχαία το σύνολο των δεδομένων που σε ένα σύνολο εκπαίδευσης και μια ανεξάρτητη σειρά δοκιμών. Στη συνέχεια, το σύνολο εκπαίδευσης περαιτέρω χωρισμένο σε 10 ίσου μεγέθους κατατμήσεις για την εκτέλεση 10 φορές σταυρό επικύρωσης. Με βάση το σύνολο εκπαίδευσης, επιλέχθηκαν τα χαρακτηριστικά και το μοντέλο πρόβλεψης χτίστηκε. Επιτέλους, η κατασκευασμένη μοντέλο πρόβλεψης δοκιμάστηκε στην ανεξάρτητη σειρά δοκιμών

Η

Προσπαθήσαμε τα ακόλουθα τέσσερα μηχανή αλγόριθμους μάθησης:. ΠΕΑ (Sequential ελάχιστη βελτιστοποίηση), ΙΒ1 (Κοντινότερη γείτονα Αλγόριθμος), Dagging, RandomForest (Random Δάσος), και επέλεξε τη βέλτιστη ένα για την κατασκευή του ταξινομητή. Η σύντομη περιγραφή αυτών των αλγορίθμων ήταν όπως παρακάτω.

Η μέθοδος ΠΕΑ είναι ένα από τα δημοφιλή αλγορίθμων για μηχανές διανυσμάτων υποστήριξης της κατάρτισης (SVM) [16]. Σπάει το πρόβλημα βελτιστοποίησης ενός SVM σε μια σειρά από μικρότερες δυνατές υπο-προβλήματα, τα οποία στη συνέχεια λυθεί αναλυτικά [16]. Για την αντιμετώπιση των προβλημάτων multi-class, ζεύγη σύζευξης [17] εφαρμόζεται για την κατασκευή του multi-class ταξινομητή.

ΙΒ1 είναι κοντινότερο γείτονά ταξινομητή, στην οποία χρησιμοποιείται η κανονικοποιημένη Ευκλείδεια απόσταση για να μετρήσει την απόσταση των δύο δειγμάτων . Για ένα δείγμα δοκιμής ερώτημα, η τάξη ενός δείγματος εκπαίδευσης με ελάχιστη απόσταση έχει εκχωρηθεί σε δείγμα δοκιμής ως προβλεπόμενη αποτέλεσμα. Για περισσότερες πληροφορίες, ανατρέξτε στην Aha και Kibler της μελέτης [18].

Dagging είναι μια μετα-ταξινομητής που συνδυάζει πολλαπλά μοντέλα που προέρχονται από ένα μόνο αλγόριθμο μάθησης που χρησιμοποιούν ξένα δείγματα από το σύνολο δεδομένων εκπαίδευσης και ενσωματώνει τα αποτελέσματα αυτών των μοντέλων με πλειοψηφία [19]. Ας υποθέσουμε ότι υπάρχει ένα σύνολο δεδομένων εκπαίδευσης που περιέχουν

n

δείγματα.

k

υποσύνολα είναι κατασκευασμένα με τη λήψη τυχαία δείγματα χωρίς αντικατάσταση, έτσι ώστε καθένα από αυτά να περιέχει

ν

»δείγματα, όπου

kn

‘≤

n

. Ένα επιλεγμένο βασικό αλγόριθμο μάθησης είναι εκπαιδευμένοι σε αυτά

k

υποσύνολα, προκαλώντας έτσι

τα μοντέλα k

ταξινόμηση

Μ

1,

Μ

2, …,

Μ

k

. Για ένα δείγμα ερώτημα,

Μ

i

(1≤

i

k

) παρέχει Προβλέψτε το αποτέλεσμα και το τελικό αποτέλεσμα προβλεπόμενη του Dagging είναι η κατηγορία με τις περισσότερες ψήφους.

Τυχαία Δάσος αλγορίθμου προτάθηκε για πρώτη φορά από Loe Breiman [20]. Πρόκειται για ένα συγκρότημα που αποτελείται από προγνωστικός πολλαπλασιάζονται δέντρων απόφασης. Ας υποθέσουμε ότι υπάρχουν

n

δείγματα στο σετ εκπαίδευσης και κάθε δείγμα εκπροσωπήθηκε από

Μ

χαρακτηριστικά. Κάθε δέντρο κατασκευάζεται από τυχαία επιλογή

Ν

, με την αντικατάσταση, από το σύνολο εκπαίδευσης. Σε κάθε κόμβο, επιλέξτε τυχαία

m

χαρακτηριστικά και επιλέξτε τη βελτιστοποιημένη διάσπαση για να αυξηθεί το δέντρο. Μετά την κατασκευή πολλαπλασιάζονται δέντρα απόφασης, η προβλεπόμενη αποτέλεσμα ενός συγκεκριμένου δείγματος είναι η τάξη που λαμβάνει τις περισσότερες ψήφους από αυτά τα δέντρα.

Matthews Συντελεστής Συσχέτισης (MCC)

MCC [21], μια ισορροπημένη μετρούν ακόμη και αν οι κατηγορίες είναι πολύ διαφορετικά μεγέθη, χρησιμοποιείται συχνά για την αξιολόγηση της απόδοσης των μεθόδων πρόβλεψης σε ένα πρόβλημα ταξινόμησης δύο κατηγορίας. Για τον υπολογισμό της MCC, πρέπει κανείς να μετρήσει τέσσερις τιμές: αληθώς θετικά (TP), ψευδώς θετικό (FP), αλήθεια αρνητικό (ΤΝ) και ψευδώς αρνητικό (FN) [22, 23]. Στη συνέχεια, το MCC μπορεί να υπολογιστεί από

(6)

Ωστόσο, πολλά προβλήματα περιλαμβάνει περισσότερες από δύο κατηγορίες, δηλαδή

Ν

μαθήματα κωδικοποιούνται από 1,2, …,

N

(

Ν

& gt? 2). Σε αυτή την περίπτωση, μπορούμε να υπολογίσουμε το MCC για την κατηγορία

i

για τη μέτρηση εν μέρει την απόδοση των μεθόδων πρόβλεψης μετρώντας TP, FP, ΤΝ και FN ως εξής τρόπους:

TP

i

: ο αριθμός των δειγμάτων έτσι ώστε τάξης

i

είναι προέβλεψε την τάξη τους και την αληθινή τάξη?

FP

i

: ο αριθμός των δείγματα έτσι ώστε τάξης

i

είναι προβλέψει και ταξική

i

τους δεν είναι αλήθεια τάξη τους?

TN

i

: ο αριθμός δειγμάτων έτσι ώστε τάξης

i

δεν είναι ούτε προβλέψει τάξη τους, ούτε πραγματική τάξη τους?

FN

i

: ο αριθμός των δειγμάτων έτσι ώστε τάξης

i

δεν προβλέπεται τάξη και την τάξη τους

i

είναι αλήθεια τάξη τους.

κατά συνέπεια, MCC για την κατηγορία

i

, συμβολίζεται με MCC

i

, μπορεί να υπολογιστεί από

(7)

Ωστόσο, αυτές οι τιμές δεν μπορούν να μετρήσουν πλήρως την απόδοση των μεθόδων πρόβλεψης, η συνολική MCC σε multiclass περίπτωση εξακολουθεί να είναι αναγκαία. Ευτυχώς, Gorodkin [24] έχει αναφερθεί η MCC σε multiclass υπόθεση, η οποία χρησιμοποιήθηκε για την αξιολόγηση της απόδοσης των μεθόδων πρόβλεψης που αναφέρονται στην ενότητα «Μέθοδοι Πρόβλεψης». Παράλληλα, η MCC για κάθε κατηγορία θα δοθεί επίσης ως παραπομπές. Εδώ, δώσαμε την σύντομη περιγραφή της συνολικής MCC σε multiclass περίπτωση ως κατωτέρω.

Ας υποθέσουμε ότι υπάρχει ένα πρόβλημα ταξινόμησης για

ν

δείγματα, λένε

s

1,

s

2, …,

s

ν

, και

Ν

μαθήματα κωδικοποιούνται από 1,2, … ,

Ν

. Ορίστε μια μήτρα

Y

με

ν

σειρές και

Ν

στήλες, όπου

Y

ij

= 1, αν η

i

-ου δείγμα ανήκει στην κατηγορία

ι

και

Y

ij

= 0 διαφορετικά. Για ένα μοντέλο ταξινόμησης, προέβλεψε τα αποτελέσματα της για το πρόβλημα μπορεί να εκπροσωπείται από δύο μήτρες

X

και

C

, όπου

X

έχει

n

σειρές και

Ν

στήλες, (8) και

C

έχει

Ν

σειρές και

Ν

στήλες,

C

ij

είναι ο αριθμός των δειγμάτων στην κατηγορία

i

που έχουν προβλεφθεί για να είναι κατηγορίας

ι

.

για Πίνακες

X

και

Y

, λειτουργία covariance τους μπορεί να υπολογιστεί από την (9) όπου

X

k

και

Y

k

είναι η

k

-ου στήλη των πινάκων

X

και

Y

, αντίστοιχα, και η μέση τιμή των αριθμών σε

X

k

και

Y

k

, αντίστοιχα. Στη συνέχεια, η MCC σε multiclass περίπτωση μπορεί να υπολογιστεί από την ακόλουθη διατύπωση [25]:

(10)

Όπως και το MCC στην περίπτωση δύο κατηγοριών, η MCC σε multiclass περίπτωση κυμαίνεται μεταξύ -1 και 1, όπου 1 δείχνει το τέλειο ταξινόμησης, -1 την ακραία εσφαλμένη κατάταξη.

αποτελέσματα και Συζήτηση

ο mRMR και IFS αποτελέσματα

Με τη χρήση της μέγιστης ενδιαφέρον ελάχιστο πλεονασμό μέθοδο (mRMR), η 187 χαρακτηριστικά αυτά ανάλογα με τη σημασία στο σύνολο εκπαίδευσης. Το αποτέλεσμα του πίνακα mRMR μπορεί να βρεθεί στο S2 File.

Κατά τη διάρκεια της προσέγγισης IFS, κάθε χαρακτηριστικό πρωτεΐνης προστέθηκε ένα προς ένα. Η κατάταξη τα MCC που λήφθηκαν από τέσσερις μεθόδους πρόβλεψης, για το σύνολο εκπαίδευσης αξιολογούνται από 10 φορές την επικύρωση σταυρό παρουσιάζονται στο S3 αρχείου. Εμείς απεικονίζεται η ταξινόμηση MCCs ως σχήμα 2 από τα δεδομένα στο S3 αρχείου. Μπορεί να παρατηρηθεί ότι τα υψηλότερα τα MCC για ΠΕΑ, ΙΒ1, Dagging και RandomForest ήταν 0.985, 0.937, 0.969 και 0.925, υποδεικνύοντας ΠΕΑ μπορεί να χρησιμοποιηθεί για την κατασκευή ενός βέλτιστου ταξινομητή. Με προσεκτική τον έλεγχο των προβλεπόμενων αποτελεσμάτων της ΠΕΑ, μπορεί να φανεί ότι με τη χρήση των κορυφαίων 23 πρωτεΐνες, το MCC έφθασε 0,904 που ήταν η πρώτη φθάνουν πάνω από 0.900. Με περισσότερες πρωτεΐνες, το MCC δεν αυξήθηκε κατά πολύ. Ως εκ τούτου, στην παρούσα μελέτη, εξετάσαμε τις 23 πρωτεΐνες ως το βέλτιστο σύνολο χαρακτηριστικών γνωρισμάτων και αυτά τα 23 πρωτεΐνες θεωρούνται ως οι πιο σημαντικές πρωτεΐνες στην ταξινόμηση αυτών των δέκα τύπους καρκίνων. Αξιολογήσαμε την απόδοση πρόβλεψη τους για την ανεξάρτητη σειρά δοκιμών και το MCC ήταν 0.936. Το MCC για κάθε τύπο καρκίνου μπορεί να βρεθεί σε S3 File.

Plot να δείξει την MCCs των διαφορετικών ταξινομητών κατασκευάστηκε με διαφορετικό αριθμό χαρακτηριστικών πρωτεΐνη που επιλέγεται από τον πίνακα mRMR κατά τη διαδικασία IFS για σύνολο εκπαίδευσης. Όταν επιλέχθηκαν οι πρώτοι 23 πρωτεΐνες, η MCC έφτασε 0.904, η οποία ήταν η πρώτη φτάσει πάνω από 0.900 και με περισσότερες δυνατότητες πρωτεΐνη, η MCC δεν αυξηθεί πολύ. Θεωρήσαμε τις 23 πρωτεΐνες ως τις πιο σημαντικές πρωτεΐνες για την ταξινόμηση.

Η

Τα επιλεγμένα top 23 πρωτεΐνες για τη διάκριση των τύπων καρκίνου

Η επιλεγμένη κορυφή Οι 23 πρωτεΐνες συνοψίζονται στον Πίνακα 2. Αυτά πρωτεΐνες μπορεί να παίζουν σημαντικό ρόλο στην κατάταξη των δέκα διαφορετικών τύπων καρκίνου. Οι περισσότερες από αυτές τις πρωτεΐνες έχουν αναφερθεί ότι σχετίζεται με ορισμένους όγκους. Για παράδειγμα, κλαουδίνης-7 έχει αναφερθεί ότι υπερ-εκφράζεται σε όγκους του μαστού [26] και ρυθμισμένα προς τα κάτω σε κεφαλής και λαιμού καρκίνωμα [27]. Tigar είναι ρυθμισμένα προς τα πάνω σε όγκους του παχέος εντέρου [28]. Η γονιδιακή ενίσχυση του ESR1 εμφανίζεται συχνά με τον καρκίνο του μαστού [29]. PREX1 εκφράζεται έντονα σε καρκίνο προστάτη [30]. Έτσι, τα ευρήματά μας επιβεβαιωθούν από αυτά τα προηγούμενα αποτελέσματα. Παρακάτω, θα συζητήσουμε τη βιολογική σημασία των 23 πρωτεϊνών λεπτομερώς με βάση τη λειτουργία του γονιδίου, μονοπάτια των κυττάρων και των βιολογικών λειτουργιών, που μπορεί να ρίξει κάποιο φως σχετικά με τις διαφορές των διαφορετικών καρκίνων στα επίπεδα έκφρασης της πρωτεΐνης. Συζητάμε κυρίως αυτά τα γονίδια σε τμήματα ανάλογα με το Robert A. Weinburg του [31]. Για ορισμένα γονίδια που δεν ισχύουν για τα χαρακτηριστικά του καρκίνου, θα προσπαθήσουμε να βάλουμε αυτά τα γονίδια με παρόμοιες λειτουργίες μαζί για συζήτηση (βλέπε σχήμα 3).

Οι 23 επιλεγμένες πρωτεΐνες αποδοθεί σε επτά ενότητες βασίζονται κυρίως σε χαρακτηριστικά του καρκίνου . Για εκείνους που δεν σχετίζονται με τον καρκίνο που σχετίζονται με οδούς, βάλαμε τα γονίδια με παρόμοιες λειτουργίες μαζί για να συζητήσουν.

Η

Η πρόληψη του κυτταρικού θανάτου είναι ζωτικής σημασίας για την ανάπτυξη του καρκίνου, επειδή τα καρκινικά κύτταρα είναι συχνά ανθεκτικά στην αποπτωτική σηματοδότηση που προκαλείται από βλάβη του DNA και άλλους παράγοντες. Στα αποτελέσματα μας βρήκαμε ένα γονίδιο που σχετίζεται με αποπτωτικά μηχανήματα και θα μπορούσαν να χρησιμοποιηθούν για τη διάκριση διαφόρων τύπων καρκίνου. Εδώ, θα συζητήσουμε NDRG1, καθώς και τα προηγούμενα ευρήματα που δείχνουν τη σχέση του με τον καρκίνο. NDRG1 (Ν-myc κατάντη ρυθμίζονται γονίδιο 1) είναι μια φωσφορυλιωμένη πρωτεΐνη [32] που θα μπορούσε να ενεργοποιείται από το γονίδιο ρ53 ογκοκατασταλτικό και που απαιτείται για την επαγωγή της ρ53 απόπτωσης που διαμεσολαβείται στο καρκίνου του παχέος εντέρου κυτταρική γραμμή [33]. Επειδή η πρωτεΐνη NDRG1 έχει κρίσιμο ρόλο στην αναστολή της ανάπτυξης πρωτογενούς όγκου, είναι γνωστό ως καταστολέας μετάσταση σε έναν αριθμό καρκίνων, συμπεριλαμβανομένων του παχέος εντέρου, του προστάτη και του καρκίνου του μαστού [34].

αντιγραφόμενης αθανασία είναι ένα σημαντικό σήμα κατατεθέν του καρκίνου, η οποία συνήθως αναγνωρίζεται ως απορυθμισμένη τον πολλαπλασιασμό των κυττάρων. Τα ευρήματά μας σε αρκετά γονίδια συνδέονται με τον κύκλο σημαντικό κύτταρο σε επιλεγμένες πρωτεΐνες απεικονίζουν όχι μόνο τη σημασία τους για την ανάπτυξη του καρκίνου, αλλά επίσης χρησιμοποιείται για πρώτη φορά ως δείκτες ταξινόμησης καρκίνου. Αυτά τα γονίδια συνδέονται με τον κύκλο των κυττάρων που συζητούνται παρακάτω: Κυκλίνη Β1 έχει ένα ρόλο στη ρύθμιση του κυτταρικού κύκλου: πριν από την είσοδο μίτωση, τα κύτταρα αναστροφή μεταξύ G2 και μίτωσης μέχρις ότου υπάρξει επαρκής συσσώρευση της κυκλίνης Β για την υποστήριξη δραστηριότητα CDK1 [35]. Misexpressed κυκλίνης Β1 στον πυρήνα έχει βρεθεί σε ένα τεράστιο ποσοστό των κυττάρων ορισμένων νεοπλασμάτων, και κυκλίνη Β1 έχει θεωρηθεί ως ισχυρός προγνωστικός παράγοντας σε ανθρώπινο καρκίνωμα του μαστού και το καρκίνωμα των πλακωδών κυττάρων [36]. Η κυκλίνη Ε1, που κωδικοποιείται από CCNE1, είναι ένα από τα μέλη της οικογένειας κυκλίνης, η οποία ελέγχει τις διαδικασίες του κυτταρικού κύκλου με δραματικές περιοδικότητα της αφθονίας. Πρόσφατα, μια μελέτη σύνδεσης γονιδιώματος σε επίπεδο διαπιστώθηκε ότι rs8102137 στο γονίδιο CCNE1 σχετίζεται με καρκίνο της ουροδόχου κύστης [37]. Η μετα-ανάλυση δείχνει επίσης ότι υπάρχει υπερ-έκφραση αυτής της πρωτεΐνης με τον καρκίνο του μαστού [38]. Chk2 (σημείο ελέγχου κινάσης 2), όπως μία κινάση πρωτεΐνης σερίνης /θρεονίνης, θα μπορούσε να ανταποκριθεί σε βλάβη του DNA, προκειμένου να διατηρηθεί η ακεραιότητα γενωμική [39]. Έχει δειχθεί ότι Chk2 παίζει σημαντικό ρόλο στον πολλαπλασιασμό των καρκινικών κυττάρων [40], προσελκύοντας μεγάλη προσοχή σε αυτό ένας στόχος δυνατόν αντικαρκινικό σχεδιασμό φαρμάκου [41] κάνει.

Είναι σαφές ότι είναι εισβολή ένα χαρακτηριστικό γνώρισμα του καρκίνου, ακόμη και αν υποκείμενων μηχανισμών του είναι ακόμα ένα αίνιγμα. Μέχρι τώρα, το κέρδος και την απώλεια των πρωτεϊνών προσκόλλησης κυττάρου-κυττάρου είναι οι κύριοι λόγοι της εισβολής, ιδιαίτερα η απώλεια της E-cadherin [31]. Στα αποτελέσματα μας, Ε-καδερίνη και ορισμένα πολικότητας που σχετίζονται με πρωτεΐνες βρέθηκε ότι θα μπορούσε να χρησιμοποιηθεί για τη διάκριση διαφόρων τύπων καρκίνου. Αυτές οι πρωτεΐνες αναλύονται κατωτέρω: Ε-καδερίνης, ως τύπου 1 κλασική cadherin, προκαλεί αλληλεπιδράσεις κυττάρου. Η πρόοδος του όγκου συνδέεται συχνά με την απώλεια της λειτουργίας του E-cadherin, που οδηγεί σε μια πιο κινητικό και επεμβατική φαινότυπο [42]. PREX1 (φωσφατιδυλινοσιτόλη-3,4,5-τριφωσφορικής-εξαρτώμενη παράγοντας ανταλλαγή Rac) εκφράζεται έντονα σε καρκίνο του προστάτη, που δείχνει μια σχέση μεταξύ της εισβολής κυττάρων και έκφραση του [30]. Σε μελανώματα, PREX1 υπερ-έκφραση συνδέθηκε με την ενεργοποίηση της ERK-ΜΑΡΚ σηματοδότησης και απαιτούνται για την αποτελεσματική μετάσταση melanoblast, καθώς και για τη μετανάστευση [43]. Κλαουδίνης-7, ένα κοινό διαμεμβρανική πρωτεΐνη, παίζει ζωτικό ρόλο στο σχηματισμό και τη διατήρηση της διαπερατότητας σε πολωμένα επιθηλιακά κύτταρα [44]. Η παρεκκλίνουσα κλαουδίνης-7 προφίλ έκφρασης έχει βρεθεί σε διάφορους όγκους, όπως υψηλά επαγόμενη κλαουδίνης-7 έκφραση σε δύο όγκους πρωτογενή και μεταστατικό καρκίνο του μαστού [26], αλλά είναι ρυθμισμένη προς τα κάτω σε κεφαλής και λαιμού καρκίνωμα [27]. Αυτές οι προηγούμενες μελέτες υποστηρίζεται περαιτέρω τα ευρήματά μας ότι κλαουδίνης-7 θα μπορούσε να χρησιμοποιηθεί ως βιολογικός δείκτης για την διαφοροποίηση και την ταξινόμηση των διαφόρων όγκων. Rab-25, ως μέλος της οικογένειας Rab του GTPases, Rab-25 είναι μία ουσιαστικά δραστική ΟΤΡάσης Rab που παίζει καθοριστικό ρόλο στην κορυφαία οδούς ανακύκλωση και διακυττάρωσης στο πολωμένο επιθηλιακά κύτταρα. Επειδή η απώλεια της κυτταρικής πολικότητας είναι ένα ουσιαστικό χαρακτηριστικό γνώρισμα του καρκίνου, Rab-25 σχετικές εμπορίας έχει σημαντικό αντίκτυπο στην επιθηλιακών κυττάρων πρόγραμμα της πολικότητας στην εξέλιξη του καρκίνου [45].

ενεργειακό μεταβολισμό των καρκινικών κυττάρων Ανώμαλη παρατηρήθηκε για πρώτη φορά από τον Otto Warbugy το 1930 και έχει γίνει αποδεκτή ως χαρακτηριστικό γνώρισμα του καρκίνου. σύνθεση Ανώμαλη λιπαρών οξέων ως ένα είδος του μεταβολισμού της ενέργειας βρίσκεται σε πολλά καρκινικά κύτταρα [46]. Εδώ, αρκετές σημαντικές λιπαρό οξύ και γλυκολυτικά γονίδια που σχετίζονται με τον μεταβολισμό βρίσκονται στα επιλεγμένα 23 πρωτεΐνες: FASN είναι ένα ένζυμο κλειδί που απαιτείται για de ηονο σύνθεση λιπαρού οξέος. Έχει βρεθεί ότι η έκφραση FASN και δραστικότητα παθολογικά αυξημένη σε πολλούς τύπους ανθρώπινων καρκίνων, η οποία μπορεί να συμβάλει στην κυτταρική αντίσταση σε φάρμακο και προκαλούμενη από ακτινοβολία απόπτωση [46]. ACC1 είναι ένα περιοριστικό του ρυθμού ένζυμο στη de novo σύνθεση των λιπαρών οξέων. Φαίνεται να είναι το ένζυμο που περιορίζει πολλαπλασιαζόμενα καρκινικά κύτταρα. ACC1 έχει βρεθεί να είναι επάνω ρυθμισμένη σε πολλαπλασιαστικά καρκινικές κυτταρικές σειρές, όπως του προστάτη, του μαστού και του ήπατος. Πράγματι, έχει δειχθεί ότι η knock-down του ACC1 με siRNA προάγει την απόπτωση στον καρκίνο του προστάτη και του μαστού καρκινικά κύτταρα αλλά όχι σε μη καρκινικό κύτταρα ελέγχου, υπογραμμίζοντας υψηλότερη εξάρτηση καρκινικά κύτταρα »σε αυτό το ένζυμο από φυσιολογικό ιστό [47]. ΑΜΡΚ (ΑΜΡ-ενεργοποιημένη πρωτεϊνική κινάση, που κωδικοποιείται από το γονίδιο PRKAA1 /2) παίζει έναν κρίσιμο ρόλο στην ανίχνευση διαθέσιμης ενέργειας και ο συντονισμός των εξωτερικών σήματα ανάπτυξης με τον κυτταρικό μεταβολισμό [48]. Μια μείωση του ΑΜΡΚ σηματοδότηση, που προκαλείται κυρίως από την απώλεια του γονιδίου λειτουργίας STK11, μπορεί να οδηγήσει σε αυξημένη ενεργοποίηση του mTOR και μια στροφή προς γλυκολυτικό μεταβολισμό, το οποίο βρίσκεται σε μία ποικιλία καρκίνων, συμπεριλαμβανομένων NSCLC [49] και του καρκίνου του τραχήλου της μήτρας [50] .

Ανώμαλη έκφραση των υποδοχέων ορμόνης είναι συχνά φαίνονται σε καρκίνους που σχετίζονται με το φύλο, όπως ο καρκίνος του μαστού και του καρκίνου του προστάτη. Τρεις υποδοχείς ορμόνης αναφέρονται επίσης στα επιλεγμένα πρωτεΐνες: προγεστίνη υποδοχέα (PR), όπως ένα πυρηνικό υποδοχέα στεροειδών, έχει υψηλή ειδικότητα για σύνδεση προγεστερόνης [51]. Έχει δειχθεί στη βιβλιογραφία ότι PR αναστέλλει τη μετάβαση από G1 προς S στον κυτταρικό κύκλο και την προώθηση της απόπτωσης σε κύτταρα καρκίνου του ενδομητρίου [52]. Στη μελέτη φάσης ΙΙ GOG119, ένα οιστρογόνο υποκατάστατο που ονομάζεται ταμοξιφαίνη μπορεί να ενισχύσει την δραστηριότητα προγεστερόνη προκειμένου να προκληθεί PR και τη θεραπεία του ενδομητρίου ασθενείς [53]. οιστρογονικών υποδοχέων (ER, ενεργοποιείται από οιστρογόνου ορμόνης) είναι μία από τις πιο σημαντικές θεραπευτικοί στόχοι σε καρκίνους του μαστού, δεδομένου ότι η συσχέτιση μεταξύ της έκφρασης ER και κυτταρική απόκριση προς τα οιστρογόνα [54]. Έχει αναφερθεί ότι η γονιδιακή ενίσχυση ESR1 συχνά να συμβεί με τον καρκίνο του μαστού [29]. Υποδοχέα ανδρογόνου (AR? NR3C4) πιστεύεται ότι μεσολαβεί μόνο όλες τις βιολογικές δράσεις του ενδογενούς, λειτουργώντας κυρίως στη ρύθμιση της ανδρικής ανάπτυξη. Λόγω της ισχυρής σύνδεσης μεταξύ ΑΕ και του καρκίνου του προστάτη, οι ανταγωνιστές ανδρογόνων ή θεραπεία στέρησης ανδρογόνων έχει εφαρμοστεί εμποδίζουν τον πολλαπλασιασμό των κυττάρων του καρκίνου των ασθενών με εξαρτώμενων από ανδρογόνα καρκίνου του προστάτη σε κλινική θεραπεία [55].

Απροσδόκητα, μεταξύ αυτών οι 23 επιλεγμένες πρωτεΐνες που χρησιμοποιούνται για τη διάκριση διαφορετικών καρκίνων, α-τουμπουλίνης και GAPDH που χρησιμοποιείται συχνά ως έλεγχοι σε ανάλυση κηλίδος Western. Στο επόμενο μέρος, θα συζητήσουμε γνωστά ευρήματα σχετικά με α-τουμπουλίνης και GAPDH που συνηγορούν προς την εγκυρότητα των ευρημάτων μας για τη σημασία τους για τη διάκριση των καρκίνων. Για παράδειγμα, και οι δύο α- και β- πρωτεΐνες τουμπουλίνης είναι υπεύθυνες για τη συναρμολόγηση των μικροσωληναρίων (ΜΤ, κυτταροσκελετικές πολυμερικές δομές), και ορισμένες μετα-μεταφραστικές τροποποιήσεις. Η ακετυλίωση της α-τουμπουλίνης (Lys-40) [56] θα μπορούσε να αλλάξει τη δυναμική συμπεριφορά του ΜΣ, η οποία μπορεί να οδηγήσει σε αλλαγές στις βιολογικές λειτουργίες που ΜΤ εκτελεί κατά τη διάρκεια της κυτταρικής διαίρεσης, της μετανάστευσης, και ενδοκυτταρική διακίνηση. Λαμβάνοντας τις δυναμικές παραμέτρους υπόψη, ΜΣ παρέχει έναν ελκυστικό στόχο για την χημειοθεραπεία κατά του ταχέως αναπτυσσόμενα κύτταρα όγκου όπως σε λέμφωμα και λευχαιμία, μεταστατικούς καρκίνους, και αργής ανάπτυξης όγκων του μαστού, των ωοθηκών, του πνεύμονα και [57, 58]. Κατά την τελευταία δεκαετία, GAPDH (αφυδρογονάση 3-φωσφορικής αφυδρογονάσης) θεωρήθηκε ένα γονίδιο οικοκυρική και ήταν ως έλεγχος για ίση φόρτωση κατά την πειραματική διαδικασία. Ωστόσο, έχει δειχθεί ότι η έκφραση GAPDH ποικίλλει διαφορετικούς τύπους ιστών. Επιπλέον, η έκφραση GAPDH διαφέρει λόγω τάση οξυγόνου [59], και τα επίπεδα έκφρασης του GAPDH ποικίλουν σε φαλλοπειά καρκίνους σωλήνα και ωοθηκών [60]. Με βάση την προτίμηση GAPDH για AU-πλούσια στοιχεία, έχει δειχθεί ότι GAPDH μπορεί να συνδέονται προς τον CSF-1 3’UTR που σταθεροποιούν το mRNA [60]. Για να συνοψίσουμε, που συνδυάζει όλα τα στοιχεία, πρωτεΐνες τουμπουλίνης και GAPDH μπορεί να φέρει μια νέα προοπτική για μελέτες για τον καρκίνο, και προτείνεται ότι δεν χρησιμοποιούνται ως μάρτυρες σε ανάλυση κηλίδος western των διαφορετικών τύπων καρκίνου.

Άλλα επιλεγμένα πρωτεΐνες περιλαμβάνουν φωσφατάσες, μεταγραφικοί ενεργοποιητές, πρωτεΐνες συνδετήρα και υποδοχέων τρανσφερίνης: GATA3 είναι ένας μεταγραφικός ενεργοποιητής με υψηλά επίπεδα έκφρασης [61] και την τρίτη πιο συχνά μεταλλαγμένο γονίδιο στον καρκίνο του μαστού [62]. Έτσι, GATA3 έχει αποδειχθεί ότι είναι ένας χρήσιμος δείκτης ανοσοϊστοχημική να προβλέψει επανεμφάνιση του όγκου νωρίς στην εξέλιξη του καρκίνου του μαστού. PEA15, ως μια πολυλειτουργική πρωτεΐνη συνδέτης εκφράζεται κυρίως σε κύτταρα του νευρικού συστήματος, όπως τα αστροκύτταρα [63], ελέγχει μια ποικιλία κυτταρικών διεργασιών, όπως κυτταρική επιβίωση, τον πολλαπλασιασμό, τη μετανάστευση και προσκόλληση [64]. λειτουργίες PEA15 σε διάφορους καρκίνους, καταλήγοντας γλοιοβλάστωμα, αστροκύτωμα, και του μαστού, καθώς και καρκίνων του δέρματος. PEA15 μπορεί να έχει τόσο αντι-(σε καρκίνωμα των ωοθηκών [65]) και προ (γλοιοβλάστωμα [66]) ογκογόνο λειτουργίες, ανάλογα με τις αλληλεπιδράσεις του. TFRC είναι ένας υποδοχέας τρανσφερίνης. Πρόκειται για ένα σημαντικό εισαγωγέα σιδήρου στα περισσότερα κύτταρα θηλαστικών. Έχει δειχθεί ότι οι πρωτεΐνες TFRC αύξηση του μαστού, κακοήθη καρκίνο του παγκρέατος, και άλλων καρκίνων [67, 68]. ΡΚΟα κωδικοποιείται από το γονίδιο PRKCA και είναι μια σερίνη και θρεονίνη-ειδική κινάση. Αυτό το γονίδιο εκφράζεται εντόνως σε πολλαπλές μορφές καρκίνου, και η υψηλή ενεργοποίηση ΡΚΟα έχει ταυτοποιηθεί για την προώθηση της γένεση του καρκίνου του μαστού [69].

You must be logged into post a comment.