PLoS One: Μια Ensemble Προγνωστικοί Μοντέλο για τον καρκίνο του παχέος εντέρου


Αφηρημένο

καρκίνος του παχέος εντέρου μπορούν να ομαδοποιηθούν σε στάδια Dukes A, B, C και D με βάση τις εξελίξεις της. Σε γενικές γραμμές, πιο προηγμένες ασθενείς έχουν χειρότερη πρόγνωση. Για την ενσωμάτωση των συστημάτων πρόβλεψης στάδιο εξέλιξης με συστήματα πρόβλεψη υποτροπής, προτείναμε ένα σύνολο προγνωστικό μοντέλο για καρκίνο του παχέος εντέρου. Σε αυτό το μοντέλο, κάθε ασθενής είχε ανατεθεί μια πιο δυνατή σκηνή και μια πιο δυνατή κατάσταση επανάληψης. Εάν ένας ασθενής που είχε προβλεφθεί να είναι η επανάληψη των ασθενών σε προχωρημένο στάδιο, θα πρέπει να ταξινομηθούν σε ομάδα υψηλού κινδύνου. Το σύνολο μοντέλο θεωρείται τόσο τα στάδια εξέλιξης και την κατάσταση επανάληψης. ασθενείς υψηλού κινδύνου και οι ασθενείς χαμηλού κινδύνου που προβλέπεται από το σύνολο μοντέλο είχε σημαντική διαφορετική επιβίωσης χωρίς νόσο (p-value δοκιμασία log-rank, 0.0016) και της νόσου ειδικά επιβίωση (p-value δοκιμασία log-rank, 0,0041). Το σύνολο μοντέλο μπορεί να διακρίνει καλύτερα τον υψηλό κίνδυνο και ασθενείς χαμηλού κινδύνου από ό, τι το μοντέλο πρόβλεψης στάδιο και το μοντέλο πρόβλεψης υποτροπή και μόνο. Αυτή η μέθοδος θα μπορούσε να εφαρμοστεί σε μελέτες άλλων ασθενειών και θα μπορούσε να βελτιώσει σημαντικά την απόδοση πρόβλεψης από ensembling ετερογενείς πληροφορίες

Παράθεση:. Li BQ, Huang Τ, Zhang J, Ζανγκ Ν, Huang GH, Liu L, et al. (2013) Μια Ensemble Προγνωστικοί Μοντέλο για τον καρκίνο του παχέος εντέρου. PLoS ONE 8 (5): e63494. doi: 10.1371 /journal.pone.0063494

Επιμέλεια: Jie Zheng, University of Akron, Ηνωμένες Πολιτείες της Αμερικής

Ελήφθη: 4 Φεβρουαρίου 2013? Αποδεκτές: 3 Απρίλη 2013? Δημοσιεύθηκε: 2 Μαΐου 2013

Copyright: © 2013 Li et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Αυτό το έργο υποστηρίχθηκε από επιχορηγήσεις από το Εθνικό Πρόγραμμα βασικής Έρευνας της Κίνας (2011CB510102, 2011CB510101), Πρόγραμμα Καινοτομίας της Σαγκάης Δημοτική Επιτροπή Παιδείας (12ZZ087), και τη χορήγηση του «The First-class Πειθαρχία των Πανεπιστημίων στη Σαγκάη.» Οι χρηματοδότες δεν είχε κανένα ρόλο στην σχεδιασμός της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

Ο ορθοκολικός καρκίνος (CRC) είναι μία από τις πιο κακοήθεις καρκίνους. εμφάνιση και την εξέλιξη της συνεπάγεται περίπλοκες εξελικτική διαδικασία που πλήττονται από πολλαπλά γονίδια [1]. Στην Αμερική και την Ευρώπη, CRC είναι ο δεύτερος συχνότερος καρκίνος που οδηγεί στο θάνατο κατάταξη κάτω καρκίνο του πνεύμονα [2]. Η έγκαιρη ανίχνευση της CRC θα μπορούσε να μειώσει τη νοσηρότητα και τη βελτίωση της πρόγνωσης [3].

CRC μπορούν να ομαδοποιηθούν σε Dukes Α, Β, Γ, και Δ στάδια με βάση την εξέλιξη του [4]. καρκινώματα Α Dukes ‘είναι αυτές περιορίζονται στην εσώτατη επένδυση του παχέος εντέρου ή του ορθού χωρίς εισβολή στους ιστούς extrarectal και δεν μεταστάσεων σε λεμφαδένες. καρκινώματα Β Dukes »είναι εκείνες που έχουν εισβάλει το μυϊκό σύστημα του παχέος εντέρου ή του ορθού, αλλά δεν έχουν ακόμη εμπλέκεται το λεμφικό σύστημα. Καρκινώματα του C κατά Dukes έχουν εξαπλωθεί σε τουλάχιστον ένα περιφερειακό λεμφαδένων. Ενώ καρκινώματα του Dukes ‘D έχουν κάνει μετάσταση σε κάπου αλλού στο σώμα όπως το ήπαρ ή πνεύμονα [4]. Το 1954, τα στάδια Dukes ‘Β και Γ περαιτέρω υποδιαιρούνται σε Β1, Β2 και Γ1, Γ2 από τους Αμερικανούς Astler και Coller [5]. καρκινώματα Β1 τύπου ήταν εκείνες στις οποίες οι βλάβες έχουν εισβάλει στο propria μυϊκό με αρνητική κόμβους, αλλά χωρίς να διεισδύουν μέσω του. Ενώ καρκινώματα Β2 τύπου ήταν εκείνες στις οποίες οι βλάβες έχουν διεισδύσει το propria μυϊκό με αρνητική κόμβους. Καρκινώματα του τύπου C1 έχουν εισβάλει στον propria μυϊκό με θετικούς λεμφαδένες, αλλά δεν έχουν διεισδύσει μέσα. Ενώ αυτά του τύπου C2 έχουν διεισδύσει μέσω propria μυϊκό με θετικούς λεμφαδένες. Επινοηθεί περισσότερα από 70 χρόνια, το σύστημα σταδιοποίησης της τώρα τροποποιημένο Dukes »παρέχει επαρκή προγνωστικές πληροφορίες για τους ασθενείς του σταδίου Α ή D. Ωστόσο, τα ενδιάμεσα στάδια Β και Γ δεν είναι τόσο χρήσιμο σε διακρίσεις καλή ασθενείς πρόγνωση από φτωχές [6].

μέχρι στιγμής, η ανάλυση μικροσυστοιχιών χρησιμοποιήθηκε σε αρκετές μελέτες σε δείγματα πρωτογενούς όγκου για τον προσδιορισμό γονιδιακής έκφρασης υπογραφές προβλεπτική της CRC πρόγνωση [6], [7]. Η γενική προσέγγιση για την υπογραφή ανακάλυψη ήταν να αναλύσει τους ασθενείς που έχουν επιλεγεί για την καλή και την κακή έκβαση, που ακολουθείται από αξιολόγηση της υπογραφής στις πρόσθετες περιπτώσεις. Ωστόσο, η ανακάλυψη υπογραφής που βασίζεται σε αποτελέσματα γενικά περιπλέκονται σε ασθενείς που υποβάλλονται σε επικουρική θεραπεία. Ως εκ τούτου, είναι δύσκολο να γίνει διάκριση μεταξύ των δεικτών πρόγνωση από εκείνους της ανταπόκρισης θεραπεία [6], [7].

Έχει αναφερθεί ότι οι διαφορές μεταξύ των ακραίων έκφραση στάδια του καρκίνου θα μπορούσε να χρησιμοποιηθεί για την πρόβλεψη υποτροπής σε ασθενείς ενδιάμεσα στάδια. Τα πλεονεκτήματα αυτής της προσέγγισης είναι ότι δεν υπάρχουν δεδομένα παρακολούθησης, απαιτείται το στάδιο του όγκου με βάση την ανακάλυψη και ότι η σύγχυση αποτέλεσμα της προηγούμενης θεραπείας μπορεί να αποφευχθεί με την επιλογή τους ασθενείς που δεν έχουν υποβληθεί σε επικουρική θεραπεία [8].

Σε αυτό το μελέτη, συνδυάζοντας τα συστήματα πρόβλεψης στάδιο εξέλιξης και τα συστήματα πρόβλεψης υποτροπής, προτείναμε ένα σύνολο προγνωστικό μοντέλο για CRC. ασθενείς υψηλού κινδύνου και οι ασθενείς χαμηλού κινδύνου που προβλέπεται από το σύνολο μοντέλο είχε σημαντική διαφορετική επιβίωσης χωρίς νόσο και ειδικά για τη νόσο επιβίωση. Η απόδοση του συνόλου μοντέλο ήταν καλύτερη από εκείνη του μοντέλου πρόβλεψης στάδιο και το μοντέλο πρόβλεψης υποτροπή και μόνο. ​​

Υλικά και Μέθοδοι

Σύνολο δεδομένων

προφίλ γονιδιακής έκφρασης των διαφόρων σταδίων CRC .

προφίλ γονιδιακής έκφρασης των 290 ασθενών CRC ανακτήθηκαν από NCBI Gene Expression Omnibus (GEO) (αριθμός ένταξης: GSE14333), στην οποία 44 ασθενείς ανήκαν σε δούκες στάδιο Α, 94 στο στάδιο Β, 91 στο στάδιο C και 61 στο στάδιο D, αντίστοιχα. Τα προφίλ έκφρασης προσδιορίστηκαν με 2,0 συστοιχίες Affymetrix Human Genome U133Plus ανακρίνει 19.621 γονίδια.

προφίλ γονιδιακής έκφρασης των ασθενών με και χωρίς υποτροπή.

προφίλ γονιδιακής έκφρασης των 77 ασθενών CRC με υποτροπή και 121 CRC ασθενών χωρίς υποτροπή ανασύρθηκαν από το GEO (αριθμός ένταξης: GSE12032). Οι ασθενείς με και χωρίς υποτροπή ήταν συμβολίζεται ως 1 και 0, αντίστοιχα. Τα προφίλ έκφρασης προσδιορίστηκαν με AceGene Ανθρωπίνων Ολίγο Chip 30K 1 Chip Έκδοση ανακρίνει 10583 γονίδια.

προφίλ γονιδιακής έκφρασης των ασθενών με το χρόνο επιβίωσης.

προφίλ γονιδιακής έκφρασης των 176 ασθενών CRC με ελεύθερη νόσου επιβίωση (DFS) και η νόσος συγκεκριμένες επιβίωση (DSS) ανακτήθηκαν από GEO (αριθμός ένταξης: GSE17538). Τα προφίλ έκφρασης προσδιορίστηκαν με Affymetrix Human Genome U133 Plus 2.0 Array ανακρίνει 20068 γονίδια.

Αυτά τα τρία σύνολα δεδομένων που περιέχονται συνολικά 644 ασθενείς CRC ανακρίνει 10166 κοινά γονίδια. Όλα τα σύνολα δεδομένων ήταν ποσοστημόριο ομαλοποιήθηκε με το πακέτο «Affy» της R για περαιτέρω ανάλυση [9].

μέθοδο mRMR

Χρησιμοποιήσαμε τη μέθοδο ελάχιστο πλεονασμό μέγιστη Σχετικότητα (mRMR) να κατατάξουν τη σημασία της τα χαρακτηριστικά [10]. Η μέθοδος mRMR κατατάσσει χαρακτηριστικά σύμφωνα τόσο με τη συνάφειά τους με το στόχο και την απόλυση μεταξύ των χαρακτηριστικών. Ένα κατετάγη χαρακτηριστικό με μικρότερο δείκτη δείχνει ότι έχει μια καλύτερη trade-off μεταξύ της μέγιστης σημασίας για τον στόχο και τον ελάχιστο πλεονασμό.

Τόσο η καταλληλότητα και η απόλυση ήταν ποσοτικά με αμοιβαίας πληροφόρησης (MI), το οποίο εκτιμά το βαθμό στο οποίο ένας φορέας που σχετίζονται με ένα άλλο. Η ΜΙ ορίζεται ως εξής:. (1) όπου είναι φορείς, είναι κοινή πιθανολογική πυκνότητά τους, και και είναι το οριακό πιθανολογική πυκνότητες

Ας υποθέσουμε ότι συμβολίζει το σύνολο του σετ χαρακτηριστικών, υποδηλώνει το ήδη επιλεγμένο σύνολο των χαρακτηριστικών που περιέχουν

χαρακτηριστικά μ

και υποδηλώνει το να-να-επιλεγμένο σύνολο των χαρακτηριστικών που περιέχουν

n

χαρακτηριστικά. Η συνάφεια ανάμεσα σε ένα χαρακτηριστικό και του στόχου μπορεί να υπολογίζεται ως εξής: (2)

Η redundancybetween το χαρακτηριστικό και όλα τα χαρακτηριστικά του μπορεί να υπολογιστεί από: (3)

Για να προσδιοριστεί η διαθέτουν με τη μέγιστη ενδιαφέρον και ελάχιστο πλεονασμό, η λειτουργία mRMR συνδυάζει την εξίσωση (2) και την εξίσωση (3) και ορίζεται ως εξής: (4)

η mRMR αξιολόγηση χαρακτηριστικό θα συνεχίσει

Ν

γύρους δοθεί ένα χαρακτηριστικό που με

Ν

(

Ν

=

m

+

ν

) χαρακτηριστικά. Μετά την αξιολόγηση χαρακτηριστικό mRMR, ένα χαρακτηριστικό SETIS λαμβάνεται: (5), όπου ο δείκτης

h

κάθε χαρακτηριστικό δείχνει στο οποίο γύρω από το χαρακτηριστικό έχει επιλεγεί. Όσο μικρότερος είναι ο δείκτης

h

, όσο νωρίτερα η εξίσωση χαρακτηριστικό ικανοποιεί (4) και τόσο καλύτερη η λειτουργία είναι.

Πλησιέστερα γείτονα Αλγόριθμος (ΝΝΑ)

Σε αυτή τη μελέτη, το πλησιέστερο γείτονα Αλγόριθμος (ΝΝΑ), το οποίο έχει χρησιμοποιηθεί ευρέως στη βιοπληροφορική και υπολογιστική βιολογία [3], [11], [12], [13], [14], εκδόθηκε για την πρόβλεψη της τάξης των δειγμάτων ορθοκολικού ιστού. Εμείς θεωρείται κάθε δείγμα σαν ένας φορέας με τις τιμές έκφρασης γονιδίων ως συνιστώσες του. ΝΝΑ υπολογίζει τις ομοιότητες μεταξύ κάθε δύο δειγμάτων και καθιστά απόφαση κατάταξης του. Στη μελέτη μας, η απόσταση μεταξύ δύο samplesandis ορίζονται ως κατωτέρω: (6), όπου είναι η ενότητα του δείγματος. δηλώνει το εσωτερικό γινόμενο του και. Όσο μικρότερη είναι η είναι, τα περισσότερα παρόμοια τα δύο δείγματα are Κίνα

Στο ΝΝΑ, δίνεται ένα δείγμα setand ένα δείγμα, θα πρέπει να οριστεί στην ίδια κατηγορία του πλησιέστερου γείτονά της στο, το οποίο είναι το δείγμα με το μικρότερο.: (7)

Πέντε φορές Cross-Validation Μέθοδος

Πέντε φορές διασταυρωμένης επικύρωσης συχνά χρησιμοποιούνται για την αξιολόγηση της απόδοσης ενός ταξινομητή [15]. Σε πέντε φορές διασταυρωμένης επικύρωσης, όλα τα δείγματα στο σύνολο δεδομένων είναι πρώτη κατανέμονται ισομερώς σε πέντε μέρη. Στη συνέχεια, κάθε μέρος έχει με τη σειρά του χρησιμοποιείται για τη δοκιμή και τα υπόλοιπα 4-μέρη για την εκπαίδευση. Έτσι, κάθε δείγμα εξετάζεται ακριβώς μία φορά

Για την αξιολόγηση της απόδοσης του προγνωστικός δείκτης για τα στάδια CRC, η συνολική ακρίβεια (ACC) της πρόβλεψης υπολογίζεται ως εξής:. (8), όπου είναι ο αριθμός των ταξινομείται ορθώς ασθενών για το

i

-ου στάδιο του καρκίνου, και αντιπροσωπεύει το συνολικό αριθμό των ασθενών.

για την αξιολόγηση της απόδοσης του προγνωστικός δείκτης για την επανάληψη, την ακρίβεια πρόβλεψης, ειδικότητα, ευαισθησία και MCC (Matthews συσχέτιση συντελεστής) υπολογίστηκαν από: (9) όπου

TP

,

TN

,

FP

,

FN

δηλώνουν τον αριθμό των θετικών αλήθεια, αλήθεια αρνητικά , ψευδώς θετικά και ψευδώς αρνητικά, αντίστοιχα.

Αυξητική Δυνατότητα επιλογής (IFS)

με βάση τα ανάλογα χαρακτηριστικά που λαμβάνονται με τη μέθοδο mRMR, χρησιμοποιήσαμε το IFS [16], [17], [18], [19] προσέγγιση για τον προσδιορισμό των βέλτιστων χαρακτηριστικών. Κατά τη διάρκεια της διαδικασίας IFS, τα χαρακτηριστικά του πίνακα κατάταξης χαρακτηριστικό προστέθηκαν με σταδιακή χαρακτηριστικά από τα υψηλότερα σε χαμηλότερη κατάταξη. Ένα νέο χαρακτηριστικό που κατασκευάστηκε όταν προστέθηκαν άλλα χαρακτηριστικά. Εντελώς διαθέτουν σύνολα που αποτελούνται από τις

Ν

κατετάγη χαρακτηριστικά. Η

i

-ου σύνολο χαρακτηριστικό είναι: (10) όπου

Ν

δηλώνει το συνολικό αριθμό των χαρακτηριστικών στο αρχικό σύνολο δεδομένων και

l

είναι ο αριθμός των χαρακτηριστικών προστεθεί κάθε βήμα, το οποίο είναι ένας θετικός ακέραιος. Σε αυτή τη μελέτη, θέτουμε. Για καθένα από τα [

Ν

/

l

] χαρακτηριστικό σύνολα, ένας ταξινομητής ΝΝΑ κατασκευάστηκε και εξετάστηκε με τη χρήση του πέντε φορές διασταυρωμένης επικύρωσης για το σύνολο δεδομένων αναφοράς. Ένας πίνακας IFS επιτεύχθηκε με μία στήλη για το δείκτη

i

και τις άλλες στήλες για την εκτέλεση πρόβλεψη. επιλέχθηκε η βέλτιστη σύνολο χαρακτηριστικών γνωρισμάτων (), με την οποία ο προγνωστικός απέδωσε την καλύτερη απόδοση πρόβλεψη.

Τέσσερα διαφορετικά κριτήρια για την αξιολόγηση του κινδύνου

Σε αυτή τη μελέτη, προτάθηκαν 4 διαφορετικά κριτήρια για την αξιολόγηση του κινδύνου των ασθενών CRC. Στην πρώτη πρόταση, οι ασθενείς του σταδίου Β με υποτροπή καθώς και εκείνες του σταδίου Γ και Δ κατάσταση ανεξάρτητα επανάληψης θεωρήθηκαν υψηλού κινδύνου, ενώ όλοι οι άλλοι ασθενείς θεωρήθηκαν ως χαμηλού κινδύνου. Στη δεύτερη πρόταση, θεωρήθηκαν μόνο τα στάδια του καρκίνου. Οι ασθενείς του σταδίου Α ορίστηκαν ως χαμηλού κινδύνου, ενώ εκείνοι του σταδίου Β, Γ και Δ ως υψηλού κινδύνου. Στην τρίτη πρόταση, οι ασθενείς του σταδίου Α και Β θεωρούνται ως χαμηλού κινδύνου, ενώ εκείνοι του σταδίου Γ και Δ ήταν υψηλού κινδύνου. Στην τελευταία πρόταση, χρησιμοποιήθηκε μόνο η επανάληψη πληροφοριών. Οι ασθενείς με υποτροπή είχαν θεωρηθεί ως υψηλού κινδύνου, ενώ οι ασθενείς χωρίς υποτροπή θεωρήθηκαν χαμηλού κινδύνου. Στη συνέχεια, Kaplan-Meier εκτιμητή [20] χρησιμοποιήθηκε για να αξιολογήσει τη σημασία της επιβίωσης χωρίς νόσο και ασθένεια συγκεκριμένες επιβίωση μεταξύ των ομάδων υψηλού και χαμηλού κινδύνου.

Αποτελέσματα

Μοντέλο για την πρόβλεψη στάδια CRC

Μετά την εκτέλεση του λογισμικού mRMR, λάβαμε δύο πίνακες (βλ S1 αρχείου). Ένα ονομαζόταν MaxRel πίνακα κατάταξης των γονιδίων ανάλογα με τη συνάφειά τους με τα στάδια των δειγμάτων. Το άλλο λεγόταν mRMR χαρακτηριστικό πίνακα με τα γονίδια με το μέγιστο ενδιαφέρον και ελάχιστο πλεονασμό στα στάδια των δειγμάτων.

Με βάση τα αποτελέσματα της mRMR, κατασκευάσαμε 500 υποσύνολα χαρακτηριστικό σύμφωνα με Eq.10. Μια ΝΝΑ προγνωστικός για κάθε υποσύνολο διαμορφώθηκε αντίστοιχα, το οποίο στη συνέχεια αξιολογήθηκε με πέντε φορές διασταυρούμενης επικύρωσης. Ο αριθμός των χαρακτηριστικών που χρησιμοποιούνται σε κάθε προγνωστικό ήταν 1,2,3, …, όπως περιγράφεται στα Υλικά και Μέθοδοι τμήμα. Το αποτέλεσμα IFS μπορεί να βρεθεί σε Στήριξη Πληροφορίες S2. Στην Εικ. 1 είναι η καμπύλη IFS χαράσσεται με βάση την Υποστήριξη Πληροφορίες S2. Ο άξονας x είναι ο αριθμός των γονιδίων που χρησιμοποιείται για την ταξινόμηση, και η y-άξονα είναι οι ακρίβειες πρόβλεψη των πλησιέστερο προγνωστικών γείτονα αξιολογούνται από πέντε φορές διασταυρωμένης επικύρωσης. Η μέγιστη ακρίβεια έφτασε 0,4759, όταν χρησιμοποιήθηκαν 25 γονίδια. Αυτά τα 25 γονίδια που θεωρήθηκαν ως οι βέλτιστες βιοδείκτες για την πρόβλεψη των σταδίων CRC (δείτε τα κορυφαία 25 γονίδια στο «Πίνακα mRMR» του S1 αρχείου).

Οι καμπύλες IFS συντάχθηκαν με βάση τα στοιχεία του αρχείου S2 . Η συνολική ακρίβεια πρόβλεψης φτάσει στην κορυφή, όταν ο αριθμός των γονιδίων που ήταν 25. Τα 25 γονίδια που λαμβάνονται έτσι χρησιμοποιούνται για να συνθέσουν το βέλτιστο σύνολο γονίδιο για το στάδιο προγνωστικός CRC.

Η

Μοντέλο για την πρόβλεψη της CRC επανάληψης

επίσης, με τη χρήση της μεθόδου mRMR, λάβαμε επίσης MaxRel και mRMR πίνακες για την πρόβλεψη υποτροπής CRC (βλ S3 αρχείου). Με βάση αυτά τα δύο πίνακες, 500 υποσύνολα χαρακτηριστικό κατασκευάστηκαν σύμφωνα με Eq.10. Μια ΝΝΑ προγνωστικός δείκτης διαμορφώθηκε για κάθε υποσύνολο και αξιολογήθηκε με πέντε φορές διασταυρωμένης επικύρωσης. Στην Εικ. 2 είναι η καμπύλη IFS χαράσσεται με βάση τα στοιχεία για τη Στήριξη Πληροφορίες S4. Ο άξονας x είναι ο αριθμός των γονιδίων που χρησιμοποιείται για την ταξινόμηση, και η y-άξονα είναι οι τιμές MCC ταξινομητών αξιολογούνται από πέντε φορές διασταυρωμένης επικύρωσης. Η μέγιστη MCC ήταν 0,6926 όταν χρησιμοποιήθηκαν 110 γονίδια. Με μια τέτοια ταξινομητή, η ευαισθησία πρόβλεψη, την ειδικότητα και την ακρίβεια ήταν 0,8182, 0,8760 και 0,8535, αντίστοιχα. Αυτά τα 110 γονίδια είχαν θεωρηθεί ως τα βέλτιστα βιοδείκτες για την πρόβλεψη της CRC επανάληψης (δείτε τα κορυφαία 110 γονιδίων στον «Πίνακα mRMR» του S3 αρχείου).

Οι καμπύλες IFS συντάχθηκαν με βάση τα στοιχεία του αρχείου S4 . Το MCC φτάσει στην κορυφή, όταν ο αριθμός των γονιδίων που ήταν 110. Τα 110 γονίδια που λαμβάνονται έτσι χρησιμοποιούνται για να συνθέσουν το βέλτιστο σύνολο γονίδιο για την επανεμφάνιση προγνωστικός CRC.

Η

Συγκρίνοντας το χρόνο επιβίωσης των τεσσάρων διαφορετικών κριτηρίων για την αξιολόγηση

κινδύνου

Χρησιμοποιήσαμε τα δύο μοντέλα που αναφέρθηκαν παραπάνω για να προβλέψει τα στάδια του καρκίνου και την κατάσταση επανάληψης των ασθενών με τους χρόνους επιβίωσης. Αυτοί οι ασθενείς χωρίστηκαν σε υψηλού κινδύνου και χαμηλής ομάδες κινδύνου, σύμφωνα με τα τέσσερα διαφορετικά κριτήρια. συγκρίθηκαν οι χρόνοι επιβίωσης των ασθενών για τις τέσσερις προτάσεις.

Σύμφωνα με την πρώτη πρόταση, υπήρχε σημαντική διαφορά στην επιβίωση ελεύθερη νόσου (DFS) χρόνος (δοκιμή logrank, p-value = 0,0016) και την ασθένεια συγκεκριμένες επιβίωση (DSS) του χρόνου (δοκιμή logrank, p-value = 0,0041) μεταξύ υψηλού κινδύνου και τις ομάδες χαμηλού κινδύνου (Πίνακας 1 και Σχήμα 3). Για τη δεύτερη πρόταση, υπάρχει επίσης μια σημαντική διαφορά στην DFS (δοκιμή logrank, p-value = 0,0021) και DSS (δοκιμή logrank, p-value = 0,0055) μεταξύ των ομάδων υψηλού και χαμηλού κινδύνου. Ωστόσο, δεν είναι τόσο σημαντική όσο αυτή του πρώτου πρότασης (Πίνακας 1). Για την τρίτη πρόταση, η διαφορά στην DFS (δοκιμή logrank, p-value = 0,3313) και DSS (δοκιμή logrank, p-value = 0,2556) δεν ήταν σημαντική μεταξύ των ομάδων υψηλού και χαμηλού κινδύνου (Πίνακας 1). Σύμφωνα με την τελευταία πρόταση, η διαφορά στην DFS (δοκιμή logrank, p-value = 0,5525) και DSS (δοκιμή logrank, p-value = 0,5606) μεταξύ των ασθενών υψηλού και χαμηλού κινδύνου δεν ήταν σημαντική, είτε (Πίνακας 1).

(Α) επιβίωση ελεύθερη νόσου (δοκιμασία log-rank, p-value = 0,0016). (Β) Νόσος ειδικό επιβίωσης (δοκιμασία log-rank, p-value = 0,0041).

Η

Συζήτηση

25 CRC που σχετίζονται με το στάδιο υποψήφια γονίδια

σε αυτή τη μελέτη, αναγνωρίσαμε 25 υποψήφια γονίδια που μπορούν να χρησιμοποιηθούν για τη διάκριση των ασθενών CRC από διαφορετικά στάδια (βλέπε τα κορυφαία 25 γονίδια στο «πίνακα mRMR» του S1 File). Μερικά από τα γονίδια έχουν ήδη αναφερθεί ότι σχετίζεται με CRC. Παρακάτω, θα συζητήσουμε εν συντομία τις σχέσεις τους με το CRC

ZC3H12A (δάχτυλο CCCH τύπου περιέχουν ψευδάργυρο 12Α), είναι ένα MCP1 (CCL2? MIM 158105). Επαγόμενη πρωτεΐνη που δρα ως μεταγραφικός ενεργοποιητής και προκαλεί κυτταρικό θάνατο καρδιομυοκυττάρων, ενδεχομένως μέσω επαγωγή γονιδίων που σχετίζονται με την απόπτωση. Πρόσφατα, ZC3H12A έχει αναγνωριστεί ως μία από τις προς τα πάνω ρυθμισμένη γονιδίων σε S100A8 /A9-ενεργοποιημένα κύτταρα όγκου κόλου, των οποίων τα προϊόντα προώθηση της πρόσληψης λευκοκυττάρων, αγγειογένεση, μετανάστευση όγκου, επούλωση πληγών, και ο σχηματισμός του προ-μεταστατικούς κόγχες σε απομακρυσμένο μεταστατικό όργανα [21].

CADPS κωδικοποιεί ένα νέο νευρικό /ενδοκρινικό-ειδική κυτταροπλασματική και πρωτεϊνών περιφερειακής μεμβράνης που απαιτείται για την Ca

2 + -regulated εξωκυπάρωσης της εκκριτικά κυστίδια. Πρόσφατα, CADPS έχει ανιχνευθεί στο λιμάνι p.R722W μετάλλαξης και p.R787 * σε καρκίνωμα παχέος εντέρου [22]. Επιπλέον, το γονίδιο αυτό έχει αναφερθεί αυξημένη έκφραση σε κύτταρα ωοθήκης σε σύγκριση με επίπλουν σε 47 δείγματα αναλύθηκαν με μικροσυστοιχιών [23].

FZD8 (κατσαρωμένων-8) είναι ένα μέλος της οικογένειας frizzled γονίδιο, το οποίο είναι διαμεμβρανικές υποδοχείς μεταγωγή Wnt σήματα με βάση την εξαρτώμενη από συνδετήρα preferentiality για caveolin- ή κλαθρίνη ενδοκυττάρωση [24], [25]. Το μονοπάτι σηματοδότησης Wnt έχει τεκμηριωθεί καλά να σχετίζεται με CRC [26], [27], [28]. Επιπλέον, πρόσφατα FZD8 έχει προταθεί να είναι ένας υποθετικός θεραπευτικός στόχος στον καρκίνο του ανθρώπινου πνεύμονα [29]. Επιπλέον, έχει δειχθεί ότι Frizzled-10, ένα μέλος της οικογένειας γονιδίου rizzled, ρυθμίζεται προς τα πάνω στο πρωτογενές CRC, και είναι ένας θετικός ρυθμιστής του μονοπατιού σηματοδότησης WNT-βήτα-κατενίνης TCF [30].

CAV3 (caveolin 3), καθώς και η caveolin-1, -2 είναι οι κύριες πρωτεΐνες μικροσπηλαίων, οι φυσαλιδώδους προεκβολές της πλασματικής μεμβράνης. Μελέτες έχουν δείξει ότι caveolins έπαιξε σημαντικό ρόλο στην κυτταρική σηματοδότηση και, ενδεχομένως, στην ογκογένεση [31]. Πρόσφατα, Η caveolin-1, ως μέλος της οικογένειας caveolin, έχει αναφερθεί ότι δρα ως αντι-αποπτωτική πρωτεΐνη σε κύτταρα καρκίνου του παχέος εντέρου με σύνδεση προς Κιι70 και αναστέλλοντας Bax εξαρτώμενη κυτταρικό θάνατο [32]. Επιπλέον, έχει αποδειχθεί ότι η απώλεια του Η caveolin-3 μπορεί να προκαλέσει μια γαλακτογόνο μικροπεριβάλλον που είναι προστατευτική έναντι σχηματισμού όγκου μαστού [33].

PACS2 (phosphofurin όξινο σύμπλεγμα διαλογή πρωτεΐνη 2), έχει αναφερθεί ότι απαιτείται για την αποτελεσματική απόπτωση ορθοκολικού κυτταρικές σειρές. PACS-2 είναι ένα ουσιαστικό τελεστή TRAIL, που απαιτείται για τη θανάτωση καρκινικών κυττάρων κόλου in vitro και ιικά μολυσμένα ηπατοκύτταρα in vivo [34], [35].

SOX11 κωδικοποιεί ένα μέλος της SRY σχετίζονται οικογένεια HMG-box μεταγραφικών παραγόντων που εμπλέκονται στη ρύθμιση της εμβρυϊκής ανάπτυξης και στον προσδιορισμό του κυττάρου μοίρας. Έκφραση των Sox4 και Sox11 έχει αποδειχθεί ότι αυξάνει σε πολλούς διαφορετικούς τύπους ανθρώπινων καρκίνων, συμπεριλαμβανομένων καρκινωμάτων των βασικών κυττάρων (BCC) και μυελοβλαστώματα. Τα καρκινώματα μπορούν να επιτεθούν διάφορα σημεία στο ανθρώπινο σώμα, συμπεριλαμβανομένου του ήπατος, του προστάτη, των ωοθηκών, του πνεύμονα, του παχέος εντέρου και. Επιπλέον, πολύ ειδική υπερέκφραση του μεταγραφικού παράγοντα SOX11 έχει ανιχνευθεί σε ανθρώπινα κακοήθη γλοιώματα [36]. Επιπλέον, η έκφραση SOX11 συσχετίζεται με μεθυλίωση προαγωγού και ρυθμίζει την ανάπτυξη του όγκου σε αιματοποιητικές κακοήθειες [37].

PRKCDBP κωδικοποιεί μια πρωτεΐνη δέσμευσης της πρωτεΐνης κινάσης C, δέλτα (PRKCD). PRKCDBP είναι ένα προ-αποπτωτικών ογκοκατασταλτικό οποία συνήθως μεταβάλλεται σε CRC με υπερμεθυλίωση προαγωγού, και γονιδιακή μεταγραφή του ενεργοποιείται άμεσα από ΝΡ-κΒ σε απόκριση σε TNFa, γεγονός που υποδηλώνει ότι PRKCDBP αδρανοποίηση μπορεί να συνεισφέρει στην εξέλιξη του όγκου μέσω της μείωσης κυτταρική ευαισθησία σε TNFa και άλλες τονίζει, ιδιαίτερα κάτω από χρόνιες φλεγμονώδεις μικροπεριβάλλον [38].

110 CRC υποτροπής που σχετίζονται με υποψήφια γονίδια

σε αυτή τη μελέτη, εντοπίσαμε 110 υποψήφια γονίδια που μπορεί να χρησιμοποιηθεί για να προβλέψει CRC επανάληψης (δείτε την κορυφή 110 γονίδια στο «πίνακα mRMR» του S3 αρχείου). Μερικά από τα γονίδια έχουν αναφερθεί ότι σχετίζονται με CRC. Παρακάτω, θα συζητήσουμε εν συντομία τις σχέσεις τους με το CRC.

SLC26A2 κωδικοποιεί μια πρωτεΐνη που ανήκει στην οικογένεια φορέα διαλυμένης ουσίας. Η diastrophic μεταφορέας θειική δυσπλασία είναι μία διαμεμβρανική γλυκοπρωτεΐνη που εμπλέκεται στην παθογένεση διαφόρων ανθρώπινων χονδροδυσπλασίες. SLC26A2 έχει ανιχνευθεί να ρυθμίζεται προς τα κάτω σε βιοψίες καρκίνου του παχέος εντέρου σε σύγκριση με τις γύρω φυσιολογικό ιστό [39]. Επιπλέον, τα επίπεδα SLC26A2 και SLC6A14 mRNA έχουν χρησιμοποιηθεί ως μέρος ενός πάνελ επτά γονίδιο αποδίδοντας ποσοστά σωστή πρόβλεψη, την ευαισθησία, και ειδικότητα υψηλότερη από ότι με προηγουμένως διαθέσιμες διαγνωστικές δείκτες για την ελκώδη κολίτιδα, νόσος του Crohn, και σύνδρομο ευερέθιστου εντέρου [40] .

SLPI (αναστολέας της πεπτιδάσης εκκριτική λευκοκυττάρων) κωδικοποιεί μια εκκρίνεται αναστολέα που προστατεύει τα επιθηλιακά ιστών από πρωτεάσες σερίνης. Υψηλότερες έκφραση spli μεταγραφής έχει ανιχνευθεί σε πολλές καρκινικές κυτταρικές σειρές, συμπεριλαμβανομένων των ωοθηκών, νεφρικό και καρκινώματος κόλου χρησιμοποιώντας ανάλυση έκφρασης RTQ-PCR [41]. Επιπλέον, μια υπόθεση έχει προταθεί ότι ένα πλήρως ανθρώπινο μονοκλωνικό αντίσωμα που εξουδετερώνει δραστικότητα πρωτεάσης SLPI μπορεί να είναι θεραπευτικά χρήσιμες για ωοθηκών και του παχέος εντέρου καρκίνωμα [41].

CLEC4M κωδικοποιεί έναν υποδοχέα διαμεμβράνης και συχνά αναφέρεται ως L -Μπόνους λόγω της έκφρασής του στα ενδοθηλιακά κύτταρα των λεμφαδένων και ήπατος. CLEC4M έχει αναγνωριστεί ως ένα από τα γονίδια που εκφράζονται διαφορικά σε καρκίνο του παχέος εντέρου ηπατική μετάσταση δείγματα ασθενών και ξενομοσχεύματος του [42]. Επιπλέον, CLEC4M σημαντικά διαφορικά εκφραζόμενο σε κακοήθεις έναντι μη κακοήθη ιστό μαστού [43].

ISCU κωδικοποιεί τις δύο ισομερείς μορφές, ISCU1 και ISCU2, της πρωτεΐνης ικριώματος σύμπλεγμα Fe-S, οι οποίες είναι απαραίτητες για αρκετές μιτοχονδριακά ένζυμα και άλλες πρωτεΐνες υποκυτταρικό διαμέρισμα. Έχει δειχθεί ότι εξω-μιτοχονδριακής εντοπισμός των φραταξίνη και η σύνδεσή της με ISCU1 διαδραματίζουν βασικό ρόλο στην εντεροκυττάρων-όπως διαφοροποίηση της ανθρώπινης κυτταρικής γραμμής αδενοκαρκινώματος κόλου Caco-2 [44]. Επιπλέον, με τη στόχευση ISCU, miR-210 μειώνει τη δραστικότητα του Krebs που ενζύμων κύκλου και μιτοχονδριακή λειτουργία, συμβάλλει στην αύξηση της παραγωγής ελευθέρων ριζών στο υποξία, αυξάνει την επιβίωση των κυττάρων κάτω από υποξία, προκαλεί μια αλλαγή σε γλυκόλυση τόσο νορμοξία και υποξία, και ρυθμίζει προς τα πάνω την πρόσληψη του σιδήρου που απαιτείται για την ανάπτυξη των κυττάρων. Αξιοσημείωτα, ανάλυση περισσότερων από 900 ασθενείς με διαφορετικούς τύπους όγκων, συμπεριλαμβανομένου του καρκίνου του μαστού, έδειξε ότι η καταστολή της ISCU συσχετιζόταν με χειρότερη πρόγνωση [45].

PANK2 κωδικοποιεί μια πρωτεΐνη που ανήκει στην οικογένεια παντοθενικό κινάσης και είναι το μόνο μέλος της οικογένειας να εκφράζονται στα μιτοχόνδρια. Έχει αναφερθεί ότι η απώλεια ενός υποσυνόλου των κινασών, συμπεριλαμβανομένων PANK2 οδήγησε σε μειωμένη β-cat-εξαρτώμενη μεταγραφή σε κύτταρα καρκινώματος παχέως εντέρου, που εκπροσωπούν δυνητικούς στόχευσης θεραπευτικά γονίδια [46].

πρωτεϊνών-πρωτεΐνη αλληλεπίδρασης μεταξύ στάδιο συναφών γονίδια και τα γονίδια που σχετίζονται με υποτροπή

χαρτογραφηθεί τα 25 γονίδια που σχετίζονται με το στάδιο και τα σχετικά γονίδια 110 υποτροπή στο δίκτυο αλληλεπίδρασης πρωτεΐνης-πρωτεΐνης κατασκευάστηκε με βάση τα δεδομένα από string [47]. Από το Σχ. 4, μπορεί να φανεί ότι υπάρχει στενή σύνδεση μεταξύ σκηνής και τα γονίδια που σχετίζονται με υποτροπή. Έχει αποδειχθεί ότι το σχετικό στάδιο γονίδιο RB1CC1 (RB1-διεγέρσιμο συσπειρωμένης σπείρας 1) μπορεί να καταστείλει την εξέλιξη του κυτταρικού κύκλου και την αναστολή του πολλαπλασιασμού μέσω της ενεργοποίησης του προαγωγού και έκφραση των συγγενικών επανάληψης γονιδίου RB1 σε ανθρώπινο καρκίνο [48], [49], [ ,,,0],50]. Επιπλέον, η αλληλεπίδραση μεταξύ αυτών των δύο γονιδίων ήταν επίσης εμπλέκονται στην πρόγνωση των ασθενών με καρκίνο. Έχει αναφερθεί ότι η RB1CC1 μαζί με RB1 και p53 παίζουν σημαντικούς ρόλους σε μακροπρόθεσμη επιβίωση των ασθενών με καρκίνο του μαστού Ιαπωνικά [51]. Εκτός αυτού, Paun et al. έχουν αποκαλύψει RB1CC1 ως νέο στόχο συχνών μετάλλαξης και παρεκκλίνουσα αυξητική ρύθμιση σε MSI-H (υψηλό επίπεδο αστάθεια μικροδορυφόρου) CRC [52]. Ως εκ τούτου, είναι λογικό να υποθέσουμε ότι η αλληλεπίδραση μεταξύ αυτών των δύο γονιδίων εμπλέκεται επίσης στην ογκογένεση και την πρόγνωση του CRC. Επιπλέον, η αλληλεπίδραση μεταξύ σχετίζονται με το στάδιο του γονιδίου ZC3H12A και σχετίζονται με υποτροπή γονίδιο ΔΕΞΑΜΕΝΗ επίσης υποστηρίζεται από μια μεγάλης κλίμακας μελέτη αλληλεπίδρασης πρωτεϊνών [53]. Συνολικά, οι αλληλεπιδράσεις μεταξύ αυτών υποψήφια γονίδια μπορεί να ευθύνονται για την αιτιολογία της CRC και επηρεάζουν την πρόγνωση.

Κίτρινο γύρο ορθογώνια αντιπροσωπεύουν γονίδια που σχετίζονται με το στάδιο, ενώ το κόκκινο ελλειπτικών αντιπροσωπεύουν γονίδια που σχετίζονται με υποτροπή. 20 από τα 25 γονίδια που σχετίζονται με το στάδιο και 61 από τα 110 γονίδια που σχετίζονται με την επανάληψη παρουσιάστηκαν.

Η

Προοπτική της μεθόδου μας

Στα προηγούμενα μοντέλα πρόγνωσης, θεωρήθηκε δεν θα επαναληφθούν να είναι ισοδύναμες σε χαμηλού κινδύνου. Ωστόσο, από τη δική μας άποψη, η πρόγνωση των προηγμένων CRC ασθενείς του σταδίου C ή D θα μπορούσε να είναι χειρότερο ακόμη και αν είχαν προβλέψει να μην επαναληφθεί. Αντίθετα, οι ασθενείς από το στάδιο Α μπορεί να επιβιώσει έτσι κι αλλιώς αν είχαν προβλέψει να επαναληφθεί. Ως εκ τούτου, στη μελέτη μας, προτείναμε ένα νέο κριτήριο για την αξιολόγηση του επιπέδου του κινδύνου, στην οποία οι ασθενείς αναμένεται να επαναληφθεί στο στάδιο Β, καθώς και οι ασθενείς του σταδίου Γ και Δ κατάσταση ανεξάρτητα επανάληψης θεωρήθηκαν υψηλού κινδύνου. Όλοι οι άλλοι ασθενείς θεωρήθηκαν ως χαμηλού κινδύνου. Αποκαλύφθηκε ότι ο χρόνος επιβίωσης των ασθενών υψηλού και χαμηλού κινδύνου αξιολογούνται από το κριτήριο αυτό ήταν πιο σημαντικό από αυτό που προέρχεται μόνο από την εξέταση κατάσταση υποτροπή ή όγκου στάδια.

Μπορεί να φανεί ότι όταν ληφθούν υπόψη μόνο τα στάδια του όγκου, τα διαφορά του χρόνου επιβίωσης στην δεύτερη πρόταση ήταν σημαντική αλλά δεν ήταν η περίπτωση στο τρίτο. Ο λόγος θα μπορούσε να είναι ότι η ακριβής ταξινόμηση των ασθενών σε ενδιάμεσα στάδια παραμένει προβληματική. Eschrich et al. έχουν δείξει ότι οι καμπύλες επιβίωσης ομαδοποιούνται και από τις δύο Dukes ‘στάδιο Β και C μπορεί να υποδιαιρεθεί περαιτέρω σε καλή και κακή πρόγνωση ομάδες (ref Εικ. 2) [6]. Αυτός είναι ο λόγος για τον οποίο η διαφορά χρόνος επιβίωσης ήταν σημαντικά, όταν μόνο οι ασθενείς του σταδίου Α ορίστηκαν ως χαμηλού κινδύνου.

Σε γενικές γραμμές, η πρώτη πρόταση ξεπέρασε τις άλλες τρεις, διότι ολοκληρωμένη στάδια του καρκίνου και την κατάσταση της υποτροπής, παρά λαμβάνοντας υπόψη μόνο μία από αυτούς. Αυτή η μέθοδος θα μπορούσε να εφαρμοστεί σε μελέτες άλλων ασθενειών και θα μπορούσε να βελτιώσει σημαντικά την απόδοση πρόβλεψης από ensembling ετερογενών πληροφοριών.

Υποστήριξη Πληροφορίες

αρχείου S1.

mRMR αποτέλεσμα για CRC μοντέλο πρόβλεψης στάδιο. Αυτό το αρχείο περιέχει δύο φύλλα. Ο πρώτος είναι ο πίνακας χαρακτηριστικό MaxRel, η οποία κατατάσσεται στην κορυφή 500 γονίδια, ανάλογα με το ενδιαφέρον μεταξύ των χαρακτηριστικών και της τάξης των δειγμάτων. Το δεύτερο είναι ο πίνακας χαρακτηριστικό mRMR, η οποία κατετάγη αυτά τα 500 γονίδια, σύμφωνα με τα κριτήρια απόλυσης και ενδιαφέρον

doi:. 10.1371 /journal.pone.0063494.s001

(XLSX)

αρχείου S2. .

Η ακρίβεια πρόβλεψης για κάθε στάδιο του όγκου και συνολική ακρίβεια πρόβλεψης για όλα τα στάδια του όγκου σε κάθε εκτέλεση του IFS

doi: 10.1371 /journal.pone.0063494.s002

(XLSX)

αρχείου S3.

mRMR αποτέλεσμα για CRC μοντέλο υποτροπής πρόβλεψη. Αυτό το αρχείο περιέχει δύο φύλλα. Ο πρώτος είναι ο πίνακας χαρακτηριστικό MaxRel, η οποία κατατάσσεται στην κορυφή 500 γονίδια, ανάλογα με το ενδιαφέρον μεταξύ των χαρακτηριστικών και της τάξης των δειγμάτων. Το δεύτερο είναι ο πίνακας χαρακτηριστικό mRMR, η οποία κατετάγη αυτά τα 500 γονίδια, σύμφωνα με τα κριτήρια απόλυσης και ενδιαφέρον

doi:. 10.1371 /journal.pone.0063494.s003

(XLSX)

αρχείου S4.

Η ευαισθησία (Sn), ειδικότητας (Sp), η ακρίβεια (Ac), Matthews συντελεστής συσχέτισης (MCC) του κάθε εκτέλεση του IFS για CRC μοντέλο πρόβλεψης επανεμφάνιση

doi:. 10.1371 /journal.pone.0063494.s004

(XLSX)

Ευχαριστίες

Οι συγγραφείς επιθυμούν να ευχαριστήσω τον επεξεργαστή για τη λήψη του χρόνου για να επεξεργαστείτε αυτό το χαρτί. Οι συγγραφείς θα ήθελα επίσης να ευχαριστήσω τους δύο κριτές για τις εποικοδομητικές παρατηρήσεις τους, η οποία ήταν πολύ χρήσιμη για την ενίσχυση της παρουσίασης της μελέτης αυτής.

You must be logged into post a comment.