PLoS One: κλινική αξία των Πρόγνωση Gene Expression Υπογραφές για τον καρκίνο του παχέος εντέρου: Συστηματική Review


Αφηρημένο

Εισαγωγή

Το παραδοσιακό σύστημα σταδιοποίησης είναι ανεπαρκής για να προσδιοριστούν οι ασθενείς με σταδίου ΙΙ καρκίνο του παχέος εντέρου ( CRC) διατρέχουν υψηλό κίνδυνο υποτροπής ή με σταδίου ΙΙΙ CRC σε χαμηλού κινδύνου. Ένας αριθμός γονιδιακής έκφρασης υπογραφές για την πρόβλεψη CRC πρόγνωση έχουν προταθεί, αλλά καμία δεν χρησιμοποιείται συνήθως στην κλινική. Ο σκοπός αυτής της εργασίας ήταν να αξιολογηθεί η ικανότητα πρόβλεψης και πιθανή κλινική χρησιμότητα αυτών των υπογραφών σε μια σειρά ανεξάρτητων συνόλων δεδομένων.

Μέθοδοι

Μια ανασκόπηση της βιβλιογραφίας εντοπίστηκαν 31 υπογραφές γονιδιακή έκφραση που χρησιμοποιείται για την έκφραση του γονιδίου δεδομένα για την πρόβλεψη πρόγνωση σε CRC ιστό. Η αναζήτηση βασίστηκε στη βάση δεδομένων PubMed και περιορίζεται σε εργασίες που δημοσιεύθηκαν από τον Ιανουάριο 2004 έως τον Δεκέμβριο του εντοπίστηκαν και κατεβάσει από δημόσια αποθετήρια 2011. Έντεκα CRC σύνολα δεδομένων γονιδιακής έκφρασης με πληροφορίες αποτέλεσμα. Τυχαία ταξινομητή Δάσος χρησιμοποιήθηκε για την κατασκευή προγνωστικοί παράγοντες από τους καταλόγους του γονιδίου. Matthews συντελεστής συσχέτισης επιλέχθηκε σαν ένα μέτρο της ακρίβειας ταξινόμησης και συνδέονται ρ-τιμή του χρησιμοποιήθηκε για να αξιολογηθεί σύνδεση με πρόγνωση. Για την κλινική αξιολόγηση της χρησιμότητας, θετικές και αρνητικές μετα-τεστ πιθανοτήτων υπολογίστηκαν στο στάδιο ΙΙ και ΙΙΙ δείγματα.

Αποτελέσματα

Πέντε γονίδιο υπογραφές έδειξε σημαντική συσχέτιση με την πρόγνωση και παρέχεται εύλογη ακρίβεια πρόβλεψης στο δικό τους σύνολα δεδομένων εκπαίδευσης. Παρ ‘όλα αυτά, όλες οι υπογραφές έδειξε χαμηλή επαναληψιμότητα σε ανεξάρτητα δεδομένα. Στρωματοποιημένη αναλύσεις από το στάδιο ή η αστάθεια μικροδορυφορικού κατάσταση έδειξαν σημαντική συσχέτιση αλλά περιορισμένη ικανότητα διάκρισης, ειδικά σε όγκους II στάδιο. Από κλινική άποψη, η πιο έξυπνη υπογραφές έδειξε μια μικρή αλλά σημαντική βελτίωση σε σχέση με το κλασσικό σύστημα σταδιοποίησης.

Συμπεράσματα

Οι δημοσιευμένες υπογραφές δείχνουν χαμηλή ακρίβεια πρόβλεψης αλλά μέτρια κλινική χρησιμότητα. Παρά το γεγονός ότι τα δεδομένα γονιδιακής έκφρασης μπορεί να ενημερώσει την πρόγνωση, οι καλύτερες στρατηγικές για την επικύρωση της υπογραφής απαιτείται για να ενθαρρύνουν την ευρεία χρήση τους στην κλινική

Παράθεση:. Sanz-Παμπλόνα R, Berenguer Α, Cordero D, Riccadonna S, Sole X, CROUS -Bou M, et al. (2012) κλινική αξία των Πρόγνωση Gene Expression Υπογραφές για τον καρκίνο του παχέος εντέρου: μια συστηματική ανασκόπηση. PLoS ONE 7 (11): e48877. doi: 10.1371 /journal.pone.0048877

Επιμέλεια: Wayne A. Phillips, Peter MacCallum Κέντρο Καρκίνου, Αυστραλία

Ελήφθη: May 30, 2012? Αποδεκτές: 2η Οκτωβρίου του 2012? Δημοσιεύθηκε: 7 του Νοέμβρη 2012

Copyright: © 2012 Sanz-Παμπλόνα et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Αυτή η μελέτη υποστηρίχθηκε από την Ευρωπαϊκή Επιτροπή να χορηγήσει FP7-COOP-Υγεία-2007-B HiPerDART. Επίσης, οι επιχορηγήσεις Instituto de Salud Carlos III (FIS PI08 /1635, FIS PI08 /1359 και FIS PI09-01037), CIBERESP CB07 /02/2005, η Ισπανική Ένωση κατά του Καρκίνου (AECC) Επιστημονικό Ίδρυμα, και η κυβέρνηση DURSI καταλανική επιχορήγηση 2009SGR1489 . Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

Καρκίνος του παχέος εντέρου (CRC) είναι ο τρίτος συχνότερος καρκίνος παγκοσμίως και η δεύτερη κύρια αιτία θανάτου από καρκίνο. Κατά τη διάρκεια των τελευταίων δεκαετιών, συχνότητα έχει αυξηθεί, ενώ η θνησιμότητα έχει σιγά-σιγά μειώνεται [1]. Ένα αξιοσημείωτο χαρακτηριστικό του ΣΔΠ είναι η διαφορά στην πρόγνωση των πρώιμων και όψιμα στάδια της νόσου: το στάδιο I και II έχουν μέτριο κίνδυνο υποτροπής μετά τη χειρουργική εκτομή, ενώ οι ασθενείς με σταδίου ΙΙΙ έχουν περισσότερες πιθανότητες υποτροπής [2]. Αναγνωρίζονται κλινικούς παράγοντες κινδύνου για υποτροπή είναι παρουσίαση έκτακτης ανάγκης, ελάχιστα διαφοροποιημένες όγκο, το βάθος της εισβολής των όγκων, και τη συμμετοχή γειτονικών οργάνων (Τ4) [3] – [5]. Ωστόσο, οι παράγοντες αυτοί δεν επαρκούν για να προσδιοριστούν οι ασθενείς με στάδιο ΙΙ CRC που διατρέχουν υψηλό κίνδυνο υποτροπής και οπίσθια μετάσταση ή εκείνους τους ασθενείς με σταδίου ΙΙΙ CRC χαμηλού κινδύνου [6], οδηγώντας σε πιθανά υπό-θεραπεία ή υπερ-θεραπείας [3].

μετάσταση του καρκίνου του παχέος εντέρου είναι μια αυστηρά ρυθμιζόμενη διαδικασία που απαιτεί εκτροπές στην έκφραση του γονιδίου που επιτρέπει στα καρκινικά κύτταρα να προχωρήσει μέσα από διάφορα στάδια μέχρι να αποικίσουν ένα μακρινό όργανο [7]. Πιθανώς οι αναγκαίες για επανάληψη αλλοιώσεις υπάρχουν ήδη στην πρωτογενή καρκίνωμα του παχέος εντέρου, που θα επιτρέψει την ταυτοποίηση προγνωστικών υπογραφές [8] – [10]. Gene-έκφραση δοκιμασίες προφίλ που βασίζονται υπήρξαν επιτυχείς ως προγνωστικοί εργαλείο στον καρκίνο του μαστού [11], [12]. Ωστόσο, καμία υπογραφή έχει υιοθετηθεί στην καθημερινή κλινική πρακτική σε CRC παρά το μεγάλο αριθμό των γονιδιακής έκφρασης προφίλ μελέτες σχετικά με την πρόγνωση έχουν πραγματοποιηθεί.

Ο σκοπός της εργασίας αυτής ήταν να δοκιμαστεί η προβλεπτική ικανότητα αυτών δημοσιεύονται υπογραφών προγνωστικοί δείκτες σε ένα σημαντικό αριθμό ανεξάρτητων συνόλων δεδομένων, προκειμένου να κατανοήσουν τα πλεονεκτήματα και τις αδυναμίες τους και να προσδιορίσει αν κάποιο από αυτά μπορεί να χρησιμοποιηθεί κλινικά για να καθοδηγεί τις αποφάσεις για την επικουρική θεραπεία για ασθενείς με σταδίου ΙΙ ή ΙΙΙ CRC.

Υλικά και Μέθοδοι

Δημοσιεύθηκε Gene Expression υπογραφές και επικύρωση Σύνολα

Μια συστηματική ανασκόπηση της βιβλιογραφίας έγινε για τον εντοπισμό μελετών που χρησιμοποίησαν δεδομένα γονιδιακής έκφρασης για την πρόβλεψη πρόγνωση CRC [13]. Η αναζήτηση βασίστηκε στη βάση δεδομένων PubMed και περιορίστηκε σε πρόσφατα έγγραφα για την αύξηση της ισχύος (από Ιανουάριος 2004 – Δεκέμβριος 2011). Αρχεία S1-S2, Πίνακας S1 και Σχήμα 1 λεπτομερώς το πρωτόκολλο επιλογής και τη λίστα ελέγχου PRISM. Τα άρθρα που υπέβαλε κατάλογο των διαφορικά εκφρασμένων γονιδίων σε δείγματα πρωτογενούς όγκου που σχετίζονται με CRC πρόγνωση συμπεριλήφθηκαν στη μελέτη μας. Εμείς αδιακρίτως αναφέρονται σε αυτές τις λίστες των γονιδίων ως «υπογραφές» ή «προφίλ». Μελέτες που βασίζονται σε μικροσυστοιχίες ιστού και εκείνων που αποκλειστικά επικεντρώθηκαν στις διαφορές μεταξύ των σταδίων ή μεταξύ πρωτοπαθούς όγκου και των μεταστάσεων αποκλείστηκαν. Οι μελέτες τελικά συμπεριλαμβάνονται για ανάλυση περιγράφεται στον Πίνακα 1 [14] – [43]. Δημοσίως εντοπίστηκαν και κατεβάσει από GEO [44] και ArrayExpress διαθέσιμα σύνολα δεδομένων με τα μέτρα γονιδιακής έκφρασης ολόκληρου του γονιδιώματος σε δείγματα πρωτογενούς όγκου CRC [45] αποθετήρια δεδομένων των μικροσυστοιχιών (Πίνακες 2 και 3). Προ-επεξεργασία μήτρες σειρά που προβλεπόταν αρχικά από τους συντάκτες χρησιμοποιήθηκαν στην ανάλυσή μας.

Η

Επειδή διαφορετικές πλατφόρμες και δυνατότητα αναγνώρισης χρησιμοποιήθηκαν σε υπογραφές και σύνολα δεδομένων γονιδιακής έκφρασης, μια μετάφραση στην επίσημη Σύμβολο Gene έγινε προκειμένου να έχουν μια κοινή σχολιασμό. Η μετάφραση έγινε με τη χρήση της βάσης δεδομένων Οικουμενική σχολιασμού Πρωτεΐνη Δυναμικού [46], το ηλεκτρονικό αποθετήριο της HUGO Επιτροπής Gene ονοματολογίας [47], καθώς και τα αρχεία σχολιασμό τσιπ από την ιστοσελίδα Affymetrix [48]. Αναπόφευκτα, καμία αντιστοιχία βρέθηκε για ορισμένες λειτουργίες σε ορισμένες σύνολα δεδομένων και χάθηκαν για μετέπειτα ανάλυση (S3 File).

Στατιστική Ανάλυση

Δεδομένου ότι ο χρόνος παρακολούθησης δεν ήταν διαθέσιμο για τα περισσότερα από τα σύνολα δεδομένων, ένα δυαδικό αποτέλεσμα ορίστηκε ως κατάσταση πρόγνωση (Πίνακας 2). Όποτε είναι δυνατόν, απαιτούνταν τουλάχιστον τρία χρόνια της παρακολούθησης των ασθενών χωρίς υποτροπή του όγκου. Παρ ‘όλα αυτά, τα δύο σύνολα δεδομένων χωρίς παρακολούθηση πληροφορίες συμπεριλήφθηκαν (GSE5206 και GSE10402) για να αυξηθεί το μέγεθος του δείγματος. Στάδιο IV άτομα συμπεριλήφθηκαν στην ανάλυση ως συμβάντα υποτροπής, όπως ήταν αναμενόμενο ότι οι συγκεκριμένες αλλαγές έκφρασης σε κακή προγνωστική δείγματα παραμένουν αναλλοίωτα στον πρωτογενή όγκο μόλις εμφανίστηκαν οι μεταστάσεις. Όταν ήταν διαθέσιμα δεδομένα, η ανάλυση υποομάδας πραγματοποιήθηκαν σύμφωνα με το στάδιο και μικροδορυφορικού κατάσταση αστάθειας (MSS /MSI).

Η

την ικανότητα κάθε υπογραφή για να προβλέψουμε την πρόγνωση είχε δοκιμαστεί ανεξάρτητα σε κάθε σύνολο δεδομένων με μια δυαδική προσέγγιση της κατάταξης σύμφωνα με το

Τυχαία Δάσος

σύνολο ταξινομητή (RF) [49], [50]. Τα δάση αναπτύχθηκαν με υψηλό αριθμό των δένδρων (5.000), προκειμένου να εξασφαλιστεί out-of-τσάντα σύγκλισης σφάλματος. Το ελάχιστο μέγεθος των τερματικών κόμβων ορίστηκε σε μία. Για την αξιολόγηση των υπογραφών, μέτρα ακρίβειας υπολογίστηκαν από μια διαδικασία 10 φορές διασταυρωμένης επικύρωσης (10CV) στην οποία χωρίσματα ήταν κατηγοριοποιημένα βάσει των αποτελεσμάτων. Ένθετα στη διαδικασία αυτή, επιλέγεται ο αριθμός των υποψήφιων μεταβλητών σε κάθε διάσπαση ήταν να ελαχιστοποιηθεί το σφάλμα out-of-bag. Όπως προτείνεται στην [51], υπο-δειγματοληψία πραγματοποιήθηκε χωρίς αντικατάσταση και χρησιμοποιώντας τον ίδιο αριθμό των παρατηρήσεων σε κάθε ομάδα πρόγνωση (0.632 φορές συχνότητα της μικρότερης ομάδας). Λόγω της έλλειψης ισορροπίας σε ομάδες αποτέλεσμα σε ορισμένες σύνολα δεδομένων, RF έδειξε μια τάση να ταξινομήσει προτίμηση στην πιο συχνή ομάδα. Για να διορθώσετε αυτό το τεχνούργημα, το cutoff ψηφοφορία ταξινόμηση τροποποιήθηκε σύμφωνα με τις αντίστοιχες συχνότητες ομάδα πρόγνωση. Όλες αυτές οι αναλύσεις πραγματοποιήθηκαν με τη χρήση του πακέτου R randomForest [52].

Για να επιβεβαιώσετε τα αποτελέσματά μας, μια ακτινική υποστήριξη του πυρήνα Vector Machine (SVM) με βάση ταξινομητή χρησιμοποιήθηκε επίσης [53], [54]. Λόγω της ασυμμετρίας, το ίδιο τεχνούργημα που περιγράφηκε παραπάνω, παρατηρήθηκε κατά την εφαρμογή του προτύπου ταξινομητή SVM. Έτσι, προσπαθήσαμε να το διορθώσουμε χρησιμοποιώντας μια στρατηγική υπο-δειγματοληψίας ως εξής [55]: i) να επιλέξετε όλα τα δείγματα από τη λιγότερο συχνή ομάδα? ii) επιλέγουν τυχαία τον ίδιο αριθμό δειγμάτων από την πιο συχνή ομάδα? iii) επαναλάβετε τη διαδικασία 25 φορές? iv) ορίζουν τις προβλεπόμενες ετικέτες χρησιμοποιώντας τις συχνότητες της ομάδας αποτέλεσμα ως ψήφο ποσοστό αποκοπής για τον κανόνα ταξινόμησης. Μια διαδικασία 10CV διεξήχθη για τον υπολογισμό των μέτρων ακρίβεια με μια ένθετη 10CV για την παράμετρο ρύθμισης, τόσο από τους στρωματοποιημένη από ομάδες αποτέλεσμα. Ένα ευρύ φάσμα των τιμών για το κόστος και την ακτινική παραμέτρους του πυρήνα αξιολογήθηκαν κατά τη διάρκεια της διαδικασίας ρύθμισης (20 ισαπέχει τιμές 0,001 έως 1,000 σε κλίμακα λογάριθμο? 11 ισαπέχει τιμές που κυμαίνονται 0,05 ×

σ

έως 20 ×

p

, είναι

σ

τον αριθμό των χαρακτηριστικών σε κάθε περίπτωση). Όλα αυτά ανάλυση διεξήχθησαν με το πακέτο R

svmpath

[56].

Ο Συντελεστής Matthews Συσχέτιση (MCC) [57] επιλέχθηκε ως μέτρο της ακρίβειας ταξινόμησης [58]. Ο δείκτης αυτός συνδυάζει την ευαισθησία της δοκιμασίας και ειδικότητα. Κυμαίνεται -1-1 και η ερμηνεία του είναι παρόμοια με συντελεστή συσχέτισης του Pearson του. Στο πλαίσιο ενός προβλήματος ταξινόμησης, αναμένεται ότι το MCC κυμαίνεται από 0 (καμία πρόβλεψη ικανότητα καθόλου) έως 1 (τέλεια πρόβλεψη) με αρνητικές τιμές κοντά στο μηδέν πιθανώς συμβαίνουν σε τυχαία ταξινομητές λόγω μεταβλητότητα του δείγματος. MCC τιμές χαμηλότερες από 0,3 μπορεί να θεωρηθεί ενδεικτική της χαμηλής προγνωστικής αξίας που αντιστοιχεί στο ακρίβεια λιγότερο από 65% σε ισορροπημένη δεδομένων. Η ευαισθησία, η εξειδίκευση και η συνολική ακρίβεια ποσοστά υπολογίζονται επίσης για τους σκοπούς της ερμηνείας.

Η πιθανή χρησιμότητα των υπογραφών για την κλινική πρακτική αξιολογήθηκε μέσω των θετικών και αρνητικών δεικτών πιθανότητα (LR +, LR-) και η προβλεπόμενη θετική και αρνητικές πιθανότητες υποτροπής μετά τη δοκιμή (PPTpr, NPTpr) στο στάδιο ΙΙ και ΙΙΙ δείγματα χωριστά [59].

για να συνοψίσουμε την παγκόσμια επίδοση υπογραφής, κάθε ένα από τα μέτρα παραπάνω συγκεντρώθηκαν από σύνολα δεδομένων σε ένα μοναδικό ευρετήριο χρησιμοποιώντας βάρη ανάλογη με κάθε μέγεθος δείγματος δεδομένων. Προκειμένου να μετριάσει την αστάθεια και η μεροληψία στις εκτιμήσεις διασταυρωμένης επικύρωσης, σύνολα δεδομένων με λιγότερα από 10 δείγματα ανά ομάδα και εκείνα που χρησιμοποιούνται για την παραγωγή των προφίλ στην αρχική μελέτη αποκλείστηκαν από αυτούς τους υπολογισμούς [60].

σημασία της MCC, την ακρίβεια, την ευαισθησία, την ειδικότητα, LR +, LR-, και οι διαφορές των PPTpr και NPTpr αξιολογήθηκαν χρησιμοποιώντας null διανομές βασίζονται σε 100.000 παραλλαγές. Υπολογισμοί έγιναν στο πλαίσιο του θεωρητικού πλαισίου για τις δοκιμές μετάθεση [61], όπως εφαρμόζεται στο πακέτο R

κέρμα

[62]. Χρονικά διαστήματα κατά 95% χτίστηκαν χρησιμοποιώντας το Bias διορθώθηκε και η μέθοδος Ταχεία εκκίνησης (BCA) με 5.000 Κάνει αναδειγματοληψία στρωματοποιημένη ανά ομάδα πρόγνωση [63]. Εμπειρικές τιμές επιρροή εκτιμήθηκαν με τη συνήθη μέθοδο jackknife. Αυτοί οι υπολογισμοί έγιναν χρησιμοποιώντας το πακέτο R

boot

[64]. Σε όλες τις περιπτώσεις, παραλλαγές και αναδειγματοληψία διεξήχθησαν απευθείας στις προβλεπόμενες τιμές που παρέχονται από τα αρχικά μοντέλα και καμία αναδιαμόρφωση έγινε. Δεδομένου ότι η στρατηγική αυτή δεν λαμβάνει υπόψη την εξάρτηση στις προβλέψεις εμμέσως επιβάλλει η 10CV, θα μπορούσε δυνητικά να διατηρήσει κάποια προκατάληψη προς την άρνηση μηδενική υπόθεση των στατιστικών ελέγχων, όταν τα αποτελέσματα είναι μικρά [65].

Αποτελέσματα

Παγκόσμια Πρόγνωση Απόδοση των δημοσιευμένων υπογραφές

η βιβλιογραφική έρευνα εντοπίστηκαν 29 έγγραφα αναφοράς 31 υπογραφές που προτείνονται ως έγκυρα πολυ-γονιδιακής εργαλείο ταξινόμησης των όγκων-αποτέλεσμα (Πίνακας 1 και S4 αρχείου). Σχεδόν όλες οι υπογραφές βασίστηκαν σε πειράματα μικροσυστοιχιών με την εξαίρεση των τριών υπογραφών που λαμβάνονται από πειράματα PCR (

OC10, PL10, SC09

). Ο αριθμός των γονιδίων (μέγεθος υπογραφή) κυμαινόταν από 3 έως 537.

Παρά τις συστάσεις για την παροχή των πρώτων στοιχείων για τα πειράματα μικροσυστοιχιών, σύνολα δεδομένων εκπαίδευσης ήταν διαθέσιμες στο κοινό μόνο για πέντε υπογραφές:

ST09, SM09, BD07, LN07 ,

και

VL10

. Έξι επιπλέον σύνολα δεδομένων γονιδιακής έκφρασης με πληροφορίες σχετικά με επαναλαμβανόμενες εντοπίστηκαν στο GEO και ArrayExpress, για συνολικά 11 σύνολα δεδομένων που διατίθενται για ανάλυση (Πίνακας 2).

Για όλους τους συνδυασμούς των υπογραφών και των συνόλων δεδομένων, η MCC και το αντίστοιχο p -τιμή υπολογίστηκε. Το Σχήμα 2 δείχνει ένα χρώμα χάρτη των τιμών MCC (λεπτομέρειες παρέχονται στο File S5 και το Σχήμα S1). Όπως ήταν αναμενόμενο, οι πέντε υπογραφές για την οποία η εκπαίδευση ήταν διαθέσιμο έδειξε σημαντική συσχέτιση και ένα λογικό προγνωστική ακρίβεια σε σύνολα δεδομένων εκπαίδευσης τους (μαύρο-επισημασμένα κελιά στο επάνω αριστερό τεταρτημόριο στο οικόπεδο στο Σχήμα 2). Για όλες αυτές τις υπογραφές, τις αξίες MCC ήταν μεγαλύτερες από 0,35, εκτός από

VL10

και σύνολο δεδομένων GSE17536 (MCC = 0,32). Παρ ‘όλα αυτά, στα ανεξάρτητα σύνολα δεδομένων η απόδοση ήταν ετερογενής και κανένα από αυτά τα πέντε υπογραφές θα μπορούσαν να αναπαράγουν το βαθμό προβλεπτική ικανότητα φαίνεται στα σύνολα δεδομένων εκπαίδευσης. Όταν οι υπόλοιποι 26 υπογραφές (εκείνους που δεν έχουν την κατάρτιση που είναι διαθέσιμη) αξιολογήθηκαν στις 11 σύνολα δεδομένων, ελήφθησαν παρόμοια αποτελέσματα: κάποιες υπογραφές έδειξε σημαντική συσχέτιση με την έκβαση των ασθενών, αλλά η ακρίβεια των διακρίσεων ήταν χαμηλή ή μέτρια

Σειρές αντιστοιχούν. υπογραφές και στήλες σε σύνολα δεδομένων. Τελευταία στήλη δείχνει μια συγκεντρωτική MCC μεταξύ συνόλων δεδομένων, χρησιμοποιώντας το μέγεθος του δείγματος ως βάρη. Μαύρες γραμμές οριοθετούν τις πέντε πρώτες υπογραφές για την οποία η κατάρτιση σύνολα δεδομένων ήταν διαθέσιμα (κύτταρα επισημαίνεται με μαύρο χρώμα). Τα κύτταρα που εκπροσωπούν υπογραφές και σύνολα δεδομένων που χρησιμοποιούνται για την επικύρωση επισημαίνονται με μπλε χρώμα. Χρώμα κλίμακα αντιπροσωπεύει τις αξίες MCC: το πιο σκούρο το χρώμα, το υψηλότερο MCC (δείτε το μύθο). Αρνητικές τιμές κατέρρευσαν στο μηδέν.

Η

Μια παγκόσμια MCC υπολογίστηκε για κάθε υπογραφή να συνοψίσει προβλεπτική ικανότητα τους σε σύνολα δεδομένων (βλέπε Εικόνα 2). Υπογραφές

BT04

και

KN11

αναδείχθηκε ως η πιο έξυπνη, τόσο με την αξία MCC 0,25 (95% CI 0,19 έως 0,31 και 0,19 έως 0,30 αντίστοιχα, p-τιμές & lt? 10

5). Παρά το γεγονός ότι σχεδόν όλες οι υπογραφές φτάσει στο επίπεδο σημαντικότητας 5% σε αυτή την εκτίμηση πισίνα που συνδυάζει 396 εκδηλώσεις το 1077 ασθενείς, μόνο τρεις υπογραφές να υπερβαίνει 0,20 παγκόσμια MCC. Η μέγιστη τιμή που λαμβάνεται για το ποσοστό των ταξινομείται ορθώς περιπτώσεις ήταν μόνο 63% (

BT04,

ευαισθησία = 65% και ειδικότητα = 61%) και κυμάνθηκε 52-61% για τις υπόλοιπες προφίλ (Πίνακας 4, αρχείο S6).

η

Για να αξιολογηθεί η επιρροή της στατιστικής μεθοδολογίας στα αποτελέσματα, μια εκ νέου ανάλυση πραγματοποιήθηκε χρησιμοποιώντας μια εναλλακτική μέθοδο (SVM). Παρά το γεγονός ότι παρατηρήθηκαν κάποιες διακυμάνσεις στις υπογραφές κατάταξη των επιδόσεων, παρόμοια αποτελέσματα ελήφθησαν από την άποψη των συγκεντρωμένων τα MCC (Σχήμα S2 και S7 Αρχείο)

υποομάδα Ανάλυση:. Πρόγνωση Απόδοση έκδοσης Υπογραφές στρωματοποιημένη κατά το στάδιο ή MSI Κατάσταση

για την αξιολόγηση των επιδόσεων των υπογραφών »σε συγκεκριμένες υποομάδες των όγκων, μια στρωματοποιημένη ανάλυση έγινε σύμφωνα με το στάδιο (II /σταδίου ΙΙΙ στάδιο) και την κατάσταση αστάθειας μικροδορυφορικού (MSS /MSI), όταν αυτή η πληροφορία ήταν διαθέσιμη ( βλέπε πίνακα 3). Σύνολα δεδομένων που συμβάλλουν με λιγότερο από 10 εκδηλώσεις αποκλείστηκαν.

Η

Παρόμοια με την ανάλυση, συμπεριλαμβανομένων όλων των δειγμάτων, η απόδοση των υπογραφών ήταν ετερογενής, όταν το στάδιο ΙΙ και ΙΙΙ δείγματα όγκων αναλύθηκαν ξεχωριστά (Εικόνες S3 και S4) . Στη συγκεντρωτική MCC, 17 υπογραφές στο στάδιο II και 22 υπογραφές στο στάδιο ΙΙΙ έδειξε μια σημαντική συσχέτιση με την πρόγνωση (p-value & lt? 0,05). Έξι υπογραφές κατατάσσεται στην πρώτη δεκάδα σε δύο υπο-αναλύσεις. Οι τιμές MCC που λαμβάνεται στο στάδιο II ήταν πολύ χαμηλότερες από εκείνες στο στάδιο ΙΙΙ. Στο στάδιο II, η καλύτερη παγκόσμια MCC επιτεύχθηκαν από

YM06

(MCC = 0,21? 95% CI 0,11 – 0,31) και

BT04

(MCC = 0,20? 95% CI 0,10 – 0,31) . Στο στάδιο ΙΙΙ, οι δύο καλύτερες υπογραφές ήταν

AJ08

(MCC = 0,42? 95% CI 0,28 – 0,55) και

VL10

(MCC = 0,40? 95% CI 0,23 – 0,55). Πίνακας 4, αρχεία S5, S6 και S7? και τα σχήματα S3, S4, S5, S6, S7 και S8 περιέχει περισσότερες λεπτομέρειες.

πληροφορίες κατάστασης

MSI ήταν διαθέσιμο μόνο για δύο σύνολα δεδομένων (GSE13294 και GSE18088). Κατά την ανάλυση των δειγμάτων MSS, οι τιμές MCC που έφτασε σημασία ήταν μέτρια (0,19 – 0,38) και μόνο τρεις υπογραφές έδειξαν συσχέτιση και στα δύο σύνολα δεδομένων (τιμή p & lt? 0,1). Όσον αφορά το υποσύνολο MSI, μόνο την υπογραφή

HO09

παρέχεται μια αρκετά ταξινόμηση ακρίβεια (MCC = 0.30) (S5 αρχείου).

Πιθανές κλινική αξία των υπογραφών στο στάδιο ΙΙ και ΙΙΙ Όγκοι

Παρά την ικανότητα χαμηλής διακρίσεων (φαίνεται από συγκεντρώνονται MCC τους), οι υπογραφές θα μπορούσαν να εξακολουθούν να έχουν χρησιμότητα στην κλινική πράξη. Εν συντομία, ένα χρήσιμο κλινική δοκιμή συνήθως παρουσιάζει μεγάλο LR + και χαμηλή LR- που μεταφράζεται σε πιο διακριτική πιθανότητες εκδήλωσης post-test: υψηλή PPTpr και χαμηλή NPTpr σε σύγκριση με το

a priori

αναμένεται αναλογία εκδήλωση. Έτσι, ακόμα και δοκιμές με χαμηλή ικανότητα διάκρισης σύμφωνα με καθαρά κριτήρια στατιστικό στοιχείο θα μπορούσε ακόμα να είναι χρήσιμο στην κλινική πρακτική, εάν PPTpr και NPTpr είναι σημαντικά αρκετά μακριά από την πιθανότητα να αναμένονται σε πληθυσμό όταν δεν υπάρχει έλεγχος. Για να διερευνήσουν το θέμα, θετικές και αρνητικές πιθανότητες μετα-τεστ της επανάληψης υπολογίστηκαν για τα στάδια ΙΙ και ΙΙΙ. Η προηγούμενη κίνδυνος υποτροπής σε ασθενείς με CRC ήταν υποτίθεται ότι είναι 20% στο στάδιο II και 34% κατά το τρίτο στάδιο [4], [66].

Για την καλύτερη υπογραφή στο στάδιο ΙΙ (

YM06

), η πιθανότητα υποτροπής μετα-τεστ για την ομάδα υψηλού κινδύνου αυξήθηκε σε 28%, και για την ομάδα χαμηλού κινδύνου η πρόβλεψη ήταν 12% πιθανότητα υποτροπής (16% απόλυτη διαφορά, Σχήμα 3Α). Το καλύτερο προφίλ στο στάδιο ΙΙΙ (

AJ08

) αυξήθηκε σε 56% η πιθανότητα μετα-τεστ της επανάληψης για την ομάδα υψηλού κινδύνου, ενώ η πιθανότητα μετα-τεστ ήταν 18% για την ομάδα χαμηλού κινδύνου (38 % απόλυτη διαφορά, Εικόνα 3Β). Τα λεπτομερή αποτελέσματα για όλες τις υπογραφές φαίνεται στο Αρχεία S6 και S7.

Επικράτηση πιθανότητα υποτροπής για το στάδιο ΙΙ και ΙΙΙ ήταν υποτίθεται ότι είναι 20 και 34% αντίστοιχα. Οι υπογραφές που παρατίθενται κατά φθίνουσα σειρά των μετα-τεστ διαφορές πιθανότητα.

Η

Συζήτηση

Ο προσδιορισμός της μοριακής προγνωστικά εργαλεία για να διευκολύνει τις αποφάσεις της θεραπείας είναι ένα σημαντικό βήμα για την εξατομικευμένη θεραπεία των ασθενών [10] . Εδώ αναφέρουμε μια εξαντλητική ανάλυση των δημοσιευμένων πολλαπλών γονιδίων προγνωστικό ταξινομητές σε καρκίνο του παχέος εντέρου, η ανάλυση του εξωτερικού τους κύρος σε ένα μεγάλο αριθμό ανεξάρτητων συνόλων δεδομένων που συνολικά περισσότερους από 1.000 ασθενείς. Η παρούσα εργασία επικεντρώνεται σε δύο στόχους που αντιμετωπίζονται από τα δύο κύρια μέρη της ανάλυσης: να αξιολογεί τη συνολική απόδοση των υπογραφών από στατιστική άποψη, στην οποία περιλαμβάνονται όλα τα στάδια, και να αξιολογηθεί το δυναμικό κλινική χρησιμότητα τους, περιορίζεται σε ασθενείς III CRC σταδίου ΙΙ και, μέσω των κατάλληλων μέτρων ακρίβειας (πιθανότητες post-test).

Μια μετα-ανάλυση των προφίλ γονιδιακής έκφρασης στο στάδιο ΙΙ CRC έχει αναφερθεί στο παρελθόν από τον Lu

et al.

[67]. Στη μελέτη αυτή, ελπιδοφόρα αποτελέσματα αναφέρθηκαν σχετικά με προγνωστική ακρίβεια, αλλά η ανάλυση περιορίστηκε στα ίδια σύνολα δεδομένων και οι προβλέψεις που χρησιμοποιούνται στις αρχικές μελέτες. Για τις γνώσεις μας, η μελέτη μας είναι η πρώτη μετα-ανάλυση στην οποία ακρίβεια πρόβλεψης των πολλών υπογραφών μετράται σε ένα μεγάλο αριθμό ανεξάρτητων δειγμάτων CRC για την αξιολόγηση των εξωτερικών εγκυρότητα και ακολούθως πιθανή χρησιμότητα τους σε κλινικές.

Σε όρους συνολικές επιδόσεις, τα αποτελέσματά μας δείχνουν ότι στην κατάρτιση του συνόλου δεδομένων τους, οι περισσότερες υπογραφές έδειξε σημαντική συσχέτιση με την πρόγνωση και θα μπορούσε εύλογα να προβλέψει το αποτέλεσμα. Ωστόσο, καμία από τις υπογραφές που εκτελούνται ικανοποιητικά όταν η ικανότητα πρόβλεψης εκτιμήθηκε σε ανεξάρτητα σύνολα δεδομένων. Το καλύτερο συγκεντρώθηκαν MCC ήταν 0.25 (

BT04

), η οποία θα πρέπει να θεωρείται χαμηλή τιμή κατάταξης. Σαν μία αναφορά, στάδιο παρέχει ένα MCC 0,23 (τα δεδομένα δεν παρουσιάζονται).

Στη συνέχεια, εστιάσαμε στην συγκεκριμένη απόδοση των υπογραφών στο στάδιο II και III ασθενών, οι οποίοι θα μπορούσαν να επωφεληθούν περισσότερο από μια ακριβή πρόβλεψη πρόγνωση αφού επικουρική χημειοθεραπεία θα μπορούσε να προσαρμοστεί για να προβλέψει επανεμφάνιση του κινδύνου τους. Παρά το γεγονός ότι παρατηρήθηκε συσχέτιση με αποτέλεσμα για 17 υπογραφές στο στάδιο ΙΙ, προβλεπτική ικανότητα τους μπορεί να θεωρηθεί κακή μόνο από στατιστική άποψη. Σε αντίθετη περίπτωση, οι τιμές MCC στο στάδιο ΙΙΙ παρατηρήθηκαν να είναι κοντά διπλάσια από αυτά στο στάδιο II. Παρ ‘όλα αυτά, μόνο οκτώ υπογραφές πέτυχε 0,30 συγκεντρώνονται αξία MCC, θεωρούνται ως ενδεικτικά της μέτριας προγνωστική αξία.

Αν και παρατηρήθηκαν άσχημα αποτελέσματα όσον αφορά την ακρίβεια ταξινόμησης, σχεδόν όλα τα προφίλ (30) έδειξε σημαντική συσχέτιση με την πρόγνωση, όταν δοκιμαστεί σε ανεξάρτητο σύνολα δεδομένων (τιμή p & lt? 0,05). Σημειώστε, ωστόσο, ότι σημαντική συσχέτιση σημαίνει μόνο ότι μια πρόβλεψη υπογραφή δεν είναι εντελώς τυχαία (MCC = 0). Σύνδεσμος δεν είναι επαρκής για να είναι χρήσιμη, δεδομένου ότι, με αρκετό μέγεθος του δείγματος, οι μικρές επιδράσεις μπορεί να είναι σημαντική. Καλύτερους δείκτες των πιθανή χρησιμότητα από ό, τι σημασία είναι το μέγεθος της ευαισθησίας και της ειδικότητας ή προέρχονται μέτρα όπως τα MCC ή την πιθανότητα αναλογιών, οι οποίοι μετρούν την ικανότητα να ταξινομεί σωστά τους ασθενείς από την έκβασή τους.

Παρά τα απογοητευτικά αποτελέσματα σύμφωνα με καθαρή στατιστική κριτήρια της ικανότητας των διακρίσεων, οι υπογραφές θα μπορούσε ακόμα να είναι χρήσιμο στην κλινική πρακτική, εφόσον παρέχουν πρόσθετη διαστρωμάτωση κινδύνου εντός γνωστό υπο-πληθυσμούς που ορίζονται από τις σχετικές κλινικές μεταβλητές. Οι θετικές και αρνητικές πιθανότητες μετα-τεστ της επανάληψης υπολογίστηκαν με στρωματοποιημένη κατά το στάδιο για τον προσδιορισμό του βαθμού της διάκρισης πρόγνωση πέρα ​​από το στάδιο. Τα αποτελέσματα για την καλύτερη υπογραφή στο στάδιο δείγματα ΙΙ (

YM06

) μέτρια τροποποίησε το 20% ένα κοινόβιο πιθανότητα υποτροπής σε 28% και 12% για το θετικό και το αρνητικό αποτέλεσμα μετά τη δοκιμή, αντίστοιχα. Αυτή η διακριτική ικανότητα δεν είναι απόλυτα ικανοποιητική, δεδομένων των μεγάλων ψευδώς αρνητικά και θετικά ποσοστά που θα προκαλέσει, αλλά θα μπορούσε να συμβάλει στον προσδιορισμό του σταδίου ΙΙ οι ασθενείς υψηλού κινδύνου για υποτροπή που οδηγεί σε μια καλύτερη ένδειξη επικουρική χημειοθεραπεία [6]. Η καλύτερη υπογραφή για τους ασθενείς σταδίου ΙΙΙ (

AJ08

) οδήγησε σε μεγαλύτερη διάκριση των ομάδων κινδύνου, με τη διαφορά μεταξύ θετικών και αρνητικών πιθανότητες μετα-τεστ του 38%. Ωστόσο, η ομάδα χαμηλού κινδύνου εξακολουθεί να έδειξε μια σχετικά μεγάλη πιθανότητα επανεμφάνισης του 18%, πολύ υψηλό για να συστήσει την αποφυγή επικουρική χημειοθεραπεία, όπως υποδεικνύεται στις μέρες μας.

Πιθανές εξηγήσεις για αυτά τα μέτρια αποτελέσματα πρέπει να ληφθούν υπόψη. Από στατιστική άποψη, τεχνικά προβλήματα, όπως μικρό μέγεθος του δείγματος, ο αριθμός των γονιδίων που περιλαμβάνονται στην ταξινομητή, μετάφραση μεταξύ πλατφορμών ή ομάδα ετερογένεια, μεταξύ άλλων, έχουν αναφερθεί ως πιθανοί εξηγήσεις για την έλλειψη κλινικών μετάφραση γενωμικού ταξινομητές ( βλέπε αναφορές [68], [69], [70]). Στην περίπτωσή μας και για κάποιες υπογραφές, μόνο συσχέτιση με την πρόγνωση αναφέρθηκε στο πρωτότυπο έργο, έτσι οι συγγραφείς αναγνώρισε εμμέσως μικρή ικανότητα ταξινόμησης. Σε αυτά τα προφίλ που αναφέρθηκαν να είναι ιδιαίτερα διακριτική, ο λόγος θα μπορούσε να είναι μια κακή έλεγχο της υπερ-προσαρμογή στη μεθοδολογία κατάρτισης, δεδομένου εξωτερική επικύρωση έγινε μόνο σε τρεις μελέτες και τα μεγέθη των δειγμάτων δοκιμής ήταν μικρές (

JG08

,

WN10

και

YM06

, βλέπε πίνακα 1). Η ανάγκη για τη χαρτογράφηση ανιχνευτές για τα γονίδια για υπογραφές που είχαν χρησιμοποιηθεί διαφορετικές πλατφόρμες μπορούν επίσης να έχουν επηρεάσει τα αποτελέσματα, αφού είναι γνωστό ότι ακόμα και πολλαπλοί ανιχνευτές του ίδιου γονιδίου στο ίδιο πλατφόρμα μπορεί να εμφανίζουν σημαντική μεταβλητότητα. Εμείς δεν θα μπορούσε να ανιχνεύσει, ωστόσο, ότι η πλατφόρμα είχε μια σημαντική επίδραση στις εκτιμήσεις MCC.

Χαμηλή διαθεσιμότητα των πληροφοριών και η ανομοιογένεια της κλινικά δεδομένα είναι συνυφασμένοι με τη χρήση των δημόσιων σύνολα δεδομένων και αυτό είναι ένα σημαντικό εμπόδιο για την επαναληψιμότητα και ενσωμάτωση των δημοσιευμένων μελετών μικροσυστοιχιών [71]. Σύνολα δεδομένων διαφέρουν ως προς τα χαρακτηριστικά του ασθενούς, τα κριτήρια ένταξης και ορισμούς αποτέλεσμα. Μια ακριβή και ομοιογενή ορισμό του αποτελέσματος σε όλη σύνολα δεδομένων θα ήταν επιθυμητό, ​​προκειμένου να αποκτήσει μια ακριβή εκτίμηση της ικανότητας πρόγνωση των υπογραφών ». Παρ ‘όλα αυτά, η ετερογένεια των συνόλων δεδομένων επιτρέπει μια πιο ρεαλιστική ανάλυση και οι προβλέψεις πρέπει να αντικατοπτρίζουν τα αναμενόμενα αποτελέσματα, όταν τα προφίλ χρησιμοποιήθηκαν στην πραγματική πρακτική, δεδομένου ότι οι ρυθμίσεις νοσοκομείο είναι επίσης ετερογενείς. Δεδομένου ότι τα διαφορετικά αποτελέσματα υποτίθεται ότι πρέπει να συσχετίζονται σε μεγάλο βαθμό [72], αποφασίσαμε να θέσει σε προτεραιότητα την ελάχιστη διαθεσιμότητα μέγεθος δείγματος για να πάρετε πιο ακριβείς εκτιμήσεις και να αποφευχθεί η αβεβαιότητα που θεσπίστηκε με σύνολα δεδομένων με λιγότερο από 10 εκδηλώσεις [60]. Η απαίτηση για τουλάχιστον τρία έτη παρακολουθεί επίσης τη δυνατότητα μεγιστοποίησης μέγεθος του δείγματος και υποστηρίχθηκε από τη βιβλιογραφία: έχει περιγραφεί ότι οι περισσότερες από αυτές τις υποτροπές συμβαίνουν μέσα σε 3 χρόνια μετά την επέμβαση και συνιστάται να χρησιμοποιηθεί ως τελικό σημείο στην επικουρική κλινικές δοκιμές [ ,,,0],73]. θεραπευτικό σχήμα που ακολουθείται από ασθενείς που έλαβαν θεραπεία δεν θεωρήθηκε, οι πληροφορίες αυτές δεν ήταν διαθέσιμες για τα περισσότερα από τα αναλύονται σύνολα δεδομένων.

Οι ασθενείς που διαγιγνώσκονται στο στάδιο IV είχαν συμπεριληφθεί και θεωρείται επαναλαμβανόμενα γεγονότα για να αξιολογήσει τη συνολική απόδοση. Αυτό προϋποθέτει σιωπηρά ότι οι μοριακές αλλαγές παίζει ένα ρόλο οδηγού για την υποτροπή της νόσου παραμένουν αμετάβλητες σε πρωτοπαθή όγκο μετά έχει συμβεί υποτροπή. Αν και αυτή η υπόθεση θα μπορούσε να είναι αμφισβητήσιμη, και υιοθετήθηκε από πολλές από τις αρχικές μελέτες που αναλύθηκαν που περιλαμβάνονται θέματα στάδιο IV στην εκπαίδευση και δοκιμασία σύνολα δεδομένων τους (

AJ08

,

BT04

,

EC05

,

HO09

,

JS09 ​​

,

LN07G

,

LN07NZ

,

PL10

,

SC09

,

SL10

,

SM09

,

ST09

,

VL10

και

YM06

).

Από ένα βιολογικό προοπτική, αυτή η μέτρια ικανότητα πρόγνωση θα μπορούσε να εξηγηθεί από ετερογένεια σε κυττάρου όγκου πληθυσμούς που μπορεί να αραιώσει το μοριακό σήμα πρόγνωση. Είναι καλά γνωστό ότι οι όγκοι CRC αποτελείται όχι μόνο από καρκινικά επιθηλιακά κύτταρα, αλλά και από τον καρκίνο που σχετίζεται με ινοβλάστες στρωματικών (CAFS), ενδοθηλιακά κύτταρα ή φλεγμονώδη κύτταρα, μεταξύ άλλων [74]. Επιπλέον, οι εν λόγω καρκινικά κύτταρα στο μεταναστευτικό μέτωπο είναι διαφορετικές από εκείνες στην κύρια μάζα του όγκου [75]. Το πρόβλημα της χύδην όγκου ετερογένεια μπορεί να ξεπεραστεί με την απομόνωση ειδικών πληθυσμών κυττάρων με τεχνολογία λέιζερ μικροδιατομής [76]. Από αυτή την άποψη, ένας από τους έντεκα σύνολα δείγμα που χρησιμοποιήθηκε σε αυτή τη μελέτη (GSE12945) χρησιμοποίησε αυτή την τεχνική για να υβριδοποιούνται ειδικά RNA από κύτταρα όγκου. Χειρουργικά δείγματα από άλλα σύνολα δείγμα εξετάστηκαν από έναν παθολόγο για να αξιολογηθεί μια ελάχιστη περιεκτικότητα όγκου 80% (GSE5206, GSE18088, E-Μπειραμ-1245). Ωστόσο, εμείς δεν παρατηρούμε σημαντικές διαφορές στην απόδοση υπογραφές σχετικά με τη μέθοδο εμπλουτισμού καρκινικών κυττάρων που χρησιμοποιούνται

Οι λίστες γονίδιο που περιλαμβάνονται σε αυτή τη μελέτη είχαν μικρή επικάλυψη:. Από 1.530 γονίδια που αναφέρθηκαν στις 31 προφίλ, μόνο δύο ήταν μοιράζονται τέσσερις υπογραφές? 10 μοιράστηκαν από τρεις υπογραφές και 102 ήταν παρόντες σε δύο προφίλ. Αυτό το αποτέλεσμα δεν ήταν μη αναμενόμενο, δεδομένου ότι έχει προηγουμένως αναφερθεί [77], [78]. Η έλλειψη του γονιδίου της επικάλυψης γενικά ερμηνεύεται ως εάν κάθε υπογραφή είναι τυχαία δειγματοληψία από ένα μικρό υποσύνολο των γονιδίων από ένα μεγαλύτερο υπογραφή που αντιπροσωπεύουν τα εμπλεκόμενα οδών [79], [80].

παχέος εντέρου και του ορθού όγκοι έχουν περιλαμβάνονται αδιακρίτως σε αυτό το έργο διότι σε προηγούμενη έκθεση που έδειξε ότι δεν υπάρχουν σημαντικές διαφορές μεταξύ του παχέος εντέρου και του ορθού όγκων σε transcriptomic επίπεδο [81]. Ωστόσο, αυτή η απόφαση θα μπορούσε να εξηγήσει μερικές από τις κακές επιδόσεις των υπογραφών, αφού είναι γνωστό ότι η ποιότητα χειρουργική είναι ένας σημαντικός προγνωστικός παράγοντας για τον καρκίνο του ορθού και λιγότερο σημαντική σε κόλον [82]. Στα δεδομένα που χρησιμοποιούνται σε αυτό το έργο, δεν υπάρχει σημαντική συσχέτιση βρέθηκε μεταξύ πρόγνωση και τη θέση του όγκου (τα δεδομένα δεν παρουσιάζονται).

Η επιλογή των στατιστικών εργαλείων για τις αναλύσεις ήταν ένα σημαντικό θέμα. Η πρόθεση αυτής της ανάλυσης ήταν να ελεγχθεί η απόδοση των δημοσιευμένων προγνωστικών υπογραφές σε ανεξάρτητα σύνολα δεδομένων, αντί να προσπαθούμε να τους αναπαράγουν χρησιμοποιώντας το αρχικό μεθοδολογία. Σε αυτό το πλαίσιο,

Τυχαία Δάσος

προκύπτει ως μια αποτελεσματική μέθοδος που αποδίδει πολύ καλά σε σύγκριση με άλλους ανταγωνιστές [49], [83]. Όπως ήταν αναμενόμενο, οι υπογραφές δοκιμάζονται σε εκπαίδευση σύνολο δεδομένων τους έδειξε την υψηλότερη ακρίβεια. Επιπλέον, καταφέραμε να αναπαράγουν τα αποτελέσματα της επικύρωσης των τριών από τα πέντε υπογραφές για τις οποίες υπήρχαν διαθέσιμα στοιχεία (

SM09

,

VL10

και

JS09 ​​

). Ωστόσο, η σύνδεση με την πρόγνωση δεν παρατηρήθηκε για το προφίλ

ST09

στο σύνολο δεδομένων GSE12945, και παρατηρήθηκε μόνο σε μία από τις τρεις ανεξάρτητες σύνολα δεδομένων επικύρωσης που περιλαμβάνονται σε αυτό το έργο για το προφίλ

SL10

, αν και η καλή επίδοση αρχικά αναφερθεί (βλέπε πίνακα 1, Σχήμα 2 και S5 αρχείο). Ένας λόγος μπορεί να είναι ότι η μεθοδολογία που χρησιμοποιήθηκε δεν συλλάβει καλά την αξία πρόγνωση ορισμένων υπογραφών, οι οποίες θα μπορούσαν να έχουν αναπτυχθεί με πιο σύνθετης αλγόριθμους για να καθορίσει την πρόβλεψη του κινδύνου στην αρχική μελέτη. Επειδή αυτή ήταν μια αναγνωρισμένη περιορισμό αυτού του έργου, αναλύσεις ήταν redone χρησιμοποιώντας εναλλακτική μεθοδολογία (SVM), η οποία προέβλεπε παρόμοια αποτελέσματα (Εικόνες S2, S5 και S6, S7 αρχείου). Σε

ST09

προφίλ, χρησιμοποιήθηκε ένα ημι-εποπτευόμενη προσέγγιση, ενώ στο

SL10

εφαρμόστηκε πλησιέστερου κέντρο βάρους προσέγγιση, η οποία δεν περιγράφεται σωστά το χαρτί.

SL10

αναπτύχθηκε σε μια πλατφόρμα Agilent και τη χαρτογράφηση των ανιχνευτών σε διαφορετικές πλατφόρμες επικύρωσης που χρησιμοποιούνται στα σύνολα δεδομένων θα μπορούσε να είναι μια πηγή προσθήκη απόκλισης.

Αν και ανέφερε ορισμένα έργα που απλούστερες μεθόδους για τους εποπτευόμενους

You must be logged into post a comment.