PLoS One: Online Λογισμικό Ανάλυση Επιβίωσης για την αξιολόγηση της προγνωστικής αξίας του Biomarkers Χρησιμοποιώντας Transcriptomic δεδομένων σε μη μικροκυτταρικό-Cell Lung Cancer


Αφηρημένο

Κατά την τελευταία δεκαετία, βελτιστοποιημένη θεραπεία για μη-μικροκυτταρικό καρκίνο του πνεύμονα είχαν να οδηγήσει σε βελτιωμένη πρόγνωση, αλλά η συνολική επιβίωση είναι ακόμα πολύ μικρή. Για την περαιτέρω κατανόηση της μοριακής βάσης της νόσου θα πρέπει να εντοπίσει βιοδείκτες που σχετίζονται με την επιβίωση. Εδώ παρουσιάζουμε την ανάπτυξη ενός online εργαλείο κατάλληλο για την σε πραγματικό χρόνο μετα-ανάλυση των δημοσιευμένων συνόλων δεδομένων καρκίνου του πνεύμονα μικροσυστοιχιών να εντοπίσει βιοδείκτες που σχετίζονται με την επιβίωση. Ψάξαμε τα αποθετήρια caBIG, GEO και TCGA για τον εντοπισμό δειγμάτων με τα δημοσιευμένα δεδομένα γονιδιακής έκφρασης και πληροφόρησης επιβίωση. Μονοπαραγοντική και πολυπαραγοντική ανάλυση παλινδρόμησης κατά Cox, οικόπεδο επιβίωσης Kaplan-Meier με αναλογία κινδύνου και logrank τιμή P υπολογίζονται και απεικονίζονται στο R. μπορεί να προσεγγιστεί Το πλήρες εργαλείο ανάλυσης στην ηλεκτρονική διεύθυνση: www.kmplot.com/lung. Όλοι μαζί 1.715 δείγματα από δέκα ανεξάρτητα σύνολα δεδομένων έχουν ενσωματωθεί στο σύστημα. Ως επίδειξη, χρησιμοποιήσαμε το εργαλείο για να επικυρώσετε 21 προηγουμένως δημοσιευθεί βιοδείκτες που σχετίζονται επιβίωσης. Από αυτές, η επιβίωση ήταν καλύτερη προβλεφθεί από CDK1 (p & lt? 1E-16), CD24 (p & lt? 1E-16) και CADM1 (p = 7Ε-12) σε αδενοκαρκινώματα και από CCNE1 (p = 2.3E-09) και VEGF ( p = 3.3e-10) σε όλους τους ασθενείς με NSCLC. Επιπλέον γονίδια συσχετίστηκε σημαντικά για την επιβίωση περιλαμβάνουν RAD51, CDKN2A, OPN, ΕΖΗ2, ANXA3, ADAM28 και ERCC1. Εν ολίγοις, έχουμε δημιουργήσει μια ολοκληρωμένη βάση δεδομένων και ένα online εργαλείο ικανό ομοιόμορφη και πολυπαραγοντική ανάλυση για

in silico

επικύρωση των νέων υποψηφίων βιοδεικτών σε μη-μικροκυτταρικό καρκίνο του πνεύμονα

Παράθεση:. Γκιορφί Β, Surowiak P, Budczies J, Lánczky Α (2013) σε απευθείας σύνδεση επιβίωση Λογισμικό Ανάλυσης για την αξιολόγηση της προγνωστικής αξίας του Biomarkers Χρησιμοποιώντας Transcriptomic δεδομένων σε μη μικροκυτταρικό καρκίνο του πνεύμονα. PLoS ONE 8 (12): e82241. doi: 10.1371 /journal.pone.0082241

Επιμέλεια: Srikumar Π Chellappan, H. Lee Moffitt Cancer Center & amp? Research Institute, Ηνωμένες Πολιτείες της Αμερικής

Ελήφθη: 27 του Ιούλη 2013? Αποδεκτές: 22 Οκτωβρίου του 2013? Δημοσιεύθηκε: 18 Δεκεμβρίου 2013

Copyright: © 2013 Γκιορφί et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Οι συγγραφείς ερευνητικό έργο χρηματοδοτήθηκε από το OTKA PD 83154 επιχορήγηση, από το έργο Προβλέψτε (δεν χορηγούν. 259303 της Health.2010.2.4.1.-8 κλήση ΕΕ) και από την επιχορήγηση KTIA U_BONUS_12-1-2013-0003. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

Αν και οι επιλογές θεραπείας του καρκίνου του πνεύμονα έχουν βελτιωθεί σημαντικά κατά την τελευταία δεκαετία που οδηγεί σε καλύτερη επιβίωση για ασθενείς με κάθε στάδιο της νόσου, εξακολουθεί να οδηγεί σχετίζονται με τον καρκίνο των θανάτων στις Ηνωμένες Πολιτείες με 160.000 θανάτους κάθε χρόνο [1 ]. Με περίπου 85% όλων των περιπτώσεων ο πιο κοινός τύπος καρκίνου του πνεύμονα είναι μη-μικροκυτταρικό καρκίνο του πνεύμονα (NSCLC), που περιλαμβάνει αδενοκαρκίνωμα, καρκίνωμα πλακωδών κυττάρων, καρκίνωμα μεγάλου κυττάρου, και βρογχιολοκυψελιδικό καρκίνωμα [2]. Όπως και σε άλλες οντότητες του καρκίνου μπορούμε να αναμένουμε νέες μοριακές υποτύπους να προκύψουν στο μέλλον, όπως είναι τώρα ευρέως αποδεκτό ότι το οπτικό μικροσκόπιο με βάση την ιστολογική υποδιαίρεση χρησιμοποιεί μόνο ένα από τα πολλά φαινοτυπικές εκδηλώσεις των γενετικών αλλαγών που διέπουν την ανάπτυξη του καρκίνου του πνεύμονα [2].

Η ταυτοποίηση των γονιδίων των οποίων αλλοιωμένη έκφραση σχετίζεται με τις διαφορές επιβίωσης μπορεί να επισυνάψουν τη γνώση για να εντοπίσει εκείνες που θα μπορούσαν να χρησιμεύσουν ως δείκτες της βιολογικής κατάστασης του όγκου. Στην ουσία υπάρχουν δύο πιθανά σενάρια για το σκοπό αυτό: όπως βιοδείκτη μπορεί να είναι είτε ένα άτομο γονίδιο ή μια υπογραφή που περιλαμβάνει μια σειρά από γονίδια. Ενώ πολλά μεμονωμένα γονίδια που σχετίζονται με την επιβίωση έχουν δημοσιευτεί κατά τα τελευταία τριάντα χρόνια, η νέα πολυγονιδιακή μοριακή προγνωστικών μοντέλων μικροσυστοιχιών με βάση τη χρήση γονιδιωματικής υπογραφές έχουν προκύψει μόνο στα τελευταία δέκα χρόνια [3], [4], [5], [6] , [7], [8], [9], [10], [11], [12], [13], [14], [15], [16], [17], [18], [ ,,,0],19]. Ένα προαπαιτούμενο για τη δυνατότητα αναπαραγωγής αυτών των γονιδιωματικής υπογραφών είναι η διαθεσιμότητα των πρώτων στοιχείων, η οποία μόνο εξασφαλίζεται από τις δημοσιεύσεις των τελευταίων έξι ετών [9], [10], [11], [12], [13], [ ,,,0],14], [15], [16], [17], [18]. Αξίζει να σημειωθεί ότι, σε δύο περιπτώσεις δεν είναι η υπογραφή στο σύνολό της, αλλά τα γονίδια που το καθένα ξεχωριστά σημαντικό προγνωστικοί δείκτες έχουν εντοπιστεί [15], [19].

Η αρχική ανακάλυψη του προγνωστικός δείκτης πρέπει να ακολουθείται από αρκετά επικύρωση σπουδές. Στη συνέχεια, τα αποτελέσματα από αυτές συνήθως συντίθενται σε μια μετα-ανάλυση που περιλαμβάνει ένα μεγάλο αριθμό κατά προτίμηση πάνω από χιλιάδες ασθενείς. Εδώ, με τη συνένωση των σχετικών δεδομένων από διάφορες μελέτες, στατιστικά ισχύς αυξάνεται και μπορεί να επιτευχθεί πιο ακριβείς εκτιμήσεις. Αρκετές προηγούμενες μετα-αναλύσεις προσπάθησε να εκτελέσει μια τέτοια μετα-ανάλυση των προηγούμενων μελετών για μοναχικές υποψηφίων γονιδίων, συμπεριλαμβανομένων του VEGF [20], ΜΜΡ9 [21], η κυκλίνη Ε [22], survivin [23] και CDK1 [24].

Εδώ, θα ενσωματωθεί transcriptomic σύνολα δεδομένων διαθέσιμα γονιδίωμα επίπεδο και στη συνέχεια να χρησιμοποιήσει αυτή τη βάση δεδομένων για να εκτελέσει μια μετα-ανάλυση των ήδη προταθεί συνδέονται επιβίωση βιοδεικτών-υποψηφίων. Έχουμε επίσης δημιουργήσει μια παγκόσμια πύλη για την εν λόγω μετα-ανάλυση που επιτρέπει ρητή επικύρωση των νέων υποψηφίων, χωρίς βιοπληροφορικής προσπάθεια μεγάλης κλίμακας σε μια αυτοματοποιημένη πλαίσιο.

Υλικά και Μέθοδοι

Κατασκευή βάσης δεδομένων καρκίνο του πνεύμονα μικροσυστοιχιών

Εμείς διερευνηθεί ο καρκίνος Βιοϊατρικής Πληροφορικής Grid (caBIG, https://cabig.cancer.gov/, τα δείγματα μικροσυστοιχιών δημοσιεύονται στο έργο caArray), η έκφραση γονιδίων Omnibus (GEO, http: //www. ncbi.nlm.nih.gov/geo/) και ο καρκίνος Γονιδιώματος Atlas (TCGA, https://cancergenome.nih.gov) για τον εντοπισμό του πνεύμονα σύνολα δεδομένων καρκίνου χρησιμοποιώντας τις λέξεις-κλειδιά «πνεύμονα», «καρκίνος», «μικρό-κυττάρων» «NSCLC», «επιβίωση», «GPL96», «GPL3921» και «GPL570» (και οι εναλλακτικές ονομασίες των πλατφόρμες μικροσυστοιχιών). Η αναζήτηση περιορίστηκε στις εκδόσεις με ταυτόχρονη διαθέσιμα δεδομένα γονιδιακής έκφρασης μικροσυστοιχιών και δημοσιεύονται κλινικά χαρακτηριστικά συμπεριλαμβανομένης της επιβίωσης. Για να ελέγξετε την τυχαιότητα, μια κατά ζεύγη δοκιμή κατάταξη έγινε για τα συλλεγόμενα κλινικά δεδομένα όπως η ηλικία, το φύλο, το ιστορικό καπνίσματος, ιστολογία, το στάδιο, το βαθμό, η επιτυχία της χειρουργικής επέμβασης, ακτινοθεραπείας και χημειοθεραπείας που εφαρμόζεται για όλους τους ασθενείς σε WinStat 2013. Για τη δοκιμή ζεύγη τάξη, τα δείγματα πρώτη ταξινόμηση σύμφωνα με σύνολα δεδομένων. Στη συνέχεια, κάθε δείγμα ( «Χ») στη σειρά συγκρίθηκε με όλες τις τιμές που συμβαίνουν αργότερα στον κατάλογο όλων των δειγμάτων ( «Υ») – υπό την προϋπόθεση τυχαιότητα, η πιθανότητα του Χ & gt? Υ είναι 1/2. Οι συσχετίσεις μεταξύ κλινικών μεταβλητών και την επιβίωση ερευνήθηκαν και Kaplan-Meier οικόπεδα για αυτά χαράχθηκαν χρησιμοποιώντας WinStat 2013. Μεταξύ των διαφόρων πλατφόρμες μικροσυστοιχιών, Affymetrix HG-U133A (GPL96), HG-U133 Plus 2.0 (GPL570) και HG-U133A 2.0 ( GPL3921) περιλήφθηκαν, επειδή αυτά χρησιμοποιούνται τακτικά και επειδή αυτές οι συστοιχίες έχουν 22.277 σετ καθετήρα στο κοινό. Η χρήση των ίδιων ανιχνευτών επιτρέπει να μετρηθεί το ίδιο γονίδιο με παρόμοια ακρίβεια, σε σχέση με την κλίμακα και δυναμική περιοχή.

Για να αποφευχθεί η πιθανή προκατάληψη λόγω σφαλμάτων σειρά, έχουμε πραγματοποιήσει ένα ποιοτικό έλεγχο για όλες τις συστοιχίες. Σε αυτό, το υπόβαθρο (μεταξύ 19 και 218), η πρώτη Q (μεταξύ 0,5 και 14), το ποσοστό των παρούσες προσκλήσεις (πάνω από 30%), η παρουσία του bioB- /C- /D- αιχμές, ο GAPDH 3 ‘ σε «αναλογία (κάτω 4,3) και η βήτα-ακτίνη 3 ‘5’ αναλογία προς 5 (κάτω των 18) έχουν ελεγχθεί. Οι τιμές κατωφλίου αντιστοιχούν στο εύρος 95% των συστοιχιών όπως περιγράφηκε προηγουμένως [25]. ποιοτικού ελέγχου δεν ήταν δυνατό για GSE4573 και για αυτό το σύνολο δεδομένων μόνο η MAS5 κανονικοποιημένα δεδομένα ήταν διαθέσιμα. Ένα φιλτράρισμα προστέθηκε στη βάση δεδομένων για τον αποκλεισμό δυνητικά προκατειλημμένη συστοιχίες. Επιπλέον, συγκρίναμε όλα τα αρχεία μικροσυστοιχιών χρησιμοποιώντας την κατάταξη έκφραση όλων των γονιδίων να εντοπίζουν μικροσυστοιχίες εκ νέου δημοσιεύτηκε σε διάφορες μελέτες.

Ρύθμιση του εξυπηρετητή για online επιβίωση υπολογισμό

Τα αρχεία unprocessed.CEL ήταν MAS5 ομαλοποιήθηκε στο περιβάλλον R (https://www.r-project.org) χρησιμοποιώντας το simpleaffy βιβλιοθήκη (https://bioinformatics.picr.man.ac.uk/simpleaffy/). Έχουμε επιλέξει MAS5 για εξομάλυνση καθώς κατατάσσεται μεταξύ των καλύτερων μεθόδων κανονικοποίησης όταν αντιπαραβάλλονται με τα αποτελέσματα των μετρήσεων RT-PCR σε προηγούμενη μελέτη μας [26]. Επιπλέον, MAS5 μπορεί να εφαρμοστεί σε ενιαίο συστοιχίες, επιτρέποντας την απρόσκοπτη μελλοντικές επεκτάσεις της βάσης δεδομένων. Για την πλήρη βάση δεδομένων, μόνο τα κοινά ανιχνευτές μετράται σε όλες τις τρεις πλατφόρμες συστοιχία επελέγησαν (n = 22.277). Στη συνέχεια, ένα δεύτερο κλιμάκωση ομαλοποίηση εκτελέστηκε για το κεντράρισμα του μέσου έκφρασης για κάθε συστοιχία 1000 – αυτή η τεχνική μπορεί να μειώσει σημαντικά αποτελέσματα παρτίδας. έκφραση γονιδίων και κλινικά δεδομένα που ενσωματώθηκαν με τη χρήση της PostgreSQL, ένα ανοικτού λογισμικού σύστημα βάσης δεδομένων αντικείμενο-σχεσιακή (https://www.postgresql.org/).

Για να εκτιμηθεί η προγνωστική αξία ενός γονιδίου, κάθε εκατοστημόριο (της έκφρασης) μεταξύ των άνω και κάτω τεταρτημόρια υπολογίστηκαν και η καλύτερη κατώφλι επιδόσεις χρησιμοποιήθηκε ως το τελικό αποκοπής σε μια μονοπαραγοντική ανάλυση παλινδρόμησης Cox. Ιστολογία, βαθμός, το στάδιο, το φύλο και το ιστορικό καπνίσματος μπορούν να χρησιμοποιηθούν στην πολυπαραγοντική ανάλυση. Ωστόσο, η πολυπαραγοντική ανάλυση χρησιμοποιεί λιγότερο ασθενείς ως μονοπαραγοντική ανάλυση, γιατί όχι κάθε ασθενείς έχει όλες τις κλινικές πληροφορίες. οικόπεδο επιβίωσης Kaplan-Meier και η αναλογία κινδύνου με 95% διαστήματα εμπιστοσύνης και logrank τιμή Ρ υπολογίζεται και αναπαρίσταται σε R χρησιμοποιώντας τη λειτουργία «survplot» της «επιβίωσης» πακέτο Bioconductor. Το σενάριο R που χρησιμοποιείται από το λογισμικό για να εκτελέσει την ανάλυση Kaplan-Meier και να προσδιορίσει την καλύτερη αποκοπής είναι διαθέσιμο ως R σενάριο S1.

Το σύνολο υπολογιστικών μονοπάτι γίνεται προσιτά για περαιτέρω ανάλυση σε ανεξάρτητη πλατφόρμα διαθέσιμες ηλεκτρονικά λογισμικό που εκτελείται σε ένα διακομιστή Debian Linux (https://www.debian.org) powered by Apache (https://www.apache.org). Τα σενάρια για το server-side αναπτύχθηκαν σε PHP, αυτές ελέγχουν το περιβάλλον εργασίας χρήστη, τα αιτήματα και την παράδοση των αποτελεσμάτων. Το πακέτο RODBC παρέχει ένα στρώμα middleware μεταξύ Ε και της βάσης δεδομένων PostgreSQL. Η πλατφόρμα αυτή μπορεί να επιτευχθεί μέσω του διαδικτύου μέσω https://www.kmplot.com/lung.

Επικύρωση προηγουμένως δημοσιευθεί βιοδεικτών που σχετίζονται επιβίωση

Μια Pubmed αναζήτηση διεξήχθη για να προσδιορίσει την επιβίωση του καρκίνου του πνεύμονα συνδεδεμένων βιοδείκτες χρησιμοποιώντας όλους τους συνδυασμούς των λέξεων-κλειδιών «καρκίνος του πνεύμονα», «NSCLC», «αδενοκαρκίνωμα», «καρκίνωμα πλακωδών κυττάρων», «επιβίωση», «γονιδιακή έκφραση», «υπογραφή» και «μετα-ανάλυση». συμπεριλήφθηκαν μόνο οι μελέτες που δημοσιεύθηκε στην αγγλική γλώσσα. κριτήρια επιλεξιμότητας περιλαμβάνονται επίσης η έρευνα του βιοδείκτη σε τουλάχιστον 50 ασθενείς – βιοδείκτες που περιγράφονται σε πειραματικά μοντέλα μόνο παραλείφθηκαν. Για κάθε γονίδιο /υπογραφή οι ακριβείς συνθήκες υπό τις οποίες ταυτίστηκε έχουν ανακτηθεί, και αυτά έχουν χρησιμοποιηθεί ως φίλτρο κατά την επιλογή των ασθενών για την ανάλυση επιβίωσης.

Για να απεικονίσει την απόδοση των διαφόρων βιοδεικτών σε σύνολα δεδομένων, συμπεριλαμβανομένων διαφορετικό αριθμό ασθενών, έχουμε δημιουργήσει οικόπεδα χωνί που απεικονίζει την αναλογία κινδύνου (και διαστήματα εμπιστοσύνης) στον οριζόντιο άξονα έναντι του μεγέθους του δείγματος στον κάθετο άξονα για κάθε σύνολο δεδομένων. Προσθέσαμε επίσης μια επιλογή για την ηλεκτρονική διεπαφή για να εκτελούν ταυτόχρονα την ανάλυση σε κάθε ένα από τα επιμέρους σύνολα δεδομένων. Τέλος, σημαντικότητας ορίστηκε στο p & lt? 0,01

Αποτελέσματα

Η κατασκευή του σε συνδυασμό πνεύμονα βάση δεδομένων του καρκίνου μικροσυστοιχιών

Εντοπίσαμε όλοι μαζί 1.715 ασθενείς, 1.120 σε επτά σύνολα δεδομένων GEO, 133. ασθενών σε TCGA και 462 ασθενείς σε caArray. Δεν υπήρχαν δείγματα επανειλημμένα δημοσιευθεί. Ένα δείγμα (GSM370984) απέτυχε δύο παράμετροι στον έλεγχο της ποιότητας – αυτή η σειρά είχε αποκλειστεί από όλες τις αναλύσεις. Επιπλέον, σε 215 συστοιχίες μία παράμετρος ήταν εκτός του εύρους 95% του συνόλου των συστοιχιών – αυτές οι συστοιχίες μπορούν να εξαιρεθούν από τις αναλύσεις, επιλέγοντας το «αποκλείει συστοιχίες ακραία» στο online περιβάλλον. Συνολική επιβίωση δημοσιεύθηκε για 1405 ασθενείς και το χρόνο στην πρώτη εξέλιξη δημοσιεύθηκε για 764 ασθενείς. Έχουμε συλλέξει ηλικία, το φύλο, το κάπνισμα ιστορία, ιστολογία, στάδιο, βαθμός, η επιτυχία της χειρουργικής επέμβασης, ακτινοθεραπείας και χημειοθεραπείας που εφαρμόζεται για όλους τους ασθενείς – καμία από αυτές τις παραμέτρους ήταν σημαντική στην κατά ζεύγη δοκιμή rank υποδεικνύοντας τυχαία κατανομή των δεδομένων. Μια σύνοψη αυτών των κλινικών ιδιότητες για κάθε σύνολο δεδομένων που χρησιμοποιούνται παρουσιάζονται στον Πίνακα 1. Η επιβίωση των ασθενών με στρωματοποίηση από τον υπότυπο, το φύλο, το ιστορικό καπνίσματος και το στάδιο παρουσιάζεται στο Σχήμα 1.

Η

Ορισμός -up των online πλατφόρμα ανάλυσης επιβίωσης

Έχουμε απασχολούνται Kaplan-Meier για να απεικονίσει τη σύνδεση μεταξύ του γονιδίου υπό έρευνα και την επιβίωση. Πριν από την ανάλυση, οι ασθενείς διηθούνται χρησιμοποιώντας τα διαθέσιμα κλινικές παράμετροι ώστε να περιλαμβάνει μόνο εκείνες τις ασθενείς όπου η συνάφεια του γονιδίου πρέπει να εκτιμηθεί. Εκτός από τις επιλογές φιλτραρίσματος ειδικά για κλινικές παραμέτρους, υλοποιήσαμε έναν αλγόριθμο που περιλαμβάνει τη χρήση όλων των εκατοστημόρια μεταξύ του άνω και κάτω τεταρτημόριο να προσδιορίσει την καλύτερη απόδοση αποκοπής.

Για τις γνώσεις μας, το παρόν η ανάπτυξη είναι το πρώτο σύστημα που επιτρέπει σε πραγματικό χρόνο πολυπαραγοντική ανάλυση επιβίωσης των γονιδίων στη διάθεση transcriptomic ομάδες.

Επικύρωση προηγουμένως δημοσιευθεί βιοδεικτών NSCLC

Εντοπίσαμε 21 προηγουμένως δημοσιευθεί συνδέονται επιβίωση των γονιδίων ατομικές και 7 υπογραφές γονιδιακής έκφρασης (που παρατίθενται στον πίνακα S1 ). Κάθε ένα από αυτούς τους υποψηφίους βιοδείκτη ερευνήθηκαν σε μία ομάδα που έχει παρόμοιες κλινικά χαρακτηριστικά όπως οι ασθενείς στους οποίους είχαν αρχικά περιγραφεί. Για τα γονίδια μετράται με διάφορα σύνολα ανιχνευτών για τις μικροσυστοιχίες, εκείνοι με την υψηλότερη ποιότητα χρησιμοποιήθηκαν (υψηλή ποιότητα: μέσο έκφρασης πάνω από 500 ή μέγιστη έκφραση πάνω από 1000, χαμηλής ποιότητας: μέσο έκφρασης κάτω από 100, ενδιάμεσα: όλοι οι άλλοι ανιχνευτές). Σε περίπτωση υπήρξαν αρκετές ανιχνευτές υψηλής ποιότητας τότε η καλύτερη απόδοση χρησιμοποιήθηκε. Τα αποτελέσματα της ανάλυσης παρουσιάζονται στον Πίνακα 2 και στο Σχήμα 2.

Μετα-ανάλυση αυτών των γονιδίων και των υπογραφών στην αντίστοιχη κοόρτη δείγμα απέδωσε CCNE1, CDC2 και CADM1 ως οι καλύτερες επιδόσεις μεμονωμένων γονιδίων (Α-C) και το υπογραφή του Yamauchi et al. (ΡΕ). Ένα οικόπεδο χοάνη που απεικονίζει τις αναλογίες κινδύνου (με διαστήματα εμπιστοσύνης) έναντι του αριθμού του δείγματος για CDC2 και VEGF δείχνει πιο αξιόπιστη εκτίμηση με τα μεγαλύτερα μεγέθη της βάσης δεδομένων (E-F).

Η

Συζήτηση

Η σημασία των βιοδεικτών του καρκίνου τονίζεται από την επιτυχία του γονιδίου HER2 στον καρκίνο του μαστού. υψηλή έκφραση HER2 ήταν η πρώτη δείκτης χειρότερη επιβίωση, αλλά η εισαγωγή του στοχευμένη θεραπεία αντι-HER2 άλλαξε την εικόνα:. Σήμερα HER2 θετικό ασθενείς έχουν μια βελτιωμένη πρόγνωση σε σύγκριση με τις γυναίκες με HER2 αρνητική νόσο [27]

Εδώ , χρησιμοποιώντας μία ολοκληρωμένη βάση δεδομένων του δέκα δημοσιευθεί προηγουμένως transcriptomic σύνολα δεδομένων, μπορούμε να επικυρώσει την συσχέτιση με την επιβίωση για ένα σύνολο γονιδίων στον καρκίνο του πνεύμονα μη-μικρού κυττάρου. Σε γενικές γραμμές, οι ισχυρότερες συσχετίσεις βρέθηκαν για εκείνους διερευνηθεί επίσης σε προηγούμενη μετα-ανάλυση (VEGF, CCNE1 και CDK1). Για όλα αυτά τα γονίδια υψηλότερη έκφραση συσχετίστηκε με βραχύτερη επιβίωση. Με πάνω από 5.000 ασθενείς, η μετα-ανάλυση για τον VEGF [20] χρησιμοποιείται το μεγαλύτερο αριθμό ασθενών – ανάλυσή μας επιβεβαίωσε επίσης τη συσχέτιση της έκφρασης του VEGF και τη συνολική επιβίωση σε ασθενείς με ΜΜΚΠ τόσο από μονοπαραγοντική και πολυπαραγοντική ανάλυση. Η σημασία του VEGF είναι λόγω της διαθεσιμότητας των στοχοθετημένων παράγοντες αναστολής άμεσα την ενεργοποίηση της. Είναι ενδιαφέρον, για ένα από τα γονίδια (CDK1) μια προηγούμενη μετα-ανάλυση απορριφθεί πράγματι μία συσχέτιση μεταξύ του γονιδίου και την επιβίωση [24]. Αντίθετα, τα αποτελέσματά μας αντιπροσωπεύουν μια ανεξάρτητη επικύρωση μεγάλης κλίμακας του γονιδίου. Σε μεμονωμένα γονίδια, μόνο λίγα συσχετίστηκαν με μεγαλύτερη επιβίωση, όταν εμφανίζει υψηλότερη έκφραση – σε αυτά περιλαμβάνονται CADM1, ANXA3, ADAM28, ΧΙΑΡ και XAF1. Μελλοντική θεραπευτική στόχευση από αυτά θα είναι δυνατή μόνο με τη χρήση μια διαφορετική προσέγγιση από ό, τι για τα περισσότερα γονίδια στα οποία υψηλότερη έκφραση στην πραγματικότητα οδηγεί σε μικρότερη επιβίωση.

Μετά τη χειρουργική επέμβαση, περίπου τα δύο τρίτα των υποτροπών της νόσου πρώιμο στάδιο συμβαίνουν σε απομακρυσμένες περιοχές . Ως εκ τούτου, η εκρίζωση των μικρομεταστάσεων πρέπει να έχει υψηλή προτεραιότητα όσο το δυνατόν νωρίτερα. Μια προηγούμενη μετα-ανάλυση όλων των δοκιμών που διερευνούν όφελος από τη χημειοθεραπεία έδειξε μια βελτίωση 5% στην συνολική επιβίωση [28]. Αυτό το πλεονέκτημα επιβίωσης σε χημειοθεραπεία επίσης διατηρήθηκε σε 9 έτη παρακολούθησης. Γι ‘αυτούς τους λόγους, η χρήση των επικουρική χημειοθεραπεία είναι το τρέχον πρότυπο της περίθαλψης για τους ασθενείς με πρώιμο στάδιο NSCLC. Στο σύστημα ανάλυσης μας έχουν ενσωματώσει τη χρήση της χημειοθεραπείας για να καταστεί δυνατή η επικύρωση των γονιδίων που σχετίζονται άμεσα με την επιβίωση σε ασθενείς που έλαβαν χημειοθεραπεία.

Ένας σημαντικός αιτιολογικός παράγοντας για τον καρκίνο του πνεύμονα είναι το κάπνισμα που ευθύνεται για σχεδόν το 85% του συνόλου περιπτώσεις. ανάπτυξη Ο καρκίνος του πνεύμονα είναι παρόμοια με άλλους τύπους καρκίνου με τη συμμετοχή μίας σταδιακής εξέλιξης σε μία κακοήθη μετασχηματισμό οδηγείται από το συνδυαστικό αποτέλεσμα των γενετικών αλλαγών που προκαλούνται από εισπνεόμενα καρκινογόνα [29]. Ταυτόχρονα, ο αριθμός των προηγουμένως ποτέ καπνιστή ασθενείς με καρκίνο του πνεύμονα αυξάνεται επίσης [30]. Συγκέντρωση νέες ιδέες μέσα στον υποκείμενο μηχανισμό και αιτιολογικοί παράγοντες σε αυτούς τους ασθενείς είναι απαραίτητη για την καλύτερη κατανόηση της ασθένειας και την ανάπτυξη νέων θεραπευτικών στρατηγικών [2]. Στη βάση δεδομένων μας είχαμε την ιστορία του καπνίσματος για 1.042 ασθενείς (από αυτά τα 187 ποτέ καπνιστής) και το εργαλείο μετα-ανάλυση περιλαμβάνει επίσης την επιλογή να περιορίσουν είτε να καπνιστή σε μη καπνιστή ομάδες ασθενών. Πρόσθετες επιλογές φιλτραρίσματος περιλαμβάνουν τη χρήση των φύλων (τα στοιχεία είναι διαθέσιμα για 1.564 ασθενείς) και στάσης (697 ασθενείς). Συνδυασμοί αυτών των επιλογών επιτρέπουν την επικύρωση των υποψηφίων βιοδεικτών σε υπο-ομάδες που έχουν ένα μέγεθος που δεν επιτευχθεί από οποιαδήποτε από τις προηγούμενες μεμονωμένες μελέτες.

Προηγουμένως, στο πλαίσιο του έργου πρόκληση του Διοικητικού Συμβουλίου για αδενοκαρκίνωμα του πνεύμονα, η συνδυασμένη χρήση των κλινικών και πληροφορίες γονιδιακής έκφρασης καλύτερη απόδοση για την πρόβλεψη της πρόγνωσης [17]. Η πολυπαραγοντική ανάλυση στο διαδικτυακό λογισμικό δίνει τη δυνατότητα να συγκρίνουν τις κλινικές και μοριακή μεταβλητές. Δυστυχώς, δεν είναι όλα κλινικές πληροφορίες που δημοσιεύονται για κάθε ασθενή – αυτό περιορίζει σημαντικά τις δυνατότητες της κάθε πολυπαραγοντική ανάλυση, συμπεριλαμβανομένων δύο μεταβλητές κλινικές και γονιδιακή έκφραση

Θα πρέπει επίσης να αναφέρουμε κάποια θέματα με μετα-αναλύσεις που ενδέχεται να υπονομεύσουν το κύρος τους. – αυτές περιλαμβάνουν προκαταλήψεις που σχετίζονται με την επιλογή των ασθενών, στην κλινική ετερογένεια, με διαφορετικά μέτρα έκβασης, σε μεθοδολογικές και στατιστικές τεχνικές [31]. Μια επιλογή η δοκιμασία για τις προκαταλήψεις έχει πραγματοποιήσει το μέγεθος του δείγματος κατά το μέγεθος της επίδρασης, καθώς αυτό είναι συνήθως ασύμμετρη και ασύμμετρη παρουσία μια προκατάληψη [32]. Βασικά, χωρίς προκατάληψη, η μεγαλύτερη διαφοροποίηση θα πρέπει να τηρούνται οι περισσότεροι στις μικρές μελέτες και τουλάχιστον σε μεγάλες μελέτες. Αυτή είναι η έννοια του αρχικού οικοπέδου χοάνη που θα χρησιμοποιηθούν για να αποδειχθεί η συσχέτιση μεταξύ των ποσοστών κινδύνου και τα μεγέθη των δειγμάτων για δύο επιλεγμένων γονιδίων. Προσθέσαμε μια επιλογή ανάλυσης για το εργαλείο μας για να τρέξει τους υπολογισμούς σε κάθε σύνολο δεδομένων ξεχωριστά για να καταστεί δυνατή η ταχεία κατασκευή τέτοιων αναλύσεων για κάθε γονίδιο.

Τέλος, έχουμε επίσης αξιολογηθεί προηγουμένως δημοσιευθεί υπογραφές γονιδιακής έκφρασης για την πρόβλεψη της επιβίωσης. Σήμερα, η κλινική εφαρμογή της πολυγονιδιακής υπογραφών εξακολουθεί να είναι αμφιλεγόμενη, καθώς πολλοί από αυτούς δεν ξεπερνούν πρόγνωση χρησιμοποιώντας συμβατικές παραμέτρους. Εδώ, από τις επτά υπογραφές, δύο ήταν σε θέση να προβλέψει την επιβίωση στο στάδιο Ι [13], καθώς και σε όλους τους ασθενείς με ΜΜΚΠ [14].

Εν ολίγοις, με τη χρήση του γονιδιώματος σε επίπεδο συνόλων δεδομένων μικροσυστοιχιών δημοσιεύεται στην τελευταία πέντε χρόνια, έχουμε ενσωματώσει επιτυχώς μια μεγάλη βάση δεδομένων κατάλληλη κλίμακα για το

in silico

επικύρωση των υποψηφίων βιοδεικτών σε μη-μικροκυτταρικό καρκίνο του πνεύμονα.

Υποστήριξη Πληροφορίες

πίνακα S1.

Λίστα των γονιδίων που εμπλέκονται στο παρελθόν δημοσιευθεί σύνολα γονιδίων

doi:. 10.1371 /journal.pone.0082241.s001

(XLS)

R Script S1.

R script χρησιμοποιείται για να παράγει Kaplan-Meier για

doi: 10.1371 /journal.pone.0082241.s002

(R)

You must be logged into post a comment.