PLoS One: Ξεκλείδωμα βιοδεικτών Ανακάλυψης: Μεγάλης Κλίμακας Εφαρμογή του απταμερούς πρωτεομικής τεχνολογίας για την έγκαιρη ανίχνευση του καρκίνου του πνεύμονα


Αφηρημένο

Ιστορικό

Ο καρκίνος του πνεύμονα είναι η κύρια αιτία των θανάτων από καρκίνο σε όλο τον κόσμο. Οι νέες διαγνώσεις που απαιτούνται για την ανίχνευση του καρκίνου του πνεύμονα πρώιμο στάδιο διότι μπορεί να θεραπευτεί με χειρουργική επέμβαση. Ωστόσο, οι περισσότερες περιπτώσεις διαγιγνώσκονται πολύ αργά για θεραπευτική επέμβαση. Εδώ παρουσιάζουμε μια ολοκληρωμένη κλινική μελέτη βιοδεικτών του καρκίνου του πνεύμονα και το πρώτο μεγάλης κλίμακας κλινική εφαρμογή της νέας απταμερούς με βάση πρωτεομική τεχνολογία για να ανακαλύψει βιοδεικτών πρωτεΐνη του αίματος στη νόσο.

Μεθοδολογία /Κύρια Ευρήματα

Πραγματοποιήσαμε μια μελέτη ασθενών-μαρτύρων πολυκεντρική σε αρχειοθετημένα δείγματα ορού από 1.326 άτομα από τέσσερις ανεξάρτητες μελέτες των μη-μικροκυτταρικό καρκίνο του πνεύμονα (NSCLC) σε μακροπρόθεσμη πληθυσμούς καπνού εκτίθενται. Οι οροί συλλέγονται και υφίστανται επεξεργασία υπό ομοιόμορφες πρωτόκολλα. Υπόθεση οροί συλλέχθηκαν από 291 ασθενείς εντός 8 εβδομάδων από την πρώτη βιοψία καρκίνου του πνεύμονα και πριν από την αφαίρεση του όγκου από χειρουργική επέμβαση. οροί ελέγχου συλλέχθηκαν από 1.035 ασυμπτωματική συμμετέχοντες στη μελέτη με ≥10 πακέτα-χρόνια του καπνίσματος. Μετρήσαμε 813 πρωτεΐνες σε κάθε δείγμα με μια νέα απταμερούς με βάση πρωτεομική τεχνολογία, εντοπίστηκαν 44 υποψήφια βιοδείκτες, και ανέπτυξε ένα πάνελ 12-πρωτεΐνης (καντερίνη-1, CD30 συνδετήρα, ενδοστατίνη, HSP90α, LRIG3, ΜΙΡ-4, πλειοτροπίνη, PRKCI, RGM-C, SCF-sR, sL-σελεκτίνη, και ναι) που εισάγουν διακρίσεις NSCLC από τους ελέγχους με 91% ευαισθησία και 84% ειδικότητα στην cross-επικυρωμένη κατάρτιση και 89% ευαισθησία και 83% ειδικότητα σε ένα ξεχωριστό σύνολο επαλήθευσης, με παρόμοιες επιδόσεις για την έγκαιρη και προχωρημένο στάδιο NSCLC.

Συμπεράσματα /Σημασία

Αυτή η μελέτη είναι μια σημαντική πρόοδο στην κλινική πρωτεομική σε μια περιοχή υψηλού ανεκπλήρωτες κλινική ανάγκη. Η ανάλυσή μας υπερβαίνει το εύρος και το δυναμικό εύρος των proteome ανακρίθηκε προηγουμένως δημοσιευμένων κλινικών μελετών ευρείας proteome ορού προφίλ πλατφόρμες, συμπεριλαμβανομένων φασματομετρία μάζας, συστοιχίες αντισωμάτων, και συστοιχίες αυτοαντισωμάτων. Η ευαισθησία και η ειδικότητα του πάνελ 12-βιοδεικτών μας βελτιώνει δημοσιεύθηκε πάνελ έκφραση πρωτεΐνης και γονιδίου. Ξεχωριστή επαλήθευση της απόδοσης ταξινομητή παρέχει αποδεικτικά στοιχεία εναντίον υπερ-τοποθέτηση και είναι ενθαρρυντικό για την επόμενη φάση ανάπτυξης, ανεξάρτητη επικύρωση. Αυτή η προσεκτική μελέτη παρέχει μια σταθερή βάση για την ανάπτυξη δοκιμών απολύτως απαραίτητη για τον εντοπισμό σε πρώιμο στάδιο καρκίνου του πνεύμονα

Παράθεση:. Ostroff RM, Bigbee WL, Franklin W, Gold L, Mehan Μ, Miller YE, et al. (2010) Ξεκλείδωμα βιοδεικτών Ανακάλυψης: Μεγάλης Κλίμακας Εφαρμογή του απταμερούς πρωτεομικής τεχνολογίας για την έγκαιρη ανίχνευση του καρκίνου του πνεύμονα. PLoS ONE 5 (12): e15003. doi: 10.1371 /journal.pone.0015003

Επιμέλεια: Irina Agoulnik, Διεθνές Πανεπιστήμιο της Φλόριντα, Ηνωμένες Πολιτείες της Αμερικής

Ελήφθη: 6 Αύγ 2010? Αποδεκτές: 7η Οκτωβρίου, 2010? Δημοσιεύθηκε: 7, Δεκεμβρίου, 2010

Copyright: © 2010 Ostroff et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Ο καρκίνος του πνεύμονα ασθενούς και Pluss ελέγχου υπόκειται σε δεδουλευμένη βάση και σχολιασμό μαζί με τη συλλογή δείγματος αίματος, την επεξεργασία και την αποθήκευση στο Πανεπιστήμιο του Πίτσμπουργκ Ινστιτούτου για τον Καρκίνο υποστηρίχθηκε από ένα Προγράμματα Specialized της ερευνητικής αριστείας (SPORE) επιχορήγηση από το Εθνικό Ίδρυμα Καρκίνου (NCI) των ΗΠΑ Εθνική ινστιτούτα Υγείας (ΝΙΗ) των Ηνωμένων Πολιτειών της Αμερικής στον καρκίνο του πνεύμονα (Ρ50 CA090440) για να JMS. Πνεύμονα μελέτες για τον καρκίνο στο NYU υποστηρίζονταν από επιχορηγήσεις από την Πρώιμη Ανίχνευση Δίκτυο Έρευνας (EDRN) του NCI του Εθνικού Ινστιτούτου Υγείας των Ηνωμένων Πολιτειών της Αμερικής και από το Stephen E. Ταμείο Banner για καρκίνο του πνεύμονα σε HIP, και μια επιχορήγηση βιοδεικτών από το NCI του Εθνικού Ινστιτούτου Υγείας των Ηνωμένων Πολιτειών της Αμερικής (5U01CA086137) για να WR. μελέτες για τον καρκίνο του πνεύμονα στο Roswell Park Cancer Institute υποστηρίχθηκαν εν μέρει από το Αντικαρκινικό Κέντρο Grant Υποστήριξης (5P30CA016056) από το NCI του Εθνικού Ινστιτούτου Υγείας των Ηνωμένων Πολιτειών της Αμερικής. Πανεπιστήμιο των εισφορών Κολοράντο με τη μελέτη αυτή υποστηρίχθηκε από μια επιχορήγηση SPORE από το NCI του Εθνικού Ινστιτούτου Υγείας των Ηνωμένων Πολιτειών της Αμερικής (Ρ50-CA58187) και επιχορήγηση από το EDRN του NCI του Εθνικού Ινστιτούτου Υγείας των Ηνωμένων Πολιτειών της Αμερικής (U01 -CA85070). SomaLogic χρηματοδότησε την πρωτεομική έρευνα βιοδείκτη. SomaLogic είχε ένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου. Χρηματοδότες εκτός από SomaLogic δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:. Οι συγγραφείς έχουν διαβάσει την πολιτική του περιοδικού και τα ακόλουθα συγκρούσεις. R Ostroff, L Gold, Μ Mehan, Α Stewart, J Walker, S Williams, D Zichi, Ε Brody είναι πλήρους απασχόλησης εργαζόμενοι της SomaLogic. Αυτό δεν αλλάζει την τήρηση των συγγραφέων στα PLoS ONE πολιτικές για την ανταλλαγή δεδομένων και υλικών.

Εισαγωγή

καρκίνου

πνεύμονα είναι η κύρια αιτία των θανάτων από καρκίνο, γιατί ~84% των περιπτώσεων διαγιγνώσκονται σε προχωρημένο στάδιο [1] – [3]. Σε όλο τον κόσμο το 2008, -1,5 εκατομμύρια άνθρωποι διαγνώστηκαν και ~ 1,3 εκατομμύρια έχασαν τη ζωή τους [4] – ποσοστό επιβίωσης αμετάβλητο από το 1960. Ωστόσο, οι ασθενείς διαγιγνώσκονται σε πρώιμο στάδιο και να έχουν τη χειρουργική επέμβαση εμπειρία αποτελεί το 86% της συνολικής επιβίωσης 5 ετών [2], [3]. Ως εκ τούτου, τα νέα διαγνωστικά αναγκαία για τον εντοπισμό σε πρώιμο στάδιο καρκίνου του πνεύμονα

Κατά την τελευταία δεκαετία η κλινική χρησιμότητα της χαμηλής δόσης CT έχει αξιολογηθεί [5] -. [8] με την ελπίδα ότι η απεικόνιση υψηλής ανάλυσης μπορεί να βοηθήσει την ανίχνευση του καρκίνου του πνεύμονα νωρίτερα και τη βελτίωση των αποτελεσμάτων των ασθενών, όσο και διαλογής έχει κάνει για καρκίνο του μαστού και του παχέος εντέρου [9]. Οριστικά συμπεράσματα για CT προσυμπτωματικού ελέγχου και τη θνησιμότητα του καρκίνου του πνεύμονα περιμένουν τα αποτελέσματα από τυχαιοποιημένες μελέτες στις ΗΠΑ [8] και στην Ευρώπη [10] – [13]. CT μπορεί να ανιχνεύσει μικρές, πρώιμου σταδίου όγκους του πνεύμονα, αλλά διακρίνουν σπάνιες μορφές καρκίνου από την κοινή καλοήθεις συνθήκες είναι δύσκολη και έχει οδηγήσει σε περιττές διαδικασίες, έκθεση σε ακτινοβολία, το άγχος, και το κόστος [6], [14] – [16]. Εμείς (JMS, JLW, και οι συνεργάτες του) ανέφερε πρόσφατα τέτοια συμπεράσματα για τη Μελέτη Screening Πίτσμπουργκ πνεύμονα (Pluss), η μεγαλύτερη ενιαία-φορέα μελέτης διαλογής, CT έχουν αναφερθεί μέχρι σήμερα [5].

Άλλα είδη βιοδείκτες έχουν επίσης ζητήθηκε [17]. Οι πρωτεΐνες είναι ελκυστικά επειδή είναι ένα άμεσο μέτρο του φαινοτύπου, σε αντίθεση με το DNA το οποίο παρέχει γονότυπο, σε μεγάλο βαθμό ένα μέτρο του κινδύνου της νόσου [18]. Ενιαία βιοδείκτες πρωτεΐνης είναι το θεμέλιο της μοριακής διαγνωστικής στην κλινική σήμερα. Είναι ευρέως πιστεύεται ότι πολλαπλοί βιοδείκτες θα μπορούσε να βελτιώσει την ευαισθησία και την εξειδίκευση των διαγνωστικών δοκιμών και ότι πολύπλοκες ασθένειες όπως ο καρκίνος αλλάξει τις συγκεντρώσεις πολλαπλών πρωτεϊνών [19]. Ωστόσο, ανακαλύπτοντας πολλαπλών βιοδείκτες πρωτεΐνη μετρώντας πολλές πρωτεΐνες ταυτόχρονα (πρωτεομική) σε σύνθετα δείγματα όπως αίμα έχει αποδειχθεί δύσκολη για λόγους κάλυψης, την ακρίβεια, απόδοση, προαναλυτικές μεταβλητότητα, και το κόστος [20].

Για να ενεργοποιήσετε την ανακάλυψη βιοδεικτών , έχουμε αναπτύξει μια νέα πρωτεομική τεχνολογία που βασίζεται σε μια νέα γενιά αντιδραστηρίων σύνδεσης πρωτεΐνης απταμερούς και έχει δυνητικά ευρεία εφαρμογή [18]. Η τρέχουσα δοκιμασία μετρά 813 διαφορετικές πρωτεΐνες του ανθρώπινου μέσα σε μόλις 15 μL αίματος με χαμηλά όρια ανίχνευσης (μέση 13:00 και τόσο χαμηλά όσο 100 FM), 7 κορμούς των συνολικών δυναμικό εύρος και την υψηλή επαναληψιμότητα (5% μέση συντελεστής μεταβλητότητας) [ ,,,0],18]. Εδώ σας παρουσιάζουμε την πρώτη κλινική εφαρμογή μεγάλης κλίμακας της τεχνολογίας πρωτεομική μας για να ανακαλύψετε βιοδεικτών πρωτεΐνη του αίματος σε μια μεγάλη μελέτη ασθενών-μαρτύρων πολυκεντρική διεξάγονται σε αρχειοθετημένα δείγματα από 1.326 άτομα από τέσσερις ανεξάρτητες μελέτες των μη-μικροκυτταρικό καρκίνο του πνεύμονα (NSCLC) στο μακροπρόθεσμη καπνού πληθυσμούς που έχουν εκτεθεί.

Υλικά και Μέθοδοι

Ηθική Δήλωση

Όλα τα δείγματα συλλέχθηκαν από συμμετέχοντες στη μελέτη μετά από γραπτή συγκατάθεση στο πλαίσιο ερευνητικών πρωτοκόλλων κλινικών που εγκρίθηκε από το παρακάτω θεσμική συμβούλια αναθεώρηση: Το Πανεπιστήμιο του Πίτσμπουργκ Διοικητικού κριτική θεσμική (Pitt)? Η Σχολή του Πανεπιστημίου της Νέας Υόρκης της ιατρικής επιτροπής αναθεώρησης Θεσμική (NYU)? Το Διοικητικό Συμβούλιο Roswell Park Cancer Institute Institutional Review (RP)? και το Διοικητικό Συμβούλιο Cape Cod Υγείας Institutional Review (BS).

Μελέτη

Οι στόχοι αυτής της μελέτης ήταν να ανακαλύψει βιοδεικτών που εισάγουν διακρίσεις NSCLC από καπνιστές με ≥10 χρόνια της ιστορίας του καπνίσματος τσιγάρων, για να εκπαιδεύσει και cross-επικυρώνει ένα πολυ-βιοδεικτών ταξινομητή του NSCLC να ανταποκριθεί προκαθορισμένα κριτήρια απόδοσης, και να ελέγχουν την απόδοση του ταξινομητή με ένα ξεχωριστό σύνολο τύφλωσε δειγμάτων. Ο συνολικός σχεδιασμός της μελέτης φαίνεται στο Σχήμα 1. Έχουμε σχεδιάζονται και να εκτελούνται αυτή τη μελέτη για την τρέχουσα αυστηρά πρότυπα για κλινικές μελέτες βιοδεικτών [21] – [23] με τους στόχους της μεγιστοποίησης των βιοδεικτών ευρωστία, την εγκυρότητα και την αξιοπιστία κατά τη φάση της ανακάλυψης, και την ελαχιστοποίηση των δυνητικών επιπτώσεων των προαναλυτικές μεταβλητότητας. Η μελέτη ήταν ένα σχέδιο ανακάλυψη φάσης, περίπτωση ελέγχου. Κρίσιμα χαρακτηριστικά του σχεδιασμού της μελέτης περιλαμβάνουν τα ακόλουθα. Η κλινική ερώτηση και σχεδιαστική μελέτη ήταν προκαθορισμένη πριν από τον προσδιορισμό και την απόκτηση δειγμάτων. Τα δείγματα αποκτήθηκαν από τέσσερις ανεξάρτητους χώρους μελέτης, ώστε να ελέγχουν για ενδεχόμενες προαναλυτικές μεταβλητότητα. Αυστηρή τυποποιημένες διαδικασίες λειτουργίας ακολουθήθηκαν για την εξασφάλιση του δείγματος και της ανωνυμίας των δεδομένων και τα εκτυφλωτικά ανά πάσα στιγμή (δείτε παρακάτω). Ένα σύνολο του δείγματος ελέγχου που αποτελείται από 25% όλων των δειγμάτων της μελέτης επελέγη τυχαία και η αναγνώριση αυτού του συνόλου τυφλώθηκε. Το σχέδιο στατιστική ανάλυση προκαθορισμένων και περιλαμβάνονται ελάχιστα αποδεκτά κριτήρια επιδόσεων για την ευαισθησία και ειδικότητα

Η

Δείγμα Cohort

Η ομάδα δείγμα περιελάμβανε 1.326 δείγματα ορού που λαμβάνονται από τέσσερις ανεξάρτητες biorepositories:. Νέα Πανεπιστήμιο York (NYU) [24]? Roswell Park Cancer Institute (RPCI) [25]? Το Πανεπιστήμιο του Πίτσμπουργκ (PITT) [5]? και ένα εμπορικό biorepository (Bioserve (BS)) (Πίνακας 1). Όλα τα δείγματα συλλέχθηκαν από συμμετέχοντες στη μελέτη μετά από συγκατάθεση σύμφωνα με θεσμικά εγκεκριμένων ερευνητικών πρωτοκόλλων κλινικών όπως περιγράφεται [5], [24], [25]. Και τα δύο δείγματα ορού υπόθεση και ελέγχου συλλέχθηκαν από τέσσερα κέντρα μελέτης. Τα κλινικά χαρακτηριστικά της σειράς ασθενών της μελέτης για τα σύνολα εκπαίδευσης και επαλήθευσης φαίνονται στον Πίνακα 2. Η σταδιοποίηση και ιστολογία των περιπτώσεων NSCLC παρουσιάζεται στον Πίνακα 3. Το δείγμα περιλάμβανε ομάδα ασθενών που έχουν διαγνωστεί με παθολογικές ή κλινικό στάδιο Ι-ΙΙΙ NSCLC και υψηλό πληθυσμό ελέγχου -Κίνδυνος με ιστορικό μακροχρόνιας χρήσης του καπνού, συμπεριλαμβανομένων των ενεργών και πρώην καπνιστές με ≥10 πακέτα-χρόνια του καπνίσματος. Οι πληθυσμοί ελέγχου επιλέχθηκαν τυχαία μέσα σε κάθε μελέτη που αντιπροσωπεύει τον πληθυσμό ασθενών σε κίνδυνο για καρκίνο του πνεύμονα που θα είναι υποψήφιοι για τη διαλογή CT, με αναλογία περίπτωση: έλεγχος του 1:3.5. Τα δείγματα αίματος για τις περιπτώσεις συλλέχθηκαν από ασθενείς εντός οκτώ εβδομάδων από την πρώτη βιοψία τη διάγνωση του καρκίνου του πνεύμονα και πριν από την αφαίρεση του όγκου από μία χειρουργική διαδικασία. Όλες οι περιπτώσεις που χρησιμοποιούνται σε αυτή τη μελέτη επιβεβαιώθηκαν ως πρωτοπαθή καρκίνο του πνεύμονα με κριτική παθολογία. NSCLC στάσης ανατέθηκε από παθολογική στάσης για 240 άτομα και η κλινική σταδιοποίηση για 51 άτομα. Καλοήθης όζος έλεγχοι έχουν τουλάχιστον ένα έτος από την παρακολούθηση των δεδομένων και μη κακοήθεις διάγνωση. έλεγχοι καπνιστής ήταν ασυμπτωματικοί συμμετέχοντες στη μελέτη με ≥10 πακέτα-χρόνια του καπνίσματος. ελέγχους καπνιστής από NYU και Pitt ήταν οζίδιο δωρεάν από CT? κατάσταση όζος είναι άγνωστη για τους ελέγχους καπνιστή από την RP και BS. Δημογραφικά δεδομένα συλλέχθηκαν με ερωτηματολόγια αυτοαναφοράς. Πρόσθετα στοιχεία για τις περιπτώσεις που αποκτήθηκε μέσω της αναθεώρησης των κλινικών διάγραμμα. Πνευμονική δοκιμές λειτουργίας αξιολογήθηκε με σπιρομέτρηση για ένα υποσύνολο των συμμετεχόντων στη μελέτη.

Η

Η

Ορός Συλλογή, επεξεργασία, αποθήκευση και αποστολή

Όλα τα δείγματα ορού συλλέχθηκαν παρακάτω ομοιόμορφη πρωτόκολλα που συνιστώνται από την έγκαιρη διάγνωση Δίκτυο Έρευνας του Εθνικού Ινστιτούτου Καρκίνου [22]. Τρία από τα κέντρα (NYU, Πιτ και RPMC) συλλέγονται ορού σε κόκκινη κορυφή σωλήνες Vacutainer (Becton Dickinson, Raritan, NJ) και ένα κέντρο (BS) που συλλέγονται ορού σε τίγρη κορυφή SST Vacutainer σωλήνες (Becton Dickinson). Όλα τα δείγματα αφέθηκαν να πήξει και ο ορός ανακτήθηκε με φυγοκέντρηση εντός 2-8 ωρών από τη συλλογή και αποθηκεύτηκαν στους -80 ° C. HIPAA υποχωρητικό, de-εντοπίστηκαν δείγματα απεστάλησαν κατεψυγμένα σε ξηρό πάγο για να SomaLogic από τα κέντρα μελέτης και αποθηκεύτηκε στους -80 ° C. Δείγματα αποψύχθηκαν φορά για δειγματισμό πριν από την πρωτεομική ανάλυση.

Δείγμα εκτυφλωτικό

Για να αποφευχθεί η πιθανή προκατάληψη, η μελέτη αυτή ακολούθησε μια αυστηρή τυπική διαδικασία λειτουργίας για το δείγμα de-ταυτοποίηση και τυφλώνει, έτσι ώστε όλα τα φυσικά δείγματα και τα αρχεία δεδομένων που εντοπίστηκαν αποκλειστικά από ένα μοναδικό, μη αναγνωρίσιμο αριθμό barcode και το κλειδί ήταν αποθηκευμένο σε μια ασφαλή βάση δεδομένων προσβάσιμη μόνο σε καθορισμένους υπεύθυνους διαχειριστές. Όλα τα δείγματα δείγμα τρέχει σε αυτή τη μελέτη ήταν αποθηκευμένα σε πανομοιότυπα σωληνάρια προσδιορίζονται μόνο από εκχωρηθέν barcode. Ο κώδικας εκτυφλωτικό δείγμα είχε σπάσει μόνο σύμφωνα με το προκαθορισμένο σχέδιο αναλύσεως για τους σκοπούς της κατάρτισης ταξινομητή με το σύνολο εκπαίδευσης και επαλήθευσης ταξινομητή με το σύνολο επαλήθευσης. Για το σύνολο του δείγματος ελέγχου, ένα μοναδικό κλειδί εκτυφλωτική δημιουργήθηκε και παρέχεται αποκλειστικά σε έναν αναγνώστη τρίτους (KC), συγγενές με τα κέντρα μελέτης ή SomaLogic, να σκοράρει και να αναφέρουν τα τελικά αποτελέσματα της επαλήθευσης.

πρωτεομική ανάλυση

τα δείγματα ορού αναλύθηκαν για πρωτεομική πλατφόρμα ανακάλυψή μας όπως περιγράφεται στο Gold et al [5]. Εν συντομία, αυτή η τεχνολογία χρησιμοποιεί νέα απταμερή DNA που περιέχουν χημικώς τροποποιημένα νουκλεοτίδια, όπως αντιδραστήρια πρόσδεσης υψηλής ειδικής πρωτεΐνης σε ένα μοναδικό πολυπλεγμένη δοκιμασία που μετατρέπει την ποσότητα κάθε στοχευμένη πρωτεΐνης σε αντίστοιχη ποσότητα του απταμερούς, η οποία ποσοτικοποιείται με μια συστοιχία έθιμο υβριδισμού. Οι ποσότητες πρωτεΐνης καταγράφονται ως σχετικές μονάδες φθορισμού (RFU), που μπορεί να μετατρέπονται σε συγκεντρώσεις με πρότυπες καμπύλες. Η πλατφόρμα είναι ιδιαίτερα αυτοματοποιημένη [26] και επεκτάσιμη για να φιλοξενήσει ένα ευρύ φάσμα της διακίνησης του δείγματος. Σε αυτή τη μελέτη, 813 στόχοι πρωτεΐνης μετρήθηκαν σε 15 μL ορού για κάθε θέμα, και όλοι οι οροί 1326 αναλύθηκαν σε μία συνεχή διαδικασία για μια περίοδο οκτώ ημερών. Συνολικά, τα αποτελέσματα είναι ανάλογες με λίγο περισσότερο από 1.000.000 υψηλής ποιότητας μετρήσεις ELISA. Τα δείγματα υποβλήθηκαν σε επεξεργασία σε πολλαπλά μικροτρυβλία 96 φρεατίων, και όλα τα 1.326 δείγματα που διανέμονται τυχαία και τις ταυτότητές τους ήταν εντελώς τυφλωμένοι σε όλη τη διαδικασία πρωτεομική ανάλυση.

Επιλογή βιοδεικτών

Biomarkers επιλέχθηκαν με μια στρατηγική σχεδιαστεί για τον εντοπισμό αναλυτών με την υψηλότερη απόδοση στην ταξινόμηση των περιπτώσεων NSCLC από ελέγχους σε όλες τις περιοχές μελέτης και ότι επηρεάστηκαν λιγότερο από προαναλυτικές μεταβλητές. Στο πρώτο στάδιο της ανάλυσης αυτής, μπορούμε εξαλειφθεί αναλύτες που έδειξαν απροσδόκητη μεταβολή σε σύγκριση με τους εσωτερικούς ελέγχους, λόγω, για παράδειγμα, αστάθεια δείγματος. Σε αυτή τη διαδικασία, εμείς επιλέξαμε μια σειρά αναλυτών που απέδωσε καλά σε ένα σύνολο αναλύει έξι Naive Bayes (NB) εκπαίδευση ταξινομητή. Πρώτα διαιρείται το σύνολο της κατάρτισης σε δύο διακριτές πληθυσμούς για τον έλεγχο για πιθανή βιολογική μεταβλητότητα μεταξύ τους: (1) σε όλες τις περιπτώσεις και τους ελέγχους με καλοήθη οζίδια που προσδιορίζονται από CT? και (2) σε όλες τις περιπτώσεις και όλα τα άλλα στοιχεία ελέγχου καπνιστή (όζος κατάσταση άγνωστη). Για κάθε πληθυσμού, συγκρίναμε τις περιπτώσεις τους ελέγχους σε τρεις κατάρτιση NB αναλύσεις σχεδιασμένα για να ελέγχουν για ενδεχόμενες προαναλυτικές μεταβλητότητα μεταξύ των περιοχών μελέτης. Οι τρεις NB αναλύσεις που ξεκίνησε με ένα μοναδικό σύνολο των πιθανών βιολογικών δεικτών με βάση τα ακόλουθα κριτήρια: (1) τις περιπτώσεις σε σχέση με τους ελέγχους KS≥0.3 για όλες τις συγκρίσεις σε κάθε μία από τις τέσσερις περιοχές μελέτης? (2) περιπτώσεις σε σχέση με τους ελέγχους KS≥0.3 για τη σύγκριση όλων των χώρων σε συνδυασμό? (3) και τα δύο κριτήρια ένα και δύο ικανοποιήθηκαν. Για κάθε ανάλυση, χρησιμοποιήσαμε ένα άπληστο εμπρός αλγόριθμος αναζήτησης για να επιλέξετε υποσύνολα των πιθανών βιοδεικτών, να χτίσουν ταξινομητές NB (βλέπε παρακάτω), και σημείωσε την απόδοσή τους για την ταξινόμηση του καρκίνου του πνεύμονα και των ελέγχων χρησιμοποιώντας το σύνολο εκπαίδευσης. Σε αυτή τη διαδικασία, αυτό το μετα-ευρετική προσέγγιση αναζητήσεις αποτελεσματικά χώρο ταξινομητή για τον εντοπισμό πιθανών βιοδεικτών που έχουν τις καλύτερες επιδόσεις στην κατάταξη. Χρησιμοποιήσαμε ένα απλό μέτρο της διαγνωστικής απόδοσης των ταξινομητών, την αριθμητική άθροισμα της ευαισθησίας + ειδικότητας, και μετράται η συχνότητα με την οποία επιλέχθηκαν δυναμικό βιοδείκτες από τον άπληστο αλγόριθμο για ένταξη στο πάνελ ταξινομητή με ευαισθησία + ειδικότητα ≥1.7. Αυτό το βήμα παράγεται ένα σύνολο πιθανών βιοδεικτών για καθένα από τα έξι παράλληλες αναλύσεις. Έχουμε επιλέξει το τελικό σύνολο των βιοδεικτών ως ένωση αυτών των έξι σύνολα.

Στατιστικές Μέθοδοι

Το στατιστικό KS είναι μια μη-παραμετρική μέτρο της διαφοράς μεταξύ των δύο κατανομών. Το KS Στατιστικά δύο δειγμάτων είναι:, όπου και είναι εμπειρικά αθροιστικές κατανομές για δύο πληθυσμούς των τιμών

Η αφελής ταξινομητής Bayes υποθέτει ανεξαρτησία μεταξύ των δειγμάτων, καθώς και τα μοντέλα οι κατανομές των κατηγοριών εκπαίδευσης να κάνουν προβλέψεις [27. ]. Χρησιμοποιήσαμε κανονικές κατανομές για τη μοντελοποίηση των δεδομένων μας. Ωστόσο, τα χαρακτηριστικά στα δεδομένα μας συχνά περιέχουν διανομές με βαριές ουρές έτσι μέγιστη εκτίμηση πιθανότητας των παραμέτρων κατανομής εκτελεί κακώς. Ως εκ τούτου, το πρότυπο διανομές μας ως κατανομές λογαριθμική-κανονική και χρησιμοποιήθηκε ο αλγόριθμος Gauss-Newton για να χωρέσει τα δεδομένα.

Κατασκευάσαμε Bayesian ταξινομητές χρησιμοποιώντας σύνολα των πιθανών βιοδεικτών που προσδιορίζονται όπως περιγράφεται παραπάνω. Χρησιμοποιήσαμε ένα παραμετρικό μοντέλο για να συλλάβει την υποκείμενη κατανομή της πρωτεΐνης για μια δεδομένη κατάσταση. Η απλούστερη παραμετρικό μοντέλο για τη συνάρτηση πυκνότητας πιθανότητας (pdf) για μία μόνο πρωτεΐνη είναι μια κανονική κατανομή, περιγράφεται πλήρως από ένα μέσο u και διακύμανση σ

2 (Εξ. 1). (1)

Πολλά κατανομές πρωτεΐνης παρατηρήθηκαν κανονικά σε σχέση με τον λογάριθμο της συγκέντρωσης. Οι αριθμητικές CDFS μπορεί να ταιριάζει σε μια κανονική κατανομή σε συγκεντρώσεις log x (Εξ. 2). (2)

Τα μοντέλα ταιριάξουν τα δεδομένα καλά. Πιο πολύπλοκα μοντέλα των συναρτήσεων κατανομής πιθανοτήτων μπορεί να χρησιμοποιηθεί όταν αυτό δικαιολογείται, αλλά το απλό μοντέλο παρέχεται μια καλή περιγραφή των δεδομένων μας.

Για να συνδυάζουν πολλαπλές δείκτες, χρησιμοποιήσαμε μια πολυμεταβλητή κανονική κατανομή για να μοντελοποιήσει τη συνάρτηση πυκνότητας πιθανότητας (pdf ) για κάθε κατηγορία. Για n δείκτες, η πολυμεταβλητή pdf δίνεται από την ακόλουθη εξίσωση (Εξ. 3). (3)

όπου το χ είναι ένας n-διανυσματική συνιστώσα των επιπέδων της πρωτεΐνης, μ είναι Ν-διανυσματική συνιστώσα της μέσης πρωτεΐνη επίπεδα, Σ είναι ο πίνακας nxn συνδιασποράς και

You must be logged into post a comment.