PLoS One: Οικοδομώντας ένα στατιστικό μοντέλο για την πρόβλεψη του καρκίνου Genes


Αφηρημένο

Περισσότερα από 400 γονίδια του καρκίνου έχουν εντοπιστεί στο ανθρώπινο γονιδίωμα. Ο κατάλογος δεν έχει ακόμη ολοκληρωθεί. Στατιστικά μοντέλα πρόβλεψης τα γονίδια του καρκίνου μπορεί να βοηθήσει με την ταυτοποίηση νέων υποψηφίων γονιδίων του καρκίνου. Χρησιμοποιήσαμε γνωστό καρκίνου του προστάτη (PCA) γονίδια (προσδιορίζονται μέσω KnowledgeNet) ως κατάρτισης που να οικοδομήσουμε ένα δυαδικό μοντέλο λογιστικής παλινδρόμησης τον εντοπισμό των γονιδίων του προστάτη. Η εσωτερική και εξωτερική επικύρωση του μοντέλου διεξήχθη χρησιμοποιώντας ένα σύνολο επικύρωσης (επίσης από KnowledgeNet), μεταθέσεις, και εξωτερικά δεδομένα σε γονίδια με υποτροπιάζοντα μεταλλάξεις όγκου του προστάτη. Αξιολογήσαμε ένα σύνολο 33 χαρακτηριστικά του γονιδίου ως προγνωστικοί παράγοντες. Δεκαέξι από τους αρχικούς 33 προγνωστικούς παράγοντες ήταν σημαντικές στο μοντέλο. Βρήκαμε ότι ένα τυπικό γονίδιο PCA είναι ένας παράγοντας μεταγραφής ειδικό προστατικό, κινάση, ή φωσφατάσης με ατομική υψηλή διακύμανση του επιπέδου έκφρασης σε παρακείμενο φυσιολογικό ιστό του προστάτη και διαφορική έκφραση μεταξύ φυσιολογικού ιστού προστάτη και πρωτογενούς όγκου. γονίδια προστάτη είναι πιθανό να έχουν ένα αντιαποπτωτικό αποτέλεσμα και να παίζουν ένα ρόλο στον πολλαπλασιασμό των κυττάρων, την αγγειογένεση, και την προσκόλληση των κυττάρων. πρωτεΐνες τους είναι πιθανό να ουβικουιτινωμένης ή sumoylated αλλά όχι ακετυλιωμένη. Έχει προταθεί ένας αριθμός νέων υποψηφίων προστάτη. Λειτουργική επισημειώσεις πρωτότυπων υποψηφίων προσδιορίζονται αντιαποπτωτικές, ρύθμιση του κυτταρικού πολλαπλασιασμού, θετική ρύθμιση της δραστικότητας κινάσης, θετική ρύθμιση της δραστικότητας τρανσφεράσης, αγγειογένεση, θετική ρύθμιση της κυτταρικής διαίρεσης, και κυτταρικής προσκόλλησης όπως κορυφή λειτουργίες. Παρέχουμε η λίστα των top 200 προβλέψει γονίδια ΣΕΣΣ, η οποία μπορεί να χρησιμοποιηθεί ως υποψήφιοι για πειραματική επαλήθευση. Το μοντέλο μπορεί να τροποποιηθεί για να προβλέψει τα γονίδια για άλλους δικτυακούς τόπους του καρκίνου

Παράθεση:. Γκόρλοβ IP, Λογοθέτης CJ, Fang S, Gorlova OY, Amos C (2012) Οικοδομώντας ένα στατιστικό μοντέλο για την πρόβλεψη γονίδια του καρκίνου. PLoS ONE 7 (11): e49175. doi: 10.1371 /journal.pone.0049175

Επιμέλεια: Ludmila Prokunina-Olsson, Εθνικό Ινστιτούτο Καρκίνου, Εθνικό Ινστιτούτο Υγείας, Ηνωμένες Πολιτείες της Αμερικής

Ελήφθη: 3, Αυγούστου 2012? Αποδεκτές: 9η Οκτωβρίου του 2012? Δημοσιεύθηκε: 15 Νοέμβρη 2012

Copyright: © 2012 Γκόρλοβ et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Αυτή η μελέτη υποστηρίχθηκε εν μέρει από το David H. Koch Κέντρο Εφαρμοσμένης Έρευνας του Ουρογεννητικό καρκίνοι, το Εθνικό Ινστιτούτο Υγείας του προστάτη CA140388-01 επιχορήγηση Spore, και τα Εθνικά Ινστιτούτα Καρκίνου Κέντρο Υγείας Υποστήριξη Grant 5 P30 CA016672. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

Μια απογραφή των ανθρώπινων γονιδίων του καρκίνου που διεξήχθη από Futreal

et al.

[1] και ενημερώθηκε από Santarious

et al

. [2] για τον εντοπισμό 400 γονίδια σχετίζονται με τον καρκίνο. Είναι προφανές ότι ο κατάλογος των γονιδίων που σχετίζονται με τον καρκίνο, δεν έχει ολοκληρωθεί: μια PubMed αναζήτηση της βιβλιογραφίας διεξήχθη τον Ιούνιο του 2011 με τη χρήση του όρου «νέο γονίδιο του καρκίνου» στον τίτλο εντοπίσει περισσότερες από 100 εργασίες που δημοσιεύθηκαν το 2011 (τα δεδομένα δεν παρουσιάζονται).

Ανάπτυξη ενός μοντέλου πρόβλεψης για τα γονίδια του καρκίνου θα μπορούσε να επιταχύνει την ταυτοποίησή τους. Σε αυτή τη μελέτη, έχουμε αναπτύξει ένα στατιστικό μοντέλο για την πρόβλεψη των γονιδίων του καρκίνου του προστάτη (PCA). Η μελέτη μας είχε ως κίνητρο από το ακόλουθο κείμενο: i) μια σειρά από προστάτη που σχετίζονται με γονίδια με ισχυρούς πειραματικές αποδείξεις έχουν εντοπιστεί, ii) πολλά γονίδια στο ανθρώπινο γονιδίωμα εκτενώς σχολιασμένο, και iii) του γονιδιώματος σε επίπεδο χαρακτηριστικών των δεδομένων γονιδιακής έκφρασης είναι διαθέσιμος [3], [4]. Σε αυτή τη μελέτη, εντοπίσαμε γνωρίσματα που είναι χαρακτηριστικές των γνωστών γονιδίων προστάτη και να χρησιμοποιούνται για την πρόβλεψη νέων γονιδίων του προστάτη.

Υλικά και Μέθοδοι

γνωστά γονίδια προστάτη

Εμείς χρησιμοποιείται η KnowledgeNet (KN? ένας αλγόριθμος λογοτεχνία εξόρυξης) προσέγγιση για τον εντοπισμό των γονιδίων του προστάτη [5]. Οι αναζητήσεις αλγόριθμο KN για μια συσχέτιση μεταξύ του γονιδίου και δύο πρωτογενή και δευτερογενή (

δηλ.,

Σχετικές) όρους. Ως αποτέλεσμα, κάθε γονίδιο λαμβάνει βαθμολογία εμπιστοσύνης (CS): όσο υψηλότερη είναι η CS, τόσο ισχυρότερη είναι η σύνδεση του γονιδίου με μια καθορισμένη φαινότυπο? στην περίπτωσή μας, του προστάτη. Εμείς εντόπισε συνολικά 707 γονίδια με CSS κυμαίνονται 2,663 με 0,001 (Πίνακας S1) και να χρησιμοποιηθούν τα 100 κορυφαία γονίδια ως «γνωστά γονίδια του προστάτη.» Τα άλλα 607 γονίδια από τη λίστα θεωρήθηκαν «υποθετικό γονίδια του προστάτη.» Τα υπόλοιπα 14.641 γονίδια με CS

Για να απαντήσουμε στο ερώτημα αυτό, εντοπίσαμε τις 100 κορυφαίες του μαστού και πάνω 100 γονίδια του καρκίνου του πνεύμονα (Πίνακας S2) χρησιμοποιώντας τον ίδιο αλγόριθμο KN θα χρησιμοποιηθούν για να προσδιορίσουν τα γονίδια PCa. Στη συνέχεια, σε σύγκριση με τα ποσοστά των προβλέψει σωστά γονίδια του μαστού και του καρκίνου του πνεύμονα με το ποσοστό των προβλέψει σωστά γονίδια του προστάτη.

Χτίσαμε μοντέλα BLR με βάση μόνο συγκεκριμένα ( «συγκεκριμένο μοντέλο») και η μη ειδική ( «μη ειδικό μοντέλο «) προγνωστικούς παράγοντες. Στη συνέχεια εκτιμήσαμε τα ποσοστά των προβλέψει σωστά γονίδια μη-προστάτη και του προστάτη για κάθε μοντέλο. Η στατιστική ανάλυση έγινε με τη χρήση του SPSS έκδοση 15.0.

Αποτελέσματα

Προβλεπόμενη προστάτη Γονίδια

Μεταξύ των 33 μεταβλητών, 22 ήταν σημαντικές στην μονοπαραγοντική ανάλυση (Πίνακας S3), ενώ στην το μοντέλο BLR πολυμεταβλητών σταδιακή κίνηση προς τα εμπρός (αναλογία πιθανότητας), 16 μεταβλητές ήταν σημαντικές (Πίνακας 2). Το μοντέλο προέβλεψε σωστά 96% των γονιδίων μη-προστάτη και 55% των γονιδίων του προστάτη και ήταν πιο ακριβή από ό, τι το μοντέλο που χτίστηκε για τα δεδομένα που περιλαμβάνονται στις υποθετικές γονίδια ΣΕΣΣ ως γονίδια μη-ΣΕΣ, στην οποία το 96% των μη-προστάτη γονίδια και το 46% των γονιδίων προστάτη είχαν προβλέψει σωστά.

η

Πίνακας S4 παραθέτει το top 200 προβλέψει γονίδια του προστάτη και δείχνει αν ήταν γνωστοί, υποθετικό, ή νέων προέβλεψε γονίδια. Κατάταξη των γονιδίων Σύμφωνα με το μοντέλο που προέρχονται πιθανότητες αναμορφώσει τον αρχικό κατάλογο CS-based:

AR

(υποδοχέα ανδρογόνων) κατετάγη έβδομος, δεν είναι η πρώτη, όπως στην αρχική λίστα, και

KLK3

(ειδικού προστατικού αντιγόνου [PSA]) ήταν η τέταρτη, αν και ήταν δεύτερος στην αρχική λίστα. Συνολικά, η συσχέτιση μεταξύ της CS και το μοντέλο-που προέρχεται πιθανότητα να σχετίζονται με προστάτη ήταν 0.32, df = 200?

σ

= 2 × 10

-6. Πίνακας S5 παρουσιάζει μεμονωμένων μεταβλητών που συμβάλλουν στην πιθανότητα ότι το γονίδιο που σχετίζεται με προστάτη.

Υποθετικά προστάτη γονίδια έχουν μεγαλύτερη πιθανότητα να χαρακτηρισθεί ως προστάτη Σχετικές

γονίδια Υποθετικά προστάτη αναμένεται να έχουν ένα υψηλότερη πιθανότητα να προστάτη που σχετίζονται με ό, τι γονίδια μη-προστάτη έχουν. Χρησιμοποιήσαμε το μοντέλο μας με βάση τα δεδομένα χωρίς υποθετικών γονιδίων για την εκτίμηση της πιθανότητας ότι ένα υποθετικό γονίδιο σχετίζεται PCa, συγκρίνοντας τις αναλογίες των γονιδίων προβλέπεται να προστάτη σχετίζονται μεταξύ των γνωστών, υποθετικές, και μη-PCa γονίδια. Οι αναλογίες των γονιδίων προβλέπεται να προστάτη σχετίζεται ήταν 0,052 ± 0,002 για τα γονίδια μη-PCa, 0.224 ± 0.017 για υποθετικών γονιδίων PCa, και 0.547 ± 0.049 για τα γνωστά γονίδια PCa. Όπως σημειώθηκε νωρίτερα, φτιάξαμε ένα μοντέλο που περιλάμβανε τις υποτιθέμενες γονίδια ΣΕΣΣ ως γονίδια μη-προστάτη. Συνολικά, η ακρίβεια πρόβλεψης ήταν μικρότερη με αυτό το μοντέλο, με τις αναλογίες των γονιδίων προβλέπεται να προστάτη συνδέεται είναι 0.037 ± 0.002 για τα γονίδια μη-PCa, 0.217 ± 0.016 για υποθετικών γονιδίων PCa, και 0.455 ± 0.049 για το γνωστό PCa γονίδια.

είναι η πρόβλεψη του προστάτη ειδικές;

Για να μάθετε εάν προγνωστικό μοντέλο μας είναι προστάτη ειδικό, εντοπίσαμε τις 100 κορυφαίες γονίδια του μαστού και του καρκίνου του πνεύμονα με τη χρήση της προσέγγισης KN-based (Πίνακας S2 ). Συνολικά, η αναλογία των προβλέψει σωστά γονίδια του καρκίνου ήταν υψηλότερη για προστάτη (0,55 ± 0,03) από ό, τι για μαστού (0,37 ± 0,02) και καρκίνων του πνεύμονα (0,31 ± 0,02). Για το μοντέλο κατασκευάστηκε με βάση την μη ειδική προγνωστικούς παράγοντες μόνο, η ακρίβεια ήταν καλύτερη για τα γονίδια PCa (0,55 ± 0,02) από ό, τι ήταν για το στήθος (0,24 ± 0,02) και τον καρκίνο του πνεύμονα (0,21 ± 0,02) γονίδια. Και για το μοντέλο που βασίζεται σε συγκεκριμένες προγνωστικούς παράγοντες, η πρόβλεψη της αποτελεσματικότητας ήταν επίσης υψηλότερα για προστάτη (0,30 ± 0,02) από ό, τι ήταν για του μαστού (0,08 ± 0,01) και ο καρκίνος του πνεύμονα (0,08 ± 0,01) γονίδια.

Discovery και Σετ επικύρωση

για εσωτερικής επικύρωσης, έχουμε τυχαία τις 200 μεγαλύτερες προστάτη που σχετίζονται με τα γονίδια για την ανακάλυψη και την επικύρωση σύνολα έτσι υπήρχαν 100 γονίδια σε κάθε ομάδα. Μπορούμε στη συνέχεια να κατασκευαστεί το μοντέλο BLR με βάση το σύνολο ανακάλυψης και το χρησιμοποίησε για να προβλέψει τα γονίδια του προστάτη από το σύνολο επικύρωσης. Το μοντέλο ανακάλυψη προβλέψει σωστά το 95% των γονιδίων μη-προστάτη και 43 ± 5% των γονιδίων προστάτη? να προβλέψει παρόμοιες αναλογίες στο σύνολο επικύρωσης: 96% των γονιδίων μη-προστάτη και 38 ± 5% των γονιδίων του προστάτη. Πραγματοποιήσαμε αυτή τη διαδικασία 100 φορές.

Μεταθέσεις

Εμείς τυχαία κατάσταση του προστάτη σε 100 γονίδια από τα 15.348 γονίδια στο αρχικό πίνακα και έχτισε ένα μοντέλο πρόβλεψης για αυτές τις «εικονικές» γονιδίων χρησιμοποιώντας την ίδια 33 μεταβλητές (Πίνακας 1). Η διαδικασία εκτελείται 100 φορές. Υπήρξαν κατά μέσο όρο 0-2 σημαντικές μεταβλητές στην παρωδία μοντέλο γονιδίου, και εκείνες οι μεταβλητές ποικίλλει από μοντέλο σε μοντέλο. Κατά μέσο όρο, 0,7 ± 0,2% παρωδία γονίδια προστάτη είχαν προβλέψει σωστά, η οποία είναι σημαντικά (

σ

& lt? & Lt? 10

-6) χαμηλότερο από το ποσοστό των προβλέψει σωστά «αλήθεια» γονίδια του προστάτη ( 55 ± 5%).

εξωτερικές επικύρωση

για εξωτερική επικύρωση, χρησιμοποιήσαμε τα αποτελέσματα της πρόσφατα δημοσίευσε έκθεση σχετικά με επαναλαμβανόμενες σωματικές μεταλλάξεις σε όγκους του προστάτη [19]. Η μελέτη αυτή προσδιορίζονται 20 genes-

BDH1, DKK1, DLK2, FSIP2, GLI1, IKZF4, KDM4B, MGAT4B, ΕΙΜ, NRCAM, PCDH11X, PDZRN3, PLA2G16, RAB32, SDF4, SF3A1, TBX20, ΜΟΚ, TP53,

και

ZNF473-

που έχουν επαναλαμβανόμενες σωματικές μεταλλάξεις. Δεκαεπτά από αυτά τα γονίδια (όλα εκτός από

BDH1, FSIP2

, και

PLAG16

) ήταν στο αρχικό μας κατάλογο των 15.348 γονίδια. Βρήκαμε ότι το μοντέλο που δημιουργείται πιθανότητα να είναι ένα γονίδιο του προστάτη ήταν πάνω από δέκα φορές μεγαλύτερη για τα γονίδια με επαναλαμβανόμενες σωματικές μεταλλάξεις από ό, τι ήταν για όλα τα άλλα γονίδια: 0,082 ± 0,041

vs

0,007 ± 0,001?. df = 15.348,

t

= 5,4,

σ

& lt? 10

-6 (Σχήμα 1). Οι άλλοι σημαντικοί προγνωστικοί ήταν παράγοντες μεταγραφής, η CS που χρησιμοποιείται για την κατάταξη των γονιδίων του προστάτη από την εξόρυξη λογοτεχνία, τον πολλαπλασιασμό των κυττάρων, φωσφατάσες, αυξητικούς παράγοντες, και την αγγειογένεση. Έχουμε λάβει παρόμοια αποτελέσματα για τα γονίδια με τα αναφερόμενα προστάτη σωματικές μεταλλάξεις από την κοσμική βάση δεδομένων [18]. Το μοντέλο που προέρχεται πιθανότητα να είναι ένα γονίδιο προστάτη ήταν η πιο σημαντική ικανότητα πρόβλεψης των γονιδίων με επαναλαμβανόμενες σωματικές μεταλλάξεις σε όγκους του προστάτη. Άλλοι σημαντικοί προγνωστικοί περιλαμβάνονται CS, κινάσες, αντιαποπτωτικού, τον πολλαπλασιασμό των κυττάρων, ακετυλιωμένη, μεμβράνη πλάσματος, και την αγγειογένεση.

Κάθετη γραμμή αντιπροσωπεύει το όριο στατιστικής σημαντικότητας.

Η

Ειδικές εναντίον μη-ειδική προγνωστικοί παράγοντες

Έχουμε κατασκευάσει ένα μοντέλο που βασίζεται μόνο σε συγκεκριμένες (οκτώ μεταβλητές) και μόνο μη ειδικά (25 μεταβλητές) προγνωστικούς παράγοντες. Στο μη ειδική μοντέλο, 11 μεταβλητές ήταν σημαντικές (κατά φθίνουσα σειρά στατιστικής σημαντικότητας): κινάσες, φωσφατάσες, εξωκυτταρικό χώρο, παράγοντες μεταγραφής, αντιαποπτωτικές, μεταγωγή σήματος, αυξητικούς παράγοντες, τον πολλαπλασιασμό των κυττάρων, sumoylated, κυτταρική προσκόλληση, και την αγγειογένεση. Η μη ειδική μοντέλο προβλέψει σωστά το 95% των μη-προστάτη και 40% των γονιδίων προστάτη? ότι με βάση τις συγκεκριμένες μεταβλητές προβλέψει σωστά το 95,5% των μη-προστάτη και 30.2% των γονιδίων του προστάτη. Υπήρχαν τέσσερις σημαντικοί προγνωστικοί σε αυτό το μοντέλο (κατά φθίνουσα σειρά της στατιστικής σημαντικότητας):. έκφραση του ειδικού προστατικού (εμπλουτισμός βαθμολογία), διακύμανση σε παρακείμενο ιστό, μετα-ανάλυση της γονιδιακής έκφρασης, και τριών επιπέδων μετα-ανάλυση

Συζήτηση

Έχουμε εντοπίσει έναν συνδυασμό χαρακτηριστικών που είναι χαρακτηριστικό των γονιδίων προστάτη: ένα τυπικό γονίδιο του προστάτη είναι ένας παράγοντας του ειδικού προστατικού μεταγραφή, κινάση, ή φωσφατάση με ατομική υψηλή διακύμανση σε παρακείμενο φυσιολογικό ιστό του προστάτη και εκφράζεται με διαφορετικό τρόπο (αυξητικά ή μειωτικά) σε φυσιολογικό ιστό του προστάτη και πρωτογενούς όγκου. γονίδια προστάτη είναι πιθανό να έχουν ένα αντιαποπτωτικό αποτέλεσμα και παίζουν ένα ρόλο στον πολλαπλασιασμό των κυττάρων, την αγγειογένεση, και την προσκόλληση των κυττάρων. Τα προϊόντα τους είναι πιθανόν να ουβικουιτινωμένης ή sumoylated αλλά όχι ακετυλιωμένη. Είναι πιθανό να εμπλέκονται σε μεταγωγή σήματος και είναι ένα συστατικό του εξωκυτταρικού χώρου. Μερικά από τα αναγνωρισμένα χαρακτηριστικά των γονιδίων προστάτη (

π.χ.,

κυτταρικού πολλαπλασιασμού ή αγγειογένεση) είναι προφανείς, ενώ άλλοι (

π.χ.

., Ειδικότητα ιστού, υψηλότερη διακύμανση της γονιδιακής έκφρασης στο παρακείμενο φυσιολογικό προστάτη ιστών, ή ουμπικουιτίνωση) δεν είναι τόσο εμφανής. Επειδή οι πολλοί διαφορετικοί παράγοντες που εμπλέκονται στο διορισμό ενός γονιδίου να καρκίνο του προστάτη που σχετίζονται με, διαφορετικά γονίδια επηρεάζονται από διάφορους παράγοντες πρόβλεψης. Οι προγνωστικοί παράγοντες που αναφέρονται στον πίνακα S5.

Το μοντέλο μας επιτρέπει επίσης κατάταξη των γονιδίων που είναι, σύμφωνα με το μοντέλο που δημιουργείται αποδείξεις, προστάτη που σχετίζονται και συνεπώς πρόβλεψης των νέων γονιδίων προστάτη. Μια σύντομη περιγραφή των κορυφαίων δέκα νέων προβλέψει γονίδια προστάτη εξής

UPK3A-

uroplakin 3Α.? ένα μέλος της οικογένειας uroplakin, μια ομάδα διαμεμβρανικών πρωτεϊνών που σχηματίζουν σύμπλοκα στην κορυφαία επιφάνεια του επιθηλίου της ουροδόχου κύστης. Μεταλλάξεις στο

Οι UPK3A

σχετίζεται με νεφρική adysplasia [20].

KITLG-

κωδικοποιεί το συνδέτη του υποδοχέα τυροσινικής κινάσης. Το γονίδιο πιστεύεται ότι παίζει ένα ρόλο στην κυτταρική μετανάστευση [21].

NPY-

εκφράζονται ευρέως στο κεντρικό νευρικό σύστημα και επηρεάζει πολλές φυσιολογικές διεργασίες, συμπεριλαμβανομένης της διεγερσιμότητας του φλοιού, αντίδραση στο στρες, τα τρόφιμα πρόσληψης, κιρκαδικούς ρυθμούς, και την καρδιαγγειακή λειτουργία.

GHR-

μέλος του τύπου Ι κυτοκινών οικογένεια υποδοχέων.

SCGB1A-

μέλος η secretoglobin οικογένεια μικρών εκκρινόμενων πρωτεϊνών. Η κωδικοποιημένη πρωτεΐνη έχει ενοχοποιηθεί σε πολυάριθμες λειτουργίες, συμπεριλαμβανομένων των αντι-φλεγμονή, αναστολή της φωσφολιπάσης Α2, και απομόνωσης των υδρόφοβων συνδετήρων.

NR3C1-

κωδικοποιεί τον υποδοχέα γλυκοκορτικοειδών, η οποία μπορεί να λειτουργήσει τόσο ως ένας μεταγραφικός παράγοντας και ένας ρυθμιστής άλλων παραγόντων μεταγραφής.

JUP-

κωδικοποιεί μια πρωτεΐνη που είναι ένα δομικό στοιχείο του υπομεμβρανώδης πλακών των δεσμοσωμάτων. Σχηματίζει σύμπλοκα με καντερίνες.

NPM1-

κωδικοποιεί μια φωσφοπρωτεΐνη που κινείται μεταξύ του πυρήνα και του κυτταροπλάσματος. Το γονίδιο προϊόν θεωρείται ότι εμπλέκονται σε διάφορες διεργασίες, συμπεριλαμβανομένης της ρύθμισης του μονοπατιού /p53 ΤΑΠ.

CD177-

NB1, ένα γλυκοζυλο-συνδέονται

Ν

-glycosylated κυτταρικής επιφάνειας γλυκοπρωτεΐνη, περιγράφηκε για πρώτη φορά σε μια περίπτωση ουδετεροπενίας νεογνών αλλοάνοσο [22].

FAM55D-

χρωμόσωμα 11 ανοικτό πλαίσιο ανάγνωσης 33. Λίγα είναι γνωστά για αυτό το γονίδιο, αλλά είναι μειωτικά σε όγκο του προστάτη.

Διενεργήσαμε λειτουργική σχολιασμό των νέων γονιδίων προστάτη με τη χρήση όλων 15.348 γονίδια ως φόντο να λογοδοτήσουν για πιθανή μεροληψία της επιλογής. Για τη λειτουργική σχολιασμό, χρησιμοποιήσαμε τη βάση δεδομένων για το σχολιασμό, Οπτικοποίηση, και Ολοκληρωμένη Discovery (David) [23]. Τα κορυφαία βιολογικές λειτουργίες που σχετίζονται με τα νέα γονίδια PCa ήταν αντιαποπτωτικές, ρύθμιση του κυτταρικού πολλαπλασιασμού, θετική ρύθμιση της δραστικότητας κινάσης, θετική ρύθμιση της δραστικότητας τρανσφεράσης, αγγειογένεση, θετική ρύθμιση της κυτταρικής διαίρεσης, κυτταρικής προσκόλλησης, ΜΑΡΚΚΚ καταρράκτη, την ανάπτυξη των οστών, και ρύθμιση της κυτταρικού εντοπισμού. (Περισσότερες πληροφορίες μπορείτε να βρείτε στο σχετικό πληροφοριακό στοιχείο.) Υπάρχει σημαντική επικάλυψη μεταξύ της περιγραφής του γνωστού και νέων προβλέψει τις λειτουργίες των γονιδίων του προστάτη »: αντιαποπτωτικές, ρύθμιση του κυτταρικού πολλαπλασιασμού, θετική ρύθμιση της δραστικότητας κινάσης, θετική ρύθμιση της δραστηριότητας της, και ΜΑΡΚΚΚ καταρράκτη είναι παρούσες και στις δύο λίστες. Η μόνη μοναδική λειτουργία που σχετίζεται με τα προβλεπόμενα νέα γονίδια του προστάτη ήταν ανάπτυξης των οστών σε δέκα γονίδια:

GHR, AMELX, TRAF6, FGF9, SMAD1, CTGF, IGF2, ΑΜΒΝ, FGF18,

και

ΡΤΝ

.

Τα αποτελέσματα της εσωτερικής επικύρωσης έδειξε ότι προστάτη που σχετίζονται με τα γονίδια δεν είναι μια τυχαία συλλογή των γονιδίων, αλλά μάλλον μοιράζονται ένα συνδυασμό πολλών χαρακτηριστικών. Μπορούν επίσης να αποδείξει ότι είναι απίθανο να overfit το μοντέλο. Εξωτερικές επικύρωσης έδειξε ότι το μοντέλο που δημιουργείται πιθανότητα να είναι ένα γονίδιο PCA είναι η πιο σημαντική ικανότητα πρόβλεψης των υποψηφίων προστάτη που προσδιορίζονται μέσω της ανάλυσης των επαναλαμβανόμενων σωματικών μεταλλάξεων. Από την άλλη πλευρά, η παρουσία των σωματικών μεταλλάξεων σε δείγματα όγκων μπορεί να είναι ένας από τους παράγοντες που ανεβάζουν την CS και, κατά συνέπεια, να συμβάλλει στην υψηλότερη πιθανότητα να χαρακτηρισθεί ως ένα γνωστό γονίδιο PCa. Πράγματι, το CS ήταν η τρίτη πιο σημαντικός προγνωστικός δείκτης των γονιδίων με επαναλαμβανόμενες σωματικές μεταλλάξεις. Ωστόσο, αυτό ήταν χαμηλότερο από το

t

στατιστική για το μοντέλο που δημιουργείται πιθανότητα να είναι ένα γονίδιο του προστάτη:. 5.5

vs

3.4. Η αναλογία των γονιδίων με την κοσμική σωματικές μεταλλάξεις ήταν υψηλότερη μεταξύ των υποθετικών γονιδίων προστάτη: χ

2 = 22,8, df = 1,

σ

& lt? 0,0001. Το ποσοστό αυτό ήταν οριακά υψηλότερο για τις προβλεπόμενες νέα γονίδια προστάτη: χ

2 = 3,8, df = 1,

σ

= 0.05. Βρήκαμε επίσης ότι η μέση μοντέλο προερχόμενο πιθανότητα των δημοσιευμένων 112 γονίδια με μια υπογραφή θετικής επιλογής [24] ήταν υψηλότερη από εκείνη της μέσης γονίδιο στο ανθρώπινο γονιδίωμα: του Student

t

δοκιμής = 2,0, df = 30.495,

σ

= 0.04. Η επικάλυψη είναι μικρή, αλλά σημαντική, ειδικά αν λάβουμε υπόψη το γεγονός ότι η δημοσιευμένη λίστα με τα γονίδια του καρκίνου δημιουργήθηκε για οποιονδήποτε τύπο καρκίνου, ενώ στη μελέτη μας επικεντρώθηκε σε προστάτη μόνο. ​​

Έχουμε αποδείξει ότι οι δύο αυτές ειδικές και μη ειδική προγνωστικοί παράγοντες είναι σημαντικοί: μοντέλα που βασίζονται μόνο σε ειδικές ή μη ειδικές μόνο προγνωστικοί παράγοντες είναι λιγότερο αποτελεσματική από ό, τι το μοντέλο χτισμένο σε συνδυασμό των χαρακτηριστικών. Το συγκεκριμένο μοντέλο προγνωστικός δείκτης που βασίζεται είναι πιο ειδικό προστατικό από ό, τι είναι το μοντέλο που βασίζεται σε μη ειδικές προγνωστικούς παράγοντες.

Είναι προφανές ότι η δομή του μοντέλου πρόβλεψης εξαρτάται σε μεγάλο βαθμό από το σύνολο εκπαίδευσης. Χρησιμοποιήσαμε έναν ευρύ ορισμό του προστάτη με τα ακόλουθα δευτερεύοντα όρους: καρκινικών κυττάρων του προστάτη, τον κίνδυνο εμφάνισης καρκίνου του προστάτη, Gleason, ανδρογόνο-ανεξάρτητες, προστάτη νεοπλάσματα, σκορ Gleason, προστατεκτομή, μεταστατικό προστάτη, του ανθρώπινου καρκίνου του προστάτη, ριζική προστατεκτομή, ανδρογόνο-ανεξάρτητες προστάτη, advanced προστάτη, προστάτη-ειδικό αντιγόνο, πρωτοβάθμια προστάτη, καλοήθης του προστάτη, όγκους του προστάτη, του προστάτη-ειδική, καρκινογένεση προστάτη και καλοήθους προστατικής. Παρά το γεγονός ότι στη σημερινή του μορφή το μοντέλο έχει σχεδιαστεί για να προβλέψουμε ορίζεται σε γενικές γραμμές τα γονίδια του προστάτη, μπορεί να ρυθμιστεί για να γίνω πιο συγκεκριμένος? για παράδειγμα, για την πρόβλεψη γονιδίων PCA-εξέλιξη. Το κρίσιμο στοιχείο εδώ είναι να καθορίσει ένα αξιόπιστο σύνολο εκπαίδευσης για τα γονίδια του προστάτη συνδέεται με την εξέλιξη του καρκίνου.

Το μοντέλο BLR είναι ένα από τα πολλά διαθέσιμα αλγορίθμων ταξινόμησης. Για να δούμε αν άλλες μέθοδοι ταξινόμησης θα μπορούσαν να παράγουν παρόμοια αποτελέσματα, αναλύσαμε επίσης τα δεδομένα μας, χρησιμοποιώντας γραμμική διακριτική ανάλυση (LDA) και μηχανές διανυσμάτων υποστήριξης (SVM). Βρήκαμε ότι η LDA και BLR έχουν μάλλον παρόμοια απόδοση των κατάταξη: 51% και 55% ταξινομηθεί σωστά γονίδια προστάτη με 95% και 96% των ταξινομείται ορθώς γονίδια μη-προστάτη, με ουσιαστικά το ίδιο σύνολο των σημαντικών προγνωστικών στο μοντέλο. Επικύρωση ήταν επίσης ελαφρώς καλύτερα για το μοντέλο BLR, με 18% των υποθετικών γονιδίων προστάτη αναμένεται να είναι γονίδια του προστάτη, σε σύγκριση με 22% για το μοντέλο LDA. Σε σύγκριση με την BLR, η SVM ήταν πιο αποτελεσματική στο σύνολο ανακάλυψη, σωστή πρόβλεψη 84% των γνωστών γονιδίων του προστάτη και 95% των γονιδίων μη-προστάτη? Ωστόσο, στην επικύρωση, θα προβλέψει σωστά μόνο το 34% των γονιδίων προστάτη, ενώ το μοντέλο BLR προβλέψει σωστά το 46% των γονιδίων PCA σε ανακάλυψη και 44% στο σύνολο επικύρωσης. Λόγω του ότι η καλύτερη απόδοση επικύρωσης, εστιάσαμε στο μοντέλο BLR.

Το επόμενο λογικό βήμα θα ήταν πειραματική επιβεβαίωση των νέων προστάτη υποψηφίους που προσδιορίζονται από το μοντέλο. Πιστεύουμε ότι ένας από τους καλύτερους τρόπους για να γίνει αυτό θα ήταν με μια πλατφόρμα διαλογής υψηλής απόδοσης. Για παράδειγμα, μπορεί κανείς να χρησιμοποιήσει υψηλής απόδοσης διαλογή RNAi κυτταρικών σειρών προστάτη. Μετά φίμωση ενός υποψήφιου γονιδίου με RNAi, μπορεί κανείς να εκτιμήσει την επίδραση του γονιδίου στον κυτταρικό πολλαπλασιασμό, τη μετανάστευση και την απόπτωση. Γονίδια με μια ισχυρή επίδραση σε αυτά σχετίζονται με τον καρκίνο φαινότυποι μπορούν να αναλυθούν περαιτέρω σε ανθρώπινο ιστό για να επιβεβαιώσουν το ρόλο τους στην ογκογένεση του προστάτη.

Εν κατακλείδι, έχουμε αναπτύξει μια βιοπληροφορική με βάση το μοντέλο BLR για την πρόβλεψη των γονιδίων που σχετίζονται με προστάτη. Το μοντέλο επιτρέπει την κατάταξη σε ανθρώπινα γονίδια, σύμφωνα με την πιθανότητά τους να συνδέονται προστάτη. Εντοπίσαμε μια σειρά νέων υποψηφίων προστάτη με υψηλή πιθανότητες να προστάτη που σχετίζονται με, και οι υποψήφιοι μπορούν να αξίζουν περαιτέρω πειραματική επαλήθευση. Η προσέγγιση που χρησιμοποιήσαμε μπορούν επίσης να εφαρμοστούν σε άλλους τύπους γονιδίων και άλλων τύπων καρκίνου? αυτή τη στιγμή εργάζονται με το μοντέλο για την πρόβλεψη της γονίδια του καρκίνου του πνεύμονα.

Υποστήριξη Πληροφορίες

Πίνακα S1.

Τα 707 γονίδια με CS κυμαίνονται 2,663 με 0,001? χρησιμοποιήσαμε στην κορυφή 100 από αυτά τα γονίδια ως

doi «γνωστά γονίδια του προστάτη.»: 10.1371 /journal.pone.0049175.s001

(XLSX)

Πίνακας S2.

Οι 100 κορυφαίες του καρκίνου του μαστού και 100 καρκίνο του πνεύμονα γονίδια που εντοπίστηκαν με τη χρήση της προσέγγισης KnowledgeNet

doi:. 10.1371 /journal.pone.0049175.s002

(DOCX)

Πίνακα S3.

μονοπαραγοντική ανάλυση εντόπισε 22 από τους αρχικούς 33 αρχικές μεταβλητές ως σημαντικοί προγνωστικοί γονιδίων προστάτη

doi:. 10.1371 /journal.pone.0049175.s003

(DOCX)

Πίνακας S4.

Κατάταξη των κορυφαίων 200 γονίδια με το μοντέλο που δημιουργείται πιθανότητα να σχετίζονται με προστάτη. P, υποθετικό γονίδιο του προστάτη? Κ, γνωστό γονίδιο προστάτη? NP, μυθιστόρημα προέβλεψε γονίδιο προστάτη

doi:. 10.1371 /journal.pone.0049175.s004

(DOCX)

Πίνακας S5.

Ατομική συμβάλλοντας μεταβλητές στο μυθιστόρημα προέβλεψε γονίδια του προστάτη. Υπογράμμισε μεταβλητές συμβάλλουν στην υψηλή πιθανότητα για ένα γονίδιο να προστάτη συνδέεται. Για δυαδικές μεταβλητές, θετικά συνεισφέροντες έχουν την τιμή 1? για τις συνεχείς μεταβλητές, προγνωστικοί παράγοντες έχουν μια τιμή υψηλότερη από m + σ, όπου m είναι μια μέση τιμή και σ είναι μια τυπική απόκλιση

doi:. 10.1371 /journal.pone.0049175.s005

(XLS)

Πληροφορίες S1.

Περιγραφή των μεταβλητών που χρησιμοποιούνται για την κατασκευή του μοντέλου πρόβλεψης. Μεταβλητές παρατίθενται με τη σειρά με την οποία παρουσιάζονται στον Πίνακα 1.

doi: 10.1371 /journal.pone.0049175.s006

(DOCX)

You must be logged into post a comment.