PLoS One: Γονιδιώματος Ευρεία αναγνώριση των γονιδίων του καρκίνου Υφεσιακές από Συνδυαστική Μετάλλαξη Ανάλυση


Αφηρημένο

Έχουμε επινοήσει μια νέα διαδικασία για τον εντοπισμό ανθρώπινα γονίδια του καρκίνου ενεργεί με υπολειπόμενο τρόπο. Η στρατηγική μας ήταν να συνδυάσουμε τις συνεισφορές των διαφόρων τύπων των γενετικών αλλοιώσεων σε απώλεια της λειτουργίας: αντικαταστάσεις αμινοξέων, μετατοπίσεις πλαισίου, το γονίδιο διαγραφές. Μελετήσαμε πάνω από 20.000 γονίδια σε 3 Gigabases των ακολουθιών κωδικοποίησης και 700 σειρά συγκριτική γονιδιωματική υβριδοποιήσεις. Υπολειπόμενων γονιδίων βαθμολογήθηκαν σύμφωνα με το νουκλεοτίδιο αναντιστοιχίες υπό θετική επιλεκτική πίεση, μετατοπίσεις πλαισίου και γονιδιωματικών διαγραφές στον καρκίνο. Τέσσερις διαφορετικές δοκιμασίες συνδυάστηκαν μαζί δίδοντας ένα υπολειπόμενο τιμή p καρκίνου για κάθε μελετηθεί γονίδιο. εντοπίστηκαν? εκατόν πενήντα τεσσάρων υποψήφιων υποτελή γονίδια του καρκίνου (1,5 × 10

-7, FDR = 0,39 p-value & lt). Εντυπωσιακά, η πρωτότυπη καρκίνο υπολειπόμενα γονίδια

TP53

,

PTEN

και

CDKN2A

όλα κατατάσσονται στην κορυφή των 0.5% των γονιδίων. Οι λειτουργίες επηρεάζονται σημαντικά από μεταλλάξεις του καρκίνου είναι ακριβώς επικαλυπτόμενες εκείνες των γνωστών γονιδίων του καρκίνου, με την κρίσιμη εξαίρεση για την απουσία κινασών τυροσίνης, όπως αναμένεται για ένα υπολειπόμενο γονίδιο-σετ

Παράθεση:. Volinia S, Mascellani Ν, Marchesini J, Veronese Α, Ormondroyd Ε, Alder H, et al. (2008) Genome Ευρεία αναγνώριση των γονιδίων του καρκίνου Υφεσιακές από Συνδυαστική Ανάλυση μεταλλάξεων. PLoS ONE 3 (10): e3380. doi: 10.1371 /journal.pone.0003380

Επιμέλεια: Μιχαήλ Β Blagosklonny, Ordway Research Institute, Ηνωμένες Πολιτείες της Αμερικής

Ελήφθη: 3, Ιούλ του 2008? Αποδεκτές: 17 του Σεπτεμβρίου 2008? Δημοσιεύθηκε: 10 Οκτωβρίου 2008

Copyright: © 2008 Volinia et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Αυτό το έργο υποστηρίχθηκε από το Πρόγραμμα Πρόγραμμα επιχορήγησης Νο P01CA76259 από το National Cancer Institute (CMC) και με επιχορηγήσεις από AIRC, PRRIITT Regione Emilia Romagna και MIUR (SV)

Αντικρουόμενα συμφέροντα:. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν αντικρουόμενα συμφέροντα υπάρχει.

Εισαγωγή

Μια ποικιλία προσεγγίσεων έχουν εφαρμοστεί στην ταυτοποίηση των γονιδίων του καρκίνου [1]. Οι διαδικασίες έχουν αναπτυχθεί που επέτρεψε ταυτοποίηση του αιτιολογικά γονίδια του κυτταρικού μετασχηματισμού [2], [3], και των πολύπλοκων διαδικασιών, όπως η διεισδυτικότητα και τη μετάσταση [4]. In vitro και in vivo μεθόδους, με τη χρήση κυτταρικών ή ζωικών μοντέλων, οδήγησε γενικά στην ανακάλυψη των κυρίαρχων γονιδίων του καρκίνου, ή ογκογονίδια. Από την άλλη πλευρά, έχουν καταστολείς όγκων ανακαλυφθεί κυρίως από τη γενετική προσεγγίσεις μοριακής. Τέτοια είναι η ανάγκη εντοπισμού πρόσθετων καταστολείς των όγκων, ή υπολειπόμενα γονίδια του καρκίνου, ότι οι νέες δοκιμές για την απώλεια-του-λειτουργία συνεχίσουν να αναπτύσσονται [5].

Πολλά καλά χαρακτηρισμένα γονίδια του καρκίνου λιμάνι σωματικά υποκαταστάσεις βάσεων ή μικρές εισαγωγή /διαγραφές. Για παράδειγμα, περιοχή κωδικοποίησης μετατοπίσεις πλαισίου και σημειακές μεταλλάξεις αντιπροσωπεύουν το 75% των σωματικών μεταλλάξεων σε

CDKN2A

και

ΤΡ53

, δύο σημαντικές ογκοκατασταλτικά γονίδια [6], [7], [ ,,,0],8]. Το ογκογονίδιο

Β-raf

, περιγράφηκε για πρώτη φορά πριν από 20 χρόνια, αποδείχθηκε επίσης να μεταλλαχθεί σε ορισμένες ανθρώπινους καρκίνους [9], παράλληλα με

ΡΙ3Κ

και μερικοί φωσφατάσες τυροσίνης [10]. Εν τω μεταξύ, έχουν άλλα γονίδια του καρκίνου έχουν ανακαλυφθεί μέσω του φαινομένου της κληρονομική προδιάθεση. Η οικογενής καρκίνος είναι σπάνια σε σύγκριση με τον καρκίνο μη κληρονομικές, αλλά ένας αριθμός υπολειπόμενων γονιδίων έχουν ταυτοποιηθεί με χρήση ανάλυσης σύνδεσης [11], [12]. Μεγάλης κλίμακας έργα υπερ-οικογένεια αλληλουχίας, δηλαδή τα έργα kinome και phosphatome, ακολούθησε και έδειξε ότι, αν και οι νοηματικές μεταλλάξεις βρέθηκαν σε ορισμένα μέλη αυτών των δύο υπεροικογένειες, δεν είναι ένα κοινό έδαφος για σωματικές μεταλλάξεις του καρκίνου. Greenman και συνεργάτες [13] ανέλαβε ολοκληρωμένη αλληλουχίας των 518 γονιδίων πρωτεΐνης-κινάση που κωδικοποιεί σε 210 καρκίνους. Οι κινάσες έχουν εμπλακεί σε πολλές πτυχές της ογκογένεσης και αρκετά έχουν τώρα επικυρωθεί ως στόχους για θεραπεία φαρμάκου [14]. Στην ανάλυσή τους για τη συλλογή των κυτταρικές κινάσες, το kinome, Greenman et al. [13] εντοπίστηκαν 1.000 μεταλλάξεις. Μεταλλάξεις ήταν σχετικά κοινά σε καρκίνους του πνεύμονα, του στομάχου, των ωοθηκών, του παχέος εντέρου και των νεφρών, και σπάνια σε καρκίνους των όρχεων και του μαστού, και καρκινοειδείς όγκους, τα οποία βρίσκονται συνήθως στον γαστρεντερικό σωλήνα. Όγκοι με ελαττώματα στην επιδιόρθωση του DNA-αναντιστοιχία έτρεφε μεγάλο αριθμό μεταλλάξεων, ενώ άλλοι τύποι όγκων δεν αποκάλυψε ανιχνεύσιμα μεταλλάξεις. Για να γίνει διάκριση οδηγό από μεταλλάξεις των επιβατών, Greenman et al. χρησιμοποίησαν ένα στατιστικό μοντέλο σύγκριση της παρατηρηθείσας-to-αναμενόμενη αναλογία συνώνυμος (χωρίς αμινοξέων αλλαγή) μεταλλάξεις με εκείνη των μη-συνώνυμη (μεταβληθεί αμινοξύ) μεταλλάξεις. Αυξήθηκε το ποσοστό των μη συνώνυμες μεταλλάξεις συνεπάγεται πίεση επιλογής κατά τη διάρκεια της ογκογένεσης. Συνολικά, εντοπίστηκαν 158 προβλέψει μεταλλάξεις οδηγού σε 120 γονίδια κινάσης. Σε αντίθεση με τις επαναλαμβανόμενες μεταλλάξεις στο

BRAF

σε κακοήθη μελανώματα [15] οι περισσότεροι κινάσης μεταλλάξεις εντοπίστηκαν σε διάφορους τύπους όγκων ήταν, επομένως, μόνο επιτυχίες. Πιο πρόσφατα, το ξύλο και οι συνεργάτες του [16] χρησιμοποίησαν μια διαφορετική στρατηγική, αλλά κατέληξε σε παρόμοια συμπεράσματα, με την πλήρη αλληλούχιση του 20857 μεταγραφές από 18.191 γονίδια σε έναν περιορισμένο αριθμό των όγκων (11 μαστού και του παχέος εντέρου 11). Ο μεγάλος αριθμός των εντοπίζεται αυτόματα μεταλλάξεις του DNA που παρέχονται άμεσα η ακόλουθη ερώτηση: πώς να προσδιορίσει από ένα δυνητικά μεγάλο αριθμό ακολουθίας δεν ταιριάζει με αυτά που είναι αιτιολογικοί της παθογένειας του καρκίνου. Μια σειρά των επόμενων φίλτρων αποκάλυψε ότι οι περισσότεροι από αυτούς ήταν σιωπηλοί (δεν οδήγησε σε αλλαγή αμινοξέων) και ένα παρόμοιο ποσό ήταν πολυμορφισμούς μονών νουκλεοτιδίων (SNPs). Ο τελικός αριθμός των μεταλλάξεων οι οποίες ορίστηκαν ως πραγματικά σωματικά επηρεάζονται περισσότερο από 1000 γονίδια. Είναι ενδιαφέρον, λίγοι μεταλλάξεις κοινή οδηγός ταυτοποιήθηκαν μεταξύ των γονιδίων κινάσης σε αυτές τις μελέτες. Αυτό συνάδει, για παράδειγμα, με τη διαπίστωση ότι μόνο 1 από τα 18 μέλη του

PI3K

οικογένεια είχε

μπορούν να γίνουν σωματικές μεταλλάξεις στον καρκίνο [17]. Ενδιαφέρουσες παρατηρήσεις από μια ακριβή παγκόσμια μελέτη των μεταλλάξεων που αναφέρθηκαν σε καρκίνο. Futreal et al. [18] διεξήγαγε μια τέτοια εκτεταμένη απογραφή από βιβλιογραφία δείχνει ότι όσο 299 γονίδια που συμβάλλουν στον καρκίνο του ανθρώπου. Ωστόσο το 70% από αυτά τα γονίδια σχετίζονται με λευχαιμίες, λεμφώματα και μεσεγχυματικών όγκων, οι οποίες αντιπροσωπεύουν μόνο το 10% των επίπτωσης του καρκίνου. Επιπλέον περίπου 75% των εν λόγω γονιδίων που σχετίζονται με μεταθέσεις, και τουλάχιστον το 90% των εισηγμένων γονιδίων καρκίνου είναι κυρίαρχη σε κυτταρικό επίπεδο (δηλαδή ενεργοποιημένα ογκογονίδια, ογκοπρωτεΐνες σύντηξης). Παρ ‘όλα αυτά, είναι γενικά αποδεκτό ότι η συντριπτική πλειοψηφία των μεταλλάξεων βλαστικής σειράς οδηγεί σε προδιάθεση καρκίνο υποχωρούν [18]. Έτσι, φαίνεται πιθανό ότι τα περισσότερα από τα γονίδια καρκίνο υποχωρούν και παραμένουν ακόμη άγνωστα.

Για τους λόγους αυτούς επινοήσει μια νέα μέθοδο για την ταυτοποίηση των υποψήφιων υπολειπόμενων γονιδίων καρκίνου από σύνολα δεδομένων γονιδιώματος κλίμακας. Εφαρμόσαμε διαδικασία μυθιστόρημα μας με τη δική μου δεδομένα από ακολουθίες και συγκριτική γονιδιωματική υβριδισμούς. Η μέθοδός μας λαμβάνει υπόψη τις διαφορετικές λειτουργίες απενεργοποίηση του γονιδίου, που κυμαίνονται από σημειακές μεταλλάξεις σε όλη την διαγραφές γονιδίου. Η υπόθεση στην οποία βασίζεται η έρευνά μας ήταν ότι, μελετώντας τα γονίδια του καρκίνου από διαφορετικές οπτικές γωνίες μεταλλάξεων και συνδυάζοντας τις αντίστοιχες πιθανότητες, ο θόρυβος αλληλουχίας και πολυμορφισμούς θα μπορούσε να φιλτράρονται και καλόπιστων υπολειπόμενα γονίδια του καρκίνου θα πρέπει να προσδιορίζονται.

Αποτελέσματα

Συγκομιδή υποψήφιος μεταλλάξεις από ESTs

στο έγγραφο αυτό, μία νέα μέθοδος εφαρμόστηκε στην ταυτοποίηση των γονιδίων που μεταλλάσσεται σε μη κληρονομικές ανθρώπινους καρκίνους (Εικόνα 1). Η διαδικασία που συγκεντρώνονται πληροφορίες ακολουθίας από τη βάση δεδομένων ετικέτα ακολουθίας έκφρασης (EST) και ένα κατάλληλο αλγόριθμο ήταν προσαρμοσμένες να εξάγουν πληροφορίες από το «χαμηλής ποιότητας» δεδομένα ακολουθίας. Η διαδικασία ανέλυσε περισσότερο από 3 × 10

9 νουκλεοτίδια της ανθρώπινης αλληλουχίας κωδικοποίησης σε πάνω από 5.600.000 ESTs που λαμβάνονται από υγιείς και καρκινικούς ιστούς και κυτταρικές σειρές. ESTs είναι δυνητικά πολύ πολύτιμη για μελέτες μετάλλαξης, δεδομένου ότι αντιπροσωπεύουν κλωνοποιημένα μόνο αλληλόμορφα, αλλά είναι επίσης ανεπιβεβαίωτες ακολουθίες, με υψηλό ποσοστό λαθών αλληλουχίας [19], [20]. Ως εκ τούτου, προκειμένου να αξιοποιηθεί πλήρως το δυναμικό των ESTs είχαμε να αναπτύξει μια μέθοδο για την ανίχνευση της καλή τη πίστει «καρκίνος» μεταλλάξεις σε ένα πλαίσιο συχνά σφάλματα αλληλουχίας ή, στην καλύτερη περίπτωση, πολυμορφισμοί. Αν και προηγούμενες εργασίες [19] επιχειρεί να εκτιμήσει το ποσοστό σφάλματος αλληλουχίας σε ESTs, ακολουθήσαμε μια εναλλακτική διαδρομή. Η διαδικασία μας βασίζεται στην παραδοχή ότι ο ρυθμός σφαλμάτων αλληλούχισης ήταν σταθερή για κάθε ανθρώπινο γονίδιο, σε κάθε θέση νουκλεοτιδίου. Ως επιστέγασμα, υποθέτουμε ότι το «γονίδιο /ποσοστό σφάλματος αλληλουχίας θέση-ειδική» ήταν σταθερή σε όλη την κανονική και καρκίνο βιβλιοθήκες EST. Από τη σύνθεση βάσης, το πλαίσιο και η ακολουθία είναι εξ ορισμού σταθερά σε κάθε διαφορετικό ανθρώπινο γονίδιο, πιστεύαμε αυτές οι υποθέσεις ήταν ασφαλείς. Μόνες εξαιρέσεις θα είναι λόγω των όγκων που φέρουν ελαττώματα επιδιόρθωση του DNA.

Το διάγραμμα δείχνει τα βήματα της διαδικασίας για την αξιολόγηση των πιθανοτήτων μετάλλαξης και τα δεδομένα που ρέουν προς την ταυτοποίηση των υποψήφιων υπολειπόμενα γονίδια του καρκίνου. Μοριακά δεδομένα αυτά προέρχονται από δημόσιες βάσεις δεδομένων (dbEST και GEO στο NCBI, και του Στάνφορντ Microarray Database). Ελήφθη ένα πολύ μεγάλο αριθμό ευθυγραμμίσεις (πάνω από 4,5 εκατομμύρια) για πάνω από 24.000 ανθρώπινα γονίδια από την ανάλυση BLAST 3 Gbases των αλληλουχιών EST. Οι ευθυγραμμίσεις είχαν αναλυθεί για να εξαγάγετε τις αναντιστοιχίες που κατατέθηκαν στο Καρκίνο Mutome τοπική βάση δεδομένων SQL. Οι αναντιστοιχίες στη συνέχεια αξιολογήθηκαν από συγκεκριμένες διαδικασίες να συνδέσει μεταλλακτικές ρ-τιμές σε κάθε ανθρώπινο γονίδιο. Παράλληλα, σχεδόν 20.000 ανθρώπινα γονίδια αναλύθηκαν από 744 array CGH να καθορίσουν τάσης τους να διαγραφή στον καρκίνο. Οι ειδικές μεταλλάξεων τιμές ρ συνδυάστηκαν για να παραχθεί ένα υπολειπόμενο τιμή ρ καρκίνου. Ένα γονιδίωμα υποσύνολο των 154 γονιδίων, μεταξύ των οποίων και

TP53

,

PTEN

,

CDKN2A

και

CDKN2B

ήταν παρόντες, επιλέχθηκε (τιμή p & lt καρκίνο ?. 1.5 × 10

-7)

η

Υψηλή θόρυβο αλληλουχίας αναμένεται να είναι παρόντες στην ετερογενή βάση δεδομένων EST και ο καρκίνος είναι μια σύνθετη πολύπλευρη γενετική ασθένεια, ως εκ τούτου, μια ενιαία στατιστική δοκιμή θα δεν οδηγούν σε αξιόπιστες επιλογή των γονιδίων του καρκίνου. Επιπλέον, θα θέλαμε να επικεντρωθεί στην υποτελή γονίδια, αδρανοποιείται από τα συμβαίνουν γεγονότα. Έτσι, για προσδιορισμό των διαφόρων μεταλλάξεων μέσα υπολειπόμενο γονίδιο καρκίνου, εμείς επομένως επινοήσει μια σειρά μεταλλάξεων δοκιμών. Οι στατιστικές δοκιμές τελικά συνδυάζονται για τον εντοπισμό των γονιδίων που συχνά αδρανοποιούνται σε καρκίνο.

Ξεκινώντας από το αποθετήριο ανθρώπινο mRNA REFSEQ, 27184 ακολουθίες (ορίζεται Ερωτήματα) ευθυγραμμίστηκαν σε περισσότερα από 5,6 εκατομμύρια ανθρώπινες αλληλουχίες EST, από 7574 διαφορετικές βιβλιοθήκες EST, για ένα σύνολο σχεδόν 3,0 Gbases του κωδικοποιητική αλληλουχία. Εκρήξεις [21] έτρεξαν για κάθε ερώτημα έναντι των ESTs και 3.839.543 επιτυχημένη ευθυγραμμίσεις παρήχθησαν (αποθηκεύονται στο Ευθυγραμμίσεις SQL πίνακα της βάσης δεδομένων του Καρκίνου Mutome) για 24.932 ανθρώπινα ερωτήματα (Στατιστικά πίνακα της βάσης δεδομένων). Κατά μέσο όρο 150 επισκέψεις (ζεύγη υψηλή βαθμολογία, HSP. Ή αλληλουχίες) παρήχθη για κάθε ερώτημα (ανθρώπινο γονίδιο ή παραλλαγή ματίσματος). Ο ποιοτικός έλεγχος των ευθυγραμμίσεις BLAST ήταν η κορυφαία σημασία για τη στρατηγική μας. Προκειμένου να ελαχιστοποιηθεί η εξόρυξη των τεχνικών σφαλμάτων ορίσαμε ένα αυστηρό όριο για την ποιότητα της ευθυγράμμισης (expect≤1E-21) και τα χαμηλά άκρα ποιότητα ευθυγραμμίσεις απορρίφθηκαν. Όλα (43.965.904) νουκλεοτίδιο αναντιστοιχίες και τα κενά /προσθήκες, καταγράφηκαν στον πίνακα Μεταλλάξεις της βάσης δεδομένων. Αμινο οξύ (ΑΑ) και την πρόωρη υποκαταστάσεις στάσεις (33.614.754 αναντιστοιχίες) στη συνέχεια επιλέγεται από τις ευθυγραμμίσεις (πίνακας AA_Mutation). Για να μειώσετε την πολυπλοκότητα και τον αναμενόμενο αριθμό των ψευδώς θετικών, αποφασίσαμε να αξιολογηθεί μόνο εκείνα τα γονίδια με υψηλό αριθμό αναντιστοιχίες (ανεξάρτητα από το καθεστώς του καρκίνου δείγματα). Ως εκ τούτου, ένα προ-επεξεργασίας με βάση ενδοτεταρτημοριακό εύρος (IQR) εφαρμόστηκε και 8.972 γονίδια (ΙΟΚ υψηλότερη από 0,5) κρατήθηκαν για περαιτέρω αναλύσεις μετάλλαξης του καρκίνου. Τα γονίδια αυτά ήταν αρκετά πλούσια σε υποθετικές μεταλλάξεις (οι αναντιστοιχίες) να εκπληρώσει το ρόλο των πιθανών υποψηφίων γονίδιο του καρκίνου.

Το πρώτο συστατικό της στρατηγικής μας ήταν η αναγνώριση των γονιδίων που φέρουν την αδρανοποίηση σημειακές μεταλλάξεις. Αξιολογήσαμε τις μεταλλάξεις σημείου σύμφωνα συχνότητα, τη θέση, την ικανότητα να μεταβάλλουν την αλληλουχία αμινοξέων, και τις συνέπειες επί του πλαισίου ανάγνωσης. διαδικασία μας έτσι προσαρμοσμένες για να εξετάσει στατιστικά όλα τα παραπάνω χαρακτηριστικά μιας μετάλλαξης σημείο.

Η εξόρυξη δεδομένων για υποκαταστάσεις αμινοξέων και πρόωρη λήξη

Εμείς ορίζεται PAA ως η πιθανότητα ότι ένα γονίδιο εμφανίζει μια περίσσεια υποκαταστάσεις αμινοξέων σε καρκίνο σε σύγκριση με μη δείγματα καρκίνου. pNSSR, αντ ‘αυτού, υποδεικνύει την πιθανότητα ότι οι σημαντικές υποκαταστάσεις αμινοξέων στα δείγματα καρκίνου είναι υπό θετική πίεση επιλογής. Για την ανίχνευση μικρής εμβέλειας ομαδοποίηση των μεταλλάξεων του καρκίνου, συχνά σε καρκίνο υπολειπόμενων γονιδίων, και να ισορροπήσει το θόρυβο, δηλ σφαλμάτων αλληλούχισης, επιλέξαμε ένα αντιστοιχισμένο t τεστ συνδέεται με ένα συρόμενο παράθυρο. Εμείς ομαλοποιηθεί τις μετρήσεις των αναντιστοιχιών στα δύο τάξεις, ο καρκίνος και ελέγχου, με τη χρήση ενός γονιδίου ειδικού και η θέση συγκεκριμένο συντελεστή. Null μετράει αναντιστοιχία προσαρμόστηκαν στην ενότητα, πριν από την κανονικοποίηση. Οι τιμές ομαλοποίηση ελήφθησαν, για κάθε γονίδιο και σε κάθε θέση νουκλεοτιδίου, όπως τα τοπικά αναλογίες των αλληλουχία νουκλεοτιδίων στα καρκινικά και ελέγχου δείγματα. Το paired t test (καρκίνος έναντι του ελέγχου, σε συνδυασμό για κωδικόνια) εφαρμόστηκε σε ένα συρόμενο παράθυρο με ένα μήκος 25 κωδικόνια. Για να εκτελέσει μια ισχυρή δοκιμασία ένα κωδικόνιο αξιολογήθηκε μόνο όταν ευθυγραμμίζεται τουλάχιστον 10 φορές σε κάθε κατηγορία (καρκίνος και ελέγχου). Gene ειδικά όρια εμπιστοσύνης για Τ βαθμολογίες, όπου παράγεται από bootstrap ανάλυση και ένα π-οριακή τιμή των 0,05 χρησιμοποιήθηκε για να επιλέξετε τις σημαντικές θέσεις αμινοξέων. Για κάθε ανθρώπινο γονίδιο, μια ρ-τιμή (ΡΑΑ) τελικά σχετίζεται με το άθροισμα των κορυφών που αντιστοιχούν στις σημαντικές βαθμολογίες Τ. Μια αναντιστοιχία ακολουθία καταγράφηκε μόνο μία φορά για κάθε βιβλιοθήκη EST.

Μια υπερεκτίμηση του ΠΑΑ θα μπορούσε να οφείλεται σε μεταλλάξεις των επιβατών, όπως αυτά που παράγονται από την αλλοιωμένη συστήματα επιδιόρθωσης του DNA, που επικρατεί σε κάποια καρκίνο. Δεδομένου ότι οι μεταλλάξεις των επιβατών πρέπει να κατανέμονται τυχαία πάνω στο γονιδίωμα, ένα πρόσθετο τεστ, συνεπώς, σε εφαρμογή για να βελτιώσετε την PAA. Η αναλογία του μη συνώνυμες (NS) για να συνώνυμες μεταλλάξεις του DNA (S) είναι ένα μέτρο της επιλεκτικής πίεσης κατά τη διάρκεια της προόδου του όγκου, ως συνώνυμος μεταβολές είναι απίθανο να ασκήσουν πλεονέκτημα ανάπτυξη και θα χαθεί επιλεκτικά [17]. Επιπλέον, οι αναντιστοιχίες λόγω σφαλμάτων αλληλούχισης, καθώς και διαφορική αναπαράσταση (καρκίνος στην κανονική διαφορική έκφραση), όλα αναμένεται να είναι ουδέτερος σε σχέση με τα NS αναλογία S. Τα κωδικόνια σημαντικές για υποκαταστάσεις αμινοξέων (ρ & lt? 0,05) ως εκ τούτου αναλύθηκαν για θετική πίεση. Ως έννοια απόδειξη της, οι αναλογίες NS /S στο

TP53

μεταλλαγμένη περιοχή αναλύθηκαν με paired t test (ρ & lt? 0.033, FDR = 0.092) και αποκάλυψε υψηλότερες τιμές στον καρκίνο από ό, τι στον έλεγχο. Έτσι εφαρμόσαμε τις NS για δοκιμή αναλογία S για κάθε γονίδιο, σε σειρά μετά από αυτό για την τοπική συχνότητα μετάλλαξης (ΡΑΑ) που περιγράφεται παραπάνω. Εκκίνησης και πάλι χρησιμοποιείται για να καθορίσει τις p-τιμές. Η πιθανότητα μιας πρωτεΐνης του καρκίνου που έχει αλλαγές συχνές αμινοξέων (ΡΑΑ) συζευγμένο με επιλεκτική θετική πίεση στον καρκίνο (pNSSR), δύο γεγονότα που δεν είναι ανεξάρτητες, ορίστηκε ως ο μέσος όρος των δύο αντίστοιχων ρ-τιμές (ΡΑΑ-NSSR).

η εξόρυξη δεδομένων για μετατοπίσεις πλαισίου στην ESTs καρκίνο

Έχοντας ορίσει για κάθε ανθρώπινο γονίδιο μια τιμή p για αντικαταστάσεις αιτιώδη αμινοξέων σε σποραδικούς καρκίνους, χρειαζόμασταν ένα αντίστοιχο δείκτη για γονιδιακή απενεργοποίηση λόγω ανοικτό πλαίσιο ανάγνωσης μετατοπίζεται σε εξώνια. γονίδια του καρκίνου μπορούν να διασπαστούν με μικρο-ενθέσεις ή -deletions σε αλληλουχία κωδικοποίησης τους, καταλήγοντας σε ένα αλλαγμένο πρωτοταγή δομή. Μια μεγάλη έρευνα του γονιδιώματος της βάσης δεδομένων αναντιστοιχία μας έδειξε ότι μόνο νουκλεοτίδιο αλλοιώσεις ήταν μακράν τα πιο κοινά προσθήκες /διαγραφές σε ESTs. Εμείς υποδεικνύεται με pFrameshift την πιθανότητα ότι ένα γονίδιο είχε μια περίσσεια μετατοπίσεις πλαισίου, λόγω διαγραφές μονού νουκλεοτιδίου /ενθέσεις στον καρκίνο, σε σύγκριση με τον έλεγχο ιστούς. Ελέγξαμε την υπόθεση ότι αυτές οι μεταλλάξεις ήταν συχνές στα γονίδια του καρκίνου, με τη μελέτη και πάλι

TP53

. δοκιμασία μας έδειξε ότι μόνο νουκλεοτίδιο μετατοπίσεις πλαισίου που σχετίζεται με τον καρκίνο ήταν μη-τυχαία εμπλουτισμένο σε

TP53

. Όταν ψάχνετε για μετατοπίσεις πλαισίου που προκαλείται από 1 νουκλεοτίδιο προσθήκες /διαγραφές, μια ανάλογη δοκιμασία με εκείνη για PAA σχεδιάστηκε, όπως περιγράφεται στις πειραματικές μεθόδους, για να δημιουργήσει pFrameshift.

Αναγνώριση διαγράφονται γονιδίων στον καρκίνο από συστοιχία υψηλής ανάλυσης συγκριτική γονιδιωματική υβριδισμού

γονίδια του καρκίνου μπορεί να επηρεαστεί σε γονιδιωματική δομή τους από τις μεγάλες ενισχύσεις και τις διαγραφές. Τα υπολειπόμενα γονίδια του καρκίνου αναμένεται να διαγραφούν ή άλλως αδρανοποιημένο και αυτό συστατικό πρέπει να περιλαμβάνεται στο μεταλλακτική μοντέλο μας. Ως εκ τούτου, αποδίδεται σε κάθε ανθρώπινη p-τιμές γονίδιο για τη διαγραφή του καρκίνου. Για να λάβουν τέτοιες τιμές p, έχουμε συγκεντρωτικά στοιχεία από το υψηλής ανάλυσης συγκριτική γονιδιωματική υβριδισμοί 744 όγκων στη βάση δεδομένων Geosoft. Χρησιμοποιήσαμε array CGH (aCGH), που λαμβάνεται από GEO (NCBI) και SMD (Stanford μικροσυστοιχιών Database), με αρκετά υψηλή ανάλυση να διακρίνει τα ανθρώπινα γονίδια (πληροφορίες για τα δείγματα και σύνολα δεδομένων στον συμπληρωματικό πίνακα S1). Κάθε δείγμα όγκου συγκρίθηκε με ένα υγιές δείγμα ελέγχου σε μια πλατφόρμα με βάση ολιγονουκλεοτίδιο δύο καναλιών. Τα ανθρώπινα γονίδια αξιολογήθηκαν σε κάθε δείγμα με τη χρήση της κανονικοποιημένης αναλογίας log2 (όγκος πάνω ελέγχου). Διαφορετικοί ανιχνευτές που συνδέονται με το ίδιο γονίδιο τέθηκαν στον μέσο όρο. σύμβολα γονιδίου χρησιμοποιήθηκαν ως κλειδιά για να προσδιορίσουν με βεβαιότητα ένα γονίδιο μέσα και σε όλες τις πλατφόρμες. Τα δεδομένα ομαλοποιήθηκαν σύμφωνα με τους παρόχους. Ως ένα βήμα προ-επεξεργασίας μειώσαμε την πολυπλοκότητα δοκιμασία διατηρώντας μόνο εκείνα τα γονίδια με υψηλή μεταβλητότητα (τυπική απόκλιση του

2 log αναλογία & gt? 0,2). Στη συνέχεια, για κάθε γονίδιο υπολογίσαμε τις εκατοστημόρια του ημερολογίου

2 αναλογίες (μόνο για τα γονίδια που μετράται σε τουλάχιστον 300 δείγματα). Ένα γονίδιο που πλήττονται από τις διαγραφές σε όγκους, θα έχουν μια χαμηλή (αρνητική) log

2 αναλογία 5

thpercentile, ενώ ένα με ενισχύσεις θα εμφανίσει υψηλή (θετική) 95

ο εκατοστημόριο.

bootstrap ανάλυση (τυχαία εναλλαγή μεταξύ των καναλιών του όγκου και ελέγχου) χρησιμοποιήθηκε για την προσομοίωση γονίδιο συγκεκριμένες 5

ου και 95

ου εκατοστημόρια. Στη συνέχεια, το γονίδιο ειδικού ρ-τιμές για τις διαγραφές (pDeletion) τελικά υπολογίζεται ως το ποσοστό των προσομοιωμένων 5

ου εκατοστημόριο υπερβαίνει το πραγματικό 5

ου εκατοστημόρια. Σε αυτό το στάδιο, θα έπρεπε να λάβει υπόψη δύο φαινόμενα, που σχετίζονται με aCGH, αλλά δεν συνδέονται με τον καρκίνο: φυλετικά χρωμοσώματα και πολυμορφικές παραλλαγές διαρθρωτικές αριθμό αντιγράφων (CNVs). Το δείγμα ελέγχου aCGHs ήταν συχνά από τα αρσενικά (πάνω από το 50% των aCGHs), ενώ περίπου οι μισοί από τους όγκους ήταν της γυναικείας προέλευσης και συνεπώς δεν είχαν το Υ χρωμόσωμα. Ως εκ τούτου, ήταν τα γονίδια του χρωμοσώματος Υ αναμένεται να εμφανιστεί ως διαγραφεί, ή καλύτερα «ψευδο-διαγραφή». Αντιστρόφως, περιμέναμε τα γονίδια χρωμόσωμα Χ, εκτός από εκείνα που ανήκουν στην ψευδο-αυτοσωματικό περιοχή, να εμφανίζεται ως «ψευδο-ενισχυμένο». Γονίδια που βρίσκονται στα χρωμοσώματα του φύλου πράγματι συμπεριφέρθηκαν σωστά, όπως φαίνεται λεπτομερώς για την ψευδο-αυτοσωματικό περιοχή 1 (PAR1) σε Xp22 (συμπληρωματική Εικόνα S1). Πολυμορφικό CNVs, από την κανονική διακύμανση του πληθυσμού και δεν συνδέονται με τον καρκίνο, θα πρέπει επίσης να οδηγήσει σε μεγάλες πολλαπλές μεταβολές, με αποτέλεσμα υψηλό 95

ου ή χαμηλές 5

ου εκατοστημόρια. Ωστόσο, αναμένεται ότι τα πολυμορφικά CNVs, που δεν συνδέονται με τον καρκίνο, δεν θα εμφανίσει σημαντικές αξίες pDeletion. Στην πραγματικότητα 5

ου εκατοστημόρια τους δεν θα μπορούσε να χαρακτηρισθεί ως σημαντική μετά την τυχαία προσομοίωση swap.

CDKN2A

και

CDKN2B

αναγνωρίστηκαν ως οι πιο διαγράφεται γονίδια σε καρκίνους του ανθρώπου?

PTEN

,

ATM

, και

TP53

επίσης αναγνωριστεί ως διαγραφεί (τιμές p & lt? 0.001). Τρεις χιλιάδες τριακόσια εβδομήντα τέσσερα γονίδια διαγράφηκαν σημαντικά (p & lt? 0.001)

Συνδυασμός μετάλλαξη αναλύει:. Τα γονίδια υποψήφια υπολειπόμενο καρκίνο

Τα γονίδια του καρκίνου επηρεάζονται από διαφορετικούς τύπους σημειακών μεταλλάξεων και του χρωμοσωμικές ανωμαλίες. Ορίσαμε ένα υποψήφιο γονίδιο του καρκίνου ως υπολειπόμενο, όταν επηρεάζεται από μεταλλάξεις που οδηγούν δυνητικά σε απώλεια της λειτουργίας? δηλαδή όταν μεταλλάσσονται συχνά στον κωδικοποιητική περιοχή του και συχνά μεταβάλλονται σε γονιδιωματική δομή της, ιδίως διαγράφονται. Ο συνδυασμός των πολλών δοκιμών διαφορετικές γονιδίωμα παρήγαγε μια τιμή p για υπολειπόμενα γονίδια του καρκίνου. Το υπολειπόμενο γονίδιο του καρκίνου (pRecessiveCancer) p-αξία ορίστηκε ως το γινόμενο των τριών τιμές p (PAA-NSSR, pFrameshift, pDeletion). Εκατόν πενήντα τεσσάρων ανθρώπινα γονίδια περιλήφθηκαν στον τελικό κατάλογο υποψήφιων γονιδίων μετά εκτελέστηκε ανάλυση συνδυαστική μετάλλαξη (pRecessiveCancer & lt? 1.5 × 10

-7). Ο αριθμός του καρκίνου υπολειπόμενων γονιδίων σε μια προσομοίωση με τυχαία σύνδεση των τεσσάρων δοκιμές μετάλλαξης ήταν 60,5 (ψευδώς ποσοστό ανίχνευσης 0,39). Η επιλογή από την συνδυαστική προσέγγιση φάνηκε να είναι συγκεκριμένες, δεδομένου ότι τρεις κλασικές υπολειπόμενα γονίδια του καρκίνου,

TP53

(16

ου θέση),

PTEN

(92

ου) και

CDKN2A

(135

ου) ανιχνεύθηκαν. Όταν συγκρίναμε τον υποψήφιο γονίδιο-οριστεί σε ολόκληρο το γονιδίωμα, καμία σημαντική προκατάληψη προέκυψε προς το μέγεθος του γονιδίου και των διαρθρωτικών πολυμορφισμούς, όπως αναμενόταν από ένα καλά συμπεριφέρθηκε στατιστική διαδικασία. Οι υπολειπόμενο μεγέθη γονίδιο του καρκίνου δεν διέφερε σημαντικά από εκείνη του συνόλου του ανθρώπινου γονιδιώματος (συμπληρωματική Εικόνα S2). Όταν θεωρείται αντίγραφο παραλλαγές αριθμό, ο καρκίνος γονίδιο-set περιείχε 15 πολυμορφικές CNVs (15/154 ή 10%), ενώ το 13,6% όλων των γονιδίων άνοιξε για pDeletion περιείχαν τουλάχιστον ένα CNV. Αυτή η διαφορά στην αναλογία δεν ήταν σημαντική (p & gt? & Gt? 0,05), γεγονός που υποδηλώνει ότι δεν υπήρχε ψευδής εμπλουτισμού για CNVs με τη μέθοδο μας, όπως αναμενόταν από το σχεδιασμό του αλγορίθμου

Γονιδιακή οντολογία και λειτουργική ανάλυση

Οι μηχανισμοί και οι λειτουργικές πορείες που σχετίζονται με τον καρκίνο υπολειπόμενων γονιδίων αξιολογήθηκαν στατιστικά. Ο εμπλουτισμός με Gene Ontology (GO) όρους αξιολογήθηκε με τη χρήση ευκολία, σε https://david.abcc.ncifcrf.gov. Οι βιολογικές διαδικασίες επηρεάζονται σημαντικά στο σύνολο γονιδίων του καρκίνου που αναφέρονται στον συμπληρωματικό πίνακα S2. Οι σημαντικών όρων GO ομαδοποιούνται από την ευκολία λειτουργική ομαδοποίηση ήταν: ATP /δέσμευσης του κυτταρικού κύκλου νουκλεοτιδίων, κυτταρικό θάνατο /απόπτωση,, μιτοχόνδριο, δεσμευτική RNA, μεθυλίωση, ογκοκατασταλτικό, το μεταβολισμό του DNA και επιδιόρθωση του DNA (ΕΑΣΕ βαθμολογίας εμπλουτισμού & gt? 2, ευκολία P- τιμή & lt? 1 × 10

-4, Benjamini τιμή p & lt? 0,01). Ένα εξαιρετικά επικαλυπτόμενες λειτουργικό φάσμα ελήφθη για τα γονίδια του καρκίνου Απογραφή [18]. Οι πιο αξιοσημείωτες εξαιρέσεις από τις επικαλυπτόμενες οντολογιών στα δύο καρκίνο γονίδιο-σετ ήταν σχετικές με το «πρωτεϊνικών κινασών τυροσίνης», απουσιάζει από τον υποψήφιο υπολειπόμενο λίστα. Αυτές οι πρωτεΐνες είναι ένας από τους πιο εκπροσωπούνται τάξεις των ογκογονιδίων, ή κυρίαρχη γονίδια του καρκίνου. Μια λειτουργική ταξινόμηση παρόμοια με εκείνη του EASE λήφθηκε με μπίνγκο και Cytoscape (τα δεδομένα δεν φαίνονται), όπου μερικές από τις πιο σημαντικές κυτταρικές διαδικασίες που προσδιορίζονται συμμετείχαν στην παθογένεση του καρκίνου, όπως του κυτταρικού κύκλου, ο κυτταρικός θάνατος /απόπτωση (διορθωμένη τιμή-ρ & lt? 1 × 10

-3). Τέλος, δημιουργήσαμε έναν έλεγχο που του ανθρώπινου γονιδιώματος με τυχαία συνδυάζοντας τις τιμές p από τις τέσσερις δοκιμές μετάλλαξης. Όταν ΕΑΣΕ και bingo εφαρμόστηκαν σε αυτό το στοιχείο ελέγχου που δεν εντοπίστηκαν σημαντικές όρους GO.

Συζήτηση

Εμείς επινόησαν και εφάρμοσαν ένα δοκιμασία εξόρυξης δεδομένων γονιδιώματος σε επίπεδο multi-tier προς την ταυτοποίηση των γονιδίων που είναι επιρρεπείς στο «υπολειπόμενο τύπου» μεταλλάξεις σε καρκίνο. Οι τιμές ρ που προκύπτουν από κάθε βαθμίδα συνδυάστηκαν για να παραχθεί ένα «υποτελές γονίδιο του καρκίνου» p-value (Πίνακας 1 και 2). Τρεις από τις πιο αξιοσημείωτες καρκίνο υπολειπόμενα γονίδια, δηλαδή

TP53

,

PTEN

και

CDKN2A

, κατετάγη 16

ου, 92

ου και 135

ου, αντίστοιχα, μεταξύ όλων των ελεγχθέντων ανθρώπινων γονιδίων. Το διάγραμμα μπλοκ λογική μας και την ροή των δεδομένων δείχνονται στο Σχήμα 1. μπορούν να υποδιαιρεθούν Οι δοκιμές σε δύο ομάδες: μία για ανίχνευση μεταλλάξεων σημείου (υποκαταστάσεις αμινοξέων και μετατοπίσεις πλαισίου) και μία για δομικές μεταβολές (μεγάλες απαλείψεις). Κατ ‘αρχήν θα μπορούσαμε να είχαμε επίσης χρησιμοποιηθεί μια δοκιμή για μερική διαγραφές γονιδίων, αλλά σε ESTs ενδο-γονίδιο αναδιατάξεις μπορεί να συγχέεται με εναλλακτικό μάτισμα εξονίων.

Η

Η πιθανότητα μιας πρωτεΐνης που έχει μεταλλάξεις αμινοξέων και μετατοπίσεις πλαισίου στον καρκίνο, γεγονότα τα οποία είναι ανεξάρτητα, ορίστηκε ως το γινόμενο των αντίστοιχων ρ-τιμές. Απλά χρησιμοποιώντας αυτές τις δύο δοκιμές, την πρωτότυπη

TP53

και

PTEN

γονίδια του καρκίνου κατετάγη 205

ου και 233

ης από 27.184 αξιολογούνται ανθρώπινης μεταγραφές (τιμή p & lt? 1 × 10

-4). Επιπλέον, δύο άλλα γνωστά γονίδια υπολειπόμενου καρκίνου,

CDKN2A

και

CDKN2B

, είχε επίσης σημαντικές π-αξίες, αν και χαμηλότερες βαθμολογίες (p & lt? 0,0025 και FDR = 0,019, αντίστοιχα). Αυτή η συμπεριφορά ήταν αναμενόμενη για τα γονίδια με μικρές περιοχές που κωδικοποιούν, τα οποία ενδέχεται να διαγραφούν συχνότερα από μεταλλαγμένα [6]. Η παρουσία τους στο σημαντικό καρκίνο σημειακές μεταλλάξεις του γονιδίου-σύνολο, ακόμη και σε αυτό το ενδιάμεσο στάδιο, μας διαβεβαίωσε από τις δυνατότητες επιλογής του αλγορίθμου μας. Παρ ‘όλα αυτά αυτή η πρώιμη κατάταξη, βασίζεται εξ ολοκλήρου σε σημειακές μεταλλάξεις, συντάχθηκε μόνο δύο δοκιμές μετάλλαξης? Έτσι, με βάση τα στοιχεία αλληλουχίας EST, ακόμα δεν ήταν αξιόπιστη, σύμφωνα με το μοντέλο μας, η οποία ενσωματώνεται μια επιπλέον λειτουργία μετάλλαξη. Θα πρέπει να σημειωθεί ότι δεν καθόρισε για τον εντοπισμό μεταθέσεις, αλλαγές αναμένεται να είναι κυρίαρχη σε κυτταρικό επίπεδο και ως εκ τούτου δεν είναι κατάλληλες για την αναζήτησή μας για την υποτελή γονίδια.

Η τελευταία δοκιμή, με βάση την ανάλυση aCGH, επιβεβαίωσε ότι ένα πολύ μεγάλο τμήμα του ανθρώπινου γονιδιώματος συχνά διαγράφεται στον καρκίνο. Όπως ήταν αναμενόμενο για 2-κανάλια διαδικασία μας aCGH, θα ανιχνεύεται σωστά γονίδια των χρωμοσωμάτων φύλου ως διαφορικά εκπροσωπούνται στις οθόνες γονιδίωμα. Ειδικότερα, λόγω της επίλυσης των διαρθρωτικών προσδιορισμό μας, τα γονίδια από την ψευδο-αυτοσωματικό περιοχή 1 ταυτοποιήθηκαν ως φυσιολογικά διπλοειδή (συμπληρωματική Εικόνα S1). Το πιο σημαντικό, θα περιμέναμε ότι τα πολυμορφικά CNVs δεν είχε φιλτράρεται μέσω του προσδιορισμού aCGH. Πράγματι, μόνο ένα μικρό ποσοστό των γονιδίων του καρκίνου συνέπεσε με πολυμορφικές CNVs και το ποσοστό αυτό είναι ακόμη μικρότερο από το αναμενόμενο κατά τύχη (Πίνακας 2).

Ο αριθμός των διαγραφών ανιχνεύονται από aCGH στο γονιδίωμα του καρκίνου είναι πολύ υψηλή (πάνω από το 10% των ανθρώπινων γονιδίων έχουν διαγραφεί στον καρκίνο). Παρά την εν λόγω διαγραφή περίσσεια, όταν περιλαμβάνονται όλοι οι τρόποι μετάλλαξη, ο αριθμός των υποψηφίων γονιδίων είναι μικρότερη από 0,5% του ανθρώπινου γονιδιώματος που αναλύθηκαν.

Ο καρκίνος είναι γονιδιακά προϊόντα εμπλέκονται σε βιολογικές διεργασίες όπως του κυτταρικού κύκλου, την επιδιόρθωση του DNA και την απόπτωση, σε συμφωνία με τη λογοτεχνία. Τα ίδια λειτουργική άποψη συνδέονται επίσης με τα γονίδια στο κοσμικό Καρκίνο Απογραφή [18]. Εντυπωσιακά, κινάσες τυροσίνης, κυρίαρχη ογκογονίδια, που υπάρχει στην Καρκίνου Απογραφή, απουσίαζαν από καρκίνο γονίδιο-σετ μας, σε συμφωνία με την επιλογή για υπολειπόμενα γονίδια.

Μερικές ισχυρή περιορισμοί εγγενείς στην προσέγγισή μας. Είναι απίθανο ότι οι καταγεγραμμένες μετατοπίσεις πλαισίου είναι πολυμορφισμοί, επειδή αλλοιώνουν την πρωταρχική δομή των προϊόντων του γονιδίου. Αντιστρόφως, θα μπορούσαν να είναι πολύ συχνά έχει ως αποτέλεσμα σφαλμάτων αλληλούχισης. Για το λόγο αυτό, επιλέξαμε να φιλτράρει όσο το δυνατόν περισσότερο τα σφάλματα προσδιορισμού αλληλουχίας με χρήση ενός αντίστοιχου t τεστ πάνω από ένα συρόμενο παράθυρο. Μια άλλη διαμάχη θα μπορούσε να σχετίζεται με το σωματικό χαρακτήρα των ανιχνεύονται μεταλλάξεις. Δεδομένου ότι δεν υπάρχουν σχεδόν καθόλου αλληλουχίες βλαστικής σειράς που αντιστοιχεί στις βιβλιοθήκες όγκου στη βάση δεδομένων EST, δεν μπορεί να υπάρξει καμία επίσημη απόδειξη ότι τα επιλεγμένα γονίδια αντιστοιχούν σε σωματικά στόχους μετάλλαξη. Δεν μπορούμε να καθορίσει πόσοι από τους ανιχνεύονται αναντιστοιχίες είναι πραγματικές μεταλλάξεις, ούτε πόσοι από αυτούς είναι πραγματικά σωματικών προέλευσης. Θα μπορούσαμε να αποδίδουν μόνο σε κάθε ανθρώπινο γονίδιο μια τιμή p για την υπέρβαση των αναντιστοιχίες με το γονίδιο αδρανοποίησης δυναμικό σε δείγματα καρκίνου. Η παρουσία του

TP53

,

PTEN

και

CDKN2A

στις υποψήφιες γονίδιο-set και λειτουργικά χαρακτηριστικά του, είναι ενδείξεις υπέρ της υπόθεσης ότι μετρήσαμε περίσσεια σωματικές μεταλλάξεις του καρκίνου. Θα είμαστε σε θέση να αντικρούσει αυτή την υπόθεση, χρησιμοποιώντας διάφορα πειραματικά πρωτόκολλα. Από την άλλη πλευρά, είναι δυνατόν ότι μερικές από τις υποψήφια γονίδια θα μπορούσαν να φέρουν μεταλλάξεις βλαστικής σειράς και έτσι αποτελούν γνωρίσματα προδιάθεση για ανταρσία καρκίνο.

Όταν συγκρίναμε τα αποτελέσματά μας με αυτά του πρόσφατα δημοσιευμένη σχέδιο μαζική αλληλούχιση, ορισμένες διαφορές προέκυψαν. Χρησιμοποιήσαμε ένα μεγαλύτερο ποσό των δεδομένων αλληλουχίας, αν και χαμηλότερης ποιότητας από τη στιγμή που δεν χρησιμοποιούν τα δεδομένα δεύτερο αλληλουχίας πέρασμα. Λάβαμε από dbEST ένας αριθμός αναντιστοιχιών περίπου 5 φορές υψηλότερες από τις οθόνες αλληλούχισης ευρείας γονιδιώματος. Αυτή η περίσσεια μπορεί να οφείλεται στη χαμηλότερη δεδομένα αλληλούχισης ποιότητας στην ESTs ή την υψηλότερη ευαισθησία της προσέγγισής μας σε σχέση με την άμεση αλληλούχιση με βάση PCR. Ανίχνευση υπο-εκπροσωπούνται μεταλλάξεις σε συχνά ετερογενή βιοψίες καρκίνου μπορεί να είναι μια τεχνική πρόκληση για άμεση αλληλούχιση, αλλά όχι για τα κλωνοποιημένα ESTs.

ESTs χρησιμοποιήθηκαν σε προηγούμενες προσπάθειες για την ταυτοποίηση γονιδίων που σχετίζονται με τον καρκίνο. Σχεδόν πάντοτε οι προσεγγίσεις αυτές βασίστηκαν σε προφίλ έκφρασης, η οποία σε δείγματα όγκων είναι πιθανώς συσχετίζεται και αργά γεγονότα, ανάμεσα στα στάδια που οδηγούν στην ανάπτυξη και την εξέλιξη του όγκου. Σε μια πολύ διαφορετική προσπάθεια εξόρυξης δεδομένων για ακολουθίες EST στον καρκίνο, Qiu και συνεργάτες [20] μετράται ένωση SNP-όγκου. Η ανάλυσή τους ήταν ιδιαίτερα επικεντρώθηκε στην ενιαία αναντιστοιχίες νουκλεοτιδίων, και περιορίζεται σε γνωστές μεταλλάξεις που περιγράφονται στη βάση δεδομένων SNP και είναι παρούσα σε τουλάχιστον 50 EST χτυπήματα. Εντόπισαν 4.865 SNP συχνή σε όγκους (ρ & lt? 0.05), εκ των οποίων 327 που προκαλείται από την υποκατάσταση αμινοξέος (cSNP). Πολλές μείζον σύμπλεγμα ιστοσυμβατότητας (MHC) τάξης II ήταν παρούσες μεταξύ αυτών κωδικεύοντες SNP, ενώ καμία δεν ήταν παρούσα σε υπολειπόμενο γονίδιο του καρκίνου-σετ μας. Το πιο σημαντικό, υπάρχουν γονίδια του καρκίνου ορόσημο, όπως

TP53

,

PTEN

και

CDKN2A

ήταν παρόντες κατά cSNPs. Τέλος, κανένα από τα γονίδια SNP ανιχνεύονται από Qiu et al. [20] ήταν παρόντες στις υποψήφιες υπολειπόμενο σύνολο γονίδιο του καρκίνου μας

Ο καρκίνος λεπτά υπολειπόμενο υπο-γονιδιώματος (& lt? 0,5%). Εντοπίσαμε μπορεί να αντιπροσωπεύει ένα ορόσημο προς την ταυτοποίηση νέων δεικτών για την έγκαιρη διάγνωση και την πρόγνωση. Επιπλέον, η στρατηγική εξόρυξης μας μπορεί να εφαρμοστεί στα δεδομένα τα οποία θα είναι διαθέσιμα από την αλληλούχιση του καρκίνου γονιδιωμάτων [22]. Τέλος, το έργο μας θα μπορούσε να οδηγήσει σε μια διαφορετική ισορροπία μέσα στην πισίνα των γονιδίων του καρκίνου, σήμερα ασύμμετρη προς την κυρίαρχη ογκογονίδια.

Υλικά και Μέθοδοι

EST εξόρυξη δεδομένων

Όλα τα ανθρώπινα κωδικοποίηση

You must be logged into post a comment.