PLoS One: Εξατομικευμένη Διαδρομή Εμπλουτισμός Χάρτης γονίδια του καρκίνου θεωρούμενα από Next Generation Sequencing Data


Αφηρημένο

Ιστορικό

ανάλυση Διαδρομή μιας σειράς γονιδίων αποτελεί ένα σημαντικό χώρο σε μεγάλης κλίμακας

μική

ανάλυση των δεδομένων. Ωστόσο, η εφαρμογή των παραδοσιακών μεθόδων εμπλουτισμού μονοπάτι για αλληλούχιση επόμενης γενιάς (NGS) δεδομένα είναι επιρρεπής σε διάφορες δυνητικές τάσεων, συμπεριλαμβανομένων γενωμική /γενετικούς παράγοντες (π.χ., την συγκεκριμένη νόσο και το μήκος γονίδιο) και περιβαλλοντικούς παράγοντες (π.χ., προσωπική ζωής και η συχνότητα και η δοσολογία της έκθεσης σε μεταλλαξιογόνες). Ως εκ τούτου, νέες μέθοδοι χρειάζονται επειγόντως για αυτούς τους νέους τύπους δεδομένων, ιδιαίτερα για τις μεμονωμένες ειδικές δεδομένων γονιδιώματος.

Μεθοδολογία

Σε αυτή τη μελέτη, προτείναμε μια νέα μέθοδο για την ανάλυση οδό της μετάλλαξης NGS δεδομένων λαμβάνοντας ρητά υπόψη το ρυθμό μετάλλαξης του γονιδίου-σοφός. Εμείς υπολογίζεται το ποσοστό μετάλλαξης γονιδίων-σοφός με βάση το ρυθμό μετάλλαξης επιμέρους ειδικές φόντο μαζί με το μήκος του γονιδίου. Λαμβάνοντας το ποσοστό μετάλλαξης ως βάρος για κάθε γονίδιο, σταθμισμένη στρατηγική αναδειγματοληψία μας χτίζει την κατανομή null για κάθε διαδρομή, ενώ ταιριάζουν με τα πρότυπα μήκος του γονιδίου. Η εμπειρική

P

τιμή που λαμβάνεται στη συνέχεια παρέχει μια προσαρμοσμένη στατιστική αξιολόγηση.

Κύρια Ευρήματα /Συμπεράσματα

Δείξαμε μέθοδο του σταθμισμένου αναδειγματοληψία μας σε ένα σύνολο δεδομένων πνεύμονα αδενοκαρκινώματα και ένα σύνολο δεδομένων γλοιοβλάστωμα, και σε σύγκριση με άλλες ευρέως χρησιμοποιούμενες μέθοδοι. Με ρητά τη ρύθμιση γονιδίων-μήκος, η μέθοδος σταθμισμένης επαναδειγματοληψία εκτελεί καθώς και οι πρότυπες μέθοδοι για σημαντικές οδούς με ισχυρά αποδεικτικά στοιχεία. Σημαντικά, η μέθοδος μας θα μπορούσε να απορρίψει αποτελεσματικά πολλά οριακά σημαντική οδών ανιχνεύεται με πρότυπες μεθόδους, μεταξύ των οποίων αρκετά μακράς γονίδιο που βασίζεται, καρκίνος-άσχετα μονοπάτια. Δείξαμε επίσης ότι με τη μείωση των εν λόγω προκαταλήψεις, οδός στιχομυθία για κάθε άτομο και διαδρομή χάρτη συν-μετάλλαξη σε πολλά άτομα μπορεί αντικειμενικά να διερευνηθούν και να αξιολογηθούν. Αυτή η μέθοδος εκτελεί ανάλυση μονοπατιού σε ένα δείγμα με επίκεντρο τη μόδα, και παρέχει έναν εναλλακτικό τρόπο για την ακριβή ανάλυση του καρκίνου εξατομικευμένες γονιδιώματα. Μπορεί να επεκταθεί και σε άλλους τύπους γονιδιωματικής δεδομένων (γονότυπου και μεθυλίωση) που έχουν παρόμοια προβλήματα μεροληψίας

Παράθεση:. Jia P, Zhao Z (2012) Εξατομικευμένη Pathway Εμπλουτισμός Χάρτης του Καρκίνου θεωρούμενα γονίδια από Next Generation Sequencing Δεδομένων . PLoS ONE 7 (5): e37595. doi: 10.1371 /journal.pone.0037595

Συντάκτης: Steve Horvath, του Πανεπιστημίου της Καλιφόρνια στο Λος Άντζελες, Ηνωμένες Πολιτείες της Αμερικής

Ελήφθη: 21, Δεκεμβρίου 2011? Αποδεκτές: 25 Απριλίου, 2012? Δημοσιεύθηκε: 18η του Μάη του 2012

Copyright: © 2012 Jia, Zhao. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Αυτό το έργο υποστηρίχθηκε εν μέρει με επιχορηγήσεις από τα Εθνικά Ινστιτούτα Υγείας, το 2009 NARSAD Maltz Ερευνητής Βραβείο για ZZ, και το 2010 NARSAD Νέων Ερευνητών βραβείο σε PJ. Καμία πρόσθετη εξωτερική χρηματοδότηση ελήφθη για τη μελέτη αυτή. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:. Οι συγγραφείς έχουν διαβάσει την πολιτική του περιοδικού και έχουν τα ακόλουθα συγκρούσεις: Δρ Zhongming Zhao υπηρετεί σήμερα ως συντάκτης για PLoS ONE. Αυτό δεν αλλάζει την τήρηση των συγγραφέων σε όλες τις PLoS ONE πολιτικές για την ανταλλαγή δεδομένων και υλικών.

Εισαγωγή

Σε μελέτες αλληλουχίας μεγάλης κλίμακας των γονιδιωμάτων καρκίνο, μία από τις κεντρικές προκλήσεις είναι να διάκριση που προκαλούν ασθένειες «οδηγός» μεταλλάξεις από μεταλλάξεις «επιβάτη», και θα επιτρέψει την ανάπτυξη στοχευμένων θεραπειών και φαρμάκων. Ενώ οι στατιστικές μέθοδοι έχουν υπό ενεργό ανάπτυξη για τη δοκιμή γεγονότα μετάλλαξης στο επίπεδο γονιδίου, η συνδυαστική εμφάνιση πολλών γονιδίων δείχνει διακριτές μοτίβα. Μερικά καλά μελετημένη παραδείγματα περιλαμβάνουν αλληλοαποκλειόμενες μεταλλάξεις όπως

EGFR

και

KRAS

στον καρκίνο του πνεύμονα [1], και

TP53

και

MDM2

στην γλοιοβλάστωμα. Οι περισσότερες από αυτές τις μεταλλάξεις που παρατηρούνται συχνά σε ορισμένες εστιασμένη οδούς, π.χ., τέσσερα γονίδια από το μονοπάτι του EGFR-RAS-RAF σηματοδότησης,

EGFR

,

KRAS

,

HER2

, και

BRAF

, συμπεριφέρονται σε μια αμοιβαία αποκλειστική περιοχή της μόδας στον καρκίνο του πνεύμονα [1], [2]. Επιπλέον, τα πιο πρόσφατα ευρήματα του καρκίνου Γονιδιώματος Atlas (TCGA) έργα που πρότεινε σθεναρά τη σύγκλιση των μεταλλάξεων σε επίπεδο οδού (π.χ., τρία βασικά μονοπάτια στο γλοιοβλάστωμα, [3]). Οι παρατηρήσεις αυτές προωθείται μια αναδυόμενη συναίνεση ότι τα γονίδια του οδηγού θα μπορούσε να να αναλυθεί σε επίπεδο οδού και να προκαλέσει πιο απλή λειτουργική ερμηνεία.

Η ταχεία πρόοδο στον τομέα των τεχνολογιών αλληλούχισης επόμενης γενιάς (NGS) έχει καταστήσει δυνατό τον προσδιορισμό ατομικών γονιδιωμάτων κατά τρόπο έγκαιρο και οικονομικά αποδοτικό τρόπο. Για παράδειγμα, ολόκληρη γονιδιώματος μπορεί να προσφέρει ένα πλήρες φάσμα των γενετικών μεταλλάξεων, συμπεριλαμβανομένων των ενιαίων παραλλαγές νουκλεοτιδίου (SNVs), σύντομες εισαγωγές /διαγραφές (indels), παραλλαγές αριθμού αντιγράφων (CNVs), και παραλλαγές δομή. Μέχρι σήμερα, πολλές μεμονωμένες γονιδιωμάτων καρκίνο έχουν επιτυχώς η αλληλουχία [4], [5], [6], και ακόμα περισσότερο αναμένονται στο εγγύς μέλλον. Αυτές οι εφαρμογές παρέχουν πολύτιμα δεδομένα αλληλουχίας των επιμέρους γονιδιώματα και να καταστεί δυνατή η διεξαγωγή ανάλυσης σε ένα δείγμα με επίκεντρο τον τρόπο, επιταχύνεται σημαντικά βήματα μας προς την εξατομικευμένη διάγνωση και φαρμακευτική αγωγή.

Σε αυτό το έργο, έχουμε ως στόχο να εκτελέσει μια pathway- εμπλουτισμός δοκιμή μιας ομάδας των θεωρούμενων γονιδίων του καρκίνου ανιχνεύεται σε μεμονωμένους ασθενείς. Σε αντίθεση με τα πιο παραδοσιακά είδη δεδομένων, τα δεδομένα αλληλούχισης εξατομικευμένη τυπικά περιπλέκεται από τα ακόλουθα χαρακτηριστικά: (1) τα μεταλλαγμένα γονίδια που σχετίζονται με ένα άτομο και είναι πιθανό να διαφέρουν σε πολλαπλές άτομα? (2) τα μεταλλαγμένα γονίδια να συμβεί σε ένα άτομο-ειδικό ρυθμό φόντο μετάλλαξη, η οποία θα μπορούσε να υπόκειται σε προσωπική ζωής, η συχνότητα και η δοσολογία της έκθεσης σε μεταλλαξιογόνες, και την συγκεκριμένη ασθένεια? και (3) τα μεταλλαγμένα γονίδια αποδίδεται σε μήκος γονίδιο με την παραδοχή ότι οι μεταλλάξεις συμβαίνουν ομοιόμορφα σε όλη την γονιδίωμα. Λόγω αυτών των προκλήσεων, οι μέθοδοι που έχουν καλά μελετημένη και εφαρμόζεται ευρέως στο πρότυπο αναλύσεις σύνολο γονιδίων δεν έχουν άμεση εφαρμογή. Για παράδειγμα, μια λειτουργική δοκιμή του εμπλουτισμού είναι ένας σημαντικός τρόπος για να διερευνήσει τις βιολογικές λειτουργίες για μια λίστα των γονιδίων ενδιαφέροντος. Παραδοσιακά, τα γονίδια των τόκων που προέρχονται μέσα από μελέτες μιας ομάδας δειγμάτων, π.χ., διαφορικά εκφραζόμενα γονίδια (DE) προέρχεται από το σχεδιασμό υπόθεση /έλεγχος, και συνήθεις στατιστικές δοκιμές, όπως η Υπεργεωμετρική δοκιμή ή την ακριβή δοκιμασία του Fisher μπορεί να γίνει για να ελέγξετε εάν ένα σετ γονιδίων (π.χ., οδός ή λειτουργική ομάδα) είναι σημαντικά εμπλουτισμένη με γονίδια DE. Αξίζει να σημειωθεί ότι, μια κοινή παραδοχή στηρίζονται αυτές οι δοκιμές είναι ότι όλα τα γονίδια (που αντιστοιχούν στις μπάλες σε μια λάρνακα) έχουν ίσες πιθανότητες να επιλεγεί. Ωστόσο, όταν εφαρμόζεται σε δεδομένα NGS, η μονάδα μετάλλαξη είναι γονιδιωματικό DNA, π.χ., SNVs ή μικρές παρεμβολές /απαλοιφές (indels), και υποτίθεται ότι συμβαίνουν ομοιόμορφα σε όλο το γονιδίωμα. Σε αντίθεση, η μονάδα ανάλυσης μιας δοκιμής εμπλουτισμού οδός είναι γονίδιο. Μια προκατάληψη που παρατηρείται συχνά κατά τη διαδικασία της σχετικά SNVs ή indels σε γονίδια είναι ότι η μακρά γονίδια τείνουν να φιλοξενούν περισσότερες μεταλλάξεις, καθώς καταλαμβάνουν μεγαλύτερα τμήματα του γονιδιώματος, και ως εκ τούτου, πολύ γονίδια τείνουν να έχουν υψηλότερη πιθανότητα να μεταλλαχθεί. Ως εκ τούτου, το πρότυπο υπεργεωμετρική δοκιμή ή την ακριβή δοκιμασία του Fisher δεν ισχύει πλέον για αυτούς τους τύπους δεδομένων.

Η μεγάλη επίδραση του γονιδίου έχει αναγνωριστεί στα δεδομένα μετάλλαξη NGS. Στην πρόσφατη δουλειά του Wendl et al. [7], για να εκτιμηθεί η πιθανότητα μιας οδού εμπλουτίζεται με μεταλλαγμένα γονίδια, μια ωμή τρόπο δύναμης του υπολογισμού της ακριβούς

P

τιμές περιγράφηκε, και συνέλιξη-based στρατηγική προσέγγιση προτάθηκε με σκοπό να μειωθεί η υπολογιστική βάρος. Η προκατάληψη μήκος γονίδιο αναγνωρίστηκε επίσης στα δεδομένα αλληλούχισης RNA, στην οποία μεγάλες μεταγραφές τείνουν να έχουν περισσότερο διαβάζει αντιστοιχίζονται σε αυτούς. Στο έργο του Young et al. [8], οι συγγραφείς προτείνεται να τοποθετηθούν μια λειτουργία στάθμισης πιθανοτήτων και ποσοτικά εκτιμηθεί η πιθανότητα μιας μεταγραφής επιλέγεται ως DE ως συνάρτηση του μήκους μεταγραφή του. Η δοκιμή του εμπλουτισμού Γονιδιακή Οντολογία (GO) στη συνέχεια πραγματοποιείται με βάση την εκτιμώμενη πιθανότητα για κάθε μεταγραφή /γονίδιο. Αξίζει να σημειωθεί ότι, η προκατάληψη μήκος γονίδιο εμφανίζεται σε πολλές πτυχές της ανάλυσης μονοπατιού που σχετίζονται, όπως αλληλοπαρεμβολές μονοπάτι μέσα σε κάθε προφίλ συν-μετάλλαξης δείγματος και μονοπάτι κατά μήκος πολλαπλών δειγμάτων [9]. Κατάλληλη προσαρμογή θα μπορούσε να εγγυάται την ακρίβεια των αναλύσεων αυτών.

Σε αυτή τη μελέτη, πρότεινε μια στρατηγική προκατάληψη μείωσης για τη δοκιμή του εμπλουτισμού της οδού από τη λήψη του φόντου των ποσοστών μετάλλαξης γονιδίου. Η στρατηγική αυτή, δηλαδή η μέθοδος σταθμικού επαναδειγματοληψία, λαμβάνει μήκος γονίδιο υπόψη για την εκτίμηση της πορείας

P

αξίες και έχει αποδειχθεί ότι είναι υπολογιστικά αποδοτική. Σύμφωνα με το σταθμισμένο πλαίσιο επαναδειγματοληψία, εξατομικευμένες στιχομυθία οδός θα μπορούσε στη συνέχεια να διερευνηθούν, αποκαλύπτοντας την περίπλοκη αλληλεπίδραση σε επίπεδο οδού. Επιπλέον, δείξαμε ότι με την αποτελεσματική μείωση του μήκους του γονιδίου προκατάληψη, μια πιο λειτουργικά σχετικό συν-μεταλλαγμένη οδό χάρτη θα μπορούσε να προέρχεται. Το έργο που προτείνεται εδώ θα βρείτε τις ευρείες εφαρμογές στο εγγύς μέλλον, καθώς είναι πιο εξατομικευμένη δεδομένα αλληλουχίας αναμένεται να είναι διαθέσιμο.

Υλικά και Μέθοδοι

Σύνολα

συλλογή Pathway.

Εμείς συλλέγονται όλα τα μονοπάτια από KEGG [10] χρησιμοποιώντας το πακέτο R ‘org.Hs.eg.db »(έκδοση 2.5.0), στην οποία οι οδοί KEGG είχαν κατεβάσει από τις 15 Μαρτίου 2011. Ένα συνολικά 229 πορείες και 5891 γονίδια που εμπλέκονται σε αυτή την έκδοση. Για την αποφυγή οδούς που ορίζονται για πολύ ειδικές ή πολύ γενικά βιολογικές διεργασίες, επιλέξαμε αυτά με τουλάχιστον 10 και το πολύ 500 γονίδια, με αποτέλεσμα 213 έγκυρες οδούς για επακόλουθη ανάλυση μας.

Lung δεδομένα αδενοκαρκινώματα.

Το σύνολο των δεδομένων του καρκίνου του πνεύμονα είχε αρχικά αναφερθεί σε Ding et al. [11], στο οποίο ένα σύνολο 188 δειγμάτων αδενοκαρκινώματα πνεύμονα αλληλουχήθηκαν για 623 γονίδια. Συνοπτικά, 163 δείγματα παρατηρήθηκαν να έχουν μεταλλάξεις σε τουλάχιστον ένα γονίδιο, και 356 γονίδια παρατηρήθηκε ότι είχαν μετάλλαξη (μεταλλάξεις) σε τουλάχιστον ένα δείγμα. Για να εξασφαλιστεί η στατιστική ισχύ, συμπεριλάβαμε μόνο εκείνα τα δείγματα που έχουν τουλάχιστον 10 μεταλλαγμένων γονιδίων (Σχήμα S1). Αυτός ο κανόνας φιλτραρίσματος οδήγησε σε 33 δείγματα με 277 γονίδια που εμπλέκονται, και στη συνέχεια χρησιμοποιήθηκαν ως σύνολο δεδομένων εργασίας μας. Το ποσοστό φόντο μετάλλαξης ορίστηκε ως 2,7 × 10

-6 για αυτά τα δείγματα, όπως αναφέρεται στην αρχική εργασία [11].

δεδομένα γλοιοβλάστωμα.

Τα στοιχεία γλοιοβλάστωμα ανιχνεύθηκαν 223 γονίδια με τουλάχιστον ένα μη σιωπηλές σωματική μετάλλαξη σε ένα ή περισσότερα δείγματα με πειραματική επιβεβαίωση [3]. Εξετάστηκαν συνολικά 91 δείγματα, συμπεριλαμβανομένων 72 ανεπεξέργαστα περιπτώσεις και 19 περιπτώσεις αντιμετωπίζονται. Για να εξασφαλιστεί η στατιστική δύναμη, απαιτείται ότι ένα δείγμα θα συμπεριληφθούν για τη συνέχεια μας μέχρι την ανάλυση αν έχει ≥5 μεταλλαγμένα γονίδια. Έχουμε επιλέξει αυτό το λιγότερο αυστηρές αποκοπής εδώ σε σύγκριση με τα δείγματα του πνεύμονα οφείλεται στο δείγμα-ειδικά χαρακτηριστικά. Όπως φαίνεται στο Σχήμα S1, θα υπήρχε μόνο μερικά δείγματα που απομένουν, αν εφαρμοστεί 10 στα δεδομένα γλοιοβλάστωμα. Έτσι, με τη χρήση 5 ως τιμή αποκοπής, 18 δείγματα παρέμειναν κατάλληλο για την ανάλυση που ακολουθεί μονοπάτι.

Όπως ορίζεται στην αρχική εργασία [3], υπάρχουν 7 υπερμεταλλαχθούν δείγματα γλοιοβλαστώματος με υψηλό σωματικό ρυθμό μετάλλαξης, το σύνολο των που ανήκουν σε δείγματα θεραπεία. Αυτά τα δείγματα είχαν ως αποτέλεσμα μια άνιση ρυθμό μετάλλαξης υπόβαθρο για επεξεργασμένα και μη επεξεργασμένα δείγματα. Συνεπώς, θέτουμε το ποσοστό μετάλλαξης να είναι 3,7 × 10

-6 για μη επεξεργασμένα δείγματα και 6,4 × 10

-6 για την επεξεργασία δειγμάτων (https://tcga-data.nci.nih.gov/docs/publications/gbm_2008/TCGA_GBM_Level4_Significant_Genes_by_Mutations_DataFreeze2.xls).

Weighted δοκιμή εμπλουτισμό της οδού με βάση αναδειγματοληψία σε ενιαίο δείγμα

Η βασική παραδοχή του προτύπου Υπεργεωμετρική δοκιμή στο γονίδιο που εμπλουτισμό της ανάλυσης είναι ότι όλα τα γονίδια στο γονιδίωμα έχουν ίσες πιθανότητες να επιλεγεί. Αυτή η υπόθεση δεν ισχύει πλέον, όταν η μονάδα ανάλυσης μεταφέρεται από μεταλλάξεις στα γονίδια, διότι πλέον τα γονίδια τείνουν να έχουν περισσότερες πιθανότητες να φιλοξενούν τις μεταλλάξεις, υποθέτοντας ότι οι μεταλλάξεις συμβαίνουν ομοιόμορφα σε όλο το γονιδίωμα. Έτσι, το πρότυπο υπεργεωμετρική δοκιμή δεν εφαρμόζεται σε τέτοιες περιπτώσεις. Για το σκοπό αυτό, προτείναμε μια σταθμισμένη στρατηγική αναδειγματοληψία για να χτίσει τη διανομή μηδενική, και σε σύγκριση με τα παρατηρούμενα μεταλλαγμένα γονίδια σε κάθε μονοπάτι με την εκτιμώμενη μηδενική κατανομή.

Ας

μ

είναι ο ρυθμός μετάλλαξης φόντο για ένα δείγμα καρκίνου. Προηγούμενες μελέτες έχουν δείξει ότι

μ

είναι της τάξεως του 10

-6 /nt [12] και ποικίλλει σημαντικά στις διάφορες ασθένειες [11], [12]. Εδώ, δηλώνει nt νουκλεοτιδίων. Ας

l

είναι το μήκος του γονιδίου και

λ

i

για το

i

ου γονιδίου, και

G

= {

g

i

?

i

= 1, …,

n

} είναι το σύνολο όλων των γονιδίων για ένα σύνολο

n

γονίδια στο γονιδίωμα. Υποθέτοντας ένα γονιδιακού τόπου (π.χ., θέση νουκλεοτιδίου) στο γονιδίωμα έχει δύο καταστάσεις, μεταλλαγμένα ή όχι, η πιθανότητα το

i

ου γονιδίου,

g

i

, δεν έχει μεταλλαχθεί θα μπορούσε να διατυπωθεί ως

exp

(-

μ × l

i

) σύμφωνα με την πιθανότητα Bernoulli, όπου

exp

είναι η εκθετική συνάρτηση. Κατά συνέπεια, ο ρυθμός μετάλλαξης του είναι

m

i

= 1

exp

(-

μ × l

i

). Σημειώσαμε ότι η εκτίμηση του ρυθμού μετάλλαξης του γονιδίου-σοφός θα μπορούσε να είναι πιο περίπλοκη από ό, τι απλά απαντώντας σε μήκος του γονιδίου. Εδώ, θα ρυθμίζεται ειδικά την προκατάληψη μήκος γονίδιο [7], ενώ μια πιο λεπτομερής θεώρημα θα μπορούσε να βρεθεί στη βιβλιογραφία [12], [13], [14], [15].

Ας υποθέσουμε σε ένα άτομο γονιδίωμα , συνολικά

Ν

γονίδια εντοπίστηκαν ως μεταλλαγμένα μεταξύ των

g

= {

g

i

?

i

= 1, …,

n

}, και εμείς τους χαρακτηρίζει ως «MutGene (s)», όπου. Έχουμε αναθέσει μια ετικέτα για κάθε γονίδιο που υποδεικνύουν την κατάσταση μετάλλαξης του: (Εικόνα 1). Λαμβάνοντας υπόψη ένα μονοπάτι

S

με

k

MutGenes, στόχος μας είναι να παρέχουμε μια στατιστική δοκιμή για να εξεταστεί κατά πόσον

S

σημαντικά εμπλουτισμένη με MutGenes. Για να γίνει αυτό, μπορούμε να οικοδομήσουμε μια κατανομή null των MutGenes με τυχαία ετικέτες γονίδιο (Σχήμα 1). Κανονικά, μη σταθμισμένη διαδικασία τυχαιοποίησης αναλαμβάνει κάθε γονίδιο έχει την ίδια πιθανότητα να επιλεγεί ως MutGenes. Για παράδειγμα, για τις

n

γονίδια στο

G

, ένας τυχαίος αριθμός παράγεται για κάθε ένα από αυτά, δηλαδή, όπου και

i

= 1, …,

ν

. Έτσι, από την παραγγελία γονίδια, σύμφωνα με

r τους

i

αξίες, τα σύμβολα γονιδίου τυχαία ενώ ετικέτα MutGene,

y

i

, είναι σταθερή (Σχήμα 1β). Επαναλαμβάνοντας αυτό τον τρόπο μετάθεση ετικετών γονίδιο για πολλές φορές (π.χ., 10,000), μπορεί να κατασκευαστεί η κατανομή φόντο MutGenes για κάθε οδό και η σημασία της οδού μπορεί στη συνέχεια να υπολογιστεί. Αυτό resamping με βάση τη μέθοδο της εκτίμησης εμπλουτισμού οδός είναι συμπληρωματική με την Υπεργεωμετρική τεστ, τα οποία βασίζονται στην υπόθεση ότι όλα τα γονίδια έχουν ίσες πιθανότητες να επιλεγεί.

Για ένα δεδομένο δείγμα, ας υποθέσουμε ότι υπάρχουν συνολικά του

n

γονίδια στο γονιδίωμα,

g

= {

g

i

?

i

= 1, …,

n

}, και

Ν

από αυτά είναι τα γονίδια μετάλλαξη (MutGenes). Οι MutGenes επισημαίνονται ως 1, ενώ οι άλλοι είναι χαρακτηρισμένα ως 0. δοκιμή (α) Υπεργεωμετρική. (Β) Η τακτική αναδειγματοληψία. (Γ) Σταθμισμένη αναδειγματοληψία. (Δ) Τα τρία σενάρια ανάλυση που πραγματοποιήθηκε.

Η

Αντίθετα, προτείναμε τη σταθμισμένη στρατηγική αναδειγματοληψία που στοχεύει να χτίσει τη μηδενική κατανομή προβάλλοντας κάθε διανομή με το ίδιο μοτίβο μήκους γονιδίου προκατάληψη (Σχήμα 1γ ). Συγκεκριμένα, σε κάθε σταθμισμένη αναδειγματοληψία, παράγεται με τον ίδιο τρόπο όπως και στην κανονική μέθοδο επαναδειγματοληψία. Ωστόσο, ρυθμίζεται για κάθε γονίδιο, ανάλογα με το ρυθμό μετάλλαξης του γονιδίου-ειδικό, δηλαδή, ένα νέο τυχαίο αριθμό,, δημιουργείται, όπου είναι τυχαίων αριθμών και

m

i

είναι ο ρυθμός μετάλλαξης του γονιδίου-σοφός . Γονίδια από

G

στη συνέχεια διέταξε, σύμφωνα με. Η κορυφαία

Ν

γονιδίων στον διέταξε λίστα γονίδιο στη συνέχεια αποδίδεται ως MutGenes για την αναδειγματοληψία. Σημειώστε ότι για μεγαλύτερο χρονικό διάστημα γονίδια με μεγάλες τιμές του

m

i

, και για μικρότερα γονίδια με μικρές τιμές του

m

i

,. Επομένως, για κάθε αναδειγματοληψία, μεγάλη γονίδια είναι πιο πιθανό να επιλεγούν ως MutGenes, και αυτά τα τυχαία σύνολα θα έχουν το ίδιο μοτίβο του μήκους γονιδίου όπως στον πραγματικό δείγμα. Τέλος, για κάθε διαδρομή, μια εμπειρική

P

αξία υπολογίζεται με τη χρήση, όπου

k

είναι ο αριθμός των MutGenes στην παρατηρούμενη περίπτωση και

K

είναι ο αριθμός των » MutGenes «σε αναδειγματοληψία.

διαδρομή στιχομυθία

Σας προτείνονται τον κόμβο που βασίζεται στιχομυθία οδού χρησιμοποιώντας το

συντελεστής Jaccard (JC)

μέτρησης, η οποία έχει εφαρμοστεί ευρέως σε σύνολο -με βάση την ανάλυση [16], [17]. Ας

U

δείχνουν το σύνολο των γονιδίων στην οδό Α και

V

δείχνουν το σύνολο των γονιδίων στην οδό Β, η μητρική

JC

υπολογίζεται ως εξής:.

για να ληφθεί υπόψη για την παρουσία του μήκους προκατάληψη, θα υπολογίζεται επίσης

JC

σε κάθε σταθμισμένη αναδειγματοληψία και υπολογίζεται μια εμπειρική

P

αξίας για κάθε ζεύγος των μονοπατιών ως εξής:, όπου

JC (π)

είναι η

JC

τιμή στο

π

ου αναδειγματοληψία.

Co-μεταλλαγμένο οδού χάρτη

Μονοπάτια που είναι συχνά συν-μεταλλαγμένο σε πολλά δείγματα θα μπορούσαν να εμπλέκουν συντονισμένη λειτουργίες σε επίπεδο συστημάτων. Για να διερευνήσουν από κοινού μετάλλαξη γεγονότα, κατασκευάσαμε πρώτα ένα προφίλ μετάλλαξη μονοπάτι κατά μήκος των σχετικών δειγμάτων. Όπως φαίνεται στο Σχήμα 1δ, για κάθε οδό, κατάσταση μετάλλαξης του καθορίζεται από ένα δυαδικό δείκτη, δηλαδή ένα μονοπάτι υποδεικνύεται ως 1 εάν αυτό είναι σημαντικά εμπλουτισμένη με το σταθμισμένο στρατηγική επαναδειγματοληψία? Αλλιώς, 0. Για ένα ζευγάρι των οδών συμβολίζεται με

Μια

και

Β

, τέσσερις κατηγορίες προτάθηκαν για να περιγράψουν το μοτίβο συνδυασμό καταστάσεις μετάλλαξης τους, δηλαδή, (α) τόσο οδός Α και β εμπλουτίζονται σημαντικά, και έτσι λιμάνι MutGenes, στο ίδιο δείγμα, (β) οδός Α ήταν σημαντικά εμπλουτισμένη αλλά οδός β δεν ήταν, (γ) οδός β ήταν σημαντικά εμπλουτισμένη αλλά οδός Α δεν ήταν, και (δ) ούτε οδός Α ούτε οδός Β ήταν σημαντικά εμπλουτισμένη. A 2 × 2 πίνακα συνάφειας στη συνέχεια διαμορφώνονται, και ακριβές τεστ του Fisher διεξήχθη για να δείξει εάν συσχετίστηκαν τα προφίλ μετάλλαξη των δύο οδών. Αξίζει να σημειωθεί ότι σε αντίθεση με τις προηγούμενες μελέτες, οι οποίες συνήθως υπολογίζονται όλες οι οδοί που ενεπλάκησαν [9], εδώ θα περιλαμβάνονται μόνο τα σημαντικά εμπλουτισμένη οδούς που εντοπίστηκαν από την μέθοδο του σταθμισμένου αναδειγματοληψία μας, όπως τα γεγονότα μετάλλαξη σε άλλες οδούς θα μπορούσε να αυξηθεί κατά τύχη.

Αποτελέσματα

μελέτη περίπτωσης 1:. αδενοκαρκινώματα πνεύμονα

δοκιμή εμπλουτισμού διαδρομή

για τα δείγματα 33 πνεύμονα αδενοκαρκινώματα που ισχύουν για τη δοκιμή του εμπλουτισμού οδός, ο αριθμός των MutGenes κυμάνθηκε μεταξύ 10 και 49, και οι περισσότεροι (24/33 = 72,72%) ήταν περισσότερο από 20 (Σχήμα S1). Χρησιμοποιώντας τον σταθμισμένο στρατηγική αναδειγματοληψία, 26 δείγματα εντοπίστηκαν να έχουν τουλάχιστον ένα σημαντικά εμπλουτισμένη οδό (

P

Bonferroni & lt? 0,05). Όπως φαίνεται στο Σχήμα 2, ο αριθμός των σημαντικών οδών ποικίλει σε μεγάλο βαθμό μεταξύ των δειγμάτων. Ο μεγαλύτερος αριθμός των σημαντικών οδών παρατηρήθηκαν στο δείγμα 16668, με 34 οδούς σημαντικά εμπλουτισμένη μεταξύ 38 MutGenes (Πίνακας 1), που ακολουθείται από το δείγμα 17.210, με 22 σημαντικές οδούς μεταξύ 49 MutGenes (τα δεδομένα δεν φαίνονται στο Σχήμα 2, λόγω περιορισμένου χώρου ). Τρία δείγματα (δείγματα 17174, 16953 και 16660) με τον ακόλουθο έχουν 17, 14 και 14 σημαντικά μονοπάτια, καθένα από τα οποία έχει 13, 16 και 36 αντίστοιχα MutGenes (Σχήμα 2). Αντίθετα, υπάρχουν πέντε δείγματα που έχουν μόνο μία σημαντική μονοπάτια με βάση τη μέθοδο σταθμικού επαναδειγματοληψία, ενώ MutGenes τους κυμαίνεται μεταξύ 10 και 30, υποδεικνύοντας ότι ο αριθμός των MutGenes έχει μικρότερη επιρροή από τον αριθμό των σημαντικά εμπλουτισμένη οδών σε κάθε δείγμα.

Πορείες εκπροσωπήθηκαν ως ορθογώνια και οργανώνεται από τα δείγματα. Για κάθε δείγμα, το αναγνωριστικό δείγματος παρουσιάζεται στα αριστερά και οι τρεις σειρές στη δεξιά αντιστοιχούν σε αποτελέσματα από τη μέθοδο της σταθμισμένης επαναδειγματοληψία (επάνω σειρά), την τακτική μέθοδο επαναδειγματοληψία (μεσαία γραμμή), και υπεργεωμετρική δοκιμής (κάτω σειρά), αντίστοιχα . Για κάθε μέθοδο, τα μονοπάτια είχαν τοποθετηθεί από αριστερά προς τα δεξιά, σύμφωνα με

P

τιμές τους με χαμηλότερο

P

τιμές στα αριστερά, και, όταν πολλαπλές οδούς έχουν το ίδιο

P

αξίες, που είχαν διαταχθεί με ID τους KEGG. Για να απεικονίσει τη σύγκριση μεταξύ των μεθόδων, κάθε μονοπάτι ανατέθηκε μόνο ένα χρώμα ανάλογο με την κατάταξή του στα αποτελέσματα από το σταθμισμένο αναδειγματοληψία, με πιο σκούρο κόκκινο εμπλέκουν κάτω

P

τιμές. Οι οδοί που προσδιορίζονται από τακτικές επαναδειγματοληψία και υπεργεωμετρική τεστ, αλλά όχι από το σταθμισμένο επαναδειγματοληψία notated στα λευκά. Έτσι, το χρώμα της οδού εμπλέκει κατάταξη της στη μέθοδο σταθμικού επαναδειγματοληψία, και η ασυμφωνία στις άλλες δύο σειρές για ένα δείγμα παρουσιάζει τη διαφορετική κατάταξη χρησιμοποιώντας τις άλλες δύο μεθόδους. Σημειώστε ότι τα δύο δείγματα με τον μεγαλύτερο αριθμό σημαντικά εμπλουτισμένη οδοί δεν παρουσιάστηκαν σε αυτό το σχήμα, λόγω περιορισμών χώρου. Πρόκειται για το δείγμα 16.668 με 34 σημαντικές οδούς και του δείγματος 17210 με 22 σημαντικές οδούς

Η

Τα πιο συχνά μεταλλάσσεται μονοπάτια που συνέβησαν σε περισσότερες από 10 δείγματα είναι hsa05220:. Χρόνια μυελογενή λευχαιμία (13 /26 δείγματα), hsa05212: καρκίνο του παγκρέατος (12/26 δείγματα), hsa05214: γλοιώματος (12/26 δείγματα), hsa05213: ο καρκίνος του ενδομητρίου (11/26 δείγματα), hsa05218: μελανώματος (11/26 δείγματα), και hsa05223: μη μικροκυτταρικό καρκίνο του πνεύμονα (11/26 δείγματα). Το άλλο που σχετίζονται με τον καρκίνο του πνεύμονα οδού, hsa05222: μικροκυτταρικό καρκίνο του πνεύμονα, εμφανίστηκαν σε 3 δείγματα. Πίνακας S1 αναφέρονται τα MutGenes που είναι contributable στον εμπλουτισμό αυτών των οδών σε καθένα από τα αντίστοιχα δείγματα.

Σύγκριση των μεθόδων εμπλουτισμού οδού.

Ως σύγκριση, υλοποιήσαμε και η τυπική Υπεργεωμετρική δοκιμή και η τακτική στρατηγική επαναδειγματοληψία, τα οποία βασίζονται στην υπόθεση ότι όλα τα γονίδια έχουν ίσες πιθανότητες να φέρουν μεταλλάξεις. Για την Υπεργεωμετρική δοκιμή, οι

P

τιμές για κάθε οδό προσαρμόστηκαν με Bonferroni διόρθωση πολλαπλές δοκιμές. Για την τακτική μέθοδο επαναδειγματοληψία, η εμπειρική

P

τιμή για κάθε οδό προσαρμόστηκε επίσης με διόρθωση Bonferroni. Σε όλες τις τρεις μεθόδους, επιλέχθηκαν σημαντικές οδούς όπως αυτές με το

P

Bonferroni & lt? 0,05

σύγκριση των αποτελεσμάτων των διαφόρων μεθόδων με δύο τρόπους:. Τα επικαλυπτόμενα μονοπάτια και την τάξη των επικαλυπτόμενων οδών. Όπως φαίνεται στο Σχήμα 2 και το Σχήμα S3, περίπου τα δύο τρίτα (17 από 26) των δειγμάτων τα αδενοκαρκινώματα του πνεύμονα με ≥1 σημαντικές οδούς έχουν περισσότερα μονοπάτια επικάλυψη μεταξύ της τακτικής μεθόδου επαναδειγματοληψία και υπεργεωμετρικών δοκιμής από εκείνες μεταξύ τακτικής και σταθμισμένης μεθόδους αναδειγματοληψία ή εκείνες μεταξύ υπεργεωμετρικών δοκιμής και μέθοδο του σταθμικού αναδειγματοληψία. Στα περισσότερα δείγματα, τα μονοπάτια που προσδιορίζονται από το σταθμισμένο στρατηγική επαναδειγματοληψία είναι μικρότερες από εκείνες των τακτικών αναδειγματοληψία και πρότυπη δοκιμή υπεργεωμετρική (Πίνακας 1, Σχήμα S3). Στη συνέχεια, εξετάσαμε την κατάταξη των αποτελεσμάτων χρησιμοποιώντας αυτές τις μεθόδους και διαπίστωσε ότι οι δύο μέθοδοι βασίζονται αναδειγματοληψία έδειξε παρόμοια κατάταξη για μονοπάτια, ενώ η σειρά κατάταξης των οδών που αποκτήθηκε από την Υπεργεωμετρική δοκιμή διαφέρει από τις άλλες δύο μεθόδους. Αυτό φαίνεται από την ασυνέπεια των χρωμάτων στην εικόνα 2.

Με δεδομένη την διαφορά της επικάλυψης και της τάξης, παρατηρήσαμε ότι η ανομοιότητα συνήθως συνέβη στο τέλος της λίστας μονοπατιού, ενώ οι τρεις μέθοδοι διαφέρουν μόνο ελαφρώς μεταξύ των πιο σημαντικών οδών. Αυτό το αποτέλεσμα δείχνει ότι η σταθμισμένη στρατηγική επαναδειγματοληψία προσβάλλει κυρίως οριακά σημαντική οδούς, ενώ οι οδοί με ισχυρές ενδείξεις σημάτων εμπλουτισμού ήταν ισχυρή στην προκατάληψη μήκος γονιδίου. Αυτό είναι σύμφωνο με την προηγούμενη εργασία από Wendl et al. [7], ο οποίος διαπίστωσε επίσης ότι οι περισσότερες οδοί που προσδιορίζονται από το πρότυπο Υπεργεωμετρική δοκιμή δεν αποκλίνουν σημαντικά από εκείνες που ταυτοποιούνται μέσω αντικειμενικών μεθόδων, ειδικά για εκείνους που κατατάσσονται στην κορυφή των καταλόγων. Ωστόσο, οι πορείες στο κάτω μέρος των καταλόγων εμπλουτισμού τείνουν να είναι ψευδώς θετικά, και θα μπορούσε να διακριθεί μόνο κατά τη ρύθμιση ρητά τις πιθανές προκαταλήψεις.

Τα μονοπάτια που είναι πιο συχνά προσδιορίζονται από υπεργεωμετρική τεστ, αλλά όχι με σταθμισμένη αναδειγματοληψία περιλαμβάνουν hsa04360: καθοδήγηση νευραξόνων (6/26 δείγματα) και hsa05216: καρκίνο του θυρεοειδούς (5/26 δείγματα), που ακολουθείται από hsa04010: ΜΑΡΚ σηματοδοτική οδό και hsa04012: ErbB μονοπατιού σηματοδότησης σε 4 δείγματα, και όλα τα άλλα, σε λιγότερο από 4 δείγματα. Δεν είναι περίεργο να δούμε το μονοπάτι καθοδήγηση άξονα, επειδή έχει ένα μεγάλο ποσοστό των μακρών γονιδίων, και το μεσαίο μήκος γονίδιο αυτής της οδού πέφτει μέσα στην άνω περιοχή της όλης διανομής (Εικόνα S2). Ομοίως, τα μονοπάτια που είναι πιο συχνά προσδιορίζονται από το πρότυπο αναδειγματοληψία, αλλά όχι από το σταθμισμένο αναδειγματοληψία περιλαμβάνουν hsa04360: καθοδήγηση νευραξόνων σε 5 δείγματα, hsa04010: ΜΑΡΚ μονοπατιού σηματοδότησης σε 4 δείγματα, hsa04012: ErbB μονοπατιού σηματοδότησης σε 4 δείγματα, και άλλοι σε λιγότερο από 4 .. τα δείγματα

διαδρομή στιχομυθία

Ένα σύνολο από 18 δείγματα παρατηρήθηκαν να έχουν τουλάχιστον 2 εκδηλώσεις οδού στιχομυθία (

P

EMP & lt? 0,05). Πραγματοποιήσαμε πολλαπλές διόρθωση δοκιμές, αλλά δεν βρέθηκε εκδήλωση είχε

P

Bonferroni & lt? 0,05. Έτσι, επιλέξαμε τα γεγονότα στιχομυθία με βάση την ονομαστική

τιμές P τους, δηλαδή, εκείνοι με

P

EMP & lt? 0,05. Όπως φαίνεται στο Σχήμα 3, οι χάρτες στιχομυθία αυτών 18 δείγματα έπεσε σε δύο μεγάλες ομάδες: μία ομάδα με εντατικές και ισχυρές άκρες μεταξύ των σημαντικών οδών (Σχήμα 3a-3f, 3Η, και 3L-3o) και ένα άλλο με αραιά συνδεδεμένα δίκτυα. Τα περισσότερα από τα δείγματα στην πρώτη ομάδα σχηματίζεται κλίκες ή κοντά-σε-κλίκα τοπολογικές μονάδες. Εδώ μια κλίκα σημαίνει μια πλήρως συνδεδεμένο γράφημα στο οποίο οποιεσδήποτε δύο κόμβων που συνδέονται με ένα μη-κατευθυνόμενο χείλος. Επιπλέον, οι ονομαστικές

P

τιμές αυτών των γεγονότων αλληλοπαρεμβολών με βάση το σταθμισμένο επαναδειγματοληψία, όπως υποδεικνύεται από το σκοτάδι των ακμών, είναι συνήθως χαμηλότερα από το μεταγενέστερο ομάδα. Τα μονοπάτια που συχνά εμπλέκονται σε αυτή την ομάδα είναι κυρίως σχετίζονται με τον καρκίνο, όπως εκείνες με το αναγνωριστικό τους KEGG ξεκινώντας με hsa052XX (Χ υποδηλώνει οποιοδήποτε ψηφίο) που ανήκουν στις «ανθρώπινες ασθένειες → καρκίνων» κατηγορία KEGG χάρτη [10]. Το αποτέλεσμα αυτό δεν αποτελεί έκπληξη, επειδή στο αρχικό ορισμό των οδών στη βάση δεδομένων KEGG, αυτά τα μονοπάτια του καρκίνου μοιράζονται ένα μεγάλο ποσοστό του συστατικού γονιδίων. Περαιτέρω εξέταση των μεταλλαγμένων γονιδίων έδειξε ότι η κλίκα που βασίζεται στιχομυθία ήταν συνήθως καθοδηγείται από διάφορα «καυτά» MutGenes που συμμετέχουν σε πολλαπλά μονοπάτια σχετίζονται με τον καρκίνο. Για παράδειγμα, τα γονίδια

TP53

και

KRAS

συν-συμβαίνουν σε 11 χάρτες στιχομυθία κλίκα που βασίζεται (Σχήμα 3α-3γ, 3ε, 3στ, 3h, 3L-3ο), όπως κάνουν άλλα γονίδια όπως

RB1 ​​

,

PIK3CD

, και

PDGFRA

.

Για κάθε δείγμα, η κορυφή του πίνακα δείχνει τον χάρτη πορείας στιχομυθία, και το κάτω μέρος πίνακας δείχνει τα γονίδια που συμβάλλουν στην στιχομυθία. Στην επάνω πίνακα, κάθε κόμβος αντιπροσωπεύει ένα μονοπάτι με το χρώμα κόμβο ανάλογη με την οδό εμπλουτισμό

P

αξία. Η ακμή αποτελεί εκδήλωση στιχομυθία μεταξύ των συνδεδεμένων κόμβων (μονοπάτια), με πλάτος άκρη ανάλογη με κοινόχρηστο MutGenes και το χρώμα άκρη ανάλογη με το

P

αξία της εκδήλωσης στιχομυθία. Στον κάτω πίνακα, μια μήτρα δείχνει το προφίλ των γονιδίων στα σημαντικά μονοπάτια, με σειρές για MutGenes και στήλες για οδούς. Όταν ένας MutGene παρατηρείται σε ένα μονοπάτι, το αντίστοιχο κουτί είναι στο κόκκινο.

Η

Πέντε δείγματα σχηματίζεται μια αραιά συνδεδεμένη στιχομυθία χάρτη (Σχήμα 3ζ, 3θ, 3ι, 3k και 3ρ). Παρόλο που σχετίζονται με τον καρκίνο μονοπάτια εξακολουθούν να είναι οι μεγάλες λειτουργικές συμμετέχοντες σε αυτό το είδος του χάρτη, υπάρχουν πρόσθετες οδών που εμπλέκονται, όπως hsa04210: απόπτωσης και hsa04620: μονοπάτι σηματοδότησης ΤοΙΙ υποδοχέα. Διερεύνηση των MutGenes σε αυτού του είδους δεν δείχνουν μια ισχυρή τάση προς οποιοδήποτε γονίδιο (α) συμβάλλοντας ουσιαστικά στα γεγονότα στιχομυθία, όπως παρατηρείται στην κλίκα-ομάδα. Τέλος, δύο δείγματα εμφανίζονται τα σπανιότερα γεγονότα στιχομυθία (Σχήμα 3q και 3R), τα οποία κυριαρχούνται από τα γονίδια

APC

και

TP53

.

Pathway συν-μετάλλαξη προφίλ.

για να διερευνήσει τα γεγονότα που συν-μετάλλαξη που συμβαίνουν μεταξύ των οδών, ξεκινήσαμε με μια λίστα με σημαντικά εμπλουτισμένη μονοπάτια για κάθε δείγμα (βλέπε παραπάνω). Για να διασφαλιστεί η υψηλή ποιότητα, μονοπάτια που έφεραν MutGenes αλλά δεν ήταν σημαντικές σε ένα δείγμα δεν συμπεριελήφθησαν για αυτό το δείγμα στην ανάλυση συν-μετάλλαξη. Ως αποτέλεσμα, συνολικά 49 οδούς και 26 δείγματα είχαν εμπλακεί.

Έχουμε επιλέξει μονοπάτια που ήταν συν-μεταλλάσσεται σε 2 ή περισσότερα δείγματα, και είχε ένα συν-εμφάνισης

P

τιμή που ήταν ονομαστικά σημαντική. Όπως φαίνεται στο Σχήμα 4, δύο ομάδες αυτο-συγκεντρωμένα, ένα από τα οποία περιλαμβάνει αρκετές σχετιζόμενη με τον καρκίνο οδούς, και η άλλη περιέχει αρκετές συνδέονται με το ανοσοποιητικό οδούς. Στο σύμπλεγμα σχετίζονται με τον καρκίνο, παρατηρήσαμε hsa05214: γλοιώματος, hsa05218: μελάνωμα, hsa05219: καρκίνος της ουροδόχου κύστης, hsa05220: χρόνια μυελοειδή λευχαιμία, και hsa05212: καρκίνο του παγκρέατος. Είναι ενδιαφέρον, παρατηρήσαμε αρκετές συνδέονται με το ανοσοποιητικό μονοπάτια στο άλλο σύμπλεγμα, όπως hsa04650: φυσικών φονικών κυττάρων κυτταροτοξικότητα, hsa04660: σηματοδότηση του υποδοχέα των Τ κυττάρων οδού, hsa04662: μονοπατιού σηματοδότησης υποδοχέα Β κυττάρων, και hsa04210:. Απόπτωση

κόμβος αντιπροσωπεύει μονοπάτια που έχουν προσδιοριστεί ως σημαντικά σε τουλάχιστον ένα δείγμα. Μια ακμή μεταξύ των οδών δείχνει μια σημαντική εκδήλωση συν-μετάλλαξη, με πλάτος άκρη ανάλογη με τον αριθμό των δειγμάτων που συμβαίνουν από την εκδήλωση συν-μετάλλαξη, και το χρώμα άκρη εκπροσωπούν τις

P

αξίες της εκδήλωσης. Πιο σκούρο άκρη υποδηλώνει χαμηλότερα

P

τιμές

Η

Μελέτη περίπτωσης 2:. Γλοιοβλάστωμα

Για τους MutGenes γλοιοβλάστωμα, υπήρχαν συνολικά 18 δείγματα που είναι επιλέξιμες για τον εμπλουτισμό της οδού δοκιμής (Σχήμα S1), καθένα από τα οποία έπρεπε να έχουν τουλάχιστον 5 MutGenes. Η εφαρμογή όλων των τριών μεθόδων, δηλαδή σταθμισμένη αναδειγματοληψία, τακτική επαναδειγματοληψία, και το υπεργεωμετρική δοκιμή, βρήκαμε 15 δείγματα εμπλουτίστηκαν με τουλάχιστον ένα μονοπάτι από τις σταθμισμένες μεθόδους επαναδειγματοληψία, και αυτά τα δείγματα χρησιμοποιήθηκαν για την επακόλουθη ανάλυση.

όπως φαίνεται στο Σχήμα 5, η παρόμοια τάση του μονοπατιού επικάλυψη και την κατάταξή παραγγελία έχει παρατηρηθεί σε δείγματα GBM όπως στα δείγματα αδενοκαρκινώματα του πνεύμονα. Η σειρά κατάταξης μεταξύ των δύο αναδειγματοληψία μέθοδοι είναι πιο κοντά ο ένας στον άλλο, και σε όλα τα δείγματα 15 GBM οι επικαλυπτόμενες οδούς βρίσκονται πιο συχνά στην τακτική μέθοδο επαναδειγματοληψία και υπεργεωμετρική τεστ σε σχέση με τα σταθμισμένα αποτελέσματα αναδειγματοληψία (Σχήμα S4). Οι πιο συχνά εμπλουτίζονται μονοπάτια είναι hsa05200: μονοπάτια στον καρκίνο (11/15 δείγματα), που ακολουθείται από hsa05214: γλοιώματος (9/15 δείγματα), hsa05218:. Μελάνωμα (9/15 δείγματα), και ούτω καθ ‘εξής (Σχήμα 5)

Πορείες εκπροσωπήθηκαν ως ορθογώνια και οργανώνεται από τα δείγματα.

You must be logged into post a comment.