PLoS One: Λειτουργική Copy-Αριθμός Τροποποιήσεις στον Καρκίνο


Αφηρημένο

Η κατανόηση της μοριακής βάσης του καρκίνου απαιτεί τον χαρακτηρισμό των γενετικών ελαττωμάτων του. τεχνολογίες μικροσυστοιχιών DNA μπορούν να παρέχουν λεπτομερείς ανεπεξέργαστα δεδομένα σχετικά με χρωμοσωμικές εκτροπές σε δείγματα όγκων. Υπολογιστική ανάλυση είναι απαραίτητη (1) για να συναγάγει από πραγματικά γεγονότα ενίσχυση ή τη διαγραφή δεδομένων πρώτων σειρά για χρωμοσωμικές θραύσματα και (2) να διακρίνει αιτιώδη χρωμοσωμικές αλλοιώσεις από λειτουργικά ουδέτερα. Σας παρουσιάζουμε μια ολοκληρωμένη υπολογιστική προσέγγιση, η ΡΑΕ, με σκοπό να χαρτογραφήσει σθεναρά χρωμοσωμικές αλλοιώσεις σε δείγματα όγκων και να αξιολογούν λειτουργική σημασία τους για τον καρκίνο. Για να αποδείξει τη μεθοδολογία, μπορούμε πειραματικά προφίλ αριθμό αντιγράφων αλλαγές σε κλινικά επιθετική υπότυπο του σαρκώματος των μαλακών μορίων, πλειομορφικές λιποσάρκωμα, και υπολογιστικά αντλούν ένα πορτρέτο του υποψηφίου ογκογόνων αλλαγές και γονιδίων-στόχων τους. Πολλοί επηρεάζονται γονίδια είναι γνωστό ότι εμπλέκονται σε sarcomagenesis? άλλες είναι νέες, συμπεριλαμβανομένων μεσολαβητές της διαφοροποιήσεως των λιποκυττάρων, και μπορεί να περιλαμβάνει πολύτιμα θεραπευτικοί στόχοι. Στο σύνολό τους, παρουσιάζουμε μια στατιστικά ισχυρή μεθοδολογία που ισχύει για γονιδιακά δεδομένα υψηλής ανάλυσης για να εκτιμήσει την έκταση και τη λειτουργία του αριθμού αντιγράφων μεταβολές στον καρκίνο

Παράθεση:. Taylor BS, Barretina J, Socci ΝΔ, DeCarolis P, Ladanyi Μ, Meyerson Μ, et al. (2008) λειτουργικό αντίγραφο Αριθμός Τροποποιήσεις στον Καρκίνο. PLoS ONE 3 (9): e3179. doi: 10.1371 /journal.pone.0003179

Συντάκτης: Greg Γκίμπσον, Το Πανεπιστήμιο του Κουίνσλαντ, Αυστραλία

Ελήφθη: 7, Αυγούστου, 2008? Αποδεκτές: 19 Αύγ 2008? Δημοσιεύθηκε: 11 Σεπτέμβρη του 2008

Copyright: © 2008 Taylor et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Αυτό το έργο υποστηρίχθηκε εν μέρει από: μαλακό ιστό του σαρκώματος Πρόγραμμα Έργου (P01 CA047179, SS, NDS και CS), το σάρκωμα Γονιδιώματος, καθώς και από το Kristen Ann Ταμείο Carr. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

καρκίνος του Ανθρώπου προκαλείται εν μέρει από μη αναστρέψιμες δομικές μεταλλάξεις. Αυτές μπορούν να παράγουν αλλαγές στο DNA αριθμού αντιγράφων σε διακριτές θέσεις στο γονιδίωμα [1]. Παρεκκλίσεις αυτού του τύπου επηρεάζουν τη λειτουργία των γονιδίων και έτσι να παράγει ένα μετασχηματισμένο φαινότυπο. Περιεκτική χαρακτηρισμός αυτών των εκτροπών είναι ένα απαραίτητο βήμα στην κατανόηση αιτιολογία της νόσου και την προώθηση της ανάπτυξης των στοχευμένων θεραπειών [2], [3], [4], [5], [6], [7]. Τεχνικές που βασίζονται στις τεχνολογίες των μικροσυστοιχιών μπορεί να μετρήσει ταυτόχρονα χιλιάδες σε εκατομμύρια θέσεις στο γονιδίωμα για τον αριθμό αλλαγών αντιγραφής του DNA. Περιλαμβάνουν σειρά συγκριτική γονιδιωματική υβριδισμού (array CGH) και μόνο-νουκλεοτιδίου πολυμορφισμός (SNP) συστοιχιών (αναθεωρηθούν [8]). Οι όλο και περισσότερο ευαίσθητες τεχνολογίες έχουν χρησιμοποιηθεί για να χαρακτηρίσει όχι μόνο εκτροπές στον καρκίνο, αλλά επίσης για να περιγράψει παραλλαγή αριθμού αντιγράφων στον ανθρώπινο πληθυσμό [9], και η βάση των γενετικών διαταραχών (που επισκοπείται στο [10]).

Λόγω της ικανότητάς της να εντοπίσει τα νέα ογκογονίδια και ογκοκατασταλτικά γονίδια του καρκίνου, έχουν δύο στρατηγικές έχουν χρησιμοποιηθεί για την ανάλυση των δεδομένων συστοιχίας αριθμό αντιγράφων από όγκους. Τα παραδοσιακά τμήματα προσέγγιση θορυβώδη δεδομένα αισθητήρα επιπέδου σε επιμέρους όγκους (διαίρεση του γονιδιώματος σε περιοχές αριθμό ίσο αντίγραφο) [11], [12], ανιχνεύει εκτροπές με ένα παγκόσμιο όριο, και ευρετικά καθορίζει τα όρια των περιοχών της συχνής αλλαγής [13] , [14]. Νεότερο αλγοριθμικές στρατηγικές χρήση στατιστικών μοντέλων για την ανάλυση πολλαπλών δειγμάτων [15], [16], [17]. Πιο πρόσφατα, Beroukhim et al. πρότεινε μια ενδιαφέρουσα ολοκληρωμένο πλαίσιο για την αξιολόγηση του αριθμού αντιγράφων μεταβολή ομάδες όγκου [18]. Παράλληλα με αυτές τις υπολογιστικές εξελίξεις, οι προσπάθειες βρίσκονται σε εξέλιξη για την ανάλυση μεγάλων συλλογών όγκου σε μια ποικιλία τύπων καρκίνου, όπως η πιλοτική φάση του καρκίνου Γονιδιώματος Atlas [19] [ο καρκίνος Γονιδιώματος Atlas (TCGA) Δίκτυο Έρευνας 2008, που υποβλήθηκε]. Αυτά θα πρέπει να συλλέγονται με τη χρήση διαφόρων πηγών και τα κριτήρια που ενδέχεται να οδηγήσει σε ετερογένεια ενδο-όγκου και μεταξύ όγκων μεταβλητότητα. Ως εκ τούτου, σημαντικά εκκρεμή ζητήματα παραμένουν. Πώς πρέπει μεταβολές σε επιμέρους όγκους να ανιχνευθεί και να συνδυαστούν όταν μια συλλογή των δειγμάτων διαφέρουν σημαντικά ως προς τα χαρακτηριστικά του θορύβου τους; Πώς θα πρέπει να διαιρεθεί το γονιδίωμα και να αξιολογούνται με πιο φυσικά αντικατοπτρίζουν το πώς να προκύψουν αλλαγές; Ποια είναι τα χαρακτηριστικά μιας ρεαλιστικής φόντο μοντέλο που επιτρέπουν την ταυτοποίηση των στατιστικά σημαντικά επαναλαμβανόμενες και ως εκ τούτου πιο πιθανό λειτουργικές μεταβολές;

Σε αυτό το άρθρο, περιγράφουμε ένα υπολογιστικό πλαίσιο που καλύπτει κάθε πτυχή αυτού του προβλήματος. Εμείς (i) την ανάπτυξη διακριτών μοντέλων βαθμολόγησης για διαφορετικούς τύπους αλλοίωση, με παραμέτρους προσαρμοσμένο στα χαρακτηριστικά των μεμονωμένων όγκων, (ii) χρησιμοποιούν σημεία διακοπής κατάτμηση για να διαιρέσει το γονιδίωμα για την ανάλυση που τονίζει τη φυσική φύση του αριθμού αντιγράφων αλλοίωση, (iii) την κατασκευή ένα τυχαίο μοντέλο εκτροπή που προσεγγίζει τη βιολογική διαδικασία με την οποία προκύπτουν αλλαγές, και να το χρησιμοποιήσετε για να (iv) την εκτίμηση της στατιστικής σημαντικότητας των παρατηρούμενων αλλαγών. Αυτό προσδιορίζει γονιδιωματικές περιοχές ενδιαφέροντος (ROI) μεταβάλλεται συχνότερα από ό, τι θα αναμενόταν από την τύχη, και συνεπώς πιο πιθανό να οδηγούν ογκογένεση (Σχήμα 1). Εφαρμόζουμε τη μέθοδο μας σε μια μεγάλη αποθήκη των συμπαγών όγκων να δοκιμάσει τις επιδόσεις του. Εφαρμόζουμε επίσης τη ΡΑΕ σε μια νέα υψηλής ανάλυσης αριθμού αντιγράφων σύνολο δεδομένων που παράγονται στα εργαστήρια μας για ένα σύνολο πλειομορφικές δείγματα λιποσάρκωμα για να τονίσει την ικανότητά της να οδηγήσει σε νέες ανακαλύψεις

Input είναι ένα σύνολο των ασθενών.? DNA του όγκου, (un) συμφωνημένα DNA μη-όγκου, και μια άσχετη αναφορά κανονική ομάδα. Τα δείγματα όγκου και μη όγκου ποσοτικά, κανονικοποιούνται, και υπόκεινται σε έλεγχο ποιότητας. Στη φάση της αξιολόγησης, τα μεμονωμένα δείγματα κατά διαστήματα και ένα πολυ-συστατικό μοντέλο παραμετροποιείται για κάθε μία? Αυτό παράγει έναν ανιχνευτή για κέρδος μονού αντιγράφου, ενίσχυση, ημίζυγος απώλεια, και ομόζυγη διαγραφή. Σε όλες τις όγκους, ένα ενιαίο σημείο διακοπής προφίλ (UBP) προέρχεται από το σύνολο των οριακών σημείων κατάτμησης, και κάθε περιοχή σκόραρε για το κέρδος και την απώλεια. Ένα μοντέλο φόντο τυχαίας εκτροπών κατασκευάζεται με συμπληρωματική διάσπαση και μετάθεση των γονιδιωματικών περιοχών, και ρ-τιμές έχουν εκχωρηθεί και διορθώθηκαν για πολλαπλές δοκιμές υπόθεση. Κατά τη φάση της παραγωγής, η ΡΑΕ καθορίζει γονιδιωματική όρια για τις περιοχές ενδιαφέροντος (ROI), ελέγχους για βλαστικής σειράς και τον πληθυσμό μεταβολής αριθμού αντιγράφων, και τις εκθέσεις στατιστικά σημαντικές μεταβολές.

Η

Αποτελέσματα

Εξωγενείς πηγές διακύμανσης

κατά την πρώτη φάση της ΡΑΕ, θα αντιμετωπίσει το ζήτημα της αξιόπιστα την ανίχνευση αριθμού αντιγράφων αλλαγή σε επιμέρους όγκους. Κάθε όγκος, συμπεριλαμβανομένων εκείνων από ασθενείς με τον ίδιο τύπο καρκίνου, ποικίλλει σε χαρακτηριστικά θορύβου τους. Έχουμε επικεντρωθεί εδώ στη πειραματικού θορύβου και το πρόβλημα της ανομοιογένειας του DNA του όγκου. Μια πρόσθετη πηγή της βιολογικής θορύβου είναι διαρθρωτική μεταβολή, η οποία θα αντιμετωπίσει αργότερα. Όσον αφορά το πρώτο, βρήκαμε τουλάχιστον τέσσερις διαφορετικές αιτίες που μπορεί να συγκαλύψει αριθμό αντιγράφων αλλάζει σε έναν όγκο και αυτό παρακινεί την αναχώρησή μας από την παγκόσμια όρια για την ανίχνευση αλλοιώσεων. Περιλαμβάνουν (i) χαμηλής ποιότητας αντίστοιχα δείγματα DNA μη-όγκου, (ii) στρωματικά πρόσμιξη, (iii) η ετερογένεια του όγκου, και (iv) ασυνάρτητη προφίλ του όγκου, και συζητάμε καθένα με τη σειρά.

Διακύμανση του ποιότητα του ταιριάζει φυσιολογικά δείγματα.

Πολλές ομάδες, συμπεριλαμβανομένης και της δικής μας, έχουν παρατηρηθεί σημαντικές μη-διπλοειδή αριθμό αντιγράφων σε ορισμένα φυσιολογικά δείγματα (Σχήμα S1). Αιτίες μπορεί να περιλαμβάνει τον ιστό πηγή (στην περίπτωση του

φυσιολογικό

ιστό δίπλα σε όγκο), διαφέροντας πρωτόκολλα χειρισμού μεταξύ όγκου και φυσιολογικών δειγμάτων, προηγούμενη χημειοθεραπεία στο DNA των φυσιολογικών κυττάρων του αίματος, κυκλοφορούντων καρκινικών κυττάρων, και άλλων μόλυνση του κανονικό DNA. Σε μια

σε συνδυασμό

ανάλυση, αυτή η μη-ουδέτερο σήμα θα μετριάσει ή με άλλο τρόπο να αλλάξει το σήμα του όγκου. Για να αποφευχθεί αυτό, θα αντικαταστήσει μια αναφορά κανονικό σύνολο δεδομένων των γνωστών διπλοειδή φαινότυπο και την ανάλυση των όγκων σε ένα αταίριαστο μορφή (Μέθοδοι). Η αναφορά αυτή δημιουργείται από την τυχαία επιλογή ενός υποσυνόλου άσχετα άτομα της συλλογής HapMap, και παράγει ένα συνεπές διπλοειδή σήματος για την ποσοτικοποίηση του όγκου και ομαλοποίηση (Methods S1, πίνακας S1, S2 και το Σχήμα). Εμείς περαιτέρω μείωση του θορύβου σε αυτό το νέο δείκτη της έντασης από την κατάτμηση επιμέρους όγκους [11], [12]. Η διαδικασία αυτή συσχετίζει τις γειτονικές δείκτες των κοινών αριθμού αντιγράφων, αναθέτοντας ο αριθμητικός μέσος όρος σήμα του αισθητήρα στάθμης σε όλη τους δείκτες σε κάθε τμήμα (Μέθοδοι). Ενώ αποφεύγουμε τη χρήση ταιριάζει κανονικό DNA σε αυτό το βήμα, χρησιμοποιούμε ένα υψηλής ποιότητας υποσύνολο για εκδήλωση βλαστική φιλτράρισμα μετά από στατιστική αξιολόγηση (Μέθοδοι).

στρωματικά πρόσμιξη.

Η δεύτερη πηγή του θορύβου είναι ακαθαρσία όγκου, ένα καλά τεκμηριωμένο πρόβλημα [20], [21]. Μεμονωμένα όγκοι έχουν διαφορετικά επίπεδα μόλυνσης κυττάρων μη-όγκου. Αυτό μειώνει την αναλογία σήματος προς θόρυβο εντός και μεταξύ των όγκων. Θέτει σε κίνδυνο και ακριβή προσδιορισμό του γονότυπου για ταυτόχρονη απώλεια-του-ετεροζυγωτίας (ΑΕ) αναλύσεις. Αυτό θέτει σε κίνδυνο την ανίχνευση των δύο σημαντικές κατηγορίες αλλοίωση: copy-ουδέτερη και διαγραφής που σχετίζονται ΑΕ. Μόλυνση του DNA του όγκου των μη νεοπλασματικών κυττάρων DNA ασκεί την επίδρασή της σε παγκόσμιο επίπεδο, εξίσου καταστολή σήμα σε όλες τις θέσεις σε έναν όγκο. Η λύση μας είναι διττός. Κατ ‘αρχάς, παίρνουμε μια προσέγγιση μεμονωμένων όγκων στον καθορισμό κατώτατων ορίων στο ημερολόγιο

2 σήμα για την ανίχνευση ανωμαλιών, αποσπώντας έτσι πληροφορίες από όγκους που αλλιώς δεν παρέχουν επαρκή σήμα για τον εντοπισμό μη διπλοειδή αριθμό αντιγράφων αλλάζει σε σύγκριση με τα επίπεδα τελειότητας δείγματα όγκων. Δεύτερον, έχουμε τυποποιήσει το μέγεθος της αλλοίωσης σε όλους τους όγκους για τη διευκόλυνση των όγκων-συγκρισιμότητα, ένα σημαντικό χαρακτηριστικό κατά τη σύγκριση των όγκων διαφόρων στρωματικών πρόσμιξη.

Tumor ετερογένεια.

Η τρίτη πηγή θορύβου είναι ίσως το πιο σύγχυση. Βλέπουμε απόδειξη ενός ενδιάμεσου αριθμού αντιγράφων σε πολλούς τύπους όγκων. Για παράδειγμα, όταν η αξία ενός μονοσωμία (ή ChrX σε έναν άνδρα ασθενή), καθορίζει, με την εμπιστοσύνη της συνεχούς καταγραφής

2 τιμή που αντιστοιχεί σε διακριτά απώλεια αντίγραφο ακέραιο, αυτό το σήμα είναι συχνά μια απώλεια βραχίονα μήκους που πέφτει στα μισά του δρόμου μεταξύ διπλοειδή και το ημερολόγιο

2 αξία της απώλειας με ένα μόνο αντίγραφο. Αυτό μπορεί να είναι αλληλόμορφο-ειδική αριθμού αντιγράφων αποκλειστική είτε στο μητρικό ή πατρικό χρωμόσωμα, ή πιο πιθανό υποδεικνύει την πιθανότητα ότι υπάρχουν πολλαπλές διακριτές αλλά συναφείς υποκλώνοι εντός ενός κλωνική όγκου. Όταν η απώλεια μονό αντίγραφο ενός χρωμοσώματος υπάρχει σε ένα μόνο από δύο διακριτούς πληθυσμούς κυττάρου όγκου, υπάρχει μία συνέλιξη της αλλοίωσης, μειώνοντας το μέγεθος της εκδήλωσης όταν μετράται από το μικτό πληθυσμό (Εικόνα S3). Ως εκ τούτου, πολλαπλές καρκινικών κυττάρων πληθυσμούς υποτιθέμενο επηρεάζουν διαφορικά σήμα σε ένα

τοπικό

τρόπο, σε ξεχωριστές περιοχές με τον ίδιο όγκο. Ως εκ τούτου, επιλέξαμε μια εναλλακτική ατομική-όγκου σε ένα παγκόσμιο όριο για τροποποίηση, ο πρώην είναι πιο ευαίσθητη στην ανίχνευση αυτού του είδους των αινιγματικό μήνυμα.

ασυνέπεια του προφίλ αριθμό αντιγράφων.

Τέλος, ανακρίβεια σε αριθμό αντιγράφων τμηματοποίηση είναι η τελευταία εξωγενή πηγή διακύμανσης συμβιβασμούς ανίχνευσης εκδήλωση σε επιμέρους όγκους. Ένα μεγάλο μέρος των πληροφοριών που κωδικοποιείται από τα αρχικά δεδομένα αισθητήρα επιπέδου σχετικά με πυκνά συστοιχίες, όπως η Affymetrix 250 συστοιχία Κ SNP. Τμηματοποίηση έχει σχεδιαστεί για να μειώσει αυτό το περιεχόμενο των πληροφοριών σε ένα ελάχιστο σύνολο διακριτών κέρδη, απώλειες, και ουδέτερο αριθμό αντιγράφων. Η μεγαλύτερη μείωση σε πληροφορίες που είναι σε δείγματα που παράγουν μερικά τμήματα, και τουλάχιστον σε δείγματα υψηλό αριθμό τμημάτων (Σχήμα S4). Ωστόσο, αυτό δεν έχει συνεκτική σχέση για την ανίχνευση επιπέδου θορύβου (Εξ. 1, Μέθοδοι). Κατά συνέπεια, επειδή τα χαρακτηριστικά του θορύβου ανιχνευτή επιπέδου είναι διαφορετικά από εκείνα της κατάτμησης, χρησιμοποιούμε μόνο τα τελευταία σε όλα τα επόμενα στάδια της ανάλυσης.

Μοντέλο

Πολυσυνθετικά βαθμολόγησης για αριθμό αντιγράφων αλλοίωση

για να προσαρμοστούν σε αυτήν την ποικιλομορφία της διακύμανσης μεταξύ των επιμέρους όγκων, έχουμε αναπτύξει ένα ρυθμιζόμενο μοντέλο πολλαπλών στοιχείων για την ανίχνευση ανωμαλιών, το πρώτο κύριο χαρακτηριστικό της ΡΑΕ. Ξεκινάμε με τον διαχωρισμό κατά διαστήματα αριθμού αντιγράφων σε τέσσερα

εξαρτήματα

, κάθε κωδικοποιεί το καθεστώς του τύπου αλλοίωση? κέρδος και μόνο-αντίγραφο (Α

0), ενίσχυση (Α

1), ημιζυγωτική απώλεια (D

0), και ομόζυγη διαγραφή (D

1). Αυτό διαχωρίζει τόσο την ανάλυση του συνολικού κέρδους από την απώλεια, αλλά και συγκεκριμένες και διαισθητική τάξεις του καθενός. Αυτό είναι απαραίτητο, διότι κάθε μεταβολή παρουσιάζει διαφορετικές αναλυτικές προκλήσεις, όχι μόνο στην δυναμική περιοχή, αλλά και ως προς τα χαρακτηριστικά του θορύβου τους, που συχνά παραβλέπεται. Επίσης, με διαίρεση των συνολικών σήμα σε αυτές τις τέσσερις διαφορετικές κατηγορίες, είναι δυνατόν το μοντέλο μπορεί να εξάγει περισσότερες πληροφορίες και να παράγουν μεγαλύτερη ακρίβεια σε μεμονωμένες κλήσεις περίπτωση.

Gain.

Κατά την ανάλυση ενός συνόλου όγκων, υπάρχουν δύο χαρακτηριστικά που περιγράφουν αριθμού αντιγράφων κέρδος, συχνότητα και πλάτος. Στο επίπεδο ενιαίο δείγμα, αυτό ισοδυναμεί με ένα «ανιχνευτής» και μια «ολοκληρωτή», ο πρώην αναγνώριση της ύπαρξης ενός γεγονότος και ο τελευταίος που την ανάθεση ενός μεγέθους ανάλογο με την αρχική του πλάτους του. Εμείς αιτιολογημένη ότι κωδικοποιεί την ανίχνευση ενός συμβάντος ξεχωριστά από το πλάτος του θα είχε αρκετά πλεονεκτήματα: (i) ένας ανιχνευτής λειτουργεί στο περιθώριο του σήματος και του θορύβου και πρέπει να είναι ανθεκτική στην εισαγωγή του σήματος άγριου τύπου, (ii) επειδή πλάτος είναι απεριόριστη και ποικίλλει ως συνάρτηση της μόλυνσης στρωματικών, θα πρέπει να τυποποιηθεί για να διευκολύνει τη συγκρισιμότητα μεταξύ των όγκων, και (iii) σε στατιστικό μοντέλο μας που ελέγχει κατά πόσον η μεταβολή υπερβαίνει ένα τυχαίο ποσοστό εκτροπή, η οποία βασίζεται κατά κύριο λόγο σχετικά με την επανάληψη σε όλη δείγματα, εμείς θέλουν να ενισχύσει τη δύναμή μας για την ανίχνευση σπάνια αλλά πολύ υψηλής έντασης γεγονότα. Έτσι, αυτά κωδικοποιούνται χωριστά ως κέρδος και μόνο-αντίγραφο (Α

0) και ενίσχυση (Α

1).

Απώλεια.

Έχουμε προσεγγίσει την ανάλυση της γονιδιωματικής απώλεια ελαφρώς διαφορετικά, αν και με ένα παρόμοιο εννοιολογικό πλαίσιο. Υπάρχουν πολλές μοναδικές προκλήσεις σε αλληλόμορφες απώλειες που δικαιολογεί μια τροποποιημένη προσέγγιση, και το καθένα από αυτά έχει μια σημαντική βιολογική συνέπεια. Κατ ‘αρχάς, η διαγραφή περιορίζεται στο φάσμα της? μόνο δύο αντίγραφα μιας θέσεως μπορεί να χαθεί. Αυτό είναι διαφορετικό από την ενίσχυση. Λείπει πραγματικό μέγεθος, το DNA είναι είτε «παρούσα» ή «απούσα», και ως εκ τούτου ένα πανομοιότυπο σύστημα βαθμολόγησης θα ήταν ακατάλληλη. Αυτή η πλήρης απουσία σήματος (ή μέγεθος) αντιστοιχεί στο ομόζυγη διαγραφή. Η δεύτερη αναλυτική επιπλοκή είναι αρνητική ασυμμετρία στην κατανομή της κατάτμησης σε όλο τον διπλοειδή κορυφή (Σχήμα S5). Μέχρι στιγμής, αυτό είναι ένα χαρακτηριστικό μοναδικό για γονιδιωματική απώλεια και περιπλέκει την ανίχνευση ημίζυγος απώλεια όταν μετάβαση του από το σήμα άγριου τύπου εμφανίζεται featureless. Παρ ‘όλα αυτά, με ακρίβεια ανιχνεύει την απώλεια με ένα μόνο αντίγραφο είναι σημαντική. Η βιολογική παράλληλος είναι ένα κλασικό ογκοκατασταλτικό μοντέλο, μία στην οποία σωματική μετάλλαξη ή μεθυλίωση σε ένα αλληλόμορφο είναι συζευγμένη με απώλεια του άλλου. Αυτές οι απώλειες είναι συχνά ευρεία, και μπορούν να στοχεύουν πολλαπλούς γενετικούς τόπους, μειώνοντας τη λειτουργία περισσότερων από ένα γονίδιο. Ωστόσο, αυτό πέφτει στο περιθώριο της ανιχνευσιμότητας σε ένα τέτοιο σύστημα θορυβώδες. Για να ξεπεραστούν αυτές τις πολυπλοκότητες, μπορούμε επίσης να διαχωρίσει τη διαγραφή σε δύο συνιστώσες. Σε αντίθεση με το μοντέλο για το κέρδος, οι δύο συνιστώσες «ανιχνευτές», ένα για ημίζυγος απώλεια (D

0), και το άλλο για ομόζυγη διαγραφή (D

1) (παραμετροποίηση συζητείται στο Methods S1).

Soft διακρίσεις.

Αν και υπάρχουν πολλές επιλογές για την ανίχνευση αυτών των τύπων αλλοίωση, ένα βασικό χαρακτηριστικό της προσέγγισής μας είναι η χρήση του

μαλακό

διακρίσεις. Παρέχοντας ένα ισχυρό (και δυαδική) τιμή για την ύπαρξη ενός γεγονότος σε ένα θορυβώδες σύστημα είναι δύσκολη. Αυτό επιδεινώνεται για εκδηλώσεις μονό αντίγραφο στο περιθώριο του σήματος και του θορύβου. Κατά συνέπεια, διαπιστώσαμε ότι ακόμα και μετά από κατάτμηση, ένα σύνολο δεδομένων σε επίπεδο καταγραφής

2 κατώτατο όριο για την ανίχνευση μεταβολή μικρότερη από την αναμενόμενη σε μια τέτοια θορυβώδη σύστημα (τα δεδομένα δεν παρουσιάζονται). Εναλλακτικά, υπάρχει σημαντικό προηγούμενο για τη χρήση μαλακών διακρίσεως σε θορυβώδη συστήματα, και έχουμε προσαρμόσει αυτή την αρχή για την ανίχνευση αριθμού αντιγράφων αλλοίωση. Για παράδειγμα, ας θεωρήσουμε αλλοίωση μιας θέσεως σε δύο όγκους, και οι δύο έχουν παρόμοια εύρη. Ο πρώην υπερβαίνει ένα

σκληρά

κατώφλι κατά ένα μικρό μέγεθος? ο τελευταίος δεν το κάνει, αλλά και πάλι με μόνο ένα μικρό μέγεθος. Είναι απίθανο ότι αυτό ονομαστικά παρόμοια θέση αποτελέσματα και σε διαφορετική βιολογία στην πρώην, αλλά το τελευταίο τιμωρείται αποτελεσματικά (Εικόνα 2Α). Έτσι, για να πετύχετε ένα απαλό διακρίσεων κάθε είδους αλλοίωση, χρησιμοποιούμε μια συνάρτηση σιγμοειδούς με παραμέτρους για την τοποθεσία (

E

) και κλίση (

β

) (Σχήμα 2Β, Μέθοδοι). Αυτή η λειτουργία χάρτες συνεχούς καταγραφής

2 αναλογίες, θεωρητικά εκτείνεται ± ∞, σε μια σταθερή τιμή μεταξύ 0 και ± 1 (ανάλογα με το ζώδιο του

β

). Μεταβάλλοντας το μέγεθος του

β

, μπορούμε να κάνουμε τη λειτουργία συμπεριφέρονται περισσότερο ή λιγότερο σαν ένα αιχμηρό όριο. Επιπλέον, επειδή οι παράμετροι (

E

,

β

) καθορίζονται από τα επιμέρους στοιχεία του όγκου και προσαρμόζονται σε κάθε τύπο αλλοίωσης, μπορούμε να ποικίλει ευαισθησία της συνάρτησης, να ικανοποιηθούν οι πολύ διαφορετικά πρότυπα θορύβου στο παρελθόν συζητήθηκε (Σχήμα 2C, Methods S1). Αυτή η προσαρμοστική παραμετροποίηση είναι επίσης ένας μηχανισμός με τον οποίο μπορούμε να εξάγουμε πληροφορίες από ακόμη και τις πιο δύσκολες προφίλ των όγκων. Αυτή η ευελιξία εξαλείφει εν μέρει την ανάγκη για υποκειμενική ποιότητα ελέγχου στην εξάλειψη των θεμελιωδώς uninformative δειγμάτων. Για τις μεμονωμένες όγκοι έχουν ένα πολύπλοκο και /ή ασυνάρτητη μοτίβο σήματος (Σχήμα S5), παραμετροποίηση παράγει συντηρητικές αξίες του

E

και

β

για κάθε τύπο αλλοίωσης, καταστέλλοντας ένα μεγάλο κλάσμα της συνολικής σήμα από το σχεδιασμό. Αυτό είναι ιδιαίτερα σημαντικό για την ανάλυση των ασυνήθιστο τύπους όγκων, όπου πρώτη ύλη είναι σε ένα ασφάλιστρο και την εξάλειψη των δειγμάτων μια ξεχωριστή μειονέκτημα. Τέλος, όταν τα μαλακά διευκρινιστές για το κέρδος και μόνο-αντίγραφο και μονο- και διαλληλόμορφο απώλειες σε συνδυασμό σε όλους τους όγκους, είναι μια ένδειξη για την επανάληψη του κάθε τύπο αλλοίωσης. Αυτή η συνάθροιση της ζήτησης σε όγκους είναι το θέμα της επόμενης ενότητας

(α) Σε ένα θορυβώδες σύστημα, ένα μαλακό διάκρισης (κόκκινη) αντιπαρατίθεται σε ένα σκληρό όριο (μαύρο).? δύο εκ των οποίων ορίσετε σημεία, είτε συνεχής ή δυαδικές τιμές, αντίστοιχα (παρένθεση) για σιγουριά αντιγραφή-ουδέτερο ή ενισχυμένο loci (μαύρο) και για την αμφισβήτηση περιπτώσεις στο περιθώριο του σήματος (πράσινο). Αυτό δείχνει το όφελος των μαλακών διακρίσεων. (Β) Η λειτουργική μορφή του μαλακού διάκρισης? μια λειτουργία σιγμοειδές με τις παραμέτρους για την τοποθεσία (

E

) και κλίση (

β

). (Γ) προσέγγιση Ατομική-όγκου για την ανίχνευση κέρδος και την απώλεια? το μοντέλο πολλαπλών συστατικών παραμετροποιημένη για δύο όγκων (κόκκινο και μπλε) δείχνει ότι όγκου-ειδικά χαρακτηριστικά παράγουν διαφορετικά διευκρινιστές για το κέρδος και μόνο-αντίγραφο και την απώλεια (στερεά), ενίσχυση (dot-παύλα), και ομόζυγη διαγραφή (διακεκομμένη). Παραμετροποίηση επιλέγει τιμές για

E

και

β

έτσι ώστε το μέγεθος τους (ανυπόγραφο) κινείται προς την κατεύθυνση που υποδεικνύεται (μύθος).

Η

Η ομαδοποίηση τροποποιήσεων

Μια ενοποιημένη προφίλ σημείο διακοπής (UBP).

Δεν ήταν ενδιαφέρονται για τον εντοπισμό των πλέον ρεαλιστική μονάδα του γονιδιώματος στις οποίες ενδέχεται να προκύψουν αλλαγές και για τα οποία το μοντέλο μας πολλαπλών στοιχείων θα πρέπει να αξιολογούνται στατιστικά. Όπως και με καλοήθη παραλλαγές, παθογόνων αλλαγές είναι τμηματική, αλλάζοντας ~kilobase σε ολόκληρο το χρωμόσωμα μεγέθους τμήματα του DNA. Γιατί να αναλύσει τα δεδομένα από την αξιολόγηση ενός πολύ πυκνό σύνολο δεικτών ( Επειδή βλάβες αλλάξει θραύσματα του DNA, αισθανθήκαμε ΡΑΕ θα πρέπει να λειτουργούν σε αυτά. Ως εκ τούτου, επωφεληθήκαμε από τα σημεία διακοπής που παράγεται από τον κατακερματισμό της επιμέρους όγκων. Αυτό συσχετίζεται ρητά γειτονικές ανιχνευτές σε ένα τμήμα με παρόμοιο αριθμό αντιγράφων και προσεγγίζει τις διαρθρωτικές αλλαγές στο γονιδίωμα. Έχουμε ενοποιήσει τις μοναδικές σημείο διακοπής θέσεις που παρατηρείται σε όλους τους όγκους και αυτά δημιουργούν ένα νέο τμήμα του γονιδιώματος (Σχήμα 3Α, Μέθοδοι). Αυτά τα πρόσφατα καθορισμένες περιοχές είναι καρκίνος τύπου συγκεκριμένες και η τελική μονάδα ανάλυσης. Αυτό αποτρέπει τόσο την κλίμακα τεχνητή μήκος και τα στατιστικά συμβιβασμούς απαραίτητη όταν δραστηριοποιούνται στις επιμέρους δείκτες, όπως η επίπτωση στις δοκιμές πολλών υποθέσεων, όταν οι μετρήσεις εξαρτώνται εν μέρει (Μέθοδοι S1).

(α) Η πυκνότητα του ανθρώπινου hotspots ανασυνδυασμού (κορυφή? μέση απόσταση μεταξύ hotspots είναι -55 kb) εκτείνεται κατάτμησης (κόκκινο) των δεδομένων αισθητήρα στάθμης (σκούρο μπλε) σε ~ 5 mb περιοχή 13q14.13-3 σε τέσσερις πλειομορφικές λιποσαρκώματα. Τα μοναδικά όρια ευαισθησίας που σχετίζεται με όγκο (μαύρα βέλη) ορίζουν το UBP (περιφέρειες r

1-6? Κάτω), το μικρότερο από τα οποία (r

3) εκτείνεται σε τέσσερα γονίδια, συμπεριλαμβανομένου του ογκοκατασταλτικό

RB1 ​​

(κατεύθυνση μεταγραφής υποδεικνύεται). (Β) στο χρωμόσωμα 1ρ, η κατανομή πυκνότητας της προβλεπόμενης hotspots ανασυνδυασμού (κόκκινο) σε πλάτος ίσο με το διάμεσο απόσταση μεταξύ όλων των hotspots ρ-βραχίονα (56 kb), και τη διανομή της τυχαιοποίησης τους (μπλε). Η διαδικασία δειγματοληψίας σέβεται το σχήμα του αρχικού διανομής και ως εκ τούτου τα χαρακτηριστικά αλληλουχίας που διέπουν. (Γ) κατανομή μεγέθους των περιοχών που προέρχεται από τον τεμαχισμό και στη συνέχεια καθορίζεται από το ενιαίο προφίλ σημείο διακοπής (UBP? Γκρι), και αυτά τα hotspot-διασπαστεί περιοχές του ίδιου μετατεθούν κατά τη διάρκεια της μηδενικής γενιάς μοντέλο (όπως υποδεικνύεται, μπλε)

Συνδυάζοντας στοιχεία αλλοίωσης από διαφορετικούς όγκους.

για να αναφέρετε μια περίληψη των αλλαγών στις περιοχές αυτές για τη συλλογή των όγκων, συνδυάσαμε τις ανιχνεύθηκαν μεταβολές σε όλους τους ασθενείς. Ο τρόπος με τον οποίο το κάνουμε αυτό μας επιτρέπει να αξιολογηθεί η σημασία ενός γεγονότος μέσω της σύγκρισης με μηδενική κατανομή των αμιγώς τυχαία εκτροπών. Κάθε συστατικό είναι η πρώτη συνοψίζεται ως ο μέσος όρος σε όλη δείγματα σε κάθε περιοχή του UBP. Μπορούμε στη συνέχεια να υπολογίσει μια συνοπτική βαθμολογία (Εξ. 3) και για τις δύο συνολικό κέρδος και την απώλεια (Α ‘και Δ’ αντίστοιχα) που συνδυάζει τα στοιχεία των επιμέρους τύπων αλλοίωση (Μέθοδοι). Το κύριο πλεονέκτημα αυτής της προσέγγισης είναι η ευελιξία. Ένα null μοντέλο (το αντικείμενο της επόμενης ενότητας) μπορεί να δημιουργηθεί για την αξιολόγηση: οποιοσδήποτε συνδυασμός των αρχικών τεσσάρων συνιστωσών, περίληψη βαθμολογίες για συνολικό κέρδος και την απώλεια (προεπιλογή), ή με τη στάθμιση έναν τύπο μεταβολή σε σχέση με το άλλο. Ως τελικό βήμα συνάθροιση, έχουμε αναλυτικά αντλούν αβεβαιότητα στην παρούσα περίληψη βαθμολογία για κάθε περιοχή του UBP. Αυτό είναι ένα σημαντικό χαρακτηριστικό της προσέγγισής μας. Με το πολλαπλασιαστικό το λάθος της κατάτμησης από όλους τους όγκους που εκτείνονται σε μια δεδομένη θέση, θα παράγει μια αναπαράσταση της αβεβαιότητας στις μετρήσεις μας αλλοίωσης σε κάθε τόπο (Μέθοδοι S1). Αυτή η αβεβαιότητα είναι ένα εγγενές χαρακτηριστικό της κάθε μοντέλο βαθμολόγησης, αλλά αυτή τη στιγμή δεν έχουν χρησιμοποιηθεί στις υπάρχουσες μεθοδολογίες.

Ένα μοντέλο φόντο.

Έχουμε αναπτύξει ένα πρότυπο υπόβαθρο για την αξιολόγηση της σημασίας του όγκου-ειδικά μετατροπές , το τρίτο χαρακτηριστικό πυρήνα της ΡΑΕ. Τα χαρακτηριστικά ενός ρεαλιστικού μοντέλου εκτροπή υπόβαθρο σε καρκίνους του ανθρώπου είναι πολύπλοκη και άλυτα τομέα της έρευνας. Σε μια πρώτη προσέγγιση, υποθέτουμε προφίλ ενός όγκου είναι ο συνδυασμός και των δύο οδηγού και του συνοδηγού αλλαγές. Επιπλέον, οι περιοχές που επιλέγονται από τα γονίδια διάρκεια των όγκων των οποίων επιδρούν στη λειτουργία μεταβάλλει τη φυσιολογική κυτταρική φαινότυπο. Υποθέτουμε αυτά είναι ενσωματωμένα μέσα σε μη ειδική ανευπλοειδία, ίσως το προϊόν της αύξησης της γονιδιωματικής αστάθειας. Αυτό διορθώνει στοχαστικά απέκτησε αλλαγές κατά τη διάρκεια της νεοπλασματικής εξέλιξης, αλλά που είναι ουσιαστικά ουδέτερο στη βιολογία του όγκου. Αυτό υποδηλώνει μια διαδικασία που καλύπτει την αδιάκριτη στον αποφασιστικά μη-τυχαία, καθώς και μια σχέση μεταξύ της κανονικής γενετικής του κύκλου εργασιών και την εξαγορά της αλλαγής του αριθμού αντιγράφων. Αυτό συνεπάγεται όγκων που σχετίζονται με σημεία διακοπής που προσδιορίζονται από τον κατακερματισμό της είναι μόνο ένα μικρό κλάσμα του συνολικού αριθμού των σημείων διακοπής στο γονιδίωμα. Έτσι, υποθέσαμε ότι ένα μοντέλο φόντο θα πρέπει να ενσωματώνουν τα συστατικά αυτής της καλοήθους γενετικό υπόβαθρο. Στο πλαίσιο του αριθμού αντιγράφων εκτροπές, επιλέξαμε προβλέψει ανθρώπινη hotspots ανασυνδυασμού.

Hotspots, μια τοπική αύξηση του ποσοστού του ανθρώπινου ανασυνδυασμού, είναι ένα χαρακτηριστικό των αλληλομόρφων και των μη αλληλομόρφων ((Ν) AHR) ομόλογο ανασυνδυασμού. Nahr, με τη σειρά του, είναι ένας μηχανισμός με τον οποίο

de novo

Οι δομικές παραλλαγές σταθερά στο γονιδίωμα. Ένα υποσύνολο αυτών των παραλλαγών παράγει την αλλαγή του αριθμού αντιγράφων, λίγα από τα οποία είναι παθογόνος. Στην πραγματικότητα, προηγούμενες μελέτες συνδέουν τα υψηλά ποσοστά του Nahr με τμηματική επαναλήψεις. Αυτές οι αλληλουχίες είναι επομένως ευαίσθητα να σπάσουν και αναδιάταξη (που επισκοπείται στο [22], [23], [24]). Επιπλέον, παραλλαγή αριθμού αντιγράφων είναι στενά συνδεδεμένο με τμηματική επαναλήψεις στο ανθρώπινο γονιδίωμα [9], [25]. Ως εκ τούτου, χρησιμοποιούμε μια τυχαία διαδικασία που περιλαμβάνει hotspots ανασυνδυασμού ως υποκατάστατο για το μηχανισμό αυτό. Αυτά τα hotspots υπολογίζεται από τα πρότυπα της ανισορροπίας σύνδεσης (LD) μεταξύ σωζόμενα άτομα, αντανακλώντας ανασυνδυασμός που συμβαίνουν σε όλη την προγονική καταγωγή τους [26]. Έχουμε συμπληρώσει σημεία διακοπής του όγκου κατά τρόπο σύμφωνο τόσο με αυτή τη δομή ανώτερης τάξης του ανθρώπινου γονιδιώματος και τα πρότυπα της γενετικής ποικιλότητας.

Εμείς τυχαία τις γονιδιωματικές θέσεις της προβλεπόμενης hotspots ανασυνδυασμού (

n

= 32996 , HapMap φάσης II [27]) με μια διαδικασία απόρριψης-δειγματοληψίας που προσομοιώνει τις προτιμησιακές χαρακτηριστικά που διέπουν την κατανομή του ανθρώπινου ανασυνδυασμού (Σχήμα 3Β). Αυτές οι τυχαιοποιημένες θέσεις χρησιμοποιούνται ως θέσεις διάσπασης για τα μεγαλύτερα τμήματα του όγκου πριν από την μεταθέσεως (Μέθοδοι). Συμπληρωματικό στεγανοποίηση του γονιδιώματος εκτός από αυτές που παρέχονται από κατάτμησης του όγκου πριν από την μεταθέσεως, επίσης, έχει ένα λειτουργικό όφελος. Αυξάνει το χώρο μετάθεση σε έναν όγκο, όταν ο κατακερματισμός παράγει χαμηλό αριθμό τμήμα του οποίου ένα μέρος είναι αντιγραφή αλλάξει, και το υπόλοιπο είναι μεγάλα σε μέγεθος, αλλά γονιδιωματική ουσιαστικά διπλοειδή. Χωρίς επιπλέον διαίρεση, το τροποποιημένο τμήμα μπορεί να μετατεθούν σε ένα πεπερασμένο αριθμό θέσεων, οι οποίες περιορίζουν το μοντέλο. Θραύση των μεγαλύτερων αντίγραφο ουδέτερο τμήματα, ωστόσο, παρέχει μια πολύ μεγαλύτερη αρίθμηση των θέσεων στο οποίο μπορούν να μετατεθούν η περιοχή ενδιαφέροντος.

Έχοντας πολλαπλά μοντέλα διερευνηθεί μετάθεση, επιλέξαμε μια μηδενική κατανομή προέρχεται από το γονιδίωμα-ευρεία μετάθεση (Μέθοδοι S1). Εν συντομία, (i) τμήματα σε κάθε όγκο υποδιαιρούνται περαιτέρω (διασπάται) στις θέσεις των τυχαιοποιημένων hotspots ανασυνδυασμού, μετά την οποία (ii) το UBP προέρχεται πάλι σε αυτό το τροποποιημένο σύνολο των σημείων διακοπής (Σχήμα 3C), (iii) οι τιμές του η πολλαπλών συστατικών μοντέλο σε κάθε περιοχή της παρούσας UBP (Α

0, A

1, D

0, D

1) είναι permuted μαζί σε μια άλλη θέση του UBP σε κάθε δείγμα και την εκ νέου -Συμπαραγωγή όλη όγκους (βλέπε Μέθοδοι). Αυτό συνήθως επαναλαμβάνεται 10.000 φορές παράγει μια κατανομή null των & gt?. 10

8 γκολ περιοχές

Αξιολογώντας τη σημασία και τον εντοπισμό των περιοχών ενδιαφέροντος

Για να εκχωρήσετε στατιστική σημασία, ξεχωριστά για το κέρδος και την απώλεια , χρησιμοποιούμε αυτή την μηδενική κατανομή των μετατεθούν στοιχεία για τον υπολογισμό π-αξιών με βάση το πόσο συχνά η τυχαία Μετατεθειμένο βαθμολογία υπερβαίνει το δείγμα βαθμολογία (Εξ. 3). Στη συνέχεια διορθώσουμε για πολλαπλές δοκιμές υπόθεση με τη διαδικασία ποσοστό εσφαλμένης ανακάλυψη Benjamini-Hochberg [28]. Η διόρθωση γίνεται πάνω από όλες τις δοκιμές, οι οποίες αντιστοιχούν σε περιοχές του UBP. Ανάλογα με το προφίλ κατάτμηση των δειγμάτων σε ένα τύπο της νόσου, αυτό έχει ως αποτέλεσμα τη μείωση του μεταξύ ενός και τριών τάξεων μεγέθους σε αποτελεσματικές δοκιμές σε σύγκριση με επιμέρους δείκτες. Η προκύπτουσα Q-τιμή καθορίζει το κλάσμα του ανεκτές false positives πάνω από ένα συγκεκριμένο σκορ που προκύπτουν από τυχαία πιθανότητα στο φόντο μοντέλο μας. Περιφέρειες στη συνέχεια φιλτράρεται με βάση την τιμή q με ένα τυπικό αποκοπής 0,01 (FDR≤1%).

περιοχές ενδιαφέροντος (ROI).

Είμαστε δίπλα εξερευνήσετε την τελική κύριο χαρακτηριστικό της Η ΡΑΕ, για τον καθορισμό των ορίων για τις περιφέρειες της σημαντικής ενίσχυσης και διαγραφή. Εάν μια αλλαγή συμβάλλει στην ογκογένεση, τότε υποθέτουμε ότι περιοχή του γονιδιώματος επιλέγεται για την επίδρασή του επί του περιεχομένου του γονιδίου. Το γεγονός αυτό μπορεί να αλλάξει ένα μόνο γονίδιο ή πολλαπλά ανεξάρτητα γεγονότα μπορεί να στοχεύουν σε ένα συντονισμένο πρόγραμμα των γονιδίων. Αυτές οι βλάβες μπορεί επίσης να συν-εξελίσσονται με τυχαίες αλλαγές που έχουν μικρή βιολογική επίδραση. Μη τυχαία αλλαγές είναι στατιστικά σημαντική σε σχέση με μηδενική μοντέλο μας και ως εκ τούτου είναι υποψήφιες περιοχές ενδιαφέροντος. Παρ ‘όλα αυτά, περιοχές ενδιαφέροντος δεν είναι αυστηρά καθορισμένη, αλλά είναι διαισθητικό και υποκινούνται κυρίως από δύο θέματα. Πρώτον, η βιολογική ερευνητής ενδιαφέρεται κυρίως σε διαχειρίσιμα και ερμηνεύσιμο γεγονότα, ίσως αφορά ένα μόνο γονίδιο. Δεύτερον, βλέπουμε οπτικά στις περιοχές δεδομένων των focality όπου υπάρχουν κορυφές της αλλοίωσης αλλά συγχέονται από θορυβώδη δεδομένα, συμπεριλαμβανομένων των παρακείμενων ή γειτονικών κορυφών. Να συλλάβει δύο από αυτά, μπορούμε να εφαρμόσουν μια προσέγγιση σε δύο στάδια για να καθορίσει τα ROI. Το πρώτο στάδιο προσδιορίζει τις περιοχές σημαντικής μεταβολής (q≤0.01). Αυτές θα είναι (i) απομονωμένες περιοχές του UBP (μονήρεις κυήσεις) όπου εστιακό τροποποίηση επηρεάζει ένα μόνο τόπο, ή (ii) πολλαπλές φυσικά παρακείμενων περιοχών που συγχωνεύονται και ανέθεσε τις μεγαλύτερες γονιδιωματικής όρια της εκδήλωσης. Το δεύτερο στάδιο είναι σχεδιασμένο για να ανακρίνουν αυτούς τους γενικούς κέρδη και ζημίες για τις κορυφές των λεπτότερα κλίμακας και πιο σημαντική μεταβολή. Αυτά είναι πιο πιθανό να περιέχουν ογκογονίδια και ογκοκατασταλτικά γονίδια, πληρούν τα πρώτα διαισθητική κριτήρια ROIs, αλλά περιπλέκεται περισσότερο από τη δεύτερη. Ως εκ τούτου, υπάρχουν δύο τύποι ανακρίβειας που επηρεάζουν τον προσδιορισμό των περιοχών της εστιακής αλλοίωσης. Χωρική ασάφεια σχετίζεται με το πειραματικό σύστημα, όπου το

true

θέση της αλλοίωσης είναι μη μετρήσιμους λόγω της επιλογής δείκτη, τη σύνθεση σειρά, και πεπερασμένη ανάλυση. Μέτρηση ασάφεια αναφέρεται στη σφάλμα πολλαπλασιάζονται από μεμονωμένα συμβάντα σε κάθε δείγμα και αντανακλά τόσο θόρυβος εγγενής στο πείραμα και η μεταβλητότητα που παράγεται από το μέγεθος του δείγματος. Το πρώτο είναι σταθερό και θα βελτιωθεί καθώς αυξάνεται η πυκνότητα του πίνακα. Το τελευταίο είναι κάτι που ενσωματώνουν ρητά στο δεύτερο στάδιο του αλγορίθμου μας, αλλά λείπει από την προηγούμενη προσεγγίσεις [13], [14], [18], [29]. Για μια δεδομένη ευρεία περιοχή που περιλαμβάνει τόπους που υπερβαίνουν ένα όριο ευαισθησίας, εντοπίζουμε κορυφές στη συνοπτική βαθμολογία (L

2, η Εξ. 3). Εάν μια κορυφή ανιχνεύεται, αυτό συγχωνεύεται με παρακείμενες θέσεις σε αυτήν την ευρύτερη περιοχή της σημασία αν η L τους

2, υπάγεται διάστημα της κορυφής του σφάλματος (Εικόνα 4, βλέπε Μέθοδοι). Σε αυτή την γραφική παράσταση από τα στοιχεία, το

RB1 ​​

ογκοκατασταλτικό, συζητείται λεπτομερέστερα παρακάτω, ανιχνεύεται σε μια κορυφή ομοίως συγχωνεύτηκαν περιοχές που τελειοποιεί τα όρια ενός ROI από αυτές που εκτείνονται σε περίπου 3 mb της ακολουθίας και 20

You must be logged into post a comment.