PLoS One: Κλήση Δείγμα Mix-Ups στον Καρκίνο Πληθυσμός Σπουδών

Φεβρουάριος 10th, 2013 elhealth του καρκίνου άρθρα

Αφηρημένο

σφάλματα παρακολούθησης του δείγματος ήταν και θα είναι πάντα ένα μέρος της πρακτικής εφαρμογής των μεγάλων πειραμάτων. Έχει πρόσφατα προταθεί ότι η έκφραση γονιδίων ποσοτικών χαρακτήρων (eQTLs) και των συναφών τα αποτελέσματά τους θα μπορούσαν να χρησιμοποιηθούν για την αναγνώριση του δείγματος μπερδέματα και αυτή η προσέγγιση έχει εφαρμοστεί σε μια σειρά από μεγάλες μελέτες γονιδιωματικής πληθυσμό να απεικονίσουν την επικράτηση του προβλήματος. Είχαμε υιοθέτησε μια παρόμοια προσέγγιση, που ονομάζεται «BADGER», στο έργο METABRIC. METABRIC είναι μια μεγάλη μελέτη για τον καρκίνο του μαστού που μπορεί να ήταν η πρώτη στην οποία eQTL με βάση την ανίχνευση της αναντιστοιχίας χρησιμοποιήθηκε κατά τη διάρκεια της μελέτης, όχι μετά το γεγονός, για να βοηθήσει τη διασφάλιση της ποιότητας. Αναφέρουμε εδώ για τα συγκεκριμένα ζητήματα που σχετίζονται με τις μεγάλες μελέτες για τον καρκίνο πραγματοποιήθηκαν με τη χρήση ιστορικών δειγμάτων, τα οποία περιπλέκουν την ερμηνεία αυτών των προσεγγίσεων. Ειδικότερα εντοπίζουμε τις επιπλοκές από τη χρήση δείγματα όγκων, της εξέτασης κυτταροβρίθεια και της ποιότητας του RNA, των ειδικών υποομάδων που υπάρχουν στον πληθυσμό της μελέτης (συμπεριλαμβανομένων των οικογενειακών δομών), καθώς και την επιλογή eQTLs να χρησιμοποιήσετε. Μπορούμε επίσης να παρουσιάσει κάποια αποτελέσματα σχετικά με τον σχεδιασμό των πειραμάτων ληφθεί υπόψη αυτών των θεμάτων. Η eQTL προσέγγιση για τον εντοπισμό σφαλμάτων παρακολούθησης του δείγματος φαίνεται να έχει αξία σε αυτές τις μελέτες, αλλά απαιτούν φροντίδα στην εφαρμογή της

Παράθεση:. Lynch AG, Chin SF, Dunning MJ, Caldas C, Tavaré S, Curtis C (2012) Κλήση Δείγμα Mix-Ups στον Καρκίνο Πληθυσμός Σπουδών. PLoS ONE 7 (8): e41815. doi: 10.1371 /journal.pone.0041815

Συντάκτης: Amanda Ewart Toland, Πολιτειακό Πανεπιστήμιο του Οχάιο Medical Center, Ηνωμένες Πολιτείες της Αμερικής

Ελήφθη: 23 του Μάρτη του 2012? Αποδεκτές: 29 του Ιουνίου, 2012? Δημοσιεύθηκε: 9 Αυγούστου 2012

Copyright: © Lynch et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Αυτή η έρευνα υποστηρίχθηκε από το Πανεπιστήμιο του Cambridge, Cancer Research UK επιχορήγηση C14303 /A10825, www.cancerresearchuk.org και Hutchison Whampoa Limited. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

είναι μια αυταπόδεικτη αλήθεια ότι, όποια και αν ληφθεί η φροντίδα, αν η μελέτη γίνεται μεγάλη ή αρκετά πολύπλοκα, στη συνέχεια, θα παρουσιαστούν σφάλματα στον εντοπισμό του δείγματος. Το θέμα αυτό είχε ένα υψηλό προφίλ αργά μετά από ένα σφάλμα σε εξατομικευμένες υπηρεσίες γενετικού ελέγχου (https://spittoon.23andme.com/2010/06/08/update-from-23andme/), προβλήματα που αποκαλύφθηκαν από την πρόσφατη «ιατροδικαστικής» έρευνες των μελετών γενωμικού κλίμακα [1], και την πρόσφατη ανάδειξη των σφαλμάτων σε διάφορες μελέτες υψηλού προφίλ [2]. Εκτός από αυτά τα μεγάλα προβλήματα, όλα αυτά τα χρόνια των σπουδών υψηλής απόδοσης, όπως τα λάθη έχουν προταθεί ως πιθανή αιτία της αντιφατικά αποτελέσματα [3], [4]. Φυσικά, για κάποιο χρονικό διάστημα, υπήρξαν εκκλήσεις να φροντίσει να περιορίσει αυτά τα λάθη [5], και μια σειρά από στρατηγικές για τη μείωση ή τον εντοπισμό σφαλμάτων χρησιμοποιούνται τακτικά.

Είναι κοινό να χρησιμοποιήσει αναπαραχθεί δείγματα ελέγχου γνωστά σημεία σε ένα πιάτο [6], η οποία θα πρέπει να πάρει κάποια σημαντικά λάθη (αν και αν αυτά είναι στις ίδιες θέσεις σε κάθε πιάτο, τότε δεν θα αναδείξει το λάθος πλάκα που χρησιμοποιείται). Εκτός από τον περιορισμό αυτό, η δαπάνη μιας τέτοιας προσέγγισης μπορεί να καταστήσει ελκυστική. Πολλές πλατφόρμες έκφρασης προσφέρουν την ευκαιρία για να αναμειχθεί εξωτερικούς ελέγχους με το δείγμα προς υβριδισμό, καθώς και πρωτοβουλίες όπως το Εξωτερικό RNA Controls Consortium (ERCC) [7] μπορεί να είναι επωφελής μόνο από αυτή την άποψη. Πράγματι, η χρήση αυτών των ελέγχων έχει πρόσφατα καταδειχθεί για Affymetrix GeneChips [8]. Όταν τον προσδιορισμό του γονότυπου συστοιχίες που χρησιμοποιούνται (ενδεχομένως για το σκοπό της συναγωγής DNA αντίγραφο-αριθμός) τότε έχουμε μια βασική μέτρηση για τον εντοπισμό δειγμάτων που θα είναι χρήσιμη αν τα πολλαπλά δείγματα υβριδίστηκαν από το ίδιο άτομο [9], ή αν έχουμε πριν γνώση των γονότυπων [10]

Γνωστή φαινοτύπων με ένα μοναδικό (ή ισχυρά) γενετική συνιστώσα μπορεί επίσης να χρησιμοποιηθεί για να ελέγξετε την εγκυρότητα του δείγματος (ή μάλλον να προσπαθήσει να εντοπίσει τα λάθη επιμετάλλωση -. καθώς είναι απίθανο να έχουν αρκετή δύναμη για να επιβεβαιωθεί ότι το δείγμα είναι αυτό που ισχυρίζεται ότι είναι). Το σεξ είναι η προφανής φαινότυπος στο θέμα αυτό. Με μια προσεκτική διαρρύθμιση του δείγματος, όπως συζητείται αργότερα, τα λάθη σε μια κλίμακα πλάκα θα ανιχνευθεί από ένα σεξ-έλεγχο, αλλά τα επιμέρους διακόπτες του κάθε ζεύγους δεν μπορεί. Σαφώς για ορισμένες μελέτες, π.χ. στον καρκίνο του προστάτη, αυτό δεν θα είναι μια επιλογή. Άλλα χαρακτηριστικά, όπως η ομάδα αίματος θα μπορούσε να συγκριθεί με τα κατάλληλα γονότυπους, αλλά για ένα χαρακτηριστικό με ένα στενό τόπο οδήγηση υπάρχει πολύ μεγάλη πιθανότητα ότι ένας θα υπάρξει miscalling της κατηγορίας γονότυπου απλά να αποκλείσει τα δείγματα με βάση αυτή τη μέτρηση. Ως εκ τούτου, είναι πολλά τέτοια χαρακτηριστικά που απαιτούνται.

Η έκφραση γονιδίων ποσοτικών χαρακτήρων (eQTLs) που ρυθμίζουν την μεταγραφή αφθονία συγκεκριμένων mRNA μπορούν να ταυτοποιηθούν συστηματικά χρήση τεχνολογιών υψηλής απόδοσης [11] και μπορεί να προσφέρει αυτό το μεγάλο αριθμό χαρακτηριστικών, με περίπου 5% των γονιδίων που δείχνει cis-eQTL γνώμονα τη συμπεριφορά [12]. Πολλές μελέτες στοχεύουν να συναγάγει eQTLs δίνεται ένα σύνολο από γονότυπους, μια σειρά μετρήσεων έκφρασης και μια χαρτογράφηση μεταξύ των δύο. Επομένως, στη συνέχεια, ότι, δεδομένων των γονότυπων, τις μετρήσεις έκφρασης και μια σειρά από eQTLs θα πρέπει να είναι σε θέση να πω κάτι για την χαρτογράφηση. Με λίγα λόγια, δίνεται ένα σύνολο από συστοιχίες έκφρασης και eQTLs, μπορεί κανείς να κάνει προβλέψεις ως προς τους γονότυπους που θα περίμενε κανείς για να οδηγήσει την έκφραση και στη συνέχεια να προσπαθήσει να εντοπίσει μια σειρά γονότυπο που έχει μετρηθεί παρόμοιες τιμές.

Η ικανότητα να προβλέψει SNPs από τα δεδομένα έκφρασης έχει πρόσφατα εξεταστεί από ένα πλαίσιο δεδομένων ασφάλειας [13], αλλά είναι μια προσέγγιση που έχουμε χρησιμοποιήσει για να εξασφαλίσει μελλοντικά την ακεραιότητα των δεδομένων στη Μοριακή Συστηματική του Καρκίνου του μαστού Διεθνούς κοινοπραξίας μελέτη (METABRIC) [14], και έχουν εφαρμοστεί σε άλλες μελέτες για τον καρκίνο. Η προσέγγιση που ονομάζεται BADGER ( «Στεφάνη Array διάγνωσης για Γονότυπος και Σχέσεις Έκφραση») και περιγράφεται στο τμήμα των Μεθόδων. Παραδείγματα δύο καταστάσεις (ένα απλό, ένα πιο πολύπλοκο), όπου έχει προκύψει σύγχυση σχετικά με την ταυτότητα του δείγματος σε μελέτες μεγάλης κλίμακας, και έχουν επιλυθεί από ασβός, δίνονται στα Σχήματα 1 και 2.

Ένα BeadChip έκφρασης (12 συστοιχίες), και δύο πλάκες δειγμάτων για γονοτυπική είναι εικονογραφημένα. Ειδικότερα, στο αριστερό πλαίσιο, οι θέσεις τις προβλεπόμενες από δύο δείγματα επισημαίνονται (σε μπλε και κόκκινο) για τις δύο τεχνολογίες. Ο ασβός κατατάσσεται για τη σύνδεση μεταξύ αυτών των δύο συστοιχίες έκφρασης και συστοιχίες γονότυπο είναι υψηλές και δείχνουν ότι υπάρχει μια λανθασμένη χαρτογράφηση. Στη δεξιά πλευρά η επίλυση σε αυτό το παράδειγμα φαίνεται. Όχι μόνο με ένα απλό διακόπτη μπορούμε να ταιριάζουν με τις συστοιχίες έκφρασης στις συστοιχίες γονότυπο (τώρα με BADGER κατατάσσεται 1), αλλά δεδομένου ότι οι δύο συστοιχίες του γονότυπου είναι από διαφορετικές πλάκες, ενώ οι δύο συστοιχίες έκφρασης γειτονικών, μπορούμε να συμπεράνουμε ότι το σφάλμα πραγματοποιήθηκε στο τσιπ έκφρασης.

Μια σειρά ασθενών (που αναφέρονται στο e-mail) από τον οποίο λαμβάνονται δείγματα (μεσαία γραμμή, δείγματα απεικονίζεται ως τετράγωνα) φαίνονται σε κάποιο σημείο. Λίγο καιρό αργότερα, έξι από αυτούς τους ασθενείς (E, F, G, I, J, L) πληρούν τα κριτήρια για την ένταξη σε μια αναδρομική μελέτη και προορίζεται να τρέξει τα δείγματα από τους ασθενείς σε συστοιχίες έκφρασης (κύκλοι, πάνω αριστερά ) και συστοιχίες γονότυπο (κύκλοι, πάνω δεξιά). Δεδομένου ότι οι ασθενείς (και ως εκ τούτου δείγματα) διαμορφώνεται μια ακολουθία, θα περιλαμβάνει χώρο κατόχους στην απεικόνιση των συστοιχιών για αυτά τα δείγματα που δεν ήταν κατάλληλο για την εν λόγω μελέτη (συμβολίζεται με διακεκομμένη κύκλους για τις συστοιχίες και γκρι σκίαση για τα δείγματα) . Ο ασβός κατατάσσεται για τις συστοιχίες έκφρασης και γονότυπο που υποτίθεται ότι σχετίζονται με αυτά τα έξι δείγματα κυμαίνονται 949-2473 γεγονός που υποδηλώνει ότι δεν είναι μία από τις έξι έχει αντιστοιχιστεί σωστά. Το ψήφισμα είναι δύσκολο να βρει κανείς, εκτός αν κάποιος γνωρίζει σχετικά με την αρχική σειρά δείγμα, συμπεριλαμβανομένων των δειγμάτων που δεν είναι μέρος της αναδρομικής μελέτης. Όταν λυθεί (κάτω σειρά) βλέπουμε ότι τα δείγματα μετάβαση σε συστοιχίες γονότυπο έχουν «έκανε» κατά μία θέση, με αποτέλεσμα ότι τα δείγματα G και J έχουν τρέξει σε έκφραση, αλλά όχι τον προσδιορισμό του γονότυπου συστοιχίες, ενώ τα δείγματα Η και Κ (τα οποία ήταν δεν σημαίνει ότι έχουν τρέξει σε όλα) έχουν τρέξει σε γονότυπο, αλλά όχι συστοιχίες έκφρασης. Για τις τέσσερις συστοιχίες που έχουν τρέξει σε δύο τεχνολογίες, μπορούμε να δούμε ότι οι τάξεις BADGER είναι τώρα τέλεια. Αξίζει να σημειωθεί ότι οι συστοιχίες έκφρασης στις οποίες έτρεξαν τα δείγματα G και J έχουν υψηλή «ελάχιστη βαθμολογία BADGER», η οποία είναι ένα σημάδι ότι το δείγμα δεν διαθέτουν σε οποιαδήποτε σειρά του γονότυπου στη μελέτη.

η προσέγγισή μας είναι εννοιολογικά παρόμοια με την πρόσφατα δημοσιευμένη προσέγγιση MixupMapper σε αυτό το πρόβλημα [2], αλλά διαφέρει σε εφαρμογή λόγω της φύσης των δεδομένων στα οποία μπορούμε να την εφαρμόσει. Διαφέρει επίσης στην επιλογή του περιβάλλοντος της εφαρμογής, με BADGER που αναπτύσσονται στον τομέα της Ε [15] και MixupMapper σε Java. Ειδικότερα, Westra και την προσέγγιση των συναδέλφων φαίνεται να βρει το καλύτερο αγώνα έκφραση για μια σειρά γονότυπο, ενώ η δική μας ήταν να εξετάσουμε, σε πρώτη φάση, για την καλύτερη αντιστοιχία γονότυπο για μια σειρά έκφρασης. Είναι γενικά ευκολότερο να εντοπιστούν διπλές σειρές γονότυπο μην επαναληφθούν συστοιχίες έκφρασης και έτσι μπορούμε να διασφαλίσουμε, αν θέλουμε, να είμαστε χαρτογράφηση για ένα σύνολο μοναδικών συστοιχίες.

Και οι δύο προσεγγίσεις βασίζονται στον καθορισμό μια απόσταση μεταξύ της έκφρασης συστοιχία και μια σειρά του γονότυπου. μέτρο μας (η «βαθμολογία BADGER») είναι το άθροισμα (σε όλη eQTLs) του τετράγωνο της διαφοράς μεταξύ του αριθμού των αλληλόμορφων «Β» ζήτησε από τη συστοιχία γονότυπο και τον αριθμό που προβλέπεται από την σειρά έκφρασης. MixupMapper, από την άλλη πλευρά, χρησιμοποιεί ένα κανονικοποιημένο άθροισμα των z-scores για τη διαφορά μεταξύ των προβλεπόμενων και παρατηρούνται τιμές έκφρασης. Ως μια μικρή επιπλέον λεπτομέρεια, MixupMapper θεωρεί ότι το μέγεθος της βαθμολογίας τους, ενώ BADGER κοιτάζει την κατάταξη. Φυσικά, ένα χαμηλό σκορ είναι ενδεικτικό του αγώνα. Η συντριπτική πλειοψηφία των συστοιχιών (ιδανικά όλες εκτός από μία) δεν θα είναι ένας αγώνας, έτσι το σκορ του μια σειρά που κάνει τον αγώνα θα πρέπει να είναι απομακρυσμένα και να το βαθμό του ενός.

Δεδομένου ότι η έννοια της αναγνώρισης λαθών επιμετάλλωσης χρησιμοποιώντας eQTLs έχει αποδειχθεί, δεν θα επικεντρωθεί στην δικαιολογούν ή επίδειξη της προσέγγισης για μια ακόμη φορά (αν και παρουσιάζονται μερικά τέτοια αποτελέσματα). Μάλλον, θα τονίσει τις προκλήσεις της εφαρμογής μιας τέτοιας προσέγγισης με μια μελέτη γονιδιωματική καρκίνο του πληθυσμού, και σημειώστε όπου οι διακρίσεις της αφομοίωσης μας σχετικά με την προσέγγιση προσφέρονται για τέτοιου είδους δεδομένα.

Αποτελέσματα

Ενώ Πρωταρχικός σκοπός μας δεν είναι να αποδείξει για μια ακόμη φορά ότι η eQTL με βάση προσέγγιση για την κλήση και τον εντοπισμό ακατάλληλα δείγματα μπορούν να εργαστούν, σημειώνουμε ότι τα αποτελέσματά μας εδώ θα στηρίξουν το μήνυμα της Westra και οι συνεργάτες του [2]. Εμείς αντί να επιδιώξει να αναδείξει μερικοί από τους παράγοντες που μπορεί να οδηγήσει σε παρερμηνεία των αποτελεσμάτων μιας προσέγγισης eQTL που βασίζεται στον εντοπισμό αναντιστοιχίες όταν εφαρμόζεται σε μεγάλες μελέτες όγκων. Συγκεκριμένα, θα εξετάσουμε τις επιπτώσεις της απώλειας ετεροζυγωτίας (ΑΕ) και αναχώρηση από διπλοειδή κατάσταση που περιμένουμε να δούμε σε δείγματα όγκων, τις επιπτώσεις της κυτταροβρίθεια, και τις συνέπειες της ύπαρξης ενός μίγματος των εθνοτήτων σε μια μελέτη. Επιπλέον, θα αναφέρουμε πώς σχεδιασμός της μελέτης επηρεάζει την ικανότητά μας να χρησιμοποιούν μια τέτοια προσέγγιση.

Κλήση Mis-αντιστοιχίσεις με Όγκων Δείγματα

Westra και οι συνεργάτες του [2] της Επιτροπής διαπιστώνουν ότι είναι δυνατόν να » αναγνωρίσει γονότυπους που σαφώς δεν ταιριάζει με κανένα συστοιχίες γονιδιακής έκφρασης «. Με προοπτικά λαμβάνεται συλλογές του φυσιολογικού ιστού αυτό φαίνεται να είναι η περίπτωση, αλλά με αναδρομικές μελέτες του ιστού του όγκου, ένας αριθμός επιπλέον προβλήματα έχουν έρθει στο φως. Πιο προφανής είναι το γεγονός ότι αυτές οι μέθοδοι να περιμένουμε να δούμε διπλοειδή κλήσεις γονότυπο, και τα δείγματα όγκων μπορεί να είναι οτιδήποτε, αλλά διπλοειδή (αν και πολλοί αλγόριθμοι θα εξακολουθούν να παράγουν διπλοειδή κλήσεις γονότυπο από αυτά τα δείγματα). Στη συνέχεια, υπάρχει το ζήτημα της μόλυνσης στρωματικών των δειγμάτων όγκου. Αυτό μπορεί, στο δείγμα από το οποίο εξήχθη DNA, είναι σε διαφορετικό επίπεδο από ότι στο δείγμα από το οποίο εξήχθη RNA. Τέλος, μπορεί να υπάρχει μια μετάλλαξη εντός του όγκου που διαταράσσουν τη βιολογία οδήγηση των eQTLs στις οποίες βασίζονται οι δοκιμές μας.

Για τους 127 δείγματα για τα οποία (SNP /έκφρασης για όγκο και φυσιολογικό ιστό) είναι τα τέσσερα συστοιχίες διαθέσιμες, οι ποιότητες των αγώνων από την κανονική και καρκινικών ιστών φαίνεται στο Σχήμα 3. σε γενικές γραμμές, τόσο για την κανονική και όγκου συστοιχίες έκφρασης, η «κανονική» σειρά γονότυπο αποδείχθηκε να είναι μια καλύτερη αντιστοιχία από τον «όγκο» σειρά γονότυπο.

Για 127 κουαρτέτα του κανονικού όγκου-και-ταιριάζουν συστοιχίες γονότυπο-και-έκφραση που απεικονίζουν τη σχετική ποιότητα των αγώνων μεταξύ των τεσσάρων διαφορετικών συνδυασμών έκφραση-γονότυπο. Τα ζεύγη συστοιχία 127 γονότυπο είναι όλα σαφώς ταιριαστό (δεν φαίνεται). Η προσέγγισή μας είναι να προσδιορίσει την ποιότητα του αγώνα μιας συστοιχίας γονότυπο για μια σειρά έκφρασης, και όλα τα αποτελέσματα που δίνονται είναι αντανακλαστική αυτής της κατεύθυνσης της σύγκρισης. Για τα σύνολα των όγκων και φυσιολογικών συστοιχίες έκφρασης, υποδεικνύεται στα βέλη είναι ο αριθμός των συστοιχιών έκφρασης για την οποία οι δύο συστοιχίες γονοτυπική είναι εξίσου καλές αντιστοιχίσεις (έχουν τις ίδιες κλήσεις γονότυπος), ο αριθμός των οποίων η συστοιχία προσδιορισμού του γονότυπου του όγκου για το εν λόγω δείγμα έχει μια καλύτερη βαθμολογία από την κανονική σειρά του γονότυπου, και το αντίστροφο. Επιπλέον, στα γωνιακά πάνελ, ο ασβός κατατάσσεται για τους αγώνες ανάμεσα σε ολόκληρο το σύνολο δεδομένων στο οποίο έχουμε πρόσβαση παρουσιάζονται.

Η ανησυχία τότε είναι ότι, στις περιπτώσεις όπου δεν έχουν μεταποιήσει την κανονική γονότυπο, ο γονότυπος όγκων θα μερικές φορές δεν είναι αρκετά καλό αγώνα για να μας επιτρέψει να ορίσετε σωστά το παιχνίδι. Anecdotally, αυτό δεν φαίνεται να συμβαίνει. Μια πιθανή εξήγηση είναι ότι η μη-διπλοειδή (ή διπλοειδή αλλά πάσχουν από LOH) φύση του γονότυπου όγκου παρεμβαίνει με την κλήση του διπλοειδή SNPs. Αν η πλειοψηφία των σχέσεων /έκφρασης SNP που παρατηρείται δεν είναι άμεσα αιτιακή σχέση, τότε αυτό θα μπορούσε να εξηγήσει τις σχετικά φτωχές ιδιότητες αγώνα των συστοιχιών SNP όγκου σε σύγκριση με την κανονική SNPs ιστό.

Κυτταρικότητα και RNA Ποιότητας

Δεδομένου ότι η κανονική συστοιχία γονότυπος φαίνεται ότι είναι μια καλύτερη αντιστοιχία από τη συστοιχία γονότυπο του όγκου, παρόλο eQTLs μας ορίστηκαν κυρίως από δείγματα όγκων, φαίνεται λογικό να υποθέσουμε ότι κυτταρικότητα (η μόλυνση του ιστού του όγκου με στρωματικό ιστό) θα έχουν μικρή επίδραση στην απόδοση των προσεγγίσεων, όπως BADGER. Κανονική μόλυνση θα αυξήσει τις πιθανότητες καλώντας ετερόζυγη SNPs, ακόμα και όταν ο όγκος έχει υποστεί ΑΕ ή αλληλόμορφο-ειδικό DNA αλλαγές αριθμό αντιγράφων.

Παρά το γεγονός ότι η διακοπή του γονότυπου καλεί λόγω των αριθμό αντιγράφων εκτροπές σε όγκους μπορεί να εμποδίσει προσεγγίσεις όπως ασβός, αυτά παραμένουν μια ακριβή περιγραφή του όγκου και πρέπει να προσπαθήσουμε να προσδιορίσει το δείγμα και ταιριάζει με αυτό σε μια σειρά έκφρασης. Όπως έχει ήδη σημειωθεί, μια φτωχή ποικιλία έκφρασης ποιότητας μπορεί επίσης να διακόψει τη διαδικασία [2], αλλά η ποιότητα ενός πίνακα είναι να εκτιμηθεί και μπορεί να αντισταθμιστεί, ή η συστοιχία μπορεί απλά να απορρίπτεται (τουλάχιστον κατά τον καθορισμό των σχέσεων eQTL) .

το σχήμα 4 δείχνει τη σχέση μεταξύ των δύο μέτρων της ποιότητας array (βλέπε Μέθοδοι) και την ελάχιστη βαθμολογία BADGER που σχετίζονται με μια σειρά (ένας δείκτης του κατά πόσον θα μπορούσε να βρεθεί μια αντιστοιχία σειρά SNP). Και οι δύο στατιστικές είναι καλοί προάγγελοι της απόδοσης μιας συστοιχίας, με το στατιστικό κάνει καλύτερα από ό, τι P95. Σαφώς τουλάχιστον μία από τις συστοιχίες προγραμματιστεί να είναι άδειο είχε πράγματι ένα δείγμα υβριδοποιήθηκε σε αυτό, και έναν αριθμό που είχε δειγμάτων που τους έχει ανατεθεί απέτυχε να υβριδοποιηθεί. Σημειώστε ότι, όταν δεν υπάρχει σήμα σε μια σειρά, η διαφορά βαθμού δεν είναι μηδενική, όπως θα περίμενε κανείς, αλλά μάλλον είναι ουσιαστικά αρνητική.

Για να απεικονίζουν ένα ευρύ φάσμα των ιδιοτήτων πίνακα, το ποσοστό αυτό περιλαμβάνει μερικά κακή συστοιχίες ποιότητα που (για αυτόν ακριβώς τον λόγο) αποκλείστηκαν από METABRIC. Αριστερό πλαίσιο: Αποδεικνύοντας τη σχέση μεταξύ της 95ης εκατοστημόριο των παρατηρούμενων log-εντάσεις (p95) και την ελάχιστη βαθμολογία BADGER που συνδέονται με τη συστοιχία. Δεξιά πίνακα: η συσχέτιση μεταξύ και ελάχιστη βαθμολογία BADGER. Επίσης αναφέρεται και στις δύο περιπτώσεις, είναι οι συστοιχίες όπου κανένα δείγμα δεν είχε προγραμματιστεί να υβριδισμό.

εθνοτήτων

Με κύριο συστατικό φορτίσεις που δημοσιεύθηκε για το εργαλείο οστρακοειδή (www.stats.ox .ac.uk /~ Davison /λογισμικού /οστρακόδερμα /shellfish.php), μπορεί κανείς να προβάλει τα δεδομένα Affymetrix SNP σε ένα τρίγωνο όπου οι τρεις γωνίες αντιπροσωπεύουν τους πληθυσμούς HapMap από τα οποία προέρχονται οι φορτίσεις. Για την καλύτερη εξυπηρέτησή εμείς θα ονομάζουμε τις ομάδες των δειγμάτων που σχηματίζουν σε αυτές τις γωνίες η «ομάδα της Ευρώπης», η «ομάδα Αφρική», και η «ομάδα της Ασίας». Έχουμε παρατηρήσει, επίσης, τα άτομα που βρίσκονται μεταξύ των ομάδων της Αφρικής και της Ευρώπης (το οποίο θα συνδυάζει στην «ομάδα Αφρική /Europe»), καθώς και μεταξύ των ευρωπαϊκών και την Ασία ομάδες (το οποίο θα συνδυάζει στην «ομάδα Ευρώπη /Ασία).

σχεδιάσετε τη μέση βαθμολογία BADGER (Σημ σκορ δεν κατατάσσουν) που σχετίζεται με κάθε συστοιχία γονότυπο εναντίον της ομάδας στο αριστερό πλαίσιο του Σχήματος 5. Βλέπουμε ότι η μέση βαθμολογία είναι χαμηλότερη στην ομάδα της Ευρώπης. Αυτό είναι αναμενόμενο, καθώς η Ευρώπη ομάδα συμβάλλει η συντριπτική πλειοψηφία των συστοιχιών έκφρασης στη συλλογή μας και κάποιος δεν θα ήταν έκπληξη το γεγονός ότι αυτά μπορεί να προβλέψει γονότυπους που είναι περισσότερο παρόμοιες με εκείνες που προέρχονται από άλλα δείγματα στην ομάδα της Ευρώπης. Επίσης, είναι στην πλειοψηφία, οι ασθενείς της ομάδας της Ευρώπης οδηγούν τα eQTL-όπως ενώσεις που χρησιμοποιούνται από BADGER και οι ενώσεις αυτές μπορεί να διαφέρουν μεταξύ των ομάδων.

Κάθε σειρά του γονότυπου συγκρίνεται με κάθε συστοιχία έκφρασης, και ένα σκορ ανατεθεί ο αγώνας (όσο χαμηλότερη είναι η βαθμολογία τόσο καλύτερη είναι η αντιστοιχία). Στο αριστερό πλαίσιο, ο μέσος όρος βαθμολογίας με συστοιχία γονότυπο συγκρίνεται με την εθνικότητα του ασθενούς, όπως προκύπτει από τον πίνακα του γονότυπου. Στο δεξιό πάνελ πλευρά, η ελάχιστη βαθμολογία που συνδέεται με έναν πίνακα προσδιορισμού του γονότυπου (καλύτερος δείκτης του κατά πόσον υπάρχει ένας αγώνας) σχεδιάζεται από την εθνικότητα.

Πιο σημαντικό από το μέσο όρο της βαθμολογίας είναι η ελάχιστη βαθμολογία που, για κάθε σειρά του γονότυπου με μια αντίστοιχη σειρά έκφρασης στο σύνολο δεδομένων, θα πρέπει να περιμένουμε για να είναι συγκρίσιμα, ανεξάρτητα από την εθνικότητα. Στο δεξιό πίνακα του Σχήματος 5 βλέπουμε ότι αυτό δεν είναι η περίπτωση, και ότι ενώ οι περισσότερες ομάδες είναι πράγματι συγκρίσιμα, η ομάδα της Αφρικής παρουσιάζει ελάχιστη βαθμολογία που είναι υψηλότερες. Δεν έχουμε καμία

a priori

λόγο να πιστεύουμε ότι αυτή η ομάδα θα είναι υπερ-εκπροσωπούνται στον αριθμό των συστοιχιών του γονότυπου για τα οποία δεν υπάρχει αντιστοίχιση συστοιχία έκφρασης. Για ένα σχετικά υψηλό ποσοστό αυτής της ομάδας δεν μπορούμε να είμαστε σίγουροι για τον αγώνα μεταξύ γονότυπου και της έκφρασης, αλλά αυτό είναι πιο πιθανό να είναι μια συνέπεια των υψηλότερων βαθμολογιών που παρατηρήθηκαν στην ομάδα της Αφρικής από μια αιτία της.

εμείς δεν μπορεί να ισχυριστεί, για κάθε ζεύγος eQTL που χρησιμοποιούμε, ότι ο γονότυπος παρατηρούμε είναι στην πραγματικότητα οδηγεί την έκφραση (βλέπε επόμενη ενότητα). Στην καλύτερη περίπτωση, είναι πιθανό να είναι μια SNP tagging για την παραλλαγή συνάφεια (αν υπάρχει), και η απόδοση του tagging SNP θα ποικίλλουν μεταξύ των εθνοτικών ομάδων. Έχει παρατηρηθεί ότι μόνο το 50% των eQTLs εμφανίζονται σε περισσότερες από μία πληθυσμού, και μια πολύ μικρή μειοψηφία σε αρκετές [16], [17]. Έτσι, δεν πρέπει να μας εκπλήσσει για να δείτε τη συμπεριφορά όπως αυτή που φαίνεται στο Σχήμα 6, όπου η σχέση μεταξύ γονότυπου και της έκφρασης, που είναι τόσο σαφής στην Ευρώπη και την Ασία ομάδες δεν είναι εμφανής στην ομάδα της Αφρικής. Δεδομένου ότι αυτή η ομάδα είναι η μειοψηφία, η προβλεπόμενη γονότυπους που δημιουργούνται για τα άτομα αυτά από μια ένωση που ορίζεται από τις Ευρώπη και την Ασία ομάδες θα είναι κακή στην καλύτερη περίπτωση.

Απεικονίζονται οι τιμές log-έντασης για τον ανιχνευτή Illumina ILMN_1710752 στην το γονίδιο NAPRT1 συναρτήσει των γονότυπο προσκλήσεις για το SNP rs10112966 από την Affymetrix SNP_A-4292499 καθετήρα (όλα στο 8q24.3 περιοχή του ανθρώπινου γονιδιώματος). Φυσικά μόνο τα δεδομένα από τις συστοιχίες του γονότυπου και της έκφρασης, που μπορούν να συνδυαστούν εμφανίζεται. Η ένωση παρουσιάζεται για τρεις ομάδες. Η σχέση μεταξύ αυτού του SNP και το γονίδιο έχει ήδη σημειωθεί [26], όπως και οι διαφορετικές συχνότητες αλληλόμορφων μεταξύ των ομάδων.

Στενοί Συγγενείς και επικύρωση

Για την περαιτέρω επεξήγηση πτυχές θεωρούμε ένα επιπλέον σετ δεδομένων: τα δεδομένα γονότυπου και έκφρασης που σχετίζονται με το HapMap (Φάση Ι) δειγμάτων [18], όπως είχε αρχικά μελετηθεί από Stranger

et al

. [16], και να χρησιμοποιηθούν ως ένα από τα επεξηγηματικά συνόλων δεδομένων στο έγγραφο MixupMapper [2]. Αν και δεν είναι μια μελέτη για τον καρκίνο, αυτό μας επιτρέπει πρώτα να επιβεβαιωθεί ότι BADGER μπορεί να εντοπίσει τα προβλήματα που εντοπίστηκαν MixupMapper, δεύτερη μας επιτρέπει να εξετάσουμε ένα σύνολο δεδομένων με γνωστές οικογενειακές δομές, και το τρίτο παρέχει μια επεξηγηματική μελέτη με μεγαλύτερη ισορροπία της εθνικότητας, της ισορροπίας του το φύλο, και την υποτιθέμενη βελτίωση της ποιότητας των δεδομένων, καθώς αυτό ήταν μια προοπτική μελέτη. Τέλος, παρέχει μια πιο χρήσιμα στοιχεία που καθορίζονται για την επένδυση της «δύναμης» των τεχνικών αυτών. Δείτε Sweave S1 για περισσότερες λεπτομέρειες.

MixupMapper προσδιορίζονται μόνο ένα μπέρδεμα σε αυτό το σύνολο δεδομένων, κρίνοντας ότι η καλύτερη αντιστοιχία έκφρασης για τα δεδομένα γονότυπο δήθεν από NA18515 δείγμα ήταν ότι δήθεν από NA18517 δείγμα.

στον πληθυσμό CEU, υπάρχει ένα πρόβλημα με μία από τις συστοιχίες έκφρασης που συνδέονται με την «NA10856″ (με την ένδειξη GSM232786_NA10856_2_2). Ωστόσο, είναι σαφές ότι οι άλλες τρεις συστοιχίες έκφρασης είναι καλές αγώνες, και με κάποια έρευνα, είναι προφανές ότι οι τιμές για αυτή τη σειρά είναι ταυτόσημες με μία από τις Yoruban συστοιχιών (επισημασμένο GSM232802_NA18503_1_1), αλλά ότι οι τιμές διαφέρουν σε GEO, καθιστώντας ασαφές όπου προέκυψε το πρόβλημα. Μπορούμε να υποθέσουμε ότι από MixupMapper θα έχουν βρει έναν καλό αγώνα για τη συστοιχία γονότυπο NA10856, ότι δεν θα έχουν επισημάνει αυτό ως προβληματική.

Με ασβός, βρίσκουμε επίσης ότι τα τέσσερα δείγματα έκφρασης που συνδέονται με NA18515 όλα προσφέρουν τη σειρά γονότυπο αντιστοιχίζονται με NA18853 ως το καλύτερο αγώνα. Είναι αλήθεια ότι οι συστοιχίες έκφρασης που συνδέονται με NA18517 είναι τα καλύτερα παιχνίδια για τη συστοιχία SNP αντιστοιχίζονται με NA18515, ωστόσο αυτό είναι επειδή NA18517 είναι γονέας NA18515. Οι συστοιχίες έκφρασης που συνδέονται με NA18516 (τον άλλο γονέα) είναι το επόμενο καλύτερο αγώνα. Σε περίπτωση απουσίας ενός πίνακα έκφρασης για το παιδί, θα περιμέναμε το καλύτερο παιχνίδι για να είναι ένας από τους γονείς. Στην πραγματικότητα, μπορούμε εύκολα να δούμε από τους γονότυπους της μητέρας /πατέρα /παιδί τρίο που το σφάλμα (αν υπάρχει σφάλμα) πρέπει να είναι σε συστοιχία έκφρασης.

Η σειρά γονότυπο που προσφέρει την καλύτερη αντιστοιχία για να όλες οι συστοιχίες έκφρασης NA18515 σχετιζόμενη είναι εκείνη που συνδέεται με NA18853. Ο αγώνας είναι οριακά χειρότερη από ότι για την σειρά έκφρασης που συνδέονται με NA18853, αλλά αισθητά καλύτερη από αυτή που σχετίζεται με NA18854 (το παιδί της NA18853). Σύγκριση της πλήρους προφίλ έκφρασης υποδηλώνει ότι οι συστοιχίες έκφρασης NA18515 δεν είναι απλά τυχαίες επαναλήψεις της NA18853. Έτσι, το μπέρδεμα είναι δύσκολο να επιλυθεί από μια τέτοια απόσταση, και εμείς θα προτείνουμε την αφαίρεση των συστοιχίες έκφρασης που συνδέονται με NA18515 από τις αναλύσεις, αλλά θα αφήσει τις συστοιχίες γονότυπο ως έχουν. Σημειώστε ότι χρησιμοποιούμε τη μήτρα έκφραση δίνεται από Westra

et al

. έτσι μπορούν να κάνουν καμία αξίωση σχετικά με την αρχική μελέτη [16].

Αν και ο αγώνας σε ένα στενό συγγενή τείνει να μην είναι τόσο καλό όσο αυτό στη σωστή του δείγματος, μπορούμε να δούμε αρκετά επικάλυψη σε τιμές ότι εάν ένας από τα δείγματα που λείπουν τότε θα είμαστε σε κίνδυνο της κατά λάθος τη σύνδεση των δύο ως από το ίδιο άτομο. Αυτό θα ήταν πιθανώς να είναι περισσότερο από ένα κίνδυνο, αν η συστοιχία γονότυπο έλειπαν, όπως η ύπαρξη των συγγενών θα είναι πιο δύσκολο να συμπεράνουμε από τα δεδομένα της έκφρασης.

Η λήψη των Κινέζων Χαν και οι Ιάπωνες ιδιώτες, καθώς αυτά δεν περιέχουν περιπλέκει την οικογένεια ομάδες, μπορούμε να προσομοιώσει διακόπτες δείγματος και επιβεβαιώνουν τη χρησιμότητα ασβού. Διαπιστώνουμε ότι τα μισά από τα δείγματα πρέπει να αλλάξει για να απαιτήσει περισσότερες από μία παραγωγική επανάληψη (η τελική επανάληψη είναι πάντα για να επιβεβαιώσει ότι δεν υπάρχουν πλέον διακόπτες να κάνουν), και τα δύο τρίτα πρέπει να είναι ενεργοποιημένο για να υπάρχει αρχίζουν να είναι άλυτο διακόπτες. Αυτό μπορεί να είναι μια υπερ-εκτίμηση της απόδοσης, δεδομένου ότι η «εξωτερική» σετ eQTL μας ήταν, στην πραγματικότητα, που ορίζεται από Westra et al. Από τα στοιχεία αυτά, αλλά ανταγωνίζονται ενάντια σε αυτό είναι η έλλειψη λεπτότητα στις διορθώσεις που στην πράξη παρέχεται από το ανθρώπινο αξιολόγηση των πιθανών διακόπτες και εργαστήριο-επικύρωσης μεταξύ των επαναλήψεων. Η αξιολόγηση εδώ ήταν απλοϊκή και αυτοματοποιημένα για τη μελέτη προσομοίωσης. Ακόμα και επιτρέποντας για τα σημεία αυτά, το γεγονός ότι 80 από τα 90 δείγματα, θα πρέπει να διαταραγμένο πριν από μια προσέγγιση όπως BADGER δεν είναι σε θέση να προσθέσει αξία είναι αξιοσημείωτη.

Επιλογή eQTLs

Ο καθορισμός της eQTLs από τα στοιχεία που, συνεπώς, μπορεί δυνητικά να επηρεάσει σε κάποιο γενετικά διακριτή μειονότητα σε μια μελέτη. Westra και οι συνεργάτες του [2] αναφέρουμε μερικά από τα πιθανά οφέλη από τη χρήση εξωτερικά ορίζεται eQTLs. Σίγουρα θα υπάρξουν οφέλη για αυτόν τον τρόπο, αν θα μπορούσαμε να εξασφαλίζουν ότι όλοι οι υποομάδες εκπροσωπήθηκαν. Είναι γνωστό ότι η απόδοση των ανιχνευτών έκφρασης μπορεί να επηρεαστεί από SNPs [19] που τυχαίνει να καλύπτεται από ένα συγκεκριμένο ιχνηλάτη και ότι το φαινόμενο αυτό μπορεί να μιμηθεί τη συμπεριφορά eQTL ( «cis-eQTL τεχνήματα» [20], [21]). Έχουμε δείξει συγκεκριμένα ότι αυτό είναι ένα πρόβλημα για τους ανιχνευτές μεγαλύτερου μήκους του Illumina BeadArrays [22].

Πολλές μελέτες eQTL αποδιαχωρισμό τέτοιων ανιχνευτών έκφρασης για την αποφυγή ψευδών ενώσεις [23]. Θα προτείναμε ότι αυτά τα «αντικείμενα cis-eQTL« όχι μόνο να βοηθήσει στη διαδικασία, όπως σημειώνεται από Westra

et al

., Αλλά μπορεί να παρέχει μια ισχυρή βάση για τη διόρθωση λαθών. Με την αξιοποίηση ενός τεχνικού αντικειμένου με αυτόν τον τρόπο, ελπίζουμε να είναι λιγότερο ευαίσθητα στην πραγματική βιολογικές διαφορές μεταξύ των ομάδων των ασθενών από ό, τι θα ήταν εάν στηρίζονται στην ομοιομορφία της πραγματικής συμπεριφοράς eQTL σε όλους τους πληθυσμούς.

Εμείς επιλέξαμε αρχικά ένα σύνολο από 383 eQTLs βάσει της δύναμης της σύνδεσης φαίνεται στα δεδομένα μας. Η σημασία του σωματείου είναι τόσο ένα μέτρο της κατανομής των γονότυπων, όπως είναι η διακριτική δύναμη του σωματείου έκφραση-SNP, αλλά αυτό είναι ένα πρώτο πέρασμα και το σύνολο είναι εκλεπτυσμένη ως μέρος της προσέγγισης BADGER όπως περιγράφεται στις Μεθόδους . Φυσικά κάποιες από αυτές τις eQTLs είναι «αντικείμενα cis-eQTL». Πράγματι, αυτή η αρχική δέσμη ανιχνευτών έκφρασης ήδη εμπλουτισμένο για τους ανιχνευτές που καλύπτουν SNPs με 184 έξω από 383 (48%) που υπάγονται σε αυτήν την κατηγορία, σε αντίθεση με 11.027 από 34.361 (32%) της αξιόπιστης ανιχνευτές στη συστοιχία. Τα πλήρη στοιχεία της κάλυψης SNP για συστοιχίες έκφρασης Illumina δίνονται στον Πίνακα 1. Παρόμοιες πληροφορίες είναι διαθέσιμες για συστοιχίες Affymetrix [24].

Όταν το σύνολο των ενώσεων έκφραση-SNP μειώνεται σε 125 ανιχνευτή ζεύγη , είναι περαιτέρω εμπλουτισμένο για SNP που καλύπτουν ανιχνευτές. Μόνο το 26% των 199 ανιχνευτές που δεν καλύπτουν SNPs επιβιώσει μέσα στο εκλεπτυσμένο σύνολο, ενώ αυτό αυξάνεται σε 33% για τα 119 ανιχνευτές που καλύπτουν ένα SNP, 47% για τα 38 ανιχνευτές που καλύπτουν δύο SNPs και 59% για τα 27 ανιχνευτές που καλύπτουν περισσότερο από δύο SNPs.

Για να ενισχύσει αυτό το σημείο, μεταξύ των σετ μας, υπάρχει μια τάση ότι οι περισσότεροι SNPs ο καθετήρας έκφραση καλύπτει, τόσο μικρότερες είναι οι διαφορές μεταξύ των προβλεπόμενων και παρατηρούνται τιμές του SNP-ανιχνευτή στην ένωση eQTL. Αυτό φαίνεται για τις ομάδες της Ευρώπης και της Αφρικής στο Σχήμα 7. Τα eQTLs μας προκατειλημμένη απέναντι στην ομάδα της Ευρώπης που περιέχει την πλειοψηφία των δειγμάτων μας, και έτσι οι παρατηρούμενες συσχετίσεις είναι ισχυρότερες για αυτή την ομάδα. Παρά τις ενώσεις στην ομάδα Αφρική είναι γενικά πιο αδύναμα, οι ανιχνευτές που καλύπτουν πολλαπλές SNPs εξακολουθούν να εξηγήσει μια χρήσιμη αναλογία της μεταβολής του log-έκφρασης και αν επιλεγεί με αμερόληπτο τρόπο (π.χ. με βάση αποκλειστικά και μόνο για σχολιασμό) μπορούν να παρέχουν μια σειρά από ανιχνευτές που . θα είναι αξιόπιστη στις διάφορες ομάδες του πληθυσμού

Σχεδίαση για το σύνολο των 383 eQTLs, ο μέσος όρος τετραγώνων των καταλοίπων (προβλέψει – παρατηρείται μετράει Β-αλληλόμορφο) έναντι του αριθμού των SNPs που βρίσκονται «κάτω» του ανιχνευτή έκφρασης σύμφωνα με το σχολιασμό. Κατά μέσο όρο, οι προβλέψεις είναι πιο κοντά στις παρατηρήσεις για τους ανιχνευτές που βρίσκονται σε πολλαπλά SNPs.

Σχεδιασμός Πειραμάτων

Πλάκα Διάταξη για Sex-based Diagnostics

Με επιλέγοντας διακριτές αλλά διαφορετικές μορφές, ανάλογα με το φύλο, για τη διαμόρφωση του δείγματος σε ένα πιάτο, και διασφαλίζοντας ότι τα σχέδια δεν έχουν περιστροφική συμμετρία, η αποτύπωση των τεκμαιρόμενη φύλων δειγμάτων από πλάκα θα παρέχει μια σαφή και οριστική διαγνωστική ως προς το αν το σωστό πλάκα έχει χρησιμοποιηθεί και αν στο σωστό προσανατολισμό. Μεμονωμένα, απλό, διακόπτες των γειτονικών δειγμάτων (στη στήλη ή γραμμή) δεν μπορεί να ενταχθεί, αλλά μπορούμε να μεγιστοποιήσουμε τις πιθανότητες να το κάνουν με την επιλογή προτύπων σύμφωνα με τους περιορισμούς μας, που ελαχιστοποιούν τον αριθμό των γειτονικών ζευγών (σε στήλες ή γραμμές) του ίδιου φύλου.

Εάν οι αριθμοί των φύλων είναι ίσες σε μια μελέτη, ένα μοτίβο σκακιέρας ελαχιστοποιεί τους αριθμούς των γειτονικών ζευγαριών του ίδιου φύλου, αλλά έχει περιστροφική συμμετρία. Μικρές διαταραχές από το μοτίβο σκακιέρας θα είναι επιρρεπείς σε σύγχυση (είτε για τον εαυτό τους μέσω μιας περιστροφής και μικρό αριθμό των διακοπτών), ή σε ένα άλλο (μέσω ελαφρώς πιο διακόπτες). Φαίνεται πιθανό ότι ένα κανονικό σχέδιο, θα ήταν προτιμότερο, για ευκολία τη σύσταση της πλάκας, και εφόσον απαιτείται, στη συνέχεια, μόνο ένας μικρός αριθμός των πλακών αυτό μπορεί να είναι εφικτό. Σημειώστε, ωστόσο, ότι προκειμένου να αποφευχθεί η περιστροφική συμμετρίες, και δυσδιάκριτες πλάκες, ο αριθμός των απλών διακοπτών σε ένα πιάτο, που καθίστανται ανιχνεύσιμες (δηλαδή, ο αριθμός των ζευγών των γειτονικών δειγμάτων του ιδίου φύλου) αυξάνει ταχέως (που φαίνεται στο Σχήμα 8) .

Εικονογραφημένο είναι τρία διαφορετικά πρότυπα του φύλου (που υποδεικνύεται από το χρώμα) με την οποία τα δείγματα θα μπορούσαν να καλοστημένο. Υπάρχουν 172 διαφορετικά σύνολα γειτονικών ζευγών (αγνοώντας διαγώνιοι) ότι μπορεί κανείς να εντοπίσει σε ένα πιάτο 8 × 12, και έτσι 172 ευκαιρίες για ένα απλό διακόπτη των γειτονικών δειγμάτων. Για την απλούστερη προσέγγιση που απεικονίζεται, 36 από αυτούς (τρεις σε κάθε στήλη) είναι του ίδιου φύλου και έτσι δεν θα είναι σε θέση να χρησιμοποιούν το φύλο ως το αναγνωριστικό για να εντοπίσετε την εναλλαγή των εν λόγω δειγμάτων. Το αντίστροφο αυτού του σχεδιασμού θα είναι πανομοιότυπο υπό περιστροφή προς την απεικονιζόμενη σχεδιασμό και έτσι μπορεί να μην είναι επιθυμητό να χρησιμοποιηθούν και τα δύο. Έτσι βλέπουμε γρήγορα την ανάγκη για πιο περίπλοκη σχέδια όπως η δεύτερη απεικονίζεται εδώ. Αρκετές παραλλαγές των τεσσάρων βασικών στήλες θα παράγει αποδεκτά (και διακριτή) σχέδια, με κάποια μικρή επίδραση στον αριθμό των δειγμάτων διακόπτες αναγνωρίσιμο από τον σχεδιασμό. Το τρίτο σχέδιο δείχνει πώς ένας πιθανώς ελκυστική διάταξη, από την άποψη της ευκολίας, έχει κακή ικανότητα να ανιχνεύει απλούς διακόπτες των δειγμάτων – μόλις κάνει καλύτερα από μια τυχαία διάταξη.

Χρόνιες ασθένειες

PLoS One: Κλήση Δείγμα Mix-Ups στον Καρκίνο Πληθυσμός Σπουδών