PLoS One: European American διαστρωμάτωση σε καρκίνο των ωοθηκών υπόθεση Data Control: Η χρησιμότητα του Γονιδιώματος-Wide Δεδομένων συναχθεί Ancestry


Αφηρημένο

Ερευνήσαμε την ικανότητα αρκετών κύρια συστατικά ανάλυσης (PCA) -με βάση τις στρατηγικές για την ανίχνευση και τον έλεγχο για τη διαστρωμάτωση του πληθυσμού, χρησιμοποιώντας δεδομένα από μια πολυκεντρική μελέτη του επιθηλιακού καρκίνου των ωοθηκών στις γυναίκες της Ευρώπης και της Αμερικής εθνικότητα. Αυτές περιλαμβάνουν μια διόρθωση βασίζεται σε μια ενημερωτική δείκτες (AIMS) πάνελ έχουν σχεδιαστεί για να συλλάβει ευρωπαϊκή προγονική παραλλαγή και διορθώσεις χρησιμοποιώντας un-αραιωμένο δεδομένων SNP γονιδίωμα-ευρεία καταγωγή? δείγματα ασθενών-μαρτύρων αντλήθηκαν από τέσσερα γεωγραφικά διακριτές Βόρειας Αμερικής sites. Οι στόχοι μόνο και γονιδιώματος-ευρεία πρώτη κύρια συστατικά (PC1) και οι δύο αντιστοιχούσε στην περιγράφηκε προηγουμένως Βορρά ή ΒΔ-άξονα της ευρωπαϊκής παραλλαγής. Βρήκαμε ότι το γονιδίωμα-ευρεία PCA κατέλαβε αυτό το πρωταρχικό διάσταση της διακύμανσης με μεγαλύτερη ακρίβεια και προσδιόρισε επιπλέον άξονες του γονιδιώματος-ευρεία διακύμανση που παρουσιάζουν ενδιαφέρον για επιθηλιακό καρκίνο των ωοθηκών. Σύλλογοι εμφανής μεταξύ των υπολογιστών του γονιδιώματος-ευρεία και χώρο μελέτης επιβεβαιώνουν βορειοαμερικανική ιστορία της μετανάστευσης και δείχνουν ότι ανεξερεύνητο διαστάσεις ψέμα διακύμανση εντός της Βόρειας Ευρώπης. Η δομή συλλαμβάνεται από το γονιδίωμα-ευρεία PCA βρέθηκε επίσης στο εσωτερικό των ατόμων ελέγχου και δεν αντικατοπτρίζει τη μεταβολή υπόθεση ελέγχου που υπάρχουν στα δεδομένα. Το PCA γονιδιώματος σε επίπεδο επισημαίνονται τρεις περιοχές των τοπικών LD, που αντιστοιχούν στο (LCT) γονίδιο της λακτάσης στο χρωμόσωμα 2, το σύστημα ανθρώπινο αντιγόνο λευκοκυττάρων (HLA) στο χρωμόσωμα 6 και σε ένα κοινό πολυμορφισμό αντιστροφή στο χρωμόσωμα 8. Αυτά τα χαρακτηριστικά δεν το έκανε συμβιβασμό η αποτελεσματικότητα των προσωπικών υπολογιστών από αυτή την ανάλυση για τον έλεγχο καταγωγή. Αυτή η μελέτη καταλήγει στο συμπέρασμα ότι, μολονότι σκοποί πάνελ είναι ένας οικονομικά αποδοτικός τρόπος για να συλλάβει τη δομή του πληθυσμού, δεδομένων γονιδιώματος σε επίπεδο θα πρέπει να χρησιμοποιείται κατά προτίμηση όταν είναι διαθέσιμο

Παράθεση:. Ράσκας P, Iversen Ε, Τσεν Α, Chen Ζ, Fridley BL, Permuth-Wey J, et al. (2012) European American διαστρωμάτωση σε καρκίνο των ωοθηκών υπόθεση Data Control: Η χρησιμότητα του Γονιδιώματος-Wide Δεδομένων συναχθεί Προγόνων. PLoS ONE 7 (5): e35235. doi: 10.1371 /journal.pone.0035235

Επιμέλεια: Manfred Kayser, Πανεπιστήμιο Erasmus Medical Center, Ολλανδία

Ελήφθη: 28 Ιουνίου του 2011? Αποδεκτές: 13 Μάρ 2012? Δημοσιεύθηκε: May 9, 2012 |

Copyright: © 2012 Ράσκας et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Η γονοτυπική για το στάδιο 1 υποστηρίχθηκε από R01-CA-114 343 και R01-CA114343-S1. Η μελέτη MAY0 υποστηρίζεται από R01-CA-122 443 και P50-CA-136393 και χρηματοδότηση από το Ίδρυμα Mayo. Η μελέτη Υπαξιωματικών υποστηρίζεται από R01-CA-76016. Η μελέτη TBO υποστηρίζεται από R01-CA-106 414, η Αμερικανική Εταιρεία Καρκίνου (CRTG-00-196-01-CCE), και η Προηγμένη Τεχνολογία Ανίχνευσης Καρκίνου Κέντρο Grant, Υπουργείο Άμυνας (DAMD-17-98-1-8659) . Η μελέτη TOR υποστηρίζεται από επιχορηγήσεις από το καναδικό Αντικαρκινική Εταιρεία και το Εθνικό Ινστιτούτο Υγείας (R01-CA-63682 και R01-CA-63678). Η Mayo Clinic Γονοτυπικές κοινόχρηστο πόρο υποστηρίζεται από το Εθνικό Ινστιτούτο Καρκίνου (P30-CA-15083). Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

Γονιδίωμα-ευρύ μελέτες συσχέτισης (GWAS) έχουν γίνει ένα απαραίτητο εργαλείο για την ανακάλυψη της γενετικής προδιάθεσης για την πολύπλοκη ασθένεια [1] – [4]. Η ισχύς των GWAS μπορούν να επηρεαστούν από την ακατάλληλη ελέγχου για κληρονομική ασθένεια που σχετίζεται με το γονιδίωμα-ευρεία διακύμανση φόντο. διαστρωμάτωση του πληθυσμού (PS) αναφέρεται σε γονιδιώματος σε επίπεδο πρότυπα της ανισορροπίας σύνδεσης (LD), ότι, όταν σχετίζεται με τη νόσο, μπορεί να συγκαλύψει το σήμα (παρών ή απών) των επιμέρους SNPs [5] – [9].

Παρά το γεγονός ότι έχει αναγνωριστεί η σύγχυση επίδραση της στρωματοποίησης του πληθυσμού, έχει θεωρηθεί ότι είναι πρακτικά αφορούν κατά κύριο λόγο στην αναμεμειγμένη ή μικτούς πληθυσμούς με καταγωγή από διαφορετικές ηπείρους [10], [11]. Παρ ‘όλα αυτά, μερικοί συγγραφείς έχουν δείξει ότι ακόμη και μέσα στο σχετικά πιο ομοιογενής πληθυσμός της Ευρωπαϊκής Αμερικανών, τη δομή του γονιδιώματος-ευρεία μπορεί ακόμα να είναι ένα πρόβλημα για μελέτες συσχέτισης [12] – [15].

Πάνελ των SNPs έχουν σχεδιαστεί για την ανίχνευση και τον έλεγχο του πληθυσμού διαστρωμάτωση στην Ευρωπαϊκή Αμερικανούς ειδικά [14] – [17]. Ακόμα κι αν αυτές οι μελέτες έχουν περιλάβει μια ποικιλία από σύνολα δεδομένων που έχουν όλα περιγραφεί ένα κοινό κύριο άξονα της διακύμανσης για την ευρωπαϊκή καταγωγή που αποτελείται από ένα Βόρεια ή Βορειοδυτική – Νοτιοανατολική Cline. Ωστόσο, οι μελέτες αυτές διαφέρουν ως προς τον αριθμό των σημαντικών διαστάσεων της διακύμανσης, τα SNPs που επιλέγονται ως καταγωγή πληροφοριακοί δείκτες (AIMS), και του αριθμού των σκοπών που απορρέουν. Ως εκ τούτου, τη λήψη απόφασης για τη βέλτιστη πίνακα για ένα συγκεκριμένο σύνολο δεδομένων δεν είναι απλή.

Αυτές οι ευρωπαϊκές επιτροπές AIM έχουν σχεδιαστεί με στόχο την παροχή μιας οικονομικά αποδοτικό τρόπο για τον έλεγχο για τη διαστρωμάτωση μέσω της μείωσης του κόστους του γονότυπου στις υποψήφιες μελέτες των γονιδίων και μελέτες επικύρωσης [12], [17]. Παρά το γεγονός αυτό, μπορούν επίσης να χρησιμοποιηθούν σε μελέτες συσχέτισης γονιδίωμα επίπεδο (GWAS). Αν και μια ανάλυση κύριο συστατικό (PCA) μπορεί να διεξαχθεί σε ολόκληρο το σύνολο δεδομένων GWAS με σκοπό τον έλεγχο για την καταγωγή [18], περιορίζοντας την ανάλυση στους στόχους μπορεί να παρέχει έναν τρόπο για την αποφυγή των επιπτώσεων των τοπικών προτύπων LD για τα αποτελέσματα PCA και τρόπος για την πρόληψη σύλληψη και τον έλεγχο μακριά τη μεταβολή περίπτωση ελέγχου ενδιαφέροντος.

Αυτή η μελέτη συγκρίνει την απόδοση του ελέγχου για το PS μέσω PCA χρησιμοποιώντας το Πάσχου et al. ΑΝΤΙΚΕΙΜΕΝΙΚΟΙ ΣΤΟΧΟΙ πίνακα [17] δεδομένα (Πάσχου PCA) και με τη χρήση των δεδομένων γονιδιώματος-ευρεία (GWAS PCA) σε ένα ωοθηκών δεδομένα ελέγχου περίπτωση του καρκίνου που ευρωπαϊκών Αμερικανών από τέσσερις διαφορετικές περιοχές της Βόρειας Αμερικής. Συγκεκριμένα, ερευνούμε τις επιπτώσεις της σύλληψης διακύμανσης και περιοχές υψηλής τοπικής Ν.Δ. για τη στρατηγική προσαρμογής PS GWAS PCA βάση περίπτωση-ελέγχου.

Μέθοδοι

είναι

Λεπτομέρειες του καρκίνου των ωοθηκών GWAS δημοσιεύονται [ ,,,0],19]. Εν συντομία, τα δεδομένα GWAS Στάδιο Ι χρησιμοποιούμε εδώ προέρχονται από τέσσερις μελέτες ασθενών-μαρτύρων του επιθηλιακού καρκίνου των ωοθηκών: η Mayo Clinic των ωοθηκών Μελέτης του Καρκίνου (MAYO, n = 877) (Rochester, MN), το οποίο περιλαμβάνει τους κατοίκους της εξάμηνης κατάσταση γύρω περιοχή (MN, ΙΑ, WI, IL, ND, SD), Βόρεια Καρολίνα των ωοθηκών μελέτης του Καρκίνου του Πανεπιστημίου του Duke (Υπαξιωματικών, n = 1147) (Durham, NC), το οποίο περιλαμβάνει τους κατοίκους της γύρω περιοχής 48 νομών, το Πανεπιστήμιο του Τορόντο οικογενής ωοθηκών Μελέτη όγκου (TOR, n = 1275) (Ontario, Canada), και H. Lee Moffitt Κέντρο Καρκίνου και μελέτης του Καρκίνου Tampa Bay ωοθηκών του Ερευνητικού Πανεπιστημιακού Ινστιτούτου (TBO, n = 396) (Tampa, FL), το οποίο περιλαμβάνει τους κατοίκους από το περιβάλλον 2 περιοχή νομών. Όλοι οι συμμετέχοντες αυτο-αναφερόμενη ευρωπαϊκού μη-εβραϊκής καταγωγής. Για να αυξήσετε αιτιολογικός ομοιογένεια, θα αποκλείονται περιπτώσεις με μη-επιθηλιακό ή οριακό όγκους, γνωστό

BRCA1

και

BRCA2

φορείς μετάλλαξης και οι γυναίκες με προηγούμενο ιστορικό των ωοθηκών, του μαστού, του ενδομητρίου, ή έγκαιρης εμφάνιση καρκίνου του παχέος εντέρου. Όλοι οι έλεγχοι είχαν τουλάχιστον μία ωοθήκη άθικτο κατά την ημερομηνία αναφοράς και ήταν συχνότητας ταιριάζουν σε περιπτώσεις σχετικά με την ηλικιακή ομάδα. Το πρωτόκολλο της μελέτης εγκρίθηκε από το διοικητικό συμβούλιο θεσμική επανεξέταση σε κάθε κέντρο (από τα IRBs στη Mayo Clinic, στο Πανεπιστήμιο Duke, στο Πανεπιστήμιο του Τορόντο, και στο Lee Moffitt Κέντρο Καρκίνου) και όλοι οι συμμετέχοντες στη μελέτη με την προϋπόθεση γραπτή συγκατάθεση.

αίμα χρησίμευσε ως πηγή του γονιδιωματικού DNA. Όλα τα δείγματα γονότυπος χρησιμοποιώντας το Array Illumina Infinium 610K και το λογισμικό Illumina του Γονιδιώματος Studio ™ χρησιμοποιήθηκε για την εκτέλεση της αυτόματης ομαδοποίησης γονότυπο και την κλήση. Μετά τον έλεγχο της ποιότητας που περιγράφεται στο Permuth Wey et al [19], ένα μέγεθος δείγματος 3.715 άτομα (1.815 περιπτώσεις και 1.900 μάρτυρες) με 559.179 δείκτες ήταν διαθέσιμο για ανάλυση.

Principal Component Αναλύσεις (PCA)

PCA έγινε σε 4 σετ των δεικτών: (1) Η Πάσχου ευρωπαϊκούς στόχους πίνακα (Πάσχου PCA), (2) όλα τα διαθέσιμα δείκτες GWAS από τη συστοιχία Illumina 610K γονότυπος σε αυτή τη μελέτη (GWAS PCA), (3) όλα διατίθενται δείκτες που χρησιμοποιούν οι έλεγχοι μόνο (PCA έλεγχο GWAS) και (4) όλα τα διαθέσιμα δείκτες με την αφαίρεση των δεικτών σε περιοχές υψηλής LD (GWAS LD PCA), χρησιμοποιώντας το πακέτο snpMatrix στο λογισμικό R [20].

Λαμβάνοντας υπόψη ένα δεδομένα μήτρα Χ με Ν άτομα στις σειρές και Ρ SNPs στις στήλες, υπολογίσαμε τις ιδιοτιμές και τα ιδιοδιανύσματα του Ν με Ν μήτρα, XX

T. Τα ιδιοδιανύσματα αντιστοιχούν στις βαθμολογίες PC (S) το οποίο μπορεί στη συνέχεια να χρησιμοποιηθεί για τον υπολογισμό των φορτίων (Β) του SNPs για κάθε υπολογιστή μέσω πολλαπλασιασμού με τη διαγώνιος πίνακας των ιδιοτιμών (V):

Για τον έλεγχο GWAS PCA, οι έλεγχοι μόνο χρησιμοποιήθηκαν για την απόκτηση Β και στη συνέχεια οι βαθμολογίες που λαμβάνονται μέσω PC πολλαπλασιάζοντας το σύνολο των δεδομένων που σε αυτές τις φορτίσεις (X

ΤΒ). Μόνο τα πρώτα 10 ιδιοτιμές διατήρησε σε όλη αυτούς τους υπολογισμούς.

Η αφαίρεση των ακραίων τιμών

19 έλεγχοι που ήταν περισσότερο από έξι τυπικές αποκλίσεις μακριά από τη μέση βαθμολογία για τον υπολογιστή για οποιαδήποτε από τα πρώτα 10 υπολογιστές ταυτοποιήθηκαν ως ακραίες τιμές στο PCA έλεγχο GWAS. Μια πρόσθετη περίπτωση μεμονωμένων ταυτοποιήθηκε ως ακραία στην GWAS PCA. Όλα τα 20 άτομα απομακρύνθηκαν από κάθε ΠΑΠ με ​​βάση τα δεδομένα του γονιδιώματος-ευρεία. 1881 έλεγχοι και 1814 περιπτώσεις έμειναν από το αρχικό σύνολο δεδομένων του 1900 ελέγχους και 1815 περιπτώσεις, για συνολικά 3695 άτομα.

Η αφαίρεση της Ν.Δ. Περιφερειών

Οι περιοχές LD ορίστηκαν από την οπτική επιθεώρηση τα οικόπεδα φορτίσεις για τις επιμέρους υπολογιστές και τον εντοπισμό δύο SNPs που οριοθετούν την κορυφή στο σύνολό της. Όλες οι SNPs εντός αυτής της περιοχής απομακρύνθηκαν με εξαίρεση ένα κεντρικό SNP με μια ακραία φόρτωση, τα οποία προσδιορίζονται επίσης μέσω του οικοπέδου. Από τους 559.179 SNPs διατίθεται στα δεδομένα GWAS, 553.601 διατηρήθηκαν για το LD PCA GWAS.

Σύλλογος Δοκιμές

Οι δοκιμές του συνεταιρίζεσθαι του κάθε SNP με τον καρκίνο των ωοθηκών διεξήχθησαν χρησιμοποιώντας μια γενικευμένη γραμμικό μοντέλο που περιλαμβάνονται υπολογιστές ως συμπαράγοντες με την επίδραση SNP διαμορφώνεται ως τακτικός (log-προσθετικό) γονοτυπική αποτέλεσμα. Οι παράγοντες του πληθωρισμού υπολογίστηκε από το λόγο του παρατηρούμενου στολισμένα σημαίνει για την αναμενόμενη τιμή της υπό την παραδοχή chi-τετράγωνο. δοκιμές σύνδεση των υπολογιστών με την περιοχή και την ασθένεια διεξήχθησαν μέσω της πολλαπλής γραμμικής παλινδρόμησης εφαρμοστεί R. Κάθε PC είχε εξασθενήσει σχετικά με την κατάσταση της νόσου και το site.

MLE και τιμή et al. στοχεύει Panel

σε additon, μέγιστη εκτίμηση πιθανότητας χρησιμοποιήθηκε για τον καθορισμό εκτιμήσεις για Northwestern Ευρώπης, της Νοτιοανατολικής Ευρώπης και της Ασκενάζι εβραϊκής καταγωγής βασίζεται σε additonal ευρωπαϊκή ομάδα AIM ανά Τιμή et al [16].

Αποτελέσματα

Principal Components

Συγκρίναμε τα GWAS και Πάσχου υπολογιστές με βάση τις συσχετίσεις τους ο ένας στον άλλο, τις ενώσεις τους με τη νόσο έλεγχο για την περιοχή και τις επιπτώσεις τους στον παράγοντα του πληθωρισμού, όπου επικαλείται την ένωσή τους με την περιοχή ως υποκατάστατο για συνάφειά τους με τους προγόνους. Η συσχέτιση μεταξύ των πρώτων υπολογιστών (δηλαδή PC1) του Πάσχου PCA και την GWAS PCA ήταν 0,79. Αυτό το πρώτο PC αντιστοιχεί στον άξονα βορειοδυτικά-νοτιοανατολικά της διακύμανσης που η Πάσχου et al πάνελ αποκλειστικά σχεδιασμένο για να συλλάβει. Μια ξεχωριστή ανάλυση με τη χρήση του πίνακα Τιμή et al επιβεβαίωσε αυτό (βλέπε σχήμα 1) [16]. Παρά το γεγονός ότι και οι δύο PC1s που σχετίζονται με την περιοχή, GWAS PC1 είχε πιο σημαντική p-τιμές (βλέπε πίνακα 1) και διορθώνεται για το συντελεστή πληθωρισμού καλύτερα από Πάσχου PC1 (βλέπε πίνακα 2). Ομοίως, όταν ελήφθησαν οι διαφορές ιστοσελίδα υπόψη, μόνο GWAS PC1 προσκόμισε αποδεικτικά στοιχεία μιας σύνδεσης μεταξύ του πρώτου άξονα της ευρωπαϊκής Αμερικής προγονική διακύμανση και τον καρκίνο των ωοθηκών.

μπλε, πράσινο και κόκκινο τα σημεία αντιπροσωπεύουν τα άτομα με τα υψηλότερα τις εκτιμήσεις της βορειοδυτική, νοτιοανατολική και Ασκενάζι εβραϊκής καταγωγής αντίστοιχα που λαμβάνονται από MLE ανάλυση με τιμή et al. ΑΝΤΙΚΕΙΜΕΝΙΚΟΙ ΣΤΟΧΟΙ πίνακα.

Η

Η

GWAS PCA επίσης συλληφθεί επιπλέον προγονική δομή. GWAS PC2 στο σχήμα 1 δείχνει τη δομή μέσα σε ιδιώτες με Northwestern καταγωγή που δεν είναι εμφανής σε Πάσχου PC2. Οι screeplots τόσο για ΠΑΠ (βλέπε σχήμα S1) έδειξε ότι σε αντίθεση με την Πάσχου PCA όπου μόνο PC1 βρίσκεται σαφώς πριν από τον αγκώνα στο οικόπεδο, το κριτήριο που χρησιμοποιείται συχνά για να συμπεράνουμε ότι η διακύμανση εξηγείται από το PC είναι μεγαλύτερη από αυτή που αναμενόταν από την τύχη , οι υπολογιστές GWAS μόνο άρχισε να σταθεροποιείται περίπου στο 20

ου PC. Αυτό additonal δομή επιβεβαιώθηκε από την εξερεύνηση τα πρώτα 100 υπολογιστές και την ένωσή τους με την περιοχή. Συμπεριλαμβανομένων όλων των κατά ζεύγη συγκρίσεων ιστοσελίδα, η μεγαλύτερη σημασία περιορίστηκε στους πρώτους 20 υπολογιστές (βλέπε σχήμα S2). Η μείωση της ανάλυσης στο πρώτο 10 PCs, μόνο υπολογιστές 1,3 και 4 συσχετίζονταν σημαντικά τόσο χώρο και τον καρκίνο των ωοθηκών (βλέπε σχήμα 2), ενώ PC2 δεν συσχετίστηκε με την ιστοσελίδα ή καρκίνο των ωοθηκών. Αυτό υποδηλώνει ότι PCs 1, 3 και 4 μπορούν όλα υπόψη για τις διαστάσεις της προγονικής παραλλαγή που έχουν τη δυνατότητα για σύγχυση δοκιμή ένωση ελέγχου των ωοθηκών περίπτωση του καρκίνου. Η επίδραση της διατήρησης των πρώτων 4 υπολογιστές από τον παράγοντα του πληθωρισμού υποστηρίζει επίσης αυτή τη διαπίστωση αφού ο συντελεστής πληθωρισμού ήταν σημαντικά χαμηλότερο από ό, τι όταν χρησιμοποιείται μόνο PC1 GWAS ή ακόμα και τα πρώτα 10 υπολογιστές (βλέπε σχήμα 3).

P-τιμές για όλα τα ζεύγη συγκρίσεις μεταξύ των τεσσάρων χώρων είναι δεδομένη.

η

Τα πρώτα 10 υπολογιστές που λαμβάνονται μέσω Πάσχου PCA, GWAS PCA έλεγχο, GWAS PCA και GWAS LD PCA χρησιμοποιείται ως συμπαράγοντες στις δοκιμές γονιδίωμα-ευρεία ένωση στον καρκίνο των ωοθηκών. Σημειώστε ότι ο πίνακας Πάσχου σχεδιάστηκε για να συλλάβει μόνο ένα σημαντικό PC.

Η

GWAS Ελέγχου

Το γεγονός ότι GWAS PC1 είναι πιο έντονα σχετίζονται με τον καρκίνο των ωοθηκών από Πάσχου PC1 και ότι παράγει μια πιο αποτελεσματική μείωση του συντελεστή πληθωρισμού μπορεί να οδηγήσουν κάποιον να πιστέψει ότι GWAS PC1 μπορεί να συλλάβει παραλλαγή έλεγχο υπόθεσης και τη μείωση της ισχύος της GWAS. Το ίδιο θα μπορούσε να υποστηριχθεί για τις πρόσθετες υπολογιστές που συνδέονται με τον καρκίνο των ωοθηκών. Για να δοκιμάσετε αυτό, πραγματοποιήσαμε μια PCA χρησιμοποιώντας μόνο τα άτομα ελέγχου (GWAS PCA ελέγχου), στην οποία οι τιμές της υπόθεσης υπολογιστές λήφθηκαν όπως περιγράφεται στις Μεθόδους.

Αν και υπολογιστές 1 και 2 του PCA ελέγχου GWAS ήταν πολύ υψηλή συσχέτιση με τους ομολόγους τους σε GWAS PCA (ρ & gt? 0,9), υπολογιστές 3 και 4 συσχετίστηκαν επίσης, αν και σε μικρότερο βαθμό (ρ & gt? 0.6, βλέπε πίνακα 3). Ένας γραμμικός συνδυασμός των υπολογιστών ελέγχου GWAS 3 και 4 εξήγησε 68,9% της διακύμανσης στις GWAS PC 3 και 68,7% της διακύμανσης στις GWAS PC 4, ως εκ τούτου, υπήρξε μια ανακατανομή της διακύμανσης των GWAS υπολογιστές 3 και 4 σε αρκετές από GWAS ελέγχου υπολογιστές.

η

το σχήμα 3 δείχνει ότι οι παράγοντες του πληθωρισμού που λαμβάνεται κατά τη ρύθμιση για τους ηλεκτρονικούς υπολογιστές ελέγχου GWAS δείχνουν το ίδιο μοτίβο όπως εκείνα που λαμβάνονται κατά τη ρύθμιση για GWAS υπολογιστές, αλλά είναι συστηματικά χαμηλότερη, υποδεικνύοντας ότι ο πρώην παρέχουν μια λιγότερο αποτελεσματική διόρθωση για PS. Και στις δύο περιπτώσεις ο συντελεστής πληθωρισμού μειώθηκε σημαντικά από υπολογιστές 1, 3 και 4. Εάν η τελευταία επιτευχθεί αυτό με τη σύλληψη παραλλαγή έλεγχο περίπτωση, αυτοί οι άξονες της διακύμανσης δεν θα έχουν εντοπιστεί στο PCA χρησιμοποιώντας μόνο τα στοιχεία ελέγχου. Οι μικρότερες μειώσεις του συντελεστή πληθωρισμού που παρατηρείται για τις προσαρμογές ελέγχου GWAS είναι πιθανό λόγω του μικρότερου μεγέθους του δείγματος του PCA ελέγχου GWAS του (n = 1814 έναντι n = 3695). Η μείωση του συντελεστή πληθωρισμού επιτευχθεί με την προσθήκη PC5 ελέγχου GWAS μπορεί να εξηγηθεί από την συσχέτιση της (ρ = 0.3) για να GWAS PCA PC3.

Στη συνέχεια, συγκρίναμε τα αποτελέσματα της ρύθμισης για τα πρώτα 4 υπολογιστές των δύο γονιδίωμα-ευρεία ΠΑΠ για τις p-τιμές για τις ενώσεις SNP με τον καρκίνο των ωοθηκών. Εάν η GWAS PCA είχαν συλλάβει παραλλαγή περίπτωση ελέγχου, η δύναμη του συνεταιρίζεσθαι από τις κορυφαίες SNPs από τον έλεγχο GWAS προσαρμοστεί ανάλυση θα πρέπει να μειωθεί ή να ελέγχονται μακριά από GWAS PCA προσαρμοστεί ανάλυση. Αντ ‘αυτού, παρατηρήσαμε ότι οι πιο σημαντικές SNPs στον έλεγχο GWAS PC προσαρμοστεί ανάλυση παρέμειναν οι πιο σημαντικές SNPs στο προσαρμοσμένο PC ανάλυση GWAS (δείτε το δεξί πίνακα του σχήματος 4).

p-τιμές Αρνητική καταγραφής των κορυφαίων Επισκέψεις για τη συσχέτιση του καρκίνου των ωοθηκών μετά τον έλεγχο για την καταγωγή χρησιμοποιώντας πρώτες 4 υπολογιστές της PCA ελέγχου GWAS σε σύγκριση με το να μην τον έλεγχο για την καταγωγή (αριστερό πάνελ) και τον έλεγχο για την καταγωγή χρησιμοποιώντας πρώτες 4 υπολογιστές της GWAS PCA (δεξιά πλευρά).

Η

το σχήμα 4 δείχνει επίσης ότι GWAS διορθώνεται για τα κορυφαία hits στο

με τον ίδιο τρόπο όπως

έλεγχο GWAS. Η SNPs του οποίου η τιμή p άλλαξε την πιο σε σύγκριση με ένα μη διορθωμένη δοκιμασία ένωση τονίζεται είναι με κόκκινο χρώμα. Οι SNPs που διασχίζουν τη γραμμή ταυτότητας από το αριστερό πάνελ προς τα δεξιά του πίνακα είναι εκείνες των οποίων η δύναμη του συνεταιρίζεσθαι διορθώνεται στην ίδια κατεύθυνση με τις δύο σειρές των υπολογιστών και του οποίου η διόρθωση είναι ισχυρότερη χρησιμοποιώντας τους υπολογιστές GWAS. SNPs που είναι πιο μακριά από τη γραμμή ταυτότητας στο δεξί πάνελ από την αριστερά που δεν το διασχίζουν είναι εκείνοι των οποίων η δύναμη του συνεταιρίζεσθαι αλλάζει σε διαφορετικές κατευθύνσεις όταν adusting για ένα σύνολο υπολογιστών σε σχέση με το άλλο. Τρία από τα έξι SNPs που άλλαξε περισσότερο όταν, αναπροσαρμοσμένες για τους υπολογιστές ελέγχου GWAS ήταν πιο αποτελεσματικά διορθωθεί από τους υπολογιστές GWAS. Ένας SNP έλαβε περίπου το ίδιο επίπεδο διόρθωσης και δύο διορθώθηκαν προς την ίδια κατεύθυνση, αλλά όχι τόσο πολύ στην ρυθμιστεί ανάλυση GWAS όπως στην ανάλυση του ελέγχου προσαρμόζεται GWAS. Κανένα από τα SNPs διορθώθηκαν σε διαφορετικές κατευθύνσεις μεταξύ των δύο αναλύσεων.

Εκτός από την επίδραση στο p-τιμές για την κορυφή χτύπησε SNPs, μια σύγκριση της διόρθωσης γονιδιώματος κλίμακα για τις δύο ΠΑΠ μπορεί να επίσης, πρέπει να γίνουν. Η συσχέτιση μεταξύ των p-τιμές για όλους τους SNPs μεταξύ των μη διορθωμένων δοκιμές σύνδεσης και εκείνων που διορθώνονται μέσω GWAS PCA ήταν 0,922, μεταξύ των μη διορθωμένων και GWAS ελέγχου ήταν 0.958 και μεταξύ των GWAS και GWAS έλεγχο ΠΑΠ ήταν 0,983. Αν GWAS PCA είχαν πάρει για τη διαφοροποίηση των μαρτύρων γονιδίωμα-ευρεία, και ως εκ τούτου, τη διόρθωση σε ένα ποιοτικά διαφορετικό τρόπο για τον έλεγχο GWAS, p-τιμές που προκύπτουν της θα έχουν περισσότερα συσχετίζεται στενά με τη μη διορθωμένη ανάλυσης και όχι με εκείνες του ελέγχου GWAS.

Σύνδεση Desequilibrium

Οικόπεδα των επιμέρους SNP φορτίσεις για GWAS υπολογιστές 1 έως 4 αποκορύφωμα τρεις περιοχές υψηλής τοπικής LD. Αυτά εμφανίζονται ως κορυφές στα χρωμοσώματα 2, 6 και 8 (βλέπε σχήμα 5). Αυτές οι ίδιες περιοχές ήταν εμφανή για τους υπολογιστές ελέγχου GWAS. Αυτά τα οικόπεδα αποκαλύπτουν ότι οι άξονες της μεταβολής που ορίζεται από υπολογιστές 3 και 4 των ΠΑΠ ελέγχου GWAS και GWAS εναλλάσσονται, με PC3 έλεγχο GWAS που δείχνει την έντονη αιχμή στο χρωμόσωμα 8, που είναι εμφανής στο οικόπεδο GWAS PC4.

GWAS PCA (αριστερό πάνελ) και PCA ελέγχου GWAS (δεξιά πλευρά) οι φορτώσεις χαράσσεται κορυφές στο χρωμόσωμα 2, 6 και 8.

Η

GWAS φορτίσεις PC1 αιχμής και στις δύο χρωμοσώματα 2 και 6. Η κορυφή στο χρωμόσωμα 2 αντιστοιχεί σε μια περιοχή που περιέχει SNP rs4988235. Αυτό SNP είναι ένα γνωστό πολυμορφισμός στο γονίδιο LCT, που συνδέεται με λακτάση επιμονή. αλληλόμορφο Τ αυτόν τον SNP που συνδέεται με την Cline Βορρά-Νότου στην Ευρώπη με συχνότητα 5-10% στη νότια Ευρώπη και 70-80% στη βόρεια Ευρώπη [21]. Η κορυφή στο χρωμόσωμα 6 αντιστοιχεί στο σύμπλοκο περιοχή μείζονος ιστοσυμβατότητας (HLA), μια γνωστή περιοχή με υψηλή LD [22]. GWAS φορτίσεις PC2 έχουν επίσης μια έντονη αιχμή στην περιοχή HLA. PC3 και PC4 φορτίσεις έχουν κορυφές στο χρωμόσωμα 8, σε μια περιοχή με ένα πολυμορφικό αντιστροφή τεκμηριωθεί προηγουμένως σε ευρωπαϊκό Αμερικανοί ,, [23-25]. Αν και η HLA και περιοχές αναστροφή φαίνεται να δειγματοληψία πιο πυκνά στο γονιδίωμα σε επίπεδο πίνακα SNP Illumina από άλλες περιοχές αυτών των χρωμοσωμάτων, αυτό από μόνο του δεν αντιπροσωπεύουν το μέγεθος των κορυφών (βλέπε πίνακα 4). Ειδικότερα, χρωμόσωμα 8 περιέχει 7 άλλες περιοχές του ίδιου μεγέθους ή μικρότερο από την περιοχή αναστροφής που είναι παρόμοια ή πιο πυκνά δείγματα με SNPs στον πίνακα, ενώ τα πρώτα 1 k SNPs που συνθέτουν την κορυφή της περιοχής HLA έχουν την ίδια μέση πυκνότητα όπως και το υπόλοιπο του χρωμοσώματος 6.

η

Αν και υπήρχαν ενδείξεις καρκίνου των ωοθηκών σχετικής δομής στα δεδομένα GWAS υπολογιστές 1 έως 4, φορτίσεις οικόπεδα τους έδειξε ότι η τοπική Ν.Δ. μπορούν να κρύβονται πίσω αυτή τη δομή. Πραγματοποιήσαμε ένα πρόσθετο PCA (GWAS LD PCA) των οποίων μόνο το SNP με την υψηλότερη φόρτωση διατηρήθηκε να αντιπροσωπεύει κάθε μία από τις περιοχές LD (βλέπε πίνακα 4) για να διαπιστωθεί αν οι περιοχές αυτές να επηρεάσουν την ικανότητα αυτών των υπολογιστών για να διορθώσει για τη νόσο σχετική PS .

η GWAS PC1, PC3 και ένα κλάσμα των αξόνων PC4 GWAS διακύμανσης κατά ένα μεγάλο μέρος φυλάσσεται από τον GWAS LD PCA, ενώ ο άξονας PC2 διακύμανσης χάνεται (βλέπε πίνακα 3). GWAS LD PC2 συλλαμβάνει παραλλαγή περιγράφεται από δύο GWAS υπολογιστές 3 και 4. Ως εκ τούτου, το χρωμόσωμα 2 γονίδιο LCT και το χρωμόσωμα 8 αναστροφή εμφανίζονται οι περιοχές που πρέπει να συσχετίζεται με την προγονική συνιστώσες του ευρωπαϊκού αμερικανικού πληθυσμού αντιπροσωπεύεται από GWAS υπολογιστές 1, 3 και 4. Σε αντίθεση , η GWAS LD PCA παρέχει στοιχεία που αποδεικνύουν ότι η περιοχή HLA δεν σχετίζεται σημαντικά με το γονιδίωμα-ευρεία ευρωπαϊκή καταγωγή PS. Ένα μεγάλο κλάσμα της διακύμανσης που περιγράφεται από GWAS PC2 μπορεί επομένως να είναι τοπική αντί γονιδίωμα πλάτους προγονική παραλλαγή. Αυτό μπορεί να ευθύνεται για την έλλειψη σύνδεσης με την περιοχή.

Αραίωση GWAS PCA LD περιοχές είχε ως αποτέλεσμα σε λιγότερο αποτελεσματικός έλεγχος του συντελεστή πληθωρισμού (βλέπε σχήμα 3). Μόνο τα πρώτα 2 υπολογιστές της GWAS Ν.Δ., που αντιστοιχούν περίπου σε GWAS υπολογιστές 1, 3 και 4, μείωσε το συντελεστή πληθωρισμού. PC1 μείωσε το συντελεστή πληθωρισμού στον ίδιο βαθμό με και χωρίς αραίωση των SNPs στην περιοχή LD LCT, ενώ για την προσαρμογή για υπολογιστές 3 και 4, μείωσε το συντελεστή πληθωρισμού περισσότερο όταν η περιοχή LD χρωμοσώματος 8 δεν είχε αραιώσει.

Προγονική GWAS υπολογιστές και σύνδεσης να μελέτη ιστοσελίδας

GWAS υπολογιστές 1, 3 και 4 είναι κάθε εξαιρετικά σχετίζονται σημαντικά με την περιοχή μελέτης μετά την προσαρμογή για την κατάσταση ασθενών-μαρτύρων (βλέπε πίνακα 5). Κάθε PC προσδιορίζει μια διακριτή αντίθεση μεταξύ των τόπων. Η ιστοσελίδα Mayo (MAYO) έχει τις χαμηλότερες τιμές PC1 και Τάμπα (TBO) το υψηλότερο, κατά μέσο όρο? Τορόντο (TOR) και τη Βόρεια Καρολίνα (ΕΚΓ) είναι ενδιάμεσο και όχι ευκρινώς διαφορετικά. Οι περιοχές που έχουν διακριτές μέσες τιμές των PC3 μετά την προσαρμογή για την κατάσταση περίπτωση ελέγχου, και διέταξε (από το μικρότερο στο μεγαλύτερο αξία) Υπαξιωματικών, TOR, TBO τότε μπορούν. PC4 έρχεται σε αντίθεση Μάιο και τα υπόλοιπα sites που δεν είναι ευκρινώς διαφορετικά το ένα από το άλλο.

Η

Ένα οικόπεδο PC1 κατά PC3 δείχνει ότι η μεταβολή που αντιπροσωπεύεται από το PC 3 ήταν μέσα σε ιδιώτες της Βορειοδυτικής ευρωπαϊκή καταγωγή (βλέπε σχήμα S3) . Δείχνει επίσης ότι ο υπολογιστής 3 διαφέρει σαφώς στους ιστότοπους. Όχι μόνο δεν MAYO δείχνουν μια τάση προς πιο θετική PC 3 τιμές σε σύγκριση με τις άλλες περιοχές, αλλά Υπαξιωματικών έδειξε μια στενότερη διακύμανση εύρους για αυτόν τον υπολογιστή σε σύγκριση με τις άλλες περιοχές. PC 1 έδειξε TBO να είναι το site με περισσότερο από ένα εκπροσώπηση της Νοτιοανατολικής Ευρωπαίων, ενώ MAYO είχε το λιγότερο.

Συζήτηση

Ακόμα κι αν οι πληροφορίες που παρέχονται από όλα τα SNPs γονότυπου σε ένα γονιδίωμα-ευρεία πίνακας μπορεί να χρησιμοποιηθεί για τον έλεγχο για τη δομή του πληθυσμού μέσω της PCA, χρησιμοποιώντας ένα μικρότερο προσχεδιασμένο πίνακα ΣΤΟΧΟΙ μπορεί να θεωρηθεί ότι παρέχουν ορισμένα πλεονεκτήματα. Κατ ‘αρχάς, τον έλεγχο για τη διαστρωμάτωση με βάση τα δεδομένα GWAS μπορεί να μειώσει ανεπιθύμητα τη διακύμανση ασθενών-μαρτύρων που η μελέτη επιδιώκει να προσδιορίσει, ενώ η πιθανότητα ότι μια ομάδα στόχοι αυτοί θα περιλαμβάνουν τη νόσο που σχετίζεται SNPs είναι απομακρυσμένη. Δεύτερον, οι διορθώσεις με βάση τα στοιχεία GWAS un-αραίωση μπορεί να αναδείξει την τοπική δομή στη θέση του γονιδιώματος-ευρεία, προγονική διακύμανσης και, ως εκ τούτου, να θέσει σε κίνδυνο την αποτελεσματικότητα του ελέγχου για το PS. Στοχεύει πάνελ αποκλείσει σκόπιμα τις απολύσεις μεταξύ των SNPs και ως εκ τούτου να αποφευχθεί αυτό το πρόβλημα. Αυτά τα πιθανά μειονεκτήματα των διορθώσεων GWAS που βασίζεται μπορεί να επιδεινώνεται σε πληθυσμούς με πιο λεπτή δομή του γονιδιώματος-ευρεία και ισχυρότερη πρότυπα της τοπικής Ν.Δ., όπως η Ευρωπαϊκή αμερικανικού πληθυσμού.

Βρήκαμε ότι αυτά τα μειονεκτήματα δεν πραγματοποιήθηκαν στην ανάλυσή μας των δεδομένων για τον καρκίνο των ωοθηκών GWAS. Συγκεκριμένα, βρήκαμε ότι η πλήρης GWAS PCA ανακεφαλαιώνει δομή του παρόντος εντός των ατόμων ελέγχου και ως εκ τούτου δεν ήταν συλλαμβάνοντας ένα σημαντικό ποσό της μεταβολής case-control. Αυτό δεν αποτελεί έκπληξη, δεδομένου παραλλαγή περίπτωση ελέγχου, τόσο γονιδίωμα-ευρεία και τοπικό, θα είναι σπάνια αρκετά μεγάλη για να προσπεράσει το γονιδίωμα-ευρεία πηγές διακύμανσης του πληθυσμού σε PCA. Αυτή και οι σημαντικά μειωμένες παράγοντες του πληθωρισμού σε σύγκριση με εκείνες που επιτυγχάνονται με τη χρήση του πίνακα Πάσχου υποδηλώνει ότι η σύνδεση με τον καρκίνο των ωοθηκών βρέθηκαν για GWAS υπολογιστές 1, 3 και 4 αποτελούν μια πραγματική διόρθωση για το PS, ακόμη και μετά τον συνυπολογισμό για την περιοχή, η οποία είναι πιθανό να οφείλεται στην μεγαλύτερη ακρίβεια που παρέχεται από τη χρήση ολόκληρου του GWAS σύνολο δεδομένων. Σημειώστε ότι μόνο 460 από 500 δείκτες του πίνακα Πάσχου ήταν στη διάθεσή μας στον καρκίνο GWAS σύνολο δεδομένων των ωοθηκών, μειώνοντας έτσι την εξουσία της κατά κάποιο τρόπο. Ωστόσο, αυτό θα είναι συχνά η περίπτωση όταν χρησιμοποιείτε ένα πάνελ προ-σχεδιασμένες έχει ως στόχο για τον έλεγχο της δομής του πληθυσμού σε μια ανάλυση GWAS.

πιθανές παγίδες της μη λαμβάνοντας υπόψη την επίδραση των περιφερειών της υψηλής τοπικής Ν.Δ. σχετικά με τον έλεγχο για το PS χρησιμοποιώντας PCA μπορούν να ταξινομηθούν σε δύο σενάρια: (1) η λειτουργική παραλλαγή βρίσκεται εκτός αυτών των περιοχών? Στην περίπτωση αυτή οι υπολογιστές που αντιπροσωπεύουν μόνο μεταβολή σε αυτές τις περιοχές δεν θα ελέγχουν αποτελεσματικά για το PS, δηλαδή ο παράγοντας του πληθωρισμού δεν είναι επαρκώς μειώνεται, και (2) η λειτουργική παραλλαγή βρίσκεται μέσα σε μια τέτοια περιοχή? στην περίπτωση αυτή, οι υπολογιστές που είναι απολύτως αντιπροσωπεύουν την τοπική δομή αυτής της περιοχής μπορεί να ελέγξει μακριά την ένωση, δηλαδή ο συντελεστής πληθωρισμού έχει μειωθεί πάρα πολύ. Παρά το γεγονός ότι σε αυτή τη μελέτη οι περιοχές υψηλής τοπικής Ν.Δ. αλλάξει τα αποτελέσματα της GWAS PCA, οι πρακτικές συνέπειες αυτού για τη δοκιμή σύνδεσης SNP με τον καρκίνο των ωοθηκών ήταν αμφίβολη.

Μόνο GWAS PC2 χαρακτηριστεί ως ένα παράδειγμα αυτής της πρώτης φαινομένου . εξαφάνισή της στην GWAS LD PCA και την έλλειψη αντικτύπου στον παράγοντα του πληθωρισμού και του συνεταιρίζεσθαι στην εμφάνιση της νόσου που είναι κατά κύριο λόγο εκπροσωπούν τις τοπικές δομή στην περιοχή HLA και προτείνει ότι λειτουργικές παραλλαγές είναι απίθανο να βρίσκονται εντός της εν λόγω περιοχής. Ακόμα κι αν η περιοχή HLA LD περιείχε αρκετή ποικιλία για να λαμβάνουν πλήρως υπόψη την υψηλή κατάταξη PC, η επίδραση της συμπερίληψης αυτό το PC κατά τον έλεγχο για τη διαστρωμάτωση δεν είναι πολύ διαφορετική από εκείνη των περιλαμβανομένων οποιοδήποτε αριθμό των μη ενημερωτικών υπολογιστές κατά τη λήψη συνήθως τις πρώτες 10 υπολογιστές ως συμπαράγοντες (βλέπε σχήμα 3). Ποια από τους υπολογιστές υψηλόβαθμων να συμπεριλάβει ως συμπαράγοντες στην ανάλυση σύνδεσης και πόσοι από αυτούς να συμπεριλάβουν μπορεί να έχει περισσότερες επιπτώσεις για τον έλεγχο του συντελεστή πληθωρισμού από την άρση των συνεπειών των περιοχών LD στο PCA.

Κάναμε δεν παρατηρούμε ένα παράδειγμα της δεύτερης φαινόμενο σημειώνεται παραπάνω σε αυτό το σύνολο δεδομένων. Αντ ‘αυτού, οι άξονες των παραλλαγή που περιγράφεται από τους υπολογιστές που βρέθηκαν να σχετίζονται με τη νόσο (GWAS PCs 1, 3 και 4) διατηρήθηκαν σε μεγάλο βαθμό όταν αραιώθηκαν οι περιοχές της υψηλής τοπικής LD. Αυτό υποδηλώνει ότι αν και αυτές οι υπολογιστές εμφανίζουν υψηλή συσχέτιση με τις τοπικές περιοχές Ν.Δ. και οι περιοχές αυτές μπορούν δυνητικά να φιλοξενούν λειτουργικές παραλλαγές, οι υπολογιστές αντιπροσωπεύουν πραγματικές, προγονική, γονιδιώματος σε επίπεδο δομής και όχι μόνο διακύμανση εντός της περιοχής LD.

Χρησιμοποιώντας τη σχιζοφρένεια δεδομένων GWAS για την Ευρωπαϊκή Αμερικανούς, Ζου et al. βρέθηκε ίδιες περιοχές LD ως τρέχουσα μελέτη, και ένα πρόσθετο κορυφή επί του χρωμοσώματος 17. Χρησιμοποιώντας μια μέθοδο για τον έλεγχο της συρρίκνωσης για επιδράσεις LD σε PCA, βρήκαν ότι όλες οι κορυφές εξαφανίζονται με την εξαίρεση της κορυφής περιοχή LCT. Καταλήγουν στο συμπέρασμα ότι είναι σημαντικό να λαμβάνονται υπόψη LD όταν χρησιμοποιούν το PCA για τον έλεγχο για το PS [25]. Δεν παρέχει τις συσχετίσεις μεταξύ των υπολογιστών με και χωρίς τη μέθοδο συρρίκνωση τους. Είναι εύλογο ότι, όπως και στην παρούσα μελέτη, τα δύο σύνολα των υπολογιστών 3 και 4 συσχετίζονται σε μεγάλο βαθμό και ότι η περιοχή πολυμορφικού αναστροφή δεν έχει πρακτικό αποτέλεσμα για τον έλεγχο καταγωγή.

διαστρωμάτωση του πληθυσμού θα ποικίλει από τη μελέτη για τη μελέτη ανάλογα με τα χαρακτηριστικά του πληθυσμού της μελέτης και της νόσου και μπορεί επομένως να υποστηριχθεί ότι τα αποτελέσματα που παρουσιάζονται εδώ είναι ειδικά για αυτή τη μελέτη. Ωστόσο, οι πληθυσμοί των ευρωπαϊκών καταγωγή όπως αυτή που μελετήθηκαν εδώ είναι ιδιαίτερα ομοιογενείς και ασθενών-μαρτύρων ή τοπική παραλλαγή LD θα είναι

λιγότερο

πιθανό να επισκιάσει την προγονική μεταβολή του πληθυσμού κατά τη χρήση un-αραιωμένο δεδομένων GWAS για την PCA, σε μελέτες λιγότερο ομοιογενείς πληθυσμούς, όπως αυτές που φέρνουν σε επαφή άτομα από διαφορετικές καταγωγές ηπειρωτικό ή /και ότι η εστίαση στην αναμεμειγμένη πληθυσμούς. Συμπερασματικά, προτείνουμε ότι μια προσεκτική ανάλυση χρησιμοποιώντας PCA του πλήρους συνόλου δεδομένων να πραγματοποιείται πριν από την απόφαση για το πώς να ελέγχουν για PS. Η χρήση των υπολογιστών από μια πλήρη GWAS PCA μπορεί να παρέχει καλύτερο έλεγχο για το PS και να οδηγήσει σε χαμηλότερο συντελεστή πληθωρισμού. Ένα επιπλέον πλεονέκτημα είναι ότι μια τέτοια ανάλυση μπορεί να βοηθήσει την ανακάλυψη και την απομάκρυνση των ακραίων τιμών ή που σχετίζονται με τα άτομα που μπορεί να χαθεί μέσα από άλλες διαδικασίες αξιολόγησης της ποιότητας /ποιοτικού ελέγχου. Σε αυτή τη μελέτη, οι ακραίες τιμές που αφαιρούνται επηρέασε σημαντικά τους υπολογιστές από την αρχική ανάλυση ελέγχου GWAS και αποδείχθηκε ότι περιέχουν σχετίζονται με τα άτομα αναπάντητες από προηγούμενες φίλτρα QC.

Θα πρέπει να επισημανθεί ότι ο πίνακας Πάσχου έκανε εξαιρετικά καλά στη σύλληψη ένα μεγάλο ποσοστό του PS για ένα τόσο μικρό αριθμό των SNPs. Στην πραγματικότητα, σε ένα πιο πρόσφατο έγγραφο οι ερευνητές πίσω από το πάνελ δείχνουν Πάσχου ότι είναι δυνατόν να προβλεφθεί ατομικές τους προγόνους εντός της Ευρώπης κάτω σε μερικές εκατοντάδες χιλιόμετρα από την καταγωγή, χρησιμοποιώντας πάνελ των 500 ή 1.000 SNPs [26]. Οι πινακίδες αυτές είναι ένα μεγάλο εργαλείο για οικονομικά αποδοτικό τρόπο προσδιορισμού του γονοτύπου ατόμων με σκοπό τον έλεγχο PS. Τι η μελέτη αυτή επιθυμεί να τονίσει είναι ότι παρά την αποτελεσματικότητα, με την παρουσία του τα πλήρη στοιχεία GWAS δεν θα πρέπει να μπουν στον πειρασμό να στηρίζονται αποκλειστικά σε μια τέτοια μείωση του αριθμού των SNPs κατά τη διεξαγωγή της ΣΕΣ.

Είναι ενδιαφέρον να σημειωθεί ότι η σχέση μεταξύ GWAS υπολογιστές 1,3 και 4 και της ασθένειας παραμένει ακόμα και μετά λαμβάνοντας υπόψη τις διαφορές ιστοσελίδα λογαριασμό (βλέπε πίνακα 5). Λαμβάνοντας υπόψη αυτές τις διαφορές ιστοσελίδα αφαιρεί το τμήμα εκείνο της πλαστή συσχέτιση μεταξύ της νόσου και την καταγωγή που οφείλεται σε διαφορές στις σχετικές αριθμό των περιπτώσεων και των ελέγχων που είχαν προσληφθεί σε τοποθεσίες σε συνδυασμό με ακόμα λεπτές διαφορές στην καταγωγή όλη sites. Αυτό που απομένει πρέπει στη συνέχεια να προκληθεί από μέσα τις διαφορές ιστοσελίδα στον προγονικό make-up μεταξύ των περιπτώσεων και των ελέγχων που οφείλονται στη διακύμανση της δειγματοληψίας. Αυτό που είναι αξιοσημείωτο εδώ είναι ότι αυτό το πλαίσιο η διαφορά χώρο στο καταγωγή μεταξύ των περιπτώσεων και ελέγχων οδηγεί σε μια επίμονη σημαντικό σήμα όταν όλες οι περιοχές συνενώνονται. Αυτό σημαίνει ότι είτε η διαφορά στην καταγωγή μεταξύ των περιπτώσεων και των ελέγχων σημειώθηκαν στην ίδια κατεύθυνση με την ευκαιρία σε κάθε περιοχή ή ότι αυτή η διαφορά στην καταγωγή ήταν τόσο έντονη σε ένα από τα sites που πνίγηκε ό, τι συνέβη στις υπόλοιπες περιοχές. Μια άλλη πιθανότητα είναι ότι η σχέση μεταξύ της νόσου και η καταγωγή δεν είναι πλαστή, αλλά πραγματική, εξηγώντας με αυτόν τον τρόπο συνεπή πορεία του σε όλους τους χώρους.

You must be logged into post a comment.