PLoS One: Χρησιμοποιώντας Αρχικές Πληροφορίες από την ιατρική βιβλιογραφία σε GWAS από τον καρκίνο του στόματος Αναγνωρίζει Μυθιστόρημα Ευαισθησία Variant σε χρωμόσωμα 4 – οι προσαρμοστούν Method


Αφηρημένο

Ιστορικό

Γονιδίωμα-ευρύ μελέτες σύνδεσης (GWAS ) απαιτούν μεγάλα μεγέθη δείγματος για να αποκτήσουν επαρκή στατιστική ισχύ, αλλά μπορεί να είναι δυνατόν να αυξηθεί η δύναμη με την ενσωμάτωση συμπληρωματικών στοιχείων. Στην παρούσα μελέτη διερευνήθηκε η δυνατότητα αυτόματα την ανάκτηση πληροφοριών από την ιατρική βιβλιογραφία και αξιοποιώντας τις πληροφορίες αυτές στην GWAS.

Μέθοδοι

Έχουμε αναπτύξει μια μέθοδο που αναζητά μέσω περιλήψεις PubMed για την προ-αποδίδεται λέξεις-κλειδιά και βασικές έννοιες, και χρησιμοποιεί αυτές τις πληροφορίες για να εκχωρήσετε εκ των προτέρων πιθανότητες του συνεταιρίζεσθαι για κάθε πολυμορφισμού ενός νουκλεοτιδίου (SNP) με το φαινότυπο ενδιαφέροντος – την προσαρμογή Priors σύνδεσης με Κείμενο μέθοδο (ADAPT). Σύλλογος αποτελέσματα από GWAS μπορεί στη συνέχεια να κατατάσσονται στο πλαίσιο αυτών των priors χρησιμοποιώντας το πλαίσιο Bayes False Discovery Πιθανότητα (BFDP). Αρχικά δοκιμάστηκε προσαρμοστούν συγκρίνοντας κατάταξη των γνωστών αλληλόμορφα ευαισθησίας σε προηγούμενη καρκίνο του πνεύμονα GWAS, και στη συνέχεια να εφαρμοστεί σε δύο-φάσεων GWAS του καρκίνου του στόματος.

Αποτελέσματα

Γνωστή πνεύμονα SNPs ευαισθησία του καρκίνου ήταν σταθερά κατατάσσεται ψηλότερα από προσαρμόσει BFDPs παρά από p-τιμές. Στον καρκίνο του στόματος GWAS, επιδιώξαμε να αναπαράγουν τις πέντε κορυφαίες SNPs, όπως ιεραρχήθηκαν από ADAPT BFDPs, εκ των οποίων rs991316, που βρίσκεται στο

ADH

γονιδιακή περιοχή 4q23, εμφανίζεται στατιστικά σημαντική συσχέτιση με το στόμα τον κίνδυνο εμφάνισης καρκίνου στο φάση αναπαραγωγής (

p-value πρόσθετο καταγραφής ανά σπάνια-αλληλόμορφο [p

τάση]

= 2.5 × 10

-3). Η συνδυασμένη Ή για το γεγονός ότι ένα επιπλέον σπάνιο αλληλόμορφο ήταν 0,83 (95% CI: 0,76 – 0,90), και η συσχέτιση αυτή ήταν ανεξάρτητη έχουν εντοπιστεί στο παρελθόν SNPs την ευαισθησία που σχετίζονται με τη συνολική καρκίνο UADT σε αυτή την περιοχή του γονιδίου. Πρέπει επίσης να διερευνηθεί αν rs991316 σχετίστηκε με άλλους καρκίνους της ανώτερης αναπνευστικής οδού (UADT), αλλά καμία πρόσθετη σήμα συσχέτιση βρέθηκε.

Συμπέρασμα

Αυτή η μελέτη υπογραμμίζει την πιθανή χρησιμότητα της συστηματικής ενσωμάτωσης πριν γνώσεις από την ιατρική βιβλιογραφία στις αναλύσεις του γονιδιώματος σε επίπεδο χρησιμοποιώντας τη μεθοδολογία προσαρμογής. ADAPT είναι διαθέσιμα στο διαδίκτυο. (Url: https://services.gate.ac.uk/lld/gwas/service/config)

Παράθεση: Johansson Μ, Roberts Α, Chen D, Λι Υ, Delahaye- Sourdeix Μ, Aswani Ν, et al. (2012) Χρησιμοποιώντας Αρχικές Πληροφορίες από την ιατρική βιβλιογραφία σε GWAS από τον καρκίνο του στόματος Αναγνωρίζει Μυθιστόρημα Ευαισθησία Variant σε χρωμόσωμα 4 – η προσαρμογής μεθόδου. PLoS ONE 7 (5): e36888. doi: 10.1371 /journal.pone.0036888

Επιμέλεια: Όλγα Γ Gorlova, το Πανεπιστήμιο του Τέξας Μ D. Anderson Κέντρο Καρκίνου, Ηνωμένες Πολιτείες της Αμερικής

Ελήφθη: 20 του Δεκέμβρη 2011? Αποδεκτές: 9 Απριλίου 2012? Δημοσιεύθηκε: May 25, 2012 |

Copyright: © 2012 Johansson et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Αυτή η έρευνα έχει υποστηριχθεί από την ΕΕ επιχορήγησης ΠΠ7 [LarKC, url: https://www.larkc.eu] [FP7-215535]. Η χρηματοδότηση για το συντονισμό της μελέτης, του γονότυπου των μελετών αναπαραγωγής και στατιστική ανάλυση που παρέχεται από τις Ηνωμένες Πολιτείες Εθνικό Ινστιτούτο Καρκίνου (R01 CA092039 05) και του Εθνικού Ινστιτούτου Οδοντιατρικής και Κρανιοπροσωπικής Έρευνας (1R03DE020116). Υποστήριξη για τις κεντρικής Ευρώπης και ARCAGE γονιδιώματος σε επίπεδο μελετών που παρέχονται από Inca (Institut National du Cancer, Γαλλία. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου.

Αντικρουόμενα συμφέροντα:. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

επιπτώσεις Κίνδυνος κοινές παραλλαγές ευαισθησία των πολύπλοκων διαταραχών – συμπεριλαμβανομένων και των περισσότερων καρκίνων – είναι γενικά μικρές (δηλ Ή & lt? 1.5) [1] και μελέτες συσχέτισης γονιδιώματος-ευρεία (GWAS) απαιτούν ένα όριο αυστηρή σημασία (π.χ. τιμή p & lt?. 10

-7), λόγω της επιβάρυνσης των πολλαπλών δοκιμών Έτσι, GWAS για τον κίνδυνο καρκίνου απαιτούν μεγάλα μεγέθη δείγματος ώστε να έχουν επαρκή στατιστική ισχύ. Ως εκ τούτου, είναι προβληματική η διεξαγωγή μελετών GWA των λιγότερο συχνές καρκίνων για τους οποίους πρόσληψη επαρκής αριθμός των περιπτώσεων είναι δύσκολο. μπορεί να υπάρχει όφελος στην ενσωμάτωση πρόσθετα αποδεικτικά στοιχεία που συγκεντρώθηκαν μέσω συμπληρωματικών πειραμάτων ή άλλες πηγές πληροφοριών. Οι πληροφορίες αυτές μπορούν να ενσωματωθούν με τα αποτελέσματα GWAS χρήση απλών Bayesian μέθοδοι [2], για παράδειγμα, η μέθοδος που αναπτύχθηκε από Wakefield [3]. Αυτό χρησιμοποιεί την προσέγγιση του παράγοντα Bayes (ABF), υπολογίζεται χρησιμοποιώντας τις εκτιμήσεις beta και τυπικά σφάλματα της γονιδιακής παραλλαγής σε ενώσεις της νόσου, σε συνδυασμό με τις προηγούμενες αποδόσεις για τη μηδενική υπόθεση για τη δημιουργία του Bayes False Πιθανότητα Discovery (BFDP). Ως εκ τούτου, ο BFDP παρέχει μια εκτίμηση της πιθανότητας ότι το παρατηρούμενο αποτέλεσμα αντιπροσωπεύει ένα ψευδώς θετική συσχέτιση, και μπορεί να χρησιμοποιηθεί στη θέση του ρ-τιμές κατά την κατάταξη ή αλλιώς την αξιολόγηση των αποτελεσμάτων σύνδεσης. Η κύρια δυσκολία στην εφαρμογή μιας τέτοιας προσέγγισης στο GWAS εκχωρεί σχετικούς και ρεαλιστικούς πριν πιθανότητες της σύνδεσης με τη νόσο για κάθε διερευνηθεί πολυμορφισμού ενός νουκλεοτιδίου (SNP).

Οι πιθανοί εκ των προτέρων πληροφορίες για τις σχέσεις γονίδιο-ασθένεια μπορεί να ανακτηθεί από διάφορες πηγές, για παράδειγμα, η έκφραση πειράματα ποσοτικά χαρακτηριστικό loci (eQTL), βάσεις δεδομένων μονοπάτι οντολογία, και τη λογοτεχνία σαρώνει [2]. Αναγνωρίζοντας ότι ένας μεγάλος αριθμός των παραλλαγών ευαισθησίας εντοπίζονται μέσω GWAS κατοικούν κοντά σε εύλογο υποψήφια γονίδια [4], υποθέσαμε ότι είναι δυνατόν να εξαχθούν προηγούμενη γνώση από το κείμενο που βασίζεται σε ιατρική βιβλιογραφία, ώστε να αυξηθεί η στατιστική ισχύς των ανίχνευση SNPs ευαισθησίας για το οποίο οι πληροφορίες αυτές είναι διαθέσιμες.

για να αξιολογηθεί η σκοπιμότητα και το πιθανό όφελος ενός τέτοιου σχεδιασμού της μελέτης, έχουμε αναπτύξει μια μέθοδο που ανακτά αυτόματα τα σχετικά δεδομένα από περιλήψεις PubMed, προκειμένου να δημιουργήσει εκ των προτέρων πιθανότητες ενός γονιδιώματος-ευρεία παραλλαγές διερευνηθεί να συμμετέχουν σε μια συγκεκριμένη νόσο, και στη συνέχεια να ενσωματώνει αυτά τα δεδομένα με τα αποτελέσματα ένωση από GWAS χρησιμοποιώντας το πλαίσιο BFDP [5], οι Ρύθμιση Ηγούμενοι σύνδεσης με Κείμενο (ADAPT) μέθοδο. ADAPT εφαρμόστηκε στη συνέχεια σε ένα GWAS του καρκίνου του στόματος (OC) [6] – [10].

Αποτελέσματα

υπολογισμοί ισχύος για BFDP και p-τιμές

Όπως περιγράφεται από Wakefield [3], [11] η εκτίμηση BFDP μπορεί να χρησιμοποιηθεί ως μέσο για την αξιολόγηση και την υποβολή εκθέσεων αξιοσημείωτο ενώσεις μόνη της. Ωστόσο, οραματιζόμαστε μια ευρύτερη υιοθέτηση ενός σχεδίου μελέτης υβριδικά, δύο φάσεων, στο οποίο SNPs που θεωρούνται αρκετά «αξιοσημείωτο», σύμφωνα με εκτιμήσεις BFDP τους επιλέξει για την αντιγραφή σε μια ανεξάρτητη μελέτη πληθυσμού και αξιολογούνται χρησιμοποιώντας τις τιμές ρ αντιγραφής. Για παράδειγμα, για τη θέσπιση BFDP αποκοπής των 0,8 κατά την επιλογή των SNPs για αντιγραφή σημαίνει ότι μια ψεύτικη μη ανακάλυψη είναι τέσσερις φορές πιο δαπανηρή ως ψευδή ανακάλυψη, ή ότι αναμένουμε κατά μέσο όρο, ένας στους πέντε SNPs που επιλέγονται για αναπαραγωγή πρέπει να συνδέεται με την ασθένεια. False μη ανακάλυψη περιλαμβάνει κάθε «πραγματική» ευαισθησία SNP που υπάρχουν στο σύνολο δεδομένων που δεν επιτευχθεί μια BFPD κάτω από 0,8. Εδώ θεωρούμε αληθινή SNPs ευαισθησία που σχετίζονται με το φαινότυπο του ενδιαφέροντος στατιστικά ισχυρή και επαναλήψιμο τρόπο, παρόλο που συνεπάγονται λειτουργική αιτιότητα. Προκειμένου να αξιολογηθεί η στατιστική ισχύς της επιλογής ευαισθησίας SNPs του καρκίνου του στόματος με τη χρήση σειράς ασθενών-μαρτύρων μας 791 περιπτώσεις και 7012 ελέγχους, αξιολογήσαμε τη στατιστική ισχύ σύμφωνα με την (εξίσωση [eq.] 9, δείτε Στατιστικές αναλύσεις). Αυτοί οι υπολογισμοί ισχύος βασίστηκαν σε 300.000 SNPs που αξιολογούνται στην GWAS, ότι 100 αληθινή SNPs ευαισθησία του καρκίνου του στόματος συμπεριλήφθηκαν στα δεδομένα που και κατανέμεται ομοιόμορφα σε όλη την προηγούμενη κατηγορίες (π.χ.

Ν * = 100, Ν

1 * = Ν

2 * = Ν

3 * = 33.3)

. Θεωρήσαμε τρεις πριν κατηγορίες (

J = 3

) και οι συνολικές SNPs στο GWAS που διανέμονται ως

C

1 = 0,875, C

2 = 0.10, και C

3 = 0,025

. Μπορούμε να υπολογίσουμε τις προηγούμενες πιθανότητες της μηδενικής υπόθεσης για τις τρεις πριν κατηγορίες με αυτές τις υποθέσεις, σύμφωνα με (eq. 7), η οποία δίνει

PO

1 = 7874, PO

2 = 899, και PO

3 = 224

. Η στατιστική δύναμη για την επίτευξη μιας BFDP 0,8 για SNPs με έναν OR 1,25 σε κάθε μία από τις τρεις κατηγορίες πριν δείχνεται στο Σχήμα 1. Για σύγκριση, περιλαμβάνουμε την δύναμη για τη χρήση BFDP υποθέτοντας την ίδια

N *

αλλά με όλους τους SNPs που έχουν την ίδια προηγούμενη. Κάτω από αυτές τις υποθέσεις η εξουσία για την ανίχνευση των συναφών SNPs στο

C

3

ή

C

2

αυξάνεται, ενώ θυσιάζει κάποια δύναμη για όσους το

C

3

. Αυτό δείχνει τα πιθανά οφέλη από την υιοθέτηση ενός τέτοιου Bayesian πλαίσιο στο GWAS, αν οι κατηγορίες και ηγούμενοι τους είναι κατάλληλα επιλέξει.

Αυτοί οι υπολογισμοί εξουσία να αναλάβει την αξιολόγηση των 300.000 SNPs εκ των οποίων 100 είναι πραγματικά συνδέεται με το αποτέλεσμα και να διανεμηθούν ομοιόμορφα σε τρεις κατηγορίες πριν, αντίστοιχα. Η συνολική κατανομή των SNPs στις τρεις κατηγορίες πριν υποτίθεται ότι είναι [87,5%? 10%? 2.5%]. Επίπεδη PO αναλαμβάνει μία ενιαία προηγούμενη κατηγορία.

Η

Έχουμε περιλαμβάνονται επίσης συμπληρωματικές υπολογισμούς ενέργειας σε σχήμα S1 μεταβάλλοντας το υποτιθέμενο αριθμό αλήθεια SNPs ευαισθησίας.

Επικύρωση της προσαρμόσει τη μεθοδολογία

για να εκτελέσετε μια αρχική

απόδειξη της αρχής

αξιολόγηση της μεθόδου ADAPT-BFDP, μπορούμε να εφαρμόζονται σε στοιχεία από τα προηγουμένως αναφερθεί καρκίνο του πνεύμονα μας GWAS [12]. Πρώτον, χρησιμοποιήσαμε την υπηρεσία προσαρμοστούν web για να δημιουργήσει εκ των προτέρων πιθανότητες για SNPs βασίζεται στην ιατρική βιβλιογραφία (βλέπε Υλικά και μέθοδοι). Οι λέξεις-κλειδιά που ομαδοποιήθηκαν κατά προτεραιότητα, η πρώτη ομάδα συμπεριλαμβανομένων των γενικών λέξεις που είναι ειδικά για τον καρκίνο του πνεύμονα, π.χ. «Καρκίνο του πνεύμονα» και «καρκίνωμα του πνεύμονα», η δεύτερη ομάδα περιλάμβανε πιο γενικές λέξεις που αφορούν ειδικά τον καρκίνο του πνεύμονα, π.χ. «Κάπνισμα», «νικοτίνη», «μη-μικροκυτταρικό καρκίνωμα», και η τρίτη ομάδα περιλάμβανε περισσότερους γενικούς λέξεις που δεν είναι αποκλειστικά σημαντικό για τον καρκίνο του πνεύμονα, αλλά για τον καρκίνο γενικά, π.χ. «Καρκινογόνο», «βλάβη του DNA», «νεοπλασματική», «απόπτωση». Εμείς στη συνέχεια έψαξε μέσα από όλες τις περιλήψεις PubMed για κάθε γονίδιο και έχουν ανατεθεί πριν από πιθανότητες σύμφωνα με το (eq. 7). Συμπεριλάβαμε μόνο λογοτεχνία που δημοσιεύθηκε πριν από την ημερομηνία της πρώτης καρκίνο του πνεύμονα GWAS [12], προκειμένου να αποφευχθεί η προκατάληψη.

Δεύτερον, χωρίζουμε την αρχική του καρκίνου του πνεύμονα μας GWAS σε μια σειρά από μικρότερα υποσύνολα να προσομοιώσει GWAS με χαμηλότερα στατιστικά δύναμη. Αυτό έγινε με τυχαία επιλογή (ίσες κατανομές των περιπτώσεων και ελέγχων) 50% και 75% της συνολικής σειράς δεδομένων 100 φορές. Ανάλυση GWAS για όλες τις υποσειρά Στη συνέχεια πραγματοποιήθηκε και τα αποτελέσματα ανάλογα με p-value και BFDP χρησιμοποιώντας priors υπολογίζεται με τη χρήση της υπηρεσίας web προσαρμοστούν. Συγκρίναμε την κατάταξη από BFDPs και ρ-τιμές μέσα σε κάθε υποσειρά (50%, 75% ή 100%) για τις παραλλαγές πέντε επιδεκτικότητα που προσδιορίζονται από τον καρκίνο του πνεύμονα GWAS που έχουν ανεξάρτητα αναπαραχθεί σε πολλαπλές μελέτες (Πίνακας 1) [12] – [14 ]. Από αυτές τις πέντε SNPs, τέσσερις είχαν ανατεθεί αυξημένα priors που οδήγησε σε σαφή βελτίωση στην κατάταξη όταν χρησιμοποιούν τις εκτιμήσεις BFDP σε σύγκριση με τις τιμές ρ. Για παράδειγμα, κατά τη δειγματοληψία 75% των πλήρων στοιχείων που το SNP rs401681 για 5p15.33 κατετάγη στο 2709 από το p-value και σε 664 από BFDP.

Η

αναλύει Μυθιστόρημα γονιδίωμα-ευρεία ένωση

Στη συνέχεια πραγματοποιείται μια GWAS του καρκίνου του στόματος. Αυτή η σάρωση ακολούθησε ένα σχέδιο δύο φάσεων, με τα αποτελέσματα ένωση της φάσης ανακάλυψης γονιδίωμα-ευρεία ανάλογα με ADAPT-BFDPs.

φάσης Discovery.

Στη φάση ανακάλυψης, μετά τον έλεγχο της ποιότητας, γονιδίωμα ανώτερου ανοικτού ανάλυση διεξήχθη σε 791 περιπτώσεις και 7012 ελέγχους. Ανάλυση οικόπεδο Q-Q δεν έδειξε καμία αξιοσημείωτη πληθωρισμού συνολικά (λ

πληθωρισμού = 1,04), γεγονός που υποδηλώνει ότι τα κρυφά υποδομές πληθυσμός είχε ελάχιστη ή καμία επίδραση στα αποτελέσματα της ανάλυσης του γονιδιώματος σε επίπεδο (Εικόνα S2). ADAPT είχε προσληφθεί με βάση περιλήψεις PubMed, χρησιμοποιώντας λέξεις-κλειδιά που σχετίζονται με τον καρκίνο του στόματος (Πίνακας S1) με τρόπο ανάλογο με το πείραμα του καρκίνου του πνεύμονα που περιγράφονται παραπάνω. Από 293.211 αξιολογούνται SNPs, 149.998 ομαδοποιήθηκαν ως

C

1

, 137.576 ομαδοποιήθηκαν ως

C

2

και 6637 ομαδοποιήθηκαν ως

C

3

. Αξιολογήσαμε τις επιμέρους εκτιμήσεις SNP BFDP χρησιμοποιώντας μια βασική προσέγγιση της ανάλυσης ευαισθησίας από τρεις διακριτές σύνολο υποθέσεων σχετικά με τον αριθμό των πραγματικών SNPs ευαισθησία, δηλαδή

Ν * = 50, Ν * = 100, και Ν * = 500

. Έχουμε εφαρμόσει ένα όριο BFDP 0,80 για την επιλογή των SNPs για την αντιγραφή, και έξι SNPs πληρούσαν αυτό το κριτήριο για όλες τις

Ν *

(Πίνακας 2). Επειδή είχαμε ήδη αξιολογηθεί και επιβεβαίωσε την 6

ου κατετάγη SNP (rs1789924,

AHD1C

) σε μια προηγούμενη μελέτη της συνολικής καρκίνου UADT (Πίνακας 2) [11], επιλέχθηκαν πέντε SNPs για την αντιγραφή. Αυτοί οι SNPs που περιλαμβάνονται rs1888732 στο 1p22.3 (log λόγος πιθανοτήτων προσθέτου [Ή

τάση] = 0,70, 95% διάστημα εμπιστοσύνης [95% CI]: 0,61 – 0,81,

BFDP

100

= 0,06 ), rs3130559 στο 6p21.33 (ή

τάση = 0,76, 95% CI: 0,65 – 0,88,

BFDP

100

= 0,57), rs10801805 για 1p22.2 (ή

τάση = 1.30, 95% CI: 1,16 – 1,46,

BFDP

100

= 0,58), rs991316 στο 4q23 (OR

τάση = 0,81, 95% CI: 0,72 – 0,91,

BFDP

100

= 0,62), και rs10008621 σε 4q35.2 (ή

τάση = 0,72, 95% CI:. 0,60 – 0,86,

BFDP

100

= 0,66)

αντιγραφή.

Μετά τον έλεγχο της ποιότητας και της στατιστικής ανάλυσης στο πλαίσιο της σειράς αναπαραγωγής, μόνο rs991316 εμφανίζεται στατιστικά σημαντική συσχέτιση με το στόμα τον κίνδυνο εμφάνισης καρκίνου (

ανά σπάνια-αλληλόμορφο πρόσθετο ημερολόγιο p-value [p

τάση]

= 2.5 × 10

-3, Πίνακας 2). Ένα γράφημα του -log

10 ρ-τιμές και ζεύγη r

2 εκτιμήσεις για SNPs περιλαμβάνεται στην φάση GWAS του

ADH

γονιδιακή περιοχή δίδεται στο σχήμα 2. Η σύγκριση με OR οι μεγάλες ομοζυγώτες της συνδυασμένης σύνολο δεδομένων (GWAS + δεδομένα αντιγραφής) ήταν 0,88 (95% CI: 0,78 – 1,01) για τους ετεροζυγώτες, και 0,67 (95% CI: 0,57 – 0,79) για τις δευτερεύουσες ομοζυγώτες. Το OR συνδέεται με την κατοχή ενός επιπλέον σπάνιο αλληλόμορφο (log-προσθετικό μοντέλο) ήταν 0,83 (95% CI: 0,76 – 0,90), και η συσχέτιση αυτή ήταν ανεξάρτητη αναπαραχθεί (

p

τάση

& lt? 0,05) σε οι δύο μεγαλύτερες μελέτες αναπαραγωγής (οι μελέτες της Λατινικής Αμερικής και ORC, πίνακα S1,

p

ετερογένεια

= 0,67). Το SNP rs991316 βρίσκεται σε μια περιοχή 4q23 το οποίο περιλαμβάνει πολλά γονίδια που κωδικοποιούν διαφορετικά

αλκοολική αφυδρογονάση

(

ADH

) γονίδια υπομονάδων, δηλαδή το

ADH6

,

ADH1A

,

ADH1B

,

ADH1C

, και

ADH7

γονίδια. Στην αναζήτηση προσαρμοστούν βιβλιογραφίας, δύο γονίδια ορίστηκαν ως δυνητικά σημαντικές για την SNP rs991316,

ADH1C

και

ADH7

, που βρίσκεται περίπου 49 κεντρομερική kb και 11 kb τελομερικού της rs991316, αντίστοιχα. SNPs στην περιοχή αυτή (δηλαδή rs1229984 [

ADH1B

], rs1789924 [

ADH1C

] και rs971074 [

ADH7

]) έχουν προηγουμένως συσχετιστεί με τη συνολική καρκίνο UADT. Ωστόσο, rs991316 ήταν κακώς συσχετίζεται με rs1229984, rs1789924 και rs971074 (r

2 & lt? 0.05), και κλιματισμού η ανάλυση κινδύνου σε αυτούς τους SNPs δεν ιδίως επηρεάζουν την Ή του rs991316 (ή

ρυθμιστεί & lt? 0,84). Επιπλέον, ερευνήσαμε αν rs991316 συσχετίστηκε επίσης με άλλες δευτερεύουσες τοποθεσίες UADT εκτός από του στόματος μορφές καρκίνου, αλλά στρωματοποιημένη ανάλυση αποκάλυψε ότι η επίδραση κίνδυνος rs991316 περιορίστηκαν σε καρκίνο του στόματος (στοματικής κοιλότητας και του στοματοφάρυγγα), αλλά όχι καρκίνους του υποφάρυγγα, του λάρυγγα ή του οισοφάγου (

p

ετερογένεια

= 0.03, Σχήμα 3). Λαμβανόμενα μαζί, αυτά τα αποτελέσματα δείχνουν ότι η rs991316 SNP συνδέεται ειδικά με τον καρκίνο του στόματος, αλλά όχι με άλλους καρκίνους UADT εντός αυτού του πληθυσμού, και ότι η ένωση είναι ανεξάρτητος από προηγουμένως ανιχνευθεί SNPs επιδεκτικότητα καρκίνου UADT στην περιοχή αυτή. Επιπλέον, αυτή η ανομοιογένεια ως προς τις επιπτώσεις του κινδύνου μεταξύ του στόματος και άλλων καρκίνων UADT μπορεί επίσης να εξηγήσει γιατί αυτή η παραλλαγή δεν ανιχνεύθηκε στην αρχική μας GWAS της συνολικής καρκίνου UADT.

P-τιμές που δείχνει τη δύναμη του συνεταιρίζεσθαι για κάθε SNP στο GWAS με τον καρκίνο του στόματος εμφανίζονται στην -λογ10 κλίμακα (αριστερά Υ-άξονας), κατά τις θέσεις τους στο χρωμόσωμα 4 (Build 36.3). Το χρώμα του κάθε σημείου και SNP αντιπροσωπεύουν το βαθμό της ανισορροπίας σύνδεσης (r

2) με rs991316 σύμφωνα με HapMap φάσης ΙΙ δεδομένων CEU. Τονίζεται στην εικόνα είναι rs1229984, rs1789924 και rs971074, οι οποίες έχουν αναφερθεί ότι συνδέονται με UADT καρκίνους προηγουμένως, καθώς και την rs991316 SNP που ανακαλύφθηκε ότι συνδέεται ειδικώς με τον καρκίνο του στόματος στην παρούσα μελέτη. rs1229984 δεν ήταν ο γονότυπος, ούτε ετικέτα με μια παραλλαγή μεσολάβησης στο BeadChip HumanHap300 αλλά ο γονότυπος από Taqman δοκιμασία στα ίδια δείγματα από την Κεντρική Ευρώπη και μελέτες ARCAGE όπως περιλαμβάνονται στη φάση ανακάλυψη της τρέχουσας GWAS, και r

2 μεταξύ rs1229984 και rs991316 εκτιμήθηκε στα 3.513 έλεγχοι από την ευρωπαϊκή και ARCAGE μελέτες Central. Τα ποσοστά ανασυνδυασμού σε όλη την περιοχή που δείχνεται από το φως μπλε γραμμή συναρτήσει του δικαιώματος y άξονα. Τα γονίδια στην περιοχή αντιπροσωπεύεται με το βέλος κεφάλια δείχνει την κατεύθυνση της μεταγραφής.

Η

α) Εκτός από το ή CT ετεροζυγώτες και ομοζυγώτες ΤΤ, η οποία υπολογίστηκε σε σχέση με τα μεγάλα ομοζυγώτες CC, το σύνολο ή και 95 % ΚΠ υπολογίστηκαν χρησιμοποιώντας το μοντέλο log-πρόσθετο, προσαρμογή για την ηλικία, το φύλο και το κέντρο. Όλα τα θέματα από τις φάσεις του γονιδιώματος-ευρεία και αντιγραφή με τις διαθέσιμες συν-variates συμπεριλήφθηκαν σε αυτή την ανάλυση (όχι γενική έλεγχοι). Οι συνολικές OR για καρκίνους της στοματικής κοιλότητας και του στοματοφάρυγγα φαίνεται από την διακεκομμένη κάθετη γραμμή. β) P για την ετερογένεια δείχνει τις διαφορές εντός ή μεταξύ στρωμάτων και προήλθε από τη δοκιμή Q του Cochran του. γ) Ποτέ πότες ήταν τα θέματα που είναι είτε η αναφερόμενη 0 g πρόσληψη αλκοόλ την ημέρα, ή να αναφερθεί είναι ποτέ παρέα, το φως πότες καταναλώνεται & gt? 0 και & lt? 6,06 g alc./day, ενδιάμεσο πότες καταναλώνεται & gt? 6.06 και & lt? 46,3 g alc ./day, και πότες καταναλώνεται & gt? 46,3 g alc./day. δ) υποφάρυγγα, του λάρυγγα, του οισοφάγου και περιπτώσεις που δεν είχαν συμπεριληφθεί στις παραπάνω αναλύσεις.

Η

Στρωματοποιημένη αναλύει

Διενεργήσαμε περαιτέρω αναλύσεις στρωματοποιημένη κινδύνου για rs991316 (Σχήμα 3), αλλά εκτός από η ετερογενής επίδραση κινδύνου στοματικών καρκίνων συνολικά, σε σύγκριση με άλλους καρκίνους UADT (

p

ετερογένεια

= 0.03), δεν παρατηρήθηκαν σαφείς τροποποιήσεις επίδραση (

p

ετερογένεια

& gt? 0.10). παρατηρήθηκε κάποια ενδεικτικά στοιχεία για την τροποποίηση επίδραση από το φύλο (

p

ετερογένεια

= 0,11), η συσχέτιση με τον κίνδυνο να είναι ισχυρότερη στους άνδρες. Ορισμένες ενδείξεις του καπνίσματος και της κατανάλωσης αλκοόλ τροποποιώντας επίσης τη συσχέτιση με τον κίνδυνο παρατηρήθηκε επίσης, με τον κίνδυνο να γίνει πιο έντονη με υψηλότερα επίπεδα το κάπνισμα και το ποτό, αλλά επίσημες δοκιμές δεν υποστηρίζουν την αλληλεπίδραση (

p

αλληλεπίδραση

= 0.15 και 0.10 για το κάπνισμα και την κατανάλωση αλκοόλ, αντίστοιχα). Περαιτέρω ρύθμιση της ανάλυσης κύριος κίνδυνος rs991316 για πόση και κάπνισμα δεν μετέβαλαν το ή εκτιμήσεις (τα δεδομένα δεν παρουσιάζονται).

Συζήτηση

Σας αναφέρω μια μέθοδο για την ανάκτηση πληροφοριών από το κείμενο που βασίζεται σε ιατρική βιβλιογραφία και την εκτίμηση των προτέρων πιθανότητες του συνεταιρίζεσθαι για όλα τα SNPs διερευνηθεί σε GWAS, οι Ρύθμιση Ηγούμενοι σύνδεσης με τη μέθοδο κειμένου (ADAPT). Οι ηγούμενοι μπορεί στη συνέχεια να ενσωματωθεί με την ένωση οδηγεί σε μια Bayesian μέτρο της noteworthiness του συνεταιρίζεσθαι για κάθε SNP στο καταστατικό της νόσου.

Ένα από τα κύρια επιχειρήματα για τη διεξαγωγή GWAS είναι ότι η προσέγγιση είναι αγνωστικιστής, προσφέροντας έτσι τη δυνατότητα για την ανίχνευση νέων θέσεων ευαισθησίας χωρίς συμπεραίνοντας πριν από τις πεποιθήσεις σχετικά με τη σημασία των συγκεκριμένων γονιδίων (π.χ. σύγκριση με την προσέγγιση υποψηφίου γονιδίου). Ωστόσο, πολλές παραλλαγές γενετική προδιάθεση ανιχνεύθηκε σε GWAS κατοικούν κοντά σε εύλογο υποψήφια γονίδια, και η μέθοδος ADAPT-BFDP δίνει την ευκαιρία να αξιοποιήσουν αυτές τις πληροφορίες με αυτόματο τρόπο. ADAPT αναζητά αυτόματα μέσω περιλήψεις PubMed για τις σχετικές προηγούμενες ενδείξεις για συμμετοχή στην εν λόγω ασθένεια. Σε συνδυασμό με την BFDP στατιστικό πλαίσιο, να προσαρμόσει ενσωματώνει την προηγούμενη ενημέρωση με τα αποτελέσματα σύνδεσης από την GWAS, δίνοντας έτσι SNPs κοντά γονίδια προηγουμένως εμπλέκονται στην ασθένεια των τόκων μια υψηλότερη κατάταξη.

Αρχικά επικυρωθεί ADAPT-BFDP με βάση δεδομένων GWAS του καρκίνου του πνεύμονα και σημείωσε ότι επικυρωθεί SNPs ευαισθησία ήταν σταθερά κατατάσσεται υψηλότερα από τις εκτιμήσεις της ADAPT-BFDP από ό, τι από το p-τιμές (Πίνακας 1). Η μέθοδος αυτή εφαρμόστηκε στη συνέχεια σε ένα μετρίου μεγέθους GWAS του καρκίνου του στόματος (περίπου 800 περιπτώσεις) με κακή στατιστική ισχύ για να ανιχνεύσει τα ενδιάμεσα αποτελέσματα των κινδύνων συνήθως παρατηρούνται σε GWAS (≤40% στατιστική ισχύ για την επιλογή ενός SNP για την αντιγραφή σε ρ & lt? 10

-5 υποθέτοντας μια Ή 1,25). Με την κατάταξη των αποτελεσμάτων ένωση σύμφωνα με ADAPT-BFDPs και αναπαράγει τις πέντε πρώτες SNPs, εντοπίσαμε μια νέα παραλλαγή ευαισθησία μέσα στην γνωστή περιοχή ευαισθησίας στον καρκίνο του στόματος και UADT του

ADH

γονίδιο συμπλέγματος στο 4q23. Ερευνήσαμε αν η ένωση των rs991316 θα μπορούσε να εξηγηθεί από την ανισορροπία σύνδεσης με προηγουμένως εντοπιστεί παραλλαγές κινδύνου συνολικής καρκίνου UADT σε αυτό τον τόπο [8], [15], συμπεριλαμβανομένων των rs1229984, rs1789924 και rs971074, αλλά κατά ζεύγη συσχετισμοί τους ήταν χαμηλή και κλιματισμού η ανάλυση κινδύνου σε αυτούς τους SNPs δεν επηρέασε την εκτίμηση ή της rs991316. Επιπλέον, η ανάλυση απλοτύπου έδειξαν σαφώς ότι η παραλλαγή αλληλόμορφα αυτών των SNPs βρίσκονται σε διαφορετικά απλότυπων (τα δεδομένα δεν φαίνονται), ενισχύοντας έτσι περαιτέρω την ανεξαρτησία συμπέρασμα αυτών των SNPs ευαισθησίας. Είναι σημαντικό, η rs991316 SNP δεν συσχετίστηκε με άλλους καρκίνους UADT (Σχήμα 3), ως εκ τούτου, υποστηρίζει την ιδέα ενός νέου συλλόγου, ως απόδειξη για τη σύνδεση με άλλους δικτυακούς τόπους καρκίνο UADT έχει σημειωθεί με τα προηγουμένως ανιχνευθεί SNPs ευαισθησία.

Αναγνωρίζουμε ότι οποιαδήποτε μέθοδος που λαμβάνει μη επιμέλεια των προτέρων ενημέρωση υπόψη στις μελέτες σύνδεσης είναι ατελή και υπόκεινται σε διάφορες προκαταλήψεις [2], και η μέθοδος ADAPT-BFDP έχει αρκετούς περιορισμούς. Όπως προσαρμοστούν αναζητήσεις περιλήψεις PubMed για την παρουσία των προ-εκχωρηθεί λέξεις-κλειδιά και σημασιολογικά σχετικές έννοιες, το τελικό αποτέλεσμα (κατάταξη από BFDPs αντί του p-τιμές) θα SNPs προνόμιο στην εγγύτητα των γονιδίων που έχουν μελετηθεί σε σχέση με το τελικό σημείο ενδιαφέροντος . Όπως φαίνεται στο Σχήμα 1, υπάρχει μια απώλεια στη στατιστική ισχύ για SNPs για τις οποίες δεν υπάρχουν διαθέσιμες προηγούμενη ενημέρωση. Αυτή η ποινή που επιβλήθηκε σε νέα γονίδια και ερήμους γονίδιο φαίνεται αντιφατικό με την αγνωστικιστής φύση της GWAS, παρόλο που ισχυρά σήματα σύνδεσης θα παραμείνει υψηλή θέση χρησιμοποιώντας είτε τη μέθοδο.

Η μέθοδος είναι επίσης ευαίσθητη στο υποτιθέμενο αριθμό των πραγματικά συναφείς SNPs (

Ν *

). Αυξάνοντας τον αριθμό αυτό θα επιτρέψει σε περισσότερους SNPs για να περάσει το κατώφλι BFDP, αλλά δεν θα αλλάξει την κατάταξή τους. Σε ένα σχέδιο δύο φάσεων όπου ο αριθμός των SNPs που διατηρούνται για τη δεύτερη φάση καθορίζεται από τη δύναμη του δεύτερου σταδίου [16], μόνο η σχετική κατάταξη στο πρώτο στάδιο είναι σχετική και η επιλογή του

N *

είναι επουσιώδης. Αντίθετα, το ποσοστό των πραγματικά συνδεδεμένων SNPs σε κάθε προηγούμενη κατηγορία επηρεάζει την κατάταξη, αλλάζοντας την προηγούμενη πιθανότητα σύνδεσης για κάθε παραλλαγή.

Επιπλέον, η τρέχουσα εφαρμογή της ADAPT χρησιμοποιεί ένα σχετικά απλό αλγόριθμο εξόρυξης κειμένου και, ως Έτσι, παραμένει σχετικά αργό. Για παράδειγμα, δεν λαμβάνει η συχνότητα λέξη-κλειδί ταιριάζει υπόψη κατά την ανάθεση των ηγούμενοι, ούτε λαμβάνει υπόψη εάν οι επιμέρους μελέτες αναφέρουν θετικά ή αρνητικά αποτελέσματα της μελέτης. Οι στρατηγικές αυτές θα αξιολογούνται στο μέλλον υλοποιήσεις της προσαρμογής, καθώς και τις μεθόδους που στοχεύουν να επεκτείνουν τις λέξεις-κλειδιά σε σημασιολογικά σχετικές έννοιες. Επιπλέον, ADAPT εκχωρεί σήμερα ατομικό SNPs σε γονίδια απλά με βάση την τοποθεσία τους, π.χ. και αν είναι εντός 50 kb από ένα δεδομένο γονίδιο. Εδώ θα ήταν χρήσιμο να λάβει επίσης ανισορροπίας σύνδεσης υπόψη, όπως έχει εφαρμοστεί στο γονίδιο σχέσεις σε εμπλακεί Loci (GRAIL) μεθοδολογία [17]. Ομοίως για την προσαρμογή, GRAIL χρησιμοποιεί εξόρυξης κείμενο περιλήψεις PubMed να δοθεί προτεραιότητα SNPs σε GWAS, αλλά το κάνει με τον εντοπισμό γονιδίων που σχετίζονται λειτουργικά με πολλαπλά άλλα γονίδια σε μεγαλύτερο βαθμό από ό, τι θα αναμενόταν από την τύχη. Ενώ η μεθοδολογία GRAIL έχει το πλεονέκτημα ότι δεν απαιτεί το φαινότυπο των τόκων που πρέπει να μελετηθεί σε σχέση με ένα συγκεκριμένο γονίδιο πριν, ούτε να επωφεληθούν όταν οι πληροφορίες αυτές είναι διαθέσιμες. Ως εκ τούτου, φαίνεται ότι τόσο η ADAPT και μεθοδολογίες GRAIL μπορεί να αποδειχθεί χρήσιμη μαζί, ή με δική τους, στην ιεράρχηση των SNPs από την αρχική σαρώσεις GWA για περαιτέρω παρακολούθηση.

Είναι σημαντικό, οραματιζόμαστε με τη μέθοδο της ADAPT-BFDP ως συμπληρωματικό εργαλείο – και όχι ως υποκατάστατο – την πιο παραδοσιακή προσέγγιση GWAS (δηλαδή κατάταξη p-value), π.χ. χρησιμοποιώντας αρχικά κατάταξης με βάση το p-value για την ανίχνευση γενετικών τόπων σε αγνωστικιστής τρόπο, και στη συνέχεια, η μεθοδολογία ADAPT-BFDP να αξιοποιήσει περαιτέρω τα δεδομένα με δυνατότητα να ανιχνεύσει τις παραλλαγές που μπορεί διαφορετικά να αγνοηθεί. Ενώ γενικά δεν συνιστάται για τη διεξαγωγή μικρής ισχύος μελέτες, η μέθοδος ADAPT-BFDP μπορεί επίσης να βοηθήσει την ανίχνευση της ευαισθησίας τόπους, όταν η στατιστική ισχύς είναι κακή, για παράδειγμα, στην ανάλυση στρωματοποιημένη γονιδίωμα-ευρεία όπως στην μικρής ισχύος καρκίνο του στόματος GWAS. Πράγματι, η rs991316 SNP κατετάγη 76

ου από p-τιμές, και αυτό το SNP ευαισθησία δεν θα έχουν συμπεριληφθεί στη φάση αντιγραφής είχε υιοθετήσαμε να αναπαράγουν μόνο τα πολύ κορυφαία παραλλαγές από p-τιμές. Επιπλέον, εάν ο αριθμός των SNPs που επιλέγονται για την αντιγραφή ήταν αρκετά βαθιά ώστε να συμπεριλάβει rs991316, το στατιστικά στοιχεία για την αντιγραφή (

P

τάση

= 2.5 × 10

-3) δεν θα έχουν κριθεί αξιοσημείωτο μετά την προσαρμογή για πολλαπλές δοκιμές στη φάση αντιγραφής (δηλαδή ένα Bonferroni ρυθμιστεί το όριο σημαντικότητας p = 0,0007). Ως εκ τούτου, φαίνεται ότι η στρατηγική ADAPT-BFDP βοήθησε την ανίχνευση και την επικύρωση της παραλλαγής rs991316. Η διαδικασία προσαρμογής μπορεί επίσης εύκολα να προσαρμοστεί για να παρέχει εκ των προτέρων ενημέρωση των συνολικών γονιδίων και όχι μεμονωμένα SNPs, και ως εκ τούτου, μπορεί επίσης να είναι χρήσιμη σε γονιδιωματική εφαρμογές, όπως οι μελέτες αλληλουχίας exome ή γονιδιώματος βάση. Επιπλέον, αρκετές πηγές πληροφόρησης θα μπορούσαν ενδεχομένως να συμπεριληφθούν στο Bayesian πλαίσιο, για τις βάσεις δεδομένων π.χ. οδός οντολογία, με άλλες μεθόδους που βασίζονται κείμενο συμπεριλαμβανομένων GRAIL, ή συμπληρωματικά πειράματα, όπως η ανάλυση eQTL γονιδιώματος σε επίπεδο [18].

Συμπεράσματα

αυτή η μελέτη επιβεβαιώνει ότι είναι δυνατό να ενσωματωθούν ολοκληρωμένη προηγούμενη ενημέρωση με αυτοματοποιημένο τρόπο για να βοηθήσει στην ιεράρχηση των SNPs σε GWAS για περαιτέρω παρακολούθηση, σε αυτή την περίπτωση από το κείμενο που βασίζεται σε ιατρική βιβλιογραφία, χρησιμοποιώντας τη μεθοδολογία ADAPT-BFDP . Προς υποστήριξη αυτού, αναφέρουμε μια νέα SNP ευαισθησία του καρκίνου του στόματος στο

ADH

γονιδιακή περιοχή 4q23, η οποία σχετίζεται με τον κίνδυνο ανεξάρτητα από προηγουμένως εντοπιστεί SNPs κινδύνου συνολικής καρκίνου UADT σε αυτή την περιοχή. Έχουμε κάνει η μεθοδολογία στη διάθεση της ερευνητικής κοινότητας προσαρμοστούν μέσω μιας υπηρεσίας Ιστού (url: https://services.gate.ac.uk/lld/gwas/service/config).

Υλικά και Μέθοδοι

Ηθική δήλωση

Όλοι οι συμμετέχοντες έδωσαν γραπτή συγκατάθεση για να συμμετάσχουν στη μελέτη και την Επιτροπή IARC Δεοντολογίας (IEC) ενέκρινε την εν λόγω έρευνα.

Ανάκτηση πληροφοριών από την ιατρική βιβλιογραφία χρησιμοποιώντας προσαρμοστούν

για να εξαγάγετε τις σχετικές πληροφορίες από την ιατρική βιβλιογραφία σε μια πλήρη και αμερόληπτη μόδας, έχουμε αναπτύξει τα Ρύθμιση Priors σύνδεσης με Κείμενο (ADAPT) μέθοδο. ADAPT εντοπίζει τις σχετικές περιλήψεις PubMed για κάθε γονίδιο REFSEQ μέσω της βάσης δεδομένων Entrez γονίδιο (url: https://www.ncbi.nlm.nih.gov/gene), όπου όλες οι μελέτες που έχουν ερευνήσει ένα συγκεκριμένο γονίδιο είναι διασταυρώνονται με PubMed. Για τη μελέτη αυτή, οποιοδήποτε γονίδιο εντός 50 000 ζεύγη βάσης ενός SNP χαρτογραφήθηκε, μαζί με περιλήψεις που συνδέονται με αυτό το γονίδιο. Είναι επίσης δυνατή η χρήση των κειμένων GeneRif, η οποία είναι μικρή και το χέρι σχολιασμένη περιλήψεις κάθε ερευνητική εργασία, στη θέση του περιλήψεις PubMed. Αυτά τα κείμενα GeneRif παρέχεται απευθείας στη βάση δεδομένων του γονιδίου Entrez. Όλες οι σχετικές περιλήψεις συνέχεια εξορύσσεται για λέξεις-κλειδιά και τις βασικές έννοιες που σχετίζονται με σημαντικά χαρακτηριστικά της νόσου ή φαινότυπο ενδιαφέροντος, συμπεριλαμβανομένων των αιτιολογικών και μηχανιστική παράγοντες. Αυτή η εξόρυξη πραγματοποιείται με τη χρήση GATE (url: https://gate.ac.uk) [19], η οποία χωρίζει αποσπάσματα σε προτάσεις, tokenizes τις ποινές σε επιμέρους όρους, βρίσκει το μέρος του λόγου για μάρκες, και σπάει κάθε κουπόνι σε κύριο συστατικό του (μορφολογική ρίζα). Περιλήψεις επίσης αντιστοιχίζεται με τις έννοιες UMLS χρησιμοποιώντας MetaMap [20], [21]. Μάρκες και τις έννοιες που ήταν αποθηκευμένα σε ένα ευρετήριο GATE Μίμιρ να διευκολυνθεί η γρήγορη ανάκτηση και την αποθήκευση χαρτογράφηση μεταξύ των επιμέρους SNPs και τις σχετικές περιλήψεις [22]. Λέξεις-κλειδιά για την εξόρυξη επίσης σε επεξεργασία με GATE για να δώσει μορφολογικά ρίζες και τις παρουσίες από αυτά επικυρώθηκαν στη συνέχεια στο δείκτη για κάθε SNP.

Σας έχουν ανατεθεί λέξεις-κλειδιά σε μία από τις τρεις ομάδες, G1, G2 και G3, η ομάδα G1 που περιέχουν λέξεις υψίστης σημασίας για το φαινότυπο, και η ομάδα G3 περιέχουν σχετικές, αλλά υποκειμενικά λιγότερο σημαντικές λέξεις. Με βάση την παρουσία σχετικές λέξεις-κλειδιά, κάθε γονίδιο και εγγύς SNPs μπορεί λογικά να ανατεθεί σε ένα από τα 8 είναι δυνατόν δυαδικών συνδυασμών των G1, G2 και G3. Για τους σκοπούς μας ορίσαμε τρεις κατηγορίες (

C

i, i = 1,2,3

):

C

1

= {Όχι

G

1

, όχι

G

2

, όχι

G

3

}

C

2

= {τουλάχιστον ένα από

G

1, G

2, G

3

αλλά όχι όλες}

C

3

= {

G

1, G

2, G

3

}.

Η

Έχουμε αναπτύξει μια διαδικτυακή υπηρεσία που επιτρέπει σε ένα χρήστη να διεξάγει κλειδί ερωτήματα λέξη πάνω από ένα αυθαίρετο σύνολο των SNPs σε εύθετο χρόνο, π.χ. μια λίστα των SNPs που περιλαμβάνονται σε ένα συγκεκριμένο γονιδίωμα-ευρεία BeadChip (url: https://services.gate.ac.uk/lld/gwas/service/config). Αυτό επιστρέφει μια κατάταξη πάνω από όλους 8 πιθανές κατηγορίες, επιτρέποντας την περαιτέρω κατάρρευση από το χρήστη. Πρέπει επίσης να παρέχουν ένα R-script που υπολογίζει τις εκ των προτέρων πιθανότητες για κάθε SNP και την εκ νέου κατατάσσει τα αποτελέσματα GWAS σύμφωνα με τις εκτιμήσεις BFDP. Αυτό θα επιτρέψει στους ερευνητές να εφαρμόσει ελεύθερα τη μεθοδολογία προσαρμοστούν χωρίς μεταφόρτωση αποτελέσματα ένωσή τους σε απευθείας σύνδεση (url: https://services.gate.ac.uk/lld/gwas/service/rscript).

You must be logged into post a comment.