PLoS One: MGEx-UDB: Μια θηλαστικών Μήτρα βάσης δεδομένων για την Έκφραση-Based Βιβλιογραφικό των γονιδίων σε όλη προϋποθέσεις, συμπεριλαμβανομένων των ενδομητρίωση και ο καρκίνος του τραχήλου της μήτρας


Αφηρημένο

Ιστορικό

Η γονιδιακή έκφραση των χαρακτηριστικών της μήτρας ιστού έχει πραγματοποιηθεί σε διάφορα περιβάλλοντα, αλλά ένα σημαντικό ποσό των δεδομένων παραμένει υποχρησιμοποιούνται, δεδομένου ότι δεν καλύπτεται από τους υπάρχοντες γενικούς πόρους.

Μεθοδολογία /Κύρια Ευρήματα

Είμαστε επιμέλεια 2254 σύνολα δεδομένων από μελέτες γονιδιακής έκφρασης που συνδέονται με μαζική κλίμακα 325 μήτρας σε είδος ανθρώπου, ποντικού, αρουραίου, αγελάδας και το χοιρινό. Στη συνέχεια υπολογιστικά προέρχεται μια «βαθμολογία αξιοπιστίας» για την κατάσταση του κάθε γονιδίου έκφραση (μεταγραφεί /αδρανής), για κάθε πιθανό συνδυασμό των συνθηκών και τοποθεσίες, με βάση το βαθμό συμφωνίας ή διαφωνίας μεταξύ συνόλων δεδομένων. Τα δεδομένα και τα παράγωγα πληροφορίες έχουν συνταχθεί στο

Μ

ammalian

G

ένιο

Ex

συμπίεση

U

terus

δ

ATA

β

ase

(MGEx-UDB, http : //resource.ibab.ac.in/MGEx-Udb/). Η βάση δεδομένων μπορεί να ερωτηθούν με ονόματα γονίδιο /αναγνωριστικά, θέσεις υπο-ιστών, καθώς επίσης και τις διάφορες συνθήκες όπως ο καρκίνος του τραχήλου της μήτρας, του ενδομητρίου κύκλους και διαταραχών και πειραματικές θεραπείες. Κατά συνέπεια, η έξοδος θα είναι α) μεταγράφεται και αδρανείς γονίδια που απαριθμούνται για την ερωτηθούν κατάσταση /θέση, ή β) προφίλ έκφρασης του γονιδίου ενδιαφέροντος σε διάφορες μήτρας συνθήκες. Τα αποτελέσματα περιλαμβάνουν επίσης το σκορ αξιοπιστίας για το καθεστώς έκφραση κάθε γονιδίου. MGEx-UDB παρέχει επίσης πληροφορίες σχετικές με Gene Ontology επισημειώσεις, αλληλεπιδράσεων πρωτεΐνης-πρωτεΐνης, μεταγραφές, υποκινητές, και την κατάσταση έκφρασης με άλλες τεχνικές προσδιορισμού αλληλουχίας, και διευκολύνει διάφορους άλλους τύπους ανάλυσης των μεμονωμένων γονιδίων ή συν-εκφράζεται συστάδες γονιδίων.

Συμπεράσματα /Σημασία

Εν συντομία, MGEx-UDB επιτρέπει την εύκολη καταγραφή των συν-εκφρασμένων γονιδίων και επίσης διευκολύνει την ανακάλυψη βιο-δείκτης για διάφορες μήτρας συνθήκες

Παράθεση:. Bajpai AK, Davuluri S, Chandrashekar DS, Ilakya S, M Dinakaran, Acharya ΚΚ (2012) MGEx-UDB: Μια θηλαστικών Μήτρα βάσης δεδομένων για την Έκφραση-Based Βιβλιογραφικό των γονιδίων σε όλη προϋποθέσεις, συμπεριλαμβανομένων των ενδομητρίωση και ο καρκίνος του τραχήλου της μήτρας. PLoS ONE 7 (5): e36776. doi: 10.1371 /journal.pone.0036776

Επιμέλεια: Zhanjiang Liu, Πανεπιστήμιο Auburn, Ηνωμένες Πολιτείες της Αμερικής

Ελήφθη: 10 Ιαν 2012? Αποδεκτές: 5, Απριλίου 2012? Δημοσιεύθηκε: 11 Μαΐου, 2012

Copyright: © 2012 Bajpai et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Αυτό το έργο υποστηρίχθηκε από το Τμήμα Πληροφορικής [Grant αριθμό DIT /R & amp? Δ /BIO /15 (5) /2008 για την KKA & amp? μια θεσμική επιχορήγηση στο πλαίσιο του κέντρου αριστείας συστήματος] κυβέρνηση της Ινδίας. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:. Οι συγγραφείς δηλώνουν ότι η αντίστοιχη συγγραφέας (Kshitish Κ Acharya) είναι συνδεδεμένες με τόσο IBAB, ένα ακαδημαϊκό ερευνητικό ίδρυμα και, Shodhaka Επιστήμες της ζωής Pvt. Ε.Π.Ε. Η τελευταία είναι μια νεοϊδρυθείσα εμπορική εταιρεία, η οποία αυτή τη στιγμή δραστηριοποιείται κυρίως στην έρευνα και την εκπαίδευση. Διαθέτει επίσης δύο προϊόντα που σχετίζονται με την αναζήτηση βιβλιογραφίας και σε απευθείας σύνδεση δοκιμή για τις θέσεις εργασίας και τα μαθήματα βιολογίας που σχετίζονται με. Στο μέλλον, η εταιρεία σκοπεύει να παρέχει υπηρεσίες στη βάση δεδομένων και το λογισμικό εξελίξεις. Οι συγγραφείς επιβεβαιώνουν την υπαγωγή στην εταιρεία και τη συμμετοχή του αντίστοιχου συγγραφέα ως διευθυντής της εταιρείας. Επιβεβαιώνουν επίσης ότι αυτό δεν μεταβάλλει την προσκόλλησή τους σε όλες τις PLoS ONE πολιτικές για την ανταλλαγή δεδομένων και υλικών.

Εισαγωγή

Μήτρα είναι ένα σημαντικό όργανο θηλαστικών που πρέπει να μελετηθεί για το ρόλο της στην συνήθεις λειτουργίες όπως η μετανάστευση σπέρμα, εμφύτευση εμβρύου και του εμβρύου τροφή, καθώς και πολλαπλές διαταραχές [1], [2]. Ο καρκίνος του τραχήλου είναι μία από τις κύριες αιτίες των θανάτων από καρκίνο στις γυναίκες παγκοσμίως [3]. Ομοίως, ο καρκίνος του ενδομητρίου, ενδομητρίωση και υπογονιμότητα οφείλεται σε ελαττωματική λειτουργίες της μήτρας έχουν επίσης σοβαρές ανησυχίες για την υγεία του ανθρώπου. Πολλά παραμένει άγνωστη για την κανονική φυσιολογία και τις παθολογικές λεπτομέρειες του ιστού της μήτρας.

Η κατανόηση του προτύπου και των μηχανισμών ρύθμισης της έκφρασης των γονιδίων είναι κεντρικής σημασίας για τις περισσότερες πτυχές της βιολογίας, συμπεριλαμβανομένων των φυσιολογικών και μη φυσιολογικών καταστάσεων της μήτρας θηλαστικών. ανίχνευση μεγάλης κλίμακας των προτύπων έκφρασης γονιδίου είναι πιο εύκολο στο επίπεδο μεταγραφής σε σύγκριση με το επίπεδο της πρωτεΐνης. Μικροσυστοιχίες επέτρεψε γονιδίωμα ευρύ προφίλ απομαγνητοφώνηση και έχουν χρησιμοποιηθεί εκτενώς για να εξερευνήσετε διάφορα βιολογικά φαινόμενα.

Παραλλαγές στο επίπεδο έκφρασης και το καθεστώς των γονιδίων, σε όλα τα αποτελέσματα των πειραμάτων μικροσυστοιχιών [4], έχουν προκαλέσει οι περιορισμοί στις επιχειρήσεις κοινής ωφέλειας των δεδομένων αυτών γονιδιακής έκφρασης. Προτεινόμενες προδιαγραφές για πειράματα μικροσυστοιχιών και την αναφορά [5] – [7], και βελτιωμένες μεθόδους μετα-ανάλυση [8] – [11] θα μπορούσε να διευκολύνει την καλύτερη χρήση των υποβαλλόμενων στοιχείων. Ενώ οι επιστήμονες σήμερα φαίνεται να προτιμούν τις μεθόδους που βασίζονται αλληλουχίας για μεταγραφή προφίλ [12], [13], η αξία των ήδη υπαρχόντων δεδομένων μικροσυστοιχιών δεν μπορεί να υποτιμηθεί. Μικροσυστοιχιών και άλλα δεδομένα γονιδιακής έκφρασης υψηλής απόδοσης έχουν συνταχθεί σε πολλαπλά χρήσιμες βάσεις δεδομένων /αποθετήρια (για μια λίστα, δείτε https://www.startbioinfo.com/gene-expression). Αλλά οι ανεπάρκειες σε επιλογές αναζήτησης ειδικά για φυσιολογικές και πειραματικές συνθήκες περιορίζουν επίσης την αξιοποίηση των διαθέσιμων βάσεων δεδομένων. Έχει επίσης παρατηρηθεί ότι ένα σημαντικό ποσό των δεδομένων που λείπουν σε αυτές τις βάσεις δεδομένων [14], [15]. Χτίσιμο τα περισσότερα από τα δεδομένα έκφρασης σε ένα μέρος θα είναι μια τεράστια πρόκληση οφείλεται σε δύο κυρίως λόγους: α) τη συλλογή των δεδομένων διάσπαρτα στη λογοτεχνία είναι μια επίπονη εργασία, αλλά δεν φαίνεται να υπάρχει εναλλακτική λύση υπάρχει? β) δεν υπήρξε ένα βολικό μέσο για να αντλήσει χρήσιμες πληροφορίες σε διάφορες πλατφόρμες, μελέτες και τύπους δεδομένων (πρώτων /επεξεργασία των δεδομένων ή των τελικών κλήσεις μόνο). Η ομάδα μας νωρίτερα πέρασε περίπου 3 χρόνια για να κόπο συγκέντρωση δεδομένων γονιδιακής έκφρασης για τους όρχεις θηλαστικών, και στη συνέχεια να εφαρμοστεί η νέα συναίνεση με βάση τη μέθοδο αξιολόγησης της αξιοπιστίας για να αντλήσει μια δυαδική κατάσταση έκφρασης για κάθε γονίδιο [15].

Μια παρόμοια προσπάθεια απαιτείται για τον ιστό της μήτρας. Σημαντική ποσότητα των δεδομένων των μικροσυστοιχιών είναι πράγματι διαθέσιμη για τον ιστό των θηλαστικών μήτρα [16]. Υπήρξαν μερικές βάσεις δεδομένων ειδικά για ένα συστατικό της μήτρας, όπως ενδομήτριου ιστού, (ενδομητρίου Βάση Δεδομένων: https://www.endometrialdatabase.com και SCCPIR ενδομήτριο Βάση Δεδομένων Πόρων: https://endometrium.bcm.tmc.edu/edr ) ή σε μια κατάσταση, ccdB, του τραχήλου της μήτρας γονίδιο του καρκίνου δεδομένων [17]. Όμως, δεν υπήρξε μια συγκεκριμένη βάση δεδομένων μήτρας. Με την πρόθεση να συγκεντρώσει το μέγιστο υπάρχοντα δεδομένα γονιδιακής έκφρασης της μήτρας και ενισχύσεις για την έρευνα σχετικά με διάφορες πτυχές της μήτρας θηλαστικών, έχουμε δημιουργήσει την θηλαστικών γονιδιακής έκφρασης Μήτρα βάση δεδομένων (MGEx-UDB), και αναφέρουν το ίδιο.

Αποτελέσματα

περιεχομένου βάσης δεδομένων

(α) τα δεδομένα θεωρούνται για τη βαθμολόγηση: επί του παρόντος, η βάση δεδομένων καλύπτει 325 μελέτες με 2254 σύνολα δεδομένων που αντιστοιχούν σε 1092 «Κατάσταση Έκφραση κάτω από συγκεκριμένες θέσεις και Προϋποθέσεις» (ESLCs) για τον άνθρωπο, το ποντίκι , αρουραίος, αγελάδα και χοίρο. Περίπου το 83% των δεδομένων σε MGEx-UDB είναι από μελέτες σε ανθρώπινα είδη (Σχήμα 1). Η βάση δεδομένων παρέχει 970 διαφορετικά ESLCs για τον άνθρωπο (23735 γονίδια), 91 για το ποντίκι (24.428 γονίδια), 15 για αρουραίου (14.497 γονίδια), 8 για αγελάδα (10.875 γονίδια), και 8 για το χοιρινό (1720 γονίδια). Η βάση δεδομένων έχει μέγιστο αριθμό μελετών για τον καρκίνο του τραχήλου της μήτρας (38% όλων των μελετών). Τα επόμενα πιο άφθονα μελέτες αντιστοιχούν σε καρκίνο του ενδομητρίου και της ενδομητρίωσης (περίπου 13% μελέτες για το καθένα). Άλλες καταστάσεις που συνέτειναν περιλαμβάνουν τις κανονικές, λειομύωμα, λειομυοσάρκωμα, τραχηλική ενδοεπιθηλιακή νεοπλασία (CIN), υπερπλασία του ενδομητρίου, του ενδομητρίου κύκλους, την κύηση, η θεραπεία με χημικά /ορμόνες και μελέτες νοκ-άουτ και διαμόλυνση που συνδέονται με συγκεκριμένα γονίδια (Σχήμα 2). Οι περισσότερες αναφορές που σχετίζονται με την ασθένεια είναι από ανθρώπινους ιστούς και /ή κυτταρικές γραμμές. Ενώ οι μελέτες που σχετίζονται με την ορμονική θεραπεία, εμφύτευση του εμβρύου και του φυσιολογικού ιστού είναι κοινά σε ποντίκια, μελέτες για χημική επεξεργασία /ορμονών και της ενδομητρίωσης είναι κοινά σε αρουραίους. Στην περίπτωση των αγελάδων και χοίρων, οι μελέτες που σχετίζονται με την εγκυμοσύνη είναι κοινή.

Άλλα είδη περιλαμβάνουν αγελάδων και χοίρων. Ανάμεσα στα δεδομένα που συλλέγονται από GEO ή «PubMed & amp? GEO », το 85% των μελετών ήταν επίσης παρόντες σε ArrayExpress, ακόμη και αν αυτό δεν αναφέρεται στο σχήμα.

Η

(και μελέτες) σε MGEx-UDB που αντιστοιχούν σε διάφορες φυσιολογικές και παθολογικές καταστάσεις της μήτρας. «Άλλοι» αντιπροσωπεύουν μετά τον τοκετό, η γενετική-κατάλυση, την τεχνητή γονιμοποίηση και την εμφύτευση του εμβρύου. Μελέτες σχετικά με τους ιστούς που χρησιμοποιούνται ως μάρτυρες, αλλά δεν μπορεί να είναι απολύτως «κανονικό» έχουν ομαδοποιηθεί σε

«μπορεί να είναι φυσιολογική»

κατηγορία (παραδείγματα: «φυσιολογικό ιστό δίπλα όγκου /καρκινικό ιστό», «υπό αγωγή με όχημα «).

η

Από τις 325 μελέτες που εντοπίστηκαν για τη συλλογή δεδομένων, 295 που δημοσιεύθηκε ερευνητικά άρθρα έχουν την επιμέλεια για τη συλλογή των πληροφοριών που σχετίζονται με κάθε λίστα γονίδιο. Στις υπόλοιπες περιπτώσεις, οι απαιτούμενες πληροφορίες επιμελήθηκε απευθείας από τα αποθετήρια? δεν υπήρχε αντίστοιχη δημοσίευση για αυτά τα πειράματα. Από όλες τις μελέτες, το 55% περίπου λήφθηκαν αποκλειστικά από τη βιβλιογραφία. Τα υπόλοιπα δεδομένα προήλθαν από Expression Gene Omnibus (GEO) [18], ArrayExpress [19] και άλλα αποθετήρια μόνο, ή σε συνδυασμό με βιβλιογραφία (Σχήμα 1). Στη βάση δεδομένων, το 90% των μελετών αντιστοιχούν στο επίπεδο έκφρασης του mRNA και 10% μελέτες αντιστοιχούν σε έκφραση σε πρωτεομικής επίπεδο. Τα περισσότερα (91%) των εκθέσεων επίπεδο του mRNA προήλθε από την τεχνολογία μικροσυστοιχιών, η οποία συμβάλλει επίσης σε 72% του συνόλου των συνόλων δεδομένων. Affymetrix (66%) είναι ο κύριος παράγοντας που συμβάλλει μεταξύ των πλατφόρμες μικροσυστοιχιών, ακολουθούμενη από έθιμο συστοιχίες cDNA (21%) (Σχήμα 3). μελέτες μικρής κλίμακας με βάση την αντίστροφη πολυμεράσης μεταγραφής αλυσιδωτή αντίδραση πολυμεράσης (PCR), ποσοτική πραγματικού χρόνου PCR, κηλίδωση τεχνικές, κλπ, συνέβαλε επίσης σύνολα δεδομένων. Μεταξύ των συνολικών σύνολα δεδομένων, το 52% έχουν & gt? 500 γονίδια σε κάθε ένα, το 8% από αυτούς έχουν 50-500 και το υπόλοιπο 40% να περιέχουν & lt? 50 γονίδια (Σχήμα 4). Στις περισσότερες περιπτώσεις, τα σύνολα δεδομένων που αντιστοιχούν σε μελέτες μικρής κλίμακας ήταν από τα πειράματα επικύρωση μιας μελέτης της γονιδιακής έκφρασης μαζική κλίμακα.

«άλλοι» περιλαμβάνει σύνολα δεδομένων συνέβαλε κατά κύριο λόγο από την GE Healthcare και Illumina πλατφόρμες.

Η

(με αρίθμηση γονίδιο) που συλλέγονται από διάφορες πηγές. Σε περίπτωση «PubMed & amp? GEO »και« PubMed & amp? ArrayExpress «, μικρότερες λίστες γονίδιο προήλθε από τα πειράματα επικύρωση και συλλέχθηκαν από PubMed, ενώ πρώτων /επεξεργασία των δεδομένων ήταν πάντα συλλέγονται από τα αποθετήρια (GEO /ArrayExpress)

Η

β) τα δεδομένα δεν θεωρούνται για τη βαθμολόγηση.: MGEx-UDB έχει επίσης δεδομένα αλληλούχισης. Τα δεδομένα αυτά δεν θα μπορούσαν να χρησιμοποιηθούν στο σκοράρισμα τη συναίνεση που οφείλεται στην ασυμβατότητα αυτών των τύπων δεδομένων με το ισχύον σύστημα υπολογιστικής βαθμολόγησης. Next Generation Sequencing (NGS) δεδομένα συμπεριλήφθηκε για τα κύτταρα HeLa με διαφορική έκφραση καλεί για 2 συνθήκες θεραπείας, από τις 3 μελέτες. Οι συνδέσεις παρέχονται για άλλες σχετικές NGS (πρώτες) σύνολα δεδομένων. Μαζική των δεδομένων αλληλουχίας, όμως, αντιστοιχεί σε Εκφράζεται Ετικέτες Sequence (ESTs).

Ένα παράδειγμα

( «στάδιο ΙΙΑ μη κερατινίωση τραχηλικό καρκίνωμα πλακωδών κυττάρων»)

ιεραρχία των όρων και των επιμέρους -οι όροι, για τους οποίους τα δεδομένα έχουν συλλεγεί και drop-down επιλογές που παρέχονται στο ερώτημα και να φορτώσετε τις σελίδες του MGEx-UDB. Επί του παρόντος, η βάση δεδομένων επιτρέπει μέχρι τέσσερα επίπεδα της ιεραρχίας για την αναζήτηση.

Η

διασύνδεση Web

χαρακτηριστικά ερωτήματος.

MGEx-UDB παρέχει πολλαπλές επιλογές ερώτημα. Να διερευνούν από ένα γονίδιο, ο χρήστης μπορεί να εισέλθει αναγνωριστικά ενός από τους παρακάτω τύπους: ονόματα, σύμβολα, τα συνώνυμα, τα αναγνωριστικά γονίδιο Entrez, και το γονίδιο λέξεις-κλειδιά /περιγραφές. Κατάσταση που βασίζεται αναζήτηση μπορεί να γίνει με την επιλογή της κατάστασης των τόκων από τις επιλογές drop-down φυσιολογικών ή πειραματικές συνθήκες σε διαφορετικά επίπεδα της ιεραρχίας για επέλεξαν είδη. Για παράδειγμα, τα γονίδια μεταγράφονται ή αδρανών μπορεί να ληφθεί για ανθρώπινο καρκίνο του τραχήλου της μήτρας, καθώς και, πλακώδους καρκινώματος κατάσταση. Ομοίως, τα ερωτήματα μπορεί να περιορίζεται σε μια συγκεκριμένη περιοχή του ιστού (υπο-ιστού), και κυτταρικό τύπο. Υπάρχει επίσης μια επιλογή για να επιλέξετε ένα συγκεκριμένο είδος πληθυσμού, όπως του Καυκάσου, στην περίπτωση των ανθρώπων, και των τύπων στέλεχος όπως C57BL6 ή Sprague-Dawley σε περίπτωση ποντικού και αρουραίου, αντίστοιχα.

Έξοδος.

Για το γονίδιο-based αναζήτηση, η βάση δεδομένων παρέχει μια λίστα με πανομοιότυπο καθώς και εν μέρει ταιριάζουν γονίδια σε διαφορετικά είδη. Κάθε γονίδιο σε αυτή τη σελίδα μπορείτε να κάνετε κλικ για βασικές πληροφορίες σχετικά με το γονίδιο, οι υποστηρικτές τους, την κατάσταση της έκφρασης, τα προϊόντα (μεταγραφές και πρωτεΐνες), Gene Ontology (GO) σχολιασμούς, οι αλληλεπιδράσεις πρωτεΐνης-πρωτεΐνης, παραπομπή σε άλλες μεγάλες βιοπληροφορική πόρων, και σχετικές PubMed αναφορές. Βασικές πληροφορίες γονίδιο αποτελείται από ακολουθία, τόπους και περίληψη του γονιδίου. πληροφορίες μεταγραφής περιλαμβάνει ID πρακτικά, κωδικοποιητική αλληλουχία και εξονίου-ιντρονίου λεπτομέρειες. λεπτομέρειες υποστηρικτής καλύψει την μεταγραφή Έναρξη Ιστοσελίδας (TSS), το δυναμικό αλληλουχία υποκινητή και χρωμοσωμική θέση του. πληροφορίες Protein παρέχει διαφορετικές ισομορφές της πρωτεΐνης (ων), με αντίστοιχη ακολουθία, τη λειτουργία, το μοριακό βάρος και το μήκος αμινοξέων. κατάσταση (-α) Η έκφραση του γονιδίου δείχνεται, μαζί με ένα σκορ αξιοπιστία, για πολλαπλές περιοχές ιστών /υπο-ιστού και κυτταρικούς τύπους υπό διαφορετικές φυσιολογικές και πειραματικές συνθήκες. Η αρχική πηγή των δεδομένων έκφρασης εμφανίζεται σε ένα ξεχωριστό πάνελ. Εκτός από αυτό, η βάση δεδομένων δείχνει μια κατάσταση ενδεικτική έκφρασης (ες) με βάση τα δεδομένα αλληλουχίας (EST & amp? NGS)., Για διάφορα μήτρας ιστούς /συνθήκες

Ερώτημα με μία κατάσταση (κατάσταση που βασίζεται αναζήτησης) παρέχει καταλόγους των γονιδίων μεταγράφονται και αδρανείς στο ερώτημα κατάσταση. Σε κάθε μία από αυτές τις δύο λίστες, η «βαθμολογία αξιοπιστίας» παρουσιάζεται για κάθε γονίδιο. Στην πραγματικότητα, τα γονίδια τοποθετημένα στη φθίνουσα σειρά της βαθμολογίας τους. GO σχολιασμούς εμφανίζονται επίσης για τις πρώτες 100 γονίδια. Ο χρήστης μπορεί να εξάγει την πλήρη λίστα των γονιδίων, μαζί με τα αποτελέσματα της αξιοπιστίας τους. Οι αναφορές στα σύνολα δεδομένων πηγής θεωρούνται για βαθμολόγησης μπορούν να προβληθούν σε αυτή τη σελίδα εξόδου. Κάνοντας κλικ σε οποιοδήποτε γονίδιο της σελίδας αποτελεσμάτων θα είναι παρόμοια σε ισχύ στο συγκεκριμένο ερώτημα γονίδιο που περιγράφεται στην προηγούμενη παράγραφο. Η επιλογή «αναλύσει» στη σελίδα εξόδου επιτρέπει στο χρήστη να εκτελέσει γρήγορη ανάλυση των σημαντικών λειτουργιών /διαδικασιών των επιλεγμένων γονιδίων. Ο χρήστης μπορεί να ξεκινήσει γρήγορα την ανάλυση GO και πολλαπλή στοίχιση ακολουθιών (των γονιδίων, πρωτεϊνών και υποστηρικτές), και εύκολη πρόσβαση σε σχετικές οδούς και πολυμορφισμού ενός νουκλεοτιδίου (SNP) αρχεία. Η βάση δεδομένων επιτρέπει, επίσης, συν-έκφραση, η πρωτεΐνη-αλληλεπίδρασης και αναλύσεις μονοπάτι, και προσφέρει απεικόνιση των δικτύων μεταξύ των επιλεγμένων σύμπλεγμα των γονιδίων με τη χρήση GeneMANIA [20] λειτουργικό εργαλείο ανάλυσης.

Η βάση δεδομένων περιλαμβάνει εύκολη περιήγηση των γονιδίων και συνθήκες. Επιπλέον, οι συνδέσεις που παρέχονται με τα στοιχεία που σχετίζονται με τη μήτρα (NGS και να αντιγράψετε τον αριθμό παραλλαγές), με δείκτη των συνθηκών, και άλλους πόρους.

Συζήτηση

Ένα σημαντικό ποσό των δημοσιευμένων δεδομένων μικροσυστοιχιών είναι δεν βρέθηκε σε κανένα από τα ευρέως χρησιμοποιούμενα βάσεις δεδομένων ή αποθετήρια [14], [15]. Συγκέντρωση των δεδομένων αυτών πρέπει να είναι χειροκίνητη και θα είναι μια διαδικασία διάστημα, λαμβάνοντας. Έχουμε ξεκινήσει ιστού σοφή συλλογή των δεδομένων γονιδιακής έκφρασης θηλαστικών με σκοπό να χρησιμοποιήσουν τα υπάρχοντα δεδομένα για την ταξινόμηση των προτύπων γονιδιακής έκφρασης. Μια συγκριτική μελέτη [15] από τις βάσεις δεδομένων με την κατάστασή συγκεκριμένα ερωτήματα έδειξε την ανωτερότητα των εν λόγω ιστών σοφή biocuration των δεδομένων γονιδιακής έκφρασης. Μια παρόμοια σύγκριση των MGEx-UDB με άλλα αποθετήρια /βάσεις δεδομένων έδειξε ότι ο πρώην παρέχει ευκολότερη σύστημα ερώτημα και παρέχει μεγαλύτερο αριθμό σχετικών μελετών και γονίδια (λεπτομέρειες στην ενότητα στατιστικά στοιχεία της βάσης δεδομένων).

Η δύναμη της «αξιοπιστίας βαθμολογία », για το καθεστώς δυαδική έκφραση, είναι ανάλογη με την ποσότητα των συνόλων δεδομένων και τη συμφωνία σε όλη τους, για κάθε αντίστοιχη κατάσταση. Υπάρχουν ορισμένοι περιορισμοί [15] σε τέτοια συναινετική βάση βαθμολόγησης των δυαδικών κρατών έκφρασης. Αλλά, αυτή η δυαδική μέθοδος συναίνεση δεν προσφέρει ένα σημαντικό πλεονέκτημα έναντι άλλων μεθόδων πλέον μετα-ανάλυση σε υπολογισμός μιας ημι-ποσοτική συναίνεση. Λειτουργεί σε όλες τις πλατφόρμες και τεχνολογίες, ανεξάρτητα από τη διαθεσιμότητα των πρώτων /επεξεργασία των δεδομένων για όσο διάστημα η τελική κλήση έχει γίνει.

Η ιεραρχική απεικόνιση των γονιδίων μεταγράφονται /νάρκη σε συγκεκριμένες συνθήκες μπορεί να είναι ένα χρήσιμο αναπαράσταση της μεταγραφής προφίλ. Οι υψηλότερες βαθμολογίες δείχνουν συνέπεια στην κατάσταση έκφρασης των αντίστοιχων γονιδίων σε όλη βιολογικά δείγματα (που χρησιμοποιείται σε διάφορες μελέτες) και τεχνολογίες. Στην πραγματικότητα, η συνέπεια φαίνεται να διατηρείται για πολλά γονίδια, παρά τις διακυμάνσεις στην τεχνολογία, όπως η πλατφόρμα μικροσυστοιχιών, μεθόδους απομόνωσης RNA και στατιστικά στοιχεία, καθώς και τα δείγματα, τα οποία θα μπορούσαν επίσης να ποικίλλουν από την άποψη των πληθυσμών /στελεχών και άλλων σχετικών πτυχών όπως η ηλικία, η κοινωνική αλληλεπίδραση και τη διατροφή. Τα προκύπτοντα κατάλογοι μπορούν να χρησιμοποιηθούν για την ταυτοποίηση γονιδίων που έχουν ισχυρή συσχέτιση με οποιαδήποτε φυσιολογική κατάσταση /κατάστασης σε μήτρα ιστού των θηλαστικών. Για παράδειγμα, ο χρήστης μπορεί να αποκτήσει μια λίστα των γονιδίων που μεταγράφονται ή αδρανείς στην κατάσταση ασθένειας που μας ενδιαφέρει και να συγκρίνουν με εκείνους που έχουν την αντίθετη κατάσταση έκφρασης στην κανονική κατάσταση. Μια λίστα ένωση των γονιδίων μεταξύ των δύο όρων μπορεί να προέρχεται και ιεραρχικά διοργανώνονται με βάση βαθμολογίες. Ένας τέτοιος κατάλογος θα περιλαμβάνει γονίδια με ποικίλους βαθμούς σύνδεσης με την ασθένεια. Ως παράδειγμα, τα γονίδια

«μεταγράφονται σε καρκίνο του τραχήλου, αλλά αδρανείς σε κανονικές τραχήλου /μήτρα»

με υψηλές βαθμολογίες αξιοπιστία μπορεί να είναι καλύτερο υποψήφιο βιο-δείκτες από τα γονίδια συνήθως προσδιορίζονται ως διαφορικά εκφραζόμενα από μία μόνο μελέτη.

CDKN2A

, η οποία είναι μια ήδη γνωστό δείκτης για τον καρκίνο του τραχήλου της μήτρας [21], [22], είναι ένα τέτοιο γονίδιο που έχει μια βαθμολογία των 318 για το

‘μεταγράφεται κατάσταση σε καρκίνο του τραχήλου »

από 79 μελέτες από το PubMed, 6 από GEO, 1 από ArrayExpress και 2 από caArray, και 88 για

«λανθάνουσα κατάσταση σε κανονική μήτρα»,

από 32 μελέτες από PubMed και 1 από GEO. Αντίθετα, μερικά από τα κορυφαία γονίδια από το αδρανείς λίστα για τον καρκίνο του τραχήλου της μήτρας ήταν επίσης αδρανείς στην κανονική μήτρα, και ως εκ τούτου είναι λιγότερο πιθανό να έχουν μια ισχυρή συσχέτιση με την ασθένεια. Έτσι, η έξοδος που λαμβάνεται κατά μήκος συνθήκες μπορούν να χρησιμοποιηθούν για τη διαφοροποίηση των γονιδίων που έχουν ισχυρή συσχέτιση με μια πάθηση της μήτρας από αυτούς με ασθενή ή καθόλου ένωση. Αυτή η προσέγγιση θα μπορούσε να ανοίξει ένα νέο τρόπο λίστα πιθανών διαγνωστικών, προγνωστικών και θεραπευτικών στόχων για τις διαταραχές που σχετίζονται με τη μήτρα. Αυτή η διαδικασία μπορεί να χρησιμοποιηθεί ώστε να ληφθεί ραφιναρισμένο συστάδες συν-εκφρασμένων γονιδίων.

Οι συστάδες γονιδίων που λαμβάνονται με MGEx-UDB μπορεί να είναι χρήσιμη όχι μόνο για την κατανόηση των μοριακών μηχανισμών και τις οδούς που σχετίζονται, αλλά επίσης για τη διαλεύκανση των μηχανισμών του μεταγραφική ρύθμιση, ταυτοποίηση της νόσου σταδίου, το γονίδιο ιεράρχηση και τις προβλέψεις της λειτουργίας των γονιδίων. Έχουμε ξεκινήσει κάποιες μελέτες στην ανάλυση του υποκινητή μερικά από τα σημαντικά συστάδες συν-εκφρασμένων γονιδίων. Το μεταγλωττισμένο (μετά από μια τεράστια προσπάθεια διαλογής) κατάλογο των αναφορών των καταλόγων γονιδίου που αντιστοιχεί σε κάθε κατάσταση και τη θέση του ενδιαφέροντος μπορεί να είναι ιδιαίτερα χρήσιμο για τους χρήστες που ενδιαφέρονται για την εφαρμογή άλλων μεθόδων μετα-ανάλυση των δεδομένων γονιδιακής έκφρασης.

από MGEx-UDB παρέχει τα περισσότερα ή όλα τα γονίδια που σχετίζονται με μια συγκεκριμένη κατάσταση, μπορεί να χρησιμεύσει ως ένα καλό σημείο εκκίνησης για κάθε είδος της λειτουργικής ανάλυσης για διάφορες μήτρας συνθήκες. MGEx-UDB παρέχει επίσης την ευκαιρία να συγκρίνουν τα πρότυπα της γονιδιακής έκφρασης σε όλη ανεπαίσθητες μεταβολές στις συνθήκες και τις θεραπείες. Για παράδειγμα, μπορεί κανείς να συγκρίνει την κατάσταση χωρίς θεραπεία έκφραση από φυσιολογικό ιστό αναφορές με αυτές από sham δείγματα /αγωγή με όχημα (μπορεί να είναι φυσιολογική)? ιστούς όγκων-γειτονικά (μπορεί να είναι φυσιολογική) με ιστούς όγκων-λείπει (κανονικό)? στρώματα της μήτρας /κύκλους? στάδια του καρκίνου, κλπ. – σε όλες τις μελέτες

Οι ήδη υπάρχοντες πόρους που αντιστοιχούν σε συγκεκριμένες μήτρας υπο-ιστών /συνθήκες είναι ευνοϊκές κατά κάποιο τρόπο σε σύγκριση με MGEx-UDB. Ως εκ τούτου, έχουμε συμπεριλάβει συνδέσεις με τέτοιους πόρους στη βάση δεδομένων μας. CcdB [17], μια βάση δεδομένων ειδικά για τον καρκίνο του τραχήλου της μήτρας, όχι μόνο παρέχει πάνω /κάτω ρύθμιση, μεθυλιωμένες, μεταλλαγμένα και ενισχυμένα γονίδια, αλλά δίνει επίσης πληροφορίες σχετικά με miRNAs που σχετίζονται με τον καρκίνο του τραχήλου της μήτρας. Ενδομητρίου Βάση Δεδομένων (https://www.endometrialdatabase.com) και η SCCPIR ενδομήτριο Database Δυναμικού (https://endometrium.bcm.tmc.edu/edr) συγκεντρώνει αρκετές αναφορές της διαφορικής γονιδιακή έκφραση σε ενδομητρίου συνθήκες. Όμως, εκτός από το να περιορίζεται σε συγκεκριμένες συνθήκες, η κάλυψη του γονιδίου τους δεν φαίνεται να είναι λιγότερο από ό, τι MGEx-UDB. Είναι, επίσης, δεν έχει σχεδιαστεί για να παρέχει μια κατάσταση συναίνεση έκφραση μέσω της μετα-ανάλυσης, ή διευκολύνουν αυτή τη διαδικασία. Από την άλλη πλευρά, ειδικό ιστό βάσεις δεδομένων όπως η τίγρης [23] και TiSGeD [24] παρέχουν μήτρα συγκεκριμένα γονίδια, αλλά δεν επιτρέπουν σε συγκεκριμένα ερωτήματα για τις ασθένειες ή /και πειραματικές συνθήκες.

Μελλοντικές εξελίξεις

Η τρέχουσα εργασία μας έχει λάβει 3 χρόνια, κυρίως λόγω των χειρωνακτικών εργασιών επιμέλεια που εμπλέκονται. Τα δεδομένα που αντιστοιχούν σε ορισμένες συνθήκες και το είδος είναι ακόμη να συμπεριληφθεί και η βαθμολογία για δυαδικά κατάσταση έχει τα όριά της. Έχουμε την πρόθεση να ενημερώσετε τη βάση δεδομένων με στοιχεία για περισσότερα είδη θηλαστικών και των προϋποθέσεων της μήτρας από: α) καλώντας τους συναδέλφους τους επιστήμονες για να φορτώσετε τα δεδομένα, και β) τις δικές μας προσπάθειες ακόλουθη πρόσθετη χρηματοδότηση. Είμαστε, επίσης, σχεδιάζει να βελτιώσει το σύστημα βαθμολόγησης με πολλούς τρόπους: α) ανάθεση διαφορετικό βάρος με βάση τον αριθμό των δειγμάτων, υβριδισμών και πειράματα επικύρωσης? β) ενσωματώνει συναίνεση σχετικά με την κατάσταση της διαφορικής έκφρασης μαζί με μεταγραφή /λανθάνουσα κατάσταση? γ) ενδεχομένως, σε συνεργασία με άλλους οργανισμούς, καθορίζει τις μεθόδους για την ενσωμάτωση δεδομένων από άλλα δεδομένα γονιδιακής έκφρασης υψηλής απόδοσης, όπως η NGS και EST, ενώ απορρέουν τη συναίνεση.

Σύνοψη

Η νεοαποκτηθέντα MGEx-UDB έχει ως στόχο να ενισχύσει πολλαπλούς τύπους των προσπαθειών από τους βιολόγους που εργάζονται στον ιστό της μήτρας. Οι σημαντικές εφαρμογές /λειτουργίες αυτής της βάσης δεδομένων είναι η ακόλουθη. Α) Περιλαμβάνει ένα μεγάλο ποσό από το χέρι τα συγκεντρωμένα στοιχεία έκφρασης γονιδίου που αντιστοιχεί σε μήτρα από διάφορες εκθέσεις και βάσεις δεδομένων. Β) Παρέχει ένας κατάλογος των συν-εκφρασμένων γονιδίων σε διάφορα φυσιολογικά και μη φυσιολογικές συνθήκες της μήτρας. Γ) Παρέχει μια «βαθμολογία αξιοπιστίας» για να δείξει την έκταση της συμφωνίας ή αντιφάσεις της κατάστασης έκφρασης σε όλη μικροσυστοιχιών και πρωτεομική μελέτες που αφορούν σε ένα συγκεκριμένο /-κυτταρικό τύπο όρο, για κάθε γονίδιο. Δ) Επίσης, χρησιμοποιεί δεδομένα αλληλουχίας σε διάφορους ιστούς της μήτρας /συνθήκες που υποδεικνύουν την κατάσταση έκφρασης του κάθε γονιδίου. Ε) Μπορεί να ερωτηθούν με φυσιολογική ή οποιαδήποτε από τις παθολογικές καταστάσεις σε μήτρα, καθώς επίσης και τα γονίδια, του ποντικού, αρουραίου και ανθρώπινο είδος. ΣΤ) Εκτός από την κατάσταση της έκφρασης, μαζί με τα αποτελέσματα της αξιοπιστίας για πολλαπλές συνθήκες της μήτρας, η βάση δεδομένων παρέχει εύκολη πρόσβαση σε άλλες σημαντικές βασικές λεπτομέρειες όπως οι αλληλουχίες των γονιδίων, πρωτεϊνών και μεταγραφές, GO σχολιασμούς, τις αλληλεπιδράσεις μεταξύ πρωτεϊνών και τις σχετικές αναφορές . G) Επιτρέπει την εκτέλεση ακολουθία και λειτουργικές αναλύσεις των παράγωγων συν-εκφράζεται σύνολα συστάδων. Η) Κάθε γονίδιο είναι επίσης παραπέμπει σε άλλους χρήσιμους πόρους της βιοπληροφορικής. Ι) Παρέχει εύκολη πρόσβαση στον συγκεντρωτικό κατάλογο των αναφορών των καταλόγων γονιδίου που αντιστοιχεί σε διάφορες μήτρας συνθήκες, χρήσιμο για διάφορες προσεγγίσεις μετα-ανάλυση. Όλα αυτά τα χαρακτηριστικά είναι πιθανό να καταλύουν την διαδικασία της μεταγραφής καταλογογράφηση, και διάφορα άλλα που σχετίζονται με τη μήτρα ερευνητικές προσπάθειες.

Ο αριθμός αντιπροσωπεύει τη συλλογή δεδομένων (πάνω μέρος), η αρχιτεκτονική (κεντρικό τμήμα) και λειτουργία (κάτω τμήμα) της η βάση δεδομένων.

η

Υλικά και Μέθοδοι

δεδομένα συλλογή

Μια στρατηγική αναζήτησης σχεδιάστηκε προσεκτικά για να συλλέξει τα σχετικά άρθρα που αναφέρονται στη βιβλιογραφία, (αναλυτική διαδικασία μπορεί να βρεθεί σε https://dx.doi.org/10.1038/npre.2011.2101.3). Εν συντομία, αυτό που εμπλέκονται εντοπισμό συνδυασμούς των όρων ερωτήματος /φράσεις για κάθε εργαλείο αναζήτησης, την απόκτηση των αναφορών με τη χρήση πολλαπλών εργαλείων και, στη συνέχεια, την κατάρτιση των επισκέψεων σε ένα μη-περιττές κατάλογο της Ευρωπαϊκής Ένωσης με τη χρήση του εργαλείου Citation-Compiler (https://www.shodhaka.com /μεταγλωττιστής). Ένα παράδειγμα των ολοκληρωμένη στρατηγική έρευνας και αναζήτησης σύνολα μπορούν να βρεθούν στην ενότητα Συχνές ερωτήσεις της βάσης δεδομένων. Ο στόχος ήταν η συλλογή αναφορών που σχετίζονται με την έκφραση του γονιδίου μαζική κλίμακα στη μήτρα ιστού. Μια αρχική διαλογή των άρθρων έγινε για να ελέγξει τη συνάφεια, από την ανάγνωση των περιλήψεων. Τα άρθρα που έχουν αναγνωριστεί ως σχετικές είχαν στη συνέχεια έψαξαν για τη λίστα των γονιδίων αναφερθεί ότι εκφράζεται, ρυθμίζεται προς τα πάνω, προς τα κάτω-ρυθμίζονται, κλπ από ενδελεχή πλήρη ανάγνωση του κειμένου. λίστες γονίδιο από αυτές τις σχετικά άρθρα συλλέχθηκαν από χειρόγραφο, συμπληρωματικές σημειώσεις ή στην ιστοσελίδα των δημιουργών. Σημαντικές αποθετήρια όπως το GEO [18] και ArrayExpress [19], και άλλα αποθετήρια όπως Oncomine [25], του Στάνφορντ Microarray Database (SMD) [26], το Κέντρο για τη βάση δεδομένων πληροφοριών γονίδιο Βιολογίας έκφρασης (CIBEX) [27], caArray (https://array.nci.nih.gov/caarray), GEMMA (https://www.chibi.ubc.ca/Gemma/) και δημόσια έκφραση Profiling Δυναμικού (PEPR) [28] επίσης, έψαξε για το μεγάλο δεδομένα γονιδιακής έκφρασης κλίμακα αφορούν μήτρα ιστό θηλαστικού. Επεξεργασμένα δεδομένα συλλέχθηκαν, όπου είναι διαθέσιμα, όπως η μέθοδος βαθμολόγησης απαιτεί μόνο την τελική κλήση για το παρόν /απούσα κατάσταση των γονιδίων. Αν δεν υπήρχε επεξεργασία των δεδομένων, τα ανεπεξέργαστα δεδομένα έγινε λήψη και επεξεργασία με τη χρήση κατάλληλων πρότυπων μεθόδων, όπως συνιστάται στα πακέτα Bioconductor (https://www.bioconductor.org).

Μαζί με τον κατάλογο γονιδίων, που σχετίζονται πληροφορίες όπως ως την κατάσταση έκφρασης, το είδος, ιστών και υπο-ιστό ή κυτταρική γραμμή, τύπου κυττάρου, και των αντίστοιχων φυσιολογικών ή πειραματικές συνθήκες συλλέχθηκαν από τις δημοσιεύσεις ή αποθετήρια. Αυτό το σύνολο των βασικών παραμέτρων είναι πλέον αναφέρεται ως «κατάσταση έκφρασης υπό συγκεκριμένες τοποθεσία και την κατάσταση» (ESLC). Οι «όροι» περιλαμβάνουν φυσιολογική κατάσταση, ασθένειες, ενδομητρίου κύκλους, την κύηση, η θεραπεία με ορμόνες και /ή άλλες χημικές ουσίες, κλπ ελεγχόμενο λεξιλόγιο ορίστηκε για κάθε κατάσταση, να διατηρήσει την ομοιομορφία και να αντλούν τη συναίνεση σε όλη παρόμοιες μελέτες. Το Σχήμα 5 απεικονίζει την ιεραρχία μιας κατάστασης και υπο-συνθήκες πολλαπλών επιπέδων. Άλλες πληροφορίες που συλλέγονται σχετικά με τους καταλόγους του γονιδίου που περιλαμβάνονται στον αριθμό των δειγμάτων, η ηλικία των ατόμων, ο αριθμός των RNA απομονώσεις και υβριδισμούς, καθώς και τις λεπτομέρειες των κύριων καθώς και πειράματα επικύρωσης (παράδειγμα: πλατφόρμα, καθετήρες και στατιστικών μεθόδων). Οι κατάλογοι αυτοί γονίδιο μαζί με το σχολιασμένο πληροφοριών (εφεξής σύνολα δεδομένων) ανέβηκαν στη βάση δεδομένων. Ο ελάχιστος αριθμός των γονιδίων ανά σύνολο δεδομένων ήταν 3, η μέγιστη ήταν 21.609, και ο μέσος όρος ήταν 8554. Κάθε λήμμα διασταυρώθηκαν με τουλάχιστον ένα άλλο ερευνητή και, κατά μέσο όρο 0,7% σφάλματα (π.χ., το όνομα του γονιδίου τσιπ, το είδος του πληθυσμού , χρονική πορεία της θεραπείας) είχαν ανιχνευθεί και διορθωθεί.

Α ‘βαθμολογία αξιοπιστίας »προήλθε για κάθε ESLC του κάθε γονιδίου, χρησιμοποιώντας τις διαδικασίες που περιγράφονται προηγουμένως [15], για να δείξει την έκταση της συμφωνίας ή διαφωνίας μεταξύ συνόλων δεδομένων, που αντιστοιχούν σε ίδιες ή παρόμοιες συνθήκες και τις θέσεις για κάθε είδος. Υψηλότερες βαθμολογίες δείχνουν ότι τα αντίστοιχα γονίδια που αναφέρθηκαν με συνέπεια να μεταγραφεί ή αδρανείς. Γονίδια με χαμηλότερες βαθμολογίες για τις ίδιες /παρόμοιες συνθήκες θα έδειχνε είτε μικρότερο αριθμό των αντίστοιχων μελετών ή παρουσία αντιφατικές αναφορές για το ειδικό καθεστώς έκφραση υπό εξέταση.

δεδομένα αλληλουχίας που σχετίζονται με ιστούς της μήτρας /συνθήκες επίσης καταρτίζονται. Ενώ οι εκθέσεις σχετικά αλληλουχίας RNA συλλέχθηκαν από τη βιβλιογραφία, τα δεδομένα EST λήφθηκε απευθείας από UniGene [29].

Database δημιουργία

Perl με βάση το σενάριο CGI χρησιμοποιήθηκε για να δημιουργήσει μια διεπαφή για την έναρξη των καταλόγων γονιδίου και των σχετικών πληροφοριών. Μια βάση δεδομένων in-house χρησιμοποιήθηκε για να μετατρέψει τα αναγνωριστικά γονίδιο από τα σύνολα δεδομένων σε αναγνωριστικά γονίδιο Entrez. Αυτά τα αναγνωριστικά γονίδιο Εηίτεζ ήταν στην ουρά-up για τη λήψη άλλων πληροφοριών που σχετίζονται με το γονίδιο. LWP μονάδα (https://search.cpan.org/~gaas/libwww-perl-5.836/lib/LWP.pm) χρησιμοποιήθηκε για να συνδεθείτε με NCBI και η απαιτούμενη πληροφορίες κατεβάσει με τη βοήθεια του NCBI E-ωφέλειας (http : //eutils.ncbi.nlm.nih.gov/entrez/query/static/eutils_help.html). Κατεβάσει πληροφορίες που περιλαμβάνει το επίσημο σύμβολο του γονιδίου, τα ψευδώνυμα, γονιδιακή αλληλουχία, περίληψη γονίδιο, χρωμοσωμική τοποθεσία, το δυναμικό αλληλουχία του υποκινητή [-1000 έως 200 bp] και όλες τις ακολουθίες μεταγραφής (μαζί με τα στοιχεία εξονίου-ιντρονίου) που αντιστοιχεί σε κάθε γονίδιο. πληροφορίες που σχετίζονται με πρωτεΐνη κατεβάσει από UniProt (https://www.uniprot.org? [30]). Ομοίως, θέσεις έναρξης της μεταγραφής είχαν κατεβάσει από dbTSS (ftp://ftp.hgc.jp/pub/hgc/db/dbtss/? [31]), έκδοση 7.0. Όταν η πληροφορία δεν ήταν διαθέσιμη σε dbTSS για ένα γονίδιο, το 5 ‘άκρο του αντίστοιχη αλληλουχία γονιδίου NCBI χρησιμοποιήθηκε για να αντιπροσωπεύουν τη θέση TSS. πληροφοριών Gene Ontology έγινε λήψη από την τοποθεσία FTP της βάσης δεδομένων (ftp://ftp.geneontology.org/pub/go/? [32]) και πρωτεϊνών πληροφορίες αλληλεπίδραση κατεβάσει από BioGRID (https://thebiogrid.org /download.php? [33]), έκδοση 3.1. δεδομένων EST είχε κατεβάσει από UniGene (ftp://ftp.ncbi.nih.gov/repository/UniGene? [29]). Perl κώδικες γράφτηκαν για να εξασφαλιστεί η αυτόματη ενσωμάτωση των κατεβάσει τα δεδομένα στη βάση δεδομένων. ClustalW είχε κατεβάσει από https://www.clustal.org/clustal2/και να ενσωματωθούν στη βάση δεδομένων, για να παρέχει δυνατότητα να εκτελέσει την ανάλυση πολλαπλών αλληλουχιών.

Σύστημα Διαχείρισης Βάσεων Δεδομένων MySQL Σχεσιακή (RDBMS) χρησιμοποιείται για την αποθήκευση δεδομένων. Ένας πίνακας είναι αφιερωμένο να αποθηκεύσει τις βασικές πληροφορίες που σχετίζονται με το γονίδιο συμπεριλαμβανομένων των όνομα του γονιδίου, ενεργητική και απομαγνητοφώνηση λεπτομέρειες. Ένας άλλος πίνακας χρησιμοποιείται για την αποθήκευση γονίδιο αναγνωριστικά όπως το όνομα του γονιδίου, την περιγραφή γονίδιο, επίσημο σύμβολο γονίδιο και το αναγνωριστικό γονίδιο NCBI, αναγνωριστικά ανιχνευτή πλατφόρμα μικροσυστοιχιών, κλπ Ξεχωριστές πίνακες διατηρούνται για την αποθήκευση πληροφοριών που σχετίζονται με το είδος, τον τύπο κυττάρων, ιστών, κυτταρική σειρά και τις προϋποθέσεις που συνθέτουν ESLC. Κάθε καταχώρηση σε αυτές τις μη-περιττές τραπέζια είναι tagged με μοναδικό αναγνωριστικό. Τα αποτελέσματα που προκύπτουν από το σύστημα βαθμολόγησης διατηρείται ως επίπεδη βάση δεδομένων αρχείου. Κάθε αρχείο αντιστοιχεί σε μοναδικό ESLC, το οποίο πήρε το όνομά του με τη χρήση στοιχείων από ESLC πίνακες. Η πλήρης αρχιτεκτονική της βάσης δεδομένων και τη λειτουργία αντιπροσωπεύεται σε ένα σχηματικό στο Σχήμα 6.

Ευχαριστίες

Θα θέλαμε να ευχαριστήσουμε Bhaskar Mudhagantgi και Nisha Ann Vishwan για επιμέλεια ορισμένες από τις μελέτες και συμβάλλοντας στην πρωτοβάθμια δεδομένων.

You must be logged into post a comment.