PLoS One: ProKinO: Μια οντολογία για την Ολοκληρωμένη ανάλυση των πρωτεϊνικών κινασών στην Cancer


κινάσες

Αφηρημένο

Ιστορικό

Η πρωτεΐνη είναι μια μεγάλη και ποικίλη οικογένεια ενζύμων που γονιδίωμά μεταβληθεί σε πολλούς ανθρώπινους καρκίνους . Στοχευμένες προσπάθειες αλληλουχίας του γονιδιώματος του καρκίνου έχουν αποκαλυφθεί τα προφίλ μεταλλάξεων των γονιδίων της πρωτεϊνικής κινάσης από πολλούς διαφορετικούς τύπους καρκίνου. Ενώ μεταλλάξεων δεδομένα για πρωτεϊνικών κινασών σήμερα καταχωρήθηκαν στις διάφορες βάσεις δεδομένων, την ολοκλήρωση των δεδομένων μετάλλαξης με άλλες μορφές δεδομένων για πρωτεϊνικών κινασών, όπως η ακολουθία, η δομή, η λειτουργία και η οδός είναι αναγκαία για την αναγνώριση και τον χαρακτηρισμό των βασικών καρκίνο προκαλώντας μεταλλάξεις. Ολοκληρωμένη ανάλυση των δεδομένων της πρωτεϊνικής κινάσης, όμως, είναι μια πρόκληση, λόγω του ετερογενούς χαρακτήρα των πηγών δεδομένων της πρωτεϊνικής κινάσης και μορφές δεδομένων.

Αποτελέσματα

Εδώ, περιγράφουμε ProKinO, μια πρωτεϊνική κινάση ειδικό οντολογία, η οποία παρέχει ένα ελεγχόμενο λεξιλόγιο των όρων, την ιεραρχία τους, και τις σχέσεις ενοποίηση ακολουθίας, τη δομή, τη λειτουργία, η μετάλλαξη και πληροφορίες μονοπάτι για πρωτεϊνικών κινασών. Η εννοιολογική αναπαράσταση αυτών των διαφόρων μορφών των πληροφοριών σε ένα σημείο που δεν επιτρέπει μόνο την ταχεία ανακάλυψη σημαντικών πληροφοριών που σχετίζονται με μια συγκεκριμένη πρωτεϊνική κινάση, αλλά επιτρέπει επίσης ολοκληρωμένη ανάλυση των δεδομένων της πρωτεϊνικής κινάσης μεγάλης κλίμακας με τρόπους που δεν είναι δυνατόν μέσω άλλων κινάσης-συγκεκριμένους πόρους. Έχουμε εκτελέσει αρκετές ενοποιητική αναλύσεις των δεδομένων ProKinO και, ως ένα παράδειγμα, βρέθηκε ότι ένας μεγάλος αριθμός των σωματικών μεταλλάξεων (~288 διακριτές μεταλλάξεις) που συνδέονται με το

αιμοποιητικών νεόπλασμα

τύπος καρκίνου του χάρτη για μόνο 8 κινασών στο ανθρώπινο kinome. Αυτό είναι σε αντίθεση προς

γλοίωμα

, όπου οι μεταλλάξεις κατανεμημένα σε 82 διακριτές κινασών. Πρέπει επίσης να παρέχουν παραδείγματα για το πώς μπορεί να χρησιμοποιηθεί η οντολογία που βασίζεται σε ανάλυση των δεδομένων για τη δημιουργία ελέγξιμες υποθέσεις σχετικά με τις μεταλλάξεις του καρκίνου.

Συμπέρασμα

Σας παρουσιάζουμε ένα ολοκληρωμένο πλαίσιο για μεγάλης κλίμακας ολοκληρωμένη ανάλυση των δεδομένων της πρωτεϊνικής κινάσης . Πλοήγησης και ανάλυση των στοιχείων της οντολογίας μπορεί να εκτελεστεί χρησιμοποιώντας τις διαθέσιμες το πρόγραμμα περιήγησης οντολογία στη διεύθυνση:. https://vulcan.cs.uga.edu/prokino

Παράθεση: Gosal G, Kochut KJ, Kannan Ν (2011) ProKinO : Μια οντολογία για την Ολοκληρωμένη ανάλυση των πρωτεϊνικών κινασών στον Καρκίνο. PLoS ONE 6 (12): e28782. doi: 10.1371 /journal.pone.0028782

Επιμέλεια: Fazlul H. Sarkar, Wayne State University School of Medicine, Ηνωμένες Πολιτείες της Αμερικής

Ελήφθη: 27 Ιουλίου, 2011? Αποδεκτές: 15 Νοέμβριος, 2011? Δημοσιεύθηκε: 14 Δεκεμβρίου, 2011

Copyright: © 2011 Gosal et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Χρηματοδότηση το έργο αυτό προβλέπεται από την αμερικανική Εταιρεία Καρκίνου (RSG-10-188-01-ΤΒΕ) και του Συνασπισμού της Γεωργίας τον Καρκίνο (GCC). Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

Ο καρκίνος προκαλείται από τη συσσώρευση μεταλλάξεων, συχνά σε ένα υποσύνολο των γονιδίων που προσδίδουν την επιβίωση και ανάπτυξη πλεονέκτημα. Η οικογένεια γονιδίων της πρωτεϊνικής κινάσης, η οποία ελέγχει βασικά μονοπάτια σηματοδότησης που σχετίζεται με την κυτταρική ανάπτυξη και την επιβίωση, είναι ένα από τα πιο υπερεκπροσωπούνται οικογενειών των ογκογονιδίων [1]. Στοχευμένη αλληλούχιση του 518 εξώνια κινάσης πρωτεΐνης που κωδικοποιείται στο ανθρώπινο γονιδίωμα (συλλογικά ονομάζεται kinome) έχει αποκαλύψει εκατοντάδες μεταλλάξεις στην περιοχή της κινάσης πρωτεΐνης [2]. Παρά το γεγονός ότι αυτές οι μεταλλάξεις είναι σήμερα καταχωρήθηκαν στις διάφορες βάσεις δεδομένων [3], [4], [5], την ταυτοποίηση και πειραματικό χαρακτηρισμό των βασικών μεταλλάξεων που προκαλούν καρκίνο είναι απαραίτητη για την ανάπτυξη νέων θεραπειών για τον καρκίνο.

Πειραματικό χαρακτηρισμός του καρκίνου μεταλλάξεις, όμως, προϋποθέτει ότι ένα διατυπώσει πρώτα τις σωστές υποθέσεις βασίζονται στην ανάλυση των υφιστάμενων δεδομένων. Ειδικότερα, η ανάλυση των δεδομένων μετάλλαξης υπό το φως των άλλων μορφών διαθέσιμων στοιχείων σχετικά με πρωτεϊνικών κινασών, όπως η ακολουθία, η δομή, η λειτουργία και η οδός είναι αναγκαία για την ανάπτυξη και τη δοκιμή νέων υποθέσεων όσον αφορά τη λειτουργική επίπτωση του καρκίνου μεταλλάξεων [6], [7], [8], [9]. Ολοκληρωμένη ανάλυση των δεδομένων της πρωτεϊνικής κινάσης, όμως, είναι μια πρόκληση, λόγω του ετερογενούς χαρακτήρα των πηγών δεδομένων της πρωτεϊνικής κινάσης και μορφές. Για παράδειγμα, ένας ερευνητής ενδιαφέρεται για τη διαρθρωτική θέση της μετάλλαξης του καρκίνου ή της διανομής των μεταλλάξεων κινάσης σε διάφορους τύπους καρκίνου, πρέπει να περάσει από τη χρονοβόρα και επιρρεπής σε λάθη διαδικασία συλλογής και ανάλυσης των δεδομένων από διαφορετικές πηγές, συχνά σε διαφορετικά δεδομένα μορφές. Παρά το γεγονός ότι αρκετές πηγές κινάσης ειδικά όπως KinBase [10], KING [11], PKR [12] και KinMutBase [4] έχουν αναπτυχθεί, οι πόροι αυτοί επικεντρώνονται σε μεγάλο βαθμό από ένα ή λίγα είδη, των δεδομένων της πρωτεϊνικής κινάσης (π.χ., ακολουθία , τη δομή, ή μετάλλαξη), αφήνοντας κατά μέρος την πρόκληση της ενοποίησης δεδομένων.

οι οντολογίες [13] έχουν αναδειχθεί ως ένα ισχυρό εργαλείο για την ολοκληρωμένη και ποσοτικής ανάλυσης βιολογικών δεδομένων [14], [15], [16] , [17]. Με τη σύλληψη της γνώσης τομέα, με τη μορφή των εννοιών (τάξεις) και τις σχέσεις, οντολογίες παρέχουν ένα εννοιολογικό αναπαράσταση των δεδομένων με έναν τρόπο που οι υπολογιστές μπορούν να διαβάσουν και οι άνθρωποι μπορούν να καταλάβουν. Για παράδειγμα, για ένα αυτοματοποιημένο και ενημέρωσε απάντηση στο ερώτημα «κινάση μεταλλάξεων που σχετίζονται με τους τύπους καρκίνου», ο υπολογιστής πρέπει να καταλάβει τις έννοιες, «μεταλλάξεις της κινάσης» και «τύπους καρκίνου», καθώς και τις σχέσεις μεταξύ των εννοιών, δηλαδή, «

που σχετίζονται με «

. Είναι αυτή η εννοιολογική αναπαράσταση της γνώσης που διακρίνει οντολογίες από σχεσιακές βάσεις δεδομένων, και επιτρέπει την αποτελεσματική ολοκλήρωση και την εξόρυξη των συνόλων διαφορετικών στοιχείων [18]. Πράγματι, πολλές οντολογίες έχουν αναπτυχθεί για να συλλάβει και να εξορύξουν τον πλούτο των πληροφοριών σχετικά με τα γονίδια (GO) [19], ακολουθία [20], μονοπάτια (https://rgd.mcw.edu/tools/ontology/ont_search.cgi

)

, τροποποίηση πρωτεϊνών [21] και άλλοι [20], [22]. Εστιασμένη οντολογίες σε επιλεγμένες οικογένειες πρωτεϊνών όπως η οικογένεια φωσφατάση πρωτεΐνης και η οικογένειά του μεταφορέα έχουν επίσης αναπτυχθεί [23]. Ωστόσο, μέχρι τώρα, μια εστιασμένη οντολογία καταγραφή της κατάστασης της γνώσης για την οικογένεια της πρωτεϊνικής κινάσης δεν έχει αναφερθεί.

Εδώ, αναφέρουμε την πρωτεϊνική κινάση Οντολογία (ProKinO). ProKinO παρέχει ένα ελεγχόμενο λεξιλόγιο των όρων και των σχέσεων που συνδέουν αλληλουχία, δομή, λειτουργία, μονοπάτι, και τα δεδομένα σχετικά με μετάλλαξη πρωτεϊνικών κινασών. ProKinO κωδικοποιείται χρησιμοποιώντας το Web Ontology Language (OWL) (https://www.w3.org/TR/owl-ref/), μια γλώσσα οντολογίας συγγραφής συνιστάται από το World Wide Web Consortium (http: //www.w3. org /). Η ολοκλήρωση διαφόρων συνόλων δεδομένων σε αναγνώσιμη από μηχάνημα μορφή επιτρέπει όχι μόνο την πλοήγηση των διαφόρων μορφών δεδομένων πρωτεϊνικής κινάσης σε ένα μέρος, αλλά επιτρέπει επίσης συνολικά ερωτήματα σχετικά με τα υπάρχοντα δεδομένα με τρόπους που δεν είναι δυνατόν μέσω των υφιστάμενων πόρων της κινάσης-ειδική. Για παράδειγμα, η συνολική ερωτήματα όπως «κατηγορίες κινασών που σχετίζονται με τον τύπο του καρκίνου» ή «μετράει μεταλλάξεων του καρκίνου που βρίσκονται σε διάφορα κινάσης υπο-τομείς» μπορεί να πραγματοποιηθεί εύκολα χρησιμοποιώντας ProKinO και τη γλώσσα SPARQL ερώτημα οντολογίας (http: //www.w3 .org /TR /RDF-SPARQL-ερώτημα /). Περιγράφουμε τη σημασία αυτών των ερωτημάτων σε ανακάλυψη της γνώσης και της δημιουργίας υποθέσεων. Ένα συσσωμάτωμα ερωτήματος «μετράει μεταλλάξεων κινάσης σε διάφορους τύπους καρκίνου», για παράδειγμα, αποκάλυψε ότι οι μεταλλάξεις που συνδέονται με

αιμοποιητικών νεόπλασμα

(288 διακριτές μεταλλάξεις) στοχεύουν κυρίως μόνο 8 κινασών στο ανθρώπινο kinome, σε σύγκριση με

γλοίωμα

, όπου οι μεταλλάξεις κατανεμημένα σε 82 διακριτές κινασών. Ομοίως, ερωτήματα όπως «μεταλλάξεις στόχευσης λειτουργικά χαρακτηριστικά κινάσης» μπορεί να χρησιμοποιηθεί για να δημιουργήσει νέες υποθέσεις σχετικά με την δομική και λειτουργική επίπτωση των μεταλλάξεων του καρκίνου. Περιγράφουμε επίσης ένα πρόγραμμα περιήγησης που επιτρέπει την ταχεία πλοήγηση και την εξέταση των δεδομένων ProKinO, προσβάσιμο στο:. https://vulcan.cs.uga.edu/prokino

Μέθοδοι

ProKinO Οργάνωσης Γνώσης

Για να αντιληφθούμε τον πλούτο της γνώσης σχετικά με ακολουθία της πρωτεϊνικής κινάσης, τη δομή, τη λειτουργία, τις οδούς και τις ασθένειες, έχουμε εισαγάγει αρκετές βασικές έννοιες (κατηγορίες) και τις σχέσεις (ιδιότητες του αντικειμένου) σε ProKinO. Αυτές οι κατηγορίες, οργανώνονται σε μια ιεραρχική τρόπο, καθώς και τις σχέσεις μεταξύ αυτών των κατηγοριών, εκφράζουν και περιγράφουν τη γνώση της πρωτεϊνικής κινάσης με τρόπο ανάλογο με έναν ειδικό τομέα.

Για παράδειγμα, ένας εμπειρογνώμονας κινάσης περιγράφει μια συγκεκριμένη μετάλλαξη θα περιγράψει το μετάλλαξη στο πλαίσιο του γονιδίου στην οποία βρίσκεται η μετάλλαξη, η κινάση που κωδικοποιείται από το γονίδιο, την ομάδα ή την οικογένειά η κινάση ανήκει, υπο-πεδίο κινάσης η μετάλλαξη βρίσκεται στην, και τα μονοπάτια στα οποία το μεταλλαγμένο γονίδιο συμμετέχει . Το σχήμα ProKinO έχει σχεδιαστεί για να συλλάβει και να ενσωματωθούν γνώσεις κινάσης πρωτεΐνης χρησιμοποιώντας τους όρους και τις σχέσεις παρόμοιες με αυτές που χρησιμοποιούνται συνήθως από έναν ειδικό (Σχήμα 1). Για παράδειγμα, η σχέση μεταξύ του «Gene» και τάξεις «Μετάλλαξη» περιγράφεται από το «

hasMutation»

ιδιοκτησίας (Σχήμα 1), ενώ το «

Locatedin»

ιδιοκτησίας συλλαμβάνει τη σχέση μεταξύ η «μετάλλαξη» και τάξεις «υποτομέα». Παρομοίως, η αλληλουχία ανήκει μία κινάση για αντιπροσωπεύεται από το «

hasSequence»

ιδιότητα μεταξύ του «Gene» και «Sequence» τάξεις, και τα υπο-τομείς που σχετίζονται με μία συγκεκριμένη ακολουθία αντιληπτές από το «

hasSubDomain «

σχέση (Σχήμα 1). Οι πληροφορίες οδός και η αντίδραση που σχετίζονται με κινάσες οποίο γίνονται αντιληπτές από το «

participatesIn»

σχέση μεταξύ «Gene» και «Pathway», και «

hasReaction»

μεταξύ «Pathway» και «αντίδρασης». Να διασχίσουν τα δεδομένα ProKinO αναφορά σε εξωτερικές βάσεις δεδομένων και πηγές, η κατηγορία «DbXref» και «

hasDbXref»

σχέση έχουν εισαχθεί (βλέπε Εικόνα 1).

Το σχήμα δείχνει έννοιες (κατηγορίες) διοργάνωσε σε μια ιεραρχία τάξη υπο-τάξη (εμφανίζονται ως οβάλ). Οι σχέσεις (ιδιότητες του αντικειμένου) μεταξύ των τάξεων εμφανίζεται ως κόκκινο χρώμα γραμμές. Οι εσωτερικές ιδιαιτερότητες (ιδιότητες δεδομένα) των κατηγοριών εμφανίζεται ως καφέ χρώματος γραμμές. Οι περιπτώσεις των τάξεων εμφανίζονται ως ορθογώνια. Η πλήρης οντολογία σχήμα μπορεί να προσεγγιστεί από την ιστοσελίδα ProKinO, και επίσης παρέχονται ως Σχήμα S1.

Η

Το σκεπτικό πίσω από την αναπαράσταση δεδομένων πρωτεϊνικής κινάσης στο παραπάνω περιγραφόμενο τρόπο είναι ότι παρέχει το πλαίσιο για την ερμηνεία των δεδομένων μετάλλαξης . Αυτό μπορεί να απεικονιστεί χρησιμοποιώντας την παρερμηνεύσιμη μετάλλαξη

p.L858M

στο

EGFR

(Σχήμα 1).

p.L858M

είναι μια μετάλλαξη στο

EGFR

κινάσης που έχει τον τύπο «εσφαλμένου νοήματος». Η μετάλλαξη εμπλέκεται στον καρκίνο

καρκίνωμα και βρίσκεται στην υπο-περιοχή VII, το οποίο αντιστοιχεί στο Ν-άκρο του τμήματος ενεργοποίησης (συμβολίζεται ως

Ενεργοποίηση-Segment-ΝΤ

στο Σχήμα 1) . Η πρωτεΐνη που κωδικοποιείται από το

EGFR

γονίδιο συμμετέχει σε μια οδό

σηματοδότηση από EGFR

, η οποία περιλαμβάνει

EGFR διμερισμό

ως μία από τις αντιδράσεις της. Άλλες κατηγορίες και υπο-κατηγορίες είναι επίσης συνδεδεμένη με τη μετάλλαξη

p.L858M

μέσω των σχέσεων που περιγράφονται στο Σχήμα 1, παρέχοντας μια ολοκληρωμένη άποψη όλων των στοιχείων που θα πρέπει να υποχρεούνται να παρέχουν δομική και λειτουργική πλαίσιο για το

σ. L858M

μετάλλαξη.

Εκτός από τις κύριες κατηγορίες και ιδιότητες του αντικειμένου που περιγράφεται παραπάνω, αρκετές επιπλέον υπο-κατηγορίες και ιδιότητες αντικειμένου έχουν οριστεί σε ProKinO να συλλάβει και να αντιπροσωπεύουν τις διαθέσιμες γνώσεις σχετικά με ακολουθία πρωτεϊνική κινάση πλήρως, δομή, τη λειτουργία και την ασθένεια. Για παράδειγμα, οι υπο-κατηγορίες της κατηγορίας «Μετάλλαξη» – «ComplexMutation», «DeletionMutation», «InsertionMutation», «SubstitutionMutation» και «OtherMutation» – καταγραφή πληροφοριών σχετικά με τα είδη των μεταλλάξεων που προσδιορίζονται στο κινάσες. Ομοίως, οι τρεις υπο-κατηγορίες κάτω από την κατηγορία «FunctionalFeature» – «ModifiedResidue», «TopologicalDomain», «SignalPeptide» – συλλάβει πληροφορίες για τα συγκεκριμένα λειτουργικά χαρακτηριστικά. Αυτή η ιεραρχική οργάνωση των κλάσεων σε ProKinO φαίνεται στο Σχήμα 1.

Εκτός από τις ιδιότητες του αντικειμένου, έχουν βασικές ιδιότητες δεδομένα έχουν εισαχθεί για να περιγράψει την εσωτερική οργάνωση των εννοιών και να διευκολύνεται η εξόρυξη δεδομένων και την εξόρυξη. Για παράδειγμα, η ιδιότητα των δεδομένων, «

hasOtherName»

, αποθηκεύει τα άλλα ονόματα με τα οποία ένα γονίδιο μπορεί να είναι γνωστή στη βιβλιογραφία (συνώνυμα). Για παράδειγμα,

EGFR

είναι επίσης αναφέρεται ως

ΕΟΡΡνΙΙΙ

,

ErbB1

,

ERBB

, ή

Mena

στη βιβλιογραφία. Συμπεριλαμβάνοντας το «

hasOtherName»

ιδιοκτησίας των δεδομένων, όλες τις πληροφορίες που είναι σχετικές με

EGFR

μπορεί να ληφθεί ανεξάρτητα από το ποιο όνομα γονίδιο χρησιμοποιείται ως ερώτημα.

Με ένα μεγάλο σύνολο των κλάσεων και ιδιοτήτων που σχετίζονται με κινάσες στη σχεδιαστεί σχήμα (ανατρέξτε στην Εικόνα S1 για το πλήρες σχήμα), ProKinO, αντιπροσωπεύει μια σαφή σύλληψη και οργάνωση της γνώσης για την ανθρώπινη πρωτεϊνικών κινασών. ProKinO περιέχει σήμερα 351 μαθήματα, 25 ιδιότητες του αντικειμένου και 27 ακίνητα δεδομένων (Πίνακες S1, S2 και S3 για την πλήρη λίστα) τη λήψη πληροφοριών σχετικά με ακολουθία της πρωτεϊνικής κινάσης, τη δομή, τη λειτουργία, οδός και την ασθένεια.

ProKinO Πληθυσμός

ProKinO έχει συμπληρωθεί με στοιχεία από πηγές δεδομένων που είναι καλά επιμέλεια και να συντηρούνται. Η εξαγορασθείσα δεδομένα έχουν αποθηκευτεί ως παρουσίες στο σχήμα που περιγράφεται παραπάνω (Σχήμα 1).

απόκτηση και αποθήκευση των δεδομένων

Ακολουθία.

Τα δεδομένα που αφορούν ακολουθία της πρωτεϊνικής κινάσης και ταξινόμησης έχουν έχουν ληφθεί από KinBase [10], το αποθετήριο για την ακολουθία κινάση και την ταξινόμηση. Τα 538 γονίδια κινάσης που προσδιορίζονται στο ανθρώπινο γονιδίωμα έχουν ταξινομηθεί σε μεγάλες ομάδες και τις οικογένειες με βάση την ομοιότητα αλληλουχίας εντός του τομέα κινάσης. Δεδομένου ότι η ταξινόμηση KinBase είναι ευρέως αποδεκτή από την κοινότητα κινάσης, έχουμε υιοθετήσει το ίδιο σύστημα ταξινόμησης σε ProKinO. Η αυτόματη διαδικασία απόκτησης δεδομένων και του πληθυσμού από KinBase περιλαμβάνει την εξαγωγή, την ενσωμάτωση και τον πληθυσμό των πληροφοριών από 538 ανθρώπινα πρωτεϊνικών κινασών και την ταξινόμησή τους σε διάφορες ομάδες, οικογένειες και υπο-οικογένειες. Πληροφορίες σχετικά με τα ονόματα γονιδίων, συνώνυμα και χρωμοσωμική θέση λαμβάνεται επίσης από KinBase. Η γνώση που αποκτάται κατοικείται ως τις περιπτώσεις της κατηγορίας «ProteinKinaseDomain», η οποία περαιτέρω κατηγοριοποιούνται σε ομάδες, οικογένειες, και υπο-οικογένειες όπως υποκατηγορίες. Περαιτέρω, τα δεδομένα της αλληλουχίας των γονιδίων κινάσης πρωτεΐνης σε μορφή FASTA έχει εξαχθεί και κατοικείται ως παραδείγματα της κατηγορίας «Ακολουθία».

Function.

Πληροφορίες για λειτουργικές περιοχές και λειτουργικά χαρακτηριστικά που σχετίζονται με την κινάση οι τομείς που έχουν ληφθεί από UniProt [24], σε επιμέλεια των πόρων για την πρωτεΐνη λειτουργικές πληροφορίες. Πληροφορίες σχετικά με τα ρυθμιστικά πεδία που σχετίζονται με πεδία κινάσης, κρυσταλλικές δομές λυθεί για κάθε κινάση, ισόμορφα που αναγνωρίζονται για κινάσες, τροποποιημένο υπόλειμμα, πεπτίδιο-σηματοδότη, τοπολογική περιοχή, κυτταρική τοποθεσία και η ειδικότητα ιστού λαμβάνεται επίσης από UniProt. Οι λειτουργικές περιοχές που σχετίζονται με πρωτεϊνικές κινάσες που κατοικείται ως παραδείγματα της κατηγορίας «FunctionalDomain», και διασταυρώνονται με Pfam [25], μια βάση δεδομένων οικογένεια πρωτεϊνών, μέσω της κατηγορίας «DBxRef». Ομοίως, οι πληροφορίες σχετικά με κρυσταλλικές δομές κατοικείται ως παραδείγματα της κατηγορίας «Δομή», με παραπομπές στην Τράπεζα Δεδομένων Πρωτεϊνών (ΠΠ) [26]. Λειτουργικές πληροφορίες χαρακτηριστικό αποθηκεύεται ως παραδείγματα στην κατηγορία «FunctionalFeature», με υπο-κατηγορίες ανάλογα με το είδος του χαρακτηριστικό, όπως «ModifiedResidue», «TopologicalDomain» και «SignalPeptide».

Νόσων.

Αν και οι πρωτεϊνικές κινάσες έχουν συσχετιστεί με πολλές ανθρώπινες ασθένειες, η τρέχουσα έκδοση του ProKinO επικεντρώνεται κυρίως για τον καρκίνο. Πληροφορίες για μεταλλάξεις του καρκίνου λαμβάνεται από τις κοσμικές [3], το οποίο είναι ένα από τα παλαιότερα και επιμέλεια πόροι για την αποθήκευση πληροφοριών σχετικά με σωματικά αποκτώνται μεταλλάξεων που σχετίζονται με ανθρώπινους καρκίνους. Εκτός από τις μεταλλάξεις, άλλες πληροφορίες, όπως πρωτογενείς θέσεις, πρωτοβάθμια ιστολογία, δείγματα, περιγραφή και άλλα σχετικά χαρακτηριστικά έχουν επίσης ληφθεί και αποθηκεύονται ως περιπτώσεις στην κατηγορία «μετάλλαξη». Η κατηγορία «μετάλλαξη» εξειδικεύεται περαιτέρω σε υποκατηγορίες με βάση τον τύπο της μετάλλαξης, δηλαδή, συγκρότημα, εξάλειψη, ένθεση, υποκατάσταση και άλλες. Οι αναφορές στο PubMed, MEDLINE και κοσμικές βάσεις δεδομένων που παρέχονται στην κατηγορία «DbXref».

Διαδρομή.

δεδομένα Διαδρομή λαμβάνεται από Reactome, χειροκίνητα επιμέλεια και κριτές των πόρων οδού [27] . Οι οδοί και η αντίδραση αποθηκεύονται ως περιπτώσεις στην κατηγορία «BiochemicalEvent». Για λόγους σαφήνειας, έχουμε υιοθετήσει τους ίδιους όρους /έννοιες που χρησιμοποιούνται στις Reactome να εκπροσωπεί οδό πληροφορίες. «BiochemicalEvent» είναι μια έννοια που χρησιμοποιείται και στις δύο Reactome και ProKinO να εκπροσωπεί βιολογικές διεργασίες που μετατρέπουν οντότητες είσοδο σε φορείς εξόδου. «Διαδρομή» και «αντίδραση» είναι υπο-κατηγορίες κάτω «BiochemicalEvent» (Εικόνα 1). Για παράδειγμα,

σηματοδότηση από EGFR

αποτελεί παράδειγμα στην κατηγορία «Pathway», η οποία σχετίζεται με την κατηγορία «αντίδραση» από το «

hasReaction»

ιδιότητα (Σχήμα 1). Η κατηγορία «αντίδραση» έχει πολλές αντιδράσεις για μια δεδομένη οδό.

EGFR διμερισμό

είναι μία από τις αντιδράσεις στο

Σηματοδότηση με EGFR

οδού (Σχήμα 1). Αυτή η αντίδραση «

καταναλώνει»

ένα συγκρότημα με όνομα

ΕΤΠ: EGFR [πλασματική μεμβράνη]

, και «

παράγει»

μια σύνθετη,

ΕΤΠ: EGFR διμερές [πλάσματος μεμβράνη]

. Και τα δύο συγκροτήματα αποθηκεύονται ως μέλη της «Συγκρότημα» κατηγορία.

κινάσης Sub-domains.

Για να παρέχουν δομική πλαίσιο για μεταλλάξεις του καρκίνου, έχουμε ενσωματώσει τις πληροφορίες υπο-τομέα σε ProKinO. Υπο-πεδία αντιστοιχούν στις βασικές συντηρημένα μοτίβα /δομικά στοιχεία που καθορίζουν την καταλυτική περιοχή της κινάσης [28]. Ο συμβολισμός υπο-τομέα χρησιμοποιείται ευρέως για να περιγράψει τη δομική οργάνωση των μοτίβων και ρυθμιστικά τμήματα που απαρτίζουν την καταλυτική περιοχή. Επί του παρόντος, οι πληροφορίες υπο-τομέα για τα ανθρώπινα κινασών δεν είναι διαθέσιμο από οποιοδήποτε δημόσιο πόρο. Ο πόρος πρωτεϊνική κινάση (PKR) παρέχει πληροφορίες υποτομέα σε κάποιες (18 κινάσες), αλλά όχι σε όλες τις κινάσες. Για την καταγραφή των πληροφοριών υπο-τομέα σε ProKinO, έχουμε χρησιμοποιήσει ένα μοτίβο μοντέλο, το οποίο συλλαμβάνει κλειδί μοτίβα που αντιστοιχούν σε κάθε ένα από XII υπο-τομείς στην περιοχή κινάσης [6], [29]. Το μοντέλο μοτίβο λειτούργησε εναντίον όλων UniProt και κοσμικές ακολουθίες για να προσδιορίσει τη θέση έναρξης και λήξης των επιμέρους τομέων σε ακολουθίες. Οι θέσεις έναρξης και λήξης των sub-domains έχουν αποθηκευτεί σε ProKinO ως περιπτώσεις στην κατηγορία «subdomain». Επειδή τα όρια υπο-τομέα είναι δύσκολο να οριοθετηθούν για αποκλίνουσες πρωτεϊνικές κινάσες, όπως οι κινάσες άτυπα, η τάξη υπο-τομέα δεν συμπληρώνεται για όλες τις πρωτεϊνικές κινάσες.

Αυτοματοποίηση απόκτησης δεδομένων και ενημερώσεις

Έχουμε δημιουργήσει ένα εξειδικευμένο λογισμικό σύστημα για να συμπληρώσετε αυτόματα ProKinO από τις ανωτέρω περιγραφείσες πηγές. Το λογισμικό είναι γραμμένο με τη χρήση της γλώσσας προγραμματισμού Java. Το λογισμικό εκτελεί όλες τις απαιτούμενες λειτουργίες για τη δημιουργία της οντολογίας και αυτόματη πληθυσμού, συμπεριλαμβανομένης της απόκτησης δεδομένων, την ανάλυση και την επεξεργασία, καθώς και τη δημιουργία των περιπτώσεων και οι συνδέσεις μεταξύ τους, χρησιμοποιώντας τις σχέσεις που ορίζονται στο σχήμα ProKinO. Η πυκνοκατοικημένη οντολογία είναι κωδικοποιημένα και εξόδου σε OWL, μια οντολογία συγγραφής και ανταλλαγή γλώσσας συνιστάται από την Κοινοπραξία του Παγκοσμίου Ιστού. Το λογισμικό μας χρησιμοποιεί επίσης Jena, μια ευρέως χρησιμοποιούμενη βασίζονται σε Java Application Programming Interface (API) (https://jena.sourceforge.net/) για την ανάλυση, τη δημιουργία και την αναζήτηση Resource Description Framework (RDF) (http: //www.w3 .org /RDF /

)

και OWL οντολογιών.

Οι οντολογίες, και ως εκ τούτου οποιεσδήποτε εφαρμογές λογισμικού και τους πόρους που χρησιμοποιούν τους, δεσμεύονται να εξελίσσονται με το χρόνο. ProKinO ενσωματώνει γνώσεις από διαφορετικές πηγές χωρίς να τροποποιεί οποιοδήποτε από τα αρχικά δεδομένα. Ως εκ τούτου, οποιεσδήποτε αλλαγές στις πηγές δεδομένων που χρησιμοποιήθηκαν για τη δημιουργία ProKinO απαιτήσει τις αντίστοιχες αλλαγές στην οντολογία να διαβεβαιώσω ότι είναι up-to-ημερομηνία και συνεπής. Οι πηγές των γνώσεων που χρησιμοποιούνται στις ProKinO υπόκεινται σε συχνές τροποποιήσεις και ενημερώνονται σε τακτική βάση. Για παράδειγμα, UniProt ενημερώνεται κάθε τρεις εβδομάδες και COSMIC περίπου κάθε δύο μήνες. Για τη γνώση ενσωματωθεί στην οντολογία να είναι παρούσα και σύμφωνα με τις υπάρχουσες διαθέσιμες στις μητρικές πηγές δεδομένων, ProKinO θα ενημερωθεί με αυτόματη διαδικασία πληθυσμός μας σε τακτική βάση, καθώς και. θα πρέπει να περιλαμβάνονται οι πληροφορίες έκδοσης σχετικά με όλες τις πηγές δεδομένων που χρησιμοποιούνται για τη συμπλήρωση ProKinO, όπως καλά. Για να διασφαλιστεί ότι οι ανάγκες της κοινότητας των χρηστών είναι ικανοποιημένοι, τυχόν απαιτούνται τροποποιήσεις σχήματος και επεκτάσεις θα εισαχθεί σε νέες εκδόσεις ProKinO σε κατάλληλα χρονικά διαστήματα. Όλες οι εκδόσεις του ProKinO θα αρχειοθετηθούν μαζί με τις πληροφορίες σχετικά με τις διαφορές μεταξύ των εκδόσεων. Ο κύκλος ζωής οντολογία θα πρέπει να παρακολουθούνται από ένα σύστημα εκδόσεων [30], και τυχόν προηγούμενες εκδόσεις του ProKinO θα είναι εύκολα προσβάσιμες.

Αποτελέσματα και Συζήτηση

ProKinO Αξιολόγηση

Επειδή η διαδικασία ανάπτυξης οντολογιών είναι δαπανηρή και χρονοβόρα, προσεκτική αξιολόγηση του περιεχομένου οντολογίας είναι απαραίτητο να προσδιορισθεί η καταλληλότητά τους για την εξυπηρέτηση του επιδιωκόμενου σκοπού της ανάπτυξής της. ProKinO έχει αξιολογηθεί για την ακρίβεια και τη χρησιμότητά του. Έχουμε χρησιμοποιήσει δύο προσεγγίσεις για την αξιολόγηση της ακρίβειας του περιεχομένου ProKinO: (i) ένα εγχειρίδιο προσέγγιση στην οποία επιλέγονται τυχαία ένα σύνολο περιπτώσεων και τις σχέσεις μεταξύ τους και διασταυρώνονται με περιεχόμενο από αρχικές πηγές, και (ii) ένα ερώτημα που βασίζεται προσέγγιση στην οποία τα στοιχεία οντολογίας ερωτάται για πληροφορίες που μπορούν εύκολα να διασταυρωθούν επικυρώνονται με στοιχεία από πρωτότυπες πηγές.

εγχειρίδιο προσέγγισης.

στο εγχειρίδιο προσέγγιση, τα σύνολα δοκιμής επιλέχθηκαν για να αξιολογήσει ένα ευρύ κάλυψη του περιεχομένου οντολογίας. Η ακρίβεια των δεδομένων ελέγχθηκε με σταυρό την επικύρωση με τις αρχικές πηγές δεδομένων. Η ενοποίηση των δεδομένων σε ProKinO επίσης επαληθεύεται από την αξιολόγηση των εισήγαγε αντικείμενο και τα δεδομένα ιδιότητες για την ακρίβεια. Για παράδειγμα,

η σχέση του EGFR

κινάσης με μονοπάτια εκπροσωπούνται ως ιδιοκτησία «

partcipatesIn»

επαληθεύτηκε για την ακρίβεια με σταυρό την επικύρωση του περιεχομένου σε ProKinO με τα αρχικά διαθέσιμα σε Reactome δεδομένων. επαλήθευσης μας δεν εντόπισε οποιαδήποτε λάθη στην ProKinO. Οι λεπτομέρειες της αξιολόγησης παρουσιάζονται στον Πίνακα S4.

Προσέγγιση με βάση τα ερωτήματα.

Εκτός από τη χειροκίνητη προσέγγιση, μια προσέγγιση με βάση τα ερωτήματα χρησιμοποιήθηκε για να ελέγξει το περιεχόμενο της οντολογίας. Η γλώσσα του SPARQL query χρησιμοποιήθηκε για την εκτέλεση των ερωτημάτων. Για παράδειγμα, το ερώτημα «καταμέτρηση των κρυσταλλικών δομών για όλες τις πρωτεϊνικές κινάσες» οδήγησε σε 200 χτυπήματα για

Cdk2

(Σχήμα 2). Αυτό το αποτέλεσμα πολλαπλής επικυρωθεί από τον έλεγχο του

Cdk2

«ΠΠ» καταχώρηση στο UniProt. Ομοίως, το ερώτημα «καταμέτρηση των ισομορφών για όλες τις πρωτεϊνικές κινάσες» οδήγησε σε 20 χτυπήματα για

FGFR2

και 19 για

FGFR1

(Σχήμα 3). Αυτό cross-επικυρωθεί από τον έλεγχο για

FGFR1

και

FGFR2

ισομορφή εγγραφές στο UniProt. Ομοίως, «μετράει κινασών που συνδέονται με μονοπάτια» οδήγησε σε 11 μονοπάτια για

SRC

, και 10 για

PKACA

(

PRKACA

στο Reactome). Αυτό το αποτέλεσμα επίσης εγκάρσια επικυρώνονται με την αρχική πηγή, δηλαδή Reactome (Σχήμα 4). Ομοίως, «μετράει κινασών που εμπλέκονται σε διάφορους τύπους καρκίνου» είχε ως αποτέλεσμα την πιο αριθμός των συμπτώσεων για

BRAF

(30 τύπους καρκίνου) (Σχήμα 5), η οποία ήταν cross-επικυρωμένη από την κοσμική βάση δεδομένων.

οι δέκα κινάσες στη φθίνουσα σειρά μετρήσεων εμφανίζονται. Ο Υ-άξονας δείχνει τον αριθμό των δομών λυθεί για κάθε μία από δέκα υπερεκπροσωπούνται κινασών. Δομές λυθεί με αναστολείς συμπεριλήφθηκαν στο συνολικό αριθμό. Χ-άξονας δείχνει τα ονόματα κινάσης. Κινάσης Aurora είναι χαρακτηρισμένη ως AURA. Το ερώτημα SPARQL που χρησιμοποιείται για να δημιουργήσει αυτό το σχήμα μπορούν να προβληθούν και excuted από το πρόγραμμα περιήγησης ProKinO επιλέγοντας «Ερώτημα 1» κάτω από τα «Παράδειγμα ερωτήματα» καρτέλα στην κεντρική σελίδα.

Η

Top 10 κινάσες εμφανίζονται σε φθίνουσα σειρά των τιμών τους. Ο άξονας Υ δείχνει τον αριθμό των επικυρωμένων ισομορφές για καθένα από τα kinass. Το ερώτημα SPARQL που χρησιμοποιείται για να δημιουργήσει αυτό το σχήμα μπορούν να προβληθούν και excuted από το πρόγραμμα περιήγησης ProKinO επιλέγοντας «Ερώτημα 2» κάτω από τα «Παράδειγμα ερωτήματα» καρτέλα στην κεντρική σελίδα.

Η

Top 10 κινάσες με την πιο αριθμός των οδών εμφανίζονται με φθίνουσα σειρά. Το ερώτημα SPARQL για να δημιουργήσει αυτό το σχήμα μπορεί να αντιμετωπισθεί άμεσα και excuted από το πρόγραμμα περιήγησης ProKinO επιλέγοντας «Ερώτημα 3» στο πλαίσιο του «Παράδειγμα ερωτήματα» καρτέλα στην κεντρική σελίδα.

Η

Οι δέκα κινάσες είναι σε φθίνουσα σειρά των τιμών τους. Το ερώτημα SPARQL για να δημιουργήσει αυτό το σχήμα μπορεί να αντιμετωπισθεί άμεσα και excuted από το πρόγραμμα περιήγησης ProKinO επιλέγοντας «Ερώτημα 4» κάτω από την καρτέλα «Παράδειγμα ερωτήματα» στην κεντρική σελίδα.

Η

ProKinO Εφαρμογή

Η επιτομή της γνώσης που εκπροσωπούνται στο ProKinO μπορεί να χρησιμοποιηθεί για μια ποικιλία εφαρμογών, όπως η εξόρυξη δεδομένων, εξόρυξη κειμένου και σχολιασμού του γονιδιώματος. Ειδικότερα, η εκπροσώπηση των διαφόρων στοιχείων της πρωτεϊνικής κινάσης σε μορφή αναγνώσιμη από μηχάνημα επιτρέπει πολύπλοκο σύνολο ερωτημάτων σχετικά με τα δεδομένα της οντολογίας, με τρόπους που δεν είναι δυνατόν μέσω των υφιστάμενων πόρων της κινάσης-ειδική. Παρακάτω, περιγράφουμε κάποια από αυτά τα ερωτήματα για να δείξουμε πώς τα δεδομένα ProKinO μπορεί να χρησιμοποιηθεί για την ανακάλυψη της γνώσης και της δημιουργίας υποθέσεων. Τα ερωτήματα που έχουν διατυπωθεί σε SPARQL, παρέχουν επίσης μια πρώτη αξιολόγηση της χρησιμότητας ProKinO του.

Ερώτημα 1.

Τα ερωτήματα SPARQL «μετράει νοηματικές μεταλλάξεις υποκατάστασης σε τύπους καρκίνου», και » μετρήσεις κινασών πρωτεΐνης που έχουν μεταλλάξεις εσφαλμένου νοήματος »διεξήχθη επί ProKinO να αναλυθεί η κατανομή των μεταλλάξεων κινάσης σε διάφορους τύπους καρκίνου. Η ανάλυση των αποτελεσμάτων που προκύπτουν από την έρευνα αυτή έδειξε ότι η κατανομή των μεταλλάξεων κινάσης είναι εντυπωσιακά διαφορετική για διαφορετικούς τύπους καρκίνου (Σχήμα 6). Ειδικότερα,

καρκίνωμα

(1168 μεταλλάξεις),

γλοιώματος

(180),

κακόηθες μελάνωμα

(201),

αιμοποιητικών νεόπλασμα

(288), και

λεμφικών νεόπλασμα

(164) είναι ιδιαίτερα υπερεκπροσωπούνται σε μεταλλάξεις της κινάσης σε σύγκριση με άλλους τύπους καρκίνου (Σχήμα 6). Επιπλέον, τα 288 και 164 μεταλλάξεις που σχετίζονται με

αιμοποιητικών νεόπλασμα

και

λεμφικών νεόπλασμα

χάρτη για μόνο 8 και 12 κινάσες, αντίστοιχα. Αυτό είναι σε αντίθεση προς

γλοίωμα

, όπου οι μεταλλάξεις κατανεμημένα σε 82 διακριτές κινασών. Ενώ αυτό το εύρημα θα μπορούσε να προκύψει από την μεροληψία στην ανάλυση αλληλουχίας του καρκίνου kinomes από επιλεγμένους τύπους καρκίνου, είναι επίσης δυνατόν ότι μόνο μερικά μονοπάτια σηματοδότησης (που συνδέονται με τις 8 κινάσες) μεταβάλλεται σε

αιμοποιητικών νεόπλασμα

, σε σύγκριση με

γλοίωμα

. Τέτοιες παρατηρήσεις έχουν επιπτώσεις στη στόχευση του μεταλλαγμένου kinome για θεραπείες, καθώς και στη δημιουργία νέων υποθέσεων για τις πειραματικές μελέτες.

Όπως αναφέρεται στο κείμενο,

haematopoietic_neoplasm

έχει 288 μεταλλάξεις στο 8 κινάσες, ενώ η

γλοίωμα

έχει 180 μεταλλάξεις εξαπλωθεί πάνω από 82 κινασών. Το ερώτημα SPARQL για να δημιουργήσει αυτό το σχήμα μπορεί να αντιμετωπισθεί άμεσα και excuted από το πρόγραμμα περιήγησης ProKinO επιλέγοντας «Ερώτημα 5α» και «5β Ερώτημα» στο πλαίσιο του «Παράδειγμα ερωτήματα» καρτέλα στην κεντρική σελίδα.

Η

Ερώτημα 2.

με βάση την παρατήρηση από Ερώτημα 1, επιπλέον ερωτήματα SPARQL μπορεί να γίνει για να λάβει περισσότερες πληροφορίες σχετικά με τις 8 κινάσες που σχετίζονται με το

αιμοποιητικών νεόπλασμα

. Για παράδειγμα, το ερώτημα που ζητούν για τις «μετρήσεις των πρωτεϊνικών κινασών που έχει νοηματικές μεταλλάξεις στο

αιμοποιητικών νεόπλασμα

» υποδηλώνει ότι

ABL1

,

KIT

,

FLT3

και

JAK2

συχνότερα μεταλλαχθεί σε σύγκριση με άλλες κινάσες (Εικόνα 7). Αυτή η παρατήρηση είναι συνεπής με τα ευρήματα που αναφέρονται στη βιβλιογραφία [31], [32], περαιτέρω διασταυρούμενη επικύρωση των περιεχομένων της οντολογίας.

Τα Top 10 χτυπήματα κατά φθίνουσα σειρά των αριθμών που εμφανίζονται. Το ερώτημα SPARQL για να δημιουργήσει αυτό το σχήμα μπορούν να προβληθούν και excuted από το πρόγραμμα περιήγησης ProKinO επιλέγοντας «Ερώτημα 6» κάτω από την καρτέλα «Παράδειγμα ερωτήματα» στην κεντρική σελίδα.

Η

Ερώτημα 3.

Ερώτημα 2 (παραπάνω) μπορεί να βελτιωθεί περαιτέρω για την απόκτηση ελέγξιμες υποθέσεις σχετικά με μεταλλάξεις του καρκίνου. Για παράδειγμα, τα ερωτήματα που ζητούν λειτουργικά χαρακτηριστικά και τη θέση υπο-τομέα για

ABL1

μεταλλάξεις που συνδέονται με το

αιμοποιητικών νεόπλασμα

αποκάλυψε ότι

Υ253Ρ

βρίσκεται στην λειτουργικά σημαντικών

γλυκίνη πλούσια βρόχο

(Υπο-περιοχή μου? Πίνακας S5), και έχει τροποποιήσει το ακίνητο υπολείμματα «

φωσφοτυροσίνη

«. Με αυτές τις πληροφορίες, μπορεί κανείς να διατυπώσει μια ελέγξιμη υπόθεση ότι «

Υ253Ρ

μετάλλαξη συμβάλλει στην ανώμαλη

ABL1

λειτουργίες με την αλλαγή της κατάστασης φωσφορυλίωσης των πλουσίων γλυκίνη βρόχο».

Εκτός από τα ερωτήματα που περιγράφηκαν παραπάνω, έχουμε διατυπώσει αρκετές επιπλέον ερωτήματα σχετικά με ProKinO. Τα αποτελέσματα που προκύπτουν από αυτά τα ερωτήματα παρέχονται ως συμπληρωματική στοιχεία (βλέπε σχήματα S2, S3, S4, S5, S6, S7, S8, S9). Η SPARQL ερωτήματα ίδιοι παρέχονται στο Σχήμα S10.

Μελλοντικές Κατευθύνσεις

ProKinO είναι μια οντολογία των όρων και των σχέσεων που εξέφραζε την κατάσταση των γνώσεων σχετικά με την οικογένεια της πρωτεϊνικής κινάσης. Εκπροσώπηση της γνώσης της πρωτεϊνικής κινάσης, με τη μορφή οντολογίας επιτρέπει την αποτελεσματική εξόρυξης και των συστημάτων σε επίπεδο ανάλυσης των δεδομένων της πρωτεϊνικής κινάσης, όπως καταδεικνύεται μέσα από διάφορα ερωτήματα SPARQL. Για να ενεργοποιήσετε την πλοήγηση και ολοκληρωμένη ανάλυση των στοιχείων της οντολογίας, ένα πρόγραμμα περιήγησης οντολογία έχει αναπτυχθεί. Το πρόγραμμα περιήγησης μπορεί να προσπελαστεί από https://vulcan.cs.uga.edu/prokino.

Ενώ η τρέχουσα έκδοση του ProKinO επικεντρώνεται σε μεγάλο βαθμό από τα γονίδια της ανθρώπινης κινάσης πρωτεΐνης, πληροφορίες σχετικά με άλλους πρότυπους οργανισμούς μπορούν να ενσωματωθούν σε ProKinO μέσω της προσθήκης νέων τάξεων και ιδιότητες των δεδομένων στο σχήμα οντολογία. Ομοίως, ο πλούτος των πληροφοριών που παράγονται σε υποστρώματα κινάσης πρωτεΐνης μέσω δεδομένων φωσφο-πρωτεομική υψηλής απόδοσης μπορεί να ενσωματωθεί για την ενσωμάτωση δεδομένων του καρκίνου με δεδομένα πρωτεομική. Επιπλέον, αναμένουμε ProKinO να είναι χρήσιμη στην παροχή συνεπή σχολιασμό των μεταλλάξεων που προσδιορίζονται σε μελέτες αλληλουχίας του γονιδιώματος του καρκίνου.

Χρησιμοποιώντας συγκεκριμένα ερωτήματα που έχουν αποδείξει πως τα δεδομένα στην οντολογία μπορεί να χρησιμοποιηθεί για να δημιουργήσει νέες υποθέσεις σχετικά με την δομική και λειτουργική επίπτωση των μεταλλάξεων. Ειδικότερα, η παρατήρηση ότι σχεδόν 288 μεταλλάξεις χάρτη με μόνο οκτώ κινάσες σε

αιμοποιητικών νεόπλασμα

είναι νέα και παρέχει νέες υποθέσεις για τις μελέτες παρακολούθησης. Ομοίως, η πρόβλεψη που

Υ253Ρ

μετάλλαξη αλλάζει η κατάσταση φωσφορυλίωσης της πλούσιας γλυκίνη βρόχο ABL κινάσης της τυροσίνης μπορεί να ελεγχθεί πειραματικά.

You must be logged into post a comment.