PLoS One: Πρόβλεψη και πειραματική επιβεβαίωση των γονιδίων Μυθιστόρημα STAT3 Target σε ανθρώπινα κύτταρα του καρκίνου


Αφηρημένο

Η πλήρης ταυτοποίηση των θέσεων πρόσδεσης λειτουργικό παράγοντα μεταγραφής (TFBSs) είναι ένα σημαντικό βήμα στην κατανόηση πολύπλοκων μεταγραφικό ρυθμιστικών δικτύων. Αυτή η μελέτη παρουσιάζει ένα μοτίβο που βασίζεται σε συγκριτική προσέγγιση, STAT-Finder, για τον προσδιορισμό των λειτουργικών χώρων του μεταγραφικού παράγοντα STAT3 δέσμευσης του DNA. STAT-Finder συνδυάζει STAT-Scanner, η οποία είχε ως σκοπό να προβλέψει λειτουργικά TFBSs STAT με βελτιωμένη ευαισθησία, και ένα μοτίβο που βασίζεται σε ευθυγράμμιση με την ελαχιστοποίηση των ψευδών θετικών ποσοστών πρόβλεψη. Χρησιμοποιώντας δύο σύνολα αναφοράς που περιέχει αλληλουχίες υποκινητή γνωστών γονιδίων στόχων STAT3, STAT-Finder εντοπιζόμενες λειτουργικές STAT3 TFBSs με βελτιωμένη αποδοτικότητα της πρόβλεψης και της ευαισθησίας σε σχέση με άλλα συμβατικά εργαλεία πρόβλεψης TFBS. Επιπλέον, STAT-Finder προσδιορίζονται νέα γονίδια στόχος STAT3 μεταξύ μιας ομάδας γονιδίων που υπερ-εκφράζεται σε ανθρώπινα καρκινικά κύτταρα. Η δέσμευση του STAT3 με την προβλεπόμενη TFBSs επιβεβαιώθηκε επίσης πειραματικά μέσω της χρωματίνης ανοσοκατακρήμνιση. προτεινόμενη μέθοδος μας παρέχει μια συστηματική προσέγγιση για την πρόβλεψη της λειτουργικής TFBSs που μπορεί να εφαρμοστεί και σε άλλες TFs

Παράθεση: Ω. ΥΜ, Kim JK, Choi Υ, Choi S, Yoo JY (2009) Πρόβλεψη και πειραματική επιβεβαίωση της γονίδια Μυθιστόρημα STAT3 Target σε ανθρώπινα κύτταρα του καρκίνου. PLoS ONE 4 (9): e6911. doi: 10.1371 /journal.pone.0006911

Επιμέλεια: Sridhar Hannenhalli, University of Pennsylvania School of Medicine, Ηνωμένες Πολιτείες της Αμερικής

Ελήφθη: 2 Απριλίου, 2009? Αποδεκτές: 3 Αυγούστου του 2009? Δημοσιεύθηκε: 4 Σεπτεμβρίου 2009

Copyright: © 2009 Oh et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Αυτό το έργο υποστηρίχθηκε από επιχορηγήσεις από την επιχορήγηση του Ιδρύματος Κορέας Επιστημών και Μηχανικής (KOSEF) που χρηματοδοτείται από το MEST (R01-2008-000-20721-0) και στο Εθνικό Κέντρο Έρευνας πυρήνα για συστήματα Bio-Dynamics (R15-2004-033). J. Κ Kim υποστηρίζεται από μια υποτροφία Microsoft Research Asia. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

Η ικανότητα του κάθε βιολογικού συστήματος να ανταποκριθεί σωστά σε ερεθίσματα σε μεγάλο βαθμό εξαρτάται από βιοχημικές καταρράκτες των οδών που καταλήγουν στην ενεργοποίηση των μεταγραφικών παραγόντων (ΤΡ) και την επακόλουθη αλλοίωση των προτύπων γονιδιακής έκφρασης [1] σηματοδότησης. Πληροφορίες σχετικά με το ποια πρέπει να εκφράζονται σε ένα συγκεκριμένο τύπο κυττάρου σε κάθε δεδομένη στιγμή γονίδια πιστεύεται ότι κωδικοποιείται στο γονιδίωμα. Η μοριακή μηχανήματα που χρησιμοποιούνται για την ερμηνεία αυτών των γενετικών πληροφοριών έχει εξελιχθεί για να εξασφαλιστεί η ακρίβεια και η ειδικότητα της γονιδιακής ρύθμισης. Μεταγραφή είναι μια διαδικασία πολλών σταδίων που απαιτεί τη συντονισμένη δράση πολλών πρωτεϊνών. Μεταγραφικοί ενεργοποιητές και καταστολείς δεσμεύουν σε μία αλληλουχία-ειδικό τρόπο για υποκινητές ή ενισχυτές των γονιδίων στόχων. Που διέπουν την πρόσληψη trans-ενεργοποιητές, τροποποιητές της χρωματίνης και γενικών μεταγραφικών παραγόντων, συμπεριλαμβανομένων των RNA πολυμεράση ΙΙ, για τη ρύθμιση της γονιδιακής έκφρασης [2], [3].

Σύνολο προσεγγίσεις γονιδίωμα για να μετρήσει τα πρότυπα έκφρασης του γονιδιώματος σε επίπεδο έχουν γνωστοποιηθούν ομάδες γονιδίων που είναι συν-ρυθμιζόμενων να ασκήσει μια χωρικά και χρονικά ελεγχόμενη κυτταρικές αποκρίσεις [4]. Ο εντοπισμός των αρμόδιες εποπτικές ενότητες που διέπουν τις συντονισμένες δράσεις των συνδυαστικών παραγόντων μεταγραφής είναι ζωτικής σημασίας για την κατανόηση των ρυθμιστικών κυκλώματα των βιολογικών διεργασιών [5]. Για το σκοπό αυτό, έχουν υπολογιστικών εργαλείων έχουν αναπτυχθεί για να βοηθήσει στην ταυτοποίηση των θέσεων δέσμευσης μεταγραφικού παράγοντα (TFBSs) στους υποκινητές των συν-ρυθμιζόμενων γονιδίων [6], [7], [8]. Αυτές οι υπολογιστικές προσεγγίσεις μπορούν να διαιρεθούν σε δύο κατηγορίες: (1) την ανίχνευση μοτίβο και (2) ταιριάζουν μοτίβο. ανίχνευση μοτίβο, επίσης γνωστή ως de novo μοτίβο ανακάλυψη, βρίσκει υποθετικές θέσεις πρόσδεσης για άγνωστους ΤΡ που υπερεκπροσωπούνται στους υποστηρικτές του συν-ρυθμιζόμενων γονιδίων. Εάν η εξειδίκευση δέσμευσης ενός TF είναι ήδη γνωστή, οι μέθοδοι που ταιριάζουν μοτίβο προτιμούνται [9]. Στην προσέγγιση που να ταιριάζουν μοτίβο, πληροφορίες αλληλουχίας DNA του TFBSs εκφράζεται σαν μία μήτρα βάρος θέση (PWM), η οποία μπορεί να χρησιμοποιηθεί για να στείλει το δυναμικό ρυθμιστικές θέσεις εντός ενός στατιστικού πλαισίου [10]. Ωστόσο, επειδή θέσεις δέσμευσης του DNA για ΤΡ είναι γενικά μικρή και εκφυλισμένη, η μέθοδος αυτή είναι επιρρεπής σε υψηλά ποσοστά ψευδώς θετικών πρόβλεψης [11].

Με βάση την παρατήρηση ότι συντηρημένη μη-κωδικοποιητικές αλληλουχίες DNA είναι συχνά σημαντικό για την ρύθμιση της βιολογικής λειτουργίας, συγκρίσεις αλληλουχίας μεταξύ ειδών έχουν ενεργά ενσωματωθεί να διακρίνει λειτουργικές και μη λειτουργικές TFBSs [12], [13], [14]. Η πράξη της ενσωμάτωσης του εξελικτικά συντηρημένη πληροφορίες ακολουθίας στις ρυθμιστικές περιοχές φιλτράρει το μη διατηρούμενες TFBSs, μειώνοντας έτσι σημαντικά την ποσοστό ψευδώς θετικών πρόβλεψης [15], [16], [17], [18], [19]. Αν και αυτή η προσέγγιση έχει εφαρμοστεί με επιτυχία για την αύξηση της προβλεπτική ικανότητα των διαπίστωση μοτίβο, είναι εξαιρετικά ευαίσθητη στον αλγόριθμο που χρησιμοποιείται για την ευθυγράμμιση αλληλουχίας και την ακρίβεια των σχολιαζόμενων μεταγραφικής θέσης έναρξης (TSS) πληροφορίες. Ως εκ τούτου, έχει αναφερθεί ότι οι ευθυγραμμίσεις προαγωγό ακολουθία που βασίζεται συχνά αποτυγχάνουν να ανιχνεύσουν σύντομες ή εκφυλισμένη ρυθμιστικά στοιχεία, όταν οι εξελικτικές αλληλουχίες υποκινητή αποκλίνουσες ευθυγραμμισμένο [12], [17]. Για να ξεπεραστούν αυτοί οι περιορισμοί, ένας αλγόριθμος ευθυγράμμιση χωρίς βάση για τη διατήρηση του δικτύου σε επίπεδο έχει επίσης προταθεί [20].

μετατροπέας σήματος και ενεργοποιητής της μεταγραφής 3 (STAT3) ανήκει στην οικογένεια STAT των παραγόντων μεταγραφής, η οποία ενεργοποιείται από ιντερλευκίνη-6 (IL-6) και συνδέονται με κυτοκίνες, όπως IL-10, ογκοστατίνης Μ (OSM), και ανασταλτικό παράγοντα λευχαιμίας (LIF) [21]. Μέχρι στιγμής, επτά STATs θηλαστικών (1, 2, 3, 4, 5α, 5β, και 6) έχουν ταυτοποιηθεί. Όλοι διαθέτουν έναν τομέα δέσμευσης DNA, μια περιοχή SH2 για διμερισμού, και ένα C-τερματικό τομέα τρανς-ενεργοποιήσεως [22]. Κατά τη διέγερση με εξωκυτταρικό συνδέτη, ενεργοποιημένα STAT3 σχηματίζει ομοδιμερή ή ετεροδιμερή με άλλο μέλος της οικογένειας STAT, STAT1, τότε μετατοπίζεται στον πυρήνα και συνδέεται με τον συγγενή ρυθμιστικά στοιχεία στους υποκινητές STAT-αποκριτικών γονιδίων. Συσσωρευμένα ενδείξεις υποδηλώνουν ότι STAT3 συνδέει επίσης με άλλους παράγοντες μεταγραφής για να σχηματίσουν σύμπλοκα ενισχυόσωμα στις περιοχές υποκινητή των γονιδίων στόχων και ελέγχει συνεργατική επαγωγή γονιδίου [23], [24], [25]. STAT3 εμπλέκεται σε ποικίλες κυτταρικές αποκρίσεις, συμπεριλαμβανομένης της κυτταρικής διαφοροποίησης, την επιβίωση, τα βλαστικά ανανέωση των κυττάρων, την επούλωση των πληγών και συστηματική φλεγμονή? Αυτό έχει αποδειχθεί από τους φαινοτύπους των γενετικά τροποποιημένων STAT3 μεταλλαγμένα ποντίκια [22], [26], [27], [28], [29]. Έχει βρεθεί ότι STAT3 συμμετέχει στην καρκινογένεση και ότι η έκτοπη έκφραση ενός ιδιοσυστατικά ενεργή μορφή της STAT3 (STAT3-C) προκαλεί τον σχηματισμό όγκου σε γυμνούς ποντικούς [30]. Επιπλέον, η έκφραση του ιδιοσυστατικά ενεργού STAT3 έχει παρατηρηθεί σε διάφορους τύπους ανθρώπινου καρκίνου συμπεριλαμβανομένου του πολλαπλού μυελώματος, του παχέος εντέρου, των ωοθηκών, του ήπατος, του πνεύμονα, της κεφαλής, του λαιμού και των καρκίνων [31]. Ενώ οι ρυθμιστικές και γενικών μηχανισμών trans-ενεργοποίηση STAT3 έχουν μελετηθεί σε βάθος, όχι πάρα πολλή προσπάθεια έχει γίνει προς την κατεύθυνση της αναγνώρισης των άμεσων γονιδίων στόχων του STAT3. Η ταυτοποίηση αυτών των γονιδίων στόχων είναι ζωτικής σημασίας για τη διαμεσολάβηση τις διάφορες βιολογικές επιδράσεις της σηματοδότησης STAT3.

Για να χαρακτηρίσουμε μεταγραφική προγράμματα STAT3 με τη μεσολάβηση, έχουμε αναπτύξει ένα υπολογιστικό πλαίσιο σχεδιασμένο για την πρόβλεψη STAT3 TFBSs με βελτιωμένη ευαισθησία και χαμηλά ψευδώς θετικά τιμή. Μέσω της ενσωμάτωσης των δεδομένων μικροσυστοιχιών που λαμβάνονται από την κατάσταση ενεργοποίησης STAT3 και τα εργαλεία πρόβλεψης TFBS, προσπαθήσαμε να εντοπίσει νέα γονίδια στόχους STAT3. Χρησιμοποιώντας το πρόγραμμα STAT-Finder μας, εντοπίσαμε οκτώ νέα γονίδια στόχος STAT3 ανάμεσα σε μια ομάδα γονιδίων που είναι εντόνως εκφρασμένα σε καρκινικά κύτταρα. Αυτά στη συνέχεια επιβεβαιώθηκε μέσω της χρωματίνης ανοσοκαθίζησης.

Αποτελέσματα

Επισκόπηση της STAT-Finder

Για να προσδιοριστούν οι άμεσες γονιδίων στόχων STAT3, έχουμε αναπτύξει ένα υπολογιστικό πλαίσιο που προβλέπει λειτουργικές TFBSs της STAT3 με αυξημένη ευαισθησία και χαμηλό ποσοστό ψευδώς θετικών. πλαισίου μας, STAT-Finder, κατασκευάστηκε βασίζεται σε δύο υπολογιστικά συστατικά, ένα πρόγραμμα σάρωσης TFBS (STAT-Scanner) και ένα πρόγραμμα ευθυγράμμισης μοτίβο με βάση (Σχήμα 1). STAT-Scanner σχεδιάστηκε για να αυξήσει την ευαισθησία για την ανίχνευση λειτουργικών STAT3 TFBSs. Ένα επί του παρόντος διαθέσιμες STAT3-ειδική PWM της βάσης δεδομένων TRANSFAC [32], V $ STAT3_01, αποτυγχάνει συχνά να ανιχνεύσει πειραματικά αποδειχθεί θέσεις πρόσδεσης STAT3 (τα δεδομένα δεν παρουσιάζονται). Για βελτιωμένη προγνωστική δύναμη, STAT-Scanner είχε ως σκοπό την αξιοποίηση της συνδυασμένης PWMs των ειδικότητα σύνδεσης παρόμοια με STAT3. Παρά το γεγονός ότι τα μέλη της οικογένειας STAT έχουν διαφορετικές φυσιολογικές λειτουργίες και ρυθμίζουν διαφορετικές ομάδες γονιδίων στόχων, οι στόχοι των επιμέρους πρωτεϊνών STAT ενίοτε επικαλύπτονται, και αλληλουχίες DNA που αναγνωρίζονται από τα μέλη της οικογένειας STAT είναι παρόμοια [21], [22], [23].

STAT-Finder έχει δύο συνιστώσες: η πρώτη ενότητα, STAT-Scanner, παίρνει ένα σύνολο έξι ορθόλογες υποκινητή θηλαστικών ως είσοδο. Κάθε αλληλουχία του υποκινητή είναι η αναζήτηση για τον εορτασμό υποτιθέμενο TFBSs χρήση των τροποποιημένων 8 PWMs STAT σχετίζονται. είναι δεσμευτικές βαθμολογίες συγγένεια των προβλεπόμενων TFBSs υπολογίζεται με βάση το

P

-τιμές, και μια ακολουθία των βαθμολογιών συγγένεια δημιουργείται για κάθε αναδόχου. Η δεύτερη ενότητα ευθυγραμμίζει σταδιακά τις ακολουθίες σκορ και υπολογίζει οπίσθια πιθανότητα να αξιολογήσει το βαθμό διατήρησης μοτίβο.

Η

Για την αμερόληπτη ταυτοποίηση των PWMs η ομοιότητα ακολουθίας μετοχή με την STAT3 ειδικά PWM, V $ STAT3_01, συνολικά 565 PWMs προέρχεται από σπονδυλωτά βάση δεδομένων TRANSFAC [32] συνενώθηκαν με βάση την ομοιότητα μοτίβο τους (Σχήμα S1). Η ομοιότητα μοτίβο ορίστηκε ως η

P

-τιμή του gapped ευθυγράμμιση μεταξύ των δύο PWMs με βάση την απόκλιση Kullback-Leibler [33] (βλέπε Μέθοδοι). Συνολικός αριθμός των clusters PWM αυξάνεται με αυστηρές

P

-τιμή cut-off, φθάνοντας το μέγιστο αριθμό σύμπλεγμα περίπου 10

-16

P

-τιμή (Σχήμα S1 Α). Με το

P

-τιμή cut-off της 10

-7, PWMs εκχωρηθεί για τα μέλη της οικογένειας STAT βρέθηκαν στο ίδιο σύμπλεγμα. Αξίζει να σημειωθεί ότι PWM ομαδοποίηση δεν αποκάλυψε PWMs μη-STAT που ήταν αρκετά παρόμοια για να συμπεριλάβει ούτε υπήρχαν PWMs STAT που ήταν σαφώς διαφορετικές (Σχήμα S1B) εκεί. Εμείς επιλέξαμε μεταξύ των οποίων οκτώ PWMs από τα μέλη της οικογένειας STAT με τα αποτελέσματα υψηλής ποιότητας PWM (& gt? 0,6), όπου κάθε ποιότητα βαθμολογία υπολογίζεται χρησιμοποιώντας τη μέθοδο που προτείνει Rahmann et al. [34]. Η συνάφεια των επιλεγμένων PWMs για την ανίχνευση γνωστών STAT3 TFBS έχει αξιολογηθεί στο παρελθόν εντοπιστεί γονίδια στόχους STAT3 [35] (Εικόνα S2).

Για να ελαχιστοποιηθεί η ψευδώς θετικά τις προβλέψεις, τα αποτελέσματα από την STAT-Scanner αναλύθηκαν στη συνέχεια χρησιμοποιώντας το εργαλείο συγκριτική μοτίβο που βασίζεται ευθυγράμμισης (Εικόνα 1). Η μέθοδος αυτή βρίσκει συντηρημένες θέσεις σύνδεσης εντός των ορθόλογα υποκινητές έξι είδη θηλαστικών με σύγκριση πολλαπλών αλληλουχιών. Μέσα σε ένα πιθανοτικό πλαίσιο, STAT-Finder στη συνέχεια αξιολογεί τα οπίσθια πιθανότητες TFBSs όπως προβλέπεται από STAT-σαρωτή με την ανάθεση υψηλότερη εκ των προτέρων πιθανότητες για συντηρημένες περιοχές έναντι των μη-συντηρημένες αυτά.

Επικύρωση της STAT-Scanner

Έχουμε την πρώτη σύγκριση των επιδόσεων της STAT-Scanner με τα πιο πρακτικά εργαλεία πρόβλεψης TFBS, MATCH 2.7 [36] και MotifLocator [37]. Για το σκοπό αυτό, συλλέξαμε θετική γονίδια με πειραματικά αποδεδειγμένη θέσεις πρόσδεσης STAT3 σε περιοχές υποκινητών τους μέσω της εξόρυξης λογοτεχνία και TRED αναζήτησης (https://rulai.cshl.edu/TRED) [38]. Οι προκύπτουσες πληροφορίες σχετικά με τις αλληλουχίες αναφοράς 22 παρατίθενται στον Πίνακα S1. Γονιδιωματικό DNA αλληλουχίες που εκτείνονται από 2.000 bp ανάντη 500 bp κατάντη της σχολιασμένης TSS του κάθε γονιδίου χρησιμοποιήθηκαν ως αλληλουχίες προαγωγού εισόδου. Πρόβλεψη της αληθινής θετική TFBSs ήταν τότε καταγράφεται ως συνάρτηση της συνολικής προβλεπόμενης TFBS μετράνε για διαφορετικές τιμές cut-off. Όπως φαίνεται στο Σχήμα 2Α, STAT-Scanner, η οποία χρησιμοποιεί συνδυασμό PWMs STAT3 συνδέονται, υπερτερεί MATCH και MotifLocator, δύο από τα οποία χρησιμοποιούν τον εκπρόσωπο STAT3 PWM (V $ STAT3_01). Πιστεύουμε ότι η βελτιωμένη προγνωστική δύναμη της STAT-Scanner οφειλόταν εν μέρει στην χρήση των συνδυασμένων PWMs STAT3 που σχετίζονται, ιδίως δεδομένου ότι η προβλεπτική ικανότητα των MotifLocator αυξήθηκε επίσης όταν συνδυάζεται PWMs χρησιμοποιήθηκαν (Σχήμα S3).

Καμπύλες για οι αλλαγές του αριθμού των αληθινών θετικών TFBSs ανιχνευθεί χρησιμοποιώντας MotifLocator (V $ STAT3_01), MATCH (V $ STAT3_01), ή STAT-ανιχνευτής, ως συνάρτηση του συνολικού αριθμού των προβλεπόμενων TFBSs (Α) στο σύνολο αναφοράς του στόχου 22 STAT3 γονίδια (Πίνακας S1) και (Β) στο γονιδίωμα-ευρεία STAT3 τσιπ Seq σύνολο δεδομένων [39].

η

Αξιολογήσαμε επίσης την απόδοση της STAT-σαρωτή χρησιμοποιώντας δεδομένα δεσμευτική STAT3 γονιδίωμα-ευρεία λαμβάνονται με τη χρήση εμβρυϊκών βλαστικών κυττάρων [39]. Μεταξύ των 461 γονίδια με STAT3 κορυφές στις περιοχές υποκινητή 2,5 kb δέσμευσης, 412 έχουν προβλεφθεί με ακρίβεια από STAT-ανιχνευτής να έχουν τουλάχιστον μία STAT3 TFBS (Σχήμα 2Β). Η συνολική απόδοση του STAT-ανιχνευτής ήταν καλύτερες από εκείνες των δύο MATCH και MotifLocator, όπως η ανίχνευση του ίδιου αριθμού των αληθινών θέσεων δέσμευσης επιτεύχθηκε με τόσο με σημαντικά χαμηλότερο συνολικό αριθμό των προβλεπόμενων θέσεων. Παρά το γεγονός ότι MATCH και MotifLocator πραγματοποιήθηκε όμοια με Stat-Scanner στην ανίχνευση περίπου το 50% της πραγματικής STAT3 TFBSs, το τελευταίο υπερτερεί τόσο από ακριβής πρόβλεψη των υπόλοιπων αλήθεια sites. Πιστεύουμε ότι αυτό οφείλεται εν μέρει στη χρήση των συνδυασμένων PWMs STAT σχετίζονται οποίο έχει την ικανότητα να αυξήσει την απόδοση των MotifLocator, αν και μικρότερη από την ενίσχυση για STAT-ανιχνευτής, με συνδυασμένη δεδομένα που προέρχονται από πολλαπλούς PWMs (Σχήμα S4). Η σχετική απόδοση και των δύο μεθόδων είναι χαμηλή σε σύγκριση με εκείνη των STAT-Scanner? Αυτό μπορεί να εξηγηθεί από το γεγονός ότι οι βαθμολογίες τους στις προβλεπόμενες θέσεις δεν είναι άμεσα συγκρίσιμα μεταξύ των διαφόρων PWMs, δείχνοντας έτσι τη σημασία του συστήματος βαθμολόγησης μας στην ενσωμάτωση αγώνες σε διαφορετικές PWMs. Αυτά τα αποτελέσματα δείχνουν επίσης ότι η επικάλυψη PWMs με παρόμοια ειδικότητα δέσμευσης είναι ζωτικής σημασίας για την ανάπτυξη βελτιωμένων στρατηγικών για τον εντοπισμό λειτουργικών TFBSs της STAT3 με υψηλή προγνωστική ακρίβεια.

Χαρακτηριστικά της λειτουργικής STAT3 TFBS

Η απόλυτη στόχος της υπολογιστικής πρόβλεψης είναι να ανιχνεύσει λειτουργική TFBSs με υψηλό βαθμό εμπιστοσύνης. Για να φιλτράρετε το ψευδώς θετικό TFBSs με σκορ υψηλή συγγένεια, εξετάσαμε διάφορα λειτουργικά προβλήματα, όπως η εξελικτική δομή της διατήρησης και του γονιδιώματος των προβλεπόμενων περιοχών STAT3 TFBS. διατηρήσεως σειράς μεταξύ πολλών ειδών έχει αποδειχθεί για να περιορίσουν λειτουργικά TFBS [16], [17], [40]. Ως εκ τούτου, αξιολογήσαμε για πρώτη φορά την κατανομή των βαθμολογιών διατήρησης multispecies (PhastCons γκολ) [41] και ρυθμιστικές δυνατότητες (RegPotential βαθμολογία) [42] για τις θέσεις στο λειτουργικές και μη-λειτουργικές STAT3 TFBSs ανιχνεύεται από STAT-σαρωτή χρησιμοποιώντας το σύνολο αναφοράς του 22 γονίδια (Πίνακας S1). Για λόγους ευκολίας, θα θεωρείται TFBS λειτουργική αν υποστηρίζεται από πειραματικά δεδομένα δεσμευτική STAT3? Αλλιώς, ο TFBS θεωρήθηκε μη λειτουργικό. Η κατανομή των PhastCons βαθμολογίες για τη μη λειτουργική STAT3 TFBSs είχαν λοξή προς το μηδέν, ενώ PhastCons βαθμολογίες για περίπου το 50% της λειτουργικής STAT3 TFBS υπέρβαση 0,1 (Σχήμα 3Α). Σε αντίθεση, η κατανομή των βαθμολογιών RegPotential, οι οποίοι μετρούν την ομοιότητα των προτύπων με εκείνα τα γνωστά ρυθμιστικά στοιχεία, ήταν παρόμοια για τις θέσεις του λειτουργικού και μη λειτουργικού STAT3 TFBSs (Σχήμα 3Β). Στη συνέχεια, ερευνήσαμε τις μεθυλίωση ανθεκτικά νησί CpG χαρακτηριστικά των STAT3 TFBS περιέχουν περιοχές. Πάνω-απεικόνιση των αλληλουχιών πρόσδεσης για ειδικούς παράγοντες μεταγραφής, όπως οι πρωτεΐνες ψευδαργύρου-δακτύλου, σε νησίδες CpG έχει προηγουμένως αναφερθεί [43]. Οι περισσότεροι από την προβλεπόμενη STAT3 TFBSs βρίσκονται μέσα νησίδες CpG [44], αλλά η γονιδιωματική διανομή δεν μεταβάλλεται σημαντικά μεταξύ των λειτουργικών και μη-λειτουργικών STAT3 TFBSs (Σχήμα 3C). Επαναλάβετε τα στοιχεία [45] στην αλληλουχία του γονιδιώματος θα μπορούσε να θέσει σε κίνδυνο τις λειτουργίες των παραγόντων μεταγραφής, καθώς κανένα από τα λειτουργικά STAT3 TFBSs έχουν εντοπιστεί στο εσωτερικό των επαναλαμβανόμενων περιοχών (Σχήμα 3D). Εν ολίγοις, η διατήρηση μοτίβο, ένα σημαντικό εμπόδιο που διακρίνει μεταξύ των λειτουργικών και μη λειτουργικών STAT3 TFBSs, έχει επομένως συμπεριληφθεί στην STAT-Finder.

(Α) PhastCons σκοράρει, (Β) Ρυθμιστική Δυναμικό σκορ, (C ) Ποσοστό στο νησί CpG, και (Δ) Ποσοστό στην περιοχή Επανάληψη.

η

Επικύρωση της STAT-Finder

στη συνέχεια εκτιμήσαμε την απόδοση της STAT-Finder σε σύγκριση με άλλες συγκριτικές μεθόδους, δηλαδή, το χέλι [46] και CONREAL [12]. Δεδομένου ότι EEL εκτελεί κατά ζεύγη στοίχιση με βάση τους αγώνες σε ένα μόνο PWM, συγκρίναμε την απόδοση της EEL χρησιμοποιώντας κάθε PWM (V $ STAT3_01 και V $ STAT1_01) ξεχωριστά. Εν τω μεταξύ, η απόδοση των CONREAL εξετάστηκε από το συνδυασμό των δύο PWMs. Δοκιμάσαμε την ακρίβεια πρόβλεψης της STAT-Finder στις δύο θετικές σύνολα δεδομένων με δέστρες STAT3. STAT-Finder παρουσίασαν καλύτερη απόδοση σε σύγκριση με EEL χρησιμοποιώντας V $ STAT3_01, EEL χρησιμοποιώντας V $ STAT1_01, ή σε σύγκριση με CONREAL στην πρόβλεψη πραγματική STAT3 TFBSs στις 22 προηγουμένως εντοπιστεί θετικά γονίδια (Εικόνα 4Α). Να σημειωθεί ότι τόσο το χέλι και CONREAL απέτυχαν να ανιχνεύσουν περίπου 40-60% της πραγματικής θετικής sites STAT3 ακόμη και στην ελάχιστη τιμή cut-off, ενώ STAT-Finder βρέθηκαν όλα αυτά. Αυτά τα δεδομένα υποδεικνύουν ότι STAT-Finder έδειξε καλύτερες επιδόσεις όσον αφορά την εξεύρεση αληθινή θετική STAT3 TFBSs ότι τα άλλα συγκριτικά προγράμματα χαθεί. Αυτό έγινε πιο εμφανής όταν ψάξαμε STAT3 TFBSs χρησιμοποιώντας EEL ή CONREAL στα σύνολα δεδομένων με δεσμευτικές γονιδίωμα-ευρεία STAT3. Παρά το γεγονός ότι η συνολική απόδοση της STAT-Finder ήταν παρόμοια με EEL στην ανίχνευση 56% της πραγματικής STAT3 TFBSs, μόνο STAT-Finder ήταν ικανή να ανιχνεύσει το υπόλοιπο 30% των πραγματικών χώρων (Σχήμα 4Β). Τα στοιχεία μας δείχνουν ότι η βελτιωμένη ευαισθησία της STAT-Finder θα μπορούσε να αποδοθεί στη χρήση των συνδυασμένων PWMs STAT που σχετίζονται, η οποία προφανώς ξεπέρασε τα όρια απόδοσης του V $ STAT3_01.

Καμπύλες για τις αλλαγές του αριθμού των αληθινών (? συνδυασμένη PWMs του V $ STAT3_01 και V $ STAT1_01 All), ή STAT-Finder, ως συνάρτηση του συνολικού αριθμού των προβλεπόμενων TFBSs (Α) στις θέσεις ανιχνευθεί με τη χρήση EEL (V $ STAT3_01 ή V $ STAT1_01), CONREAL δεσμευτική σύνολο αναφοράς του 22 γονίδια (Πίνακας S1) και (Β) στο γονιδίωμα-ευρεία STAT3 τσιπ Seq σύνολο δεδομένων [39].

η

επόμενο προσπάθησε γονιδίωμα-ευρεία πρόβλεψη της STAT3 δεσμευτικός ως ανθρώπινο υποκινητή περιοχές. Για το σκοπό αυτό, πρέπει πρώτα να υπολογίζεται η τιμή αποκοπής του σκορ διατήρησης μοτίβο (MCS) για την ταυτοποίηση συντηρημένες λειτουργικές STAT3 TFBSs. Ο βαθμός διατήρησης των προβλεπόμενων TFBS, η οποία καθορίζεται από τον υπολογισμό MCS, ενσωματώθηκε με τις βαθμολογίες συγγένεια με STAT-σαρωτή (βλέπε μεθόδους). Το σκορ εμπιστοσύνη σε κάθε MCS αξιολογήθηκε με τη χρήση των αλληλουχιών προαγωγού 2.5 kb όλων σχολιασμένες ανθρώπινων γονιδίων και ορθόλογα γονίδια του ποντικιού. Η βαθμολογία της εμπιστοσύνης καθορίζει την πιθανότητα ότι μια δεδομένη TFBS δεν διατηρείται από την τύχη. Ως τιμές αποκοπής του MCS αυξηθεί, ο συνολικός αριθμός των προβλεπόμενων STAT3 TFBSs μειώθηκαν με βραδύτερο ρυθμό από ό, τι το μέσο αριθμό των ευθυγραμμισμένων περιπτώσεις μοτίβα ελέγχου, με αποτέλεσμα κλιμακώθηκε βαθμολογίες εμπιστοσύνη στο MCS τιμές υψηλότερες από 0,9 (Σχήμα S5). Χρησιμοποιώντας STAT-Finder, πραγματοποιήσαμε μια έρευνα του γονιδιώματος κλίμακα για STAT3 TFBSs στις περιοχές ανθρώπινο υποκινητή. Μεταξύ των 15.461 ανθρώπινα γονίδια με προσδιορίζονται ορθόλογα στον ποντικό, περίπου 7.600 γονίδια προβλέπεται να έχει θέσεις σύνδεσης υποθετική STAT3 εντός της περιοχής του υποκινητή 2,5 kb, στο κατώφλι πιθανότητα 0,9. Σημαντικό εμπλουτισμό της STAT3 TFBSs θα μπορούσε να προβλεφθεί στο εγγύς ανάντη περιοχές της TSS χρησιμοποιώντας STAT-σαρωτή και STAT-Finder [35], [39] (Σχήμα S6).

Αναγνώριση των νέων γονιδίων στόχων STAT3 στον καρκίνο κύτταρα

Συστατική ενεργοποίηση STAT3 και υπερέκφραση του γονιδίου στόχου του έχουν προταθεί ότι παίζουν κρίσιμους ρόλους στην ανθρώπινη καρκινογένεση [12], [31], [47], [48], [49], [ ,,,0],50]. Για να καθοριστεί εάν ή όχι STAT-Finder είναι χρήσιμη στην ταυτοποίηση νέων γονιδίων στόχων STAT3, εφαρμόσαμε αυτό το πρόγραμμα σε μία ομάδα γονιδίων που υπερ-εκφράζεται σε ανθρώπινα καρκινικά κύτταρα. Έχουμε ενσωματώσει τα δεδομένα μικροσυστοιχιών που λαμβάνεται από την έκφραση της μονάδας χάρτη των γονιδίων up-ρυθμίζονται σε καρκίνο [51] και τα δεδομένα που προέρχονται από τα κύτταρα Α549 που υπερεκφράζουν ένα ιδιοσυστατικά ενεργή μορφή της STAT3 [52].

Μεταξύ των 33 γονιδίων που είναι συνήθως πάνω ρυθμισμένα, έντεκα έχουν ήδη αναφερθεί ότι ρυθμίζεται από STAT3 (Πίνακας 1). Χρησιμοποιώντας αυτή την ομάδα γονιδίων, που εξέτασε κατά πόσον ή όχι STAT-Finder θα μπορούσαν να ανιχνεύουν πειραματικά αποδειχθεί STAT3 TFBSs. Είναι αξιοσημείωτο ότι ήμασταν σε θέση να αναλύσει μόνο ένα κλάσμα των αλληλουχιών προαγωγού, κυρίως λόγω της εναλλακτικής χρήσης υποκινητή και την κακώς σχολιασμένα πληροφορίες TSS διαθέσιμα. STAT-Finder ανιχνεύονται τρεις υποθετικές θέσεις πρόσδεσης STAT3 στο

JunB

περιοχή υποκινητή των οποίων μία θέση που έχει προηγουμένως αναφερθεί ότι είναι μία θέση δέσμευσης STAT3 [53] (Σχήμα 5Α). Χρησιμοποιώντας τρεις διαφορετικές κυτταρικές σειρές που προέρχονται από ασθενείς με καρκίνο του ανθρώπου, επιβεβαιώσαμε STAT3 σύνδεση με το

JunB

προαγωγού με χρωματίνη ανοσοκαταβύθιση (Σχήμα 5Β). STAT-Finder ανιχνεύθηκε επίσης με επιτυχία μία STAT3 TFBS στην Νικοτιναμίδιο Ν-μεθυλτρανσφεράσης (

NNMT

) περιοχή προαγωγέα, μια πρόσφατα προσδιοριστεί γονίδιο στόχος STAT3 [54] (Σχήμα 5C, D). Είναι ενδιαφέρον, STAT-Finder δεν ήταν σε θέση να ανιχνεύσει γνωστό STAT3 TFBS στο

MYC

περιοχή του υποκινητή (Σχήμα 5Ε), παρόλο που

MYC

έχει αναφερθεί ότι είναι ένας στόχος STAT3 [55]. Έχει επίσης αναφερθεί ότι η πρόσδεση STAT3 με την περιοχή προαγωγέα του

MYC

γονίδιο απαιτεί μια θέση που είναι διαφορετική από την συναινετική STAT3 αλληλουχίες σύνδεσης, αλλά είναι παρόμοια με E2F TFBS, υποδεικνύοντας ότι, στην περίπτωση αυτή, STAT3 δεσμευτικές εξαρτάται από την παρουσία άλλων παραγόντων μεταγραφής [55]. Χρησιμοποιώντας ομάδες εκκινητών που ανιχνεύουν γνωστές θέσεις πρόσδεσης STAT3 στο

MYC

υποκινητή, ήμασταν σε θέση να επιβεβαιώσει δεσμευτική της κατά της IL-6 διέγερση σε κύτταρα HepG2 (Σχήμα 5F). Αυτά τα αποτελέσματα δείχνουν ότι STAT-Finder θα μπορούσε να ανιχνεύσει αποτελεσματικά θέσεις πρόσδεσης για STAT3 μόνο αν δεσμευτική τους δεν εξαρτάται από την παρουσία άλλων

cis

ή

trans

παράγοντες.

( A, C, E) ο δείκτης συνάφειας από STAT-σαρωτή (επάνω) και το οπίσθιο πιθανότητα από STAT-Finder (μέση) της προβλεπόμενης STAT3 απεικονίζονται στα συρόμενα παράθυρα για μια περιοχή 2,5 kb υποκινητή σε όλη την

JunB

(Α),

NNMT

(C), και

MYC

(Ε) γονιδιωματική τόπους. Το ανοικτό τετράγωνο στο κάτω μέρος δείχνει τις προβλεπόμενες TFBS με την οπίσθια πιθανότητα μεγαλύτερη από 0,95? ενώ ο αστερίσκος (*) στην περιοχή προαγωγού απεικονίζει το γνωστό STAT3 TFBS. (Β, D, F) χρωματίνης ανάλυση ανοσοκατακρήμνισης με ένα αντι-STAT3 αντισώματα: Αναφέρθηκαν STAT3 TFBSs του

JunB

(Β),

NNMT

(D), και

MYC

(F) ενισχύθηκαν με PCR χρησιμοποιώντας τους εκκινητές ειδικές θέσεις σύνδεσης (*) από την είσοδο και ανοσοκατακρημνίσθηκαν κυτταρολύματα, που προέρχεται από το μη-διεγερμένα ή IL-6 (10 ng /ml) + IL-6SR (10 ng /ml) διεγερμένων HepG2, Α549, και MDA-MB-231 κύτταρα.

Η

επόμενο εξετάστηκε κατά πόσον ή όχι μπορούμε να εντοπίσουμε νέα γονίδια στόχους της STAT3 χρησιμοποιώντας STAT-Finder. Για το σκοπό αυτό, επιλέξαμε γονίδια με συντηρημένες TSS (Πίνακας 1) και προσδιορίζεται η παρουσία του υποθετικού STAT3 TFBSs χρησιμοποιώντας STAT-Finder σε περιοχές προαγωγού τους. STAT-Finder ανιχνευθεί επιτυχώς υποθετικού STAT3 TFBSs με υψηλές πιθανότητες στις περιοχές υποκινητή του

AKAP12

(Α-κινάση αγκύρωσης πρωτεΐνη 12),

HIC2

(υπερ-μεθυλιωμένη στον καρκίνο 2), και

THBS1

(θρομβοσπονδίνη 1). STAT3 δέσμευση σε αυτές τις προβλεπόμενες θέσεις επιβεβαιώθηκε πειραματικά με δοκιμασία πλινθίου (Εικόνα 6Α-F). Για να επαληθεύσετε την ιδιαιτερότητα της STAT-Finder, προσδιορίσαμε επίσης τη δέσμευση της STAT3 με τις τοποθεσίες που δεν συντηρούνται, αλλά ήταν παρόντες στα υποστηρικτές των ανθρωπίνων ορθόλογα γονίδια. Σε αντίθεση με την διατηρημένη STAT3 TFBSs, δεν μπορέσαμε να ανιχνεύσει STAT3 σύνδεση με το μη-συντηρημένο STAT3 TFBSs σε ανθρώπινες καρκινικές κυτταρικές σειρές (Σχήμα 6G). STAT3 σύνδεση με άλλες προβλέψει STAT3 TFBSs παρόντες στις περιοχές υποστηρικτής του

ATF3

(παράγοντα ενεργοποίησης της μεταγραφής 3),

DUSP5

(διπλή φωσφατάση ειδικότητα 5),

SERPINE1

(serpin αναστολέα πεπτιδάσης, κατηγορίας Ε),

NP

(νουκλεοζιτική φωσφορυλάση), και

SLC2A3

(διαλυμένης ουσίας φορέα οικογένεια 2, διευκολύνεται μεταφορέα γλυκόζης, μέλος 3) επίσης πειραματικά επικυρωμένη (Σχήμα S7). Τέλος, μελετήσαμε το εάν ή όχι άλλα εργαλεία υπολογισμού όπως το χέλι ή CONREAL θα μπορούσε επίσης να ανιχνεύσει με ακρίβεια τις περιοχές στόχου STAT3 που έχουν εντοπιστεί και επικυρωθεί στην παρούσα μελέτη. Των αλληλουχιών 10 προαγωγού που περιέχει πειραματικά αποδειχθεί θέσεις πρόσδεσης 10 STAT3 (σχήμα 5, 6 και S7), STAT-Finder προέβλεψε ένα σύνολο 29 θέσεων σύνδεσης STAT3 συμπεριλαμβανομένων όλων από τα 10 πειραματικά επικυρωμένη θέσεις δέσμευσης STAT3. Εν τω μεταξύ, το χέλι και CONREAL ανιχνευθούν μόνο 5 (50%) και 2 (20%) επικυρώνονται STAT3 θέσεις πρόσδεσης μεταξύ 23 και 6 συνολικά προβλέψεις, αντίστοιχα, υποδεικνύοντας έτσι ότι STAT-Finder έχει καλύτερη απόδοση σε σχέση με τον εντοπισμό νέων γονιδίων στόχων του STAT3 ( Εικόνα S8).

(A, C, E) Ο δείκτης συνάφειας (κορυφή, STAT-Scanner) και οπίσθιας πιθανότητας (μέση, STAT-Finder) της προβλεπόμενης STAT3 TFBSs απεικονίζονται στα συρόμενα παράθυρα για 2.5 περιοχή -Kb υποστηρικτής σε όλη την

AKAP12

(Α),

HIC2

(C), και

THBS1

(Ε) γονιδιακού τόπου. Η κλειστή πλατεία στο κάτω μέρος δείχνει τις προβλεπόμενες TFBS με οπίσθιο πιθανότητα & gt? 0.5? ενώ το κίτρινο τετράγωνο δείχνει τις προβλεπόμενες TFBS χωρίς συντήρηση. (B, D, F) ανάλυση τσιπ με ένα αντι-STAT3 αντίσωμα. Υποθετική STAT3 TFBSs του

AKAP12

(Β),

HIC2

(D), και

THBS1

ενισχύθηκαν με PCR χρησιμοποιώντας τα σετ εκκινητών υποδεικνύονται με αντίστροφη βέλη. ανάλυση (G) τσιπ με ένα αντι-STAT3 αντίσωμα. Προβλεπόμενη TFBSs χωρίς τη διατήρηση του ανθρώπινου

AKAP12

,

HIC2

, και

THBS1

γονίδια ενισχύθηκαν με PCR χρησιμοποιώντας τα σύνολα αστάρι που υποδεικνύεται από τα βέλη αντίστροφο.

Συζήτηση

Εμείς παρουσίασε ένα υπολογιστικό πλαίσιο για τον προσδιορισμό των λειτουργικών STAT3 TFBSs σε προωθητές θηλαστικών. Το πρώτο διαμέρισμα, STAT-Scanner, σχεδιάστηκε για να προβλέψει λειτουργικά STAT3 TFBSs με βελτιωμένη ευαισθησία. Με τη χρήση συγκριτικών ευθυγραμμίσεις μοτίβο με βάση το STAT-Scanner συνδέθηκε με STAT-Finder για την ελαχιστοποίηση των ψευδώς θετικών προβλέψεων. προτεινόμενη μέθοδος μας δοκιμάστηκε χρησιμοποιώντας προηγουμένως εντοπιστεί γονιδίων στόχων STAT3 και εφαρμόστηκε με επιτυχία στην ταυτοποίηση νέων γονιδίων στόχων.

Η στρατηγική μας για την ανάπτυξη STAT-Finder στηρίχθηκε σε διάφορες υποθέσεις. Πρώτον, η εξειδίκευση δέσμευσης DNA της STAT3 μοιράζεται με άλλα μέλη της οικογένειας STAT. παράγοντες μεταγραφής STAT δεσμεύονται σε όμοιες αλληλουχίες DNA, και η παρόμοια εξειδίκευση των διαφόρων παραγόντων μεταγραφής STAT, όπως STAT1, STAT5A /5Β, ή STAT6, δέσμευσης DNA έχουν αποδειχθεί πειραματικά [56]. Έχει επίσης σημειωθεί ότι η ενσωμάτωση των επικαλυπτόμενων αγώνων ανιχνεύονται από μήτρες από τα ίδια τα μέλη της οικογένειας μειώνει σημαντικά ο αριθμός των συνολικών προβλεπόμενων TFBSs, και ως εκ τούτου μειώνει το ποσοστό των ψευδώς θετικών ανίχνευσης [57]. Επιπλέον, έχει πρόσφατα αναφερθεί ότι περίπου το ήμισυ των TFs αναγνωρίζουν πολλαπλά μοτίβα αλληλουχία [58]. Ως εκ τούτου, μια συμβατική προσέγγιση σάρωσης μοτίβο χρησιμοποιώντας ένα μόνο PWM για κάθε TF έχει εγγενή περιορισμό στην ανίχνευση όλων των λειτουργικών TFBSs. Ως αποτέλεσμα, η προβλεπτική ικανότητα της STAT-Scanner ενισχύθηκε σημαντικά με την ενσωμάτωση STAT που σχετίζονται με PWMs. Η δεύτερη υπόθεση, που χρησιμοποιούνται για τις ευθυγραμμίσεις μοτίβο που βασίζεται, είναι ότι οι σχετικές θέσεις των λειτουργικών TFBSs συντηρημένες μεταξύ στενά συγγενικών ειδών θηλαστικών. Στη ζύμη, άκρως συντηρημένη TFBSs για ένα σύνολο TFs παρουσιάζουν σχετικά χαμηλή χωρική αποκλίσεις (~150-200 bp) [20]. Ομοίως, διαπιστώσαμε ότι, για έξι είδη θηλαστικών, γνωστό STAT3 TFBSs που βρίσκονται σε παρόμοια χωρική κατανομή σε κάθε υποκινητή.

Χρησιμοποιώντας STAT-Finder, έχουμε εντοπίσει μια λίστα των γονιδίων στόχων STAT3 που εκφράζονται πάνω- σε ανθρώπινα καρκινικά κύτταρα. Ομοίως, STAT3 σύνδεση με το προβλεπόμενο TFBSs έχει πειραματικά επαληθευτεί σε IL-6 που διεγείρεται ανθρώπινες καρκινικές κυτταρικές σειρές. Είναι ενδιαφέρον, STAT3 προσλήφθηκε στα προβλεφθέντα TFBS σε ένα κύτταρο τύπου-ειδικό τρόπο. Για παράδειγμα, STAT3 σύνδεση με το προβλεπόμενο TFBSs στις περιοχές προαγωγέα του

AKAP12

και

HIC2

γονίδια παρατηρήθηκε σε μη διεγερμένα, αλλά όχι σε IL-6 που διεγείρεται Α549 και MDA-MB- 231 κύτταρα. Ωστόσο, στα κύτταρα HepG2, STAT3 προσλήψεως στον ίδιο TFBS μόνο μετά IL-6 διέγερση (Σχήμα 6). Σε αντίθεση, STAT3 δεσμευτική για τις περιφέρειες υποστηρικτής του

MYC

,

SERPINE1

,

NP

, και

SLC2A3

ήταν ανιχνεύσιμη μόνο σε IL-6 που διεγείρεται κύτταρα HepG2, αλλά όχι σε Α549 ή MDA-MB-231 (Σχήμα 6, Σχήμα S7). Επιπλέον, είναι προφανές ότι η σύνδεση STAT3 με την προβλεπόμενη TFBSs στους υποκινητές των γονιδίων υποψήφιος στόχος δεν εγγυάται την έκφραση του εν λόγω γονιδίου. Αν και η έκφραση των περισσότερων γονιδίων στόχων είχε μεταβληθεί μετά από δέσμευση STAT3 με τον υποκινητή, βρήκαμε ότι η δέσμευση STAT3 στις θέσεις στόχους δεν συσχετίζονται πάντα με την έκφραση του γονιδίου σε κυτταρικές γραμμές που δοκιμάστηκαν (Oh, ΥΜ, αδημοσίευτα δεδομένα). Αυτό υποδηλώνει ότι η σύνδεση STAT3 στις θέσεις στόχους δεν είναι επαρκής για την επαγωγή γονιδιακής έκφρασης, και παράγοντες μεταγραφής ιστού-ειδική, ή trans-ενεργοποιητές που προσδιορίζει τροποποίηση στην χρωματίνη περιοχή μπορεί επίσης να απαιτείται [59], [60], [61], [62].

ένα

cis-ρυθμιστικών

μονάδα αποτελείται από ένα σύμπλεγμα πολλαπλών TFBSs που συνεργατικά-αλληλεπιδρούν με TFs για τον έλεγχο της γονιδιακής έκφρασης. Η ταυτοποίηση των

cis-ρυθμιστικών

ενότητες για την ειδική ρύθμιση του γονιδίου είναι ένα προκλητικό βήμα προς την κατανόηση του γονιδιώματος σε επίπεδο μεταγραφής ρυθμιστικών δικτύων σε γονιδιώματα θηλαστικών. Ως εκ τούτου, είναι αναγκαίο να προβλεφθεί αποτελεσματική λειτουργική TFBSs για μεμονωμένες TFs. Αναμένουμε ότι το συγκριτικό μας προσέγγιση μπορεί να εφαρμοστεί και σε άλλες TFs με ορισμένους περιορισμούς. Πρώτον, η αποτελεσματικότητα του προγράμματος μας εξαρτάται από τον βαθμό της εξελικτικής διατήρησης μεταξύ των έξι είδη θηλαστικών. Ως εκ τούτου, θέσεις σύνδεσης DNA για ΤΡ που ασχολούνται με τη γονιδιακή ρύθμιση ειδική για το είδος δεν μπορεί να προβλεφθεί. Αξίζει να σημειωθεί ότι η συχνή κέρδος ή απώλεια TFBSs στις διαγονιδιακές περιοχές οδηγεί στην εξέλιξη του μεταγραφικού κυκλωμάτων [63]. Δεύτερον, το πρόγραμμά μας δεν μπορεί να εφαρμοστεί στην ΤΡ που βασίζονται επί της σύνδεσης άλλο DNA πρωτεϊνών για την πρόσληψη στο DNA. Τρίτον, γιατί σε σύγκριση με μόνο 2 kb ανοδικής αλληλουχίας προαγωγού σε σχέση με το σχολιασμένο TSS, θέσεις πρόσδεσης DNA του ΤΡ που είναι εμπλουτισμένα σε περιοχές μακριά από τον TSS θα μπορούσε να αγνοηθεί από το πρόγραμμα μας.

You must be logged into post a comment.