PLoS One: Ένα μυθιστόρημα HMM-Based μέθοδος για την ανίχνευση Εμπλουτισμένο Μεταγραφή Factor Δεσμευτική τοποθεσίες Αποκαλύπτει RUNX3 ως πιθανός στόχος σε καρκίνο του παγκρέατος Biology


Αφηρημένο

Ιστορικό

παγκρέατος αδενοκαρκίνωμα (PAC) είναι ένα από τα πιο δυσεπίλυτα κακοήθειες. Προκειμένου να αναζητήσουν πιθανούς νέους θεραπευτικούς στόχους, στηριχθήκαμε στις υπολογιστικές μεθόδους με στόχο τον προσδιορισμό του μεταγραφικού παράγοντα sites (TFBSs) υπερ-εκπροσωπούνται στις περιοχές των υποκινητών των γονιδίων που εκφράζονται διαφορικά σε PAC δεσμευτική. Αν και έχουν πολλές υπολογιστικές μέθοδοι έχουν εφαρμοστεί για να επιτευχθεί αυτό, κανένας δεν έχει κερδίσει γενική αποδοχή ή παράγονται αποδειχθεί νέων στόχων σε PAC. Για το σκοπό αυτό έχουμε αναπτύξει DEMON, μια νέα μέθοδο για την ανίχνευση μοτίβο.

Μεθοδολογία

DEMON βασίζεται σε ένα κρυμμένο μοντέλο Markov να σκοράρει την εμφάνιση των μοτίβων ακολουθίας, λαμβάνοντας υπόψη όλες τις πιθανές τοποθεσίες στη ένας προαγωγός ενδεχομένως ποικίλες συγγένειες σύνδεσης. Έχουμε αποδείξει την ακρίβεια δαίμονα για προσομοίωση και πραγματική σύνολα δεδομένων. Εφαρμόζοντας DEMON με τον PAC που σχετίζονται με τα σύνολα δεδομένων που προσδιορίζει την οικογένεια RUNX ως ιδιαίτερα εμπλουτισμένο σε PAC που σχετίζονται με τα γονίδια. Χρησιμοποιώντας μια νέα πειραματικό παράδειγμα να διακρίνουν μεταξύ φυσιολογικών και PAC κύτταρα, διαπιστώνουμε ότι RUNX3 mRNA (αλλά όχι RUNX1 ή RUNX2 mRNAs) παρουσιάζει εξαρτώμενη από το χρόνο αυξάνει σε φυσιολογικά αλλά όχι σε κύτταρα PAC. Οι αυξήσεις αυτές συνοδεύονται από αλλαγές στα επίπεδα mRNA των στόχων υποτιθέμενο γονίδιο RUNX.

Συμπεράσματα

Η ολοκληρωμένη εφαρμογή των DEMON και ένα νέο σύστημα διαφοροποίηση οδήγησε στην ταυτοποίηση ενός μοναδικού μέλους της οικογένειας, RUNX3, που μαζί με τέσσερις από τους πιθανούς στόχους του του έδειξε μια ισχυρή απάντηση σε ένα ερέθισμα διαφοροποίηση σε υγιή κύτταρα, ενώ αυτό το ρυθμιστικό μηχανισμό απουσίαζε στα κύτταρα PAC, τονίζοντας RUNX3 ως μια πολλά υποσχόμενη στόχος για περαιτέρω μελέτες

Παράθεση:. Levkovitz L , Yosef Ν, Gershengorn MC, Ruppin Ε, Sharan R, Oron Υ (2010) A Novel HMM-Based μέθοδος για την ανίχνευση Εμπλουτισμένο Μεταγραφή Factor τοποθεσίες Δεσμευτική αποκαλύπτει RUNX3 ως πιθανός στόχος για τον καρκίνο του παγκρέατος Βιολογία. PLoS ONE 5 (12): e14423. doi: 10.1371 /journal.pone.0014423

Επιμέλεια: Dov Joseph Stekel, Πανεπιστήμιο του Nottingham, Ηνωμένο Βασίλειο

Ελήφθη: 2 Φεβρουαρίου 2010? Αποδεκτές: 10η Σεπτεμβρίου, 2010? Δημοσιεύθηκε: 22η Δεκεμβρίου 2010

Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της δήλωσης Creative Commons Public Domain που ορίζει ότι, μόλις τοποθετηθεί στο δημόσιο τομέα, το έργο αυτό μπορεί να αναπαραχθεί ελεύθερα, διανεμηθεί, μεταδοθεί, τροποποιηθεί, χτισμένο πάνω, ή ειδάλλως να χρησιμοποιηθεί από οποιονδήποτε για οποιονδήποτε νόμιμο σκοπό

Χρηματοδότηση:. η εργασία αυτή υποστηρίζεται από ένα ERA-NET επιχορήγηση pathogenomics να ER και RS, και επιχορήγηση Ισραήλ Καρκίνου στο ER, RS και YO. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή παγκρεατικό αδενοκαρκίνωμα

(PAC) είναι μία από τις πιο επιθετικές μορφές καρκίνου. Αν και 10η σε συχνότητα, είναι η τέταρτη κύρια αιτία των θανάτων από καρκίνο στον δυτικό κόσμο. PAC χαρακτηρίζεται από καθυστερημένη διάγνωση, ταχεία εξέλιξη και εκτεταμένη μετάσταση και είναι σχεδόν εντελώς ανθεκτική σε όλες τις θεραπευτικές αγωγές. Παρά το γεγονός ότι το 10-15% των όγκων PAC μπορεί να αντιμετωπιστεί με μερική παγκρεατεκτομή, ο μέσος χρόνος μεταξύ διάγνωσης και ο θάνατος είναι 3-6 μήνες και το ποσοστό επιβίωσης 5 ετών είναι κάτω από 5%. Στις ΗΠΑ, περίπου 30.000 νέες περιπτώσεις διαγιγνώσκονται κάθε χρόνο και σχεδόν ο ίδιος αριθμός των ασθενών PAC πεθαίνουν κάθε χρόνο από τη νόσο [1], [2]. Αυτή η ζοφερή εικόνα που κάνει αυτό το καρκίνο άξιος θέμα για την αναζήτηση νέων θεραπευτικών στόχων. Ωστόσο, δημοσιευμένες μελέτες γονιδιακής έκφρασης, μέχρι στιγμής, έχουν αποτύχει να εντοπίσει χρήσιμοι θεραπευτικοί στόχοι.

Προσδιορισμός των μεταγραφικών παραγόντων (ΤΡ) που συμμετέχουν σε βασικές βιολογικές διεργασίες και διάφορες παθολογικές καταστάσεις, ιδιαίτερα του καρκίνου και κληρονομικών διαταραχών, έχει αποκτήσει δημοτικότητα Τα τελευταία χρόνια. TFs είναι κύριος ελεγκτές των αλλαγών στην έκφραση πολλαπλών γονιδίων και έτσι μπορεί να χρησιμεύσουν ως προτιμώμενοι στόχοι για θεραπείες των ασθενειών του ανθρώπου. Ένας σχετικά μεγάλος αριθμός μεθόδων για την αναγνώριση εμπλουτίζεται θέσεις πρόσδεσης TF (TFBSs) υπάρχουν [3] – [5], αλλά δεν υπάρχει ενιαία μέθοδος έχει κερδίσει την καθολική προτίμηση έναντι των άλλων

Η εφαρμογή του state-of-the-. τέχνη PRIMA αλγόριθμο [4] σε σύνολα δεδομένων που αντανακλά διαφορική έκφραση των γονιδίων σε PAC επεσήμανε ZNF350 ως ένα σημαντικό TF σε PAC βιολογία (αδημοσίευτη). Ωστόσο, τα πειράματα qRT-PCR έδειξε μόνο μικρές αλλαγές στην έκφραση ZNF350 κατά την απομάκρυνση του ορού των κυττάρων PAC (βλέπε Εικ. S1). Εν όψει της σημασίας αυτής της μεθοδολογίας, επιδιώξαμε να αναπτύξει μια νέα μέθοδο που αποσκοπούν στην καλύτερη προγνωστική αξία σε βιολογικά πειράματα.

Ένας σχετικά μεγάλος αριθμός μελετών γονιδιακής έκφρασης PAC έχουν πραγματοποιηθεί, με τη χρήση ασθενών και υγιών παγκρεατικών ιστών και γραμμές PAC in vitro. . Brandt

et al

[6] επανεξετάζονται τα στοιχεία από 10 μελέτες έκφρασης και εντόπισε κοντά στο 1000 γονίδια, η έκφραση των οποίων αλλάζουν σε PAC? 148 από αυτά τα γονίδια εντοπίστηκαν σε δύο ή περισσότερες μελέτες. Ο κατάλογος συντάχθηκε από Brandt

et al

. περιλαμβάνει γονίδια τα οποία εκφράζονται σε ένα υψηλό ποσοστό των μελετών PAC και είχαν συσχετιστεί με πολλούς τύπους καρκίνων, όπως Ras, ΙΝΚ4, Ρ53, κλπ Καμία, ωστόσο, φαίνεται να εξηγήσει την «καταστροφική» [7] εξέλιξη της ασθένειας αυτής . Παρά το γεγονός ότι μεμονωμένες πρωτεΐνες μπορεί να χρησιμεύσουν ως υποσχόμενους στόχους για την ανάπτυξη φαρμάκων, η έρευνα για θεραπευτικούς στόχους σε PAC έχει αποτύχει μέχρι τώρα να παράγουν νέα ελπιδοφόρα οδηγεί φαρμάκου. Εννοιολογικά, οι θεραπείες που απευθύνονται σε ΤΡ που είναι κύριος ρυθμιστές της έκφρασης ενός μεγάλου αριθμού γονιδίων, είναι δυνητικά πιο πιθανό να επηρεάσει τον καρκίνο κυτταρική βιολογία και είναι ιδιαίτερα ελκυστική.

Εδώ έχουμε εφαρμόσει μια νέα μέθοδο, DEMON, για ανίχνευση εμπλουτίζεται TFBSs και ένα νέο πρότυπο για τη σύγκριση της κανονικής του παγκρέατος και των κυττάρων PAC. Εφαρμόζοντας DEMON σε PAC πειραματικών δεδομένων προέβλεψε ότι θέσεις δέσμευσης για την υποοικογένεια RUNX του ΤΡ είναι ιδιαίτερα εμπλουτισμένο σε σχετικές διαφορικά εκφραζόμενο σύνολα γονιδίων. qRT-PCR επιβεβαίωσε RUNX3 ως ένα διαφορικά εκφραζόμενο TF. Εν κατακλείδι, DEMON αποδείχθηκε ότι είναι ένα χρήσιμο εργαλείο πρόβλεψης στην ανάλυση TFBSs και, μαζί με τα πειραματικά αποτελέσματα, δείχνουν ότι RUNX3 μπορεί να αποδειχθεί ένας σημαντικός TF-στόχο σε παγκρεατικά έρευνα για τον καρκίνο.

Αποτελέσματα

ανίχνευση Εμπλουτισμένο μοτίβα σε συνεργασία ρυθμιζόμενα γονίδια (DEMON)

Λαμβάνοντας υπόψη ένα σύνολο στόχων υποστηρικτές της συν-ρυθμιζόμενων γονιδίων και ένα σύνολο γνωστών μοτίβων TFBS (εκπροσωπήθηκαν ως μήτρες βάρους θέση από τη βάση δεδομένων TRANSFAC [8], βλέπε μέθοδοι), DEMON επιδιώκει μοτίβα που εμφανίζονται σε αυτές τις υποκινητές πιο συχνά από ό, τι αναμένεται από την τύχη (δηλαδή, μοτίβα που εμπλουτίζονται στο στόχο που έχει τεθεί). Ο αλγόριθμος χρησιμοποιεί ένα κρυφό μοντέλο Markov (HMM) για να περιγράψει την πιθανολογική διαδικασία που δημιουργεί τις ακολουθίες υποκινητή, και να εκτιμηθεί πόσο πιθανό είναι ότι κάθε δεδομένο μοτίβο είναι εμπλουτισμένη με το στόχο που είχε τεθεί.

Κάθε HMM περιέχει κράτη για ένα μοναδικό μοτίβο και φόντο δηλώνει ότι το μοντέλο τμήματα μεταξύ μοτίβο (Εικ. 1). DEMON βαθμολογίες κάθε δικαιούχος για την εμφάνιση οποιουδήποτε δεδομένου μοτίβο. Η βαθμολογία αυτή αντανακλά την πιθανότητα ότι η αλληλουχία δημιουργήθηκε με βάση την ΗΜΜ που περιγράφει το μοτίβο, έναντι της πιθανότητας ότι δημιουργήθηκε με βάση ένα απλό μοντέλο φόντο. Με δεδομένο τον στόχο που συν-ρυθμιζόμενων γονιδίων, οι βαθμολογίες των υποκινητών συνόψισε για κάθε HMM, και σε σύγκριση με τα ποσά των βαθμολογιών που λαμβάνονται με τυχαία συνόλων-στόχων. Η σύγκριση αυτή χρησιμοποιείται για να εκχωρήσετε ένα

σ

-τιμή για κάθε ένα μοτίβο που αντανακλά την αφθονία του στις περιοχές υποκινητή της στόχο που έχει τεθεί (βλέπε Σχ. 2 και Μέθοδοι).

Η ΗΜΜ αποτελείται του μοτίβου μελών (σε ροζ), τα κράτη φόντο (σε μπλε χρώμα) και μια κρατική αρχή. Μια κατάσταση φόντο ορίζεται για κάθε νουκλεοτίδιο (τέσσερα μέλη) και μια κατάσταση μοτίβο ορίζεται για κάθε θέση κατά μήκος του PWM που αντιστοιχεί στο TFBS ενδιαφέροντος. Οι πιθανότητες εκπομπής των μελών μοτίβο καθορίζονται σύμφωνα με την PWM, και εκείνα των μελών υποβάθρου έχουν οριστεί σε 1 για το αντίστοιχο νουκλεοτίδιο. πιθανότητες μετάβασης μεταξύ των κρατών φόντο αντανακλούν την κατανομή των δινουκλεοτιδίων σε όλες τις περιοχές υποτιθέμενου προαγωγέα στον άνθρωπο. Η πιθανότητα μετάβασης από κάθε κράτος μοτίβο στο επόμενο έχει οριστεί σε 1. Παραμένοντας μεταβάσεις περιλαμβάνουν κινείται προς τα κράτη φόντο (διακεκομμένη βέλη) ή κινούνται προς την πρώτη κατάσταση μοτίβο (στερεά βέλη). Αυτές οι μεταβάσεις μάθει χρησιμοποιώντας τον αλγόριθμο Baum-Welch.

Η

α. Ανάκτηση κατάλογο των συν-εκφρασμένων γονιδίων από πειράματα υψηλής απόδοσης. σι. Για κάθε ζεύγος ΗΜΜ-υποκινητή μια βαθμολογία υπολογίζεται ως ο λόγος μεταξύ της πιθανότητας να εκπέμπει την αλληλουχία προαγωγού χρησιμοποιώντας το TFBS ΗΜΜ και την πιθανότητα να εκπέμπει την αλληλουχία προαγωγού χρησιμοποιώντας ένα ΗΜΜ φόντο. Το άθροισμα των βαθμολογιών για κάθε TF χρησιμοποιείται για τον υπολογισμό ενός ενιαίου βαθμολογία αντικατοπτρίζει τη συνολική αφθονία του TF στο σύνολο υποκινητή εισόδου. ντο. Τυχαία επιλογή 100 σύνολα δεδομένων υποκινητή με το ίδιο μέγεθος με το πρωτότυπο σετ δεδομένων. Οι βαθμολογίες υπολογίζονται όπως προηγουμένως για τα εν λόγω σύνολα δεδομένων. ρε. Κάθε TF έχει εκχωρηθεί με μια εμπειρική ρ-τιμή που ορίζεται ως το ποσοστό των τυχαίων περιπτώσεων στις οποίες είχαν υψηλότερη βαθμολογία.

Η

Η αξιολόγηση των επιδόσεων σε προσομοιωμένα και πραγματικά δεδομένα

Για να δοκιμάσετε την προσέγγισή μας, θα αξιολογηθούν συγκριτικά πρώτη DEMON σε δεδομένα προσομοίωσης. Για το σκοπό αυτό προσομοιώνεται σύνολα 100 τυχαίων υποκινητών, των οποίων οι αλληλουχίες επιλέχθηκαν σύμφωνα με την πιθανότητα υπόβαθρο των δινουκλεοτιδίων σε περιοχές πραγματικό υποκινητή (Μέθοδοι). Στη συνέχεια φύτεψε ένα πραγματικό μοτίβο σε x% (10≤x≤90) από τους δικαιούχους σε κάθε σετ (τρεις περιπτώσεις από τα μοτίβα φυτεύτηκαν σε κάθε υποκινητή). Επαναλάβαμε αυτή τη διαδικασία για όλους τους σπονδυλωτών μήτρες βάρος θέση (PWMs) στην βάση δεδομένων TRANSFAC [8] (βλέπε Μέθοδοι).

Το Σχήμα 3 συγκρίνει την απόδοση της DEMON με εκείνη του αλγορίθμου PRIMA. Εμείς επιλέξαμε PRIMA ως εκπρόσωπος μιας ομάδας των μεθόδων που χρησιμοποιούν ένα σκληρό όριο για τον εντοπισμό υποθετικών εμφανίσεις των μοτίβων σε κάθε δεδομένη υποκινητή. Τέτοιες μέθοδοι μπορεί να αποτύχει να εντοπίσει «ασθενή» εμφανίσεις του μοτίβου και συχνά δεν λαμβάνουν υπόψη τον πραγματικό αριθμό των εμφανίσεων του μοτίβου (για παράδειγμα, σε PRIMA, οι δικαιούχοι κατηγοριοποιούνται σε εκείνους που έχει 0, 1, 2, ή περισσότερο από 2 εμφανίσεις του μοτίβου).

Μια σύγκριση μεταξύ του δαίμονα και την απόδοση PRIMA για σύνολα δεδομένων με διάφορες ποσοστό των υποκινητών με φυτεύονται μοτίβα.

η

Προφανώς, σε όλες τις περιπτώσεις DEMON επιτυγχάνει καλύτερα αποτελέσματα τόσο από την άποψη της εξειδίκευσης και ευαισθησίας. Διενεργήσαμε επιπλέον προσομοιώσεις, μεταβάλλοντας τον αριθμό των υποκινητών σε κάθε σύνολο, ή τον αριθμό των μοτίβων που φυτεύτηκαν σε κάθε υποκινητή. Τα αποτελέσματα παρέμειναν ποιοτικά παρόμοια (Σχ S2 και S3).

Prima έχει ένα οριακό πλεονέκτημα έναντι DEMON για μικρά σύνολα δεδομένων (για 30 προωθητές, Demon ποσοστό ψευδώς θετικών (FPR) είναι 0,0006 έναντι 0,0004 για PRIMA, βλ . S3). Ωστόσο, αυτές οι πολύ χαμηλοί αριθμοί κάνουν το FPR και των δύο μεθόδων ουσιαστικά ίσα.

Στη συνέχεια, συγκρίναμε τις δύο μεθόδους για την πρόσφατα δημοσιευμένη

Amadeus

μεταζώων σημείο αναφοράς, το οποίο είναι μια συλλογή των TF και microRNA σύνολα γονιδίου στόχου που προέρχεται από τα πειράματα υψηλής απόδοσης (γονίδιο μικροσυστοιχιών έκφραση και πειράματα τσιπ on-chip) [9]. Έχουμε κατεβάσει όλα τα ανθρώπινα και το ποντίκι καταχωρήσεις αυτής της συλλογής, όπου κάθε εγγραφή περιέχει ένα μόνο TF και τον κατάλογο των γονιδίων-στόχων (που κυμαίνονται 25-2238 γονίδια).

Ο Πίνακας 1 παρουσιάζει τα αποτελέσματα της DEMON και PRIMA πάνω από όλα τα εξεταζόμενα καταχωρήσεις δεδομένων. DEMON αναγνώρισε την αλήθεια TF στο 70,3% των περιπτώσεων (όπου το 51,8% των περιπτώσεων η πραγματική TF κατατάσσεται στην πρώτη ή τη δεύτερη θέση), ενώ PRIMA θα προσδιορίζονται στο 55,5% των περιπτώσεων (στο 48,1% των περιπτώσεων, η πραγματική TF κατατάσσεται στην πρώτη ή τη δεύτερη θέση). Επιπλέον, το 37% των περιπτώσεων DEMON κατετάγη η σωστή TF υψηλότερη από PRIMA ενώ PRIMA κατετάγη το δικαίωμα TF υψηλότερα από δαίμονα σε μόνο 18,5% των περιπτώσεων.

Η

Ανίχνευση TFs που εμπλέκονται στη ρύθμιση της μεταγραφής στο PAC

Σας χρησιμοποιήθηκε αρχικά μια λίστα των διαφορικά εκφρασμένων γονιδίων σε PAC συντάχθηκε από Brandt

et al.

[6] από τις 10 μελέτες. Έχουμε λάβει από τον κατάλογο μια μικρότερη λίστα με 45 γονίδια που εντοπίστηκαν ως διαφορικά εκφρασμένων σε 3 ή περισσότερες μελέτες, εκ των οποίων 38 (30 που παρουσίασαν αυξημένη και 8 που παρουσίασαν μειωμένη έκφραση) συμφωνημένα συλλογή μας για την ανθρώπινη υποκινητές (βλέπε πίνακα S1). Αναλύσαμε αυτή τη λίστα χρησιμοποιώντας DEMON και βρήκε σημαντικό εμπλουτισμό των 6 μοτίβα, εκ των οποίων οι πιο εμπλουτισμένου μοτίβα ήταν για την RUNX υπο-οικογένεια των TFs (ονομάζεται επίσης η AML υπο-οικογένεια). Όταν περιορίζονται τα δεδομένα συναίνεση που στα 30 γονίδια που παρουσίασαν αυξημένη μεταγραφή, DEMON βρέθηκαν σημαντικό εμπλουτισμό των 8 μοτίβα, εκ των οποίων οι πιο εμπλουτισμένο μοτίβα ήταν επίσης για RUNX.

Η TFs του RUNX υπο-οικογένεια , οι συνεργάτες σύνδεσης ετεροδιμερικού ρυθμιστές της μεταγραφής συμβολίζεται ως CBFs (πυρήνας παράγοντες δέσμευσης) εκ των οποίων οι CBFA (RUNX) μέλη δεσμεύονται άμεσα με το DNA και τα δύο εναλλακτικά ματισμένα ΟΒΡΒ (επίσης γνωστή ως PEBP) μέλη δεσμεύονται με την υπομονάδα CBFA και να ενισχύσει δέσμευσης DNA του [10]. Αξίζει να σημειωθεί ότι PEBP εμφανίζεται ως τρίτη και μία δεύτερη πιο εμπλουτισμένο TF, αντίστοιχα (βλέπε Πίνακα 2).

Η

Θα χρησιμοποιηθεί PRIMA να αναλύσει τις ίδιες λίστες, και βρήκε ένα σημαντικό εμπλουτισμό ενός μοτίβου, ZBRK1, που ονομάζεται επίσης ZNF350 (βλέπε πίνακα S2). Ωστόσο, τα πειράματα qRT-PCR έδειξε μόνο μικρές αλλαγές σε ZNF350 έκφραση σε PANC-1s αμέσως μετά την απόσυρση του ορού (μη δημοσιευμένα αποτελέσματα, βλέπε Σχ. S1).

Οι τρεις εντόνως ομόλογο TFs ανθρώπινη RUNX (RUNX1, 2, και 3 ) έχουν εμπλακεί στην αναπτυξιακές διαδικασίες και, ιδίως, στον καρκίνο. RUNX1 (επίσης γνωστή ως AML1) έχει εκτενώς τεκμηριωθεί ως ένας σημαντικός παράγοντας στην αιματοποίηση και στην αιτιολογία της οξείας μυελογενούς λευχαιμίας (για ανασκόπηση βλέπε [11]). RUNX2 έχει δειχθεί ότι εμπλέκεται στην ανάπτυξη των οστών (για ανασκόπηση βλέπε [12]) και RUNX3 τεκμηριώθηκε ως σημαντικό TF σε ανάπτυξη των Τ-λεμφοκυττάρων [13] – [15] και έχει συσχετισθεί με την παθογένεση πολλών κακοηθειών [ ,,,0],16], συμπεριλαμβανομένων PAC [17], [18]. Ως εκ τούτου, η ανάλυση DEMON προβλέπει ότι τα μέλη της οικογένειας RUNX TF είναι κορυφαία υποψήφιοι υπεύθυνοι για αλλαγμένη μεταγραφή των γονιδίων στο σύνολο συναίνεση δεδομένων PAC.

RUNX πειραματική επαλήθευση

Τα περισσότερα από τα πειραματικά δεδομένα στον καρκίνο συγκρίνετε γονιδιακή έκφραση των καρκινικών ιστών με εκείνη των υγιών ιστών των ανθρώπινων δοτών. Η σύγκριση αυτή φιλτράρει τη μεταβλητότητα της έκφρασης των γονιδίων λόγω του φύλου και της ηλικίας του ασθενούς, το στάδιο της νόσου, η συμμετοχή των μη συνδεδεμένων παθολογικών καταστάσεων, διαφορετική (καρκίνος στόχευσης και άλλα) φαρμακευτικές θεραπείες, όπως επίσης και την εθνική γενετική και τον τρόπο ζωής. Έτσι, μόνο οι κοινά γονίδια με τον PAC στο φόντο όλων των παραπάνω πηγών μεταβλητότητας εκπροσωπούνται. Αξίζει να σημειωθεί ότι et Brandt του al. [6] κατάλογο κοντά σε χίλια διαφορικά εκφρασμένων γονιδίων συρρικνώνεται σε 148 και 45, όταν κάποιος προσθέτει μια υποχρέωση που πρέπει να εμφανίζεται σε τουλάχιστον δύο ή τρεις μελέτες, αντίστοιχα.

Για να αποφευχθεί η μεταβλητότητα μεταξύ των ασθενών, επιλέξαμε να μελετήσουμε τα μοτίβα διαφορική γονιδιακή έκφραση παρατηρήθηκε σε δύο τύπους κυττάρων σε καλλιέργεια: ΦΥΧ, παγκρεατικά πρόδρομα κύτταρα που ξεπεράσουν από καλλιεργημένα ανθρώπινα νησίδια του Langerhans υγιών δοτών πτωματικών και κύτταρα PANC-1, μια καθιερωμένη γραμμή του ανθρώπινου PAC. Είναι σημαντικό ότι, και οι δύο τύποι κυττάρων υφίστανται μεσεγχυματικών-to-επιθηλιακά μετάβασης (ΜΕΤ) και μερικώς διαφοροποιούνται σε ένα φαινότυπο νευροενδοκρινή όταν αφήνεται να συσσωματώνονται σε μέσο ελεύθερο ορού [19], [20]. Ενώ ΦΥΧ παύουν να πολλαπλασιάζονται και κάποια από αυτά πεθαίνουν, τα κύτταρα PANC-1 συνεχίζουν να πολλαπλασιάζονται κάτω από αυτές τις συνθήκες.

Η κύρια παραδοχή του παραδείγματος μας είναι ότι η απάντηση σε ένα ερέθισμα διαφοροποίηση θα αποκαλύψει τις αλλαγές της γονιδιακής έκφρασης που διακρίνουν φυσιολογικά από τα κύτταρα PAC. Για το καλύτερο της γνώσης μας, δεν υπάρχει καμία απόδειξη στη βιβλιογραφία που συγκρίνουν τις διαδικασίες σε φυσιολογικά και καρκινικά κύτταρα παρόμοιας προέλευσης κάτω από συνθήκες που προκαλούν μερική διαφοροποίηση θα δώσει εικόνα για την έκφραση του γονιδίου σχετίζεται με τον καρκίνο. Συνεχής πολλαπλασιασμό των κυττάρων σε μέσο χωρίς ορό θα μπορούσε να αποδοθεί σε μεταλλάξεις των βασικών γονιδίων (π.χ., Κ-Ras). Ωστόσο, δεν είναι όλα τα χαρακτηριστικά των καρκινικών κυττάρων (π.χ. μετανάστευση, διεισδυτικότητα, διέγερση της αγγειογένεσης, η αντίσταση σε κυτταροτοξικούς παράγοντες) μπορούν να συνδέονται άμεσα με την ικανότητά τους να πολλαπλασιάζονται σε απουσία αυξητικών παραγόντων. Είναι πιθανό ότι αυτό το παράδειγμα θα αποφέρει τα γονίδια που είχαν χάσει τον παραδοσιακό υγιή εναντίον νοσούντα μεθόδους ιστού. Έχουμε, επομένως, καλλιεργημένα τόσο ΦΥΧ και PANC-1 κύτταρα σε μέσο άνευ ορού για 24 ώρες και σε σύγκριση αλλαγές στην έκφραση γονιδίων σε δύο τύπους κυττάρων. Αυτή η σύγκριση απέδωσε ένα χειροκίνητο επιμέλεια σύνολο 30 γονιδίων, των οποίων η έκφραση αλλάξει σημαντικά σε ένα τύπο κυττάρου και είτε δεν άλλαξε ή εκτίθενται μεταβολή στην αντίθετη κατεύθυνση στο άλλο (βλέπε πίνακα S3). Αναλύσαμε αυτό το σετ με DEMON (βλέπε Πίνακα S4). Παρά το γεγονός ότι PEBP (ΟΒΡΒ) ήταν οριακά μόνο εμπλουτισμένο (p~0.1) σε αυτή τη λίστα, εμφανίστηκε ανάμεσα στα δέκα κορυφαία TFBSs παρουσιάζουν τις χαμηλότερες τιμές p τόσο στους καταλόγους που προέρχονται από DEMON από σύνολα συναίνεση δεδομένων (κατετάγη 2ος και 3ος) και από ΦΥΧ εναντίον PANC-1 κύτταρα σύνολο δεδομένων του πειράματος (κατετάγη 6ος). Αυτό το εύρημα υποστηρίζει την πρόβλεψη ότι τα μέλη των υπο-οικογενειών RUNX μπορεί να εμπλέκεται σε PAC. Ανάλυση των ίδιων δεδομένων με PRIMA δεν βρούμε εμπλουτίζεται μοτίβα (βλέπε Πίνακα S5).

Για να αποκτήσετε πειραματικές αποδείξεις για RUNX διάκριση μεταξύ φυσιολογικών και PAC κύτταρα, που παρακολουθείται έκφραση RUNX1, 2 και 3 mRNAs από qRT-PCR ως συνάρτηση του χρόνου από τη στέρηση ορού των ΦΥΧ και κυττάρων PANC-1 (Εικ. 4). Υπήρχε μικρή μεταβολή στην έκφραση του RUNX1 και 2 μεταγραφές σε κάθε τύπο κυττάρου. Η έκφραση του RUNX3, ωστόσο, ήταν σημαντικά αυξημένη σε χρονο-εξαρτώμενο τρόπο με τον ΦΥΧ ενώ δεν υπήρχε ουσιαστικά καμία μεταβολή σε κύτταρα PANC-1. Φαίνεται, λοιπόν, ότι η έκφραση του RUNX3 ρυθμίζεται σε υπερχρεωμένες φτωχές χώρες κατά τη διάρκεια της διαφοροποίησης, αλλά αποτυγχάνει να ανταποκριθεί στο ερέθισμα διαφοροποίηση στα κύτταρα PANC-1.

υπερχρεωμένες φτωχές χώρες και PANC-1 κύτταρα είτε καλλιεργήθηκαν σε μέσο που περιέχει ορό (t = 0) ή για τους υποδεικνυόμενους χρόνους σε μέσο χωρίς ορό. RNA εκχυλίστηκε και qRT-PCR πραγματοποιήθηκε όπως περιγράφεται στο Υλικά και Μέθοδοι. Τα αποτελέσματα παρουσιάζονται ως% μεταβολή στα επίπεδα mRNA των τριών γονιδίων RUNX ως συνάρτηση του χρόνου σε μέσο χωρίς ορό.

Η

Για την επικύρωση περαιτέρω αυτό το εύρημα, προσδιορίσαμε σε ΦΥΧ την έκφραση των πέντε υποθετικών RUNX στόχους, ECM2, DUSP2, ESAM, PECAM, και ITGB4, που επιλέχθηκαν από μια λίστα πιθανών στόχων RUNX δημιουργούνται με βάση μια διαδικασία παρόμοια με τη μέθοδο που περιγράφεται στο [4]. Τέσσερα από αυτά τα mRNAs παρουσίασαν σημαντικές μεταβολές στην έκφραση (βλέπε Σχ. 5Α), ενώ η πέμπτη, ITGB4, εμφάνισε μόνο μία παροδική αύξηση δύο φορές. Συγκριτικά, η έκφραση αυτών των γονιδίων δεν άλλαξε σε κύτταρα PANC-1 (βλέπε Εικ. 5Β). Όταν η έκφραση των ίδιων γονιδίων εξετάστηκε για τα δεδομένα μικροσυστοιχιών, κανένας (συμπεριλαμβανομένων RUNX3) ήταν αρκετά υψηλή για την ουσιαστική ανάλυση, επιβεβαιώνοντας την ανώτερη ευαισθησία της qRT-PCR.

Α. ΥΦΧ και Β κύτταρα PANC-1 ήταν είτε καλλιεργήθηκαν σε μέσο που περιέχει ορό (t = 0) ή για τους υποδεικνυόμενους χρόνους σε μέσο χωρίς ορό. RNA εκχυλίστηκε και qRT-PCR πραγματοποιήθηκε όπως περιγράφεται στο Υλικά και Μέθοδοι. Τα αποτελέσματα παρουσιάζονται ως% μεταβολή στα επίπεδα mRNA των γονιδίων υποδεικνύονται ως συνάρτηση του χρόνου σε μέσο ελεύθερο ορού.

Η

Συζήτηση

Έχουμε παρουσιάσει ένα νέο αλγόριθμο για την ανίχνευση εμπλουτίζεται TFBSs σε ένα δεδομένο σύνολο υποκινητών. Ο αλγόριθμος χρησιμοποιεί ένα HMM-based σκορ να λάβει υπόψη όλες τις πιθανές σαρώνει μιας αλληλουχίας προαγωγού σε θέσεις πρόσδεσης και νουκλεοτίδια φόντο. Ζυγίζει σε μια ηθική τρόπο όλες οι πιθανές θέσεις σύνδεσης κατά μήκος του υποκινητή, καθιστώντας δυνατή την εξετάσει πολλαπλές αδύναμες θέσεις πρόσδεσης που δεν θα έχουν περάσει ένα όριο σημαντικότητας. Αυτή είναι η πρώτη χρήση μιας τέτοιας μεθόδου για τις δοκιμές εμπλουτισμού. Δείχνουμε ότι υπερτερεί μια προηγούμενη προσέγγιση (PRIMA) στο πρόβλημα, το οποίο χρησιμοποιεί ένα κατώτατο όριο για να κάνει δυαδική αποφάσεις για τις πραγματικές θέσεις πρόσδεσης.

Τρεις πτυχές των πειραματικών αποτελεσμάτων που παρουσιάζονται στην έκθεση αυτή φαίνεται να είναι μείζονος σημασίας . Πρώτον, πειραματικά επικυρώνει την εξουσία της ανάλυσης για την πρόβλεψη DEMON TFs (και γονίδια στόχους τους) από ένα μικρό αριθμό διαφορικά εκφραζόμενων γονιδίων σε PAC. Παρά το γεγονός ότι DEMON αποδείχθηκε ανώτερη από PRIMA σε πειράματα προσομοίωσης, η τιμή του μπορεί να αποδειχθεί μόνον με την πειραματική προβλεπτική ικανότητα του. Στην περίπτωσή μας, η δύναμη της DEMON δεν ήταν μόνο επικυρωθεί για RUNX3, αλλά και από την εγγενώς συνεπή αναγνώριση της ΟΒΡΒ, το ετεροδιμερικό συνεργάτη (ες) του RUNX υπο-οικογένεια.

Δεύτερον, τα αποτελέσματά μας υποδεικνύουν έντονα ότι RUNX3 και ΟΒΡΒ ετεροδιμερικού συντρόφου της, θα πρέπει να διερευνηθεί περαιτέρω όσον αφορά το δυναμικό ρόλο (ες) τους σε PAC αιτιολογία. Παρεκκλίσεις στην έκφραση του RUNX1 εντοπίστηκαν σε ένα σημαντικό ποσοστό των λευχαιμιών [11]. RUNX2 και 3 γονίδια έχουν μελετηθεί εκτενώς ως αναπτυξιακά TFs. RUNX2 φάνηκε να είναι ζωτικής σημασίας για τα οστά και την σκελετική ανάπτυξη [12]. RUNX3 δείχθηκε ότι εμπλέκεται άμεσα στην δέσμευση του + /CD8 + κυττάρων CD4 σε CD8 + Τ-κύτταρα και στην ωρίμανση των δενδριτικών Τ-κυττάρων [15], [21]. Μερικές εκθέσεις δείχνουν το ρόλο του RUNX3 στην ανάπτυξη του αισθητηρίου νευρωνικού συστήματος [22], [23]. Η υπερμεθυλίωση της περιοχής RUNX3 προαγωγού έχει συσχετισθεί με διάφορες μεταστατικές κακοήθειες, όπως του μαστού, του μη-μικροκυτταρικού καρκίνου του πνεύμονα, του στομάχου, του παγκρέατος, του ορθού, ή ηπατοκυτταρικό καρκίνωμα [24]. Σημαντικά, αποκατάσταση της έκφρασης RUNX3 σε κυτταρικές σειρές καρκίνου του οδηγεί σε απόπτωση ή μειωμένη πολλαπλασιασμό των καρκινικών κυττάρων και τη διαφοροποίηση τους [25] – [28]. Αυτές και παρόμοιες αναφορές, διαπιστώθηκε ότι RUNX3 φαίνεται να λειτουργεί ως καταστολέας όγκου. Έχουν επιβεβαιωθεί περαιτέρω από το εύρημα μας ότι τα μη μετασχηματισμένα μεσεγχυματικά ΦΥΧ ανταποκριθεί σε ένα ερέθισμα διαφοροποίηση από την αύξηση της μεταγραφής RUNX3 και τη σύλληψη του πολλαπλασιασμού, ενώ τα κακοήθη κύτταρα PANC-1 φαίνεται να έχουν χάσει αυτή η κανονιστική ανταπόκριση και συνεχίζουν να πολλαπλασιάζονται. Στην ανθρώπινη PAC, υπερμεθυλίωση και απώλεια της ετεροζυγωτίας των RUNX3 βρέθηκαν σε ένα μεγάλο ποσοστό των ιστών PAC και συσχετίζεται με χειρότερη πρόγνωση [17], [18]. Αυτά τα ευρήματα τοποθετούν RUNX3 ως ένα άλλο PAC-σχετίζεται γονιδιακό προϊόν. ανάλυση DEMON, ωστόσο, θέτει RUNX και ο συνεργάτης του, PEBP, όπως πιθανώς πολύ σημαντικό TFs ελέγχει την έκφραση πολλών PAC που σχετίζονται με τα γονίδια.

Τρίτον, τα αποτελέσματά μας επιβεβαιώνουν την υπόθεση ότι οι διαφορές μεταξύ της κανονικής του παγκρέατος και των κυττάρων PAC αποκαλύπτονται μετά από ένα ερέθισμα διαφοροποίηση. Η υπόθεση αυτή ενισχύεται περαιτέρω από μια πρόσφατη ανάλυση της transcriptomes που εμπλέκονται στον καρκίνο και την ανάπτυξη [29]. Σε πολλαπλασιαζόμενα ΥΦΧ και PANC-1 κύτταρα, και οι δύο εμφανίζουν φαινοτύπους μεσεγχύματος [19], λίγοι μεταγραφές RUNX3 είναι παρόντες (κατώτατα όρια των 31,5 και 30 κύκλους, αντίστοιχα). Μέχρι τις 24 ώρες σε μέσο διαφοροποίησης, ωστόσο, τα επίπεδα των mRNAs RUNX3 σε ΦΥΧ αυξήθηκε περισσότερο από 1000 φορές ενώ δεν υπήρχε ουσιαστικά καμία απόκριση σε κύτταρα PANC-1. Ομοίως, θεωρούμενη γονιδίων στόχων RUNX3 εκτίθενται αλλαγμένη μεταγραφή σε υπερχρεωμένες φτωχές χώρες, αλλά χωρίς αλλαγές στα κύτταρα PANC-1. Είναι σημαντικό, Li

et al

. [30] βρήκαν ότι RUNX3 εκφράζεται μόνο σε νησίδες και ένα ποσοστό των ιστών PAC. πειραματικά δεδομένα μας δείχνουν ότι ενώ η έκφραση του mRNA RUNX3 δεν μπορεί να είναι διαφορετική στα πολλαπλασιαζόμενα φυσιολογικά και PAC κύτταρα, ο ρόλος του αποκαλύπτεται μόνο μετά διαφοροποίηση ερέθισμα, εξηγώντας έτσι την φαινομενική διαφωνία μεταξύ των ευρημάτων της Wada

et al.

και Nomoto

et al.

[17], [18] και των Li

et al

. [30].

Είναι σημαντικό ότι η διαφοροποίηση που προκαλείται από αντίδραση των RUNX3 και πέντε υποτιθέμενη στόχους της σε υπερχρεωμένες φτωχές χώρες δεν μπορούν να αντληθούν από την ανάλυση μικροσυστοιχιών λόγω της απουσίας του σήματος ή πολύ χαμηλά επίπεδα τους. Παρά το γεγονός ότι PECAM1 και CBFA2T1 σημάτων αυξήθηκε περισσότερο από δύο φορές, τα σήματα τους ήταν πολύ χαμηλή για να είναι σημαντική. Αυτό δικαιολογεί τη χρήση των υπολογιστικών μεθόδων, όπως η DEMON ή PRIMA, να προσδιορίσει τους στόχους των γονιδίων και την επικύρωση τους από την πιο ευαίσθητη τεχνική qRT-PCR. Βεβαίως, qRT-PCR δεν μπορεί να αποκαλύψει επιγενετικώς ελεγχόμενη κανονισμούς του φαινοτύπου των κυττάρων.

Τα αποτελέσματά μας δείχνουν απώλεια της ανταπόκρισης του γονιδίου RUNX3 σε PAC και να προτείνει περαιτέρω μελέτες, όπως η διερεύνηση της μεθυλίωσης του υποκινητή του, καθώς και μια πιο εκτενή μελέτη της έκφρασης των υποθετικών γονιδίων στόχων RUNX.

Υλικά και Μέθοδοι

Ο δαίμονας αλγόριθμος

Ο αλγόριθμος DEMON χρησιμοποιεί ΗΜΜ για την εκπροσώπηση TFBSs. Κάθε HMM αποτελείται από δύο τύπους μελών: τα κράτη μοτίβο και φόντο κράτη (Εικ. 1). Μια κατάσταση φόντο ορίζεται για κάθε νουκλεοτίδιο (τέσσερα μέλη) και μια κατάσταση μοτίβο ορίζεται για κάθε θέση κατά μήκος του PWM που αντιστοιχεί στο TFBS ενδιαφέροντος. Οι πιθανότητες εκπομπής των μελών μοτίβο καθορίζονται σύμφωνα με την PWM, και εκείνα των μελών υποβάθρου έχουν οριστεί σε 1 για το αντίστοιχο νουκλεοτίδιο. πιθανότητες μετάβασης μεταξύ των κρατών φόντο αντανακλούν την κατανομή των δινουκλεοτιδίων σε όλες τις περιοχές υποτιθέμενου προαγωγέα στον άνθρωπο. Η πιθανότητα μετάβασης από κάθε κράτος μοτίβο στο επόμενο έχει οριστεί σε 1. Παραμένοντας μεταβάσεις περιλαμβάνουν κινείται προς τα κράτη φόντο (Εικ. 1, διακεκομμένη βέλη) ή κινούνται προς την πρώτη κατάσταση μοτίβο (Εικ. 1, στερεά βέλη). Αυτές οι μεταβάσεις μάθει χρησιμοποιώντας τον αλγόριθμο Baum-Welch [31] (Υποστήριξη Πληροφορίες S1).

Οι είσοδοι σε DEMON είναι η λίστα των γονιδίων ενδιαφέροντος (Σχ. 2α) και ένα σύνολο TFBS μοτίβα που αντιπροσωπεύεται από PWMs . Το αποτέλεσμα είναι μια λίστα των TFs των οποίων οι θέσεις πρόσδεσης είναι στατιστικά υπερεκπροσωπούνται στις περιοχές υποστηρικτής του συγκεκριμένου καταλόγου των γονιδίων.

Ως πρώτο βήμα, χτίζουμε ένα HMM από κάθε δεδομένη PWM, και κάθε HMM- ζεύγος προαγωγού εκχωρείται με σκορ που αντικατοπτρίζει την πιθανότητα που εμφανίζεται η αντίστοιχη TFBS στην αντίστοιχη περιοχή προαγωγού. Αυτή η βαθμολογία υπολογίζεται ως ο λόγος μεταξύ δύο τιμών (Σχήμα 2β).: (I) η πιθανότητα να εκπέμπει την αλληλουχία προαγωγού χρησιμοποιώντας το TFBS ΗΜΜ στο Σχήμα 1, και (ii) η πιθανότητα να εκπέμπει την αλληλουχία προαγωγού χρησιμοποιώντας ένα ΗΜΜ αποτελείται αποκλειστικά των κρατών φόντο. Οι τιμές πιθανότητας υπολογίζεται χρησιμοποιώντας τον αλγόριθμο Forward [32]. Τα ζεύγη βαθμολογίες στη συνέχεια χρησιμοποιούνται για τον υπολογισμό ενός ενιαίου βαθμολογία για κάθε TF, αντανακλώντας τη συνολική αφθονία στο σύνολο υποκινητή εισόδου. Η βαθμολογία αυτή ορίζεται ως το άθροισμα πάνω από όλα βαθμολογίες αποδίδεται ατομικά με κάθε υποκινητή.

Στο δεύτερο βήμα, χρησιμοποιούμε μια εμπειρική προσέγγιση για την αξιολόγηση της στατιστικής σημαντικότητας των συνολικών βαθμολογιών πιθανότητα υπολογίζεται για το ΤΡ. Επιλέγουμε τυχαία ένα παρόμοιο αριθμό των δικαιούχων, όπως στα αρχικά δεδομένα που από την πισίνα όλων των περιφερειών της ανθρώπινης υποκινητή και υπολογίζει μια νέα βαθμολογία για κάθε TF όπως πριν (Σχ. 2γ). Επαναλαμβάνουμε αυτή τη διαδικασία 100 φορές, καταλήγοντας με μια εμπειρική κατανομή των τυχαίων βαθμολογίες πιθανότητα. Κάθε TF τότε αποδίδεται με μια εμπειρική

σ

-τιμή καθορίζει ως η πιθανότητα να δούμε το στόχο που είχε τεθεί άθροισμα των βαθμολογιών, με δεδομένες τις τυχαίες ποσά που υποτίθεται ότι πρέπει να διανέμονται κανονικά (Εικ. 2δ). δηλαδή, υπολογίζουμε τον μέσο όρο και την τυπική απόκλιση των τυχαίων αποτελέσματα, και χρησιμοποιήστε τη λειτουργία κανονικής αθροιστικής κατανομής για να υπολογίσουμε την πιθανότητα ότι μια παρατήρηση από μια τυπική κανονική κατανομή θα είναι υψηλότερο από το στόχο που είχε τεθεί άθροισμα των βαθμολογιών. Οι τιμές ρ διορθώθηκαν για τις δοκιμές πολλαπλές υποθέσεις χρησιμοποιώντας την διαδικασία ποσοστό εσφαλμένης ανακάλυψη [33]. Αναφέρουμε όλα τα ευρήματα με ποσοστό εσφαλμένης ανακάλυψη κάτω από 5%.

Data Acquisition και PRIMA εφαρμογή

Έχουμε λάβει μια σειρά από πίνακες διανομής νουκλεοτιδίων που το μοντέλο σπονδυλωτά TFBSs από τη βάση δεδομένων TRANSFAC (απελευθερώσει 11.1) [ ,,,0],8]. Ένα σύνολο από 588 πίνακες σπονδυλωτών είχαν κατεβάσει από τη βάση δεδομένων. Οι μήτρες μετασχηματίστηκαν σε μήτρες πιθανότητα ότι οριοθετεί την πιθανότητα κάθε νουκλεοτίδιο να εμφανίζονται σε κάθε θέση στο TFBS. Δεδομένου ότι η βάση δεδομένων είναι περιττή και μερικές από τις μήτρες περιγράφουν παρόμοιες TFBS, έχουμε συγκεντρωμένα των μητρών σε ένα στάδιο προεπεξεργασίας σε μία διαδικασία παρόμοια με εκείνη που χρησιμοποιείται στο [4]. Για το σκοπό αυτό, χτίσαμε ένα PWM

w

από κάθε μήτρα πιθανότητας

m

, και να χρησιμοποιηθεί μια μικρή προ-υπολογισμένο όριο

t

να ανιχνεύσει το ανθρώπινο γονιδίωμα υποστηρικτές. Το όριο υπολογίζεται χρησιμοποιώντας δύο σύνολα υποκινητών φόντο: (i) τυχαία υποκινητές που είναι κατασκευασμένες με βάση την κατανομή νουκλεοτιδίων σε όλες τις προαγωγούς, (ii) τυχαία επιλεγμένα τμήματα του πραγματικού υποκινητών. Οι δύο ομάδες που σαρώνονται από κάθε PWM

w

και το όριο

t

ορίζεται ως η μέγιστη μεταξύ των 100

ου υψηλότερη βαθμολογία από κάθε ένα από τα δύο σύνολα φόντο δεδομένων (η οποία συνεπάγεται μια FPR 0.01). Κάθε υπο-που είχε ένα σκορ ομοιότητας με το PWM

w

πάνω από το όριο

t

χαρακτηρίστηκε ως ένα υποθετικό παράδειγμα του

w

. Στη συνέχεια, κάθε ζεύγος πινάκων που

x

% των εμφανίσεων τους στον υποκινητή που επικαλύπτονταν ήταν συγκεντρωμένα και τη μήτρα με το περιεχόμενο κατώτερο πληροφορίες (δηλαδή, η μήτρα η οποία είναι λιγότερο διαφορετική από μια ομοιόμορφη κατανομή) απομακρύνθηκε . Δεδομένου ότι η τιμή του

x

μεγαλώνει, το κριτήριο ομαδοποίησης γίνεται πιο αυστηρά και οι οδήγησε πίνακες που μεγαλώνει, και το αντίστροφο. Χρησιμοποιήσαμε

x

= 0,2 για να αποκτήσετε ένα σύνολο 219 μήτρες για χρήση στην ανάλυσή μας.

Έχουμε κατεβάσει το πλήρες σύνολο των ανθρώπινων υποκινητών από τη βάση δεδομένων του προγράμματος περιήγησης UCSC γονιδίωμα [34], [35 ]. Με βάση την προκαταρκτική δοκιμή και πρόσφατες μελέτες υποστηρίζουν ότι το μεγαλύτερο μέρος της TFBSs στο ανθρώπινο υποστηρικτές βρίσκονται κοντά στη θέση έναρξης της μεταγραφής [36], ορίζουμε τις περιοχές υποκινητή των γονιδίων με την ακολουθία 500 bp ανοδικά της θέσης έναρξης της μεταγραφής.

Έχουμε εφαρμόσει PRIMA όπως περιγράφεται στο [4].

κυτταροκαλλιέργειες

Ανθρώπινο νησάκι που προέρχονται από παγκρεατικά πρόδρομα κύτταρα (HIPC) απομονώθηκαν και πολλαπλασιάστηκαν σε τροποποιημένο μέσο CMRL όπως περιγράφηκε προηγουμένως [ ,,,0],20]. Ανθρώπινη παγκρεατική κυτταρική γραμμή αδενοκαρκινώματος PANC-1 αγοράστηκε από την American Type Collection Tissue και διατηρήθηκαν σε μέσο Dulbecco-τροποποιημένο ελάχιστο Eagle (DMEM) όπως περιγράφηκε προηγουμένως [20]. Μερική διαφοροποίηση οποιουδήποτε τύπου κυττάρου επετεύχθη με καλλιέργεια κυττάρων σε μέσο ελεύθερο ορού, ουσιαστικά όπως περιγράφηκε προηγουμένως [20]. Τα κύτταρα αναπτύχθηκαν και διατηρούνται σε 95:5% αέρα:. CO

2 ατμόσφαιρα στους 37 °

DNA μικροσυστοιχίες

Affymetrix GeneChip Human Genome U133 Plus 2.0 από μικροσυστοιχιών (κατάλογος # 900466) χρησιμοποιήθηκε, αποδίδοντας 12.760 αλληλουχίες. ΦΥΧ δοκιμάστηκαν εις τριπλούν, το καθένα από ένα χωριστό βιολογικό δείγμα. κύτταρα PANC-1 προσδιορίστηκαν σε pentaplicate συστοιχίες, δύο από τις ξεχωριστές βιολογικές επαναλήψεις και ενός άλλου βιολογικού επανάληψη τρέχει σε συστοιχίες τριπλούν. Κάθε σετ αποτελούνταν από δείγματα που απομονώνονται από πολλαπλασιαζόμενα κύτταρα (t = 0, σε 10% εμβρυϊκό βόειο μέσο που περιέχει ορό) και τα κύτταρα μετά από 24 ώρες σε (διαφοροποίηση) μέσο χωρίς ορό.

You must be logged into post a comment.