PLoS One: High Resolution Copy Number Διακύμανση δεδομένων στις κυτταρικές σειρές καρκίνου του NCI-60 από ολόκληρο το γονιδίωμα μικροσυστοιχίες με πρόσβαση μέσω CellMiner


Αφηρημένο

Array με βάση συγκριτική γονιδιωματική υβριδισμού (aCGH) είναι μια ισχυρή τεχνική για την ανίχνευση του γονιδίου αντιγράψετε παραλλαγή αριθμό. Είναι γενικά θεωρείται ότι είναι ισχυρή και εύκολη, δεδομένου ότι μετρά DNA αντί του RNA. Στην παρούσα μελέτη, συνδυάζουμε αριθμό αντιγράφων εκτιμήσεις από τέσσερις διαφορετικές πλατφόρμες (Agilent 44 K, NimbleGen 385 K, Affymetrix 500 K και Illumina Human1Mv1_C) για να υπολογίσει μια αξιόπιστη, υψηλής ανάλυσης, εύκολο να καταλάβει έξοδος για το μέτρο του αριθμού αλλαγών αντίγραφο στις 60 καρκινικά κύτταρα του NCI-DTP (το NCI-60). Στη συνέχεια αναφέρονται τα αποτελέσματα σε γονιδιακή έκφραση. Έχουμε εξηγήσει πώς να έχουν πρόσβαση στη συγκεκριμένη βάση δεδομένων χρησιμοποιώντας CellMiner μας web-εργαλείο και να παρέχει ένα παράδειγμα της ευκολίας σύγκρισης με την έκφραση μεταγραφή, αλληλουχίας ολόκληρη exome, έκφραση microRNA και απάντηση σε 20.000 φάρμακα και άλλες χημικές ενώσεις. Στη συνέχεια δείχνουν πώς τα δεδομένα μπορούν να αναλυθούν με integratively δεδομένα έκφρασης μεταγραφής για το σύνολο του γονιδιώματος (26.065 γονίδια). Σύγκριση αριθμού αντιγράφων και των επιπέδων έκφρασης δείχνει ένα συνολικό μέσο υψηλής συσχέτισης (διάμεσος r = 0.247), με σημαντικά υψηλότερα συσχετίσεις (διάμεσος r = 0,408) για τα γνωστά γονίδια καταστολής όγκου. Η παρατήρηση αυτή είναι σύμφωνη με την υπόθεση ότι η απώλεια του γονιδίου είναι ένας σημαντικός μηχανισμός για ογκοκατασταλτικό αδρανοποίηση. Μια ολοκληρωμένη ανάλυση των ταυτόχρονων αριθμό αντιγράφων του DNA και η έκφραση του γονιδίου της αλλαγής παρουσιάζεται. Περιορίζοντας την προσοχή στο κομβικό κέρδη ή ζημίες DNA, εντοπίζουμε και να αποκαλύψει καταστολείς των όγκων μυθιστόρημα υποψήφιος με ασορτί μεταβολές στο επίπεδο μεταγραφής

Παράθεση:. Varma S, Pommier Υ, Sunshine Μ, Weinstein JN, Reinhold WC (2014) Υψηλή Ψήφισμα Αριθμός Αντιγραφή Διακύμανση δεδομένων στα NCI-60 καρκινικές κυτταρικές σειρές από ολόκληρο το γονιδίωμα μικροσυστοιχίες με πρόσβαση μέσω CellMiner. PLoS ONE 9 (3): e92047. doi: 10.1371 /journal.pone.0092047

Επιμέλεια: Kwok-Wai Lo, το Κινεζικό Πανεπιστήμιο του Χονγκ Κονγκ, Χονγκ Κονγκ

Ελήφθη: 17 Οκτ, 2013? Αποδεκτές: 18 Φεβρουαρίου 2014? Δημοσιεύθηκε: 26 Μαρτίου 2014

Αυτό είναι ένα άρθρο ανοικτής πρόσβασης, χωρίς όλα τα πνευματικά δικαιώματα, και δεν μπορεί να αναπαραχθεί ελεύθερα, διανεμηθεί, να μεταδοθεί, τροποποιηθεί, χτισμένο πάνω, ή ειδάλλως να χρησιμοποιηθεί από οποιονδήποτε για οποιονδήποτε νόμιμο λόγο. Το έργο γίνεται διαθέσιμα υπό την Creative Commons CC0 αφοσίωση δημόσιο τομέα

Χρηματοδότηση:. Η εργασία αυτή υποστηρίζεται από το Κέντρο Έρευνας για τον Καρκίνο, Τειχών Πρόγραμμα του Εθνικού Ινστιτούτου Καρκίνου. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:. Sudhir Varma είναι υπάλληλος της HiThru Analytics LLC που εργάζονται με σύμβαση στις NCI παροχή βιοπληροφορική και υπολογιστικές υπηρεσίες. Ο ίδιος δεν έχει κανένα άλλο εμπορικό ενδιαφέρον για την έρευνα που δημοσιεύεται σε αυτό το άρθρο. Margot Sunshine είναι υπάλληλος των Συστημάτων Έρευνας και Εφαρμογών (SRA) που εργάζονται με σύμβαση με το NCI, παρέχοντας υπολογιστική και ανάπτυξης ιστοσελίδων υπηρεσίες. Δεν έχει καμία άλλη εμπορική ενδιαφέρον για την έρευνα που δημοσιεύεται σε αυτό το άρθρο. Αυτό δεν αλλάζει την τήρηση των συγγραφέων σε όλες τις PLoS ONE πολιτικές για την ανταλλαγή δεδομένων και υλικών.

Εισαγωγή

Η NCI-60 είναι ένα σύνολο από 60 ευρέως χρησιμοποιούμενη καρκινικές κυτταρικές σειρές που προέρχονται από 9 ιστούς προέλευσης συμπεριλαμβανομένου του μαστού, του κεντρικού νευρικού συστήματος, του παχέος εντέρου, του πνεύμονα, του προστάτη, των ωοθηκών και του νεφρού, καθώς επίσης λευχαιμία και μελανώματα [1]. Εμείς, και άλλοι, έχουν ήδη διατεθεί μοριακών δεδομένων σε πολλαπλές πλατφόρμες για την NCI-60 [2] – [7], καθιστώντας το μια μοναδική πηγή πληροφοριών για τις δύο φαρμακογονιδιωματικής [8], [9] και η βιολογία συστημάτων [10], [ ,,,0],11]. Αυτές οι κυτταρικές γραμμές διατηρούν τα πρότυπα έκφρασης του γονιδίου από το αρχικό καρκίνο τους ιστούς της προέλευσης, όπως αποδεικνύεται από συν-ομαδοποίησης [4], και σύγκριση με κλινικά δείγματα [12]. Η ικανότητα να συγκρίνουν απάντηση ναρκωτικών και γονιδιακά δεδομένα για αυτές τις κυτταρικές σειρές είναι χωρίς ταίρι από οποιοδήποτε άλλο βάσεις δεδομένων κλινικών ή των καρκινικών κυττάρων [8], [11], [13], [14].

Πριν από μελέτες της αντιγραφής του DNA αριθμό χρησιμοποιώντας aCGH από πολλαπλές καρκινικές κυτταρικές γραμμές και κλινικά δείγματα έχουν μεγαλύτερη κατανόηση του DNA μεταβλητότητα σε κυτταρικό επίπεδο [15], καθώς και αποδίδοντας μεταφραστική ιδέες [16]. aCGH παρέχει μία μέτρηση της γενωμική αστάθεια [17], ένα σήμα κατατεθέν της καρκινογένεσης [18]. Συσχετίσεις μεταξύ αριθμού αντιγράφων γονιδίου και της έκφρασης έχουν επίσης μελετηθεί, σε ορισμένες περιπτώσεις, αποδίδοντας επιπτώσεις όσον αφορά τους μηχανισμούς της εξέλιξης του καρκίνου [19], [20].

Δεδομένα σε πολλαπλές πλατφόρμες προφίλ το NCI-60 είναι προσβάσιμες μέσω CellMiner μας web εφαρμογή [21]. Πρόσφατα, έχουμε εισαγάγει web-based εργαλεία που επιτρέπουν τη μη bioinformatician για την αξιολόγηση και την πολλαπλή σύγκριση των βάσεων δεδομένων [8]. Στην παρούσα μελέτη, επεκτείνουμε αυτήν την ενοποιητική ικανότητα κατά την παρουσίαση των δεδομένων αριθμό αντιγράφων του DNA υψηλής ανάλυσης για το NCI-60 που συντίθεται από το συνδυασμό των δεδομένων από τέσσερις πλατφόρμες (Πίνακας S1), και το τοποθέτησε σε μορφή στερεότυπη με τις άλλες μορφές των δεδομένων. Έχουμε εισαγάγει τον «αριθμό αντιγράφων του γονιδίου DNA» web-εργαλείο, σχεδιασμένο για να επιτρέπει τη μη bioinformatician, να διερευνούν, να απεικονίσει και να κατεβάσετε δεδομένα σχετικής αριθμό αντιγράφων του DNA. Η έξοδος από αυτό το εργαλείο διευκολύνει την ενσωμάτωση του DNA αντιγραφή δεδομένων με άλλες βάσεις δεδομένων μας, ενισχύοντας την ενοποιητική ικανότητα τους.

Αναλυτικότερα, παρέχουμε μετρήσεις της σχετικής αντιγράφων του DNA της παραλλαγής αριθμό εντός και μεταξύ των κυτταρικών σειρών, υπολογίζει διάφορα μέτρα της γονιδιωματικής αστάθειας , και συσχετίζονται σχετικού αριθμού αντιγράφων του DNA με τα επίπεδα γονιδιακής έκφρασης. Προχωρώντας με την υπόθεση ότι ο καρκίνος εστιακό κέρδη και οι ζημίες είναι το αποτέλεσμα της επιλεκτικής πίεσης βάσει κανονιστικών επίδρασή τους στην έκφραση των γονιδίων, που συσχετίζουν τα αποτελέσματα της εστίασης αλλαγή αριθμού αντιγράφων του DNA, και την έκφραση του γονιδίου για τον εντοπισμό πιθανοί καταστολείς όγκων.

Υλικά και Μέθοδοι

Απομόνωση DNA

DNA απομονώθηκε όπως περιγράφηκε προηγουμένως [22]. Εν συντομία, γενωμικό DNA καθαρίστηκε από τα κύτταρα με τη χρήση του QIAamp Blood DNA Cell Culture Maxi Kit (Qiagen Inc., Valencia, CA) σύμφωνα με τις οδηγίες του κατασκευαστή. Ποιότητα αξιολογήθηκε με οπτική πυκνότητα 260/280 αναλογία χρησιμοποιώντας φασματοφωτόμετρο (Beckman-Coulter, Fullerton, CA) και κατά 0,8% αγαρόζης (SeaKem GTG, FMC BioProducts, Rockland, ΜΕ) ηλεκτροφόρηση πηκτής σε 1Χ ΤΑΕ (Roche, Indianapolis, ΙΝ) .

Αριθμός DNA Αντιγραφή στο NCI-60 Χρησιμοποιώντας τέσσερις πλατφόρμες μικροσυστοιχιών

αριθμό αντιγράφων του DNA για όλα τα γονίδια προσδιορίστηκαν από την ενσωμάτωση των ανιχνευτών από i) το Ανθρώπινο Γονιδίωμα CGH μικροσυστοιχιών 44Α (Agilent Technologies , Inc., GEO ένταξη GPL11068) με 44 k ανιχνευτές, ii) η συστοιχία v2.0 Η19 CGH 385K WG Πλακάκια (Roche NimbleGen Systems, Inc., GEO ένταξη GPL13786,), με 385 k ανιχνευτές, iii) η GeneChip χαρτογράφησης του ανθρώπινου 500 k array Set (Affymetrix Technologies, Inc., GEO ένταξη GPL3812) με 500 k ανιχνευτές, και iv) η σειρά του Ανθρώπου Human1 Mv1_C Beadchip (Illumina, GPL6983) με 1.100 k ανιχνευτές. Τα στοιχεία για αυτές τις μικροσυστοιχίες μπορούν να έχουν πρόσβαση σε CellMiner [21]. Επιπλέον, τα ανεπεξέργαστα δεδομένα έχει κατατεθεί στο Gene Expression Omnibus (GEO), υπό τους ακόλουθους αριθμούς πρόσβασης Agilent 44 k (GSE48568) Affymetrix 500 k (GSE32264), NimbleGen 385 K (GSE30291), Illumina 1 Μ (GSE47620).

Probe Χαρτογράφηση και εντάσεις

Ανιχνευτές για την Agilent, συστοιχίες NimbleGen και Illumina εκ νέου χαρτογραφήθηκαν με την τελευταία αναφορά HG19 χρησιμοποιώντας BLAST + (έκδοση 2.2.25) [23]. Για τη σειρά Affymetrix, χρησιμοποιήσαμε την τελευταία σχολιασμό κατεβάσετε από την ιστοσελίδα Affymetrix NetAffx [24]. Για κάθε πλατφόρμα, έχουμε μέσο όρο των επαναληπτικών δειγμάτων (εάν είναι διαθέσιμο, βλέπε πίνακα S1). εντάσεις Probe προσδιορίστηκαν σύμφωνα με τις συστάσεις των κατασκευαστών όπως περιγράφηκε προηγουμένως για την Agilent [25], NimbleGen Roche [26], Affymetrix [27], και Illumina [28] μικροσυστοιχίες.

Για όλες τις πλατφόρμες, οι εντάσεις αισθητήρα καταγραφής για κάθε δείγμα ομαλοποιήθηκαν με μέση-κεντράρισμα, σε όλες τις επόμενες αναλύσεις. Ο μέσος όρος των εντάσεων καθετήρα καταγραφής αφαιρέθηκε από όλες τις εντάσεις καθετήρα για αυτό το δείγμα.

Κατάτμηση των Περιφερειών με συνεπή αριθμό αντιγραφής

Κατάτμηση αναφέρεται στην κατάτμηση του κάθε χρωμοσώματος σε συνεχόμενα τμήματα, έτσι ώστε η αριθμός αντιγράφων είναι η ίδια μέσα σε ένα τμήμα και υπάρχει σημαντική διαφορά στον αριθμό αντιγράφων μεταξύ γειτονικών τμημάτων. Στην ανάλυσή μας, χρησιμοποιήσαμε Εγκύκλιος Binary Τμηματοποίηση (CBS) [29]. CBS επιστρέφει τη μέση ένταση καθετήρα μέσα σε κάθε τμήμα ως εκτίμηση του ημερολογίου

2 του αριθμού αντιγράφων μέσα σε αυτό το τμήμα. Έτσι, μια μέση τιμή έντασης ιχνηθέτη μηδέν θα αντιστοιχούσε σε ένα μετρημένο αριθμό αντιγράφων 2Ν (δηλαδή διπλοειδή), μια τιμή του -1 αντιστοιχεί σε αριθμό αντιγράφων 1Ν και 1 αντιστοιχεί σε 4Ν.

Σημειώστε ότι η Affymetrix 500 k τα στοιχεία έχουν χρησιμοποιηθεί πριν για την ανίχνευση περιοχών ΑΕ (απώλεια ετεροζυγωτίας), ωστόσο ο αλγόριθμος που χρησιμοποιείται για την ανίχνευση του αριθμού αντιγράφων παραλλαγές ήταν

pennCNV

οποίο είναι ακατάλληλο για γονιδιώματος κλίμακα εκτίμησης αριθμού αντιγράφων για τα δείγματα του καρκίνου [30] . Έχουμε, ως εκ τούτου, εκ νέου ανάλυση των δεδομένων με τη χρήση Εγκύκλιος Binary Τμηματοποίηση (CBS).

Συνδυασμός Αριθμός Αντιγραφή Εκτιμήσεις από τέσσερις πλατφόρμες

Χρησιμοποιήσαμε ένα νέο αλγόριθμο για να συνδυάσει τις εκτιμήσεις αριθμό κατακερματισμένες αντίγραφο από τις τέσσερις πλατφόρμες για κάθε κυτταρική γραμμή. Χρησιμοποιήσαμε τον κατακερματισμό του αριθμού αντιγράφων να καθορίσει

σημεία διακοπής

στη διασταύρωση των δύο συνεχόμενα τμήματα. Σε ένα σημείο διακοπής, μία διακριτή άλμα (αύξηση ή μείωση) του αριθμού αντιγράφων συμβαίνει. Τα σημεία αυτά αντιστοιχούν με τις θέσεις των χρωμοσωμικών διαλείμματα

ευθυγραμμίσετε τα σημεία διακοπής από τις τέσσερις πλατφόρμες για την ίδια κυτταρική γραμμή με την ακόλουθη μέθοδο:. Breakpoints από διαφορετικές πλατφόρμες που βρίσκονται σε 100.000 ζεύγη βάσεων μεταξύ τους και έχουν το ίδιο κατεύθυνση της αλλαγής αριθμού αντιγράφων ταιριάζουν μεταξύ τους. Αυτή ομάδες σημεία παύσης μαζί από διαφορετικές πλατφόρμες που παραπέμπουν πιθανώς στην ίδια χρωμοσωμική διάλειμμα. Τα όρια ευαισθησίας που δεν ταιριάζουν με οποιοδήποτε σημείο διακοπής από μια άλλη πλατφόρμα απορρίπτονται. Στη συνέχεια, υπολογίζουμε ένα μέσο σημείο διακοπής θέση από κάθε ομάδα συμφωνημένα όρια ευαισθησίας ως ο μέσος όρος των θέσεων των σημείων διακοπής από τη διαφορετική πλατφόρμα. Υπολογίζουμε το

μέσος αριθμός αντιγράφου τμήματος

τον μέσο όρο των κατακερματισμένων τιμές μεταξύ δύο γειτονικών κατά μέσο όρο σημεία διακοπής κατά τη διάρκεια των τεσσάρων πλατφόρμες.

Για κάθε γονίδιο, βρίσκουμε το τμήμα στο οποίο βρίσκεται. Ο αριθμός αντιγράφων του γονιδίου είναι η

μέσος αντιγράφου τμήματος αριθμός

για αυτό το τμήμα. Αυτή η ενέργεια αντιστοιχίζει αριθμό αντιγράφων εκτιμάται σε 41 ή περισσότερες κυτταρικές σειρές για 23.413 γονίδια.

Ο αριθμός αντιγράφων εκτιμήσεις για τα γονίδια σε σύγκριση με τον αριθμό αντιτύπου εκτιμήσεις από τη γραμμή Cancer Cell Εγκυκλοπαίδεια (CCLE) [13] με τη χρήση 44 κυτταρικές σειρές κοινά σε δύο σύνολα δεδομένων. Υπολογίσαμε τη συσχέτιση Pearson μεταξύ των μετρήσεων μας τον αριθμό αντιγράφων και τον αριθμό αντιγράφων CCLE σε όλες τις κυτταρικές σειρές 44 για κάθε γονίδιο.

Εξέχοντες και Focal Κέρδη και ζημίες

Για να προσδιοριστούν οι περιοχές με τη μεγαλύτερη , πιο οπτικά εντυπωσιακό κέρδη και ζημίες, θέτουμε ένα αυθαίρετο όριο του 1,5 για την απόλυτη ημερολόγιο

2 αριθμό αντιγράφων και εντάχθηκε τμήματα που ήταν λιγότερο από 500 χιλιάδες βάσεις μακριά από τον άλλον (συμπεριλαμβανομένων τυχόν τμήματα μεταξύ τους).

για μια συστηματική αναγνώριση όλων των κερδών εστιακό αντίγραφο αριθμό (ή ζημίες) για κάθε δείγμα, χρησιμοποιήθηκαν οι CBS (κατά διαστήματα) τα δεδομένα για να βρουν τμήματα του γονιδιώματος που είναι υψηλότερα (ή χαμηλότερα) από ό, τι οι δύο γείτονες αριστερό και το δεξί χέρι τους . Χρησιμοποιήσαμε τρία κριτήρια για την κλήση κέρδος ή ζημία εστίασης: i) το τμήμα πρέπει να έχει μια διαφορά στο ημερολόγιο

2 αριθμού αντιγράφων τουλάχιστον 0,3 τόσο από τους γείτονες αριστερό και το δεξί χέρι του, και οι δύο διαφορές να είναι είτε θετική είτε αρνητική? ii) το πλάτος του τμήματος πρέπει να είναι μικρότερη από 5 Mb? και iii) πρέπει να υπάρχουν περισσότερα από 10 ανιχνευτές χαρτογράφηση εντός του τμήματος. Οποιοδήποτε γονίδιο που έχει (μερική ή ολική) επικαλύπτονται με το τμήμα ονομάζεται εστιακά κερδίζεται ή χάνεται

Γονιδιωματική Παράμετροι Αστάθεια

Χρησιμοποιώντας τις τμηματικές δεδομένων αριθμού αντιγράφων, υπολογίσαμε δύο μορφές της γονιδιωματικής αστάθειας.? i) η αναλογία του γονιδιώματος που έχει κερδίσει ή χαθεί, και ii) ο αριθμός των κερδών και ζημιών. Το ποσοστό του γονιδιώματος που κερδίζεται ή χάνεται υπολογίστηκε με βάση τις τμηματικές τιμές του array CGH. Εκτιμήσαμε αυτό με τη λήψη της αναλογίας των ανιχνευτών που εμπίπτουν τμήματα με απόλυτη μέση ένταση μεγαλύτερη από 0,3 (μια αύξηση του αριθμού αντιγράφων του DNA ή απώλεια 0,46). Ο αριθμός των κερδών και ζημιών υπολογίστηκε ως ο συνολικός αριθμός (των περιφερειών κέρδος /ζημία) με απόλυτη μέση ένταση μεγαλύτερη από 0,3 με περισσότερα από 10 ανιχνευτές χαρτογράφηση στην περιοχή.

γονιδιακής έκφρασης Προσδιορισμός και ο συσχετισμός της με το DNA Copy Number

έκφρασης για 26.065 γονίδια ελήφθη ως ένα ολοκληρωμένο z-score των μετρήσεων από τις πλατφόρμες έκφρασης πέντε γονιδίου, όπως περιγράφηκε προηγουμένως [31]. Γονίδια με έκφραση z-score αντιστοιχήθηκαν σε γονίδια με αριθμό αντιγράφων. Αυτό είχε ως αποτέλεσμα 18.504 γονίδια τόσο με την έκφραση και την αντιγραφή εκτιμήσεις αριθμό. αριθμό αντιγράφων για αυτά τα 18.504 γονίδια σε σχέση με τη γονιδιακή έκφραση χρησιμοποιώντας συσχέτισης του Pearson (Πίνακας S3). Το ιστόγραμμα αυτών των συσχετισμών παραστάθηκε γραφικά χρησιμοποιώντας το

R

(έκδοση 2.15.2). Οι μέσες συσχετίσεις για όλα τα γονίδια, καθώς και για τα σύνολα των γνωστών ογκογόνων και καταστολείς όγκων, υπολογίστηκαν.

Αξιολόγηση των γνωστών και πιθανοί καταστολείς όγκων

επιλεγμένα γονίδια με βάση την συνάντησή τους τέσσερις κριτήρια? i) στατιστικά σημαντική συσχέτιση μεταξύ του αριθμού αντιγράφων και της έκφρασης (False Discovery Rate FDR & lt? 0,05), ii) το γονίδιο που εστιακά κερδίζεται ή χάνεται σε τουλάχιστον 3 δείγματα (εστιακό κέρδη και ζημίες, όπως ορίζεται στην ενότητα Τμηματοποίηση), iii) η αριθμός κυτταρικών σειρών με εστιακή απώλειες είναι τουλάχιστον 3 φορές μεγαλύτερος από τον αριθμό των κυτταρικών σειρών με εστιακή κέρδη, iv) τα γονίδια ήταν περισσότερο από 2 εκατομμύρια ζεύγη βάσεων απόσταση από γνωστές καταστολείς όγκων. Κριτήριο 4 χρησιμοποιείται για την αφαίρεση των γονιδίων «επιβάτη», του οποίου η επιλογή μπορεί να οφείλεται σε γονιδιωματική εγγύτητας.

Αποτελέσματα

Η Array CGH δεδομένα μπορούν να προσεγγιστούν και να απεικονιστεί Χρησιμοποιώντας το CellMiner «Gene DNA Αριθμός Αντιγραφή» web εργαλείο ανάλυσης

για να διευκολυνθεί η εξόρυξη των δεδομένων αριθμού αντιγράφων NCI-60 DNA, έχουμε εισαγάγει ένα έξυπνο εργαλείο για την αναζήτηση και να απεικονίσει το σύνολο δεδομένων. Αυτό το εργαλείο είναι διαθέσιμο σε CellMiner ιστοσελίδα μας [21] στο πλαίσιο των «NCI-60 εργαλεία ανάλυσης» καρτέλα (Σχήμα 1Α). Όπως φαίνεται στο Σχήμα 1Α, οι χρήστες επιλέγουν πρώτα «υπογραφή γραμμή κυττάρων» στο Στάδιο 1, και στη συνέχεια, το «Γονίδιο DNA αριθμού αντιγράφων». Στο βήμα 2, έως και 150 γονίδια ενδιαφέροντος μπορεί να εισαχθούν είτε πληκτρολογώντας τα ονόματα γονίδιο στο «Input το αναγνωριστικό» κουτί, ή αποστολή τους ως ένα αρχείο κειμένου ή Excel χρησιμοποιώντας το κουμπί «Μεταφόρτωση αρχείου». Στο Βήμα 3, οι χρήστες εισάγετε τη διεύθυνση ηλεκτρονικού ταχυδρομείου τους, και κάντε κλικ στο «Λήψη δεδομένων». Τα αποτελέσματα θα αποσταλούν μέσω e-mail για κάθε γονίδιο, με ένα σύνδεσμο για να κατεβάσετε ένα αρχείο Excel. Αυτό το αρχείο περιέχει τέσσερα φύλλα εργασίας: i) «αντίγραφο DNA αριθμό» περιέχει πίνακα σημαίνει αναλογίες έντασης (του DNA τεστ σε σύγκριση με το τεκμήριο κανονικό) και εκτιμάται αριθμό αντιγράφων του DNA, και ένα οικόπεδο μπαρ των εκτιμώμενων αριθμό αντιγράφων του DNA (Εικόνα 1Β), ii ) «Γραφική εξόδου» που περιέχει διασποράς-οικόπεδα των επιμέρους εντάσεων ανιχνευτή για το γονίδιο του ενδιαφέροντος, καθώς και 2MB πλευρική περιοχή για κάθε κυτταρική σειρά (σχήμα 1Γ), iii) «εισόδου» που περιέχει τα κανονικοποιημένα δεδομένα για τις εν λόγω ανιχνευτές που εμπίπτουν σε γονίδιο ενδιαφέροντος (επισημαίνονται με κίτρινο χρώμα), καθώς και 2 × 10

6 νουκλεοτίδια της πλευρικής περιοχής σε κάθε άκρο, και iv) «υποσημειώσεις». Το Σχήμα 1 δείχνει ένα παράδειγμα του 3 καρκίνος-σχετικών γονιδίων (Σχήμα 1Α), CDKN2A κωδικοποιεί εξαρτώμενων από κυκλίνη κινάσης αναστολέα 2Α (ρ16

ΙΝΚ4 &, ρ19

ARF), η οποία συνήθως διαγράφονται σε καρκίνους, CCNE1 κωδικοποιεί Κυκλίνη Ε , η οποία συνήθως ενισχύεται σε καρκίνους, και KRAS κωδικοποιούν Kirsten Rat σαρκώματος Viral Oncogene, η οποία ενεργοποιείται σε καρκίνους από μεταλλάξεις και σπανιότερα ενίσχυσης. Πάνελ Β και C (Σχήμα 1) δείχνουν ότι πολλοί κυτταρικές σειρές επιδεικνύουν εξάντληση του τόπου CDKN2A (αριστερά πλαίσια), ενώ τα καρκινικά κύτταρα των ωοθηκών και OVCAR3 OVCAR5 δείχνουν εστιακή ενίσχυση CCNE1 και KRAS, αντίστοιχα.

A. Το εργαλείο μπορεί να έχει πρόσβαση στην ιστοσελίδα CellMiner κάνοντας κλικ στην καρτέλα «NCI-60 εργαλεία ανάλυσης» (εγκλωβιστούμε σε κόκκινο). Σε αυτό το παράδειγμα, οι 3 σχετιζόμενη με καρκίνο γονίδια ερωτηθούν ταυτόχρονα: CDKN2A, CCNE1 και KRAS. B. Η έξοδος περιλαμβάνει ένα οικόπεδο μπαρ του εκτιμώμενου αριθμού αντιγράφων για κάθε κυτταρική σειρά. Ο άξονας x είναι ο αριθμός αντιγράφων του DNA. Ο γ-άξονας δείχνει τις κυτταρικές γραμμές, με τις ράβδους χρωματισμένα με βάση ιστό προέλευσης. Μπαρ στην αριστερή 2Ν δείχνουν απώλεια, ενώ τα μπαρ στα δεξιά δείχνουν γονιδιωματική κέρδος. Διακεκομμένες γραμμές δείχνουν κυτταρικές σειρές με αριθμό αντιγράφων κέρδη σε CCNE1 και KRAS C. Ένα οικόπεδο διασποράς παρέχεται επίσης για κάθε κυτταρική σειρά. Το x-άξονας δείχνει την χρωμοσωμική θέση. Ο γ-άξονας δείχνει τις τιμές έντασης log2 στα αριστερά. Οι κόκκινες κουκίδες δείχνουν ανιχνευτές που εμπίπτουν εντός του γονιδίου. Οι μπλε κουκκίδες υποδεικνύουν τις όμορες περιοχές. Τα δεδομένα που λαμβάνονται ως αρχεία Excel. Δείτε κείμενο για λεπτομέρειες.

Η

Ένα μοναδικό χαρακτηριστικό της ιστοσελίδας CellMiner είναι ότι το πρότυπο αριθμός αντιγράφων που λαμβάνονται από CellMiner για ένα γονίδιο μπορεί να χρησιμοποιηθεί ως πρώτη ύλη για την Μοτίβο Σύγκριση εργαλείο για να βρείτε συσχετίζονται έκφραση γονιδίων και φαρμάκων δραστηριότητα. Το Σχήμα 2 δείχνει τον αριθμό αντιγράφων για CDKN2A (ρ16), το γονίδιο με την υψηλότερη συσχετίζονται έκφρασης (CDKN2A), και το φάρμακο του οποίου η απόκριση είναι το πιο αρνητική συσχέτιση (NSC-301739). Η ισχυρή συσχέτιση μεταξύ του αριθμού αντιγράφων του DNA και της έκφρασης μεταγραφή προσδιορίσει η ισχυρή επηρεάζει ο αριθμός αντιγράφων του DNA αλλοίωση έχει στην έκφραση μεταγραφή σε αυτό το γονίδιο. Η αρνητική συσχέτιση του αριθμού αντιγράφων του DNA με τη δραστηριότητα του φαρμάκου προσδιορίζει το FDA-εγκεκριμένο μιτοξαντρόνη φάρμακο (NSC-301739) ως πιο ενεργό σε πολλές περιπτώσεις τα καρκινικά κύτταρα με τη διαγραφή CDKN2A (Σχήμα 2, δεξιά πάνελ και διακεκομμένες γραμμές).

Η πιο αριστερό διάγραμμα δείχνει ένα barplot αξιών αριθμού αντιγράφων για CDKN2A που λαμβάνεται με την αναζήτηση CellMiner. Το μεσαίο διάγραμμα δείχνει την έκφραση του γονιδίου και η δεξιότερη διάγραμμα δείχνει την απάντηση σε μια μιτοξαντρόνη, ένα φάρμακο με σημαντική αρνητική συσχέτιση με την κατάσταση αριθμό αντιγράφων του CDKN2A. Διακεκομμένες γραμμές υποδεικνύουν μερικές από τις κυτταρικές σειρές όπου η κατεύθυνση του αριθμού αντιγράφων μεταβολή είναι στην ίδια κατεύθυνση με το γονιδιακή έκφραση και προς την αντίθετη κατεύθυνση με το δραστικότητα του φαρμάκου.

Η

Συσχέτιση με τη γραμμή Cancer Cell Εγκυκλοπαίδεια are Κίνα

υπάρχουν 44 κυτταρικές σειρές κοινό μεταξύ του NCI-60 και το CCLE. Αξίζει να σημειωθεί ότι, το συνδυασμένο αριθμό αντιγράφων εκτιμάται στο NCI-60 συσχετίζονται καλά με τις εκτιμήσεις αριθμό αντιγράφων στο CCLE με διάμεση συσχέτισης 0,833. Αυτό είναι υψηλότερο από ό, τι η συσχέτιση να αντιγράψετε αριθμούς από οποιοδήποτε άτομο πλατφόρμα (Agilent: Agilent: 0.660, NimbleGen: 0,448, Affymetrix: 0,821, Illumina: 0,804) υποδηλώνοντας ότι ο συνδυασμός των πλατφορμών βελτιώνει μαζί την εκτίμηση. Όσο υψηλότερη συσχέτιση με την πλατφόρμα Affymetrix θα μπορούσε να οφείλεται στο γεγονός τα δεδομένα CCLE επίσης παράγεται σε συστοιχίες Affymetrix (Affymetrix SNP 6.0).

Ευρεία Μεταβολές στη σύνθεση του DNA αντιγραφής λαμβάνει χώρα στο NCI-60 κυτταρικών σειρών

Μια συνολική θεώρηση του NCI-60 γενωμική σύνθεση δημιουργήθηκε χρησιμοποιώντας το CBS κατά διαστήματα τα αποτελέσματα aCGH. Σχήμα 3 παρουσιάζει αντιπροσωπευτικά παραδείγματα διαφόρων τύπων παραλλαγή γονιδίωμα. Η πλήρης έκδοση για το NCI-60 είναι διαθέσιμο στο σχήμα S1 και στην ιστοσελίδα μας [21]. Αυτές οι οθόνες αποκαλύπτουν ότι οι περισσότερες κυτταρικές γραμμές επιδεικνύουν γονιδιωματική μεταβολές, καθώς και συχνή γονιδιωματική ζημίες και τα κέρδη, καθώς και αλλαγμένη πλοειδίας. Τα είδη των μεταβολών στα γονιδιώματα, ωστόσο, να ποικίλει ευρέως εντός του NCI-60. Μόνο μερικές κυτταρικές σειρές παρουσιάζουν φυσιολογικό αριθμό (2Ν) αντίγραφο με λίγες μεταβληθεί τμήματα όπως CO: HCT_15. Ορισμένα έχουν πολλαπλές αλλαγμένη τμήματα γονιδιώματος με περίπου 2Ν αριθμό συνολική αντίγραφο (π.χ. RE: CAKI_1). Ωστόσο, άλλοι έχουν πολλά μεταβληθεί τμήματα εκτός του ότι μετατοπίστηκε από 2Ν, συμπεριλαμβανομένων ΜΡ: MCF7, ΚΝΣ: SF_268, LE: RPMI_8226, ME: MALME_3M, OV: NCI_ADR_RES και PR: PC_3. Τα στοιχεία που αποδεικνύουν την έντονη μεταβλητότητα που βρέθηκαν στις ανωμαλίες των NCI-60 γονιδιωμάτων.

Ο x-άξονας είναι η χρωμοσωμική θέση των ανιχνευτών, χρωματισμένη από τον αριθμό των χρωμοσωμάτων και διέταξε με γονιδιωματική θέση. Ο γ-άξονας είναι ο λόγος καταγραφής των εντάσεων καθετήρα. Οι μαύρες οριζόντιες σημάδια δείχνουν την

2 αριθμούς αντιγράφων μέσο καταγραφής σε κάθε τμήμα, όπως υπολογίζεται από την εγκύκλιο Binary Τμηματοποίηση (βλέπε Υλικά και Μέθοδοι). Το ποσό της διασποράς πάνω και κάτω από μαύρα σημάδια των τομέων δείχνει το επίπεδο της μεταβλητότητας καθετήρα. Οι θέσεις κάποιων σχετίζονται με τον καρκίνο γονίδια που έχουν εστιακή κέρδη ή ζημίες ανέφερε επίσης. εικόνες υψηλής ανάλυσης για όλες τις κυτταρικές σειρές NCI-60 είναι διαθέσιμα στο σχήμα S1 και στην ιστοσελίδα μας [21].

Η

Η υψηλής έντασης (απόλυτη log

2 τιμές μεγαλύτερες από 1,5, δηλαδή DNA αντιγραφή αριθμούς μεγαλύτερους από 5,60 ή μικρότερη από 0,71) επιμηκύνσεις (κέρδη) και διαγραφές (ζημίες), οπτικοποιούνται στο Σχήμα 3 και το Σχήμα S1, απαριθμούνται με την θέση τους στον πίνακα S2 από την κυτταρική γραμμή, λόγω υποψήφιους τους σημασία. Αυτά τα μεγάλα κέρδη και ζημίες έχουν προκαταλήψεις χρωμόσωμα, με τρία χρωμοσώματα (9, 3 και 6) που έχουν πολλαπλές μεταβολές σε πολλαπλές κυτταρικές σειρές, και ένα (χρωμόσωμα 21) χωρίς αισθητή κέρδη ή ζημίες. Τα δεδομένα αυτά προσδιορίζουν τα χρωμοσώματα και κυττάρου-ειδική εστιακό ενισχύσεις και τις διαγραφές.

Παγκόσμια DNA Copy Number μεταβολή της NCI-60

Για να κατηγοριοποιήσετε περαιτέρω τις γονιδιωματικές παραλλαγές αριθμού αντιγράφων σε όλη την NCI-60, δύο παράμετροι προέκυψαν από τα δεδομένα aCGH (Πίνακας 1). Η «αναλογία γονιδιώματος κερδίζεται ή χάνεται» είναι η συνολική κλάσμα του γονιδιώματος που κερδίζεται ή χάνεται (σε ​​σύγκριση με 2Ν)? ο «αριθμός των κερδίζεται ή χάνεται περιοχές» ανά γονιδίωμα αντιπροσωπεύει τον συνολικό αριθμό των τροποποιημένων τμημάτων (κερδίζεται ή χάνεται σε σύγκριση με 2Ν).

Η

Η σύγκριση των δύο παραμέτρων (ποσοστό και τον αριθμό των κερδών και ζημιών) έδειξε μια εξαιρετικά στατιστικά σημαντική θετική συσχέτιση (r του Pearson = 0,76, p-value = 1.2 × 10

-12), που συνδέει τη συχνότητα των σωρευτικών κλάσμα του γονιδιωματικής αλλαγές. Οι κυτταρικές σειρές με τις λιγότερο συχνές αλλαγές γονιδιωματικής, σύμφωνα με το πρώτο μέτρο (ποσοστό του γονιδιώματος κερδίζεται ή χάνεται) είναι το CO: HCC_2998 και OV: IGROV1, και εκείνοι με την πιο Οι RE: Α498 και ΜΡ: T47D. Για το δεύτερο μέτρο (αριθμός των περιφερειών με κέρδη /ζημίες), τα κύτταρα με τις λιγότερες αλλαγές είναι CO: HCC_2998 και ΚΝΣ: SNB_75, και οι κυτταρικές σειρές με τις περισσότερες αλλαγές είναι ΜΡ: MCF7 και RE:. SN12C

εξέχουσες περιοχές του γονιδιώματος με Focal Copy Number αλλαγές, και τη σχέση τους με τις γνωστές και των προοπτικών ογκοκαταστολείς

στη συνέχεια έψαξε για γενωμική αλλαγές αριθμό αντιγράφων που ήταν «κομβικό» στη φύση. Η προσέγγισή μας ήταν να ψάξουν για τα τμήματα γονιδιώματος με: i) τη διαφορά στο ημερολόγιο

2 αριθμού αντιγράφων τουλάχιστον 0,3 τόσο από τους γείτονες αριστερό και το δεξί χέρι του (οι διαφορές είναι είτε και τα δύο θετικά είτε και τα δύο αρνητικά)? ii) πλάτος λιγότερο από 5 Mb? και iii) τουλάχιστον του 10 (aCGH) ανιχνευτές. Ο Πίνακας 2 συνοψίζει αυτές τις εστιακές αλλοιώσεις για γνωστά ογκογονίδια και καταστολείς όγκων. Πίνακας S3 παρέχει το εστιακό κατάσταση μεταβολής για όλες τις (18.504) γονίδια τόσο με τον αριθμό αντιγράφων και την έκφραση του γονιδίου (βλέπε στήλη S), και η γονιδιωματική θέσεις τους (στήλες Q και R).

Η

Το συνηθέστερα εστιακά διαγράφεται τμήμα εμφανίζεται σε 24 κυτταρικές γραμμές, και περιέχει το γονίδιο καταστολής CDKN2A όγκου (ρ16

ΙΝΚ4 & και Ρ14

ARF) στο χρωμόσωμα 9 (Σχήμα 1 Β, 2 και 4Α). Οι διαγραφές CDKN2A εμφανίζονται σε περισσότερους από τους τύπους NCI-60 του ιστού, με την υψηλότερη συχνότητα εμφάνισης σε νεφρική (6 από 8 γραμμές) και κύτταρα του ΚΝΣ (4 από τις 6 γραμμές). διαγραφές CDKN2A είναι λιγότερο συχνές στο μητρικό (1 από 5) και των ωοθηκών (2 από 7) και απουσιάζει στις γραμμές του παχέος εντέρου και του προστάτη. Η λεπτομερή στοιχεία για CDKN2A βρίσκεται στον πίνακα S3 (στήλη Q). Η επόμενη πιο συχνά διαγράφονται ογκοκατασταλτικό γονίδιο είναι PTEN στο χρωμόσωμα 10 (Πίνακας 2 και Πίνακας S3), η οποία είναι σαφώς υποεκπροσωπούνται σε 4 κυτταρικές σειρές: CNS: SF_539, LE: CCRF_CEM, PR: PC_3 και RE: RXF_393. Είναι, επίσης, εστιακά που αποκτήθηκε κατά OV: OVCAR_4. Αξίζει να σημειωθεί ότι ΤΡ53, η οποία αδρανοποιείται από μεταλλάξεις σε 47 από το NCI-60 [3], [32] (που υποβάλλονται τα αποτελέσματά μας) έχει εστιακή απώλεια μόνο σε δύο κυτταρικές σειρές LE: HL_60, RE: TK_10 (Πίνακας S3), καταδεικνύοντας εξειδίκευση σε μηχανισμός λειτουργίας νοκ ντάουν της καταστολείς των όγκων.

Α. CDKN2A και πλευρική αλληλουχία στο χρωμόσωμα εννέα για έξι κυτταρικές σειρές. Το κεντρικό κατακόρυφο πασχαλιά περιοχή σκιαγραφεί τη θέση του γονιδίου. Β MYC και πλευρικής αλληλουχίας στο χρωμόσωμα οκτώ για πέντε κυτταρικές σειρές. Το κεντρικό κατακόρυφο πασχαλιά περιοχή σκιαγραφεί τη θέση του γονιδίου. Γ ABCB1 (MDR1), ABCB4 και πλευρική αλληλουχία στο χρωμόσωμα 7 για τη γονική OVCAR_8 και των παράγωγων NCI_ADR_RES ανθεκτικών στα φάρμακα του. Τα πράσινα και ροζ κεντρικό κατακόρυφο περιοχών οριοθετούν τη θέση του ABCB1 και ABCC4, αντίστοιχα. Στο Α, Β, και C, το Χ-άξονας είναι η τοποθεσία νουκλεοτιδίου. Οι τιμές y-άξονα στα αριστερά είναι οι μέσες αναλογίες έντασης καταγραφής, και στη δεξιά εκτιμάται αριθμό αντιγράφων του DNA. Οι μαύρες οριζόντιες γραμμές δείχνουν τη μέση αναλογία έντασης καταγραφής σε κάθε τμήμα, ενώ τα καφέ σημεία δείχνουν τις αναλογίες έντασης καταγραφής για κάθε ανιχνευτή.

Η

Για τα γνωστά ογκογονίδια, η πιο συχνή εστιακό κέρδος εμφανίζεται στο CCND1 ( κυκλίνη D1) γονίδιο στο χρωμόσωμα 11, και MYC, στο χρωμόσωμα 8. CCND1 έχει εστιακό κέρδη σε 4 κυτταρικές σειρές (CNS: SF_295, ME: SK_MEL_28, ME: SK_MEL_5, RE: TK_10), συμπεριλαμβανομένων 2 μελανώματα. MYC ενισχύεται σε τέσσερις κυτταρικές σειρές CO: SW_620, LE: HL_60, LE: RPMI_8226 και PR:. PC_3 (Εικόνα 4Β)

Εκτός από γνωστά ογκογονίδια και καταστολείς των όγκων, μία από τις πιο έντονες ενισχύσεις βρέθηκε στο OV: κυτταρική γραμμή NCI_ADR_RES στο χρωμόσωμα 7q21.12 (Σχήμα 3, κάτω αριστερά πάνελ και Σχήμα 4C). Αυτή η ενίσχυση περιλαμβάνει δύο αντλία εκροής γονίδια μεταφορέα ABC, ABCB1 και ABCB4 (Σχήμα 4C), και είναι σύμφωνο με την αντίσταση υψηλής δοξορουβικίνη (αδριαμυκίνη) αυτής της κυτταρικής γραμμής [33], [34]. Εκτός από αυτό το χρωμόσωμα 7 εστιακό ενίσχυσης, η OV: κυτταρική σειρά NCI_ADR_RES δείχνει ένα προφίλ aCGH συγκρίσιμη με γονική γραμμή OV:. OVCAR_8 (Σχήμα S1)

Συσχέτιση μεταξύ Gene Expression και DNA Αριθμός Αντιγραφή

για να καθορίσουν τη σχέση μεταξύ των επιπέδων αριθμό αντιγράφων του DNA και της έκφρασης μεταγραφή, υπολογίσαμε τις συσχετίσεις μεταξύ των δύο παραμέτρων για όλες τις (18.504) γονίδια τόσο με τον αριθμό αντιγράφων και την έκφραση του γονιδίου. Πίνακας 2 και Πίνακας S3 δώσει αυτές τις τιμές συσχέτισης, καθώς και την αντίστοιχη τιμή p και FDR για τους καταστολείς όγκων, και όλα τα γονίδια, αντίστοιχα. Το ιστόγραμμα στο Σχήμα 5 δείχνει ότι η συσχέτιση η διάμεση Pearson είναι r = 0.247, παρέχοντας ένα παγκόσμιο δείκτη της επιρροής του αριθμού αντιγράφων γονιδίου επί της έκφρασης.

Ιστόγραμμα των συσχετίσεων της Pearson μεταξύ αριθμού αντιγράφου και γονιδιακή έκφραση για την πλήρη σύνολο των 18.504 γονιδίων με τις δύο τιμές διαθέσιμες. Τα άνω και κάτω σύνολα σημάδια υποδιαίρεσης επάνω από τα x-άξονα δείχνουν τους συσχετισμούς για τα μεμονωμένα ογκογονίδια (με κόκκινο χρώμα) και όγκου-καταστολείς (σε μπλε χρώμα), αντίστοιχα.

Η

Η μέση συσχέτιση της συνδυασμένης δεδομένων είναι υψηλότερη από οποιαδήποτε ατομική πλατφόρμα (Agilent: 0.212, NimbleGen: 0.149, Affymetrix: 0,242, Illumina: 0.226)., και πάλι υπονοώντας ότι η συνδυασμένη δεδομένων βελτιώνει την εκτίμηση του αριθμού αντιγράφων πάνω από τη χρήση οποιουδήποτε επιμέρους πλατφόρμα

το υποσύνολο των 101 γνωστές καταστολείς όγκων είχαν σημαντικά υψηλότερη διάμεση συσχέτιση (r = 0.408, Εικόνα 5) από ολόκληρο το γονιδίωμα (r = 0.247, Εικόνα 5). Το υποσύνολο των 96 γνωστών ογκογόνων έδειξε μόνο ελαφρώς υψηλότερη συσχέτιση σε σχέση τη συνολική γονιδιώματος (διάμεσος r = 0,255? Σχήμα 5). Αυτά τα αποτελέσματα αποδεικνύουν ότι οι επιρροές απώλεια έκφρασης γονιδίου γνωστών καταστολείς όγκων σε μεγαλύτερο βαθμό από ό, τι είτε οι «όλων των γονιδίων» ή ογκογονίδια ομάδες.

Αναγνώριση Νέων Υποθετικές ογκοκατασταλτικά γονίδια

Από εστιακό αλλαγές στην αριθμό αντιγράφων του DNA των γονιδίων γνωστών καταστολής όγκου (Σχήμα 1 Β και C, το Σχήμα 3, Πίνακας 2) έδειξε πολύ σημαντική συσχέτιση με τα επίπεδα έκφρασης μεταγράφου τους (Σχήμα 5, Πίνακας 2), χρησιμοποιήσαμε αυτό το χαρακτηριστικό για την αναζήτηση και τον εντοπισμό επιπρόσθετων γονιδίων με δυναμικό σχέση με τον καρκίνο. Η προσέγγισή μας βασίστηκε στα αποτελέσματα για το γνωστό καταστολείς όγκων CDKN2A και ΡΤΕΝ (Πίνακας 3). Τα κριτήρια επιλογής για τα νέα γονίδια που απαιτούνται: i) συσχετίσεις μεταξύ αριθμού και απομαγνητοφώνηση επίπεδα αντιγράφων του DNA σημαντική σε FDR 0,05, ii) εστιακή κέρδη ή ζημίες σε-τουλάχιστον τρεις κυτταρικές σειρές [εστιακό αλλαγές ορίστηκαν ως κέρδη ή ζημίες μικρότερη από 5 Mb που επικαλύπτουν το γονίδιο], και iii) αναλογία 3:01 ή μεγαλύτερη για τον αριθμό των κυτταρικών σειρών με ζημιές σε σύγκριση με τα κέρδη. Επιπλέον, απαιτείται ότι τα γονίδια περάσει ένα τέταρτο κριτήριο ότι θα πρέπει να υπάρχει καμία γνωστή καταστολείς των όγκων μέσα σε 2 MB (για να αποφευχθεί η ανίχνευση «γείτονες» γνωστών καταστολείς των όγκων του οδηγού).

Η

Έχουμε αξιολογήσει όλες 18504 γονίδια που έχουν τόσο τη γονιδιακή έκφραση και τον αριθμό αντιτύπου εκτιμήσεις για τον εντοπισμό εκείνων που πέρασαν τα παραπάνω κριτήρια. Τριάντα ένα γονίδια πέρασε κριτήρια 1-3 (Πίνακας S4), και 22 ικανοποιημένοι και τα τέσσερα κριτήρια (που αναφέρεται στη στήλη U και επισημαίνονται με πράσινο χρώμα). Εκείνοι ομάδα γονιδίων σε 12 «συστάδες γονιδίων», έτσι ώστε τα γονίδια στο ίδιο σύμπλεγμα είναι δίπλα στο άλλο και έχουν αριθμούς αντίγραφο που σχετίζονται στενά (μεταξύ τους) σε ολόκληρη την NCI-60 (Pearson συσχέτιση & gt? 0,8), υποδεικνύοντας ότι αυτοί χάνονται σε μεγάλο βαθμό ή έχει αποκτηθεί ως ομάδα. Οι 22 νέες όγκου συστάδες καταστολέα είναι σε cytobands 11q13.4, 17p12, 17ρ11.2, 17q23.1, 21q11.2, 21q21.1, 22q11.21, 22q12.2, 22q13.1 και Xp22.31. Ο Πίνακας 3 παραθέτει δέκα από τα γονίδια που εμπίπτουν μέσα σε αυτές τις συστάδες και έχουν αναφερθεί να εμφανίζουν χαρακτηριστικά ογκοκατασταλτικά.

Συζήτηση

Στην παρούσα μελέτη συνδυάσαμε δεδομένα σχετικά με την NCI-60 του πίνακα κυτταρική σειρά από τέσσερις υψηλής ανάλυσης array CGH πλατφόρμες. Συνδυάζοντας τις τέσσερις πλατφόρμες δίδει ένα σύνολο δεδομένων με i) αυξημένη κάλυψη ιχνηλάτη, ii) υψηλότερη συσχέτιση με τον αριθμό αντιγράφων εκτιμάται από την CCLE (Cancer Cell Γραμμή Εγκυκλοπαίδεια), και iii) υψηλότερη συσχέτιση με την έκφραση του γονιδίου, υποδεικνύοντας καλύτερες εκτιμήσεις ότι οποιαδήποτε πλατφόρμα μόνος .

το σύνολο δεδομένων προσθέτει στην γκάμα των μοριακών διαθέσιμα στοιχεία για το NCI-60, διευκολύνοντας την ολοκληρωμένη ( «integromic») [4], [8], [32], [35] οι μελέτες της βιολογίας του καρκίνου και μοριακής φαρμακολογίας. Τα δεδομένα και τα εργαλεία ανάλυσης για να διευκολυνθεί η χρήση του είναι διαθέσιμα στο κοινό στο NIH CellMiner μας σουίτα web [21] (Εικόνα 1Α). Πρέπει επίσης να παρέχουν ένα παράδειγμα του είδους ολοκληρωμένη ανάλυση που μπορεί να γίνει. Συγκρίνοντας τον αριθμό αντιγράφων του DNA για CDKN2A, ένα γνωστό ογκοκατασταλτικό με την έκφραση του mRNA του αποκαλύπτει την ισχυρή τρόπο με τον οποίο αυτή η μοριακή μεταβολή συσχετίζεται με την έκφραση γονιδίων, και η συχνή απενεργοποίηση του στην NCI-60 (βλέπε Εικόνα 1 και Πίνακας S3). Συγκρίνοντας τον αριθμό αντιγράφων του DNA για CDKN2A στην ένωση της βάσης δεδομένων αποκαλύπτει η FDA-εγκεκριμένο φάρμακο μιτοξαντρόνη (NSC301739) ως πιο ενεργό σε κυτταρικές σειρές με CDKN2A νοκ-άουτ (Σχήμα 2).

Τα σχέδια των κερδών και ζημιών στο

You must be logged into post a comment.