PLoS One: Μια σύγκριση της Ενιαίας μορίου και ενίσχυση Βασισμένο αλληλουχίας του Καρκίνου Transcriptomes


Αφηρημένο

Το δεύτερο κύμα των τεχνολογιών επόμενης γενιάς αλληλουχίας, που αναφέρεται ως ένα μόνο μόριο αλληλουχίας (SMS), φέρει την υπόσχεση του προφίλ δείγματα απ ‘ευθείας χωρίς την χρησιμοποίηση στάδια αντίδρασης αλύσου πολυμεράσης που χρησιμοποιεί μεθόδους προσδιορισμού αλληλουχίας που βασίζονται σε ενίσχυση (AS). Να εξετάσει τα πλεονεκτήματα και των δύο τεχνολογιών, εξετάζουμε mRNA αποτελέσματα αλληλουχίας από ένα μόνο μόριο και αλληλούχιση ενίσχυση που βασίζεται σε ένα σύνολο ανθρώπινων καρκινικών κυτταρικών σειρών και ιστών. Παρατηρούμε μια χαρακτηριστική προκατάληψη κάλυψη έναντι υψηλού μεταγραφές αφθονία σε αλληλούχιση ενίσχυση που βασίζεται. Ένα μεγαλύτερο κλάσμα του AS διαβάζει κάλυμμα υψηλής έκφρασης γονίδια, όπως εκείνα που συνδέονται με μεταφραστικές διεργασίες και τα γονίδια οικοκυρική, με αποτέλεσμα σχετικά μικρότερη κάλυψη των γονιδίων σε χαμηλές και μεσαίου επιπέδου αφθονία. Σε αντίθεση, η κάλυψη των υψηλών μεταγραφές αφθονίας οροπέδια off χρησιμοποιώντας SMS. Κατά συνέπεια, το SMS είναι σε θέση να ακολουθία χαμηλότερης μεταγραφές αφθονία πιο διεξοδικά, συμπεριλαμβανομένων και ορισμένων που εντοπιζόταν με μεθόδους AS? Ωστόσο, αυτές περιλαμβάνουν πολλά άλλα αντικείμενα χαρτογράφησης. Η καλύτερη κατανόηση των τεχνικών και αναλυτικών παράγοντες εισαγωγή πλατφόρμα συγκεκριμένες προκαταλήψεις σε εφαρμογές αλληλουχίας μεταγραφικό υψηλής απόδοσης θα είναι κρίσιμη σε μελέτες μετα-αναλυτική πολλαπλής πλατφόρμας

Παράθεση:. Σαμ LT, Lipson D, Raz Τ, Cao Χ, Thompson J, Μήλος PM, et al. (2011) Μια σύγκριση της Ενιαίας μορίου και ενίσχυση Βασισμένο αλληλουχίας του Καρκίνου Transcriptomes. PLoS ONE 6 (3): e17305. doi: 10.1371 /journal.pone.0017305

Επιμέλεια: Θωμάς Preiss, Victor Chang Καρδιακές Ίδρυμα Ερευνών (VCCRI), Αυστραλία

Ελήφθη: 18 Οκτωβρίου του 2010? Αποδεκτές: 28 του Ιανουαρίου του 2011? Δημοσιεύθηκε: 1 Μαρ, 2011

Copyright: © 2011 Sam et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. AMC είναι υποστηρίζεται από το Φιλανθρωπικό Ίδρυμα Βραβείο Κλινική Επιστήμονας Doris Duke, ένας Burroughs Καλώς ήρθατε Βραβείο Ιδρύματος στην Κλινική Translational Research, και το Ίδρυμα του καρκίνου του προστάτη. AMC είναι μια αμερικανική Αντικαρκινική Εταιρεία Έρευνας καθηγητής. CAM προέρχεται επί του παρόντος στήριξη από την αμερικανική ένωση της Έρευνας για τον Καρκίνο Amgen Υποτροφία στην Κλινική /Translational Research, των Καναρίων Ιδρύματος και American Cancer Society Πρώιμη Ανίχνευση μεταδιδακτορικής έρευνας, καθώς και ένα Βραβείο Νέου Ερευνητή του προστάτη Ίδρυμα Καρκίνου. LTS υποστηρίζεται από το Πανεπιστήμιο του Michigan Βιοπληροφορικής Πρόγραμμα Κατάρτισης. DL, TR, JT, και PMM είναι υπάλληλοι της Helicos BioSciences Corporation. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:. DL, TR, JT, και PMM είναι υπάλληλοι της Helicos BioSciences Corporation. Αυτό δεν αλλάζει την τήρηση των συγγραφέων σε όλους PLoS ONE πολιτικές για την ανταλλαγή δεδομένων και υλικών.

Εισαγωγή

δείγματα αλληλουχίας σε ανάλυση ένα μόνο μόριο θεωρείται ως το επόμενο βήμα στην εξέλιξη των Επόμενο γενιά αλληλουχίας (NGS). Αυτές οι τεχνολογίες έχουν ήδη παραχθεί άνευ προηγουμένου ποσοτήτων δεδομένων σε ανάλυση νουκλεοτίδιο επίπεδο, και μεταμορφώνουν την ικανότητά μας να παρατηρήσουμε τα βιολογικά συστήματα. τεχνολογία NGS είχε ιδιαίτερο αντίκτυπο στη μελέτη της transcriptomes μέσω αλληλουχίας του mRNA, ή RNA-Seq. Προσφέροντας ένα ευρύ δυναμικό εύρος και πραγματικά σφαιρική άποψη, αυτή η εφαρμογή NGS γρήγορα αντικαθιστώντας τις υπάρχουσες προσεγγίσεις για την παρακολούθηση πολύπλοκων transcriptomes όπου και οι δύο μήκη απομαγνητοφώνηση και οι συγκεντρώσεις είναι εξαιρετικά ετερογενής. Η πολύπλευρη φύση του RNA-Seq επέτρεψε σε βάθος ανάλυση της μεταγραφής αφθονίας [1], [2], [3], εναλλακτικό μάτισμα [4], [5], [6], [7], τα νέα μεταγραφή ανίχνευσης [8], ανακάλυψη βιοδεικτών [9], [10], [11], την ανίχνευση του παθογόνου και χαρακτηρισμός [12], [13], [14], και την ανακάλυψη του γονιδίου σύντηξης [15], [16], [17] .

Το πρώτο κύμα των πλατφορμών αλληλουχίας «επόμενης γενιάς», όπως αυτές από την Applied Biosystems, Illumina, Ion Torrent, και η Roche /454, χρησιμοποιούν PCR βασίζεται βήματα ενίσχυσης στο πλαίσιο της προετοιμασίας του δείγματος και προσδιορισμός της αλληλουχίας και επομένως χαρακτηρίζονται ως ενίσχυση αλληλουχίας βάση (AS) μεθόδους. Ένα δεύτερο σύνολο από πλατφόρμες, που περιγράφεται ως «ενιαία αλληλουχίας μόριο» (SMS) [18] από Helicos και του Ειρηνικού Βιοεπιστημών, να εξαλείψει τα βήματα ενίσχυσης που εμπλέκονται στη διαδικασία προετοιμασίας του δείγματος και προσδιορισμός της αλληλουχίας και έτσι πρεσβεύουν να παρέχει μια πιο ακριβή εικόνα της μεταγραφικό.

Καθώς οι τεχνικές συνήθως περιλαμβάνουν δύο στάδια ενίσχυσης? η πρώτη ενίσχυση λαμβάνει χώρα κατά τη διάρκεια της δημιουργίας της βιβλιοθήκης cDNA διπλής έλικας από την κατακερματισμένη mRNA. Τα cDNA προσδέθηκε σε ένα ζεύγος μορίων προσαρμογέα, και ενισχύεται με PCR. Ένα δεύτερο στάδιο ενίσχυσης πραγματοποιείται με τον προσαρμογέα-προσδέθηκε απλούς κλώνους cDNA υβριδοποιήθηκε με εκκινητές δεσμευμένο σε ένα γυαλί ή πυρίτιο υπόστρωμα για την παραγωγή τοπικών συσπειρώσεων ταυτόσημων μορίων χρησιμοποιώντας ισοθερμικής ενίσχυσης ή γαλάκτωμα PCR. Λαμβανόμενα μαζί, αυτά τα δύο βήματα έχουν τη δυνατότητα να εισαγάγει επιλεκτικά υπερεκπροσωπούνται τμήματα και γονιδίων μέσα ως δεδομένα. Έχει παρατηρηθεί ότι υπάρχει αυτή η προκατάληψη [19], [20], [21], [22], ωστόσο επίδρασή του στην μεταγραφή κάλυψη και τον ποσοτικό προσδιορισμό δεν έχει πλήρως διερευνηθεί σε συγκρότημα δειγμάτων με προϊόντα μετεγγραφής σε μεταβλητά συγκέντρωση. Το πρωτόκολλο SMS Helicos περιλαμβάνει δημιουργία προτύπων μονόκλωνου cDNA απευθείας από mRNA και υβριδισμό αυτών των πολυ-αδενυλιωμένα πρότυπα για να συμπληρωματικά ολιγομερή δεσμευμένο σε ένα γυάλινο πλακίδιο για αλληλούχιση (Σχήμα S1).

Αποτελέσματα

αξιολόγηση των SMS RNA-Seq μέσω μεταγραφή προφίλ

Για να αξιολογήσει συστηματικά τις διαφορές μεταξύ των δύο τεχνολογιών αλληλουχίας, αναλύσαμε RNA-Seq αποτελέσματα από την αλληλούχιση ενίσχυση με βάση (AS) και αλληλούχιση ένα μόνο μόριο (SMS) σε όλη την ένα σύνολο από κυτταρικές σειρές καρκίνου του δώδεκα και δείγματα ιστών. Ειδικότερα, η προσέγγισή μας προσπάθησαν να ανακαλύψουν επαναλαμβανόμενες προκαταλήψεις που μπορούν να εισαχθούν από τα βήματα ενίσχυσης τεκμαρτό AS. Η αρχική μας σύνολο δεδομένων χρησιμοποιείται για την αξιολόγηση των επιδόσεων ποσοτικοποίηση αποτελείται από δείγματα από τις καρκίνο του προστάτη κυτταρικές γραμμές DU145, RWPE, VCAP, και LnCaP, και ένας προστάτη ιστό όγκου του καρκίνου με συμφωνημένα παρακείμενο φυσιολογικό δείγμα. Από σειρά μας, τρία δείγματα καθένα από vcap και ΙΝΟειΡ δομημένη ως μια μελέτη πορεία του χρόνου με 0 h, 24 h και 48 h Χρόνος σημεία.

Στην ανάλυσή μας για τις δύο τεχνολογίες, επιλέξαμε να χρησιμοποιήσετε το προτιμώμενο εργαλείο ευθυγράμμισης για κάθε τεχνολογία σε ένα «εναντίον καλύτερο καλύτερο» προσέγγιση. AS διαβάζει ευθυγραμμίστηκαν με την aligner Bowtie [23], ενώ SMS διαβάζει ευθυγραμμίστηκαν με IndexDP [24] (Εικόνα S2). Διαβάζει την ευθυγράμμιση με τις γνωστές βιολογικές ουσίες όπως μιτοχονδριακό DNA, ριβοσωμικό RNA, και η τεχνολογία-ειδικούς ρύπους, όπως ακολουθίες προσαρμογέα και καιρό ολιγομερή, διηθούνται από τα δεδομένα που πριν από την ανάλυση.

Για να εκτιμηθεί η διακύμανση μεταξύ των SMS και οι τεχνολογίες, υιοθετήσαμε μια απλή διαδικασία καταμέτρησης ανάγνωσης παρόμοια με άλλες μεθοδολογίες ποσοτικοποίηση RNA-Seq [1], [2]. Διαβάζει από μόνο λωρίδες AS και τεχνολογίες SMS τρέχουν παράλληλα, ήταν ευθυγραμμισμένες με 56722 Πανεπιστήμιο της Καλιφόρνια Σάντα Κρουζ (UCSC) μεταγραφές (έκδοση hg18). Στη συνέχεια απαριθμούνται διαβάζει ανά μεταγραφής και κανονικοποιήθηκε με βάση τον αριθμό των υψηλής ποιότητας, μη-μολυσματικό διαβάζει ανά δείγμα για να ληφθούν τιμές σε διαβάζει ανά εκατομμύριο (RPM). Για να αποφευχθεί η αβεβαιότητα που σχετίζεται με multi-αντιστοιχίσεις με ισομορφές του γονιδίου, μόνο και μόνο-καλύτερες μεθόδους χαρτογράφησης χρησιμοποιήθηκαν για την ποσοτικοποίηση των γονιδίων για σύγκριση. Ενιαία καλύτερες αντιστοιχίσεις προήλθαν από AS διαβάζει θέτοντας Bowtie να αναφέρουν μόνο το ενιαίο υψηλότερο ευθυγράμμιση ποιότητας ανά ανάγνωσης. Ενιαίο καλύτερο ευθυγραμμίσεις προήλθαν από SMS διαβάζει από την αποδοχή ευθυγραμμίσεις με τις υψηλότερες βαθμολογίες ποιότητας. Οι τιμές από όλες τις ισομορφές μεταγραφής γονιδίου, όπως ορίζεται από UCSC, αθροίστηκαν για να δώσουν τιμές σε όρους ευθυγραμμίσεις ανά εκατομμύριο διαβάζει για κάθε μία από τις 29.416 γονίδια. τιμές κάλυψη διαβάζει ανά κιλοβάσης ανά εκατομμύριο (RPKM) υπολογίστηκαν αθροίζοντας τιμές RPKM των ισομορφών του κάθε γονιδίου. Μέσα από ένα κεφάλι σε σύγκριση κεφάλι μεταξύ AS και SMS διαβάζει πανομοιότυπα δείγματα τρέχουν παράλληλα για τις δύο πλατφόρμες, παρατηρήσαμε μια συστηματική υπερ-εκπροσώπηση των υψηλών εκφράζοντας μεταγραφές στην AS σε σύγκριση με SMS. Αυτή η προκατάληψη οδήγησε σε μειωμένη κάλυψη των γονιδίων έκφρασης μέσα και χαμηλότερου επιπέδου που οδηγούν σε συνολική χαμηλότερη ευαισθησία ανίχνευσης μεταγραφή στην AS. Επανεπεξεργασία ένα υποσύνολο των δειγμάτων που χρησιμοποιεί IndexDP και επαναλαμβάνοντας την ανάλυση απέκλεισε τεχνικές διαφορές στις διαβάσετε ανάθεση ως η αιτία αυτής της πόλωσης εκπροσώπηση. Καθώς οι τεχνολογίες αλληλουχίας και χημείες συνεχίσει να προωθεί, αναμένουμε ως πλατφόρμες θα ξεπεράσει τον περιορισμό της χαμηλής εξέφρασε την ανίχνευση μεταγραφή με αυξημένη απόδοση.

Παγκόσμια ιδιότητες του AS και τα αποτελέσματα SMS

αλληλουχίας μεταγραφικό διεξήχθη εκτελούνται παράλληλα στο AS και SMS πλατφόρμες για 12 δείγματα, συμπεριλαμβανομένων 10 προστάτη κυτταρικές σειρές καρκίνου του προστάτη και 2 καρκινικούς ιστούς. Συνολικά, παράγονται 2,8 να 19,7 εκατομμύριο πρώτων AS και SMS διαβάζει σε καθένα από τα 12 δείγματα. Περίπου το 30-60% αυτών διαβάζει πέρασε αρχικά στάδια φιλτραρίσματος και ευθυγραμμισμένο με αναφορά μεταγραφικό μας. SMS διαβάζει παρήχθησαν σε δύο ξεχωριστές εκτελέσεις μηχάνημα ενώ AS διαβάζει παρήχθησαν σε 6 ανεξάρτητα τρεξίματα μηχάνημα. Η διαδικασία αυτή οδήγησε σε 2,1 έως 15000000 και 2,8 έως 8.000.000 διαβάζει για SMS και AS, αντίστοιχα, η οποία ευθυγραμμίζεται με αναφορά μεταγραφικό μας. Σε 10 από τα 12 δείγματα που χρησιμοποιούνται για την αξιολόγηση, SMS που παράγεται περισσότερο ευθυγραμμίσιμες διαβάζει σε απόλυτους όρους, με ένα μέσο όρο 1.39x σε όλα τα 12 δείγματα. αποτελέσματα SMS που περιέχονται περισσότερες διαβάζει ευθυγράμμιση με τις γνωστές προσμείξεις, που κυμαίνονται από 12% έως 51% των συνολικών διαβάζει, με ένα μέσο όρο 22%. Το κλάσμα των διαβάζει ευθυγράμμιση με τις προσμείξεις των AS κυμαίνονταν από 2,6% έως 14%, με ένα μέσο όρο 4,2%. SMS διαβάσει το μήκος ήταν μεταβλητό και ένα βήμα φιλτραρίσματος περιορίζεται μπορούν να χρησιμοποιηθούν διαβάζει σε μια περιοχή μήκους μεταξύ 24 bp και 57 bp στην πρώτη εκτέλεση, και 25 bp και 64 bp στο δεύτερο γύρο μας, παρέχοντας μια ανάγνωση μετράνε σταθμισμένο μέσο μήκος περίπου 33 bp σε κάθε ένα από τα δώδεκα δείγματα (Πίνακας S1). Ένας μέσος όρος των 97% του συνόλου των SMS διαβάζει είχε μήκος μεταξύ 25 bp και 47 bp σε όλα τα 12 δείγματα (Σχήμα S3). AS διαβάζει παρήχθησαν σε ένα ελάχιστο μήκος 36 bp σε κάθε δείγμα, αν και η πρώτη και η τελευταία αρκετές βάσεις αγνοήθηκαν για την παραγωγή υψηλής ποιότητας διαβάζει τουλάχιστον 34 bp σε μήκος. Όλα AS διαβάζει θεωρήθηκαν για να έχουν ένα μέγιστο των 36 μήκους bp. Αναπαραγωγιμότητα μεταξύ της τεχνικής επαναλήψεων της κυτταρικής γραμμής DU145 ήταν υψηλό για τόσο ως και μεθόδους SMS, με συσχέτιση Pearson του

r = 0,98

για αμφότερες τις τεχνολογίες (Σχήμα S4). Διαβάζει από τόσο AS και SMS επίσης ευθυγραμμισμένες επιτρέποντας για 25 κατ ‘ανώτατο όριο αντιστοιχίσεις για να εκτιμηθεί η κατανομή μεταξύ uniquely- και πληθαίνουν χαρτογραφηθεί διαβάζει στο επίπεδο του γονιδίου, αν και μόνο μονά-καλύτερες αντιστοιχίσεις χρησιμοποιήθηκαν για τους σκοπούς της ποσοτικοποίησης και σύγκριση. Και οι δύο τεχνολογίες επιτευχθεί πολύ παρόμοιο μοναδικό ποσοστά χαρτογράφηση του 72% και 75% στην AS και SMS, αντίστοιχα. Από αυτή την πρώτη ευθυγραμμισμένα δεδομένα, εξετάσαμε την σχετική κατανομή των διαβάζει όλη γονίδια που παρατηρήθηκε στα δείγματα μας συγκρίνοντας κανονικοποιημένες μετρήσεις ανάγνωσης τους. Όπως ήταν αναμενόμενο, παρατηρήσαμε ευρεία συμφωνία όσον αφορά τις τιμές της γονιδιακής έκφρασης μεταξύ των τεχνολογιών (Σχήμα S5). Ωστόσο, παρατηρήσαμε ένα επαναλαμβανόμενο μοτίβο της υπερ-εκπροσώπηση των μεταγραφών υψηλής αφθονίας από τη μεθοδολογία AS σε σύγκριση με SMS.

Κάλυψη προκατάληψη στην ενίσχυση αλληλουχίας

Σύγκριση μεταγραφικό διαβάζει το ίδιο δείγματα ποσοτικοποιούνται παράλληλα από AS και SMS πλατφόρμες αποκαλύπτει μια ξεχωριστή προκατάληψη σε AS οδηγεί προς μία ελαφρά υπερεκπροσώπηση των εντόνως εκφρασμένων γονιδίων σε σύγκριση με SMS, όπως φαίνεται στο Σχήμα 1Α. Αυτή η διαφορά ποιοτικά εκτιμήθηκε με διαίρεση των γονιδίων σε τεταρτημόρια του ίσο αριθμό, με εντολή παρατηρούμενες τιμές σε AS, με την πρώτη τεταρτημόριο που αντιπροσωπεύουν τις υψηλότερες έκφραση γονιδίων, το δεύτερο τεταρτημόριο αντιπροσωπεύει γονίδια έκφρασης μεσαίου επιπέδου, και το τρίτο και το τέταρτο τεταρτημόριο ορίζουν το γονίδια με τα χαμηλότερα επίπεδα μεταγραφών (Σχήμα 1Β). Εξαιρετικά εξέφρασε μεταγραφές έτειναν να έχουν μεγαλύτερη κάλυψη ανάγνωσης στην AS, ενώ SMS έτειναν να καλύψει τις χαμηλότερες εξέφρασε μεταγραφές πιο αποτελεσματικά (Πίνακας S3). Αυτή η πρόσθετη κάλυψη μεταγραφές υψηλής συγκέντρωσης συνέπεια φαίνεται να είναι σε βάρος της χαμηλότερης εξέφρασε μεταγραφές, τα οποία έτειναν να είναι πιο προσεκτικά την αλληλουχία με χρήση SMS (Πίνακας S4).

(Α) Single-καλύτερο Μεθοδολογι- χαρτογράφησης με βάση ποσοστημόριο-quantile οικόπεδο δείχνει απόδειξη της υπερ-εκπροσώπηση των υψηλής έκφρασης μεταγραφές στην αλληλούχιση ενίσχυση που βασίζεται σε σύγκριση με τις μεθόδους και μόνο μόριο. (Β) Κατανομή διαβάζει όλη γονιδίων από παραστάσεις συγκέντρωσης μεταγραφή μειωμένη κάλυψη SMS από τα πιο υψηλής έκφρασης των γονιδίων, με εκείνους που διαβάζει πρόκειται να μεσοπρόθεσμων και εκφραστές χαμηλού επιπέδου. (Γ) Οι διαφορές στην κατανομή των διαβάζει οδηγούν σε αυξημένη ευαισθησία σε χαμηλές εκφράζουν μεταγραφές. (Δ) εννέα από τα υποψήφια γονίδια δει πάνω από το επίπεδο θορύβου 0,3 RPKM αποδειχθεί οποιαδήποτε ενίσχυση με RT-PCR, αν και μόνο

HIST1H4C

έδειξε μεγάλη αφθονία.

Η

Για να εξασφαλιστεί ότι αυτές οι προκαταλήψεις δεν ήταν το αποτέλεσμα της χρησιμοποιώντας μια διαφορετική aligner για κάθε τεχνολογία, καθώς διαβάζει εκ νέου ευθυγραμμισμένη με τη χρήση του aligner IndexDP που χρησιμοποιείται για SMS διαβάζει για ένα υποσύνολο των δειγμάτων, που αποτελείται από το vcap-24 h, vcap-48 h, LnCaP -24 h, LnCaP-48 h, και τα δείγματα DU145_1 (Σχήμα S6). Πολύ υψηλή συσχέτιση των τιμών του γονιδίου σε επίπεδο σύγκρισης Bowtie και IndexDP ευθυγραμμίσεις για το σύνολο της AS διαβάζει αποκλείεται οι διαφορές μεταξύ των μέσων ευθυγράμμισης ως πηγή των παρατηρούμενων τάσεων. Για παράδειγμα, η συσχέτιση των τιμών του γονιδίου-επίπεδο στο δείγμα LnCaP-24 ώρες ήταν υψηλή μεταξύ των μεθόδων ευθυγράμμιση σε

r

= 0,97. Ομοίως επίπεδα υψηλή συσχέτιση παραπάνω

r = 0,95

παρατηρήθηκαν στα υπόλοιπα δείγματα. Παρόμοια πρότυπα υψηλής εκφραστής υπερ-αντιπροσώπευση σε AS παρατηρήθηκαν χρησιμοποιώντας IndexDP ευθυγραμμίσεις AS διαβάζει στην θέση του προτύπου ευθυγραμμίσεις χρησιμοποιώντας Bowtie όπως φαίνεται στο Σχήμα S7. Με μεθοδολογικές διαφορές ουσιαστικά αποκλείεται, προσπαθήσαμε να παρατηρήσουν τα αποτελέσματα αυτής της υψηλής συγκέντρωσης προκατάληψη κάλυψη από την εξέταση της ανίχνευσης των μεταγραφών σε χαμηλά επίπεδα.

Αυξημένη SMS ευαισθησία αποτελέσματα από υψηλή κάλυψη των μεταγραφών χαμηλής αφθονίας

για να αξιολογήσει τις επιπτώσεις της αυξημένης κάλυψης στα μέσα με χαμηλά μεταγραφές επίπεδο SMS, υπολογίσαμε τον αριθμό των γονιδίων που παρατηρείται πάνω από ένα όριο θορύβου σε μία μόνο από τις δύο τεχνολογίες. Χρησιμοποιώντας το 0,3 RPKM αποκοπής στάθμη θορύβου με βάση την Ramskold, et al. [25], ο αριθμός των γονιδίων που ανιχνεύθηκαν σε ένα μόνο τεχνολογία κυμαίνονταν μεταξύ ενός υψηλού από 4851 και το χαμηλό του 2048 και το υψηλό του 1276 και το χαμηλό των 145 σε SMS και AS (Σχήμα 1 C), αντίστοιχα, κατά μήκος του συνόλου δείγματα. Μια διαφορά log-πλάσια μεταξύ του αριθμού των γονιδίων ανιχνεύθηκαν σε μόνο μία από τις έναντι SMS ως τεχνολογία παρατηρήθηκε καθώς μεταβάλλεται η τιμή αποκοπής μεταξύ 0,1 και 3,0 RPKM RPKM (Σχήμα S8) σε 0,1 προσαυξήσεις RPKM. Αυτά τα όρια επιλέχθηκαν για να εξεταστεί η ευαισθησία των δύο μεθόδων σε ένα ευρύ φάσμα τιμών ξεκινώντας από ένα σχεδόν μηδενικό επίπεδο θορύβου σε μία τάξη μεγέθους μεγαλύτερη από προηγουμένως αναφερθεί. Διαστρωμάτωση των γονιδίων που παρατηρούνται σε μια ενιαία τεχνολογία σε κατηγορίες μήκος 0-300 bp, 300-3000 bp, και 3000 + bp απέδειξε ότι αυτό δεν οφειλόταν σε διαφορές στην προετοιμασία του δείγματος συγκεκριμένη τεχνολογία, όπως το πρωτόκολλο AS καθορίζει -300 bp στάδιο επιλογής μέγεθος που η διαδικασία SMS δεν απαιτεί. Η κατηγορία αυτή παρουσιάζει σχετικά χαμηλή εκπροσώπηση σε όλη κατώτατα όρια θορύβου τόσο AS και SMS. Στη συνέχεια πήρε την αξιολόγηση αυτή ένα βήμα παραπέρα και εξέτασε τα αποτελέσματα και από τις δύο SMS και οι τεχνικές που προσπαθούν να βρουν γονίδια ανιχνεύσιμη σε μία μόνο τεχνολογία.

Μοναδικά εντοπιστεί γονίδια με SMS

Για να τεκμηριώσει το δυναμικό προκαταλήψεις εκπροσώπηση στις δύο πλατφόρμες και η προτεινόμενη πρόσθετη ευαισθησία των SMS, είμαστε δίπλα ερωτηθούν για τα γονίδια που ανιχνεύτηκαν πάνω από ένα όριο θορύβου μέσω SMS, αλλά ήταν κάτω από το όριο αυτό στην AS. Εμείς επιλέξαμε να αναλύσει το δείγμα DU145 καθώς ήταν η πιο καλά αλληλουχία του δείγματος με δύο επαναλήψεις τρέξει χρησιμοποιώντας κάθε τεχνολογία. Χρησιμοποιώντας ένα όριο 0,3 RPKM, επιλέξαμε να δοκιμαστεί η έκφραση των 23 γονιδίων σε δείγματα DU145 μας χρησιμοποιώντας RT-PCR, δέκα από τα οποία έδειξαν ανιχνεύσιμη ενίσχυση. Επιπλέον, έχουμε την αλληλουχία την κυτταρική γραμμή DU145 πολύ πιο διεξοδικά, προκειμένου να διασφαλιστεί ότι ανιχνεύσεις μας δεν ήταν λόγω τεχνικών παραγόντων σε μία μόνο κίνηση της μηχανής. Όπως φαίνεται στο Σχήμα S9, αυτό το σύνολο των γονιδίων είχε καλύτερη κάλυψη αλληλούχιση σε SMS σε σύγκριση με AS σε όλη την συνολική 94427789 διαβάζει παράγεται στο δεύτερο σετ μας τρεξίματα. Αυτή η λίστα δημιουργήθηκε από την εξέταση της κατανομής των διαβάζει και χάρτες κάλυψης από τα κορυφαία 50 γονίδια των οποίων RPKM κάλυψη έδειξε τη μεγαλύτερη διαφορά μεταξύ AS και τεχνικές SMS και είχε επίσημες ονομασίες HUGO [26]. Οι υποψήφιοι επιλέχθηκαν για την παρουσία των μεγάλων (& gt? 36 bp) η χαρτογράφηση διαβάζει και καλά κατανεμημένη ανάγνωσης ευθυγραμμίσεις σε όλο το μήκος των μεταγραφών. Των επικυρωμένων γονίδια ανιχνευθούν μόνο από SMS, μόνο

HISTH1H4C

βρέθηκε να είναι παρούσα στο δείγμα DU145 με υψηλή εμπιστοσύνη, όπως φαίνεται στο σχήμα 1Δ. Εννέα άλλα υποψήφια γονίδια

AK5

,

ACVRL1

,

AMHR2

,

CERKL

,

ΠΧΣ

,

MAGI2

,

PIP5K1B

,

FAM49A

, και

TPRXL

έδειξε αδύναμη ενίσχυσης. Σε αυτό το σύνολο των γονιδίων, ενίσχυση παρατηρήθηκε μόνο πέραν του κύκλου 30 που καθιστά δύσκολο να επιβεβαιώσουν την παρουσία τους. Είμαστε δίπλα προσπάθησε να εξετάσει τις υπερεκπροσωπούνται γονίδια που μπορεί να συμβάλει στη μείωση της ευαισθησίας χρησιμοποιώντας τεχνικές προσδιορισμού αλληλουχίας ενίσχυσης που βασίζεται.

Συνεπής υπερ-εκπροσώπηση των γονιδίων υψηλής έκφρασης σε αλληλούχιση ενίσχυση με βάση

Συνολικά, 393 γονίδια βρέθηκαν να είναι σταθερά μέσα στο σύνολο των 500 κορυφαίων υπερεκπροσωπούνται γονίδια σύμφωνα με την κανονικοποιημένη καταμέτρηση χαρτογράφηση ανάγνωσης σε τουλάχιστον 40% των δειγμάτων μας (Πίνακας S2). Από αυτά τα 393 γονίδια, δέκα γονίδια βρέθηκαν να υπερ-αντιπροσωπεύεται από ομαλοποιημένη μέτρηση χαρτογράφηση ανάγνωσης σε όλα τα 12 από τα δείγματα που εξετάσθηκαν στη μελέτη. Οι χάρτες κάλυψης του

RPLP0

και

RPL31

, υπερεκπροσωπούνται σε όλα τα 12 δείγματα, και

SPINT2

, υπερεκπροσωπούνται σε 11 δείγματα, καταδεικνύουν αυτή την προκατάληψη κάλυψη σε αυτά τρία υψηλής έκφρασης μεταγραφές (Σχήμα 2Α, Β, C). Στη συνέχεια εξέτασε την σύνθεση και την κατανομή των διαβάζει σε μερικά από αυτά τα εξαιρετικά υπερ-εκπροσωπούνται μεταγραφές.

χαρτών Κάλυψη από την ενίσχυση με βάση και μόνο αλληλουχίας μόριο επιδεικνύουν σημαντικά μεγαλύτερη κάλυψη (Α)

RPLP0

, (Β)

RPL31

, και (Γ)

SPINT2

. Απομάκρυνση των διαβάζει με τις ίδιες θέσεις εκκίνησης, αυστηρά καταστολή ενίσχυση ειδικών θραυσμάτων mRNA, μειώνει σημαντικά την «spikiness» δει σε αυτές τις περιπτώσεις. (D) Διπλότυπο διαβάζει, ορίζεται ως διαβάζει πάνω από ένα ανά τόπο έναρξης και διαβάστε το μήκος, είναι σχετικά ομοιόμορφα κατανεμημένα σε όλο το μήκος όλων των παρατηρούμενων μεταγραφές σε όλα τα δείγματα σε σύνολο αξιολόγηση μας.

Η

Επιπτώσεις της διπλή διαβάζει στην ενίσχυση με βάση αλληλουχίας

Το γονίδιο

RPLP0

είχε πολύ μεγαλύτερη συνολική κάλυψη χαρτογράφησης AS σε όλες τις δώδεκα δείγματα (Σχήμα S10). Για την άμβλυνση επιθετικά την επίδραση της ενίσχυσης στην κάλυψη αυτού του γονιδίου, εις διπλούν διαβάζει αφαιρέθηκαν (επιτρέποντας μόνο 1 read ανά μοναδική θέση εκκίνησης) και για τις δύο τεχνολογίες, όπως έγινε και σε προηγούμενες μελέτες [21], [22]. Αυτό είχε ως αποτέλεσμα την καταστολή πολλών από τις παρατηρούμενες κορυφές στο AS. Σε αντίθεση, SMS κάλυψη του γονιδίου φαίνεται να είναι σχετικά συνεπής σε όλο το μήκος του

RPLP0

μεταγραφή πριν και μετά τη διαδικασία αυτή. Αυτή η σημαντική διαφορά στη συμπεριφορά μεταξύ πριν και μετά διπλούν διαβάσετε αφαίρεσης για AS σε σύγκριση με SMS υποδεικνύει ότι η ενίσχυση είναι ένας σημαντικός παράγοντας που συμβάλλει στην παρατηρούμενη προκατάληψη. Παρόμοια συμπεριφορά παρατηρείται στο

RPL31

και

SPINT2

γονίδια, καθώς και.

Είμαστε θεωρείται τόσο ενεργητική ευθυγράμμιση και διαβάστε το μήκος στον ορισμό μας για να διαβάσετε επικάλυψη, επιτρέποντας μία ανάγνωση στο κάθε θέση με ένα μοναδικό μήκος ανάγνωσης. Κοιτώντας σε ολόκληρο τον μεταγραφικό τη χρήση αυτού του ορισμού των διαβάσετε επικάλυψη, παρατηρήσαμε μια κατά προσέγγιση κανονική κατανομή κατά μήκος όλων των μεταγραφές δεν σταματούν. Μια διαφορά 3-φορές σε μέσο αριθμό των διπλών διαβάζει μεταξύ AS και SMS σε όλη όλες οι μεταγραφές που παρατηρείται σε όλα τα δείγματα διατηρήθηκε σε όλη την πλειοψηφία του μήκους μεταγραφήματος (Σχήμα 2D). Αυτό το μοτίβο του διαβάσει επικαλύψεων είναι παρόμοια με αυτή που παρατηρήθηκε στην βιβλιογραφία μεταξύ των τυποποιημένων μεθοδολογιών ενίσχυση εξαρτώμενη και ενίσχυση χωρίς αλληλούχιση [27]. Αφαίρεση των διπλών διαβάζει, επιτρέποντας μόνο μία ανάγνωση ανά τόπο, έδωσαν αντιφατικά αποτελέσματα σε όλη την ομάδα του δείγματος (Σχήμα S11). Σε ορισμένες περιπτώσεις, η διαδικασία μείωσε τον υπερ-αντιπροσώπευση στα υψηλότερα έκφραση γονιδίων, ωστόσο η προκατάληψη φάνηκε να παραμείνουν σε άλλα δείγματα. Η διαδικασία επίσης μειωθεί δραστικά ο αριθμός των λέξεων διαβάζει από ένα μέσο όρο 47% σε όλη τη σειρά 12 δειγμάτων (Σχήμα S12). Ενώ αυτή η αφελής μεθοδολογία διπλούν αφαίρεσης ανάγνωσης είχε κάποια θετική επίδραση στη μείωση των διαφορών μεταξύ AS και SMS από την άποψη της μεταγραφής ποσοτικοποίησης, οι δραστικές συνέπειες που έχει για τον αριθμό των χρησιμοποιήσιμη διαβάζει όπως υποδηλώνει μια διαφορετική προσέγγιση μπορεί να είναι επιθυμητή. Με αυτή την κατανόηση του αντίκτυπου των διπλές διαβάζει, αναλύσαμε το σύνολο των κατ ‘επανάληψη υπερεκπροσωπούνται γονίδια για να δούμε αν η αλληλουχία βιολογικά ενδιαφέρουσες κατηγορίες γονιδίων.

Γονιδιακή Οντολογία ανάλυση του συνόλου των 393 περιοδικά υπερ-εκφρασμένων γονιδίων

πέρα ​​από τα δείγματα, τα γονίδια που σχετίζονται με την κυτταρική μηχανήματα του κυττάρου αποτελείται το μεγαλύτερο μέρος της υπερ-εκπροσωπούνται μεταγραφές με ολική κανονικοποιημένη αριθμό χαρτογράφηση διαβάζει στα περισσότερα δείγματα. Γονιδιακή Οντολογία ανάλυση του συνόλου των 393 σταθερά υπερεκπροσωπούνται γονίδια δείχνει ότι είναι συστατικά του μεταφραστικού μηχανισμού του κυττάρου (Σχήμα 3), μια κατηγορία γενικά βρίσκεται σε υψηλά επίπεδα σε όλες τις δώδεκα δείγματα που χρησιμοποιήθηκαν σε αυτήν την αξιολόγηση. Αυτό δείχνει και πάλι ότι η διαδικασία ενίσχυσης σιωπηρή προετοιμασία AS βιβλιοθήκη υπερβάλλει μια ιδιαίτερη κλίση προς αυτές τις ήδη άφθονη μεταγραφές. Ο συνολικός αριθμός των διαβάζει εμπίπτουν σε κάθε μία από τις κατηγορίες που παρατηρήθηκαν να είναι υπερ-εκπροσωπούνται στην AS ήταν κατά μέσο όρο 2.23x υψηλότερη σε σύγκριση με SMS, αν και τα γονίδια επικαλύπτονται μεταξύ των τάξεων. Με λιγότερο από μια έμφαση στην μηχανήματα μεταφραστική και καθαριότητας γονίδια υψηλής συγκέντρωσης, μπορούμε στη συνέχεια προσπάθησε να εφαρμόσει SMS στην εύρεση του γονιδίου συγχωνεύσεις στο μεταγραφικό.

GO ανάλυση των 393 πιο υπερεκπροσωπούνται γονίδια που βρέθηκαν χρησιμοποιώντας ανάλυση υποτροπής μας στη Μοριακή Λειτουργία (MF) και βιολογική διεργασία (BP) υποδένδρων αποδεικνύει ότι μεταφραστικές διεργασίες και τα συστατικά του ριβοσώματος υπερεκπροσωπούνται σε όλη δείγματα σε αλληλούχιση ενίσχυση που βασίζεται.

η

Re-ανακάλυψη του γνωστού γονιδίου συγχωνεύσεις, χρησιμοποιώντας ένα μόνο μόριο αλληλουχίας

Είμαστε αξιολόγησε την εφαρμογή του ενιαίου SMS ανάγνωσης στην ανακάλυψη της γονιδιακής σύντηξης με την προσπάθεια να ανακαλύψετε ξανά γνωστό συγχωνεύσεις γονιδίων στην κυτταρική σειρά vcap, είναι γνωστό ότι το λιμάνι

TMPRSS2-ERG

, σε

de novo

διαδικασία. Όπως φαίνεται στο Σχήμα S13, πρέπει πρώτα να ευθυγραμμίζονται με όλες τις πιθανές διαβάζει κατά της μεταγραφικό και γονιδιώματος χρησιμοποιώντας IndexDP. Το μη-χαρτογράφηση διαβάζει, τα οποία φιλοξενούν χίμαιρες, στη συνέχεια ευθυγραμμίζονται κατά την μεταγραφικό επιστροφή εκείνων που αναφέρει ότι είχε μια μερική ευθυγράμμιση τουλάχιστον 18 νουκλεοτίδια. Το τμήμα του ανάγνωσης που αποτυγχάνει να ευθυγραμμιστούν ορίζεται ως η προεξοχή. Όλα τα διαβάζει έχουν τα ίδια μερική ευθυγραμμίσεις, προτείνοντας ένα κοινό σημείο διακοπής, ήταν συγκεντρωμένα. Όλες οι συστάδες στη συνέχεια συγκρίθηκαν για να προσδιοριστεί εάν η προεξοχή από τη μια περιοχή breakpoint είχε ομοιότητα με την προεξοχή ενός ανεξάρτητου breakpoint ανακατασκευής έτσι την διασταύρωση σύντηξης. Τέλος, όλα τα υπόλοιπα μη-χαρτογράφηση διαβάζει ήταν ευθυγραμμισμένες κατά των νέων κόμβων σύντηξης.

Για το σκοπό αυτό, ένα δείγμα της κυτταρικής σειράς vcap αλληλουχήθηκε εκτενέστερα σε 2 κανάλια, δημιουργώντας 31.198.128 διαβάζει ευθυγραμμιστεί με το μεταγραφικό ή γονιδιώματος . Το δείγμα vcap παρασκευάστηκε με ένα κανάλι το καθένα με και χωρίς κατακερματισμό. Το σημείο αναφοράς σύντηξη μεταξύ του γονιδίου του ειδικού προστατικού

TMPRSS2

και ETS μέλος ογκογόνο οικογένειας,

ERG

[28], βρέθηκε να καλύπτεται από 53 διαβάζει από την παραγωγή 65 εκατομμύρια διαβάζει στην κυτταρική σειρά vcap (Σχήμα 4).

Σχηματική της ενδο-χρωμοσωμική αναδιάταξη στο χρωμόσωμα 21 τήξης

TMPRSS2

(κίτρινο) για να

ERG

(μοβ).

η

Συζήτηση

Αυτή είναι η πρώτη μελέτη για την αξιολόγηση της απόδοσης της RNA-Seq χρησιμοποιώντας αλληλούχιση ένα μόνο μόριο σε σύγκριση με τις υπάρχουσες τεχνικές ενίσχυσης που βασίζονται. Ενώ τα χαρακτηριστικά του SMS διαβάζει θα ποικίλει ανάλογα με την πλατφόρμα, αναμένουμε ότι η κατανομή των διαβάζει απέναντι διάφορες συγκεντρώσεις μεταγραφής να παραμείνει σχετικά σταθερή. Η τεχνική SMS ήταν σε θέση να παράγουν περισσότερο χρησιμοποιήσιμο διαβάζει σε δέκα από τα δώδεκα δείγματα εξετάζονται στο RNA-Seq ποσοτικοποίηση και αξιολόγηση κάλυψης, που παράγουν μια μέση 78% περισσότερο διαβάζει σε αυτά τα 10 δείγματα. Το πιο σημαντικό, αυτά διαβάζει την τάση να είναι λιγότερο πυκνό στο υψηλότερο μεταγραφές αφθονία, όπως φαίνεται στο Σχήμα 1Β, όπου κλάσμα του συνολικού διαβάζει χαρτογράφησης με τα υψηλότερα μεταγραφές αφθονία σε SMS είναι 4% κάτω από εκείνη του AS. Επειδή η τεχνική AS amasses ένα μεγάλο κλάσμα διαβάζει αλληλούχιση μεταγραφές υψηλής αφθονίας, ανίχνευση χαμηλοτέρων γονιδίων αφθονία μειώνονται. Οι μεγάλες διαφορές μεταξύ των υψηλότερων και δεύτερο υψηλότερο τεταρτημόριο εκφράζονται μεταγραφές υποδεικνύει ότι το αποτέλεσμα αυτό είναι μη γραμμική ως μεταγράφημα αφθονία αυξήσεις στο δείγμα. Το ευρύ φάσμα της έκφρασης μεταγραφής σε βιολογικά δείγματα που κάνει αυτή ασύμμετρη κατανομή ανάγνωσης της κάλυψης ένας σημαντικός παράγοντας κατά προφίλ mRNAs σε επίπεδο νουκλεοτιδίων, που αναχωρούν από τα μοντέλα που μπορεί να αναλάβει μια γραμμική συσχέτιση μεταξύ της μεταγραφής αφθονία και την κάλυψη αλληλουχίας.

Η αριθμός των διπλών αναγνώσεις παρατηρήθηκε στα δείγματα σε όλες τις μεταγραφές ήταν, όπως ήταν αναμενόμενο, 3 φορές υψηλότερη σε σύγκριση με το AS SMS. Η απομάκρυνση των διπλών διαβάζει είναι μια καλά καθορισμένη διαδικασία σε πειράματα που περιλαμβάνουν αλληλουχίας του DNA, αλλά είναι λιγότερο σαφής όταν αλληλούχιση του μεταγραφικό όπου διάφορες συγκεντρώσεις μεταγραφής φυσικά να οδηγήσει σε διαβάζει πανομοιότυπων τμημάτων mRNA. Αυτή η προειδοποίηση αυτή οφείλεται σε μεγάλο βαθμό εκφράζονται μεταγραφές συμβάλλοντας ψευδώς θετικά διπλούν διαβάζει οφείλεται στην τυχαία δειγματοληψία ανάγνωσης ξεκινήσει θέσεις κατά μήκος της μεταγραφής. Ωστόσο, εντόνως εκφρασμένο σε μεταγραφές SMS θα μπορούσε πιθανώς να δημιουργήσει ένα μεγάλο αριθμό αυτών των ψευδών θετικών καθώς και. Ως αποτέλεσμα, αυτή η πηγή ψευδών θετικών αντιγραφεί διαβάζει είναι απίθανο να είναι ο κύριος παράγοντας πίσω από τις παρατηρούμενες μεγάλες διαφορές στον αριθμό των αντιγράφων μεταξύ AS και SMS. Η απομάκρυνση των αντιγραφεί διαβάζει φιλτράροντας όλα διαβάζει πάνω από ένα και μόνο ανάγνωσης για μια ενιαία θέση φαίνεται να είναι μια ατελής λύση που εισάγει αρκετούς παράγοντες σύγχυσης κατά τη χρήση μόνο διαβάζει. Πρώτον, η διαδικασία αφαίρεσης διπλότυπων είναι ασυνεπής, που επηρεάζουν την προκατειλημμένη αντιπροσώπευση των διαβάζει μόνο σε ένα υποσύνολο των περιπτώσεων παρατηρούμε. Δεύτερον, η διαδικασία αφαίρεσης δύο αντίτυπα μείωσε επίσης την ωφέλιμη απόδοση ακολουθία από κάθε πειραματική τρέχει σχεδόν κατά το ήμισυ, αν και αυτό είναι μια υπερεκτίμηση λόγω του αφελή φύση της μεθόδου. Τέλος, αυτές οι διπλές μέθοδοι αφαίρεσης επιβάλει ένα όριο αιχμής κάλυψης για κάθε μεταγραφή που είναι ισοδύναμο με το μήκος ανάγνωσης. Η αφελής διαδικασία που εφαρμόζεται για την εξάλειψη των διπλότυπων είναι σίγουρα πάνω-επιθετική και αυτό το ζήτημα μπορεί να αρθεί εν μέρει με τη χρήση πιο εξελιγμένων βιοπληροφορικής και στατιστικών μεθόδων. Ωστόσο, αυτές οι διαδικασίες να επιβάλλουν πρόσθετους παράγοντες που δημιουργούν σύγχυση σε δεδομένα που SMS αποφεύγει εξ ολοκλήρου λόγω της άμεσης φύση της μεθοδολογίας προσδιορισμού αλληλουχίας. Εναλλακτικά, η χρήση των ζευγών-end επίσης διαβάζει παράγει πρόσθετες πληροφορίες χαρτογράφησης και αλληλουχία η οποία βελτιώνει τη διαδικασία των διπλών αναγνώρισης και απομάκρυνσης. Οι διαφορές που προκύπτουν από τα χαρακτηριστικά αυτών των δύο μεθόδων μπορεί να οδηγήσει σε ανισότητες όσον αφορά την κάλυψη των γονιδίων κατά μήκος του φάσματος της έκφρασης.

Μικρές διαφορές στην κατανομή των διαβάζει στο υψηλότερο τεταρτημόριο των εκφρασμένων γονιδίων έχουν ένα μεγάλο αποτέλεσμα σχετικά με την κάλυψη των υπολοίπων εκφρασμένων γονιδίων. Για παράδειγμα, το χαμηλότερο τεταρτημόριο όλων των γονιδίων παρατηρείται τόσο σε τεχνολογίες στο δείγμα VCAP-24 h συνθέτει το 0,4% του συνολικού ποσού των κανονικοποιημένων αναγνώσεις φαίνεται στο υψηλότερο τεταρτημόριο που εκφράζεται από την AS. Μια μείωση 1% του αριθμού των αναγνώσεις που χρησιμοποιείται για τον προσδιορισμό της αλληλουχίας των υψηλότερων εκφράζουν γονίδια στο εμπρός τεταρτημόριο μπορεί να χρησιμοποιηθεί για να τριπλασιάσει την κάλυψη από τα χαμηλότερα που εκφράζουν γονίδια όταν διαβάζει εφαρμόζονται εντός του συνόλου. Το αποτέλεσμα της μετατόπισης της κατανομής ανάγνωσης για να μειώσει την έκφραση των γονιδίων φαίνεται μεταξύ του vcap-0 h και vcap ως δείγματα. Αμφότερα τα δείγματα έδωσαν ένα σχετικά παρόμοιο αριθμό διαβάζει, με 3.636.454 και 3.352.960 διαβάζει vcap-0 h και vcap, αντίστοιχα. Ωστόσο, η vCap-0 h δείγμα έχει περισσότερες από δύο φορές το κλάσμα του συνολικού διαβάζει πέσουν στα χαμηλότερα 2 τεταρτημόρια με 2,2% και 0,9%, το αντίστοιχο VCAP-0 h και τα δείγματα VCAP. Αυτό δεν αποτελεί έκπληξη το γεγονός ότι στο δείγμα vcap-0 h, είμαστε σε θέση να παρατηρήσουμε 16.813 γονίδια πάνω από το όριο θορύβου 0,3 RPKM ενώ στην vcap, παρατηρούμε μόνο 13.866 γονίδια πάνω από αυτό το όριο. Ομοίως, η μειωμένη υψηλής αφθονίας προκατάληψη κάλυψη σε μεταβλητές συγκεντρώσεις επιτρέπει την προσέγγιση SMS 2 έως 6 φορές περισσότερη κάλυψη στο κάτω μισό του συνόλου των εκφρασμένων γονιδίων. Το μεταβλητού μήκους ανάγνωση του SMS έχει συμβάλλει στο θόρυβο ποσοτικοποίησης, σε σύγκριση με το AS, λόγω του αριθμού των βραχυπρόθεσμων διαβάζει οποία χάρτη διφορούμενα. Αυτά MIS-αντιστοιχίσεις μπορούν να συμβάλλουν στον μεγαλύτερο αριθμό των γονιδίων που παρατηρείται στα πολύ χαμηλότερα επίπεδα έκφρασης. Εξέταση της διαβάζει χαρτογράφησης για τα γονίδια που βρίσκονται μόνο σε SMS δείχνει η παρουσία περισσότερων από 30% των μακρών SMS διαβάζει (& gt? 36 bp σε μήκος) σε ένα μέσο όρο 17% των γονιδίων (που προσεγγίζει την κατανομή μήκους ανάγνωσης σε όλους δείγματα) , αφήνοντας ένα 1,7 φορές πλεονέκτημα υπέρ της ευαισθησίας SMS, εάν τα γονίδια ανιχνευθούν μόνο με σύντομο 24- έως 35-μερές διαβάζει είναι όλα θεωρούνται ανιχνεύσεις λόγω του θορύβου. Ενώ ένα σημαντικό ποσοστό αυτού του θορύβου είναι άμεσα με ασάφειες στην ακριβή χαρτογράφηση σύντομο διαβάζει, η παρουσία της μακρύ (& gt? 36 bp) ευθυγραμμισμένα διαβάζει δεν αποτελεί εγγύηση για την παρουσία μεταγραφή. Σε ένα μεγάλο αριθμό από τις περιπτώσεις όπου ανιχνεύονται τα γονίδια έχουν από καιρό διαβάζει ευθυγραμμίζονται με αυτούς, ψευδώς θετικά ήταν αποδίδεται σε αυτές τις μεγάλες διαβάζει χαρτογράφηση σε επαναλαμβανόμενα στοιχεία ή τις περιοχές με χαμηλή πολυπλοκότητα εντός των μεταγραφών.

Τα αποτελέσματα της επικύρωσης της PCR δείχνουν ότι η χρήση

You must be logged into post a comment.