PLoS One: Μοριακό υπότυποι σε καρκίνο κεφαλής και τραχήλου Έκθεμα Διακριτή Σχηματομορφές χρωμοσωμικών Κέρδος και απώλεια γονίδια του καρκίνου Canonical


Αφηρημένο

πλακώδες καρκίνωμα κεφαλής και τραχήλου (HNSCC) είναι μια συχνά θανατηφόρα ετερογενής νόσος. Πέρα από το ρόλο του ιού του ανθρώπινου θηλώματος (HPV), έχει καθιερωθεί καμία επικυρωμένη μοριακός χαρακτηρισμός της νόσου. Χρησιμοποιώντας μια ολοκληρωμένη γονιδιωματική ανάλυση και τη μεθοδολογία επικύρωσης επιβεβαιώνουμε τέσσερα μοριακά κατηγορίες HNSCC (βασική, μεσεγχυματικά, άτυπα, και κλασσική) συνεπές με τις υπογραφές που καθορίστηκε για πλακώδες καρκίνωμα του πνεύμονα, συμπεριλαμβανομένων απορρύθμιση της οδού οξειδωτικού στρες KEAP1 /NFE2L2, διαφορική χρησιμοποίηση του η δείκτες γενεαλογίας SOX2 και TP63, και προτίμηση για την ογκογονίδια PIK3CA και EGFR. Για πιθανή κλινική χρήση οι υπογραφές είναι δωρεάν για κατάταξη από τον ιό HPV κατάστασης της λοίμωξης, καθώς και το υποτιθέμενο CCND1 δείκτη αύξηση του αριθμού αντιγράφων υψηλού κινδύνου. Μια μοριακή αιτιολογία για τους υποτύπους προτείνεται από στατιστικά σημαντική χρωμοσωμική κέρδη και ζημίες και το διαφορικό κελί των προτύπων έκφρασης προέλευσης. συστήματα μοντέλο εκπρόσωπο καθεμιάς από τις τέσσερις υποτύπους παρουσιάζονται επίσης

Παράθεση:. Walter V, Yin Χ, Wilkerson MD, CABANSKI CR, Zhao Ν, Du Y, et al. (2013) Μοριακή υπότυποι σε καρκίνο κεφαλής και τραχήλου Έκθεμα Διακριτή Σχηματομορφές χρωμοσωμικών Κέρδος και απώλεια γονίδια του καρκίνου του Canonical. PLoS ONE 8 (2): e56823. doi: 10.1371 /journal.pone.0056823

Επιμέλεια: Muy-Teck Teh, Barts & amp? Το London School of Ιατρικής και Οδοντιατρικής, Πανεπιστήμιο Queen Mary του Λονδίνου, Ηνωμένο Βασίλειο

Ελήφθη: 1 Οκτώβρη του 2012? Αποδεκτές: 15 Γενάρη, 2013? Δημοσιεύθηκε: 22 Φεβρουαρίου 2013

Copyright: © 2013 Walter et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Χρηματοδότηση:. Κλινική /Μεταγραφική Βραβείο από το UNC Lineberger Περιεκτική Κέντρο Καρκίνου? https://unclineberger.org/research/research/research/developmental-research-awards Κ12-RR-023248? https://www.nih.gov. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Αντικρουόμενα συμφέροντα:.. Οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

πλακώδες καρκίνωμα κεφαλής και τραχήλου (HNSCC) είναι μια ετερογενής νόσος που αντιπροσωπεύει το έβδομο πιο κοινή μορφή καρκίνου στις Ηνωμένες Πολιτείες. Πέρα από το ρόλο του ιού του ανθρώπινου θηλώματος (HPV), καμία επικυρωμένη μοριακός χαρακτηρισμός της νόσου έχει αποδειχθεί [1] – [4]. Για τον περαιτέρω χαρακτηρισμό της πολυμορφίας των HNSCC καθώς και άλλους όγκους, η ομάδα μας και άλλοι πρότειναν την έκφραση του γονιδίου (GE) υποτύπων ως μέσο για την προτεραιότητα των κυρίαρχων γονιδιωματική μοτίβα μέσα σε μια συγκεκριμένη ομάδα των όγκων [5] – [11]. Οι επικυρωμένες υπότυποι βασίζονται κυρίως σε GE προφίλ του καρκίνου του μαστού, γλοιοβλάστωμα, καρκίνο πνεύμονα, και άλλοι έχουν κερδίσει ευρεία ενδιαφέροντος [5] – [7], [9] – [11]. Προκαταρκτικές εργασίες έχει προτείνει ότι κλινικά σχετικές υπότυποι βρίσκονται επίσης σε καρκίνο κεφαλής και τραχήλου [8], αλλά τα ευρήματα δεν έχουν αναπαραχθεί, δεν υπάρχουν μοντέλο συστήματα έχουν προταθεί, και η αιτιολογία των υποτύπων είναι ασαφής. Σε άλλους τύπους όγκων η επικύρωση των μοριακών υπογραφών έχει καθιερωθεί από την ακόλουθη προσέγγιση: (i) οι υπότυποι έδειξαν να είναι στατιστικά έγκυρη, (ii) γονιδιωματική αλλαγές στις οποίες βασίζονται οι υπότυποι ήταν τεκμηριωμένες, και (iii) τα συστήματα αντιπροσωπευτικό μοντέλο της έκφρασης ταυτοποιήθηκαν υποτύπους. Η παρούσα μελέτη σχεδιάστηκε για να αντιμετωπίσει κάθε ένα από τα σημεία που αναφέρονται παραπάνω. Επειδή ο στόχος της παρούσας μελέτης ήταν να ανιχνεύσει τα πρότυπα γονιδιακής έκφρασης και της υποκείμενης γονιδιωματικής γεγονότα που υπάρχουν σε HNSCC, ο σχεδιασμός της μελέτης δεν ενσωματώνουν τις μοριακές υποτύπους που καθορίζονται εκ των προτέρων – π.χ. υπότυποι έχουν ταξινομηθεί από την κατάσταση του HPV.

Αποτελέσματα

Ανεξέλεγκτη Ανακάλυψη της έκφρασης HNSCC υπότυποι

Για να αντιμετωπιστεί το ζήτημα του κατά πόσον στατιστικά σημαντική υποτύπους έκφραση του γονιδίου μπορεί να ανιχνευθεί σε HNSCC, εκτελέσαμε ιεραρχικής ομαδοποίησης σε μια ανεξέλεγκτη και αμερόληπτο τρόπο, χρησιμοποιώντας καθιερωμένη και αντικειμενικές τεχνικές [7]. Όπως και στην προηγούμενη εργασία από τους Chung et al. [8], μπορούμε τεκμηριωμένη την παρουσία τεσσάρων υποτύπων γονιδιακής έκφρασης. θερμικούς χάρτες της γονιδιακής έκφρασης (Εικόνα 1Α) και οικόπεδα που παράγεται από ConsensusClusterPlus [12] (Σχήμα S1 Α – Γ) δεν υποστηρίζουν την παρουσία επιπλέον στατιστικά σημαντική clusters σε αυτό το σύνολο δεδομένων. Ένα αντιπροσωπευτικό σύνολο των γονιδίων που είναι γνωστό ή υπάρχουν υποψίες ότι είναι σημαντικές για καρκίνο κεφαλής και τραχήλου φαίνεται στο Σχήμα 1Β, και τα στατιστικά τεστ για τη σύνδεση όλων των γονιδίων στο σύνολο δεδομένων με υπότυπο του όγκου παρέχονται στον Πίνακα S1. SigClust [13] ανάλυση έδειξε ότι οι ρ-τιμές για όλες τις συγκρίσεις κατά ζεύγη των υποτύπων έκφρασης ήταν σημαντικές σε επίπεδο the.05 μετά την εφαρμογή ενός διόρθωση Bonferroni για πολλαπλές συγκρίσεις (Σχήμα S1D). Αναφερόμαστε στους υποτύπους έκφρασης ως βασική (BA), μεσεγχυματικά (MS), άτυπα (ΑΤ) και την κλασική (CL) με βάση βιολογικά χαρακτηριστικά των γονιδίων υψηλής έκφρασης σε κάθε υπότυπο.

Heatmaps των τιμών έκφρασης των 840 γονιδίων ταξινομητή (Α) και την επιλογή γονιδίων που σχετίζονται με HNSCC (Β) για κάθε ένα από τους υποτύπους έκφρασης. θερμικούς χάρτες Επικύρωση των αποστάσεων κεντροειδούς που βασίζονται μεταξύ των κεντροειδή των υποτύπων έκφρασης στην παρούσα μελέτη και εκείνων που προέρχονται από τους Chung et al. (C) και τα LUSC υποτύπους Wilkerson et al. (D).

Η

Κλινικά Χαρακτηριστικά

Τα κλινικά χαρακτηριστικά των ασθενών που συμπεριλήφθηκαν στην παρούσα μελέτη αντιπροσωπεύουν μια ευρεία διατομή των ασθενών με HNSCC που είναι ιδιαίτερα αντιπροσωπευτικό του πληθυσμού φαίνεται στο μια τυπική κλινική πρακτική (Πίνακας 1). Δεν υπήρχε συσχέτιση του υποτύπου του όγκου με την ηλικία, το φύλο, τη φυλή, τη χρήση οινοπνεύματος, χρόνια πακέτο, ή το μέγεθος του όγκου. υποτύπους όγκου στατιστικά που σχετίζονται με το site, αν και όλες οι ιστοσελίδες είχαν όγκους σε κάθε ένα από τους υπότυπους έκφρασης, με μία εξαίρεση (υποφάρυγγα δεν έδειξε BA). Επιπλέον, καμία περιοχή συνέβαλε περισσότερο από το 58% των δειγμάτων του σε έναν υπότυπο έκφραση. Δεν υποτύπου έκφραση αποτελείτο από περισσότερο από το 68% των όγκων από ένα μόνο χώρο. Ως εκ τούτου, σε αντίθεση με άλλους μοριακούς δείκτες, όπως HPV ή p16, καταλήγουμε στο συμπέρασμα ότι υποτύπους έκφραση κατέλαβε μια διάσταση της βιολογίας η οποία δεν περιορίζεται σε ένα μόνο σημείο του σώματος [14]. Υπήρχαν επιπλέον στατιστικά σημαντικές συσχετίσεις μεταξύ υποτύπου του όγκου και την κατάσταση του HPV, η θεραπεία, η κατάσταση του κόμβου, και η συνολική σκηνή. Είναι αξιοσημείωτο ότι πάνω BA κινήθηκαν προς την κατεύθυνση να είναι καλά διαφοροποιημένο, ενώ 13 από 16 χαμηλής διαφοροποίησης όγκους ήταν είτε MS ή CL, αν και η διαφορά αυτή δεν ήταν στατιστικά σημαντική.

Η

Επικύρωση των υποτύπων

στη συνέχεια έστρεψε την προσοχή μας στο ερώτημα του κατά πόσον οι υπότυποι έκφραση ανιχνεύθηκε στο τρέχον σύνολο δεδομένων αντιστοιχούσαν σε αυτές που έχουν αναφερθεί στο παρελθόν από τον Chung et al. [8]. Wilkerson et al. [7] παρουσίασε μια μέθοδο για τη σύγκριση των προτύπων έκφρασης γονιδίων που βρέθηκαν σε υποτύπους έκφραση σε πολλαπλές μελέτες. Χρησιμοποιούμε την ίδια διαδικασία, η οποία περιγράφεται πληρέστερα στην ενότητα Μέθοδοι. Εν συντομία, centroids των υποτύπων έκφρασης μετρούν μέσες τιμές της γονιδιακής έκφρασης, και υποτύπους με συγκλίνουσες πρότυπα έκφρασης παράγουν κέντρα βάρους που είναι πιο υψηλή συσχέτιση των υποτύπων με ασύμφωνα μοτίβα έκφρασης. Μια σαφής αντιστοιχία παρατηρήθηκε (Σχήμα 1C), με BA, MS, AT, και CL επιδεικνύοντας τα ίδια μοτίβα έκφρασης, όπως ο Chung υποτύπων 1, 2, 3, και 4, αντίστοιχα. Έχοντας ανακαλύψει τέσσερις υποτύπους χρησιμοποιώντας την ανεξάρτητη και αμερόληπτη σύνολα δεδομένων και μεθόδων, θεωρούμε αυτά τα τέσσερα υποτύπους της έκφρασης πρέπει να επικυρωθεί.

Ξεχωριστά βιολογικές διεργασίες και ομοιότητες με πνεύμονα πλακωδών κυττάρων Καρκίνωμα

Τα πρότυπα έκφρασης που βρέθηκαν στο υποτύπων υποδηλώνουν την παρουσία θεμελιώδεις διαφορές στην υποκείμενη βιολογία των σχετικών όγκων (Πίνακας S2). Η γονιδιακή έκφραση σε BA έδειξε μία ισχυρή ομοιότητα με την υπογραφή βρέθηκαν σε βασικά κύτταρα από το επιθήλιο του ανθρώπου αεραγωγών, συμπεριλαμβανομένων των υψηλών έκφραση γονιδίων όπως

COL17A1,

η οποία συνδέεται με την εξωκυτταρική μήτρα, ο παράγων ανάπτυξης και του υποδοχέα

TGFa

και

EGFR

, και ο μεταγραφικός παράγοντας

TP63

[14]. Οι όγκοι σε MS είχαν παραδειγματικά με αυξημένη έκφραση γονιδίων που σχετίζονται με την επιθηλιακή-προς-μεσεγχυματικά μετάβαση (ΕΜΤ), συμπεριλαμβανομένης της μεσεγχυματικά δείκτες

VIM

και

DES

, ο παράγοντας μεταγραφής

TWIST1

, και ο αυξητικός παράγοντας

HGF

[15], [16]. AT όγκοι είχαν μια ισχυρή HPV + υπογραφής, όπως αποδεικνύεται από την αυξημένη έκφραση του

CDKN2A, LIG1

, και ο μεταγραφικός παράγοντας

RPA2

[17]. Οι όγκοι στο CL, ο υπότυπος με το βαρύτερο ιστορικό καπνίσματος, έδειξε υψηλή έκφραση των γονιδίων που σχετίζονται με την έκθεση στον καπνό του τσιγάρου, περιλαμβανομένης της ξενοβιοτικών μεταβολισμό γονίδια

AKR1C1 /3

και

GPX2

[7], [18], [19] και ο μεταγραφικός παράγοντας

NFE2L2

[10]

πλακωδών κυττάρων καρκινώματα από διαφορετικές τοποθεσίες στο μετοχικό σώμα μια σειρά μοριακών χαρακτηριστικών -. π.χ. απώλεια του χρωμοσώματος 3ρ και το κέρδος του χρωμοσώματος 3q [20], [21] – έτσι υποθέσαμε ότι η αλληλογραφία μεταξύ των υποτύπων έκφραση μας και πρόσφατα αναφερθεί πνεύμονα πλακώδες καρκίνωμα (LUSC) υποτύπων έκφραση [7], θα πρέπει να τηρούνται. Για να διερευνήσουν ένα ευρύτερο φαινότυπο των πλακωδών κυττάρων καρκινώματα της ανώτερης αναπνευστικής οδού, επεκτείναμε το κέντρο βάρους μεθοδολογία προγνωστικός και αξιολόγησε την αλληλογραφία κέντρα βάρους από LUSC και HNSCC (Σχήμα 1D). Είναι αξιοσημείωτο ότι, παρατηρήθηκε σαφές πρότυπο συσχετισμού στην οποία η BA, MS, και CL υποτύπους HNSCC αντιστοιχούσε στην LUSC βασική, εκκριτικό και κλασική υποτύπους, αντίστοιχα, του Wilkerson et al. [7]. Εξέταση των στοιχείων TCGA LUSC [10] παρέχονται πρόσθετες αδιάσειστα στοιχεία των σχετικών συνδέσεων μεταξύ των υποτύπων έκφραση στις δύο περιοχές του όγκου (Εικόνα S2). Η αντιστοιχία μεταξύ των βασικών υποτύπων είναι αξιοσημείωτη επειδή Wilkerson et al. [7] περιγράφονται πειράματα χρονικής πορείας που περιλαμβάνουν καλλιεργημένα ανθρώπινα βρογχικά επιθηλιακά κύτταρα στα οποία τα πρότυπα έκφρασης του γονιδίου σε πρώιμα χρονικά σημεία έδειξαν μία ισχυρή ομοιότητα με εκείνες που παρατηρούνται στην βασική υπότυπο του LUSC. Ομοίως, όπως φαίνεται στον πίνακα S3, παρατηρήσαμε ότι η βασική υπότυπος του HNSCC είναι πιο παρόμοια με την ημέρα 3 χρονικό σημείο στα δεδομένα χρονικής πορείας από το υγρό αέρα διεπαφή (ALI) μοντέλο [22].

DNA Αντιγραφή Ανάλυση από Δευτερεύων

Στη συνέχεια έστρεψε την προσοχή μας στις γονιδιωματικής μεταβολές των HNSCC όπως μετριέται από τον αριθμό αντιγράφων (ΣΟ) συστοιχίες. Πρώτα επιβεβαίωσε πολλές περιοχές έχουν αναφερθεί στο παρελθόν, όπως μεταβάλλεται σε HNSCC, συμπεριλαμβανομένων της αύξησης των χρωμοσωμάτων 3q, 7ρ, και 11q (είναι στατιστικά σημαντικά κέρδη δει τόσο 11q13 και 11q22) και απώλεια χρωμοσωμάτων 3p, 9p και 14q (Πίνακας S4). Όπως έχει παρατηρηθεί σε άλλους όγκους [11], υπάρχουν και οι δύο συμφωνούν και ασύμφωνα μοτίβα αριθμού αντιγράφων μεταβολή σε βασικές περιοχές του γονιδιώματος ως συνάρτηση του υποτύπου του όγκου (Σχήμα 2, Πίνακας S5). Για παράδειγμα, τα κέρδη των 3q διαφέρουν ανάλογα με τον υπότυπο έκφραση (p = 0.01), ενώ δεν υπάρχουν σημαντικές διαφορές ΣΟ μεταξύ των υποτύπων ανιχνεύθηκαν σε 11q13, η οποία περιέχει

CCND1

(p = 1). Η κανονική κέρδος HNSCC 7ρ συνέβη σε μια περιοχή που περιέχει

EGFR

, αλλά αυτές οι αλλοιώσεις βρέθηκαν στα ΒΑ, MS, και CL, δεν ΑΤ (p = 0.01). τιμές ΣΟ 3ρ δεν ήταν σημαντικά διαφορετική μεταξύ των υποτύπων (p = 0.47). Απώλειες της 9p περιοχής που περιέχει

CDKN2A

βρέθηκαν στην ΒΑ και μόνο CL, και οι διαφορές ΣΟ ήταν σημαντική (p = 0.01). Εστιακή απώλεια ΣΟ βρέθηκε στο 14q32 για τη ΣΚΠ, CL, και είναι ιδιαίτερα έντονη σε ΑΤ, αλλά αν και αυτό δεν το έκανε όχι στατιστικά σημαντική. Αυτή η περιοχή περιέχει miR203, το οποίο είναι αξιοσημείωτο επειδή στοχεύει ΔNp63 [23], ένα από τα έξι προϊόντα πρωτεΐνης του

TP63

. Χρωμοσωμική αστάθεια ποικίλλει επίσης σημαντικά από τον υπότυπο (p = 2.2e-4), όπως φαίνεται στο Σχήμα S3.

Οικόπεδα από τις μέσες τιμές του αριθμού αντιγράφων των υποτύπων έκφραση HNSCC μετά την εξομάλυνση και την αφαίρεση ακραίων τιμών, τόσο γονιδίωμα-ευρεία (Α) και για συγκεκριμένα χρωμοσώματα ή περιοχές ενδιαφέροντος (Β).

η

Αντιγραφή Αριθμός Αλλαγές και διαφορική έκφραση γονιδίων σε χρωμόσωμα 3q από Έκφραση Δευτερεύων

Ένα από τα πεμπτουσία γονιδιωματικής αλλαγές που συνδέονται με ακανθοκυτταρικό καρκίνωμα είναι το κέρδος του 3q [20], [21], και στην προηγούμενη ενότητα θα σημειωθεί ότι οι τιμές ΣΟ στην περιοχή αυτή ποικίλει ανάλογα με τον υπότυπο έκφραση. Είναι ενδιαφέρον, υπήρξε μια διακριτή απόκλιση αναλογική χρήση των τριών γονιδίων τυπικά συζητηθεί όπως και οι στόχοι της αμπλικονίου:

TP63, PIK3CA,

και

SOX2

(Σχήμα 3). Η CL και AT υποτύπους αποδειχθεί αναλογικά υψηλότερη έκφραση του

SOX2

σε σχέση με τα κράτη μέλη και η BA, η οποία στην πραγματικότητα φαίνεται να εκφράσουν λιγότερο

SOX2

από το κανονικό τους ελέγχους των αμυγδαλών. Αντίθετα, ο υπότυπος BA εκφράζεται δραματικά υψηλότερα επίπεδα

TP63

από οποιαδήποτε άλλη ομάδα. Ομοίως, αν και τα MS υποτύπου παρουσίασαν αντίγραφο κέρδη αριθμό 3q, κανένα από τα υποθετικών γονιδίων-στόχων φάνηκε να εκφράζεται σε επίπεδα υψηλότερα από τα φυσιολογικά αμυγδαλών. τεστ Kruskal-Wallis έδειξε ότι η έκφραση του κάθε

TP63, PIK3CA,

και

SOX2

συνδέθηκε με τον υπότυπο έκφραση μετά από προσαρμογή Bonferroni για πολλαπλές δοκιμές (Πίνακας S6). Η παρατήρηση αυτή εγείρει την πιθανότητα ότι η ετερογένεια των HNSCC θα μπορούσε εν μέρει να εξηγηθεί από διαφορική χρήση των μεταγραφικών παραγόντων (

SOX2

και

TP63

) και ογκογονίδιο (

PIK3CA

) στο αμπλικόνιο 3q, η οποία είναι πιο πολύπλοκη από ό, τι έχει αναφερθεί προηγουμένως [24]. Προτείνει επίσης διαφορική χρήση των παραγόντων μεταγραφής και ογκογονίδια, που προωθείται εν μέρει από διακριτά αριθμού αντιγράφων μετατροπές, μπορεί να συμβάλλει στις υπογραφές γονιδιακής έκφρασης που ορίζουν τους υποτύπους έκφρασης.

Μέσες τιμές έκφρασης αριθμού αντιγράφων και του γονιδίου του γονιδίου-ειδική στους υποτύπους έκφραση HNSCC και φυσιολογικά δείγματα αμυγδαλών (NL) για τα γονίδια στο αμπλικόνιο 3ο τρίμηνο.

η

Αντιγραφή αριθμού γεγονότα που αφορούν τον καρκίνο Canonical γονίδια

Νωρίτερα σημειωθεί ότι οι τιμές του αριθμού αντιγράφων σε κέρδος και την απώλεια περιοχές συνδέθηκαν με τον υπότυπο έκφραση. Τώρα περιγράφουμε παρόμοια ευρήματα που προέκυψαν όταν το γονίδιο-ειδικές τιμές αριθμού αντιγράφων για τα γονίδια είναι γνωστό ότι παίζουν ρόλο στην HNSCC –

CCND1, CDKN2A,

και

EGFR

– θεωρήθηκαν, όχι το ευρύτερο περιοχές που συζητήθηκαν παραπάνω. Στην παραπάνω συζήτηση που δήλωσε ότι τα κέρδη της 11q13 δεν διέφεραν σημαντικά μεταξύ των υποτύπων, και ο πίνακας 2 δείχνει ότι παρόμοια αποτελέσματα όταν η προσοχή περιορίζεται σε κέρδη

CCND1

. Σε αντίθεση, η συχνότητα των

EGFR

κέρδη κυμαίνονταν από 0% σε ΑΤ σε 31% το CL (p = 0,069), ενώ η συχνότητα των

CDKN2A

απώλειες κυμάνθηκαν μεταξύ 10% στη σκλήρυνση κατά πλάκας σε 63% το CL (p = 0,004). Και τα δύο αυτά ευρήματα είναι σύμφωνη με τα πορίσματα των ευρύτερων περιοχών των 7ρ και 9p, αντίστοιχα, που περιγράφονται παραπάνω.

Η

Προηγούμενες μελέτες έχουν εντοπίσει συσχετίσεις μεταξύ διακριτή γονιδιωματική γεγονότα, και τα ευρήματα αυτά παρέχονται διορατικότητα είτε το υποκείμενη βιολογία ή η κλινική διαχείριση των ασθενών με καρκίνο [25], [26]. Σε HNSCC, ταυτόχρονη

CCND1

κέρδη και

έχουν CDKN2A

απώλειες έχουν μελετηθεί από Okami et al. [27] και Namazie et al. [28], με Namazie et al. την ανίχνευση μιας σύνδεσης μεταξύ αυτών των γονιδιωματικών γεγονότων. Βρήκαμε ότι

CCND1

κέρδη ΣΟ συνδέθηκαν με

CDNK2A

απώλειες σε όλους τους υποτύπους (Πίνακας S7), και ότι η κοινή εκδήλωση που συνδέονται με τους υποτύπους έκφραση (Πίνακας 2), επιβεβαιώνοντας έτσι και για την επέκταση των αποτελεσμάτων της Namazie et al.

Κλινικά αποτελέσματα από έκφραση Δευτερεύων και Focal Μεταβολές Γονιδιωματική

Αφού αναλυθεί το σύνολο σχεδόν 140 όγκων HNSCC σε υποτύπους έκφρασης, και υπό το φως των γνωστών παραγόντων κινδύνου όπως ως HPV, το κάπνισμα και η χρήση αλκοόλ, θα εξεταστεί κατά πόσον θα μπορούσε να προτείνει επιπλέον διαστρωμάτωση για την έκβαση των ασθενών. Πρέπει πρώτα διερευνηθεί κατά πόσον το πλεονέκτημα επιβίωσης που αναφέρονται από Chung et al. για «υπότυπο 1» θα μπορούσε να αναπαραχθεί στην τρέχουσα ομάδα. Ήμασταν σε θέση να επιβεβαιώσει αυτό το αποτέλεσμα, και στην παρούσα μελέτη δεν υπήρχε συσχέτιση μεταξύ της επιβίωσης χωρίς υποτροπή και υποτύπου του όγκου, είτε συνολικά (Εικόνα 4Α) ή όταν έχουμε περιορίσει σε ασθενείς προχωρημένο στάδιο (δεν φαίνεται). Αυτές οι διαφορές μπορούν να εξηγηθούν από την κλινική ετερογένεια της νόσου σε συνδυασμό με το γεγονός ότι οι διανομές θέση του όγκου στις δύο μελέτες διαφέρουν σημαντικά.

Kaplan-Meier οικόπεδα και p-τιμές δοκιμασία log-rank συγκρίνοντας χωρίς υποτροπή χρόνοι επιβίωσης σε όλους τους υποτύπους έκφραση (Α), HPV + εναντίον HPV- υποκείμενα (Β), όλες οι υπότυποι έκφραση σε HPV- άτομα (C), και AT έναντι μη-AT σε HPV- άτομα (D). Η στατιστική σημαντικότητα αξιολογήθηκε με τη χρήση της δοκιμής Rank Σύνδεση.

Η

Για να διευκρινιστεί κατά πόσον είναι γνωστό ή υπάρχουν υπόνοιες ότι η σύγχυση θα μπορούσε να επηρεάσει την ικανότητά μας να ανιχνεύσουμε υπότυπο-ειδικές διαφορές στην έκβαση των ασθενών, αξιολογήσαμε την επίδραση της κατάστασης HPV στη συνολική επιβίωση. Παρατηρήσαμε μια σχετικά μεγάλη αλλά ασαφή επίδραση λόγω της συνολικής μικρό αριθμό HPV + ασθενείς (Σχήμα 4Β). Ως εκ τούτου, θεώρησε λογικό να επαναξιολογήσει την ομάδα με HPV + ασθενείς αποκλείονται. Αποκλεισμός των HPV + ασθενών απεκάλυψε ότι η υποομάδα AT έδειξε μια ιδιαίτερα δυσμενή έκβαση (Σχήμα 4C), και αυτή η διαφορά ήταν στατιστικά σημαντική σε σύγκριση με όλες τις άλλες υποτύπους συνδυάζονται (Εικόνα 4D). Στη συνέχεια προσεγγιστεί ένα ανεξάρτητο σύνολο 122 μικροσυστοιχιών ιστού (ΤΜΑ) δείγματα, σε μια προσπάθεια να επικυρώσει αυτή τη διαπίστωση. Επειδή σειρά που βασίζεται GE και ανοσοϊστοχημεία (IHC) τιμές χρώση δεν είναι συγκρίσιμα, δεν ήταν εφικτό να προβλεφθεί ο υπότυπος του όγκου του κάθε δείγματος TMA. Αντ ‘αυτού χρησιμοποιείται χαμηλή EGFR και υψηλή χρώση p16 ως υποκατάστατο για την κατάσταση της ΑΤ. Η διαφορά στους χρόνους επιβίωσης δεν ήταν στατιστικά σημαντική, αλλά πήραμε αποτελέσματα παρόμοια με αυτά που περιγράφονται παραπάνω (Σχήμα S4).

Διερευνήσαμε επίσης κατά πόσον τα εστιακά εκδηλώσεις αριθμού αντιγράφων σχετίστηκαν με κλινική έκβαση. Προηγούμενες μελέτες έχουν ανιχνευθεί μια συσχέτιση μεταξύ κερδών CCND1 και μειωμένη ελεύθερη υποτροπής χρόνους επιβίωσης σε HNSCC [29]. Έχουμε λάβει παρόμοια ευρήματα, όταν εξετάσαμε τις τιμές ΣΟ για όλα τα δείγματα όγκων (Σχήμα S5), αν και τα αποτελέσματα μας είναι οριακά σημαντική (p = 0.07). Αξίζει να σημειωθεί ότι λίγες AT θέματα εμφάνισαν

CCND1

κέρδη (Πίνακας 2), και αυτό δείχνει την παρουσία δύο σε μεγάλο βαθμό διακριτές ομάδες ασθενών με κακή κλινικές εκβάσεις: εκείνοι με

CCND1

κέρδη και εκείνα που είναι HPV – και η AT. Εικόνα S6 υποστηρίζει αυτό το συμπέρασμα.

υπότυποι Έκφραση σε μοντέλο Συστήματα

Η Γραμμή Cancer Cell Εγκυκλοπαίδεια [30] περιέχει γονιδιακά δεδομένα από πάνω από 900 ανθρώπινες καρκινικές κυτταρικές σειρές, συμπεριλαμβανομένων τόσο της GE και της ΣΟ δεδομένα από 19 οισοφάγου και 18 άνω κυτταρικές σειρές αναπνευστικής οδού. Εφαρμόσαμε κέντρο βάρους προγνωστικό μας με τα στοιχεία της GE από αυτές τις κυτταρικές σειρές και διαπίστωσε ότι και οι τέσσερις υπότυποι έκφραση ήταν παρόντες (Πίνακας S8). Τα ευρήματα αυτά είναι ιδιαίτερα επιτακτική υπό το φως της κλινικής σημασίας των υποτύπων έκφρασης, επειδή παρέχουν τη βάση για μελλοντικές μελέτες που αφορούν τα συστήματα μοντέλου. Εικόνα S7 παρέχει παραδείγματα για να τονίσει ότι υποτύπου-συγκεκριμένα γεγονότα ΣΟ παρατηρούνται επίσης στις κυτταρικές σειρές

Συζήτηση

πρωταρχικό μας αποτέλεσμα ήταν η ανίχνευση των τεσσάρων υποτύπων γονιδιακής έκφρασης σε HNSCC -. Βασικοκυτταρικό, μεσεγχυματικά , άτυπα, και κλασική. Έχουμε, επίσης, έδειξε ότι αυτοί οι υπότυποι έχουν βιολογική και κλινική σημασία, και, ως εκ τούτου, παρέχουν μια χρήσιμη και ενημερωτική μηχανισμός ταξινόμησης όγκων HNSCC που συμπληρώνει τις υπάρχουσες μεθόδους που βασίζονται στην ιστολογία και θέση του όγκου. Η ανάλυση των διαθέσιμων στο κοινό σύνολα δεδομένων έκφρασης αποκάλυψε ότι αυτοί οι υπότυποι μπορούν να αναπαράγονται σε HNSCC [8] και είναι εντυπωσιακά παρόμοια με εκείνα που βρέθηκαν σε LUSC [7], [10]. Παρά το γεγονός ότι τα πρότυπα γονιδιακής έκφρασης για την εκκριτική υπότυπο LUSC είναι παρόμοιες με εκείνες που παρατηρήθηκαν στο μεσεγχυματικά υπότυπο του HNSCC, είμαστε υπέρ μια εναλλακτική ονοματολογία. Στοιχεία που να επιβεβαιώνουν την αδενικό προέλευση HNSCC είναι λιγότερο επιτακτική σε σύγκριση με εκείνη για τον πνεύμονα, και τα αποδεικτικά στοιχεία μιας μεσεγχυματικών υπογραφή είναι άφθονη [7]. Ενώ θα ήταν δυνατόν να χρησιμοποιηθούν τα υπάρχοντα δεδομένα για να παράγουν ένα γονίδιο προγνωστικός δείκτης για την κατάσταση του HPV, δεν προσπαθούν να το κάνουμε αυτό, επειδή τα αποτελέσματα αυτής της φύσης παρουσιάστηκαν από Martinez et al. [31]. Περιοχές του κέρδους αριθμού αντιγράφων του DNA επαναλαμβανόμενες και απώλεια ανιχνεύθηκαν, μερικά από τα οποία περιέχουν γνωστά ογκογονίδια και κατασταλτικά του όγκου. Οι τιμές αριθμού αντιγράφων σε ορισμένες περιοχές παρεκκλίνουσα συνδέθηκαν με υπότυπο του όγκου, γεγονός που υποδηλώνει ότι αριθμός αντιγράφου γεγονότα μπορεί να συμβάλει στην ανάπτυξη των υποτύπων έκφρασης. Όλα τα υποτύπων έκφρασης ανιχνεύθηκαν σε κυτταρικές σειρές HNSCC, ένα εύρημα που παρέχει τη βάση για μελλοντικές μελέτες.

Θα συζητήσουμε τώρα εν συντομία τους ορισμούς των υποτύπων έκφρασης. Βασική και κλασική επελέγησαν επειδή τα πρότυπα έκφρασης σε αυτούς τους υποτύπους έδειξε σημαντικές ομοιότητες με τα βασικά και κλασικά υποτύπους LUSC. Wilkerson et al. σύγκριση των προτύπων έκφρασης στα LUSC υποτύπους σε δεδομένα πορεία του χρόνου από την ανάπτυξη των ανθρώπινων βρογχικών επιθηλιακών κυττάρων, και βρήκαν ότι η βασική υπότυπος είχαν παρόμοια σχήματα έκφρασης με εκείνες που παρατηρήθηκαν σε πρώιμα χρονικά σημεία, όταν τα βασικά κύτταρα είναι τα πλέον κοινά. Ομοίως, όπως φαίνεται στον Πίνακα S2, παρατηρήσαμε ότι η βασική υπότυπος του HNSCC είναι πιο παρόμοια με την ημέρα 3 χρονικό σημείο στα δεδομένα χρονικής πορείας από το μοντέλο ALI [22]. Η κλασική υπότυπος παρουσιάζει κανονική γονιδιωματική αλλοιώσεις που συνδέονται με το καρκίνωμα των πλακωδών κυττάρων – π.χ. διαγραφή 3p και 9p, ενίσχυση της 3q, και το εστιακό ενίσχυση και

EGFR

και

CCND1

. Μεσεγχυματικά επιλέχθηκε με βάση ανάλυση μονοπάτι ενδεικτική μιας επιθηλιακής προς μεσεγχυματικά. Τέλος, άτυπα επιλέχθηκε λόγω της έλλειψης είτε

EGFR

ενίσχυση ή τη διαγραφή του 9Ρ.

Οι διαφορές στα πρότυπα έκφρασης που βρέθηκαν στα υποτύπους είναι κλινικά σημαντική.

TP63

παράγει έξι διακριτές πρωτεΐνες, και ΔNp63 είναι το πιο άφθονο ισόμορφο σε HNSCC [32]. Yang et al. [33] δείχνουν ότι ΔNp63 προάγει τον πολλαπλασιασμό των κυττάρων. Chatterjee et al. [32] Σημειώνεται ότι η έκθεση σε σισπλατίνη οδήγησε σε μειωμένα επίπεδα ΔNp63, έτσι αυτό θεραπεία μπορεί να είναι ιδιαίτερα αποτελεσματική για τους ασθενείς σε ΒΑ. Barbieri et al. [34] έδειξε ότι η απώλεια του

TP63

σε κυτταρικές σειρές HNSCC οδήγησαν στην απόκτηση ενός φαινοτύπου μεσεγχυματικών, η οποία είναι επιτακτική υπό το φως των χαμηλών επιπέδων έκφρασης του

TP63

δει στο MS. Martin και Cano [35] έδειξε ότι η αυξημένη έκφραση του

TWIST1

ή

BMI1

σε κυτταρικές σειρές HNSCC θα μπορούσε να αυξήσει την πιθανότητα της εισβολής και της μετανάστευσης. Επειδή MS όγκοι παρουσίασαν φαινότυπο EMT και αυξημένη έκφραση και των δύο

TWIST1

και

BMI1

, τα άτομα αυτά μπορεί να είναι πιο πιθανό να αναπτύξουν απομακρυσμένες μεταστάσεις. Το γεγονός ότι

EGFR

υπερεκφράζεται στην πλειονότητα των όγκων HNSCC [36] καθιστά

EGFR

αναστολείς μια ελκυστική θεραπευτική επιλογή για την ασθένεια αυτή. Ωστόσο, αυτές οι θεραπείες είναι λιγότερο πιθανό να είναι αποτελεσματική σε όγκους ΑΤ επειδή

EGFR

έκφραση ήταν χαμηλότερη από ό, τι στους άλλους υπότυπους έκφρασης.

SOX2

και

ΑΙ_ϋΗ1

ήταν άκρως εκφράζονται σε ΑΤ και CL, και οι δύο από αυτά τα γονίδια είναι υποθετικό δείκτες καρκίνου βλαστικών κυττάρων, λόγω της συνεισφοράς τους να αυτο-ανανέωσης και ένα φαινότυπο pleuripotent [37], [38]. Το προϊόν πρωτεΐνης του

PIK3CA

είναι ρ110α, η οποία φωσφορυλιώνει ΑΚΤ. Ενεργοποιημένος ΑΚΤ συμβάλλει στην επιβίωση των καρκινικών κυττάρων, και έτσι ογκογόνο μετασχηματισμό [39]. West et al. [40] έδειξε ότι η έκθεση φυσιολογικού πνεύμονα επιθηλιακών κυττάρων στη νικοτίνη διευκολύνει την ενεργοποίηση του ΑΚΤ καθιστώντας εξαρτώνται από μόνη της ΡΙ3Κ. Η παρατήρηση αυτή, σε συνδυασμό με τα υψηλά επίπεδα του καπνίσματος φαίνεται στο CL, υποδηλώνει ότι οι αναστολείς της κινάσης ΡΙ3 παρέχουν μια ελκυστική θεραπευτική επιλογή για τους όγκους CL.

Υπήρχαν αρκετοί περιορισμοί σε αυτή τη μελέτη. Πρώτον, δεν είχαμε GE, CN, και κλινικά δεδομένα για όλα τα άτομα της μελέτης, η οποία περιορίζεται η ικανότητά μας να αναλύουν από κοινού αυτές τις μεταβλητές. Επιπλέον, αν και οι ετικέτες υποτύπου είχαν καθοριστεί αντικειμενικώς από έναν αλγόριθμο συσταδοποίησης και τα πρότυπα γονιδιακής έκφρασης ήταν ανεξάρτητα επικυρωθεί, τα κλινικά ενώσεις δεν ήταν. συστοιχίες αριθμός αντιγραφής δημιουργήθηκαν για όλα τα δείγματα με επαρκή ποιότητα και την ποσότητα του DNA. Δυστυχώς, πάνω από το 20% των συστοιχιών απέτυχε να ανταποκριθεί τυποποιημένη ποιότητα μετρήσεις. Επίσης, δεν ήταν σαφές οποία ισομορφή (ες) του

TP63

προσδιορίστηκαν από συστοιχίες γονιδιακής έκφρασης μας, και δυστυχώς ο ρόλος που

TP63

παίζει στη βασική υπότυπο δεν μπορεί να εκτιμηθεί πλήρως χωρίς τη γνώση από αυτές τις ισομορφές. Επειδή η HPV + δείγματα αφαιρέθηκαν κατά τη διεξαγωγή δευτερογενή ανάλυση επιβίωσή μας, τα αποτελέσματα αυτά θα πρέπει να θεωρηθεί ως διερευνητική και ως εκ τούτου θα πρέπει να επικυρωθεί ανεξάρτητα. Τέλος, η κατάσταση HPV όλων των ασθενών δεν ήταν διαθέσιμα.

Εν κατακλείδι, επιβεβαίωσε τέσσερα μοριακά κατηγορίες HNSCC (βασικοκυτταρικό, μεσεγχυματικά, άτυπα, και κλασική), σύμφωνο με τις υπογραφές που καθορίστηκαν για πλακώδες καρκίνωμα του πνεύμονα. Χρησιμοποιώντας μια ολοκληρωμένη γονιδιωματική ανάλυση και τη μεθοδολογία επικύρωσης, έχουμε τεκμηριωμένη υπότυποι που προσδιορίζονται από τα κανονικά γονίδια και ογκογονίδια ογκοκατασταλτικά, συμπεριλαμβανομένης της απορρύθμισης του

KEAP1 /NFE2L2

οδού οξειδωτικό στρες, διαφορική χρήση των δεικτών γενεαλογίας

SOX2

και

TP63

, και η προτίμηση για τα ογκογονίδια

PIK3CA

και

EGFR

. Για πιθανή κλινική χρήση, οι υπογραφές είναι δωρεάν για κατάταξη με βάση την κατάσταση λοίμωξη HPV, καθώς και το υποθετικό δείκτη υψηλού κινδύνου

CCND1

αντιγράψετε κέρδος αριθμό. Μια μοριακή αιτιολογία για τους υποτύπους προτείνεται από στατιστικά σημαντική χρωμοσωμική κέρδη και ζημίες και το διαφορικό κελί των προτύπων έκφρασης προέλευσης. συστήματα μοντέλο εκπρόσωπο καθεμιάς από τις τέσσερις υποτύπους παρουσιάστηκαν επίσης.

Υλικά και Μέθοδοι

Συλλογή όγκου και Γενετικής Αναλύσεις

Μετά την παραλαβή γραπτή συγκατάθεση, κατεψυγμένα, χειρουργικά εξάγεται, macrodissected καρκίνου κεφαλής και τραχήλου συλλέχθηκαν στο Πανεπιστήμιο της Βόρειας Καρολίνας στο πλαίσιο Institutional Review Board πρωτόκολλο # 01-1283. Tumor RNA εκχυλίστηκε και η έκφραση του mRNA προσδιορίστηκε χρησιμοποιώντας Agilent 44K μικροσυστοιχίες. Tumor DNA εκχυλίστηκε και ο αριθμός αντιγράφων του DNA προσδιορίστηκε χρησιμοποιώντας Affymetrix GenomeWide SNP 6,0 μάρκες. Μια περίληψη όλων των γενετικών δεδομένων που χρησιμοποιούνται σε αυτή τη μελέτη μπορεί να βρεθεί στον Πίνακα S9.

Η έκφραση mRNA Ανάλυση

διαδικασίες ποιοτικού ελέγχου εφαρμόστηκαν σε μικροσυστοιχιών αρχεία έντασης ιχνηθέτη-επίπεδο. Ένα σύνολο από 138 συστοιχίες όγκου παρέμεινε μετά την αφαίρεση συστοιχίες χαμηλής ποιότητας, διπλές σειρές και σειρές από δείγματα μη HNSCC. Η διόρθωση υποβάθρου normexp και loess διαδικασίες κανονικοποίησης [41] εφαρμόστηκαν στα δεδομένα αισθητήρα επιπέδου. Μετά ημερολόγιο

2 μετασχηματισμό, ανιχνευτές αντιστοιχίζονται με μια κοινή βάση δεδομένων γονίδιο να παράγει τιμές έκφρασης για 15.597 γονίδια.

Δευτερεύων Discovery Ανεξέλεγκτη Έκφραση

Η διαδικασία που περιγράφεται εδώ είναι παρόμοια με αυτή που εμφανίστηκε σε Wilkerson et al. [7]. Μετά τιμές έκφρασης ήταν γονιδίου μέση στο κέντρο, το γονίδιο μεταβλητότητα υπολογίστηκε χρησιμοποιώντας τη μέση απόκλιση άφεση αμαρτιών. Επελέγησαν οι 2.500 πιο μεταβλητά γονίδια. ConsensusClusterPlus [12] χρησιμοποιήθηκε για να εκτελέσει χωρίς επίβλεψη ομαδοποίηση για αυτά τα γονίδια στα 138 συστοιχίες. Αυτή η διαδικασία πραγματοποιήθηκε με 1000 τυχαία επιλεγμένα σύνολα δειγμάτων μικροσυστοιχιών χρησιμοποιώντας μία δειγματοληψία ποσοστό 80% και μια απόσταση μετρική ίση με το ένα μείον τον συντελεστή συσχέτισης Pearson.

στατιστική σημασία των Patterns γονιδιακής έκφρασης σε υπότυποι Expression

Για να επιβεβαιωθεί η στατιστική σημαντικότητα των τεσσάρων ομάδων, SigClust [13] εφαρμόστηκε χρησιμοποιώντας το σύνολο των 2500 πιο μεταβλητά γονίδια που περιγράφονται παραπάνω. Όλες οι συγκρίσεις κατά ζεύγη των υποτύπων εξετάστηκαν χρησιμοποιώντας 1.000 προσομοιωμένων δειγμάτων και την αρχική μέθοδο εκτίμησης συνδιακύμανσης.

διαφορικά εκφραζόμενων γονιδίων και μεταβολικών μονοπατιών

Διαφορικά εκφραζόμενα γονίδια ανιχνεύτηκαν με την samr πακέτο R [42] χρησιμοποιώντας ένα μεσαίο όριο FDR of.01. Για καθένα από τα υποτύπους UNC συγκρίναμε τις τιμές γονιδιακής έκφρασης στον υπότυπο σε όλους τους άλλους υπότυπους συνδυάζονται. DAVID [43] στη συνέχεια χρησιμοποιήθηκε για να βρει μονοπάτια KEGG που έδειξε εμπλουτισμού για τα εντόνως εκφρασμένα γονίδια σε κάθε υπότυπο. Επιπλέον, διαφορικά εκφραζόμενα γονίδια με γνωστές λειτουργικές κατηγορίες, π.χ. παράγοντες μεταγραφής, βρέθηκαν συγκρίνοντας τις υποτύπου-συγκεκριμένες λίστες γονιδίου σε γνωστές κατηγορίες γονιδίων οντολογίας [44].

Δημοσιεύθηκε Έκφραση δεδομένων

Ο ανιχνευτής επιπέδου αρχεία έντασης μικροσυστοιχιών που παράγεται από Chung et al. [8] υποβλήθηκαν σε διόρθωση υποβάθρου, κανονικοποίηση, και οι διαδικασίες περιληπτική γονίδιο-επίπεδο παρόμοιο με αυτά που περιγράφονται ανωτέρω. Αυτό που παράγεται γονιδιακής έκφρασης τιμές για 60 θέματα και 8224 γονίδια. Ο υπότυπος ετικέτες για αυτούς τους 60 πίνακες που εμφανίστηκε στο [8] αναφέρονται ως υποτύπων Chung 1, 2, 3, και 4.

τιμές RPKM Περίληψη για 20.502 γονίδια και 178 υποκείμενα λήφθηκαν με βάση τα δεδομένα RNASeq παρουσιάζεται στο [10]. Οι τιμές RPKM ήταν log

2 μετασχηματίζεται, και οποιοδήποτε γονίδιο που περιείχαν τουλάχιστον ένα λείπει τιμή αφαιρέθηκε από την ανάλυση. Αυτό που παράγεται αξία της γονιδιακής έκφρασης για 15.314 γονίδια.

Επικύρωση της έκφρασης υπότυποι

Συναίνεση ομαδοποίησης εκχωρεί μια ετικέτα υποτύπου σε κάθε σειρά. Ως αποτέλεσμα, ορισμένοι πίνακες μπορεί να μην είναι αντιπροσωπευτικά του υποτύπου τους. Χρησιμοποιώντας πλάτη σιλουέτα [45], εντοπίσαμε ένα σύνολο 125 «πυρήνα» δείγματα των οποίων τα πρότυπα έκφρασης ήταν πιο παρόμοια με αυτά των μελών της δικής τους υποτύπου από άλλους υπότυπους. ClaNC [46], μια μέθοδος ταξινόμησης με βάση την πλησιέστερη κέντρα βάρους, στη συνέχεια εφαρμόστηκε στα δεδομένα έκφρασης UNC από τα δείγματα πυρήνα σε μια προσπάθεια να δημιουργήσει ένα σύνολο γονιδίων ταξινομητή του οποίου η υπογραφή έκφραση θα μπορούσε να χρησιμοποιηθεί για την ταξινόμηση νέων δειγμάτων. Ελαχιστοποιώντας το ποσοστό σφάλματος διασταυρωμένης επικύρωσης έναν κατάλογο των 840 γονιδίων ταξινομητή (210 γονίδια ανά υπότυπο).

Έχουμε εντοπίσει τα γονίδια ταξινομητή των οποίων οι τιμές έκφρασης είναι επίσης παρούσα στο σύνολο δεδομένων έκφρασης Chung, και στη συνέχεια περιόρισε την UNC και Chung σύνολα δεδομένων έκφραση αυτών των γονιδίων. Μετά γονίδιο διάμεσος κεντράρισμα κάθε σύνολο δεδομένων ξεχωριστά, βρήκαμε το κέντρο βάρους για κάθε ένα από τους υποτύπους UNC και Chung υπολογίζοντας την μέση τιμή έκφρασης για κάθε γονίδιο σε όλους τους πίνακες που έχουν την κατάλληλη ετικέτα υπότυπο. Όπως στο [7], οι αποστάσεις μεταξύ των κέντρων βάρους UNC και Chung υπολογίστηκαν χρησιμοποιώντας μια μετρική απόστασης ίση με το ένα μείον το συντελεστή συσχέτισης Pearson. Αυτή η διαδικασία επικύρωσης επαναλήφθηκε χρησιμοποιώντας τα δεδομένα LUSC του Wilkerson et al. [7]. Τα δεδομένα RNASeq από [10] αντιμετωπίστηκε παρόμοιο με τις εξής διαφορές: (i) οι τιμές της γονιδιακής έκφρασης από το UNC και συνδεθείτε

2 (RPKM) τιμές από τα σύνολα δεδομένων TCGA χωριστά διάμεσο κέντρο και τυποποιηθεί από το γονίδιο, (ii)

You must be logged into post a comment.