PLoS One: Αναδρομική Τυχαία Lasso (RRLasso) για την ταυτοποίηση Anti-Cancer Drug Targets


γονίδια

Αφηρημένο

Η αποκάλυψη του οδηγού είναι ζωτικής σημασίας για την κατανόηση της ετερογένειας στον καρκίνο.

L

έχουν

προσεγγίσεις νομιμοποίησης 1-τύπου έχουν χρησιμοποιηθεί ευρέως για την αποκάλυψη των γονιδίων του οδηγού του καρκίνου με βάση τα στοιχεία του γονιδιώματος κλίμακας. Παρά το γεγονός ότι οι υπάρχουσες μέθοδοι έχουν εφαρμοστεί ευρέως στον τομέα της βιοπληροφορικής, διαθέτουν αρκετά μειονεκτήματα: περιορισμοί υποσύνολο μέγεθος, εσφαλμένα αποτελέσματα εκτίμησης, πολυσυγγραμμικότητα και μεγάλη κατανάλωση χρόνου. Έχουμε εισαγάγει μια νέα στατιστική στρατηγική, που ονομάζεται Αναδρομικές Τυχαία Lasso (

RRLasso

), για την υψηλή διαστάσεων γονιδιωματική ανάλυση των δεδομένων και την έρευνα των γονιδίων του οδηγού. Για την ανάλυση του χρόνου αποτελεσματική, θεωρούμε μια αναδρομική διαδικασία εκκίνησης σύμφωνα με την τυχαία λάσο. Επιπλέον, εισάγουμε μια παραμετρική στατιστική δοκιμασία για την επιλογή του γονιδίου οδηγού με βάση εκκίνησης τα αποτελέσματα της προσομοίωσης παλινδρόμησης. Η προτεινόμενη

RRLasso

δεν είναι μόνο γρήγορη αλλά αποδίδει καλά για την υψηλή διαστατική ανάλυση γονιδιωματικών δεδομένων. Monte Carlo προσομοιώσεις και ανάλυση του «Sanger Γονιδιωματική των ναρκωτικών Ευαισθησία στον Καρκίνο σύνολο δεδομένων από την Γονιδιώματος του Καρκίνου» δείχνουν ότι η προτεινόμενη

RRLasso

είναι ένα αποτελεσματικό εργαλείο για την υψηλή διαστατική ανάλυση γονιδιωματικών δεδομένων. Οι προτεινόμενες μέθοδοι παρέχουν αξιόπιστη και βιολογικά σχετικών αποτελεσμάτων για την επιλογή του γονιδίου οδηγού καρκίνο

Παράθεση:. Πάρκο H, Imoto S, Miyano S (2015) Αναδρομική Τυχαία Lasso (

RRLasso

) για την ταυτοποίηση Anti- Στόχοι του καρκίνου των ναρκωτικών. PLoS ONE 10 (11): e0141869. doi: 10.1371 /journal.pone.0141869

Επιμέλεια: Xiaodong Cai, Πανεπιστήμιο του Μαϊάμι, Ηνωμένες Πολιτείες |

Ελήφθη: 5 Μάη του 2015? Αποδεκτές: 14η Οκτωβρίου 2015? Δημοσιεύθηκε: 6 Νοεμβρίου του 2015

Copyright: © 2015 Πάρκο et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Δεδομένα Διαθεσιμότητα: Το Sanger Γονιδιωματική των ναρκωτικών Ευαισθησία στον Καρκίνο σύνολο δεδομένων από το Πρόγραμμα Καρκίνου Γονιδιώματος (https://www.cancerrxgene.org/)

χρηματοδότηση:.. Οι συγγραφείς δεν έχουν καμία υποστήριξη ή χρηματοδότηση για να αναφέρετε

Ανταγωνιστικά συμφέροντα : Οι συγγραφείς δηλώνουν ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα

Εισαγωγή

Μεγάλο μέρος της έρευνας είναι σε εξέλιξη για να κατανοήσουν την πολυπλοκότητα των ετερογενών γενετικών δικτύων υποκείμενες καρκίνο.. Να προσδιορίσει τα ετερογενή γενετική δίκτυα που βρίσκονται πίσω από τον καρκίνο, διάφορα έργα μεγάλης κλίμακας–ωματικής (π.χ., το γονιδίωμα του έργου του καρκίνου, ο καρκίνος Genome Atlas (TCGA), Sanger Γονιδιωματική των ναρκωτικών Ευαισθησία στον Καρκίνο σύνολο δεδομένων από το Πρόγραμμα Καρκίνου Γονιδιώματος, και άλλοι) έχουν κινηθεί και έχουν παράσχει μεγάλες ποσότητες δεδομένων, όπως γονιδιωματική και Γενετικής δεδομένα για τους ασθενείς με καρκίνο ή κυτταρικές σειρές. Ένα κρίσιμο ζήτημα στην έρευνα του καρκίνου είναι να εντοπισθούν τα γονίδια οδηγού του καρκίνου βασίζονται σε διάφορα γονιδιωματική ανάλυση των δεδομένων (π.χ., τα επίπεδα έκφρασης, αντίγραφο παραλλαγές αριθμός, μεθυλίωση, και άλλοι), δεδομένου ότι αποτελεσματική ταυτοποίηση των στόχων καρκίνου του φαρμάκου διευκολύνει την ανάπτυξη επιτυχών αντικαρκινικών θεραπειών. Αν και διάφορες

L

προσεγγίσεις νομιμοποίησης

1-τύπου, π.χ., λάσο [1] και ελαστικό δίχτυ [2], έχουν χρησιμοποιηθεί ευρέως για τον εντοπισμό των γονιδίων του οδηγού του καρκίνου, που έχουν αρκετά μειονεκτήματα ως εργαλεία για γονιδιακή οδηγό αναγνώρισης [3]. Το λάσο και προσαρμοστική λάσο [4] υποφέρουν από τον περιορισμό του υποσυνόλου μέγεθος (δηλαδή, αυτές οι μέθοδοι επιλέξτε χαρακτηριστικά το πολύ το μέγεθος του δείγματος,

ν

). Το ελαστικό δίχτυ, το οποίο έχει χρησιμοποιηθεί ευρέως στην έρευνα βιοπληροφορική, μπορούν να παρέχουν εσφαλμένα αποτελέσματα εκτίμησης για συντελεστές υψηλή συσχέτιση μεταβλητών με διαφορετικά μεγέθη, ειδικά εκείνοι που διαφέρουν στη νοηματική, λόγω της «ομαδοποίηση αποτέλεσμα» της. Ωστόσο, οι συντελεστές υψηλή συσχέτιση των μεταβλητών με διαφορετικά μεγέθη που παρατηρείται συχνά στην έρευνα βιοπληροφορική, αφού τα γονίδια κοινά βιολογικά μονοπάτια είναι συνήθως συσχετίζονται, και οι συντελεστές παλινδρόμησης τους μπορεί να έχουν διαφορετικά μεγέθη και διαφορετικά σημεία. Επιπλέον, προσαρμοστική

L

μεθόδους νομιμοποίησης

1-τύπου υποφέρουν από πολυσυγγραμμικότητα, δεδομένου ότι οι προσαρμοστικές δεδομένα τους με γνώμονα τα βάρη με βάση την Τακτική ελαχίστων τετραγώνων (OLS) εκτιμητές.

Για να επιλύσετε αυτά τα ζητήματα, Wang et al. [3] πρότεινε ένα τυχαίο λάσο με βάση εκκίνησης μοντέλων παλινδρόμησης με τυχαία μέθοδο δάσος. Παρά το γεγονός ότι η τυχαία λάσο υπερνικά τα μειονεκτήματα των υπαρχόντων

L

νομιμοποίησης προσεγγίσεις 1-τύπου, χρησιμοποιώντας ένα τυχαίο δασικής στρατηγικής, η μέθοδος είναι υπολογιστικά εντατικές επειδή χρησιμοποιεί δύο διαδικασίες βήμα εκκίνησης. Επιπλέον, Wang et al. [3] πραγματοποιείται τελική επιλογή χαρακτηριστικό βασίζεται σε αυθαίρετα αποφάσισε όριο, ακόμη και αν τα ποικίλα αποτελέσματα επιλογής εξαρτώνται σε μεγάλο βαθμό από το όριο.

Προτείνουμε μια νέα στατιστική στρατηγική για τον εντοπισμό γονιδίων οδηγό αντι-καρκίνου ευαισθησία φαρμάκου σε γραμμή με την τυχαία λάσο. Έχουμε εισαγάγει αναδρομικές προσεγγίσεις εκκίνησης για την ταυτόχρονη μέτρηση της σημασίας του κάθε γονιδίου και να εκτελέσει την επιλογή γονίδιο του οδηγού. Έχουμε επίσης προτείνει ένα νέο όριο με βάση ένα παραμετρικό στατιστικό τεστ για τον εντοπισμό αποτελεσματικά τα γονίδια του οδηγού με βάση εκκίνησης μοντέλων παλινδρόμησης. Με τη χρήση μιας επαναληπτικής διαδικασίας εκκίνησης, μπορούμε να εκτελέσουμε χρονικά αποτελεσματική μοντελοποίηση εκκίνησης παλινδρόμησης για την υψηλή τρισδιάστατη γονιδιωματικής ανάλυσης δεδομένων χωρίς απώλεια της ακρίβειας μοντέλων. Επιπλέον, η προτεινόμενη μέθοδος επιλογής χαρακτηριστικών χρησιμοποιώντας παραμετρική στατιστική δοκιμή μπορεί να είναι ένα χρήσιμο εργαλείο για τη μεταβλητή επιλογής με βάση την bootstrap μοντέλων παλινδρόμησης.

Χρησιμοποιώντας Monte Carlo προσομοιώσεις διαφόρων σεναρίων, που αποδεικνύουν την αποτελεσματικότητα της προτεινόμενης αναδρομικών τυχαία λάσο και ελαστικό δίχτυ με παραμετρική στατιστική δοκιμασία για την υψηλή τρισδιάστατη μοντελοποίηση παλινδρόμησης. Εφαρμόζουμε επίσης την προτεινόμενη στατιστική στρατηγική για τη δημόσια διαθέσιμες «Sanger Γονιδιωματική των ναρκωτικών Ευαισθησία στο σύνολο δεδομένων του καρκίνου από το Γονιδιώματος του Καρκίνου» (https://www.cancerrxgene.org/), και τον εντοπισμό πιθανών γονιδίων οδηγός του αντι-καρκίνου ευαισθησία των ναρκωτικών . Αριθμητικές αναλύσεις δείχνουν ότι η προτεινόμενη αναδρομική τυχαία λάσο και ελαστικό δίχτυ είναι χρονικά αποτελεσματικές διαδικασίες, και υψηλές επιδόσεις υψηλού διαστάσεων γονιδιωματικής ανάλυσης δεδομένων (δηλαδή, από ένα σημείο άποψη της επιλογής χαρακτηριστικών και προγνωστική ακρίβεια).

Στο τμήμα 2, εισάγουμε το υπάρχον

L

προσεγγίσεις νομιμοποίησης

1-τύπου, και να επισημάνω τα μειονεκτήματά τους. Στη συνέχεια εισάγει την τυχαία λάσο, και προτείνει την αναδρομική τυχαία λάσο και ελαστικό δίχτυ διαδικασίες. Στην Ενότητα 3, περιγράφουμε την προσομοιώσεις και γονίδιο οδηγό επιλογής Monte Carlo χρησιμοποιώντας την Sanger Γονιδιωματική των ναρκωτικών Ευαισθησία στο σύνολο δεδομένων Καρκίνο να εξετάσει την αποτελεσματικότητα των προτεινόμενων στατιστικών στρατηγικές. Έχουμε αναφέρει τα συμπεράσματά μας στην Ενότητα 4.

Υλικά και Μέθοδοι

Ας υποθέσουμε ότι έχουμε

ν

ανεξάρτητες παρατηρήσεις {(

y

i

,

x

i

)?

i

= 1, …,

n

}, όπου

y

i

είναι μεταβλητές και x τυχαία απάντηση

i

είναι

σ

διάστατο διανύσματα των μεταβλητών πρόβλεψης. Εξετάστε το μοντέλο γραμμικής παλινδρόμησης, (1) όπου

β

είναι μια άγνωστη

σ

διάστατο διάνυσμα των συντελεστών παλινδρόμησης και

ε

i

είναι τα τυχαία σφάλματα τα οποία υποτίθεται ότι είναι ανεξάρτητα και πανομοιότυπα κατανεμημένα με μέση τιμή 0 και διακύμανση

σ

2. Υποθέτουμε ότι το

y

i

επικεντρώνονται και

x

ij

είναι τυποποιημένα από την μέση τους και την τυπική απόκλιση: , και, ως εκ τούτου ένας όρος τομής αποκλείεται από το μοντέλο παλινδρόμησης στην εξίσωση (1). Πολλές μελέτες βρίσκονται σε εξέλιξη για την μοντελοποίηση παλινδρόμηση, ιδιαίτερα για την υψηλή διαστατική ανάλυση των δεδομένων (π.χ., γονιδιωματική αλλαγές ανάλυση δεδομένων).

Tibshirani [1] πρότεινε την λάσο, η οποία ελαχιστοποιεί το υπολειπόμενο άθροισμα των τετραγώνων που υπόκεινται σε περιορισμό, και η λύση του δίνεται από (2) όπου

λ

είναι μια παράμετρος ρύθμισης που ελέγχει την πολυπλοκότητα του μοντέλου. Με την επιβολή ενός όρου ποινής, το άθροισμα των απόλυτων τιμών των συντελεστών παλινδρόμησης, το λάσο μπορεί ταυτόχρονα να εκτελέσουν εκτίμηση των παραμέτρων και μεταβλητών επιλογής.

Ωστόσο, μια πρόσφατη εργασία προτείνει ότι το λάσο μπορεί να υποφέρει από τους ακόλουθους περιορισμούς [ ,,,0],2]:

Στο

σ

& gt?

ν

περίπτωση, οι λάσο επιλέγει σε πιο

ν

μεταβλητές, λόγω της κυρτής πρόβλημα βελτιστοποίησης. Αυτό σημαίνει ότι το λάσο δεν είναι κατάλληλο για την επιλογή του γονιδίου οδηγού, δεδομένου ότι γονιδιακά δεδομένα μεταβολή είναι συνήθως υψηλή διαστάσεων των δεδομένων.

Το λάσο δεν μπορούν να εξηγήσουν την ομαδοποίηση επίδραση των μεταβλητών πρόβλεψης, και έτσι τείνει να επιλέξετε μόνο μία μεταβλητή μεταξύ υψηλή συσχέτιση μεταβλητών, ακόμη και αν όλα έχουν σχέση με μεταβλητή απόκρισης. Ωστόσο, γονιδιωματικό μεταβολές των γονιδίων (π.χ., τα επίπεδα έκφρασης, αριθμός αντιγράφων παραλλαγές, μεθυλίωση, κ.λ.π.) που μοιράζονται μια κοινή βιολογική οδό είναι συνήθως υψηλή συσχέτιση, και τα γονίδια μπορεί να σχετίζεται με ένα σύνθετο μηχανισμό καρκίνος θεωρείται ότι είναι η μεταβλητή απόκρισης. Αυτό σημαίνει επίσης ότι το λάσο δεν είναι κατάλληλο για γονιδιωματική ανάλυση των δεδομένων.

Η

Για να ξεπεραστούν αυτά τα μειονεκτήματα, διάφορες

L

μεθόδους νομιμοποίησης 1-τύπου έχουν προταθεί . Το ελαστικό δίχτυ [2], και ιδίως επέστησε ιδιαίτερη προσοχή στον τομέα της βιοπληροφορικής: (3) Ο όρος ποινή της ελαστικής δίχτυ είναι ένα κυρτό συνδυασμό της κορυφογραμμής [5] και λάσο κυρώσεις. Με την επιβολή πρόσθετου

L

2-πέναλτι στο λάσο, το ελαστικό δίχτυ εκτελεί διαθέτουν αποτελεσματικά επιλογή σε υψηλή διαστατική ανάλυση των δεδομένων, δηλαδή, δεν υπάρχει περιορισμός στο μέγεθος του υποσυνόλου. Επιπλέον, το ελαστικό δίχτυ μπορεί να απολαύσει την ακόλουθη ομαδοποίηση αποτέλεσμα: (4), όπου είναι συσχέτιση του δείγματος [2]

Αν και το ελαστικό δίχτυ αποδίδει καλά για την υψηλή διαστατική ανάλυση των δεδομένων, Wang et al.. [3] κατέδειξε ότι το ελαστικό δίχτυ έχει τα ακόλουθα μειονεκτήματα:

Η ιδιότητα του «ομαδοποίηση φαινόμενο» οδηγεί σε εσφαλμένα αποτελέσματα εκτίμησης, όταν οι συντελεστές υψηλή συσχέτιση των μεταβλητών με διαφορετικά μεγέθη, ιδιαίτερα εκείνες με διαφορετικές πινακίδες. Ωστόσο, οι συντελεστές υψηλή συσχέτιση των μεταβλητών με διαφορετικά μεγέθη που παρατηρείται συχνά στην έρευνα βιοπληροφορική, αφού τα γονίδια στο κοινό βιολογικό μονοπάτι είναι συνήθως σχετίζεται σε μεγάλο βαθμό, και οι συντελεστές παλινδρόμησης τους μπορεί να έχουν διαφορετικά μεγέθη ή διαφορετική ένδειξη.

Η

Η προσαρμοστική

L

1-τύπου κυρώσεις έχουν επίσης προταθεί και χρησιμοποιούνται ευρέως σε διάφορους τομείς της έρευνας:

προσαρμοστική λάσο: (5)

προσαρμοζόμενο ελαστικό δίχτυ: (6)

Η

όπου είναι μια προσαρμοστική τα δεδομένα με γνώμονα το βάρος για

γ

& gt? 0. Με τη χρήση του βάρους, μπορούμε να επιβάλει discriminately ποινή για κάθε χαρακτηριστικό, ανάλογα με τη σημασία τους, και έτσι να εκτελεί αποτελεσματικά επιλογής χαρακτηριστικών. Ζου και Hastie [4] και Ζου και Zhang [2] ιδρύθηκε το ακίνητο μαντείο της προσαρμοστικής λάσο και το προσαρμοζόμενο ελαστικό δίχτυ, αντίστοιχα. Ωστόσο, η απόδοση των προσαρμοστικών μεθόδων νομιμοποίησης εξαρτάται σε μεγάλο βαθμό από τον εκτιμητή OLS, και έτσι αυτές οι μέθοδοι υποφέρουν από πολυσυγγραμμικότητα. Επιπλέον, η προσαρμοστική

L

1-τύπου μεθόδους νομιμοποίησης υποφέρουν από τα ίδια μειονεκτήματα όπως οι κοινές μεθόδους, δηλαδή, κατά τη χρήση της προσαρμοστικής λάσο, ο αριθμός των επιλεγμένων μεταβλητών δεν μπορεί να υπερβαίνει το

n

, και το προσαρμοζόμενο ελαστικό δίχτυ μπορεί επίσης να παρέχει εσφαλμένα αποτελέσματα εκτίμησης όταν υπάρχουν συντελεστές υψηλή συσχέτιση των μεταβλητών με διαφορετικά μεγέθη.

Τυχαία Λάσο

Wang et al. [3] λεπτομερώς τα μειονεκτήματα των υπαρχόντων

L

1-τύπου προσεγγίσεις, και προτείνεται η τυχαία λάσο βασίζεται σε ένα bootstrap στρατηγική που χρησιμοποιεί τη μέθοδο της τυχαίας δάσος. Στο τυχαίο λάσο διαδικασία, επιλέγονται τυχαία

Τα q

μεταβλητές θεωρούνται υποψήφιες μεταβλητές στα μοντέλα παλινδρόμησης για κάθε bootstrap δείγμα. Έτσι, τα αποτελέσματα δεν πάσχουν από τις μεταβλητές υψηλή συσχέτιση μειονεκτήματα, δεδομένου ότι κάθε bootstrap δείγμα μπορεί να περιλαμβάνει μόνο ένα υποσύνολο των συσχετίζεται ιδιαίτερα μεταβλητές. Επιπλέον, η τυχαία λάσο μπορεί να ξεπεράσει το όριο μεγέθους υποσύνολο, αφού μεταβλητή επιλογής με βάση τα αποτελέσματα της εκκίνησης μοντέλων παλινδρόμησης με τυχαία επιλεγμένο

q

1 ή

q

2 μεταβλητές κάθε bootstrap δείγμα.

Wang et al. [3] προτείνει τον ακόλουθο αλγόριθμο που βασίζεται σε ένα bootstrap διαδικασία δύο σταδίων για την υλοποίηση της τυχαίας λάσο:

Αλγόριθμος 1

Τυχαία λάσο

Βήμα 1: Δημιουργία μέτρα σημασία των μεταβλητών πρόβλεψης.

∘ Ισοπαλία

β

δείγματα bootstrap με μέγεθος

n

με δειγματοληψία με αντικατάσταση από το αρχικό σύνολο δεδομένων.

∘ Για το bootstrap δείγμα,

b

1 ∈ {1, 2, …,

Β

},

q

1 υποψήφιος μεταβλητές επιλέγονται τυχαία, και το λάσο εφαρμόζεται για τη μοντελοποίηση παλινδρόμησης και παίρνουμε εκτιμητές για

ι

= 1, …,

σ

.

∘ Το μέτρο σημασία του

x

ι

υπολογίζεται ως

η

Βήμα 2:. Μεταβλητό επιλογή

∘ Ισοπαλία

Β

δείγματα bootstrap με μέγεθος

n

με δειγματοληψία με την αντικατάσταση από το αρχικό σύνολο δεδομένων.

∘ Για το bootstrap δείγμα,

β

2 ∈ {1, 2, …,

β

},

q

2 υποψήφιες μεταβλητές επιλέγονται τυχαία με πιθανότητα επιλογής του

x

ι

ανάλογος προς

I

ι

, και η προσαρμοστική λάσο εφαρμόζεται για τη μοντελοποίηση παλινδρόμησης, και παίρνουμε τον εκτιμητή για

ι

= 1, …,

σ

.

∘ Υπολογίστε το τελικό εκτιμητή,, όπως για

ι

= 1, …,

σ

.

η

η

για μεταβλητές πρόβλεψης του θορύβου, των συντελεστών στο αντίστοιχο bootstrap δείγματα εκτιμάται ότι είναι μικρό ή να έχουν διαφορετικά σημεία, και έτσι η απόλυτη τιμή του μέσου όρου των συντελεστών (δηλαδή,

I

ι

) θα είναι μικρό ή κοντά στο μηδέν . Από την άλλη πλευρά, οι συντελεστές ζωτικής μεταβλητών πρόβλεψης μπορεί να είναι σταθερά μεγάλα σε διαφορετικά δείγματα bootstrap, και συνεπώς ένα βασικό γονίδιο έχει μια μεγάλη τιμή του

I

j

. Αυτό σημαίνει ότι η πιθανότητα επιλογής

I

ι

παρέχει αποτελεσματική επιλογή χαρακτηριστικό. Wang et al. [3] θεωρείται

q

1 και

q

2 ως παράμετροι συντονισμού, και το μέτρο σημασία

I

ι

μπορεί επίσης να χρησιμοποιηθεί για το βάρος για την προσαρμοστική λάσο.

Wang et al. [3] Σημειώνεται ότι τα μεταβλητά αποτελέσματα της επιλογής του τυχαίου λάσο είναι άδικο, δεδομένου ότι ορισμένα από τα τελικά μη μηδενικών συντελεστών μπορεί να προκύψει από ένα συγκεκριμένο δείγμα bootstrap (δηλαδή, η τυχαία λάσο μπορεί να δώσει ψευδώς θετικά στη μεταβλητή επιλογής). Έτσι, ένα όριο

t

n

= 1 /

ν

προστέθηκε για τη μεταβλητή επιλογής και μεταβλητές πρόβλεψης με διαγράφηκαν από το τελικό μοντέλο.

Αναδρομικές τυχαία λάσο για την αποτελεσματική Δυνατότητα επιλογής

Η τυχαία λάσο μπορεί να ξεπεράσει τα μειονεκτήματα των υπαρχόντων

L

1-τύπου νομιμοποίηση, χρησιμοποιώντας τη μέθοδο της τυχαίας δάσος με εκκίνησης μοντέλων παλινδρόμησης . Παρά το γεγονός ότι η τυχαία λάσο αποδίδει καλά για την υψηλή τρισδιάστατη μοντελοποίηση παλινδρόμησης με υψηλή συσχέτιση προγνωστικούς παράγοντες, η μέθοδος πάσχει επίσης από τα ακόλουθα μειονεκτήματα:

Η τυχαία λάσο είναι υπολογιστικά εντατικές, δεδομένου ότι βασίζεται σε δύο διαδικασίες εκκίνησης με τις αντίστοιχες επαναλήψεις Β. Η υπολογιστική πολυπλοκότητα του τυχαίου λάσο είναι σημαντικά αυξημένη σε γονιδιωματική ανάλυση των δεδομένων, επειδή το σύνολο δεδομένων είναι κατασκευασμένο με ένα εξαιρετικά μεγάλο αριθμό μεταβλητών πρόβλεψης.

Το όριο είναι ζωτικής σημασίας για την επιλογή χαρακτηριστικών, δεδομένου ότι τα αποτελέσματα της επιλογής χαρακτηριστικό εξαρτώνται σε μεγάλο βαθμό στο κατώφλι. Ωστόσο, Wang et al. [3] που αυθαίρετα το όριο ως 1 /

ν

, χωρίς στατιστικό υπόβαθρο.

Η μέθοδος έχει πάρα πολλές παραμέτρους ρύθμισης, δηλαδή,

λ

στο

L

1-τύπου κυρώσεις, και

q

1 και

q

2 στη μέθοδο της τυχαίας δάσος. Ο μεγάλος αριθμός των παραμέτρων συντονισμού καθιστά επίσης τη χρονοβόρα μέθοδος, δεδομένου ότι οι τυχαίες λάσο διαδικασίες θα πρέπει να εφαρμοστεί κατ ‘επανάληψη για να επιλέξετε το βέλτιστο συνδυασμό των παραμέτρων.

Η

Προτείνουμε μια αποτελεσματική στρατηγική για τη μοντελοποίηση σύμφωνα με η τυχαία λάσο, που ονομάζεται αναδρομική τυχαία λάσο (ή ελαστικό δίχτυ). Να επιτελούν αποτελεσματικά υψηλή διαστατική ανάλυση των δεδομένων γονιδιωματικής, προτείνουμε μια αναδρομική διαδικασία εκκίνησης για τη δημιουργία του μέτρου σημασία και μοντελοποίηση παλινδρόμησης. Προτείνουμε επίσης ένα νέο όριο για να επιλέξετε αποτελεσματικά μεταβλητές πρόβλεψης στην bootstrap μοντέλων παλινδρόμησης χρησιμοποιώντας μια παραμετρική στατιστική δοκιμή. Επιπλέον, ορισμένες υποψήφιες προγνωστικούς παράγοντες,

q

, επίσης επιλέγεται τυχαία σε κάθε bootstrap δείγμα (δηλαδή, δεν θεωρούμε

q

ως παράμετρος ρύθμισης). Η προτεινόμενη αναδρομική τυχαία λάσο (ελαστικό δίχτυ) υλοποιείται από το ακόλουθο αλγόριθμο.

Αλγόριθμος 2

Αναδρομικές τυχαία λάσο (ή ελαστικό δίχτυ)

Ισοπαλία

Β

εκκίνησης δείγματα με μέγεθος

n

με δειγματοληψία με αντικατάσταση από το αρχικό σύνολο δεδομένων.

Για το δείγμα πρώτο εκκίνησης (δηλαδή,

b

= 1),

q

υποψήφιος μεταβλητές επιλέγονται τυχαία και το λάσο (ή ελαστικό δίχτυ) εφαρμόζεται για τη μοντελοποίηση παλινδρόμησης. Στη συνέχεια αποκτήσουν εκτιμητές για

ι

= 1, …,

σ

.

Για

β

∈ {2, …,

B

}, το μέτρο σημασία του

x

ι

υπολογίζεται ως. Η

q

υποψήφιες μεταβλητές επιλέγονται τυχαία με πιθανότητα επιλογής

I

ι

, και η προσαρμοστική λάσο (ή προσαρμοστική ελαστικό δίχτυ) με

w

ι

= 1 /

I

ι

εφαρμόζεται για τη μοντελοποίηση παλινδρόμησης. Έχουμε λάβει τα εκτιμητές για

ι

= 1, …,

σ

.

Οι τελικές εκτιμητές υπολογίζονται ως.

Τέλος, εκτελούμε μεταβλητή επιλογής με βάση στο κατώφλι

t

* μέσω της παραμετρική στατιστική δοκιμασία.

η

παραμετρική στατιστική δοκιμής για Μεταβλητή επιλογής στην Bootstrap Παλινδρόμηση Μοντελοποίηση (PSTVSboot).

προκειμένου να εκτελέσουν αποτελεσματικά επιλογής χαρακτηριστικών, προτείνουμε μια παραμετρική στατιστική δοκιμή με βάση τα bootstrap αποτελέσματα μοντέλων παλινδρόμησης. Θεωρούμε πρώτα ένα

Β

×

σ

δυαδική μήτρα D που λαμβάνονται από τις παραπάνω αναδρομικές διαδικασίες εκκίνησης. Θέτουμε ένα στοιχείο του δυαδικού πίνακα ως

D

bj

= 1 για ένα μη μηδενικό στο

β

ου

bootstrap δείγμα? Αλλιώς

D

BJ

= 0. Με άλλα λόγια, θεωρούμε ότι η δυαδική μήτρα λαμβάνεται από Bernoulli πειράματα, και αφήστε το

D

ι

να είναι μια τυχαία μεταβλητή που σχετίζεται με δοκιμών Bernoulli ως εξής:.

,

Η

Η Bernoulli τυχαία μεταβλητή έχει την ακόλουθη συνάρτηση πυκνότητας πιθανότητας (7), όπου η πιθανότητα

π

μπορεί να υπολογιστεί ως εξής, (8), η οποία δείχνει το μέσο όρο του δείκτη επιλογής όλων των μεταβλητών πρόβλεψης στο

Β

δείγματα bootstrap. Για λογική μεταβλητή επιλογής, μπορούμε στη συνέχεια να εξετάσει τα ακόλουθα στατιστικά στοιχεία: (9), η οποία υποδεικνύει τον αριθμό των μη μηδενικών στο

Β

δοκιμών Bernoulli (δηλαδή

Β

δείγματα bootstrap). Η στατιστική

C

ι

ακολουθεί την διωνυμική κατανομή και έχει την ακόλουθη συνάρτηση μάζας πιθανότητας: (10) Στη συνέχεια υπολογίζει ένα

σ

-τιμή για κάθε προγνωστικό μεταβλητή ως εξής, (11) και, τέλος, να εκτελέσει μεταβλητή επιλογής με βάση το

σ

-τιμή με όριο

t

* = 0,05 ως εξής (12), όπου

I

(⋅) είναι μια συνάρτηση δείκτης. Μπορούμε να αναμένουμε ότι η παραμετρική στατιστική δοκιμασία μπορεί να ξεπεράσει ψευδώς θετικά αποτελέσματα επιλογής χαρακτηριστικών της εκκίνησης μοντέλων παλινδρόμησης. Αν και έχουμε περιγράψει την προτεινόμενη μεταβλητή στρατηγική επιλογή επικεντρώθηκε στην τυχαία λάσο διαδικασία, η παραμετρική στατιστική δοκιμασία θα είναι ένα χρήσιμο εργαλείο για την bootstrap μοντέλων παλινδρόμησης.

Αποτελέσματα

Monte Carlo προσομοιώσεις

Monte Carlo προσομοιώσεις διεξήχθησαν για να διερευνηθεί η αποτελεσματικότητα της προτεινόμενης στρατηγικής μοντελοποίησης. Προσομοιώσαμε 100 σύνολα δεδομένων από το ακόλουθο γραμμικό υπόδειγμα παλινδρόμησης (13), όπου

ε

i

είναι

Ν

(0,

σ

2), και ο συσχετισμός μεταξύ

x

l

και

x

m

είναι 0,5

|

l

m

|

Εμείς θεωρούνται οι καταστάσεις εξής προσομοίωση:.

Type1:

n

= 100 και

p

= 1000 ως

β

ι

= 3 για 50 τυχαία επιλεγμένες μεταβλητές, διαφορετικά

β

ι

= 0,

Τύπος2:

n

= 100 και

σ

= 1000 ως

β

ι

= 3 για 25 τυχαία επιλεγμένες μεταβλητές,

β

ι

= -3 για 25 τυχαία επιλεγμένες μεταβλητές, διαφορετικά

β

ι

= 0,

Type3:

n

= 100 και

σ

= 1000 ως

β

ι

= 3 για 150 τυχαία επιλεγμένων μεταβλητών, διαφορετικά

β

ι

= 0.

TYPE4:

n

= 100 και

p

= 1000 ως

β

ι

= 3 για 75 τυχαία επιλεγμένες μεταβλητές,

β

ι

= -3 για 75 τυχαία επιλεγμένες μεταβλητές, διαφορετικά

β

ι

= 0,

Type5:

n

= 50 και

p

= 2000 ως

β

ι

= 3 για 40 τυχαία επιλεγμένες μεταβλητές, διαφορετικά

β

ι

= 0,

Type6:

n

= 50 και

σ

= 2000 ως

β

ι

= 3 για 20 τυχαία επιλεγμένες μεταβλητές,

β

ι

= -3 για 20 τυχαία επιλεγμένες μεταβλητές, διαφορετικά

β

ι

= 0,

Type7:

n

= 50 και

σ

= 2000 ως

β

ι

= 3 για 200 τυχαία επιλεγμένες μεταβλητές, διαφορετικά

β

ι

= 0.

Type8:

n

= 50 και

p =

2000 ως

β

ι

= 3 για 100 τυχαία επιλεγμένων μεταβλητών,

β

ι

= -3 για 100 τυχαία επιλεγμένες μεταβλητές, διαφορετικά

β

ι

= 0,

η

Για να αξιολογηθεί η προτεινόμενη αναδρομική τυχαία λάσο και ελαστικό δίχτυ διαδικασίες, συγκρίναμε η απόδοση των μεθόδων μας, αναδρομικές τυχαία ελαστικό δίχτυ (RCS.RD.EL), αναδρομικές τυχαία Lasso (RCS.RD.LA), με το λάσο (LASSO), προσαρμοστική Lasso (AD.LA), ελαστικό δίχτυ (ELA), και των υφιστάμενων τυχαία λάσο (RD.LA). Σε αριθμητικές μελέτες, χρησιμοποιήσαμε ένα εκτιμητή κορυφογραμμή για το βάρος στο υφιστάμενο προσαρμοστική λάσο, και θεωρήσαμε το όριο του υφιστάμενου τυχαία λάσο για να είναι

s

/

ν

, και επιλεγμένα

s

με βάση την ρίζα του μέσου τετραγωνικού σφάλματος στο σύνολο δεδομένων επικύρωσης. Θεωρήσαμε τον αριθμό των δειγμάτων bootstrap να

Β

= 1000 και ένα σύνολο δεδομένων κατασκευάστηκε με την εκπαίδευση, την επικύρωση, και σύνολα δεδομένων δοκιμής με το μέγεθος του δείγματος

ν

, αντίστοιχα. Οι παράμετροι ρύθμισης επιλέχθηκαν από 5-φορές σταυρό επικύρωση με βάση το σύνολο δεδομένων εκπαίδευσης.

Είμαστε αξιολόγησε για πρώτη φορά την υπολογιστική αποδοτικότητα των μεθόδων μας. Ο Πίνακας 1 δείχνει το υπολογιστικό χρόνο που απαιτείται για την υπάρχουσα τυχαία λάσο αλγόριθμο 1 (RD.LA) και την προτεινόμενη αναδρομική τυχαία λάσο αλγόριθμο 2 (RCS.RD.LA). Ο χρόνος λειτουργίας υποδεικνύει το συνολικό χρόνο που απαιτείται για την εκτίμηση του υποδείγματος παλινδρόμησης μέσω της επιλογής των παραμέτρων ρύθμισης και εκκίνησης αντιγραφής. Ο Πίνακας 1 δείχνει ότι οι επιδόσεις της προτεινόμενης αναδρομικών τυχαία λάσο είναι υπολογιστικά αποτελεσματική σε σύγκριση με την υπάρχουσα τυχαία λάσο σε όλες τις καταστάσεις προσομοίωσης.

Η

Για να δείξει την αποτελεσματικότητα των αναδρομικών στρατηγικής εκκίνησης, συγκρίναμε τα μέτρα σημασία για την οι τυχαίες λάσο διαδικασίες. Ο Πίνακας 2 δείχνει το μέσο όρο της σημασίας των μέτρων

I

ι

για μεταβλητές πρόβλεψης με αληθινά μη μηδενικών συντελεστών και πραγματικά μηδενικών συντελεστών στο αναδρομικό τυχαίο ελαστικό δίχτυ (RCS.RD. EL), αναδρομικές τυχαία Lasso (RCS.RD.LA) και τυχαία λάσο (RD.LA), όπου οι αριθμοί στις παρενθέσεις είναι ο μέσος όρος των μέτρων σημασίας για μικρό αριθμό δειγμάτων εκκίνησης

Β

= 20.

η

στην υφιστάμενη τυχαία λάσο, το μέτρο σημασία υπολογίζεται ανεξάρτητα με μοντελοποίηση παλινδρόμησης (δηλαδή, στο βήμα 1 του αλγορίθμου 1). Ωστόσο, στη μέθοδο μας, η

I

ι

αναδρομικά υπολογίζεται κατά τη διάρκεια της μοντελοποίησης παλινδρόμησης. Επιπλέον, η

I

ι

της μεθόδου μας βασίζεται σε μια τυχαία επιλεγμένο αριθμό των μεταβλητών υποψήφιο προγνωστικό

q

, ενώ στο υπάρχον τυχαία λάσο μέθοδο,

I

ι

βασίζεται στη ρύθμιση παραμέτρων

q

1 και

q

2 επιλέγονται από την ελαχιστοποίηση πρόβλεψης σφάλμα στο σύνολο δεδομένων επικύρωσης. Με λίγα λόγια, η μέθοδος μας παρέχει χρονικά αποτελεσματικές διαδικασίες σε σύγκριση με την υπάρχουσα τυχαία λάσο.

Από τον Πίνακα 2, μπορεί να φανεί ότι η σημασία μέτρο μέθοδος μας δείχνει μεγαλύτερη διαφορές μεταξύ πραγματικά μηδέν και μη μηδενικοί συντελεστές από το κάνει στο υπάρχον τυχαία λάσο, αν και η διαφορά είναι μικρή. Επιπλέον, μπορούμε να δούμε ότι η προτεινόμενη αναδρομική διαδικασία εκκίνησης παρέχει επίσης τις μεγαλύτερες διαφορές για το μέτρο σημασία ακόμα και στο μικρό αριθμό δειγμάτων εκκίνησης (δηλαδή,

Β

= 20 δίνεται σε παρένθεση του Πίνακα 2). Αυτό σημαίνει ότι οι προτεινόμενες αναδρομικές προσεγγίσεις εκκίνησης εκτελέσει αποτελεσματικά για την επιλογή τη λειτουργία χρησιμοποιώντας το τυχαία διαδικασία δάσος, αν και η μέθοδος μας παρέχει υπολογιστικά αποτελεσματική αποτελέσματα της προσομοίωσης.

Στη συνέχεια συνέκριναν τα αποτελέσματα των μοντέλων παλινδρόμησης με βάση την ακρίβεια πρόβλεψης κατά τη δοκιμή συνόλου δεδομένων και η μεταβλητή επιλογής αποτελέσματα που φαίνονται στα σχήματα 1 και 2.

η

το σχήμα 1 δείχνει τα σφάλματα πρόβλεψης δίνονται ως μέσος όρος ρίζα του μέσου τετραγωνικού λάθη χρήση αναδρομικών τυχαία ελαστικό δίχτυ (RCS.RD.EL ), αναδρομικές τυχαία Lasso (RCS.RD.LA), τυχαία Lasso (RD.LA), ελαστικό δίχτυ (ELA), προσαρμοστική Lasso (AD.LA), και λάσο (LASSO). Μπορεί να φανεί αν και Εικόνα 1 ότι η προτεινόμενη αναδρομικό τυχαίο ελαστικό δίχτυ εμφανίζει ανώτερη ακρίβεια πρόβλεψης σχεδόν σε καταστάσεις προσομοίωσης. Επιπλέον, η προτεινόμενη αναδρομική τυχαία λάσο δείχνει επίσης πολύ μεγαλύτερη ακρίβεια πρόβλεψης από το λάσο, προσαρμοστική λάσο ή ελαστικό δίχτυ, και τα αποτελέσματα είναι παρόμοια με την υπάρχουσα τυχαία λάσο, ακόμη και αν η αναδρομική τυχαία λάσο παρέχει χρονικά αποτελεσματική επιδόσεων σε σύγκριση με το υπάρχον τυχαία λάσο όπως φαίνεται στον πίνακα 1.

επίσης, σε σύγκριση με ποικίλα αποτελέσματα επιλογής που αναφέρονται ως ο μέσος όρος της πραγματικής θετικού ρυθμού (δηλαδή, ο μέσος αριθμός των αληθινή μη μηδενικών συντελεστών, λάθος στο μηδέν) και αληθινό αρνητικό ποσοστό (π.χ. , το μέσο ποσοστό της πραγματικής μηδενικών συντελεστών, που είχαν οριστεί σωστά στο μηδέν) στο Σχήμα 2. Μπορούμε να δούμε αν Σχήμα 2 ότι η προτεινόμενη αναδρομική τυχαία λάσο και αναδρομικοί τυχαία ελαστικό δίχτυ δείχνουν εξαιρετική απόδοση για τη μεταβλητή επιλογής σε όλες τις καταστάσεις προσομοίωσης. Από την άλλη τα χέρια, τα λάσο και προσαρμοστική λάσο δείχνουν άσχημα αποτελέσματα για τη μεταβλητή επιλογής σε υψηλές καταστάσεις διαστάσεων των δεδομένων, εφόσον οι μέθοδοι υποφέρουν από τον περιορισμό του μεγέθους υποσύνολο.

Με λίγα λόγια, η προτεινόμενη αναδρομική τυχαία λάσο και ελαστικό δίχτυ μέθοδοι δεν είναι μόνο υπολογιστικά αποτελεσματική, αλλά παράγουν εξαιρετικά αποτελέσματα μοντέλων παλινδρόμησης (δηλαδή, την ακρίβεια πρόβλεψης και μεταβλητό επιλογή). Αυτό το αποτέλεσμα σημαίνει ότι οι μέθοδοι μας μπορούν να είναι χρήσιμα εργαλεία για την υψηλή διαστάσεων γονιδιωματικής ανάλυσης δεδομένων αλλοίωση

Real World Παραδείγματα:. Προσδιορισμός Γονίδια Driver αντικαρκινικών φαρμάκων Ευαισθησία

Εφαρμόσαμε τις προτεινόμενες στρατηγικές για τον εντοπισμό δυναμικό γονίδια οδηγός της αντι-καρκίνου ευαισθησία των ναρκωτικών στο διαθέσιμο στο κοινό «Sanger Γονιδιωματική των ναρκωτικών ευαισθησία στο σύνολο δεδομένων του καρκίνου από το Γονιδιώματος του καρκίνου» (https://www.cancerrxgene.org/). Το σύνολο δεδομένων περιέχει την κατάσταση των επιπέδων γονιδιακής έκφρασης, αριθμός αντιγράφων και μετάλλαξης για 654 κυτταρικές γραμμές και τα ήμισυ της μέγιστης ανασταλτικές συγκεντρώσεις φαρμάκου (τιμές IC50) του 138 αντικαρκινικά φάρμακα ως δείκτης της ευαισθησίας φαρμάκου. Θεωρήσαμε τα επίπεδα έκφρασης των 13.321 γονιδίων και τις τιμές IC50 των αντικαρκινικών φαρμάκων για να αποκαλύψει τα γονίδια του οδηγού, τα οποία είναι διαθέσιμα από τους πόρους: «γραμμή κυττάρων γενετική (μετάλλαξη και αριθμός αντιτύπου) και τα δεδομένα γονιδιακής έκφρασης που χρησιμοποιούνται για EN ανάλυση» και » Η γραμμή κυττάρων ευαισθησία φαρμάκου, μεταλλάξεις και τύπου ιστού », αντίστοιχα, στο» https://www.cancerrxgene.org/». Πολλές τιμές IC50 που λείπει από το σύνολο δεδομένων Sanger, και εμείς επομένως θεωρούνται μόνο 99 αντικαρκινικά φάρμακα, τα οποία έχουν τις διαθέσιμες παρατηρήσεις για τουλάχιστον 600 καρκινικές κυτταρικές σειρές, όπως μεταβλητές απόκρισης. Τα επίπεδα έκφρασης του 10% των γονιδίων (δηλαδή, 1,332 γονίδια) που έχει την υψηλότερη διακύμανση σε όλα τα δείγματα θεωρήθηκαν ως μεταβλητές πρόβλεψης. Εμείς που απασχολούνται

Β

= 1000 επαναλήψεις εκκίνησης και οι παράμετροι ρύθμισης επιλέχθηκαν από 5-φορές επικύρωση σταυρό.

Για να αξιολογεί τις προτεινόμενες μεθόδους, συγκρίναμε την ακρίβεια πρόβλεψης των αναδρομικών τυχαία λάσο και ελαστική καθαρό, τα υπάρχοντα τυχαία λάσο, ελαστικό δίχτυ, προσαρμοστική λάσο και λάσο βασισμένο σε 99 μοντέλα παλινδρόμησης που αντιστοιχεί στο 99 αντικαρκινικά φάρμακα. Ο Πίνακας 3 δείχνει το μέσο της ρίζας σημαίνει τετραγωνικού σφάλματος των μοντέλων 99 παλινδρόμησης. Μπορούμε να δούμε μέσα από τον Πίνακα 3 ότι οι τυχαίες προσεγγίσεις λάσο τύπου παρουσιάζουν εξαιρετικές επιδόσεις σε σύγκριση με τις

L

μεθόδους νομιμοποίησης 1-τύπου. Η προτεινόμενη αναδρομική τυχαία λάσο και ελαστικό δίχτυ παρουσιάζουν παρόμοια απόδοση με το υπάρχον τυχαία λάσο, αν και οι μέθοδοι μας δείχνουν τη διαδικασία χρονικά αποτελεσματική, όπως φαίνεται στον πίνακα των χρόνων κίνηση Πίνακα 3.

Η

Στη συνέχεια προσδιορίζονται δυναμικό γονίδια πρόγραμμα οδήγησης χρησιμοποιώντας την προτεινόμενη αναδρομική τυχαίο ελαστικό δίχτυ. Εμείς επικεντρώθηκε σε πέντε δημοφιλή αντικαρκινικά φάρμακα: σισπλατίνη, docetaxel, doxorubicin, γεμσιταβίνη και βινορελβίνη, τα οποία έχουν προσελκύσει σημαντική για την έρευνα του καρκίνου [6, 7]. Εμείς θα εισαγάγει τις πέντε αντικαρκινικά φάρμακα

Η σισπλατίνη (εμπορική ονομασία: Platinol):. Ένα φάρμακο χημειοθεραπείας πλατίνα ένωση που σταματά τα καρκινικά κύτταρα από την καλλιέργεια. Στόχος: DNA μέσο διασύνδεσης. Χρησιμοποιείται για τη θεραπεία: όρχεων, των ωοθηκών, της ουροδόχου κύστης, κεφαλής και λαιμού, του μαστού, του τραχήλου της μήτρας και του προστάτη. Παρενέργειες:. Ναυτία και έμετο, νεφρική τοξικότητα, χαμηλός αριθμός λευκών αιμοσφαιρίων, και χαμηλά επίπεδα ερυθροκυττάρων

Η docetaxel (εμπορική ονομασία: Taxotere): ανήκει σε μια κατηγορία φαρμάκων χημειοθεραπείας που λειτουργεί με την παρεμπόδιση διαίρεση της τα καρκινικά κύτταρα. Στόχοι: μικροσωληνίσκοι. Χρησιμοποιείται για τη θεραπεία: μαστού, μη μικροκυτταρικό καρκίνο του πνεύμονα, του στομάχου προηγμένη και καρκίνους της κεφαλής και του λαιμού. παρενέργειες: ναυτία, διάρροια, απώλεια μαλλιών, την αλλαγή των νυχιών, χαμηλός αριθμός λευκών αιμοσφαιρίων, και χαμηλά επίπεδα ερυθροκυττάρων

Η δοξορουβικίνη (εμπορική ονομασία: Αδριαμυκίνη):. ένα φάρμακο χημειοθεραπείας κατά του καρκίνου που έχει ταξινομηθεί ως ένα «ανθρακυκλίνης αντιβιοτικό». Θα επιβραδύνει ή σταματά την ανάπτυξη των καρκινικών κυττάρων, και συνδέεται στο DNA με παρεμβολή μεταξύ συγκεκριμένων ζευγών βάσης, μπλοκάροντας έτσι τη σύνθεση του DNA [8]. Στόχος: DNA παρεμβολή. Χρησιμοποιείται για τη θεραπεία της λευχαιμίας, της ουροδόχου κύστης, του μαστού, του στομάχου, του πνεύμονα, των ωοθηκών και καρκίνων του θυρεοειδούς, και το σάρκωμα των μαλακών μορίων. Παρενέργειες:. Τριχόπτωση, μυελοκαταστολή, βλεννογονίτιδα του στόματος, και διάρροια

Γεμσιταβίνη (εμπορική ονομασία: Gemzar): ένα φάρμακο χημειοθεραπείας κατά του καρκίνου που έχει ταξινομηθεί ως αντιμεταβολίτης. Η γεμσιταβίνη εμποδίζει την ανάπτυξη των καρκινικών κυττάρων, τελικά οδηγεί σε καταστροφή τους. Αναστέλλει θυμιδυλική συνθετάση, η οποία οδηγεί σε αναστολή της σύνθεσης του DNA και τον κυτταρικό θάνατο [9].

You must be logged into post a comment.