PLoS One: αποποίησης Δέντρο Αιτιώδης μοντέλα καρκίνου Εξέλιξη με πιθανότητα Αύξηση


Αφηρημένο

Οι υπάρχουσες τεχνικές για να ανακατασκευάσει τα μοντέλα δέντρο της εξέλιξης αθροιστικά διαδικασίες, όπως ο καρκίνος, επιδιώκουν να εκτιμήσει την αιτιώδη συνάφεια με το συνδυασμό αντιστοιχίας και frequentist έννοια της χρονικής προτεραιότητας. Στο έγγραφο αυτό, ορίζουμε ένα νέο θεωρητικό πλαίσιο που ονομάζεται CAPRESE (καρκίνος εξέλιξη Εκχύλιση με ενιαία άκρες) να ανακατασκευάσει τέτοια μοντέλα που βασίζονται στην έννοια της πιθανοτικής αιτιώδη συνάφεια ορίζεται από Suppes. Θεωρούμε μια γενική ρύθμιση ανασυγκρότηση περιπλέκεται από την παρουσία θορύβου στα δεδομένα λόγω βιολογικών παραλλαγή, καθώς και πειραματικές ή σφάλματα μέτρησης. Για να βελτιωθεί η ανοχή στο θόρυβο ορίζουμε και να χρησιμοποιήσετε μια συρρίκνωση-όπως εκτιμητή. Έχουμε αποδείξει την ορθότητα του αλγορίθμου μας, δείχνοντας ασυμπτωτική σύγκλιση προς τη σωστή δέντρο κάτω από ήπιες περιορισμούς σχετικά με το επίπεδο του θορύβου. Επιπλέον, για τα συνθετικά δεδομένα, δείχνουμε ότι η προσέγγισή μας ξεπερνά το state-of-the-art, ότι είναι αποτελεσματικό ακόμη και με ένα σχετικά μικρό αριθμό δειγμάτων και ότι η απόδοση του συγκλίνει γρήγορα στην ασύμπτωτο του καθώς ο αριθμός των δειγμάτων αυξάνεται. Για πραγματικά δεδομένα καρκίνο λαμβάνονται με διαφορετικές τεχνολογίες, τονίζουμε βιολογικά σημαντικές διαφορές στις ακολουθίες συναχθεί σε σχέση με άλλες ανταγωνιστικές τεχνικές και δείχνουμε επίσης πώς να επικυρώσει εικάζεται βιολογικές σχέσεις με τα μοντέλα της εξέλιξης

Παράθεση:. Loohuis LO, Caravagna G, Graudenzi Α, Ramazzotti D, Mauri G, Antoniotti M, et al. (2014) τεκμηρίωση Δέντρο Αιτιώδης μοντέλα καρκίνου Εξέλιξη με πιθανότητα Αύξηση. PLoS ONE 9 (10): e108358. doi: 10.1371 /journal.pone.0108358

Επιμέλεια: Lars Kaderali, Technische Universität Dresden, Ιατρική Σχολή, Γερμανία

Ελήφθη: 11 Απριλίου του 2014? Αποδεκτές: 27 Αύγ 2014? Δημοσιεύθηκε: 9 Οκτ 2014

Copyright: © 2014 Olde Loohuis et al. Αυτό είναι ένα άρθρο ανοικτής πρόσβασης διανέμεται υπό τους όρους της άδειας χρήσης Creative Commons Attribution, το οποίο επιτρέπει απεριόριστη χρήση, τη διανομή και την αναπαραγωγή σε οποιοδήποτε μέσο, ​​με την προϋπόθεση το αρχικό συγγραφέα και την πηγή πιστώνονται

Δεδομένα Διαθεσιμότητα:. Η συγγραφείς επιβεβαιώνουν ότι όλα τα δεδομένα που διέπουν τα ευρήματα είναι πλήρως διαθέσιμα χωρίς περιορισμούς. Όλα τα στοιχεία που περιλαμβάνονται στο έγγραφο

Χρηματοδότηση:. Το ερευνητικό έργο χρηματοδοτήθηκε από το Εθνικό Ίδρυμα Επιστημών χορηγεί CCF-0836649 και CCF-0926166 και Regione Lombardia (Ιταλία) στο πλαίσιο των ερευνητικών προγραμμάτων RetroNet μέσω της ASTIL [12 -4-5148000-40]? UA 053 και NEDD Έργου [ID14546A Rif SAL-7] Fondo accordi Istituzionali 2009. Οι χρηματοδότες δεν είχε κανένα ρόλο στο σχεδιασμό της μελέτης, τη συλλογή και ανάλυση των δεδομένων, η απόφαση για τη δημοσίευση, ή την προετοιμασία του χειρογράφου

Ανταγωνιστικά συμφέροντα.: οι συγγραφείς έχουν δηλώσει ότι δεν υπάρχουν ανταγωνιστικά συμφέροντα.

Εισαγωγή

ο καρκίνος είναι μια ασθένεια της εξέλιξης. έναρξης και εξέλιξης της προκαλούνται από δυναμικές σωματικές αλλαγές στο γονιδίωμα εκδηλώνεται ως σημειακές μεταλλάξεις, οι διαρθρωτικές αλλαγές, μεθυλίωση του DNA και τις αλλαγές τροποποίηση των ιστονών [1].

Αυτά τα γονιδιωματικής αλλοιώσεις που δημιουργούνται από τυχαίες διαδικασίες, και από μεμονωμένους όγκους κύτταρα ανταγωνίζονται για χώρο και πόρους, οι ισχυρότερου παραλλαγές είναι φυσικά επιλεγεί. Για παράδειγμα, εάν μέσα από κάποιες μεταλλάξεις ένα κύτταρο αποκτά την ικανότητα να αγνοήσει τα σήματα anti-ανάπτυξης από το σώμα, αυτό το κύτταρο μπορεί να ευδοκιμήσει και χάσματος, και των απογόνων του μπορεί τελικά να κυριαρχήσει κάποιο μέρος (ες) του όγκου. Αυτό το

κλωνική

επέκταση μπορεί να θεωρηθεί ως

διακριτή κατάσταση

της εξέλιξης του καρκίνου, που χαρακτηρίζεται από την απόκτηση μιας σειράς γενετικών συμβάντων. εξέλιξης του καρκίνου μπορεί τότε να θεωρηθεί ως μια ακολουθία των εν λόγω διακριτά βήματα, όπου ο όγκος αποκτά ορισμένα ξεχωριστές ιδιότητες σε κάθε κατάσταση. Διαφορετικές αλληλουχίες εξέλιξη είναι πιθανή, αλλά μερικοί είναι πιο συχνές από ό, τι άλλοι, και όχι κάθε παραγγελία είναι βιώσιμο [2].

Κατά τις δύο τελευταίες δεκαετίες, πολλές συγκεκριμένων γονιδίων και γενετικών μηχανισμών που εμπλέκονται σε διάφορους τύπους καρκίνου έχουν ταυτοποιηθεί (βλέπε π.χ. [3], [4] για μια επισκόπηση των γονιδίων κοινή μορφή καρκίνου και [5], [6] για συγκεκριμένες γενετικές αναλύσεις των ωοθηκών καρκίνωμα και αδενοκαρκίνωμα του πνεύμονα, αντίστοιχα), και

θεραπείες

με στόχο τη δραστηριότητα των γονιδίων αυτών αναπτύσσονται πλέον με ταχείς ρυθμούς [2]. Ωστόσο, δυστυχώς, η

συνάφεια και χρονικές σχέσεις

μεταξύ των γενετικών γεγονότα οδήγηση εξέλιξη του καρκίνου παραμένουν σε μεγάλο βαθμό απατηλό.

Ο κύριος λόγος για αυτή την κατάσταση είναι ότι οι πληροφορίες που αποκάλυψε στα δεδομένα συνήθως λαμβάνονται μόνο σε ένα (ή μερικά) χρονικά σημεία, και όχι κατά τη διάρκεια της νόσου. Η εξαγωγή αυτή δυναμικές πληροφορίες από τη διαθέσιμη

διατομής

δεδομένα είναι δύσκολο και απαιτείται ένας συνδυασμός μαθηματικών, στατιστικής και υπολογιστικές τεχνικές. Τα τελευταία χρόνια, αρκετές μέθοδοι για την εξαγωγή μοντέλων πρόοδο από στοιχεία διατομής έχουν αναπτυχθεί, ξεκινώντας από το σπερματικό εργασίες για μονής διαδρομής μοντέλα με Fearon and Vogelstein [7]. Ειδικότερα, διαφορετικά μοντέλα ογκογένεση δέντρα αναπτύχθηκαν όλα αυτά τα χρόνια. Στον πυρήνα μερικών από αυτές τις μεθόδους, π.χ. [8], [9], είναι η χρήση του

συσχέτιση

να προσδιορίσει τις σχέσεις μεταξύ των γενετικά συμβάντα. Αυτές οι τεχνικές ανακατασκευάσει

δέντρο

μοντέλα της εξέλιξης ως ανεξάρτητα μη κυκλικό μονοπάτια με κλαδιά και χωρίς συμβολές. Τα διαφορετικά μοντέλα της ογκογένεση δέντρα αντί να βασίζεται σε

μέγιστη πιθανότητα εκτίμησης

, π.χ., [10], [11], [12]. Πιο γενικά

Markov αλυσίδας

μοντέλα, π.χ., [13], περιγράφουν πιο ευέλικτη πιθανολογική δίκτυα, παρά το υπολογιστικά ακριβά εκτίμησης των παραμέτρων. Άλλα πρόσφατα μοντέλα είναι Συνδυαστική Bayesian Δίκτυα, CBNs [14], [15], ότι το εκχύλισμα

κατευθυνόμενος άκυκλος γράφος

, αλλά την επιβολή ειδικών περιορισμών σχετικά με την κοινή εμφάνιση των γεγονότων. Τέλος, σε ένα ελαφρώς διαφορετικό πλαίσιο, διαχρονικά μοντέλα ανακατασκευάστηκε από τα δεδομένα γονιδιακής έκφρασης χρονική πορεία [16], [17].

Στην εργασία αυτή παρουσιάζουμε ένα νέο θεωρητικό πλαίσιο που ονομάζεται CAPRESE (καρκίνος εξέλιξη Εκχύλιση με ενιαία άκρα) να ανακατασκευάσει σωρευτικές προοδευτική φαινόμενα, όπως την πρόοδο του καρκίνου. Υποθέτουμε την αρχική ρύθμιση πρόβλημα της [8], και προτείνει μια νέα τεχνική για να συμπεράνουμε

πιθανολογική δέντρα εξέλιξη

από τα δεδομένα της διατομής. Σε αντίθεση με τεχνικές εκτίμησης που βασίζονται σε μέγιστη πιθανότητα, στόχος μας είναι η εξαγωγή του

ελάχιστη

εξέλιξη μοντέλο που εξηγεί τη σειρά με την οποία συμβαίνουν μεταλλάξεις και συσσωρεύονται. Η μέθοδος είναι η τεχνολογία αγνωστικιστής, δηλαδή, μπορεί να εφαρμοστεί σε σύνολο δεδομένων που προέρχονται από όλους τους τύπους του (επι-) γενετικά δεδομένα, όπως η βαθιά αλληλουχίας exome, όξινο θειώδες αλληλουχίας, SNP συστοιχίες, κλπ, (βλέπε αποτελέσματα), και παίρνει ως είσοδο ένα . σύνολο προ-επιλεγμένο γενετικό γεγονότα των οποίων η παρουσία ή η απουσία κάθε συμβάν καταγράφεται για κάθε δείγμα

CAPRESE βασίζεται σε δύο κύρια συστατικά: αντί να χρησιμοποιούν

συσχέτιση

να συμπεράνει την εξέλιξη δομές, βασίζουμε την τεχνική μας σε μια ιδέα του

πιθανολογική αιτιώδη συνάφεια

, και να αυξήσει την αντοχή κατά του θορύβου, έχουμε υιοθετήσει μια

συρρίκνωση-όπως εκτιμητή

να μετρήσει την αιτιώδη συνάφεια μεταξύ κάθε ζεύγους των γεγονότων. Πιο συγκεκριμένα, σε σχέση με το πρώτο μας συστατικό, υιοθετούμε την ιδέα του (εκ πρώτης όψεως) την αιτιώδη συνάφεια που προτείνει Suppes στο [18]. βασική διαίσθηση του είναι απλή: συμβάν προκαλεί περίπτωση εάν συμβεί

πριν

και η εμφάνιση του

αυξάνει την πιθανότητα

παρατήρησης. Αυτή είναι μια πολύ βασική έννοια της πιθανοτικής αιτιώδη συνάφεια που από μόνη της δεν αντιμετωπίζει πολλά από τα προβλήματα που συνδέονται με αυτό (όπως ασυμμετρία, κοινές αιτίες, και διαλογή μακριά [19]), και περιλαμβάνει

πλαστή

καθώς και

γνήσιο

προκαλεί. Ωστόσο, όπως αποδεικνύεται, αυτή η βασική έννοια σε συνδυασμό με ένα φίλτρο για την ανεξάρτητη προόδους, αρχής γενομένης από την ίδια ρίζα, είναι ένα εξαιρετικό εργαλείο για να καθοδηγήσει την εξόρυξη εξέλιξη από συγχρονικά δεδομένα -. Αυτός που ξεπερνά τις μεθόδους που χρησιμοποιούνται συνήθως συσχέτισης που βασίζονται

Πιθανοθεωρητικές αιτιώδη συνάφεια χρησιμοποιήθηκε σε βιοϊατρικές εφαρμογές πριν (π.χ., για να βρείτε τα γονίδια του οδηγού από τα δεδομένα CNV στο [20], και να εξάγει τα αίτια από τα δεδομένα σειράς βιολογικών φορά στο [21]), αλλά, προς το καλύτερο της γνώσης μας ποτέ, να συμπεράνει

μοντέλα εξέλιξης

στο

απουσία

άμεση χρονική πληροφορία.

το πρόβλημα εξόρυξης περιπλέκεται από την παρουσία και των δύο ψευδώς θετικών και ψευδώς αρνητικών παρατηρήσεων (βλέπε [22] για μια συζήτηση για το θέμα αυτό με βάση την ανοικοδόμηση από [8]), όπως αυτή προβλέπεται από την εγγενή μεταβλητότητα των βιολογικών διαδικασιών (π.χ.,

γενετική ετερογένεια

) και

πειραματικά σφάλματα

. Αυτό θέτει ένα πρόβλημα, επειδή αύξηση, ενώ η πιθανότητα είναι πολύ ακριβές εργαλείο, από μόνη της, δεν είναι αρκετά ισχυρή κατά του θορύβου. Εξαρτάται από την ποσότητα του θορύβου, που θα βασίζεται τόσο στην πιθανολογική την αιτιώδη συνάφεια και σε μια πιο ισχυρή (αλλά λιγότερο ακριβής) συσχέτιση που βασίζεται μετρικούς με το βέλτιστο τρόπο. Για να γίνει αυτό έχουμε εισαγάγει δεύτερο συστατικό μας, μια

συρρίκνωση-όπως εκτιμητή

να μετρήσει την αιτιώδη συνάφεια μεταξύ κάθε ζεύγους των γεγονότων. Η διαίσθηση πίσω από αυτή εκτιμητή, η οποία συνδέεται στενά με έναν εκτιμητή συρρίκνωση από [23], είναι να βρεθεί η βέλτιστη ισορροπία μεταξύ αύξηση πιθανότητα αφενός και συσχέτιση, από την άλλη, ανάλογα με το ποσό του θορύβου.

Έχουμε αποδείξει την ορθότητα του αλγορίθμου μας, δείχνοντας ότι με την αύξηση του δείγματος μεγέθη, η ανακατασκευασμένη δέντρο συγκλίνει ασυμπτωτικά στη σωστή (Θεώρημα 3). Υπό ήπιες περιορισμούς σχετικά με τις τιμές του θορύβου, το αποτέλεσμα αυτό ισχύει και για το πρόβλημα της ανασυγκρότησης με την παρουσία ομοιόμορφων θορύβου, καθώς και.

Επίσης, μελετούν την απόδοση των CAPRESE σε πιο ρεαλιστικές ρυθμίσεις με περιορισμένο μέγεθος του δείγματος. Χρησιμοποιώντας τα συνθετικά δεδομένα, δείχνουμε ότι κάτω από αυτές τις συνθήκες, ο αλγόριθμος μας ξεπερνά τον αλγόριθμο ανακατασκευής δέντρο state-of-the-art της [8] (βλέπε αποτελέσματα). Ειδικότερα, η συρρίκνωση-όπως εκτιμητή μας παρέχει, κατά μέσο όρο, μια αυξημένη ανθεκτικότητα στο θόρυβο που εξασφαλίζει να ξεπεράσουν oncotrees [8]. Η απόδοση ορίζεται σε όρους

δομική ομοιότητα μεταξύ

ανακατασκευασμένης δέντρο και της πραγματικής δέντρο, και όχι σε επαγόμενη διανομή τους όπως γίνεται, π.χ., στο [11]. Αυτή η μέτρηση είναι ιδιαίτερα κατάλληλη για το στόχο της ανοικοδόμησης ένα μοντέλο εξέλιξης, όπου τα στοιχεία-πιθανότητα ταιριάζει είναι δευτερεύουσα σε «καλώντας» το ενδεχομένως ελάχιστο σύνολο των αιτιακών σχέσεων.

Επίσης, δείχνουμε ότι CAPRESE λειτουργεί καλά ήδη με σχετικά χαμηλός αριθμός των δειγμάτων και ότι η απόδοση του συγκλίνει γρήγορα να ασύμπτωτο του καθώς ο αριθμός των δειγμάτων αυξάνεται. Το αποτέλεσμα αυτό υπαινίσσεται την εφαρμογή του αλγορίθμου με σχετικά μικρά σύνολα δεδομένων, χωρίς να θέτει σε κίνδυνο την αποτελεσματικότητα της.

Παρατηρούμε ότι η περαιτέρω αναλύσεις για τα συνθετικά στοιχεία δείχνουν ότι CAPRESE υπερτερεί μια πολύ γνωστή Bayesian πιθανολογική γραφικό μοντέλο, καθώς (δηλαδή,

Συνδυαστική Bayesian Δίκτυα

[14], [15]), το οποίο είχε αρχικά σχεδιαστεί για την ανασυγκρότηση των πιο πολύπλοκων τοπολογιών, π.χ. ΚΑΓ, αλλά έχει αποδειχθεί αποτελεσματικό στην ανακατασκευή τοπολογίες δένδρων, καθώς και [24] (βλέπε αποτελέσματα).

Τέλος, εφαρμόζουμε την τεχνική μας σε τροποποιήσεις αξιολογούνται με δύο Συγκριτική Γονιδιωματική υβριδοποίηση και τεχνικές προσδιορισμού αλληλουχίας Next Generation (δείτε αποτελέσματα). Στην πρώτη περίπτωση, έχουμε δείξει ότι ο αλγόριθμος του [8] και CAPRESE τονίζουν βιολογικά σημαντικές διαφορές στη ωοθηκών, του γαστρεντερικού και τον καρκίνο του στόματος, αλλά συμπεράσματα μας είναι στατιστικά πιο σημαντική. Στην τελευταία, θα επικυρώσει μια πρόσφατα ανακάλυψε σχέση μεταξύ των δύο βασικών γονιδίων που εμπλέκονται στη λευχαιμία.

Μέθοδοι

Πρόβλημα ρύθμιση

Το set-up του προβλήματος ανακατασκευής έχει ως εξής . Αν υποθέσουμε ότι έχουμε μια σειρά μεταλλάξεων (

Εκδηλώσεις &, στην πιθανολογική ορολογία) και τα δείγματα, εμείς εκπροσωπούμε ένα σύνολο δεδομένων διατομής ως δυαδική μήτρα στην οποία μια καταχώρηση, αν τηρήθηκε η μετάλλαξη στο δείγμα, και το αντίθετο. Το πρόβλημα λύνουμε σε αυτό το χαρτί είναι να εξαγάγετε ένα σύνολο των ακμών αποδίδοντας την εξέλιξη

δέντρο

από αυτή την μήτρα που, παρατηρούμε, μόνο έμμεσα παρέχει πληροφορίες για το χρονοδιάγραμμα εξέλιξης. Η ρίζα του έχει ως πρότυπο τη χρήση ενός (ειδική) περίπτωση, έτσι ώστε

ετερογενή μονοπάτια εξέλιξης

ή

δάση

μπορεί να ανακατασκευαστεί. Πιο συγκεκριμένα, στοχεύουμε στην ανακατασκευή ένα

τις ρίζες δέντρων

ότι ικανοποιεί: κάθε κόμβος έχει το πολύ μια εισερχόμενη ακμή, η ρίζα δεν έχει κανένα εισερχόμενες ακμές δεν υπάρχουν

κύκλους

Η

Κάθε δέντρο της εξέλιξης υπάγει την κατανομή των παρατηρώντας ένα υποσύνολο των μεταλλάξεων σε ένα δείγμα καρκίνου που μπορεί να επισημοποιηθεί ως εξής:

Ορισμός 1. (δέντρο που προκαλείται από διανομή)

Ας

είναι ένα δέντρο και

μια λειτουργία σήμανσης που δηλώνει την ανεξάρτητη πιθανότητα κάθε άκρη,

δημιουργεί μια κατανομή όπου η πιθανότητα της παρατήρησης ενός δείγματος με το σύνολο των μεταβολών

είναι

(1)

όπου όλα τα γεγονότα σε

υποτίθεται ότι είναι προσβάσιμα από τη ρίζα

, και

είναι το σύνολο των ακμές που συνδέουν τη ρίζα στα γεγονότα της

.

η

θα ήθελα να τονίσω δύο ιδιότητες που σχετίζονται με το δέντρο που προκαλείται από τη διανομή. Πρώτον, η διανομή εντάσσει ότι, με δεδομένη οποιαδήποτε προσανατολισμένη ακμή, παρατηρήθηκε δείγμα περιέχει αλλοίωση με πιθανότητα, που είναι η πιθανότητα παρατήρησης μετά. Για το λόγο αυτό, αν αιτίες, η πιθανότητα της παρατήρησης θα είναι μεγαλύτερη από την πιθανότητα παρατήρησης ανάλογα με την αρχή της χρονικής προτεραιότητας που ορίζει ότι όλες οι αιτίες πρέπει να προηγείται, στο χρόνο, τις επιπτώσεις τους [25].

Δεύτερον, το σύνολο δεδομένων εισόδου είναι ένα σύνολο των δειγμάτων που δημιουργούνται, στην ιδανική περίπτωση, από μια άγνωστη κατανομή προκαλείται από ένα άγνωστο δέντρο ή δάσος που στοχεύουν στην ανασυγκρότηση. Ωστόσο, σε ορισμένες περιπτώσεις, θα μπορούσε να είναι ότι δεν υπάρχει δέντρο του οποίου επάγεται διανομή παράγει

ακριβώς

τα εν λόγω δεδομένα εισόδου. Όταν συμβαίνει αυτό, το σύνολο των παρατηρούμενων δείγματα αποκλίνει ελαφρώς από κάθε δέντρο που προκαλείται από τη διανομή. Να διαμορφώσει αυτές τις καταστάσεις μια ιδέα του

θόρυβος

μπορούν να εισαχθούν, η οποία εξαρτάται από το πλαίσιο στο οποίο συγκεντρώνονται τα δεδομένα. Η προσθήκη του θορύβου στο μοντέλο περιπλέκει το πρόβλημα της ανασυγκρότησης (βλέπε αποτελέσματα).

Το

oncotree

προσέγγιση.

[8] Desper

et al.

αναπτύξει μια μέθοδο για να εξαγάγετε τα δέντρα εξέλιξη, που ονομάζεται

«oncotrees»

, από στατικά δεδομένα CNV. Στο [22] Szabo

et al.

Επέκτεινε τη ρύθμιση του προβλήματος της ανασυγκρότησης Desper να αντιπροσωπεύουν τόσο

false positives

και

αρνητικά

στα δεδομένα εισόδου. Σε αυτές τις oncotrees, οι κόμβοι αντιπροσωπεύουν γεγονότα CNV και ακμές αντιστοιχούν σε πιθανές ακολουθίες από το ένα συμβάν στο επόμενο.

Το πρόβλημα της ανασυγκρότησης είναι ακριβώς όπως περιγράφεται παραπάνω, και κάθε δέντρο έχει τις ρίζες της στην ειδική περίπτωση. Η επιλογή των οποίων άκρη για να συμπεριλάβει σε ένα δέντρο βασίζεται στον εκτιμητή (2), η οποία αναθέτει σε κάθε άκρη ένα βάρος που αντιπροσωπεύουν τόσο τις σχετικές και κοινές συχνότητες των γεγονότων – μετρώντας έτσι

συσχέτιση

. Ο εκτιμητής αξιολογείται μετά συμπεριλαμβανομένων σε κάθε δείγμα του συνόλου δεδομένων. Σε αυτό τον ορισμό το δεξιότερο όρος είναι η (συμμετρική)

πιθανότητα αναλογία

για και εμφανίζονται μαζί, ενώ το πιο αριστερό είναι η ασύμμετρη

χρονική

προτεραιότητα μετράται με ποσοστό εμφάνισης. Αυτή η έμμεση μορφή χρονισμού υποθέτει ότι, σε περίπτωση που προκύψει

πιο συχνά από ό, τι

, τότε αυτό συμβαίνει πιθανότατα

νωρίτερα

, ικανοποιώντας έτσι

Μια oncotree είναι το δέντρο με ρίζα των οποίων το συνολικό βάρος ( δηλαδή, άθροισμα όλων των βαρών των ακμών) μεγιστοποιείται, και μπορεί να ανακατασκευαστεί σε βήματα χρησιμοποιώντας αλγόριθμο Edmond [26]. Εκ κατασκευής, το γράφημα που προκύπτει είναι ένα κατάλληλο δέντρο ρίζες στην: κάθε συμβάν εμφανίζεται μόνο μία φορά,

συρροές

απουσιάζουν, δηλαδή, οποιοδήποτε γεγονός που προκαλείται από το πολύ ένα άλλο γεγονός. Αυτή η μέθοδος έχει χρησιμοποιηθεί για να αντλήσει προόδους για διάφορα καρκίνο σύνολα δεδομένων, π.χ., [27], [28], [29]), και ακόμα κι αν πολλές μέθοδοι που εκτείνονται υπάρχει αυτό το πλαίσιο (π.χ. [9], [11], [15] ), για το καλύτερο της γνώσης μας, είναι σήμερα η μόνη μέθοδος που αποσκοπεί στην επίλυση ακριβώς το ίδιο πρόβλημα με εκείνο που διερευνώνται στην παρούσα εργασία και ως εκ τούτου παρέχει ένα σημείο αναφοράς για να συγκρίνουν κατά.

μια πιθανολογική προσέγγιση για την αιτιώδη συνάφεια

Εξετάζουμε εν συντομία την προσέγγιση για την πιθανολογική αιτιώδη συνάφεια, στην οποία βασίζεται η μέθοδος μας. Για μια εκτενή συζήτηση για το θέμα αυτό παραπέμπουμε στο [19].

Στη δημιουργική εργασία του [18], Suppes προτείνει την ακόλουθη έννοια.

Ορισμός 2. (Πιθανοτικοί την αιτιώδη συνάφεια, [18] ).

Για οποιεσδήποτε δύο γεγονότα

και

, που συμβαίνουν αντίστοιχα κατά καιρούς

και

, σύμφωνα με τις ήπιες παραδοχές που

, η εκδήλωση

είναι μια εκ πρώτης όψεως, αιτία του συμβάντος

αν συμβεί πριν από το αποτέλεσμα και η αιτία αυξάνει την πιθανότητα του φαινομένου, δηλαδή,

(3)

Όπως αναφέρεται στο [19] τις παραπάνω προϋποθέσεις δεν είναι, σε γενικές γραμμές, αρκεί να ισχυρίζονται ότι το γεγονός είναι μια αιτία του συμβάντος. Στην πραγματικότητα, μια εκ πρώτης όψεως, αιτία είναι είτε

γνήσιο

ή

πλαστή

. Στην τελευταία περίπτωση, το γεγονός ότι οι όροι κατέχουν τις παρατηρήσεις οφείλεται είτε σε σύμπτωση ή σε παρουσία ενός ορισμένων τρίτων

συγχητικές παράγοντας

, συνδέεται τόσο με και σε [18]. Γνήσια αιτίες, αντ ‘αυτού, να πληρούν Ορισμός 2 και δεν ελέγχονται-off από κάθε παράγοντας σύγχυσης. Ωστόσο, δεν χρειάζεται να είναι άμεσες αιτίες. Δείτε το Σχήμα 1.

Παράδειγμα εκ πρώτης όψεως τοπολογία όπου όλες οι ακμές αντιπροσωπεύουν εκ πρώτης όψεως αιτίες, σύμφωνα με Ορισμός 3: είναι μια πιθανότητα άντλησης κεφαλαίων της και αυτό συμβαίνει πιο συχνά. Στην αριστερά, μπορούμε να φιλτράρει τα ψευδείς αιτίες και να επιλέξετε μόνο τα αληθινά από τα γνήσια, δίνοντας μια ενιαία αιτία τοπολογία, εκ πρώτης όψεως.

Η

Σημειώστε ότι θεωρούμε δεδομένα της διατομής, όπου δεν υπάρχουν πληροφορίες σχετικά και είναι διαθέσιμα, έτσι ώστε το περιβάλλον ανασυγκρότηση μας περιορίζονται να λαμβάνεται υπόψη μόνο η

πιθανότητα αύξησης

(PR) ιδιοκτησίας, δηλαδή,, γεγονός που καθιστά δυσκολότερη τη διάκριση μεταξύ πραγματικής και ψευδείς αιτίες. Τώρα έχουμε αναθεωρήσει κάποιες από τις ιδιότητές του.

Πρόταση 1. (Εξάρτηση).

Όποτε η

PR

κατέχει μεταξύ δύο γεγονότων

και

, τότε τα γεγονότα

στατιστικά εξαρτάται

με τη θετική έννοια, δηλαδή,

(4)

Αυτή και η επόμενη πρόταση είναι καλά γνωστά γεγονότα του PR? παραγωγής τους, καθώς και οι αποδείξεις για όλα τα αποτελέσματα που παρουσιάζουμε είναι στη S1 αρχείου. Παρατηρήστε ότι το αντίθετο εμμέσως κατέχει, καθώς: όταν τα γεγονότα και εξακολουθούν να εξαρτώνται, αλλά σε μια αρνητική έννοια, δηλαδή, το PR δεν κατέχει, δηλαδή,

Θα θέλαμε να χρησιμοποιήσετε την ασυμμετρία του PR. να καθοριστεί αν ένα ζευγάρι των γεγονότων και να ικανοποιήσει μια σχέση αιτιώδους συνάφειας, ώστε να πραγματοποιηθεί πριν από το δέντρο της εξέλιξης, αλλά, δυστυχώς, το PR ικανοποιεί την ακόλουθη ιδιότητα.

Πρόταση 2. (αμοιβαία PR). .

Δηλαδή, εάν αυξάνει την πιθανότητα παρατήρησης, τότε αυξάνει την πιθανότητα παρατήρησης πάρα πολύ.

Ωστόσο, προκειμένου να καθορίσουν τα αίτια και τα αποτελέσματα μεταξύ των γενετικά γεγονότα, μπορούμε να χρησιμοποιήσουμε μας

βαθμός εμπιστοσύνης

στην εκτίμηση μας της πιθανότητας αύξησης να αποφασίσει την κατεύθυνση της σχέσης αιτιώδους συνάφειας μεταξύ των ζευγών των γεγονότων. Με άλλα λόγια, εάν αυξάνει την πιθανότητα

περισσότερα

από τον άλλο τρόπο γύρω, τότε είναι πιο πιθανή αιτία της παρά. Παρατηρήστε ότι αυτό είναι να ακούγεται όσο κάθε περίπτωση έχει

σε πιο

μια αιτία? Αλλιώς,

συχνές αργά γεγονότα

με περισσότερες από μία αιτίες, οι οποίες είναι μάλλον κοινά σε βιολογικά προοδευτική φαινόμενα, θα πρέπει να αντιμετωπίζονται με διαφορετικό τρόπο. Όπως αναφέρθηκε, το PR δεν είναι συμμετρική, και το

κατεύθυνση

της ευαισθητοποίησης πιθανότητας εξαρτάται από τις σχετικές συχνότητες των γεγονότων. Κάνουμε αυτή την ασυμμετρία ακρίβεια στην παρακάτω πρόταση.

Πρόταση 3. (αύξηση Πιθανοτήτων και χρονικής προτεραιότητας).

Για οποιεσδήποτε δύο γεγονότα

και

έτσι ώστε η αύξηση της πιθανότητας

κατέχει, έχουμε

(5)

Δηλαδή, δεδομένου ότι το PR κατέχει μεταξύ δύο γεγονότων, αυξάνει την πιθανότητα

περισσότερα

από αυξάνει την πιθανότητα, αν και μόνο αν παρατηρείται πιο συχνά από ό, τι. Παρατηρήστε ότι χρησιμοποιούμε το λόγο για να αξιολογήσει την ανισότητα PR. Η απόδειξη της πρότασης αυτής είναι η τεχνική και μπορεί να βρεθεί στο S1 αρχείου. Από αυτό το αποτέλεσμα προκύπτει ότι, αν μετράμε τον χρόνο της εκδήλωσης από το ρυθμό της εμφάνισής της (δηλαδή, σημαίνει ότι θα συμβεί πριν), αυτή η έννοια του PR υποτάσσει την ίδια έννοια της χρονικής προτεραιότητας που προκαλείται από ένα δέντρο. Μπορούμε επίσης να σημειώσουμε ότι αυτή είναι και η χρονική προτεραιότητα αναφέρεται ρητά στους συντελεστές της μεθόδου Desper του. Λαμβάνοντας υπόψη αυτά τα αποτελέσματα, ορίζουμε την ακόλουθη έννοια της αιτιώδους συνάφειας.

Ορισμός 3.

Έχουμε δηλώσει ότι

είναι μια εκ πρώτης όψεως, αιτία

αν

είναι μια πιθανότητα άντλησης κεφαλαίων των

, και αυτό συμβαίνει πιο συχνά:

η

Εμείς όρο

, εκ πρώτης όψεως τοπολογία

ένα κατευθυνόμενο άκυκλο γράφημα (πάνω από ορισμένες εκδηλώσεις) όπου κάθε ακμή αντιπροσωπεύει μια εκ πρώτης όψεως, αιτία. Όταν το πολύ ένα μόνο εισερχόμενη ακμή έχει εκχωρηθεί σε κάθε περίπτωση (δηλαδή, ένα συμβάν έχει το πολύ ένα

μοναδική αιτία

, στον πραγματικό κόσμο), ονομάζουμε αυτή τη δομή

μόνο αιτία τοπολογία εκ πρώτης όψεως

. Διαισθητικά, η τελευταία αυτή κατηγορία τοπολογίες αντιστοιχούν στα δέντρα ή, γενικότερα, τα δάση όταν έχουν αποσυνδεθεί συστατικά, ότι στοχεύουμε στην ανακατασκευή.

Πριν προχωρήσουμε στην εισαγωγή αλγόριθμο μας, ας συζητήσουμε τον ορισμό μας για

αιτιώδη συνάφεια

, ο ρόλος της στον ορισμό του προβλήματος ανακατασκευής και μερικά από τα όριά της. Όπως έχει ήδη αναφερθεί, μπορεί να είναι ότι για ορισμένα εκ πρώτης όψεως αιτία ενός γεγονότος, υπάρχει ένα τρίτο συμβάν πριν από τα δύο, έτσι ώστε αιτίες και τελικά προκαλεί. Εναλλακτικά, μπορεί να προκαλέσει τόσο και ανεξάρτητα, και η σχέση αιτιώδους συνάφειας που παρατηρείται από το να είναι απλώς

πλαστή

. Στο πλαίσιο του προβλήματος δέντρο-ανασυγκρότηση, δηλαδή όταν γίνεται η παραδοχή ότι κάθε συμβάν έχει το πολύ μια μοναδική αιτία, ο στόχος είναι να συγκρατούν τα παρασιτικά άκρες από μια τοπολογία όψεως γενική prima, έτσι για την εξαγωγή ενός μονού αιτία εκ πρώτης όψεως δομή (βλέπε Εικόνα 1).

Ορισμός 3 συνοψίζει Suppes βασική έννοια της εκ πρώτης όψεως, αιτία, ενώ αγνοεί βαθύτερη συζητήσεις της αιτιώδους συνάφειας που στοχεύουν στη διάκριση μεταξύ της πραγματικής γνήσια και πλαστά αιτίες, π.χ. διαλογής-off, το πλαίσιο φόντο, d-διαχωρισμού [30], [31], [19]. Για ωστόσο τους σκοπούς μας, ο ανωτέρω ορισμός είναι επαρκής, όταν όλα τα σημαντικά γεγονότα θεωρούνται, δηλαδή, όλα τα γνήσια αιτίες που παρατηρούνται, όπως σε ένα κλειστό κόσμο παραδοχή, και στοχεύουμε στην εξαγωγή της παραγγελίας

της εξέλιξης μεταξύ των τους (είτε να διαπιστώσει ότι δεν υπάρχει προφανής σχέση), παρά την εξόρυξη αιτιώδους συνδέσμου

per se

. Σημειώστε ότι αυτές οι υποθέσεις είναι ισχυρή και θα μπορούσε να αποδυναμωθεί στο μέλλον (βλ συζητήσεις), αλλά μοιράζονται από εμάς και [8].

Τέλος, υπενθυμίζουμε μερικές αλγεβρικές απαιτήσεις που είναι αναγκαίες για μας πλαίσιο να είναι καλά οριστεί. Πρώτα απ ‘όλα, το PR πρέπει να είναι υπολογίσιμη: κάθε μετάλλαξης θα πρέπει να τηρούνται με πιθανότητα αυστηρά. Επιπλέον, χρειαζόμαστε κάθε ζευγάρι των μεταλλάξεων να είναι

διακρίνονται

από την άποψη του PR, δηλαδή, για κάθε ζεύγος των μεταλλάξεων και, ή παρόμοια με την παραπάνω κατάσταση. Οποιαδήποτε μη διακρίνονται ζευγάρι γεγονότα μπορούν να συγχωνευθούν ως μία σύνθετη εκδήλωση. Από τώρα και στο εξής, θα υποθέσουμε αυτές οι προϋποθέσεις που πρέπει να ελέγχονται.

μέτρηση των επιδόσεων και συνθετικά σύνολα δεδομένων

Κάναμε χρήση του

συνθετικά στοιχεία

για την αξιολόγηση της απόδοσης των CAPRESE ως συνάρτηση του μεγέθους του συνόλου δεδομένων και των ψευδώς θετικών και αρνητικών επιτοκίων. Πολλές ξεχωριστές συνθετικά σύνολα δεδομένων δημιουργήθηκαν για το σκοπό αυτό, όπως εξηγείται παρακάτω. απόδοση του αλγορίθμου μετρήθηκε σε όρους

Δέντρο Επεξεργασία Απόσταση

(TED, [32]), δηλαδή, η ακολουθία ελάχιστου κόστους του κόμβου επεξεργασίας εργασιών (επισήμανση, επανεπισήμανση, διαγραφή και εισαγωγή), η οποία μετατρέπει τα ανακατασκευασμένα δέντρα σε η αυτοί παραγωγή των δεδομένων. Η επιλογή αυτού του μέτρου της αξιολόγησης αιτιολογείται από το γεγονός ότι μας ενδιαφέρει το

δομή

πίσω από την προοδευτική φαινόμενο της εξέλιξης του καρκίνου και, ειδικότερα, μας ενδιαφέρει σε ένα μέτρο από τα γνήσια αιτίες που μας λείπει και των πλαστές αιτίες που αποτυγχάνουν να αναγνωρίσουν (και να εξαλείψει). Επίσης, δεδομένου ότι τοπολογίες με παρόμοιες κατανομές μπορεί να είναι δομικά διαφορετικά έχουμε επιλέξει να μετρήσει τις επιδόσεις μέσω των διαρθρωτικών απόσταση και όχι μια απόσταση από την άποψη των διανομών. Μέσα στη σφαίρα των «διαρθρωτικών μετρήσεις», ωστόσο, έχουμε αξιολογήσει επίσης την απόδοση με το

Hamming Απόσταση

[33], ένα άλλο που χρησιμοποιούνται συνήθως διαρθρωτικές μετρική, και μας δόθηκαν ανάλογες αποτελέσματα (δεν φαίνεται εδώ).

Συνθετικά την παραγωγή δεδομένων και πειραματική ρύθμιση.

τα συνθετικά σύνολα δεδομένων δημιουργήθηκαν με δειγματοληψία από διάφορα τυχαία δέντρα αναγκάζεται να έχουν βάθος, αφού ευρύ κλάδοι είναι πιο δύσκολο να ανασυνθέσει από ευθεία μονοπάτια, και με δειγματοληψία πιθανοτήτων εκδήλωσης στο (βλέπε αρχείο S1).

Εκτός αν ορίζεται ρητά, σε όλα τα πειράματα χρησιμοποιήθηκαν διακριτή τυχαία δέντρα (ή τα δάση, ανάλογα με τη δοκιμή για την εκτέλεση) των γεγονότων η κάθε μία. Αυτό φαίνεται μια αρκετά λογική σειρά των γεγονότων και είναι σύμφωνη με το συνηθισμένο μέγεθος της ανακατασκευασμένης δέντρα, π.χ. [34], [35], [36], [37]. Η

επεκτασιμότητα

των τεχνικών δοκιμάστηκε κατά τον αριθμό των δειγμάτων από που κυμαίνονται από σε, με ένα βήμα, και από την αντιγραφή ανεξάρτητα σύνολα δεδομένων για κάθε ρύθμιση παραμέτρων (βλέπε την λεζάντα των στοιχείων για λεπτομέρειες).

Θα περιλαμβάνεται μια μορφή

θόρυβος

στη δημιουργία των συνόλων δεδομένων, προκειμένου να λογοδοτήσει για τη ρεαλιστική παρουσία του

βιολογικών

θορύβου (όπως αυτή που παρέχεται από μεταλλάξεις των παρευρισκομένων, η γενετική ετερογένεια , κλπ) και

πειραματικά σφάλματα

. Μια παράμετρος θόρυβο υποδηλώνει την πιθανότητα ότι κάθε περίπτωση αναλαμβάνει μια τυχαία τιμή (με ομοιόμορφη πιθανότητα), μετά τη δειγματοληψία, από το δέντρο που προκαλείται από τη διανομή. Αλγοριθμικά αυτή η διαδικασία δημιουργεί, κατά μέσο όρο, τυχαία καταχωρήσεις σε κάθε δείγμα (π.χ. με έχουμε, κατά μέσο όρο, ένα λάθος ανά δείγμα). Θέλουμε να εκτιμηθεί κατά πόσον αυτά τα θορυβώδη δείγματα μπορούν να παραπλανήσουν τη διαδικασία ανασυγκρότησης, ακόμη και για χαμηλές τιμές. Παρατηρήστε ότι υποθέτοντας μια ομοιόμορφα κατανεμημένη ενδέχεται να εμφανιστεί θόρυβος απλοϊκή δεδομένου ότι ορισμένα γεγονότα μπορεί να είναι πιο ισχυρή, ή εύκολο να μετρηθεί, από ό, τι άλλοι. Ωστόσο, με την εισαγωγή των δεδομένων τόσο

false positives

(σε ποσοστό) και

αρνητικά

(σε ποσοστό) καθιστά το πρόβλημα συμπέρασμα ουσιαστικά πιο δύσκολο, και για πρώτη φορά ερευνήθηκε στο [22].

στην ενότητα Αποτελέσματα, αναφερόμαστε σε σύνολα δεδομένων που δημιουργούνται με το ρυθμό όπως θορυβώδη συνθετικό σύνολο δεδομένων. Στα αριθμητικά πειράματα, συνήθως επιλύονται με, (δηλαδή, θόρυβος).

Αποτελέσματα

Εξαγωγή δέντρα εξέλιξη με αύξηση πιθανότητας και συρρίκνωσης-όπως εκτιμητής

Η ανασυγκρότηση CAPRESE μέθοδος περιγράφεται στον αλγόριθμο 1. ο αλγόριθμος είναι παρόμοια με Desper και αλγόριθμο Szabo του, η κύρια διαφορά είναι μια εναλλακτική λειτουργία του βάρους βασίζεται σε μια συρρίκνωση-όπως εκτιμητής

αλγόριθμος 1. CAPRESE:. ένα δέντρο-όπως ανακατασκευή με α. συρρίκνωση-όπως εκτιμητής

1: εξετάσουμε μια σειρά γενετικών συμβάντων καθώς και μια ειδική εκδήλωση, προστίθεται σε κάθε δείγμα του συνόλου δεδομένων?

2: ορίζουν ένα πλέγμα, όπου κάθε καταχώρηση περιλαμβάνει τη συρρίκνωση -όπως εκτιμητή σύμφωνα με την παρατηρούμενη πιθανότητα των γεγονότων και?

3: [PR αιτιώδη συνάφεια] ορίζουν ένα δέντρο όπου για αν και μόνο αν:

4: [Ανεξάρτητη φίλτρο προόδους] ορίζουν, αντικαταστήσει άκρη με άκρη, αν, για όλους, που κατέχει

Η

Ορισμός 4. (Συρρίκνωση-όπως εκτιμητής).

Ορίζουμε

τη συρρίκνωση-όπως εκτιμητής

της εμπιστοσύνης στη σχέση αιτιώδους συνάφειας από

για να

όπως

(6)

όπου

και

(7)

Αυτή η εκτιμήτρια είναι παρόμοια στο πνεύμα με έναν εκτιμητή συρρίκνωση (βλέπε [23]) και συνδυάζει μια κανονικοποιημένη εκδοχή του PR, το

πρώτες εκτιμήσεις

, με ένα

συντελεστής διόρθωσης

(στην περίπτωσή μας μια συσχέτιση που βασίζεται σε μέτρο της χρονικής απόστασης μεταξύ των γεγονότων), να ορίσει μια σωστή σειρά με την εμπιστοσύνη του κάθε σχέση αιτιώδους συνάφειας. Μας είναι η ανάλογη της

συντελεστή συρρίκνωσης

και μπορεί να έχει μια Bayesian ερμηνεία με βάση τη δύναμη της πίστης μας ότι και είναι αιτιολογικά σχετικό με το ένα το άλλο και τα αποδεικτικά στοιχεία που αυξάνει την πιθανότητα. Σε περίπτωση απουσίας ενός λύση κλειστού τύπου για τη βέλτιστη τιμή του, μπορεί κανείς να επικαλεστεί διασταυρωμένης επικύρωσης των προσομοιωμένων δεδομένων. Η δύναμη της συρρίκνωσης (και συρρίκνωση-όπως εκτιμητή μας) έγκειται στη δυνατότητα προσδιορισμού μια βέλτιστη τιμή για να εξισορροπήσει την επίδραση του συντελεστή διόρθωσης για την εκτίμηση των πρώτων μοντέλο για να εξασφαλιστεί η βέλτιστη παραστάσεις σε κακή θέτει περιπτώσεις του προβλήματος συμπέρασμα. Μια κρίσιμη διαφορά, όμως, μεταξύ εκτιμητή μας και κλασική συρρίκνωση, είναι ότι εκτιμητής μας στοχεύει στη βελτίωση της απόδοσης της συνολικής διαδικασίας ανασυγκρότησης

, δεν περιορίζεται στην απόδοση του ίδιου του εκτιμητή όπως συμβαίνει σε συρρίκνωση. Δηλαδή, η μετρική επάγει μια παραγγελία με τα γεγονότα που αντανακλά την εμπιστοσύνη μας για την αιτιώδη συνάφεια τους. Επιπλέον, από τη στιγμή που δεν κάνουν καμία υπόθεση για την υποκείμενη κατανομή, μπορούμε να μάθουμε εμπειρικά από διασταυρωμένης επικύρωσης. Στις επόμενες ενότητες θα δείξουμε ότι η συρρίκνωση που μοιάζει εκτιμητής είναι ένας αποτελεσματικός τρόπος για να πάρετε μια τέτοια παραγγελία, ιδίως όταν τα δεδομένα είναι θορυβώδεις. Σε CAPRESE χρησιμοποιούμε ένα ζεύγη έκδοση μήτρα του εκτιμητή.

Η πρώτη εκτιμήτριας και ο συντελεστής διόρθωσης.

Με την εξέταση μόνο την πρώτη εκτιμητή, θα περιλαμβάνει μια άκρη στο δέντρο συνέπεια, σύμφωνα με των Ορισμός 3 (Μέθοδοι) και αν είναι η καλύτερη raiser πιθανότητα. Όταν τα γεγονότα και είναι δυσδιάκριτες από την άποψη της χρονικής προτεραιότητας, έτσι δεν είναι επαρκής για να αποφασίσει αιτιώδη σχέση τους, εφόσον υπάρχουν. Αυτό εγγενής ασάφεια είναι απίθανο στην πράξη, ακόμη και αν, κατ ‘αρχήν, είναι δυνατό. Παρατηρήστε ότι αυτή η διατύπωση είναι μια μονότονη κανονικοποιημένη εκδοχή της αναλογίας PR.

Πρόταση 4. (μονότονη κανονικοποίηση).

Για οποιεσδήποτε δύο γεγονότα

και

έχουμε

(8)

Αυτή η ακατέργαστη μοντέλο εκτιμητή ικανοποιεί: όταν τείνει να το ζεύγος των γεγονότων εμφανίζονται disjointly (δηλαδή, εμφανίζουν ένα αντι- πρότυπο αιτιώδη συνάφεια), όταν αυτό τείνει να μη αιτιώδη συνάφεια ή αντι- αιτιώδη συνάφεια μπορεί να συναχθεί και τα δύο γεγονότα είναι στατιστικά ανεξάρτητα και, όταν αυτό τείνει να, η σχέση με την αιτιώδη συνάφεια μεταξύ των δύο γεγονότων είναι γνήσιο. Ως εκ τούτου, παρέχει μια ποσοτικοποίηση του βαθμού εμπιστοσύνης για μια σχέση PR αιτιώδη συνάφεια. Στην πραγματικότητα, για κάθε δεδομένη πιθανή άκρη την αιτιώδη συνάφεια, ο όρος δίνει μια εκτίμηση του

ποσοστό σφάλματος

του, ως εκ τούτου, ο αριθμητής της πρώτης μοντέλο παρέχει μια εκτίμηση του πόσο συχνά είναι στην πραγματικότητα που προκαλείται από. Ο εκτιμητής είναι τότε κανονικοποιούνται να κυμαίνεται μεταξύ και.

Ωστόσο, δεν παρέχει ένα γενικό κριτήριο για την αποσαφήνιση μεταξύ γνήσια αιτίες ενός δεδομένου γεγονότος. Δείχνουμε μια ειδική περίπτωση κατά την οποία δεν είναι επαρκής εκτιμητή. Ας εξετάσουμε, για παράδειγμα, μια αιτιώδη γραμμική πορεία:. Σε αυτήν την περίπτωση, κατά την αξιολόγηση των υποψήφιων γονέων και έχουμε:, οπότε και είναι γνήσια αιτίες της, αν και θα θέλαμε να επιλέξετε, αντί του.

You must be logged into post a comment.