
Το θεώρημα του Bayes
Η παραπάνω εξίσωση εκφράζει το θεώρημα του Bayes που μαθαίνουν όλοι οι πρωτοετείς φοιτητές των θετικών επιστημών. Διατυπώθηκε από τον Άγγλο μαθηματικό και πρεσβυτεριανό ιερέα Τόμας Μπέυζ (Thomas Bayes 1701–1761). Επρόκειτο για μια νέα προσέγγιση σε ένα θεμελιώδες αίνιγμα: πως να προχωρήσεις αντίστροφα από τις παρατηρήσεις στα κρυφά αίτια όταν οι πληροφορίες που έχεις είναι ελλιπείς. Το θεώρημα αναπτύχθηκε περαιτέρω από τον Pierre-Simon Laplace, που δημοσίευσε τη μοντέρνα διατύπωση το 1812 στο βιβλίο του «Théorie analytique des probabilités». Μάλιστα χρησιμοποίησε το θεώρημα για να εκτιμήσει την μάζα του πλανήτη Κρόνου. Έτσι, ο Laplace ήταν ένας από τους πρώτους «Μπεϋζιανούς» στατιστικολόγους.
Σύμφωνα με τον John Horgan, (από το άρθρο του στο Scientific American με τίτλο «Bayes’s Theorem: What’s the Big Deal?» ), οι Μπεϋζιανές στατιστικές εμφανίζονται παντού, από τη φυσική μέχρι την έρευνα για τον καρκίνο, από την οικολογία μέχρι την ψυχολογία. Οι φυσικοί έχουν προτείνει Μπεϋζιανές ερμηνείες της κβαντομηχανικής αλλά και Μπεϋζιανά επιχειρήματα υπέρ της θεωρίας των χορδών και των πολυσυμπάντων.
Οι φιλόσοφοι υποστηρίζουν ότι η επιστήμη στο σύνολό της μπορεί να ιδωθεί ως μια Μπεϋζιανή διαδικασία και ότι το θεώρημα Bayes μπορεί να διακρίνει ανάμεσα στην επιστήμη και την ψευδο-επιστήμη με μεγαλύτερη ακρίβεια από την αρχή της διαψευσιμότητας, της μεθόδου που υποστηρίχθηκε από τον Karl Popper.
Οι ερευνητές της τεχνητής νοημοσύνης, συμπεριλαμβανομένων των σχεδιαστών των αυτό-κινούμενων οχημάτων της Google, χρησιμοποιούν Μπεϋζιανό λογισμικό, για να βοηθήσουν τις μηχανές να αναγνωρίσουν δομές και να παίρνουν αποφάσεις. Τα Μπεϋζιανά προγράμματα, σύμφωνα με την Sharon Bertsch McGrayne , συγγραφέα του βιβλίου «The Theory That Would Not Die», αναγνωρίζουν τα spam στα e-mail, εκτιμούν τους κινδύνους στην ιατρική και την κρατική ασφάλεια και μεταξύ άλλων αποκωδικοποιούν και το DNA. Στον ιστότοπο edge.org,ο νομπελίστας φυσικός John Mather ανησυχεί για το ότι οι Μπεϋζιανές μηχανές μπορεί να γίνουν τόσο ευφυείς που θα κάνουν τους ανθρώπους άχρηστους.
Ερευνητές της γνωσιακής επιστήμης εικάζουν ότι οι εγκέφαλοί μας ενσωματώνουν Μπεϋζιανούς αλγορίθμους για να αντιλαμβάνονται, να προμελετούν και να αποφασίζουν. Τον περασμένο Νοέμβριο, επιστήμονες και φιλόσοφοι διερεύνησαν αυτή τη δυνατότητα σε ένα συνέδριο στο Πανεπιστήμιο της Νέας Υόρκης που είχε ως θέμα το ερώτημα: «Είναι ο εγκέφαλος Μπεϋζιανός;».
Οι φανατικοί επιμένουν πως αν οι περισσότεροι από μας συνειδητά υιοθετήσουν την Μπεϋζιανή λογική (σε αντίθεση με την ασυνείδητη Μπεϋζιανή διαδικασία που υποτίθεται χρησιμοποιούν οι εγκέφαλοί μας), τότε ο κόσμος μας θα ήταν πολύ καλύτερος.

O Sheldon Cooper στο τηλεοπτικό σίριαλ Big Bang Theory χρησιμοποιεί το θεώρημα του Bayes
Όσον αφορά την κατανόηση του θεωρήματος του Bayes, ο Horgan θεωρεί πολύ χρήσιμο το δοκίμιο, “An Intuitive Explanation of Bayes’ Theorem”, του θεωρητικού της τεχνητής νοημοσύνης Eliezer Yudkowsky, την παρουσίαση του θεωρήματος στη Wikipedia, αλλά και την σύντομη παρουσίαση του φιλοσόφου Curtis Brown.
Όμως και ο ίδιος επιχειρεί στο άρθρο του να εξηγήσει τα σχετικά με το θεώρημα Bayes, και μάλιστα όπως αναφέρει … κυρίως για το δικό του όφελος!
Δίνει λοιπόν το συνηθισμένο παράδειγμα εφαρμογής του θεωρήματος στην ιατρική:
Έστω ότι κάνατε ένα τεστ για μια ασθένεια Α που οι στατιστικές δείχνουν ότι προσβάλλεται 1 στους 100 ανθρώπους της ηλικίας σας. Αν το τεστ ήταν 100% αξιόπιστο, τότε δεν θα χρειαζόταν το θεώρημα του Bayes.
Όμως, τα ιατρικά τεστ διάγνωσης ποτέ δεν είναι 100% αξιόπιστα (τουλάχιστον μέχρι σήμερα). Ας πούμε λοιπόν πως το τεστ διάγνωσης της ασθένειας Α είναι 90% αξιόπιστο. Που σημαίνει ότι 90 στους 100 ανθρώπους που έχουν την ασθένεια Α βρίσκονται θετικοί στο τεστ, και 90 στους 100 ανθρώπους που δεν έχουν προσβληθεί από την εν λόγω ασθένεια βρίσκονται αρνητικοί στο τεστ.
Έστω ότι κάνετε το τεστ και βγήκε θετικό. Ποια είναι η πιθανότητα να έχετε προσβληθεί από την ασθένεια Α;
Ενώ η πρώτη απάντηση που έρχεται στο μυαλό των περισσότερων είναι 90% ή κάπου εκεί κοντά σ’ αυτό το νούμερο, η εφαρμογή του θεωρήματος Bayes δίνει ένα αναπάντεχο αποτέλεσμα: 8,33% !!
Ας δούμε γιατί, αφού πρώτα υιοθετήσουμε τον παρακάτω συμβολισμό:
Ρ(Α) = η πιθανότητα ένα άτομο της ηλικίας σας να προσβληθεί από την ασθένεια Α = 1/100 = 0,01
Ρ(Υ) = η πιθανότητα ένα άτομο της ηλικίας σας να μην έχει προσβληθεί από την ασθένεια = 99/100 = 0,99
Ρ(Θ|Α) = η πιθανότητα το τεστ να είναι θετικό για ένα άτομο που φέρει την ασθένεια = 90/100 = 0,9
Ρ(Θ|Υ) = η πιθανότητα το τεστ να είναι θετικό για ένα άτομο που είναι υγιές = 10/100 = 0,1
και Ρ(Α|Θ) = το ζητούμενο, η πιθανότητα ένα άτομο που βρέθηκε θετικό στο τεστ να έχει προσβληθεί πράγματι από την ασθένεια Α.
Tότε, σύμφωνα με το θεώρημα του Bayes θα έχουμε: Το αποτέλεσμα γίνεται πιο κατανοητό με το παρακάτω διάγραμμα:
Βλέπουμε ότι σε σύνολο 90 + 990 = 1080 ατόμων που βγήκαν θετικοί στο τεστ, μόνο οι 90 πάσχουν από την ασθένεια οπότε: Ρ(Α|Θ) = 90/1080 =0,083.
Το ενδεχόμενο κατάχρησης του θεωρήματος αρχίζει από την εκ των προτέρων εκτίμηση της πιθανότητας Ρ(A), που συχνά καλείται «prior». Στο παράδειγμα της ασθένειας Α θεωρήσαμε την τιμή 0,01. Το ζήτημα είναι πως προκύπτει αυτή η εκτίμηση – ότι δηλαδή 1 στους 100 ανθρώπους μιας συγκεκριμένης ηλικίας προσβάλλονται από την συγκεκριμένη ασθένεια…. Σε πολλές περιπτώσεις η εκτίμηση της εκ των προτέρων πιθανότητας περιέχει υποκειμενικούς παράγοντες. Η εκτίμηση αυτής της πιθανότητας – όχι για την εκδήλωση μιας αρρώστιας – αλλά για κάτι που ίσως δεν υπάρχει όπως τα πολυσύμπαντα, την πληθωριστική διαδικασία του σύμπαντος ή τον Θεό και στη συνέχεια η εφαρμογή του θεωρήματος προωθεί την ψευδο-επιστήμη και την δεισιδαιμονία.
Στο θεώρημα του Bayes βρίσκεται ενσωματωμένο ένα ηθικό μήνυμα: αν δεν είστε σχολαστικός στην αναζήτηση εναλλακτικών ερμηνειών για τα δεδομένα σας, τότε τα δεδομένα σας θα επιβεβαιώσουν ακριβώς αυτό που ήδη πιστεύετε….
Διαβάστε επίσης: Κατάπαυση πυρός στον πόλεμο των πιθανοτήτων
Κατηγορίες:ΜΑΘΗΜΑΤΙΚΑ, ΦΙΛΟΣΟΦΙΑ
Στο παράδειγμα που αναφέρεται στο άρθρο δεν έχει ληφθεί υπόψη ένας καθοριστικός αστάθμητος παράγοντας. Στον υπολογισμό της πιθανότητας, θεωρητικά, το σύνολο του εν λόγω πληθυσμού θα κάνει το τεστ. Όμως, πρακτικά, όποιος δεν έχει σχετικά συμπτώματα δεν έχει και κανένα λόγο να κάνει το τεστ, εκτός αν ανησυχεί υπερβολικά. Έτσι ο αριθμός των υγιών που θα υποβληθούν στο τεστ θα είναι πολύ περιορισμένος, κάτι που βελτιώνει πολύ την τελική αξιοπιστία του τεστ. Σε άλλους τομείς, όταν δεν υπάρχουν τέτοιοι αστάθμητοι παράγοντες τα αποτελέσματα είναι όντως εντυπωσιακά, αν και εντελώς αντιδιαισθητικά.
Το «ηθικό μήνυμα» που αναφέρεται στο τέλος του άρθρου με βρίσκει πλήρως σύμφωνο.
Πολλές φορές γίνονται τεστ ερήμην μας ακόμα και για ασθένειες που ούτε φανταζόμαστε , π.χ. για μια ασφάλεια ζωής οι ασφαλιστικές κάνουν πολλές εξετάσεις χωρίς να έχουμε κάποιο σύμπτωμα, επίσης για να νοσηλευτής στα μεγάλα ιδιωτικά κέντρα κάνουν εξετάσεις σε όλους ανεξαιρέτως και για τον ιό HIV. Δηλαδή ακόμα και σε άτομα που ούτε κατά διάνοια ανήκουν στις ομάδες υψηλού κινδύνου.
Εξ αφορμής της όμορφης παρατήρησης του Μάνου έκανα ένα παράδειγμα με άλλη prior.
Στα εξωτερικά ιατρεία καταφθάνουν 10.000 άνθρωποι με prior πιθανότητα 80% ασθενείς και 20% υγιείς.
Καθόλου εξωπραγματικό μέγεθος σε μια επιδημία ή σ’ ένα νοσοκομείο.
Τότε οι υπολογισμοί γίνονται ως εξής; 8000 ασθενείς + 2000 υγιείς. Από τους 8000 ασθενείς μετά το τεστ θα έχουμε 7200 θετικά αποτελέσματα και από τους 2000 υγιείς 200 ψευδώς θετικά αποτελέσματα. Σύνολο θετικών αποτελεσμάτων (αληθή και ψευδή) 7400. Σύνολο πραγματικών θετικών 7200. Άρα 7200/7400= 97,3% Δηλαδή τα αποτελέσματα είναι κατά 97,3% ακριβή. (!!!) και όχι 8,3%. Ωπα! Τί έγινε εδώ;;;
Τίποτα απολύτως.
Καμία λοιπόν σχέση μεταξύ ακρίβειας του μηχανήματος και ακρίβειας αποτελεσμάτων σ’ ένα δεδομένο πληθυσμό με μετρημένη prior. Όλα εξαρτώνται από την prior πιθανότητα η οποία πρέπει να μετρηθεί με διαφορετικό τρόπο αν θέλουμε να την μετρήσουμε με αυτό το τεστ (βλέπε στατιστική).
Το θέμα της prior πιθανότητας το αναφέρει το άρθρο αλλά θά ‘πρεπε να το τονίσει λίγο πιο πολύ βάζοντας ένα αριθμητικό παράδειγμα σαν παραπάνω.
Σημειωτέον ότι το «σημείο καμπής» γίνεται με prior 50% οπότε η ακρίβεια του τεστ και η ακρίβεια των αποτελεσμάτων απλώς συμπίπτουν χωρίς αυτό να σημαίνει τίποτα.
Πλήρες φως πέφτει αν υπολογίσουμε και τα αρνητικά αποτελέσματα. Πόσο δηλαδή πρέπει να είναι ήσυχος ή ανήσυχος ένας που θα πάρει αρνητικό αποτέλεσμα. Εκεί βγαίνουν κι’ άλλα «λαβράκια»