Καρκίνος του στήθους, ληστείες και μισθοί: απλά στατιστικά λάθη

Καρκίνος του στήθους, ληστείες και μισθοί: απλά στατιστικά λάθη

Έλεγχοι υποθέσεων και εκτιμήσεις διαστημάτων εμπιστοσύνης, ανάλυση παλινδρόμησης και συσχέτισης - μολονότι όλα αυτά υπόκεινται σε παρερμηνείες, τα πιο συνηθισμένα είδη στατιστικών σολοικισμών δεν αφορούν τίποτε πιο περίπλοκο από κλάσματα και ποσοστά. Αυτό το τμήμα περιέχει μερικά αντιπροσωπευτικά παραδείγματα.

Ότι μία στις έντεκα γυναίκες θα προσβληθεί από καρκίνο του στήθους, είναι ένα πολυσυζητημένο στατιστικό στοιχείο. Ωστόσο ο αριθμός αυτός είναι παραπλανητικός διότι ισχύει μόνο για ένα φανταστικό δείγμα γυναικών, που ζουν όλες μέχρι τα ογδόντα πέντε και των οποίων η πιθανότητα να προσβληθούν από καρκίνο του στήθους σε μια οποιαδήποτε ηλικία αντιστοιχεί στη συχνότητα με την οποία εμφανίζεται σήμερα η ασθένεια σ’ αυτή την ηλικία. Μόνο μια μειοψηφία των γυναικών ζει μέχρι τα ογδόντα πέντε, ενώ η συχνότητα εμφάνισης αλλάζει τα τελευταία χρόνια και είναι πολύ μεγαλύτερη για τις πιο ηλικιωμένες γυναίκες.

Στην ηλικία των σαράντα, περίπου μία γυναίκα στις χίλιες προσβάλλεται από καρκίνο του στήθους κάθε χρόνο, ενώ στην ηλικία των εξήντα, ο αριθμός έχει ανέβει σε μία στις πεντακόσιες. Η μέση σαραντάρα έχει περίπου 1,4% πιθανότητες να προσβληθεί από την ασθένεια πριν από την ηλικία των πενήντα και 3,3% πιθανότητες να προσβληθεί πριν από τα εξήντα. Για να υπερβάλουμε λίγο, το ποσοστό μία στις έντεκα είναι κάπως σαν να λέμε ότι εννέα στα δέκα άτομα θα αποκτήσουν «λεκέδες» λόγω ηλικίας, κι αυτό βεβαίως δεν σημαίνει ότι θα έπρεπε να ανησυχούν σοβαρά οι τριαντάρηδες.

Ένα άλλο παράδειγμα τεχνικά σωστής και όμως παραπλανητικής στατιστικής είναι το γεγονός ότι τα καρδιακά νοσήματα και ο καρκίνος είναι οι δύο πρώτοι δολοφόνοι των Αμερικανών. Αυτό είναι αναμφίβολα σωστό αλλά, σύμφωνα με τα Κέντρα Ελέγχου Νοσημάτων, οι τυχαίοι θάνατοι -αυτοκινητικά δυστυχήματα, δηλητηριάσεις, πνιγμοί, πτώσεις, πυρκαγιές και ατυχήματα με όπλα- συνεπάγονται περισσότερα χαμένα χρόνια από την αναμενόμενη διάρκεια ζωής αφού ο μέσος όρος της ηλικίας αυτών των θυμάτων είναι πολύ χαμηλότερος από εκείνον των θυμάτων του καρκίνου και των καρδιακών νοσημάτων.

Τα ποσοστά, ένα θέμα που διδάσκεται στο δημοτικό, χρησιμοποιούνται συνεχώς με λάθος τρόπο. Παρ’ ότι πολλοί πιστεύουν το αντίθετο, ένα είδος του οποίου η τιμή αυξάνεται κατά 50% και μετά μειώνεται κατά 50% υφίσταται μια καθαρή μείωση της τιμής του κατά 25%. Ένα φόρεμα του οποίου η τιμή πέφτει κατά 40% κι έπειτα κατά άλλα 40% έχει μια μείωση 64% και όχι 80%.

Η νέα οδοντόπαστα που μειώνει την τερηδόνα κατά 200% είναι απ’ ό,τι φαίνεται ικανή να αφαιρέσει όλη την τερηδόνα που έχει κανείς δύο φορές, τη μία ίσως βουλώνοντας τις κοιλότητες και την άλλη προσθέτοντας μικρά εξογκώματα στην ίδια θέση πάνω στα δόντια. Εάν σημαίνει τίποτα, η τιμή 200% μπορεί να δείχνει ότι η νέα οδοντόπαστα μειώνει την τερηδόνα ας πούμε κατά 30%, εκεί που μια συνηθισμένη οδοντόπαστα τη μειώνει κατά 10% (η μείωση κατά 30% είναι μια αύξηση κατά 200% της μείωσης κατά 10%). Αυτή η τελευταία διατύπωση, ενώ είναι λιγότερο παραπλανητική, είναι επίσης λιγότερο εντυπωσιακή, κι αυτό εξηγεί γιατί δεν χρησιμοποιείται.

Το απλό τέχνασμα να ρωτάει κανείς πάντα τον εαυτό του: «Ποσοστό τίνος;» θα ήταν πολύ καλή συνήθεια. Εάν τα κέρδη είναι 12%, για παράδειγμα, αυτό σημαίνει 12% των εξόδων, των πωλήσεων, των κερδών του τελευταίου χρόνου ή τίνος άλλου πράγματος;

Τα κλάσματα είναι μια άλλη πηγή ταλαιπωρίας για πολλούς αριθμόφοβους. Ένας υποψήφιος για την προεδρία το 1980 λέγεται ότι ρώτησε τους δημοσιογράφους που τον συνόδευαν πώς να μετατρέψει τα 2/7 σε ποσοστό επί τοις εκατό, εξηγώντας ότι η άσκηση αυτή είχε δοθεί στο γιο του από το σχολείο. Είτε αυτή η ιστορία είναι αληθινή είτε όχι, είμαι πεπεισμένος ότι μια σημαντική μειοψηφία ενήλικων Αμερικανών δεν θα ήταν ικανή να περάσει μια απλή εξέταση πάνω στα ποσοστά, τους δεκαδικούς, τα κλάσματα και τις μετατροπές από το ένα στο άλλο. Καμιά φορά όταν ακούω ότι ένα είδος πουλιέται σε ένα κλάσμα της κανονικής του τιμής κόστους, λέω ότι αυτό το κλάσμα θα είναι μάλλον 4/3, οπότε ο άλλος με κοιτάει με άδειο βλέμμα.

Στο κέντρο της πόλης κάποιος πέφτει θύμα ληστείας και δηλώνει ότι ο ληστής ήταν μαύρος. Όταν όμως γίνεται η αναπαράσταση του συμβάντος, πολλές φορές κάτω από ανάλογες συνθήκες φωτισμού, από τον ανακριτή που ερευνά την υπόθεση, το θύμα αναγνωρίζει σωστά τη φυλή του επιτιθέμενου μόνο σ’ ένα 80% των προσπαθειών. Τι πιθανότητα υπάρχει ο κακοποιός να ήταν πράγματι μαύρος;

Πολλοί θα πουν βεβαίως ότι η πιθανότητα είναι 80%, αλλά η σωστή απάντηση, με δεδομένες ορισμένες λογικές παραδοχές, είναι πολύ χαμηλότερη. Οι παραδοχές μας είναι ότι περίπου 90% του πληθυσμού είναι λευκοί και μόνο 10% μαύροι, ότι στο κέντρο της πόλης ισχύει αυτή η φυλετική σύνθεση, ότι καμιά από τις δύο φυλές δεν είναι πιο πιθανό να ληστεύει κόσμο, και ότι το θύμα είναι εξίσου πιθανό να κάνει λάθος αναγνώριση και προς τις δύο κατευθύνσεις, να δει μαύρο αντί λευκού και λευκό αντί μαύρου. Με δεδομένες αυτές τις προϋποθέσεις, σε εκατό ληστείες που θα συνέβαιναν κάτω από παρόμοιες περιστάσεις, το θύμα θα αναγνώριζε κατά μέσο όρο είκοσι έξι από τους ληστές ως μαύρους - 80% των δέκα που ήταν πράγματι μαύροι, δηλαδή οκτώ, συν 20% των ενενήντα που ήταν λευκοί, δηλαδή δεκαοκτώ, που κάνει σύνολο είκοσι έξι. Επομένως, επειδή μόνο οκτώ από τους είκοσι έξι που αναγνωρίστηκαν ως μαύροι ήταν όντως μαύροι, η πιθανότητα να έπεσε ο άνθρωπος θύμα ενός μαύρου, με δεδομένο ότι αυτός έτσι ισχυρίστηκε, είναι μόνο 8/26 ή περίπου 31%!

Ο υπολογισμός είναι παρόμοιος με αυτόν που αφορούσε τα ψευδή θετικά αποτελέσματα κατά τον έλεγχο χρήσης ναρκωτικών και, όπως κι εκείνος, δείχνει ότι η παρερμηνεία των κλασμάτων μπορεί να είναι ζήτημα ζωής και θανάτου.

Σύμφωνα με κρατικά στοιχεία που δημοσιεύτηκαν το 1980, τα χρήματα που παίρνουν οι γυναίκες ανέρχονται σε 59% εκείνων που παίρνουν οι άντρες. Παρόλο που αναφέρεται συνεχώς από τότε, αυτό το στατιστικό στοιχείο δεν είναι αρκετά ισχυρό για να κρατήσει το βάρος που του φορτώνεται. Χωρίς παραπέρα λεπτομερή στοιχεία, που δεν περιλαμβάνονται στην έρευνα, δεν είναι σαφές τι συμπεράσματα δικαιολογούνται. Σημαίνει άραγε αυτός ο αριθμός ότι, για τις ίδιες ακριβώς δουλειές που κάνουν οι άντρες, οι γυναίκες πληρώνονται το 59% των μισθών των αντρών; Λαμβάνεται υπόψη σ’ αυτά τα στοιχεία ο αυξανόμενος αριθμός γυναικών στο εργατικό δυναμικό, η ηλικία και η πείρα τους; Λαμβάνονται υπόψη οι σχετικά χαμηλά αμειβόμενες δουλειές που κάνουν πολλές γυναίκες (υπάλληλοι γραφείου, δασκάλες, νοσοκόμες κ.λπ.); Λαμβάνεται υπόψη το γεγονός ότι η δουλειά του συζύγου συνήθως καθορίζει πού θα ζήσει ένα παντρεμένο ζευγάρι; Λαμβάνεται υπόψη το μεγαλύτερο ποσοστό των γυναικών που εργάζονται με βραχυπρόθεσμη προοπτική; Η απάντηση σε όλες αυτές τις ερωτήσεις είναι όχι. Ο ξερός αριθμός που κυκλοφόρησε, δήλωνε απλώς ότι το μέσο εισόδημα των εργαζόμενων γυναικών πλήρους απασχόλησης ήταν 59% του ανδρικού.

Ο σκοπός των παραπάνω ερωτήσεων δεν είναι να αρνηθούμε την ύπαρξη διακρίσεων εναντίον των γυναικών, που σίγουρα είναι πολύ πραγματικές, αλλά να επισημανθεί ένα σημαντικό παράδειγμα στατιστικού στοιχείου, το οποίο από μόνο του δεν είναι ιδιαίτερα πληροφοριακό. Κι όμως αναφέρεται διαρκώς και έχει γίνει αυτό που ο στατιστικολόγος Darrell Huff έχει ονομάσει ημιπροσαρτημένο αριθμό, ένας αριθμός έξω από κάθε πλαίσιο με λίγες ή καθόλου πληροφορίες για το πώς προέκυψε ή τι ακριβώς εννοεί.

Όταν οι στατιστικές παρουσιάζονται τόσο απογυμνωμένες, χωρίς καμιά πληροφορία για το μέγεθος και τη σύνθεση του δείγματος, τη μεθοδολογία και τους ορισμούς, τα διαστήματα εμπιστοσύνης, τα επίπεδα σημαντικότητας κ.λπ., το μόνο που μας μένει είναι να σηκώσουμε τους ώμους ή, εάν το θέμα μας εξάπτει την περιέργεια, να προσπαθήσουμε να καθορίσουμε το πλαίσιο από μόνοι μας. Ένα άλλο είδος στατιστικών στοιχείων που συχνά παρουσιάζονται απογυμνωμένα παίρνουν την εξής μορφή: το πλουσιότερο X τοις εκατό της χώρας κατέχει το Ψ τοις εκατό του πλούτου της, όπου το X είναι σκανδαλωδώς μικρό και το Ψ είναι σκανδαλωδώς μεγάλο. Οι περισσότερες στατιστικές αυτού του τύπου είναι σκανδαλωδώς παραπλανητικές, μολονότι, για άλλη μια φορά, δεν θέλω να αρνηθώ ότι υπάρχουν πάρα πολλές οικονομικές αδικίες σ’ αυτή τη χώρα. Τα περιουσιακά στοιχεία που διαθέτουν πλούσια άτομα και οικογένειες σπανίως είναι ρευστοποιήσιμα, και ούτε είναι καθαρά προσωπικής σημασίας ή αξίας. Οι λογιστικές διαδικασίες που χρησιμοποιούνται για να μετρηθούν αυτά τα περιουσιακά στοιχεία είναι πολλές φορές αρκετά τεχνητές και υπάρχουν κι άλλοι παράγοντες που περιπλέκουν το ζήτημα, οι οποίοι με λίγη σκέψη γίνονται προφανείς.

Είτε είναι δημόσια είτε ιδιωτική, η λογιστική είναι ένα ιδιαίτερο κράμα στοιχείων και αυθαίρετων διαδικασιών, το οποίο συνήθως απαιτεί αποκρυπτογράφηση. Τα κρατικά στοιχεία για την απασχόληση έκαναν ένα σημαντικό άλμα το 1983, για τον απλούστατο λόγο ότι αποφασίστηκε να υπολογιστούν και οι στρατιωτικοί μέσα στους εργαζόμενους. Με τον ίδιο τρόπο τα κρούσματα AIDS μεταξύ ετεροφυλόφιλων αυξήθηκαν δραματικά όταν η κατηγορία των Αϊτινών ενσωματώθηκε στην κατηγορία των ετεροφυλόφιλων.

Η πρόσθεση, μολονότι ευχάριστη και εύκολη, είναι συχνά άτοπη. Εάν καθένα από τα δέκα είδη που απαιτούνται για την κατασκευή κάποιου προϊόντος ακριβύνει κατά 8%, η συνολική τιμή θα αυξηθεί κατά 8%, όχι 80%. Όπως ανέφερα, ένας παραπλανημένος τοπικός μετεωρολόγος ανακοίνωσε κάποτε ότι υπήρχε 50% πιθανότητα να βρέξει το Σάββατο και 50% την Κυριακή κι έτσι, συμπέρανε, «φαίνεται πως υπάρχει 100% πιθανότητα να βρέξει αυτό το Σαββατοκύριακο». Ένας άλλος μετεωρολόγος ανακοίνωσε ότι την επόμενη μέρα θα έκανε διπλή ζέστη, επειδή η θερμοκρασία θα ανέβαινε από τους 25° F στους 50° F.

Υπάρχει ένας διασκεδαστικός τρόπος με τον οποίο τα παιδιά αποδεικνύουν ότι δεν έχουν χρόνο για σχολείο.

  • Το ένα τρίτο του χρόνου κοιμούνται, συνολικά γύρω στις 122 μέρες.
  • Το ένα όγδοο του χρόνου τρώνε (τρεις ώρες τη μέρα), συνολικά γύρω στις 45 μέρες.
  • Το ένα τέταρτο του χρόνου, ή 91 μέρες, έχουν καλοκαιρινές και άλλες διακοπές, και
  • τα δύο έβδομα του χρόνου, ή 104 μέρες, είναι Σαββατοκύριακα.

Το άθροισμα κάνει περίπου ένα έτος, άρα τα παιδιά δεν έχουν χρόνο για σχολείο.

Τέτοιες άτοπες προσθέσεις, αν και συνήθως όχι τόσο προφανείς όσο οι παραπάνω, γίνονται συνεχώς. 'Όταν προσδιορίζεται το συνολικό κόστος μιας απεργίας, ή η ετήσια δαπάνη για οικόσιτα ζώα, για παράδειγμα, υπάρχει η τάση να προστίθεται ότι μπορεί να σκεφτεί κανείς, ακόμη κι αν αυτό έχει σαν αποτέλεσμα να υπολογίζονται κάποια πράγματα πολλές φορές κάτω από διαφορετικούς τίτλους, ή να μη λαμβάνονται υπόψη ορισμένες οικονομίες που προκύπτουν. Εάν πιστεύετε τέτοιου είδους στοιχεία μάλλον θα πιστεύετε ότι τα παιδιά δεν έχουν καιρό να πάνε σχολείο.

Εάν θέλετε να κάνετε αισθητή στους άλλους, ιδιαίτερα τους αθεόφοβους, τη σοβαρότητα μιας κατάστασης, μπορείτε να χρησιμοποιήσετε ως στρατηγική την αναφορά του απόλυτου αριθμού αντί της πιθανότητας κάποιου σπάνιου φαινομένου του οποίου ο φέρων βασικός πληθυσμός είναι μεγάλος. Αυτό ονομάζεται μερικές φορές πλάνη της «ευρείας βάσης», κι έχουμε ήδη αναφέρει ένα-δυο σχετικά παραδείγματα. Το ποιο στοιχείο θα υπογραμμίσετε, τον αριθμό ή την πιθανότητα, εξαρτάται από τα συμφραζόμενα, αλλά είναι χρήσιμο να μπορείτε να μετατρέπετε γρήγορα το ένα στο άλλο, έτσι ώστε να μη σας παρασύρουν τίτλοι όπως «Μακελειό με 500 νεκρούς στο εορταστικό τετραήμερο» (αυτός περίπου είναι ο αριθμός των ανθρώπων που σκοτώνονται σε οποιαδήποτε τετραήμερη περίοδο).

Ένα άλλο παράδειγμα έχει να κάνει με τη συρροή των άρθρων που γράφτηκαν πριν μερικά χρόνια για την υποτιθέμενη σχέση ανάμεσα στις αυτοκτονίες εφήβων και το παιχνίδι «Κατακόμβες και Δράκοντες» [Dungeons and Dragons]. Το επιχείρημα ήταν ότι οι έφηβοι πάθαιναν μονομανία με το παιχνίδι, κατά κάποιο τρόπο έχαναν επαφή με την πραγματικότητα και κατέληγαν στην αυτοκτονία. Τα στοιχεία που αναφέρονταν ήταν ότι είκοσι οκτώ έφηβοι που έπαιζαν συχνά το παιχνίδι είχαν αυτοκτονήσει.

Αυτό το στατιστικό στοιχείο φαίνεται αρκετά εντυπωσιακό μέχρις ότου ληφθούν υπόψη δύο πρόσθετα δεδομένα. Πρώτον, το παιχνίδι πουλήθηκε κατά εκατομμύρια, και υπάρχουν εκτιμήσεις ότι το έπαιζαν ως και 3 εκατομμύρια έφηβοι. Δεύτερον, σε άτομα αυτής της ηλικίας το ετήσιο ποσοστό αυτοκτονίας είναι περίπου 12 ανά 100.000. Αυτά τα δύο δεδομένα μαζί υποδεικνύουν ότι ο αριθμός των εφήβων παικτών του «Κατακόμβες και Δράκοντες», που θα μπορούσε να αναμένεται ότι θα αυτοκτονήσουν είναι περίπου 360 (12 x 30)! Δεν θέλω να αρνηθώ ότι το παιχνίδι ήταν ένα αίτιο σε κάποιες από αυτές τις αυτοκτονίες, αλλά μόνο να βάλω τα πράγματα στη σωστή προοπτική.

***

John Allen Paulos - Αριθμοφοβία