Neděle 19. dubna 2026, svátek má Rostislav
  • Premium

    Získejte všechny články
    jen za 99 Kč/měsíc

  • schránka
  • Přihlásit Můj účet

První český ryze internetový deník. Založeno 23. dubna 1996

VĚDA: Jak správně číst statistiky

diskuse (24)

Jak rozumět statistikám pro pokročilé. Pokračování Tim se ptá: Proč a jak funguje vesmír, co se na papír nevešlo

Drahý Time,

dneska odbočíme z hájemství čisté fyziky a podíváme se opět na statistiku. Bez ní se neobejde ani teoretická fyzika, která vytváří hypotézy, tak ani experimentální fyzika, která se snaží tyto hypotézy potvrdit nebo vyvrátit. V tomhle článku jsme se bavili o tom, jak poznat, že daný jev není anebo je zatížený chybou měření, a také pravidlo 3σ, tedy jak moc je daný jev jistý. Dneska se ale podíváme na pár způsobů, které mohou statistiku posunout velmi nežádoucím směrem.

Vliv přeživších

Ve druhé světové válce Spojenci při bombardování ztráceli obrovské množství letadel. Proto se rozhodli zapojit do hry statistiku a požádali vědce, aby podle zjištěných zásahů letadel protiletadlovou palbou a stíhačkami nepřítele zjistili oblasti v trupu a křídlech letadla, které patří mezi nejčastěji zasažené. Dostali takovýto obrázek:

s


Nejpravděpodobnější místa zásahu palbou na letadle

Logicky na první pohled by se vyplatilo posílit konstrukci letadla na místech, kde je nejvíce červených teček. Ale to by byla zásadní chyba. Na to upozornil generály Abraham Wald. Problém není v metodice měření a určení statistiky, ale ve výběru vzorku dat. Do statistiky se logicky dostala jenom ta letadla, která se vrátila z náletu. Proto je potřeba posílit naopak ta bílá místa, místa bez zásahů, protože trefa do bílého místa znamená, že se letadlo nevrátilo. A nemohlo tak být zahrnuto do měření. Říká se tomu, že vzorek dat je zaujatý, vliv přeživších.

Ve statistice pracujeme s populací, což jsou v našem případě všechna letadla, která letěla nad Německo. Z ní vybereme vzorek, což jsou stroje, které se vrátily. Nad nimi provedeme měření a zkonstruujeme statistiku, což je obrázek průstřelů. A pokud je náš vzorek zaujatý, někdy se tomu anglicky říká biased, nebo že má bias, tak je celá naše precizně zpracovaná statistika úplně k ničemu.

Zdaleka to neplatí jenom o letadlech. Třeba postoj, že vysoká škola je k ničemu se opírá o to, že Gates, Zuckerberg nebo Jobs z výšky utekli a kam to dotáhli. Ale to je zaujatý vzorek. Naše populace nejsou úspěšní boháči bez vysoké školy, ale všichni kdo výšku nedodělali. Když se zbavím vlivu přeživších, dostaneme úplně jiný výsledek, který ukazuje, jak důležité je patřičné vzdělání. Tady myslím opravdové vysoké školy, ne Genderová studia nebo Ekonomiku volného času či co to ještě učí nejen v Brně na Fakultě smažení sýra (FSS MU).

Ostatně platí to i o minulosti. Jak se rozplýváme nad starou hudbou, literaturou, stavbami, že tehdy to lidé prostě uměli. I tohle je vliv přeživších. Hudbu, která nestála za nic lidé neposlouchali, knihy nevalné kvality nečetli, nedobré stavby zchátraly a byly zbourány. Do dnešních dob tak přežilo jenom skutečně dobré umění, bez ohledu na to, kolik šumařů a pisálků tehdy bylo.

Bias kam se podíváš

Je to tak. Ukazuje se, že zdaleka složitější než je konstrukce statistiky je výběr správného vzorku. Někdy jde o nehodu, existuje nějaký vnější vliv, který tu statistiku někam posune, typicky třeba nějaká vada v měření, v návrhu pokusu. Proto je tak důležité, aby byla vědecká práce transparentní, aby byla možná její replikace a ověření - vyvrácení. A to je jeden z velkých problémů současné vědy, že tomu tak není. Třeba na začátku hype kolem globálního oteplování byl slavný Hokejkový graf rekonstrukce teplot a jejich predikce od Michaela Manna a jeho kolektivu. Dost působivé, aby to spustilo paniku. Až později, v rámci Climategate, vyšlo najevo, že podobný graf lze za použití Mannovy statistiky udělat i z bílého šumu, aneb nejdříve byl znám výsledek a pak se dělala statistika. Asi něco podobného, jako když jsme na výšce měřili beta rozpad a vyšlo nám to o pár řádu jinde. Naprosto zděšeni jsme provedli „revalidaci“ měřených výsledků v počítači a najednou to krásně vycházelo. Co jsme nevěděli, bylo, že celé měření je duchařina a má to vycházet o pár řádu jinde. Naštěstí jsme to ukecali, že jsme kluci šikovní a zápočet byl. To Mann to neukecá, má z ostudy kabát, ale to je v rámci klima hnutí jenom zanedbatelný fakt, když se kácí les, tak prostě lítají třísky.

WEIRD bias

Další velmi slavný bias. WEIRD, neboli divný, je vlastně zkratka z Western, Educated, Industrialized, Rich, Democratic. Na tento jev upozornili ve své práci Joseph Henrich a kolektiv v roce 2010.

Oč jde? V podstatě o to, že výzkumníci z psychologie, ekonomie a dalších věd pro řadu svých studií spoléhala na nejbližší zdroje. Tedy jejich typický vzorek se skládal ze západních, převážně bílých, univerzitních studentů a studentek. A na základě tohoto vzorku potom zobecňovali svoje zjištěné poznatky na celé lidstvo.

Uvedu příklad z ekonomie a Hry na ultimáta, poměrně jednoduchá hra pro dva hráče. Dostanou dohromady třeba tisíc korun a jeden z nich rozhoduje, jak peníze rozdělí. Ten druhý potom s nabídkou souhlasí a peníze jsou vyplaceny, nebo nesouhlasí a peníze propadnou. WEIRD vzorek ukázal, že neakceptuje neférové nabídky, tedy že třeba ten, co navrhuje rozdělení peněz si nechá 900 Kč a druhému dá jenom 100 Kč. Ovšem Indiáni v Amazonii jsou rádi za každou nabídku a podobné věci neřeší. A tak to bylo v celé řadě studií.

Zaujal mne velmi Müller-Lyerova iluze. Podívej se na následující obrázek a řekni, která úsečka je delší:

s

Müller-Lyer Illusion

Je to chyták, když si vezmeš pravítko, zjistíš, že se jedná o optický klam, na který skočí většina lidí. Ukazuje se, že naše vnímání je velmi odlišné od lidí, kteří nežijí v prostředí pravoúhlých staveb, třeba Křováci na Kalahari na tohle nenaletí.

Je tedy důležité nezkoumat jenom výsledky statistik, ale i to, jakým způsobem byly zkonstruovány. Někdy, jako třeba u WEIRD biasu nemusí jít o vědomý úmysl, ale někdy je to prostě podvod. Asi jako se vším, je potřeba si to dát do kontextu.

___________________________________________________________________________________

tim

Vážený čtenáři, máš před sebou knihu „Tim se ptá: Proč a jak funguje vesmír“. Je to kniha odpovědí na otázky z moderní fyziky, kosmologie, ale také třeba o tom, jak fungují atomové elektrárny, výlet do historie, jak vznikala moderní fyzika a kdo byli její zakladatalé. Věnujeme se i současné kosmonautice, potřebám kolonizace vesmíru a jsou tam i pikaktní detaily, jak kosmonauti chodí na záchod, zdaleka nejčtenější část knihy. Tedy hned po kapitole, jak Jára Cimrman přispěl ke vzniku kvantové mechaniky.
Kniha je určená jak pro děti, ale i z části pro jejich rodiče, pro každého, kdo se laicky zajímá o fyziku a potřebuje zjednodušení složitých odpovědí. Předmluvu ke knize mi napsal Ondřej Neff, na faktickou správnost dohlížel profesor Jiří Chýla z Ústavu fyziky Akademie Věd.Stručně řečeno, Tim se ptal, abyste se už nemuseli ptát Vy :)Cena je 199 Kč + poštovné.
Objednat je možno na martin.tuma@smartblue.net,

Ivan Emr
18. 4. 2026

Jan Potměšil je asi nejtragičtější oběť Sametové revoluce z roku 1989.

Miloslav Grundmann
18. 4. 2026

Status a autonomie vysvětlují, proč dobrovolná služba nefunguje

Tomáš Guttmann
18. 4. 2026

Proti Židům se jako argument používají i jejich ctnosti i jejich utrpení.

Petr Kolman
18. 4. 2026

Seniorka Jitka (71 let) z Brna vsadila sportku a nevyhrála. Media o tom mlčí.

ČTK, Lidovky.cz
19. 4. 2026

Na hřbitově v ostrovním státě Trinidad a Tobago našla policie těla nejméně 50 malých dětí a šesti...

svm Matěj Svěrák, ČTK
19. 4. 2026

Premiér Andrej Babiš prohlásil, že jeho vláda bude dělat pragmatickou zahraniční politiku, ne...

Milan Votava
19. 4. 2026

Pokud se vysloví spojení českoslovenští letci v britském Královském letectvu, velmi často se...

herp Petr Heřmánek, ČTK
19. 4. 2026

Další podnikatelská mise na Tchaj-wan je zbytečná, řekl Radek Vondráček (ANO) v nedělní debatě ČT....

aoc Adéla Očenášková, svm Matěj Svěrák, ČTK
19. 4. 2026

Premiér Andrej Babiš se chce zapojit do iniciativy celoevropského jaderného odstrašení, kterou v...

Vyhledávání

TIRÁŽ NEVIDITELNÉHO PSA

Toto je DENÍK. Do sítě jde obvykle nejpozději do 8.00 hod. aktuálního dne. Pokud zaspím, opiji se, zešílím nebo se zastřelím, patřičně na to upozorním - neboť jen v takovém případě vyjde Pes jindy, eventuálně nikdy. Šéfredaktor Ondřej Neff (nickname Aston). Příspěvky laskavě posílejte na adresu redakce.

ondrejneff@gmail.com

Rubriku Zvířetník vede Lika.

zviretnik.lika@gmail.com

HYENA

Tradiční verze Neviditelného psa. Sestává ze sekce Stručně a z článků Ondřeje Neffa - Politický cirkus a Jak život jde. Vychází od pondělka do pátku.

https://www.hyena.cz