19.3.2024 | Svátek má Josef


VĚDA: Covid a statistika

28.9.2020

aneb Věřím jen citátům, které jsem si sám zfalšoval

Nevíte, co si vybrat z protichůdných vyjádření, která o viru pronášejí kapacity i „kapacity“? Nedokážete se vyznat v horách dat? Nevěříte, že vůbec nějaká relevantní data jsou? Zkusíme vám pomoct najít směr. A kdyby ne směr, kterým jít, tak aspoň ten, kterým se rozhodně nevydávat.

Nedůvěra k výstupům datových analýz vyjádřená bonmotem, že autor společně s Churchillem věří jen těm statistikám, které si zfalšoval sám, bývá mimo mísu. Zaprvé s Churchillem má daný „citát“ společného asi totéž jako „Hitler je gentleman“ s Ferdinandem Peroutkou.V žádných záznamech se nic podobného neobjevilo a anglických verzí fráze připisované Churchillovi je mnoho – protože se jedná o překlad z němčiny.

„Dovolávat se falešnosti statistik“ poukazem na falšovaný „citát“, který zřejmě pochází od nacistických politických marketérů, je zábavné – ale argumentační problém tkví úplně jinde. Statistiky samozřejmě zfalšované být můžou, ale také nemusí, stejně jako cokoli jiného: peníze, malby nebo třeba lékařské zprávy – a stejně jako u nich i u statistik dává lepší smysl než je všechny zavrhnout spíš prozkoumat každý konkrétní výstup, lékařskou zprávu, bankovku.

Statistické výsledky se podobají hledání na Google: na položenou otázku nabízejí nespočet různých odpovědí, které si často protiřečí. Zkušenost s vyhledávači přitom ale každému z nás říká, že navzdory mnohosti odpovědí můžeme získat užitečné, validní a často i pravdivé informace. Aspoň pokud je právě to naším cílem. Jinak samozřejmě najdeme podporu pro vcelku libovolné tvrzení, ať už je s realitou v souladu, nebo ne: třeba spoustu webů připisujících Churchillovi i tvrzení „lies, damn lies and statistics“ – které rovněž nepochází od něj.

Skvělým příkladem jsou názory odborníků vzdělaných v přírodních vědách na koronavirus nebo globální oteplování. Budeme-li po tom toužit, snadno v pár vteřinách dohledáme akademicky ověnčené zastánce nereálných apokalyps i popírače. Pokud nám ale záleží na zjištění, co si o tématech myslí odborná komunita, stačí hledat jinak – a taky to zjistíme.

Nemá smysl odmítat data týkající se koronaviru jen proto, že jsou nepřesná a potenciálně zneužitelná k obhajobě vcelku jakéhokoli názoru. Navzdory nepřesnostem totiž můžou i nám, laikům, posloužit aspoň negativně: ukázat, že pravdivost některých názorů je extrémně nepravděpodobná. Nejlepší ochranou přitom může být jednoduchost: použijeme-li úplně simplicistní úvahy, které většinu vlivů zanedbají, dojdeme k sice nepřesným, ale nezaujatým výsledkům, z nichž si můžeme udělat aspoň řádovou představu.

Úmrtí „s covidem“ zkracuje život o léta, ne o týdny

Vyjdeme-li z celosvětových dat předkládaných Googlem, na covid-19 k polovině září zemřel necelý milion lidí. Čísla nejspíš budou podhodnocená, minimálně v rozvojových zemích (možná také někde výjimečně nadhodnocená, když některé zemřelé testují post mortem bez ohledu na příčinu smrti, což je ale v globálním měřítku nepodstatné). Řádový odhad počtu obětí z Google ale získáme: ať už se jedná o milion, nebo dva, je to číslo vyšší než počet obětí úmrtí spjatých s HIV (0,69 mil ročně) a zhruba srovnatelné ročními s úmrtími v dopravních nehodách (1,35 milionu).

Klíčovou otázkou pak je, o jakou část života přišli oni zemřelí. Jedná se, pravda, zejména o lidi, kteří nebyli úplně zdraví a často se už dožili úctyhodného věku. Jenže když už se člověk aspoň trochu úctyhodného věku dožije, zásadně stoupá pravděpodobnost, že se dožije let ještě úctyhodnějších. Bezpochyby existují pacienti, pro něž byla nákaza poslední kapkou, která by během pár týdnů přišla v jiné podobě – jenže takových bude minimum. Letmý pohled na strmý vzrůst úmrtnosti v zemích, které prošly krizí zdravotnictví, ukazuje, že v dalších týdnech a měsících nenásledoval žádný strmý pokles pod dlouhodobý průměr.

Na řadě z úmrtí se mohl koronavirus podílet nepřímo, třeba kvůli zablokování kapacit zdravotnických zařízení a společnosti obecně nebo kvůli zanedbání zdravotní péče ze strany pacientů (viz třeba reportáž ČT). Vědomí takových souvislostí je důležité při snaze odhadnout na základě dat z minulosti možný budoucí vývoj – ale ze stávajících úmrtí nákazu nevyviňuje. Názory, že „úmrtí s koronavirem“ svým obětem v průměru zkrátila život jen o pár měsíců, jsou tak zřejmě mylné (výmluvnější než tisíc slov je ilustrace The Economist).

Stručně a ošklivě: kdyby si virus vybíral jen oběti, které by stejně za pár týdnů zemřely, po těch pár týdnech by si vybil většinu klientů a (celková) mortalita by po nárůstu klesla pod obvyklou úroveň. Což se nestalo. (S trochou fantazie by bylo možné argumentovat, že k takovému poklesu skutečně došlo, nicméně je v datech maskovaný zvýšením mortality následkem onoho zanedbání preventivní zdravotní péče. V tom případě by se ale muselo ono zvýšení mortality po lockdownu projevit třeba u nás nebo v Maďarsku – což se rovněž nestalo.)

Italská data z doby rozpuku epidemie naznačují, že průměrné úmrtí s covidem znamená ztrátu víc než deseti let života; mezinárodní studie mluví dokonce o čtrnácti letech. Argumentace o „úmrtí s covidem“ je přesto do jisté míry správná: odhady jsou nadhodnocené, protože analýzy vycházejí ze srovnání s tabulkovou dobou dožití a jen minimálně (italská) nebo vůbec (globální) nekorigují fakt, že s vyšší pravděpodobností na covid zemřou méně zdraví lidé. Jejich význam přitom může být značný (jakkoli ani na tom nepanuje shoda – viz třeba blog vztahující se právě k citované studii) a odhady nadhodnocovat o desítky procent – nicméně přesto zůstáváme v řádu let, nikoli týdnů.

Eurostat

Celková úmrtnost ve vybraných evropských zemích podle dat Eurostatu: tečky zobrazují týdenní souhrny za letošní rok, linky průměrnou hodnotu v letech 2010–2019

Statisticky průměrnému Čechovi virus zkrátil život o pět hodin. Zatím

Průměrná oběť covidu tak zemřela o tucet let dřív, než činí odhady pro jejího statisticky průměrného vrstevníka. Průměrná oběť ale není průměrný člověk. Už samotný fakt, že se daný člověk nakazil, ukazuje, že mohl mít nějakou vlastnost, která zvyšuje i jiná rizika – třeba horší imunitu nebo hygienické návyky. Těžký průběh onemocnění, stejně jako rozvoj příznaků, taky nepostihuje lidi rovnoměrně a náhodně, ale spíš ty, kdo trpí nějakými dalšími problémy. (Skvělým příkladem by mohlo být kouření – kdyby italská data nenaznačovala, že jsou kuřáci možná nějakým způsobem přímo nebo nepřímo chráněni. Na argumentaci to ale nic nemění: úmrtí s koronavirem, stejně jako prakticky všechna jiná úmrtí, postihují častěji jedince, kteří jsou obecně méně zdraví.)

Dalším vlivem může být socioekonomický status. Ten ovlivňuje přístup ke zdravotnictví – jak ve smyslu praktických možností a kvality péče, tak postoje konkrétního člověka – za jakých podmínek ji vyhledá a jestli se bude řídit doporučeními odborníků. Roli ale můžou hrát i složitější vztahy: od chronického stresu doprovázejícího chudobu, který narušuje imunitní systém, po možnost těch movitějších trávit karantény na zahradě – protože množství studií naznačuje, že by sluneční světlo mohlo být jedním z faktorů, které korona-rizika snižují. Princip je stejný: přímými i nepřímými obětmi koronaviru jsou nejspíš častěji lidé, kteří by se kvůli chudobě dožili nižšího věku, než jaký udávají souhrnné tabulky.

Americká studie třeba ukazuje, že se oběti koronaviru dožívají o deset let méně než vrstevníci, aby jedním dechem odkázala na modely, podle nichž by oběti prý zemřely už za dva roky. Střízlivé evropské výsledky přináší analýza britských dat z dubna: nabízí rozmezí 6 až 11 let, v závislosti na tom, jak silné interakce viru a dalších zdravotních prediktorů očekáváme (jedenáct odpovídá jejich ignorování – a v případě započtení silnějšího vlivu se můžeme dostat i pod oněch šest let). Pokud použijeme konzervativní hodnotu šesti let, virus nás zatím celosvětově stál šest milionů ztracených let na předčasných úmrtích.

Do výpočtů celkových dopadů onemocnění kromě úmrtnosti obvykle zahrnujeme ještě další veličinu, která vyjadřuje dopad zdravotních obtíží v průběhu života. K rokům ztraceným kvůli předčasnému úmrtí přičítáme zlomek doby, kterou pacient neprožil „na sto procent“. Pro účely zjednodušeného výpočtu můžeme započítat, že prodělání covidu odpovídá v průměru dvanácti dnům ztraceného života, tedy třicetině roku. Jedná se o velmi hrubý odhad: podstatná část nakažených prožije nemoc bezpříznakově, zatímco jiní můžou trpět násobně delší dobu, případně celoživotně (pokud by prodělané onemocnění u podstatné části nakažených způsobovalo zásadní trvalé následky, číslo by mohlo raketově vzrůst – ale zatím o tom nevíme).

Podle Google se celkově nakazilo asi třicet milionů lidí; k oněm šesti milionům let tak můžeme přičíst ještě sedmý milion jako vyčíslení ztráty, kterou virus způsobil nakaženým, kteří se vyléčili. Přepočteno na světovou populaci se jedná o ztrátu sta let života na každých sto tisíc obyvatel. Nebo, vyjdeme-li z horní hranice jedenácti let, dostaneme se kousek pod dvě stě let. Covid přitom „ve velkém“ po světě řádí asi půl roku, takže roční dopad může být zhruba dvojnásobný: 200–360 ztracených let na sto tisíc obyvatel. Anebo dvojnásobek, pokud budeme předpokládat, že statistiky Google prezentují polovinu skutečných úmrtí.

V kontextu dat Světové zdravotnické organizace o dopadech jiných onemocnění – třeba Alzheimerovy choroby (400 let na sto tisíc obyvatel), depresivních poruch (730 na statisícové stádo) nebo úhrnu rakovin (3000 let) – covid nebude vypadat tak strašidelně. Hrozivě naopak může ve srovnání s covidem působit tisíc ztracených let na sto tisíc obyvatel, za které může nedostatek živin (respektive 287 let ztraceného života, za něž může nedostatek bílkovin a energie: tedy ne nekvalitní strava, ale úplný hlad).

Výsledné stovky let ztraceného života na sto tisíc obyvatel překvapivě dobře odpovídají závěrům analýzy italských dat z jarního rozpuku pandemie v Evropě: podle té stojí covid 201 let na sto tisíc obyvatel. Shoda mě překvapuje o to víc, že oba odhady vychází z úplně jiných populací. Dopady onemocnění totiž závisí na společnosti. Šíření se dramaticky liší podle přijatých opatření a mortalita v závislosti na možnostech zdravotního systému. V zemích, kde protiepidemiologická opatření účinně zamezí šíření viru a kvalitní a kvalitní zdravotní systém pomůže přežít těm, u kterých se symptomy projeví obzvlášť nebezpečně, hodnoty budou zásadně nižší než tam, kde virus může působit bez intervencí.

Jasně to vidíme v Česku: kruté restrikce a pokročilé zdravotnictví znamenaly nákazu 50 tisíc osob a úmrtí 500 spoluobčanů – tedy asi dva tisíce ztracených let na oněch týdnech, které lidé prožili vinou nákazy nekvalitně, a tři tisíce ztracených let vinou předčasných úmrtí (Tentokrát volím jen oněch konzervativních šest let, protože jsme na rozdíl od Itálie netrpěli přehlceným zdravotnictvím. Lze tedy předpokládat, že lékaři pomohli, komu bylo pomoci – a ti, kdo zemřeli u nás, byli „nemocnější“ než italské oběti, a tedy by jim i bez covidu zbývalo méně života). Pokud je rozdělíme mezi desetimilionový národ, vyjde nám ztráta 0,2 dne per capita. Což samo o sobě není až tak zlé – kdyby se nekrocená epidemie nerozmáhala exponenciálně.

Exponenciální panika

Ani onen exponenciální růst přitom nemusí vést k dystopickým závěrům. Pokud bychom si zvládli udržet zdravotní systém na úrovni přehlcené Itálie, doba dožití průměrného nakaženého by se zkrátila o týdny, maximálně pár měsíců (nízké jednotky procent úmrtnosti krát vyšší jednotky let ztraceného života). A srovnání s Itálií je velmi pesimistické: na rozdíl od dubna víme, čemu čelíme. Pro srovnání: průměrná doba dožití v Ústeckém kraji a v Praze se liší o tři roky. Narodit se v Ústí nad Labem je násobně nebezpečnější než dostat koronavirus.

Konejšivě působí i srovnání s psychiatrickými problémy. Před dopady viru nás pokročilé zdravotnictví umí ochránit nesrovnatelně lépe než třeba Indy nebo Brazilce, zatímco depresemi a Alzheimerem trpíme ve srovnání s většinou světa víc. Průměrného Čecha tak deprese ohrožují násobně víc než koronavirus.

Zároveň by ale bylo nezdravé to s optimismem přehánět. Scénáře o desetitisících mrtvých jsou nadsazené: jistě, pokud virus bude řádit po léta a všechny oběti sečteme, k těm desítkám tisíc vystoupají. Ale totéž lze říct i o autonehodách nebo čemkoli jiném. V ročním horizontu nás taková tragédie nečeká – byť by to asi bylo biologicky možné. Jako společnost se tomu umíme ubránit, stejně jako se bráníme raketovému vzestupu úmrtí v dopravě, který by nastal, kdybychom všichni brázdili své rodné obce stovkou a opilí. Kdyby to s námi šlo hodně z kopce, i ta nejhorší vláda přijme aspoň špatná opatření, ale lepší než nic. Jenže přesně takový scénář nechceme: byť by neznamenal žádné masové vymírání a většina lidí by žádnou oběť osobně neznala, stála by životy docela zbytečně. A opatření, která by v takovou chvíli byla logická, nutná a žádoucí, by každého z nás omezovala daleko víc než nepříjemný hadřík přes ústa a trocha distancu od lidí.

Pokud se málo chráníme před depresemi, zvyšujeme tím jejich výskyt každý u sebe. Pokud se přestaneme chránit před virovou pandemií, kromě dopadu na sebe samé tím zvyšujeme pravděpodobnost výskytu i u všech ostatních. I malé snížení rizika nákazy koronavirem může mít pro společnost větší efekt než výrazně vyšší snížení rizika třeba právě deprese – navzdory tomu, že pro průměrného člověka představuje deprese větší hrozbu než covid. Daleko větším prkotinám, než je covid, navíc obětujeme víc než občasné nošení roušky a vyhýbání se lidem, které nepotřebujeme potkat. Pro posílení preventivních opatření svědčí i predikce vývoje v následujících měsících, které nás co do zhoršování řadí na chvost Evropy: horší trend předpokládají jen u Chorvatska, Malty, Řecka a Ukrajiny.

Škody napáchané jarními restrikcemi nenapravíme a bylo by absurdní brojit proti umírněným opatřením, která pomáhají nákazu udržet v přijatelných mezích, ze vzteku, kolik jsme toho na obětovali a jak zbytečná oběť to byla, když ji naši představitelé nevyužili k vytvoření dlouhodobě funkčního konceptu. Že vláda na dva měsíce zavřela lidi do klecí a pak aktivně přispívala k šíření viru předvolebními meetingy a neochotou trvat na rozumných ochranných opatřeních, která po jarní maškarádě ztratila na popularitě, je smutné. Pokud samosprávy a bůhvíjaké spolky nepřestávají zvát občany na shromáždění po náměstích a návsích, je to o to absurdnější, že si šíření nákazy platíme z vlastních daní.

Kdybychom ale kvůli politické tragikomedii ztratili ochotu jednat racionálně i my sami, byli bychom úplně stejně pitomí. Anekdoty o tom, že virus své oběti atakuje až po půlnoci, kdy zavíráme hospody, nebo výhradně v těch ročnících, v nichž školy zavádějí roušky, možná znějí vtipně, ale míjejí podstatu věci, která je právě statistická. Je totiž docela jedno, jestli snížíme přenos ve dne nebo v noci, u Pepíků nebo u Marušek, ve školách nebo v hospodách. Pokud se někdo chlubí, že na něj si společnost nepřijde, a na ochranu z vysoka kašle, jednoduše tím svůj díl práce na společné ochraně svaluje na ostatní. Nic, co by nás bezprostředně ohrožovalo, ale nefér to je: asi jako předbíhat ve frontě nebo házet vajgly na zem.

Převzato z magazínu Finmag.cz se souhlasem redakce

Vojtěch Pišl