Neviditelný pes

POLEMIKA: Ještě jedna rada, zejména panu Brezinovi

6.5.2008

Je to sice již poněkud únavné, ale musím reagovat na článek pana Breziny Velká rada klimatickým alarmistům. Když pan Brezina tvrdí, že by se diskuse „…neměla uchylovat k „podpásovým útokům“…“, dalo by se s tím souhlasit. Pro pana Brezinu to ale asi znamená jen to, že on vůči ostatním podpásovky používat může, ostatní vůči němu ale ne. Jak by mi jinak vysvětlil ty urážky, které vůči mě i dalším diskutujícím použil v diskusích (nejen) na Neviditelném psu? Navíc ale má i evidentní zmatek v pojmech, když „radí“ jakýmsi klimatickým alarmistům, ovšem často uvádí mé jméno…

V úvodu si však nemohu odpustit jednu osobnější věc. Pan Brezina totiž začal svůj článek také dost osobně, když mě nazval „politickým klimatologem“. Od člověka, který své klimatologické diletantství kombinuje s demagogií, to vyznívá obzvlášť komicky. Jen bych rád zdůraznil, že v případě pana Breziny slova „diletantství“, „demagogie“ a podobná, která používám nebo jsem použil, v žádném případě nejsou a nikdy nebyla míněna jako urážky (to si asi pan Brezina něco špatně vyložil), ale jen jako prosté konstatování stavu jeho znalostí klimatologie a způsobu argumentace.

Dále v článku pan Brezina, možná z nedostatku vlastních argumentů, ocitoval lživá tvrzení pana Motla z článku Pravdu má Hrad, nikoli Hradec. Pan Motl v něm tvrdí, že prý používám při zpracování dat následující algoritmus: „Pokud studujete data z nějaké oblasti a pokud z nich plyne trend oteplování, tak ho publikujte a vášnivě ho propagujte v médiích … Pokud z nich plyne něco jiného, vymyslete jiný způsob, jak data reprezentovat, oříznout, interpolovat, interpretovat, zašeptat nebo úplně zahodit.“ Tuhle Motlovu lež používá pan Brezina asi jako důkaz mého „kouzlení s daty“. Je to skutečně půvabný „důkaz Motlem“. Na zmíněný článek pana Motla jsem reagoval v článku Ono někdy úplně stačí vzít si data… a na tom nemám, co bych měnil. Zajímalo by mě ale, kde pan Brezina bere tu drzost dávat takové postupy do souvislosti se mnou, když on sám úplně vážně argumentuje studiemi, kde je zcela účelově „odříznuto“ a „zašeptáno“ celé poslední čtvrtstoletí, nehodící se do jeho ideologie. To nám ostatně sám pěkně předvedl v článku Globální oteplování – mnoho povyku pro nic (poslední graf v kapitole 2, graf v kapitole 3).

Hned v dalším odstavci ale pan Brezina píše: „Používáním "cinknutých" dat se Metelka snaží za každou cenu obhájit dnes už zcela neudržitelný tzv. hokejkový graf amerického klimatologa Michaela Manna…“ . Jistě by pro pana Brezinu neměl být žádný velký problém toto tvrzení také doložit. Měl by veřejně ukázat ta „cinknutá data“, měl by jasně doložit kdy, kde a jak jsem je použil nebo kdy jsem záměrně použil nějaké nekorektní statistické metody. Pokud to ovšem pan Brezina neudělá, pak je jen obyčejný lhář.

Další část článku pana Breziny se týká jeho oblíbeného tématu – „Mannovy hokejky“. Pan Brezina nám zde pěkně ukazuje, že metoda analýzy hlavních komponent, kterou sám zmiňuje, je mu značně cizí. Že vlastně vůbec neví, jak tato metoda pracuje, jak a proč Mann tuto metodu použil nebo co mu McIntyre a McKitrick vyčítali. Podle pana Breziny totiž zřejmě stačí postupovat podle zásady „čemu nerozumím, to buď neexistuje nebo to mají špatně“…

Kolem způsobu, jakým Mann použil analýzu hlavních komponent, koluje spousta polopravd i nepravd. Pokud se ale chceme podívat na celý problém trochu podrobněji, je jasné, že se to neobejde bez alespoň základních znalostí této metody. Nechci dělat z Neviditelného psa učebnici statistiky, takže budu velmi rád, pokud si následující text přečtou (a vyjádří se k němu) statistici, kteří metodu PCA dobře znají. Pro ty, kteří tuto metodu neznají, ale chtěli by se s jejími principy trochu seznámit, mohu doporučit např. tento text nebo tento text. No a pro ty, kteří ji neznají a ani znát nechtějí žádnou radu nemám. Těm už asi opravdu nezbude nic jiného, než se dál držet své ideologie…

Celý spor začal zveřejněním této práce Manna, Bradleyho a Hughese v časopise Nature (číslo 392) v roce 1998. Po nějakém čase reagovali pánové McIntyre (mineralog) a McKitrick (ekonom), kteří údajně našli v Mannově práci řadu chyb. Svou reakci chtěli zveřejnit rovněž v časopise Nature, byla však v recenzním řízení odmítnuta (z důvodu řady faktických chyb v textu), tak ji publikovali v ekonomickém časopise Energy&Environment, ročník 14 (2003), číslo 6. Text je k dispozici zde.

Po pravdě řečeno – nevím, proč si tito pánové vybrali zrovna Manna. V době zveřejnění jejich práce totiž už existovalo několik dalších studií, které se rovněž zabývaly problémem rekonstrukce vývoje teplot za posledních několik staletí pomocí tzv. „proxy“ dat (tj. nepřímých měření, jejichž hodnoty mají kvantifikovatelný vztah k teplotám, např. letokruhy, sedimenty, analýza ledovců a podobně) a výsledky nebyly nepodobné těm Mannovým. A další práce tohoto typu byly publikovány v dalších letech. V poslední zprávě IPCC je jich už více než 10 (Kapitola 6 – Paleoclimate, str. 467, obr. 6.10).

McIntyre a McKitrick ale nejen kritizovali Manna za jeho údajné chyby při zpracování dat, ale sestavili i svou vlastní „rekonstrukci“, která měla ukázat, že žádná „hokejka“ v průběhu teplot vlastně neexistuje a že teploty v době středověkého „klimatického optima“ byly vyšší, než jaké jsou dnes.

Reakcí na práce McIntyra a McKitricka byly samozřejmě další práce klimatologů, kteří podrobně analyzovali jak Mannovu práci, tak i práce McIntyra a McKitricka. Prokázali, že Mannova rekonstrukce, i když obsahuje některé problematičtější partie, je v zásadě zpracována správně, že je dostatečně robustní vzhledem ke změně metodik a do značné míry i použitých (nebo nepoužitých) datových souborů a že je dobře validovaná pomocí přístrojových dat z 19. století. Naopak v McIntyrově a McKitrickově rekonstrukci našli řadu i zcela zásadních chyb a problémů.

Jak to tedy je? Podívejme se, co McIntyre a McKitrick Mannovi vyčítali:

1. Data: McIntyre a McKitrick vyčítali Mannovi např. to, že vyřadil některá data ze zpracování. Ano, to je pravda. Vyřadil několik časových řad v období 15. a 16. století, které byly podle použitých testů kvality poněkud podezřelé. Nicméně ukázalo se (resp. ukázali to autoři této práce), že kdyby Mann tato data ve zpracování ponechal, zvýšilo by to odhad průměrné teploty v 15. a 16. století o 0,05 až 0,1 st.C. Tedy rozhodně ne na hodnoty, které ve své rekonstrukci zjistili McIntyre a McKitrick (ti byli až cca 0,5 st.C. nad Mannovými daty). I tak ale nebylo Mannovo vyřazení těchto dat zcela bezdůvodné a zatím je to otázka diskuse, zda tato data mě použít nebo ne. Autoři ale také zjistili, že pánové McIntyre a McKitrick sami vyřadili právě v období 15. a 16. století ze zpracování celou jednu velkou databázi North American ITRDB (International Tree Ring Data Bank) a řadu ‘St. Anne’ Northern Treeline. Tím vyřadili ze zpracování kolem 70% dat. To je ukázáno např. zde. Toto vyřazení ovšem mělo na jejich výsledky zásadní vliv.

2. Předzpracování dat: McIntyre a McKitrck kritizovali Manna za to, že údajně nesprávně standardizoval data před tím, než na ně použije analýzu hlavních komponent. Konkrétně že použil chybné „referenční období“ a tato chybná standardizace prý ovlivnila výsledky. Je to nesmysl. Každá taková standardizace je vlastně lineární transformací souřadného systému, ve kterém jsou data vyjádřena. Samotná analýza hlavních komponent je ovšem také jen lineární transformace souřadného systému. Použijeme-li před analýzou hlavních komponent různé lineární transformace (standardizace) dat, dostaneme sice formálně poněkud různé výsledky, ale pořád to budou výsledky, reprezentující jedno a to samé. Stejně jako třeba číslo 15 je možné vyjádřit jako součet 7+8 nebo 1+2+3+4+5. Formálně různé, výsledek stejný. Navíc tato práce jasně ukázala, že i standardizace přesně podle McIntyra a McKitricka vede k výsledkům, které jsou prakticky shodné s Mannem, pokud se ovšem analýza hlavních komponent použije správně. A to je ten problém (viz následující bod).

3. Analýza hlavních komponent: Mannovi vyšlo (při standardizaci dat, kterou použil), že musí vzít do dalšího zpracování 2 mody analýzy hlavních komponent. McIntyre a McKitrick ale použili jinou metodu standardizace a měli si tedy znovu otestovat, kolik komponent obsahuje užitečný signál. To však neudělali a vzali, přesně podle Manna, první 2 komponenty, ačkoli oni jich podle objektivních kritérií měli vzít 5. Tím se dopustili dost zásadní chyby a zanedbali kolem 40% užitečné informace, obsažené v datech. Když znovu zmíním příklad z minulého odstavce, to, že někdo zjistí, že číslo 15 lze vyjádřit pomocí součtu dvou po sobě jdoucích přirozených čísel (7+8) neznamená, že když vezmu jiná dvě čísla, dostanu stejný výsledek. Někdy prostě musím použít těch čísel víc, abych dostal stejný výsledek (třeba 1+2+3+4+5). McIntyrovi a McKitrickovi nepřišlo divné dokonce ani to, že zatímco Mann vysvětlil pomocí prvních dvou modů komponentní analýzy celkem 48% variability původních dat, oni sami jen 29%. Ovšem kdyby použili prvních 5 modů tak, jak to měli udělat, vysvětlili by skoro přesně stejných 48%, jako Mann pomocí dvou komponent. Problém s „hokejkou“ byl ale hlavně v tom, že Mann měl svou „hokejku“ obsaženou již v 1. modu komponentní analýzy, zatímco McIntyrovi a McKitrickovi (vzhledem k jiné standardizaci dat) vyšla až ve 4. modu, který ale chybně vyřadili. Kdyby zpracovali všech 5 prvních modů komponentní analýzy tak, jak měli, tu „hokejku“ by ve výsledku dostali také. Kromě toho v této práci je jasně ukázáno, že výsledky rekonstrukce nakonec ani nejsou závislé na tom, zda Mann použil analýzu hlavních komponent. Autoři totiž zpracovali stejná data jako Mann, ale naprosto jinou metodikou (CFR – Climate Field Reconstruction, což je metoda, založená na násobné regresi). Došli k závěrům, které jsou zcela srovnatelné s Mannem.

4. Mannova metoda analýzy hlavních komponent údajně sama generuje „hokejku“: Jinak řečeno – Mannova „hokejka“ je údajně artefakt, vzniklý při zpracování dat a nikoli reálný jev. Tady se ale pan Brezina opět mýlí, když o Mannovi píše: „Jeho "cinkutá" metoda tak produkovala hokejkový graf dokonce i v případě, že byla "nakrmena" jen náhodným šumem“. Ale on není „šum“ jako „šum“. O nejčastěji používaném „bílém šumu“ (tj. nekorelovaném) Brezinovo tvrzení v žádném případě neplatí. McIntyre a McKitrick měli na mysli tzv. „rudý šum“. To už ale není čistě náhodná záležitost, protože každá hodnota tohoto „šumu“ je náhodná jen zčásti, ale je také částečně ovlivněna minulými hodnotami v dané časové řadě („rudý šum“ má nenulové autokorelace pro nenulové časové posuny). Tohle už je trochu odbornější věc, ale pokusím se vysvětlit. Už v této práci jsem kdysi dávno ukázal, že v náhodně generovaných časových řadách mohou za určitých okolností vznikat tzv. „náhodné trendy“ čistě jako důsledek působení náhodných vlivů na systém s vhodnou autokorelační strukturou. A také to že právě teplotní řady takovou vhodnou strukturu mohou mít. Trendy v teplotních řadách tedy mohou být v principu dvojího druhu. Buď nenáhodné (fyzikálně podmíněné), dané reálnými fyzikálními důvody (např. změna radiační bilance působením skleníkových plynů), nebo to mohou být trendy náhodné, které jsou pouze důsledkem působení náhodných faktorů na systém s vhodnou autokorelační strukturou. A právě tyto dva typy trendů je třeba odlišit. Proto se jako „testovací“ používají právě řady s charakterem „rudého šumu“. Ty mají podobnou autokorelační strukturu jako skutečné teplotní řady, obsahují však pouze náhodný signál a nikoli signál fyzikální. Porovnáme-li pak výsledky analýzy hlavních komponent na skutečných datech s výsledky téže analýzy na řadách „rudého šumu“, můžeme je přímo porovnat. Ty mody komponentní analýzy zpracovávaných dat, které se výrazně liší od výsledků pouze na datech s „rudým šumem“, tedy obsahují kromě náhodných trendů i nějaký využitelný fyzikální signál. Tato data tedy má smysl dále zpracovávat. Kde naopak nelze výsledky na zpracovávaných datech odlišit od výsledků na „rudém šumu“, tam fyzikální signál není nebo je zanedbatelný (dominuje tam signál náhodný) a tyto mody se tedy zanedbávají. To je ostatně princip tzv. Preisendorferova kriteria určení počtu modů analýzy hlavních komponent, které se berou pro další zpracování. Výsledky analýzy hlavních komponent na reálných datech se zde porovnávají s výsledky na řadách „rudého šumu“ tak, aby se odlišily čistě „náhodné trendy“ (které vznikají pouze v důsledku autokorelační struktury časové řady) od fyzikálně podmíněných trendů. Podstatné ale je, že tady žádná „hokejka“ nevzniká jako důsledek samotné analýzy hlavních komponent, ale ty „hokejky“ jsou generovány už v „testovacích“ řadách „rudého šumu“. To ostatně potvrzuje i panem Brezinou uvedená (ale jím také špatně pochopená) publikace, kde se píše: „The reason is that in some of the red noise series there is a ‘pseudo-trend’ at the end, where a random shock causes the data to drift upwards, and before it can decay back to the mean the series comes to an end“. Jistě. V generované řadě s charakterem rudého šumu může vzniknout náhodný trend („pseudo-trend“) kdekoli, může být analogický „oteplování“ i „ochlazování“, může se kdykoli náhodně zastavit nebo různě změnit. Takže je také jasné, že pokud společně zpracujeme více takových náhodně vygenerovaných řad nějakou multivariační metodou (např. právě analýzou hlavních komponent), bude variabilita dat na konci řady větší, než na jejím začátku a analýza hlavních komponent bude pochopitelně indikovat (v absolutní hodnotě) vyšší skóre na konci řady než na jejím začátku. Možná i jakousi „hokejku“…

Takže malé shrnutí tohoto bodu: To, že zpracování časových řad s charakterem „rudého šumu“ pomocí analýzy hlavních komponent může dát cosi, vzdáleně podobného „hokejce“, je fakt. Tu „hokejku“ tam ale negeneruje metoda (analýza hlavních komponent), jak se mylně domnívá pan Brezina, ty „hokejky“ jsou totiž obsaženy už v náhodně generovaných řadách. Ale protože jsou to řady náhodně generované, neobsahují žádný fyzikální signál a nemělo by smysl je dále zpracovávat. Preisendorferovo kritérium (které Mann použil, ale McIntyre a McKitrick buď ne nebo špatně) umožňuje, zjednodušeně vyjádřeno, právě odlišit ty „hokejky“, které obsahují nějaký využitelný fyzikální signál (např. oteplování) od „hokejek“, bez fyzikálního signálu, vzniklých náhodně, čistě v důsledku autokorelační struktury zpracovávaných časových řad.

5. Validace výsledků: McIntyre a McKitrick neprovedli validaci výsledků porovnáním s přímo měřenými hodnotami za období 19. století. To za ně udělali až autoři této práce. Ukázalo se, že Mannova rekonstrukce splňuje podmínky validace, zatímco McIntyrova a McKitrickova nikoli. Pokud ovšem nějaká rekonstrukce vývoje teplot nedokáže dobře reprodukovat výsledky přístrojových měření – co s ní?

Další velký problém McIntyra a McKitricka (ale nejsou v tom zdaleka sami) je v tom, že brali zpracovávaná data čistě formálně, jen jako čísla a zřejmě nebyli schopni brát v úvahu jejich fyzikální význam. Ono totiž zdaleka ne všechno, co je dobře definované a lze to udělat v matematice, lze také rozumně použít ve fyzice. Pokud ale někdo zpracovává fyzikální data, měl by z celého matematického aparátu používat pouze ten, kterým se dostane k fyzikálně smysluplným výsledkům. Pro zajímavost - podívejte se, jak McKitrick počítal průměrné teploty. Jako jakousi „střední kvadratickou teplotu“. V jedné ze svých prací (str.10) to zdůvodnil následovně: „…treat each month as a vector of 10 observed temperatures, and define the aggregate as the norm of the vector (with temperatures in Kelvins). This is a perfectly standard way in algebra to take the magnitude of a multidimensional array. Converted to an average it implies a root mean square rule...”. Tedy v algebře standardní metoda. Čistě matematicky je to asi v pořádku, ale fyzikálně a u teplot je to naprostý nesmysl. Lze to demonstrovat na jednoduchém příkladu: máme 1 kg vody 10 st.C. teplé a 1 kg vody 30 st.C. teplé. Smícháme je dohromady a dostaneme 2 kg vody. Jakou průměrnou teplotu bude mít ta voda? Podle selského rozumu 20 st.C. Podle termodynamiky 20 st.C. Podle McKitrickova „středního kvadratického“ průměru 20,2 st.C. Možná drobnost, ale tady se pořád bavíme o změnách teploty vzduchu o desetiny st.C., takže každá taková chyba může zásadně ovlivnit výsledky. Nehledě na to, že McKitrick by mohl mít se svou průměrnou teplotou pravdu pouze za předpokladu, že neplatí zákon zachování energie. Ten by se mu ale vyvracel asi dost těžko. I když – kdo ví???....

Na závěr už jen několik poznámek k páně Brezinovým tvrzením: „Cituji v ní celou řadu klimatických odborníků, kteří jsou s odkazem na aktuální data přesvědčeni, že maxima oteplování už bylo dosaženo a že se pomalu začíná ochlazovat.“ nebo „…současné výsledky měření naznačují něco úplně jiného, než by si klimatičtí alarmisté přáli. Klima se láme…“ Tyto názory „odborníků“ často vycházejí z vývoje teplot za posledních 7-8 let a někteří z nich vyvozují poměrně zásadní závěry o zastavení oteplování nebo dokonce o začátku ochlazování. Jak jsou takové úvahy spolehlivé, to lze ukázat na grafech dat GISS nebo CRU, do kterých byly přidány klouzavé osmileté lineární trendy. Je vidět, že kolem roku 1986 nebo 1994 byly tyto osmileté trendy dokonce negativní (což teď za posledních 8 let ani nejsou). Stačí se ale podívat na uvedené grafy a je hned vidět, jak „spolehlivě“ takovéto výkyvy trendu indikují nastupující zastavení oteplování nebo dokonce začátek ochlazování.

Takže ta malá rada nakonec: Pane Brezino, než začnete dávat někomu své „velké rady“, měl byste si o problematice něco nastudovat. Není totiž vždy dobré bez ověření papouškovat všechno, co si někde přečtete, jen proto, že se Vám to „hodí do krámu“. Takhle se jen ztrapňujete… Ale na druhou stranu – i na to máte právo….

Úplně závěrem se panu Brezinovi omlouvám, pokud uvedené informace neodpovídají jeho ideologii a dogmatům, ale co se dá dělat…



zpět na článek