Diskuze
PRÁVO: Toto český sir Humphrey poněkud přehnal
Děkujeme za pochopení.
B. Meissner
Chybovost v obou kontrolních vzorcích
Chybovost v daném souboru dat je definována jako relativní počet chyb, tj. poměr počtu chybných údajů a celkového počtu údajů v souboru (viz Wikipedie). Chybovost v obou kontrolních vzorcích (přesně vzato jde o dva náhodné výběry ze souboru údajů) ) zjistíme takto: Oba dva kontrolní vzorky sloučíme do jednoho výběru, a to tak, že sečteme počet údajů v obou vzorcích (N = 8500+8500 = 17000) a sečteme i počet chyb v obou vzorcích (součet chyb označíme Nchyb). Chybovost C ve sloučeném výběru je podle definice jednoznačně dána poměrem C = Nchyb/N, v našem případě C = Nchyb/17000, procento chyb ve sloučeném výběru je 100 C. Snadno zjistíme, že 100 C je rovno průměrné hodnotě procenta chyb v prvním a druhém kontrolním vzorku. Tvrzení mkinisterstva vnitra, že formulace "chybovost v obou kontrolních vzorcích" připouští dva výklady je nesprávné.
Požadavek zákona vybrat z petičního archu obsahujícího údaje od NP podporovatelů dva vzorky s 8500 údaji a zjistit, zda procento chyb v těchto výběrech je menší nebo větší než 3% je zcela zbytečné. Stačí vyhodnotit jediný (sloučený) výběr s 17000 údaji, t.j. zjistit, kolik tento výběr obsahuje platných údajů Npl. Je-li celkový počet sebraných údajů (t.j. počet podporovatelů daného kandidáta) NP, vypočítáme odhad celkového počtu platných hlasů NPpl odevzdaných pro daného kandidáta podle vztahu NPpl = Npl x NP / 17000. Odhad NPpl vykazuje statistický rozptyl, závisí např. na velikosti použitého výběru. Bude-li nalezené NPpl jen mírně vyšší nebo dokonce mírně nižší než požadovaných (avšak nijak nezdůvodněných, jen nahodile zvolených!) 50000, může vzniknout spor, zda odchylka NPpl od 50000 je statisticky významná a zda tedy kandidát už splnil či ještě nesplnil požadavek zákona. Např. hodnoty NPpl uvedené v LN dne 24.11. pro J. Bobošíkovou, V. Dlouhého a T. Okamuru jsou 50793, 48929. 48829. Požadavek, aby dva byli vyřazeni, je podložen jen velice slabými argumenty. Doporučuji výrok, že splnili všichni. . .
M. Kosejk
?
Jsem žádný matematik, ale není to tak, že tady někteří jen znásilňují názvosloví - a konkrétně slovo: Celek, které pro mne - osobně - vždy znamenlo "sumu", tady součet?!
Příklad :
Prodám 2 domy klientovi - a z jednoho domu mám 4% provizi a z druhého 3% provizi.
V životě by mne nenapadlo uvažovat, kolik jsem vydělal CEKLEM procent. Celkem jsem vydělal součet částek, které odpovídají 4 a 3% z prodejních cen.
A o tom to podle mého je. Pokud máte 2 kontrolní vzorky, tak bych také neuvažoval o tom, že budu mluvit o nějakém "celkovém" počtu procent . A když se tam to slovo "celkem" objeví, tak bych taky myslel, že tvůrci zákona očekávali součet procent, i když vím, že je to matematická blbost.
F. Pavlis
Vážení
diskutréři. problém není v matematice, ani ve výkladu pravidel. Já sám se domnívám, ba jsme přesvědčen, že kandidát, který sbírá hlasy pro cokoli a je na tom osobně angažován, by za ty miliony do kampaně měl opatřit podpisy nezpochybnitelné. Zaměstnává na sbírání xy svých spolupracovníků, takže je na nich, aby všechny Hurvínky, Švejky a Dráty a j. vyloučili ihned po provedeném podpisu. Pokud to z nějakých důvodů nelze - ač nevím proč - rozhodne to soud. Jistě blbě pro někoho, ale s poslední autoritou. Žel, tak to normálně funguje. Milí odvolávající se kandidáti měli opatřit těch podpisů aspoň 1% populace, aby to vůbec mělo smysl. Co to je 50 000 podpisů ? a z toho 3-5 % srandovních ? To by si případný prezident měl opravdu pohlídat. Jinak je to na pováženou neschopa....
L. Matura
Re: Vážení
Kandidáty typu Švejk apod většinou vyškrtali sami kandidáti nebo jejich tým. Jak chcete ale získat nezpochybnitelné podpisy? Můžete požadovat občanku (na což ale nemáte právo) a i ti kteří by ji pro zápis i poskytli nevědí, jestli nejste falešní sbírači, kteří s údaji z občanky poběží pro úvěr do banky. A co duplicitní zápisy vědomych škodičů?
M. Šejna
logika je faulovaná
znovu jsem si přečetl námitky autora, znovu přečetl text zákona a musím konstatovat, že je to zcela jasné. Pokud někdo z textu zákona pochopil, že se musí z obou zkušebních vzorků sčítat procenta, tak by měl vrátit maturitní vyvědčení. Z textu zákona jasně vyplývá, že buďto úředníci zprůměrují procenta z kontrolovaných dvou vzorků, nebo sečtou počet chybných podpisů a vydělí to celkovým počtem kontrolovaných podpisů. V obou případěch je dosaženo stejného výsledku.
Pokud jsem to dobře pochopil, tak úřednící MV sečetli chybné hlasy z obou vzorků a vydělili je celkovým počtem kontrolovaných hlasů. To je správný postup dle dikce zákona a dle matematické logiky.
J. Dobrý
Re: logika je faulovaná
"Pokud jsem to dobře pochopil, tak úřednící MV sečetli chybné hlasy z obou vzorků a vydělili je celkovým počtem kontrolovaných hlasů"
Nepochopil, kdyby to udelali, nebyl by kolem toho takovy cirkus.
P. Gabriel st.
Pane Hasenkopfe,
Nechci zpochybňovat vaši způsobilost k elementárnímu chápání českých pojmů. Nicméně, je-li napsáno celkem, neznamená to ani průměrování ani jinou matematickou operaci ale prostý součet, nechť se vám to líbí, nebo ne. A mnohostránkové rozklady na tom nemohou zhola nic měnit.
L. Matura
Re: Pane Hasenkopfe,
A kde vidíte v příslušném odstavci zákona slovo CELKEM?
R. Langer
Ale pane autore,
to tak nemůžete vysvětlovat, to by mohlo dávat smysl! Takhle se přece pane politika nedělá, takhle ne! :-D
J. Kubička
Problém je v tom zákoně
MV nepochybně interpretovalo ten zákon tak, že to z hlediska běžných statistických postupů nedává smysl. Ovšem zákon, ve kterém se počítá s náhodnými vzorky a odhady, je sám o sobě problematický. I kdyby byl aplikován správně, může se stát, že kandidaturu ovlivní náhoda.
U náhodného namátkového vzorku je důležité, aby byl opravdu náhodný a tudíž v zákoně měla být popsaná procedura náhodného výběru to tam není). Bylo spočítáno, že rozdíly v procentech mezi vzorky jsou tak velké, že pravděpodobně nevnikly náhodou. Vytvořit opravdu náhodný výběr není snadné a zdá se že MV vhodnou metodu nepoužilo. Korektnější by bylo žádat podpisů méně a ověřovat všechny.
J. Dobrý
Re: Problém je v tom zákoně
Vybiral se arch, ne primarne konkretni podpis. To je prvni chyba.
Druha chyba jsou duplicity: http://paragraphos.pecina.cz/2012/11/jak-je-to-s-duplicitami-aneb-mala-nocni.html
J. Kalina
prosím o logiku, zvláště budouli soudy
Kandidát má mít dle ústany 50 000 správných podpisů. Při ověřování je možná nějaká benevolence ve prospěch kamdidáta, ale nikoliv proti němu. Viz zrušení ponižující "roboty" ˇ(stanovené zákonem) US pro nezaměstnané. Prostě ústavní soud by se měl točit na těch 50 000 a říci, že není možné nějakými přibllými zákony a metodami vyhodit kandidáta, který je reálně má. Viz tento příklad: 52 000 podpisů a 3% chybných je 50 440 platných a 1560 neplatných --> kandidát má opravdu splněno. Ne ovšem dle MV. V obou vzorcích se trefíme přesně na 3% neplatných a co?? Odečtou mu snad 2 x 8 500 = 17 000 nebo jen 510 což jsou 3% z 17 000?? Obojí je blbost. Přitom by stačilo napsat:- budeli pokud v prvním vzorku chybovost pod 3%, bude vztažena na všechny podpisy
- budeli v prvním vzorku chybovost 3% a více, použije se druhý vzorek. Klesneli, bude se předpokládat, že chybovost v těchto vzorcích je i celková chybovost.
- pokud by chybovost v druhém vzorku byla větší než v prvním, pokračuje se třetím vzorkem (případně dalšími) dokud chybovost posledního vzorku neklesne pod chybovost předposlední.
Nejmenší počet podpisů v jednom kontrolním vzorku nesmí klesnout pod 8 500 podpisů.
A pro blby z MV a i jiné bych nakonec dodal:% chybovosti se počítá z počtu všech platných i neplatných hlasů v použitých vzorcích. Ani tento postup však není odolný proti záměrně upraveným výběrům. 1560 neplatných podpisů (viz výše) soustředěných do 1 vzorku činí cca 18 %. To by asi nikdo neudělal neb ve druhém by naměři 0% chyb. Ale kdyby to rozprostřel do 3 vzorků aby chyby tvořili 6,5,4 %, kandidát neprochází.Takže si odhadněme: u kandidátů s počty na hraně múže ÚS klidně nařídit překontrolovat všechny podpisy a zjistit to přesně. Tipněme si, který z kandidátů to bude požadoval??
J. Dobrý
Re: prosím o logiku, zvláště budouli soudy
"dokud chybovost posledního vzorku neklesne pod chybovost předposlední"
Chyba! Ciste statisticky diky pocitani duplicit i pres predchozi vzorky (postup MV) bude mit kazdy dalsi vzorek vyssi chybovost nez predchozi. Pribyva odhalenych duplicit.
M. Šejna
sečíst nebo zprůměrovat?
tedy já nevím, ale asi jsem autora článku nepochopil. Po celou dobu čtení jeho článku jsem měl pocit, že pokud porovnávám výsledky ze dvou stejně velkých skupin, pak je úplně jedno, zda k celkovému výsledku dojdu součtem, nebo průměrováním. Ale asi jsem matematický analfabet. Takže jsem na to šel přes experiment, kde vstupní data byla následující: první vzorek 8500 podpisů měl 4% vadných podpisů. To je 340. Druhý vzorek 8500 podpisů měl 5% vadných podpisů. To je 425. Celkem bylo kontrolováno 17 tisíc podpisů (2 x 8500). Tak a teď to tedy přepočítám:
- použiji metodu průměrování. Průměr čísel 3% a 4% je 4,5%. Kolik je 4,5% ze 17000 podpisů? Odpověď je: 765 podpisů.
- pro jistotu použiji i druhou metodu, tedy součet. 340 plus 425 je 765.
Pak jsem pro jistotu spočítal, kolik procent je 765 ze 17000 podpisů. VÝSLEDEK je 4,5%.
Výsledek je tedy pokaždé shodný. Ať sčítám, nebo průměruji. Tak, a teď by mě zajimalo, co je na tom špatně.
M. Šejna
chybička se vloudila
chtěl jsem napsat "průměr čísel 5% a 4% je 4,5%. Ruka byla rychlejší než mozek, a tak jsem místo čísla 5 napsal číslo 3.
J. Dobrý
prumerovani
Slovo "prumerovani" bych nepouzival.
Zpravny postup ziskani hodnoty ktera: "procentuálně odpovídá chybovosti v obou kontrolních vzorcích"
Je secist absolutni pocet chyb a vydelit celkovou velikosti vzorku.
Ano, vysledek v tomto pripade je stejny jako prumerovani. Predevsim je ale presne podle dikce zakona. Nemuze vzniknout namitka, ze o prumerovani se v zakone nemluvi. Je to primocare pochopitelne.
M. Šejna
přesně tak
pokud totiž použiji dvě stejně velké kontrolní skupiny, pak je úplně jedno, zda použiji metodu průměrování, nebo metodu součtu. Pokaždé mi výjde stejný výsledek.
Vyhledávání
TIRÁŽ NEVIDITELNÉHO PSA
Toto je DENÍK. Do sítě jde obvykle nejpozději do 8.00 hod. aktuálního dne. Pokud zaspím, opiji se, zešílím nebo se zastřelím, patřičně na to upozorním - neboť jen v takovém případě vyjde Pes jindy, eventuálně nikdy. Šéfredaktor Ondřej Neff (nickname Aston). Příspěvky laskavě posílejte na adresu redakce.
ondrejneff@gmail.comRubriku Zvířetník vede Lika.
zviretnik.lika@gmail.comHYENA
Tradiční verze Neviditelného psa. Sestává ze sekce Stručně a z článků Ondřeje Neffa - Politický cirkus a Jak život jde. Vychází od pondělka do pátku.
https://www.hyena.cz