Přidat debatu mezi oblíbenéZasílat nové příspěvky e-mailem Base rate fallacy - casta chyba logiky

Uvadzam to tu preto, ze tento chybny vyklad "logiky" sa uz parkrat vyskytol a vo vlaknach o ockovani a Corone ho mozeme pozorovat coraz castejsie.
Tu je vysvetlenie pre tych par expertov, ktorych tu mame, specialne pre jedneho...pokusim sa o nemozne a podat to tak, aby to pochopil aj on;o).
O co ide?
Posluzime si udajmi z UK a pouzije ich koronove cisla.
K 9.7.2021 mali v UK 123 620 pripadov covidu delta. 10,834 z nich mali obe dávky vakciny, 71 392 nemalo ani jednu dávku. Celkovo zomrelo 257 ľudí, z čoho v rizikovej skupine starsích ako 50 rokov malo obe davky 116 ludi, 71 nemalo ani jednu.
Znamená to, že ockovanie nefunguje alebo je menej efektivne?
Pre niekoho urcite ano;o).
Pretoze spravili prave chybu nazyvanu base rate fallacy.

Ak sa pozrieme, kolko ludí k danemu datumu malo obe dávky vakcíny, tak je to takmer 20 miliónov, pricom ani jednu dávku nemalo približne 2 milióny.
Inak povedané, v 10-násobne pocetnejsej skupine mali 1,6-krát viac mrtvych.
Ak by sme to prepocitali, aby obe skupiny boli porovnateľné (to je to, co tu dost casto zdoraznujem), zistíme zrazu, že neockovaní zomierajú 6-krát viac.
Ak by sme porovnávanie rozšírili na všetky vekové skupiny staršie ako 18 rokov (kedze nizsie vekove kategorie sa neockuju a skresluju nam vysledky), tak by to bolo až 9-krát viac.

Priklad c.2.
Porovname si cisla z UK, JAR a Ruska.
UK 52% zaockovanost, Rusko 13% a JAR 3%.
Pocet novych pripadov na 1mil obyvatelov je 550 UK, 170 Rusko a 320 JAR.
To vyzera zle pre vakciny nie?
Pozrime si, ale umrtia.
Pocet umrti na 1mil obyvatleov je v UK 0.45, v Rusku 5 a v JAR 6.
Rozdiely sa mozu zdat male, ale ide rozdiely v rade, co je z pohladu statistiky uz daleko mimo za povolenu statisticku chybu a je to obrovsky rozdiel.
Inymi slovami...ako vidime virus sa v relativne vysoko zaockovanom UK siri momentalne trosku rychlejsie ako v Rusku a v JAR a napriek tomu tam umiera minimalne o jeden rad menej ludi ako v Rusku, co v JAR.
Ak by sme pouzili cisla hospitalizovanych dostaneme rovnake obrovske rozdiely, ktore hovoria v prospech ockovania.

V UK sa predpoklada, ze pocas tretej vlny v najhorsom scenari bude zomierat 150-200 ludi, co je 8x menej ako pocas prvej vlny. Momentalne sa to cislo hybe okolo 100 ludi/denne.
Uz toto je obrovsky rozdiel, ktory sa este navyse ak si uvedomime, ze porovnavame delta s alfa variantou a kedze delta je o 40-60% agresivnejsia ako alfa zistime, ze ide o fantasticke cisla, pretoze cislo 8x mozeme tym padom zvysit o tych 40-60%.

Jsou zobrazeny jen nové příspěvky. Zobrazit všechny
Předmět Autor Datum
ono prave tie percenta su skreslujuce. mas 100 ludi. 99 je zaockovanych, jeden nie je. 1 zaockovany…
fallon 09.08.2021 15:52
fallon
Přitom mnohem extrémnější (a tedy vhodnější do titulků) by bylo zasaženo jen přibliřně 1% očkovaných…
gilhad 09.08.2021 18:51
gilhad
Z definice pojmu medián je snad zřejmé, že na medián vždycky přesně půlka důchodců nedosáhne a druhá… nový
Araneus84 12.08.2021 16:19
Araneus84
medián ti zákonitě musí vyjít na x desetinných míst Tak to opravdu ne. Buď půjde o celé číslo nebo… nový
Wikan 12.08.2021 16:24
Wikan
Těsně vedle :) Medián je takové číslo, že nejméně půlka vzorků není větší (je menší a nebo rovna) a… nový
gilhad 12.08.2021 16:55
gilhad
Pleteš si medián s průměrem. Lidí, kteří berou medián bude minimálně :>: 1 (pokud by byl lichý poče… poslední
gilhad 12.08.2021 17:24
gilhad
Neni trochu prilis zakladat dalsi tema ke koronaviru? Nakonec i k ockovani tu je jedno tema. Myslim,…
RedMaX 09.08.2021 21:18
RedMaX
Toto nie je o koronaviruse, ale o logickom mysleni a o tom ako sa vyberaju ceresnicky z kolaca a vyd…
fleg 09.08.2021 21:21
fleg
Mne to prijde o koronaviru. K jabkam a hruskam mam jen ten poznatek, ze kdo teda urci co je jabko a…
RedMaX 09.08.2021 21:48
RedMaX
Pri base rate fallacy je praveze uplne jasne, co su jablka a co su hrusky. Napriklad mas statsitku,…
fleg 11.08.2021 09:05
fleg
To ses do té logiky nějak zamotal. Napriklad mas statsitku, ze 95% vrazd vykonaju pravaci. Su teda… nový
Pavel 11.08.2021 11:47
Pavel
Fleg měl napsat, že leváci jsou více nebezpeční, ašýbka slučílas :-) nový
L-Core 11.08.2021 14:11
L-Core
Da, pravilna. nový
fleg 12.08.2021 08:54
fleg

ono prave tie percenta su skreslujuce. mas 100 ludi. 99 je zaockovanych, jeden nie je. 1 zaockovany a 1 nezaockovany dostanu COVID. a bum, hned je senzacia - dvaja ludia s COVIDOM a z toho az 50% tvoria ludia zaockovany, ergo je ockovanie k prdu. logika antivaxerov.

Přitom mnohem extrémnější (a tedy vhodnější do titulků) by bylo zasaženo jen přibliřně 1% očkovaných, zato 100% neočkovaných - jenže zase to je houby tragédie ...

Mi připomíná jinou senzaci, která fakt novinama proběhla, že prý "V Čechác na medián důchodu nedosáhne ani polovina českých důchodců" - což je to naprosto očividná lež - z definice na něj dosáhne minimálně jedna polovina, ale možná i víc (důchod je na celé koruny, důchodců dost, takže rozumná šance je, že právě na mediánu se jich pohybuje dost) - jednak i kdyby to napsali správně, tak je to nic neříkající tvrzení, ke kterému netřeba znát kolik ti důchodci berou a jehož obdoba platí kdekoli na světě, včetně zemí, kde žádný důchody nejsou ...

Z definice pojmu medián je snad zřejmé, že na medián vždycky přesně půlka důchodců nedosáhne a druhá půlka má vic +- několik jednotek. Tomu se přesně říká medián, protože je to uprostřed. Tvl.
PS: Vzhledem k tomu, že důchody jsou různé, tak i medián ti zákonitě musí vyjít na x desetinných míst. Tedy počet lidí, kteří budou brát přesně medián bude 0, protože důchody se zaokrouhlusjí na celé koruny. Tím pádem logicky půlka musí brát míň a druhá půlka víc.
článek napsal zřejmě nějaký blbec, co netuší, co to medián je, a jen podobní lidé se nad tím pozastaví. :-D:))

Těsně vedle :) Medián je takové číslo, že nejméně půlka vzorků není větší (je menší a nebo rovna) a nejméně půlka vzorků není menší (je větší a nebo rovna) než toto číslo.

1 2 3 má medián přesně 2
1 10 10 10 10 10 10 10 11 má medián přesně 10
0 1 2 1000 má jako medián libovolné číslo z uzavřeného intervalu <1 .. 2>, tedy například 1 1.1 1.2 1.3 1.4 ... 1.723456789123456789 ... 2
1 2 100 1000 má jako mědián libovolné z čísel v uzavřeném intervalu <2 .. 100>, tedy například 2 100 3 15 27 99 56.789123456789

Ostatně viz též

https://cs.wikipedia.org/wiki/Medi%C3%A1n

Takže z definice je jasné,že minimálně polovina na medián dosáhne (má více nebo rovno) a že na medián nedosáhne maximálně polovina (ani o jednoho víc, ovšem může se stát, že na něj dosáhnou klidně i všichni, pokud by brali všichni stejně. Proto jsem taky uváděl jako jeden z příkladů státy, kde důchod nebere nikdo, každý má tedy 0 a všichni důchodci na medián přesně dosáhnou)

(a mimochodem medián obecně může být i například jedno číslo s desetinými místy, například v řadě ( 0 e π 10 100 ) je mediánem Ludolfovo číslo a to má desetiných míst dokonce nekonečně :-D )

Pleteš si medián s průměrem.
Lidí, kteří berou medián bude minimálně

:>: 1 (pokud by byl lichý počet vzorků a po seřazení dle velkosti se prostřední hodnota neopakovala ), (příklad 1 [2] 100 - medián je 2)
:>: 2 (pokud by byl sudý počet a jen jeden člověk by měl právě poslední hodnotu pod prostředkem a jen jeden hodnotu nad prostředkem ), (příklad 1 [2 | 30] 10000 - medián je cokoli od 2 do 30 včetně )
:>: ale nejpravděpodobněji celá řada, protože se důchody zaokrouhlují
:>: :>: a tak uprostřed té seřazené řady bude skupina lidí, kteří tu hodnotu mají, ( 1 2 3 [50 50 50 50 50 50 50 50 50] 10000 - medián je 50 )
:>: :>: nebo budou dvě skupiny lidí, z nichž jedna bere tu poslední hodnotu pod půlkou řady a druhá tu hodnotu nad půlkou řady (1 2 3 [50 50 50 50 | 60 60 60 60 60 60] 1000 - medián je cokoli mezi 50 a 60, včetne)

Pokud je půlka řady mezi dvěma čísly, značím ji svislítkem | medián značím hranatýma závorkama []

Povšimni si, že medián může, ale rozhodně nemusí obsahovat průměr (a pokud by se nejednalo o čísla, ale o něco jiného, seřaditelného (například slova řazená podle abecedy), tak medián může existovat, i když průměr neexistuje) (příklad auto bota [cylindr duha] encefalitida fialka medián je "cylindr" a "duha" , průměr zde nedává smysl )

Neni trochu prilis zakladat dalsi tema ke koronaviru? Nakonec i k ockovani tu je jedno tema. Myslim, ze tu byla nejaka nepsana dohoda, ze se kazdy bude se zakladanim temat brzdit, kdyz to bude k jedne a te same veci nebo velmi podobne, ktere mohou byt v jednom tematu.

Pri base rate fallacy je praveze uplne jasne, co su jablka a co su hrusky.
Napriklad mas statsitku, ze 95% vrazd vykonaju pravaci. Su teda pravaci nebezpecnejsi ako lavaci?
Nie, pretoze ked zohladnis fakt, ze 99% ludi su pravaci vyjde ti naopak vysledok, ze lavaci su menej nebezpecni.
To iste so soferovanim...90% zavinenych nehod sa stane muzom soferom...su muzi horsi soferi?
Nie, pretoze si nezohladnil fakt, ze vodicak ma viacej muzov ako zien a opat porovnavas neporovnatelne velke skupiny (mozno statsisticky su, uvadazam to len ako priklad).

To ses do té logiky nějak zamotal.

Napriklad mas statsitku, ze 95% vrazd vykonaju pravaci. Su teda pravaci nebezpecnejsi ako lavaci?
Nie, pretoze ked zohladnis fakt, ze 99% ludi su pravaci vyjde ti naopak vysledok, ze lavaci su menej nebezpecni.

Mějme 10.000 lidí a 100 zločinů.

99% praváků -> 95 % zločinů => 9.900 praváků / 95 zločinů
1% leváků -> 5 % zločinů => 100 leváků/ 5 zločinů

Jeden zločin provede průměrně každej 104. pravák a každej 20. levák.

Ehm...

Zpět do debat Přispět do debaty Nahoru