Přejít na obsah


Fotka

Pravděpodobnost a statistika


  • Pokud chcete vložit odpověď, přihlašte se
51 odpovědí na toto téma

#21 dr.vota

dr.vota

    Advanced Member

  • Members
  • PipPipPip
  • 5 022 příspěvků(y)

Publikováno 11 listopad 2018 - 20:24

Vláček správně...proto jsem odkazoval na narozeninový paradox.


  • 0

#22 Shashlick

Shashlick

    Advanced Member

  • Members
  • PipPipPip
  • 303 příspěvků(y)

Publikováno 11 listopad 2018 - 21:01

Já mám několik semestrů na VŠ. Věř mi, že to mám dobře. 

Uznávám chybu, asi jsem se unáhlil v úsudku. Ani devět let studia matematiky na VŠ a doktorské státnice ze statistiky tomu nezabránily :)

Proto bych se raději na absolvované vzdělání neodkazoval. I když uznávám, u mě zvítězilo spíš podvědomé potlačování spoléhání se na tuto oblast matematiky. 


  • 2
Jde se lovit!

#23 d-n

d-n

    Advanced Member

  • Members
  • PipPipPip
  • 291 příspěvků(y)

Publikováno 12 listopad 2018 - 0:00

Ono těch 1/365 je jen taková aproximace. Když nebudeme uvažovat singulární případ keše umístěné, publikované a odlovené v ten samý den, tak během prvního roku od umístění není možné dosáhnout shody. Během druhého roku bude pravděpodobnost průměrně log(2)/365 a postupně se vzrůstajícím stářím keše bude konvergovat k těm 1/365. Čili hodně bude záviset, jak staré keše daný kačer loví - pokud loví pouze místní keše zpravidla během prvního roku od publikace, bude potřebovat mnohem více než někdo, kdo má hodnoty věku keší v době odlovu zastoupeny rovnoměrněji.


  • 0

#24 mpik

mpik

    Advanced Member

  • Members
  • PipPipPip
  • 7 382 příspěvků(y)

Publikováno 12 listopad 2018 - 7:35

Celá tato statistika je založena na tom, že rozložení je čistě náhodné. Což není. Např. v létě, kdy i reviewři mívají dovolenou, se schvaluje méně a dělají se fronty. Někdo schvaluje i na Štědrý den, Silvestra a Nový rok, většinou ale ne. Nebo tak tematické keše, že už z názvu je datum vidět a tedy ulovit je v konkrétní den není už čístá náhoda. (ale zase - keš k Novému roku bude mít datum umístění asi dřívější). A dál - málokdo si uvědomí, že statistika funguje jen zpětně, v oboru velkých čísel. Bude fungovat když budu počítat, kolik lidí vyhraje ve Sportce, ale nebude fungovat, když budu chtít vypočítat, jestli zrovna já vyhraju. A už vůbec ne, že když 49x prohraju tam, kde je pravděpodobnost 1:50 tak příště už musím vyhrát.


  • 2

#25 Roman_Jaromer

Roman_Jaromer

    Roman_Jaroměř

  • Members
  • PipPipPip
  • 3 775 příspěvků(y)

Publikováno 12 listopad 2018 - 8:19

Hmm, asi bych neměl sázet. Nálezů přes 7 tisíc a navštívených v den výročí jen 9 :-). A to bych to měl mít splněné více jak 2x. Takže u mě ta statistika moc nefunguje...


  • 0

#26 d-n

d-n

    Advanced Member

  • Members
  • PipPipPip
  • 291 příspěvků(y)

Publikováno 12 listopad 2018 - 9:51

Tak jsem si trochu pohrál s Geogetem. Při 11907 neeventových nálezech bych měl mít 32,62 shod. Mám 34, z toho jsou 4 betatestované keše a 2 FTF ve dni uložení, čili 28 statisticky neovlivněných. Zároveň mám 1574 keší odlovených během prvního roku od publikace. A (11907-1574)/365 = 28,31. Na mě to sedí zcela přesně.

 

Tak těch odlovených během prvního roku bylo 3759, takže zas až tak přesně to nevychází, ale řádově v normě to je.


Tento příspěvek byl upraven od d-n: 12 listopad 2018 - 10:24

  • 0

#27 ondro91

ondro91

    Advanced Member

  • Members
  • PipPipPip
  • 106 příspěvků(y)

Publikováno 12 listopad 2018 - 10:15

mpik  - popvedal by som, ze pravdepodobnost druhej vyhry v sportke je pravdepodobnost ze vyhrajem raz2 . A pravdepodobnost vyhry ked je napríklad 50 cisel a hadam jedno je 1:50. ak hadam znovu a cislo sa zmeni, je to znovu 1:50. Ak sa cislo nemeni, tak pravdepodobnost je 1:25. Ak sa znova zmeni, zas 1:50, ak sa nezmeni, tak 3:50 atd. Nie som odbornik na statistiku tak sa mozem mylit, ale myslim ze toto tak je


  • 0

#28 Vláček

Vláček

    Advanced Member

  • Members
  • PipPipPip
  • 1 581 příspěvků(y)

Publikováno 12 listopad 2018 - 10:32

popvedal by som, ze pravdepodobnost druhej vyhry v sportke je pravdepodobnost ze vyhrajem raz2

 

To bys řekl špatně. Pravděpodobnost druhé výhry, pokud už jsi jednou vyhrál, je stejná jako u té první.Žádné na druhou. Pravděpodobnost, že vyjdou stejná čísla jako při minulém losování, je stejná jako u jakékoliv jiné kombinace. Pravděpodobnost, že na kostce padne šestka, je stále 1/6 bez ohledu na to, jestli třeba předtím padlo pět šestek za sebou nebo 50x žádná šestka nebyla. Ta kostka nemá paměť, aby to korigovala.


  • 0

#29 Koumacisko

Koumacisko

    Newbie

  • Members
  • Pip
  • 5 příspěvků(y)

Publikováno 12 listopad 2018 - 11:46

Tohle není jak u rulety, protože prvních 364 dnů tu šance na výhru není ...


  • -1

#30 mpik

mpik

    Advanced Member

  • Members
  • PipPipPip
  • 7 382 příspěvků(y)

Publikováno 12 listopad 2018 - 11:53

To ano, ale pořád je to jen pravděpodobnost. Ne jistota. A teprve na hodně velkých souborech se s tím dá počítat, že to tak bude. Např. tlak plynu, počítaný pravděpodobnostně z hybnosti jednotlivých molekul, kterých jsou miliardy. Nebo ekonomické ukazatele na úrovni státu (ale tam jde i o stanovení podmínek, které nejsou předem známé). Ne že když hodím šestkrát, tak šestka padne. Ani když hodím 60x, že bude cca 10 šestek. Jo, kdybych házel 6milionkrát, asi by těch šestek bylo cca milion. Ale taky možná ne. Záleží na tvaru kostky, která nebude úplně pravidelná. Tady totéž. Zdaleka není stejná pravděpodobnost, že keška bude založena v libovolném dni. V zimě se moc nezakládá, o dovolených taky ne, je to vidět na frontě keškoměrky, jak kolísá. Tady ale kdo by chtěl cíleně plnit výzvu, má možnost vidět to dopředu. A pravidlům neodporuje nález zrušit a zalogovat znovu, fyzicky i elektronicky. Ale bavíme se o teorii, prakticky by to pak znamenalo jet do Vídně a počítat s tím, že finálka bude ještě v provozu.


  • 0

#31 ondro91

ondro91

    Advanced Member

  • Members
  • PipPipPip
  • 106 příspěvků(y)

Publikováno 12 listopad 2018 - 11:53

vlacek - zle som sa vyjadril, myslel som pravdepodobnost, ze sa mi podari vyhrat az dva krat v sportke...Ale niesom matematik :-)


  • 0

#32 ProKesTom

ProKesTom

    Advanced Member

  • Members
  • PipPipPip
  • 1 034 příspěvků(y)

Publikováno 12 listopad 2018 - 18:22

Rozložení publikovaných keší po dnech založení? SQL select, co jiného...

 

 

Přiložené miniatury

  • Keše publikované.jpg

  • 0

#33 ladislavappl

ladislavappl

    Advanced Member

  • Members
  • PipPipPip
  • 711 příspěvků(y)

Publikováno 13 listopad 2018 - 10:56

#523  z 13. 11. 2018
Tak se nám ta diskuse o statistice hezky rozproudila!  Rozhodl jsem se k ní taky trochu přispět.
1. Na rozcvičení dám tento příklad:
Hodíme 10x za sebou kostkou. (Nebo 1x deseti kostkami). Jaká je pravděpodobnost, že padnou dvě šestky?
Použijeme binomické rozdělení s parametrem p= 1/6 = 0,1666667
Vyjde nám pravděpodobnost p = 0,2907, čili přibližně 29 %.
2. a   Házím kostkou. 5x po sobě mi padla šestka. Jaká je pravděpodobnost, že padne i pošesté? Bude menší než teoretická 1/6?
Opět použijeme binomické rozdělení. (Jde to spočítat i jinak).
Z 5 pokusů padne 5 šestek - p = 0,000129
z 6 pokusů padne 6 šestek - p = 0,0000214
p = 0,0000214 : 0,000129 = 0,166667 = 1/6.
Pravděpodobnost zůstala stejná. Předchozí výsledky nijak neovlivní pravděpodobnost v dalším hodu.
2. b  V ruletě to platí podobně. Pravděpodobnost, že vyhrajeme v jedné hře na sudé číslo, je necelá 1/2 (přesněji 0,4865). I kdyby vyhrálo třeba desetkrát po sobě liché číslo (pravděpodobnost toho je pouze 0,000743), tak pravděpodobnost, že už konečně padne jako 11. číslo této série číslo sudé, je stále původních 0,4865!!!
Pamatujte si tento příklad, když budete třeba hrát ruletu v kasinu a  budete mít pocit, že tentokrát vám to (třeba to sudé číslo) konečně už musí padnout a vsadíte do hry všechny zbývající (nedejbože půjčené!!!) peníze. Bohužel nemusí...
3. Hrajeme Sportku. Pro zjednodušení její starou verzi, kdy uhodnutých 3, 4, 5 a 6 čísel znamenalo 4., 3., 2. a 1. pořadí a dodatkové číslo ještě nebylo. Vsadíme 6 čísel, losuje se 6 čísel ze 49.
Protože se tažená čísla do osudí nevracejí (2. číslo losujeme z 48 čísel, 3. číslo z 47 čísel atd.),  musíme použít hypergeometrické rozdělení.
Pravděpodobnost výhry ve 4. pořadí (3 uhodnutá čísla ze 6 tažených) p = 0,01765, p pro 1. pořadí je 0,000 000 072. (zbytek si dopočítejte).
Pro ondro91: pravděpodobnost, že aspoň něco ve Sportce vyhrajeme, je u jedné sázky a jednoho tahu 0,0186. Pravděpodobnost, že ve dvou sázkách a ve dvou tazích něco vyhraje, je 0,0186 na druhou, jak správně uvádí. Ovšem nesprávné je tvrzení, že to je pravděpodobnost druhé výhry; je to pravděpodobnost, že dvakrát vyhraje ve dvou tazích Sportky! (a ty tahy nemusejí následovat bezprostředně za sebou).
4.a   Zvědavka má 5 keší ze svých 1960 nálezů, které nalezla v den výročí jejich založení. Nehledá keše první rok, takže po několika letech se její data vyrovnají, i když neloví každý den (viz příspěvek od d-n).
Je opravdu dítkem Štěstěny?
Odpověď nám může dát metoda založená na odhadu intervalu spolehlivosti výběrového souboru v porovnání s "teoreticky správnou" (předpokládanou nebo zjištěnou) hodnotou.
Takže: " Jáchyme, hoď ji do stroje!"
Vyjde nám u = 0,1656, což je méně než kritická hodnota u0,05 = 1,96.
Zvědavka tedy v tomto ohledu dítkem Štěstěny opravdu není. Ani anomálie... :P
4.b  Phrkt má jen 3 takové keše ze svých 4676 FI. Můžeme říci, že je ve srovnání se Zvědavkou vyslovený smolař?
Formulujeme nulovou hypotézu, že se uvedené počty (resp. procenta) obou kačerů neliší, jinými slovy, že keše vybírali ze stejného souboru keší (třeba všech v ČR) a tuto hypotézu otestujeme.
K zodpovězení této otázky použijeme t-test s cyklometrickou (arcsin) transformací. ProKes Tom uvedl graf s rozložením nových keší během roku. Graf nálezů většiny z nás je asi podobný: v zimě útlum, na jaře aktivita, o prázdninách hledáme (smíme hledat?) trochu méně a na podzim si to vynahradíme, takže můžeme předpokládat homogenitu základního i výběrových souborů.
Vyjde nám p = 0,0614, což je více, než kritická hodnota p = 0,05. Znamená to tedy, že nulovou hypotézu nezamítáme, tzn. že se nálezy obou kačerů statisticky významně neliší. Takže ten rozdíl je téměř určitě pouze náhoda.
Podobně Vláček s 13 nalezenými kešemi ve výročí publikace z 4886 celkových nálezů a Roman_Jaroměř se svými 9 z 7719 FI se taky vzájemně statisticky významně neliší, protože p = 0,057 je víc než 0,05. I když těsně.
Takže Zvědavko, nestrkej peníze do Sportky a ušetřené peníze radši investuj do přípravy svých dobrot pro pohoštění účastníků eventů.
A pak že statistika nuda je...! :D
 


Tento příspěvek byl upraven od ladislavappl: 20 listopad 2018 - 19:46

  • 7
Quaerendo invenietis (Kdo hledá, najde).

#34 dr.vota

dr.vota

    Advanced Member

  • Members
  • PipPipPip
  • 5 022 příspěvků(y)

Publikováno 13 listopad 2018 - 13:20

a tím bychom mohli matematické okénko jako OT taky ukončit


  • 4

#35 mpik

mpik

    Advanced Member

  • Members
  • PipPipPip
  • 7 382 příspěvků(y)

Publikováno 13 listopad 2018 - 14:23

Ach jo, profesor Havrda by z nás měl radost. Odřenější uši než u jeho zkoušek ze stochastiky a teorie informace, jsem nikdy neměl. Zajímavé je, že až za dva roky v jiném předmětu jsem pochopil, o čem to mluvil. Byl matematik a jakákoli fyzikální nebo technická aplikace těchto metod mu byla cizí. Vlastně cokoli mimo čtení svých vlastních nečitelných skript.


  • 0

#36 Kyblik94

Kyblik94

    Advanced Member

  • Members
  • PipPipPip
  • 30 příspěvků(y)

Publikováno 13 listopad 2018 - 16:27

A pak že statistika nuda je...! :D

 

Pro mě teda je, vždyť půlce z těch věcí nerozumím  :D


  • 0

#37 Loo36

Loo36

    Advanced Member

  • Members
  • PipPipPip
  • 318 příspěvků(y)

Publikováno 13 listopad 2018 - 16:34

Statistiku jsem měl jeden semestr a skončil u rozptylu...(bacha neplést s rozptylovou loučkou, to je jiný obor lidské činnosti).....


  • 0

#38 Roman_Jaromer

Roman_Jaromer

    Roman_Jaroměř

  • Members
  • PipPipPip
  • 3 775 příspěvků(y)

Publikováno 13 listopad 2018 - 19:34

Osobně jsem statistiku měl různě, myslím, že jsme se jí dotkli už i na gymplu při volitelné matice, pak na vysoké 2 semestry, ale stejně už tomu co tu psal láďa vůbec nerozumím...

 

Nějak se ztrácím, jaký je rozdíl v p a u, co tu používá a co znamená kritická hodnota? Jestli je to něco co určuje rozdílnost dvou datových řad? Musel bych opět vše znovu dlouze studovat a to už dnes moc nehodlám. Stačí mi, když občas luštím některé kešky:-).


  • 0

#39 seedcorp

seedcorp

    Advanced Member

  • Members
  • PipPipPip
  • 528 příspěvků(y)

Publikováno 14 listopad 2018 - 0:02

Ach jo, profesor Havrda by z nás měl radost. Odřenější uši než u jeho zkoušek ze stochastiky a teorie informace, jsem nikdy neměl. Zajímavé je, že až za dva roky v jiném předmětu jsem pochopil, o čem to mluvil. Byl matematik a jakákoli fyzikální nebo technická aplikace těchto metod mu byla cizí. Vlastně cokoli mimo čtení svých vlastních nečitelných skript.

 

Jestli to ejn ten Havrda z FELu, tak to bylo peklo. Povinnmý semestr ze statisktiky všichni tak nějak ošmelili a bylo dobře. Od tý doby co mnoho let používám matlab, mně žádná matematika nezaskočí... :)


  • 0

#40 Kreten8

Kreten8

    Advanced Member

  • Members
  • PipPipPip
  • 1 365 příspěvků(y)

Publikováno 14 listopad 2018 - 10:04

Havrdu z FELu jsem měl taky, ale na matematickou analýzu, na statistiku jsme měli nějakou babu, už si nepamatuji jméno, ale měla to perfektně připravený, všechno do sebe pěkně logicky zapadalo, takže jsem s tím neměl žádnej problém, jen si z toho už nic nepamatuju. Ale v tý době mě žádný příklad na statistiku či pravděpodobnost nezaskočil.


  • 0
A kdo netuší nic o Kreténské organizaci, tak zde se dozví víc
Moje pluginy Puzzle magnetky Turistické nálepky Turistické známky




0 uživatel(ů) prochází toto téma

0 uživatelů, 0 návštěvníků 0 anonymních uživatelů

Reklama