Benfordův zákon - Jak nás klame intuice 3 - s Mirko Rokytou

Marek Valášek

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 24 гру 2019
mathematicator.com/
Přátelé mám pro vás třetí díl ze série Jak nás klame intuice, který jsme natočili s panem docentem Mirko Rokytou. Povídáme si v něm o Benfordově zákonu. A nejen, že si řekneme co to je Benfordův zákon, ale také odvodíme, proč pravděpodobnostní rozložení vychází tak, jak vychází.
Odkaz na video 1: Jak nás klame intuice - • Jak nás klame intuice ...
Odkaz na video 3: Monty Hall problem - • Monty hall problem - J...

КОМЕНТАРІ • 327

@grandfatherandfatmanparkou3486 4 роки тому ⁺⁹
Pánové, děkuji za Vaši tvorbu. Je to koncert pro nadšence. Určitě si odpočinu u vlídného vysvětlování matematických dějů, a zároveň se poučím. DĚKUJU!
@marekvalasek7251 4 роки тому
Dekujeme :-)
@miroslavmaly9505 4 роки тому ⁺¹³⁵
Bude do budoucna ještě více videí s panem Rokytou? Mám z nich opravdu velikou radost.
@marekvalasek7251 4 роки тому ⁺³⁴
To zalezi hlavne na panu docentovi, ale verim, ze ano :-)
@mirkorokyta9694 4 роки тому ⁺⁷⁰
Já taky věřím, že ano. A omlouvám se za dlouhé čekací doby, já jsem skutečně poměrně zaměstnaný člověk. Ale s Markem je to příjemná spoupráce a věřím, že ještě nějaké zajímavé téma spolu vymyslíme
@grandfatherandfatmanparkou3486 4 роки тому ⁺⁵
@@mirkorokyta9694 Hurá! To je koncert...DĚKUJI
@armandonicolas2651 2 роки тому
Sorry to be off topic but does anybody know a way to log back into an Instagram account??
I stupidly forgot the login password. I love any help you can give me
@zakailondon2979 2 роки тому
@Armando Nicolas Instablaster =)
@mispanludensprinck5652 4 роки тому ⁺¹³
Velice pěkné. Připomnělo mi to takové to Paretovo pravidlo, které jsem si kdysi ověřoval pro obce a města v ČR a skutečně: Prvních 20% měst a obcí seřazených podle počtu obyvatel má dohromady skoro přesně 80% všech obyvatel ČR.
@dodomarek 4 роки тому ⁺²¹
Výborný video. Sice jsem tak od 20. minuty ničemu nerozuměl ale i tak jsem se naučil víc než za celý gympl. Děkuji pěkně! :)
@martinkroufek1699 4 роки тому ⁺⁶
Naprosto úžasná série videí!
Děkuji moc a doufám, že v budoucnu vzniknou i další videa ve spolupráci s panem doc. Rokytou.
@mirkorokyta9694 4 роки тому ⁺²
Pokud čas dovolí, tak ano.
@jurajkubis5591 4 роки тому
Tymto ste ma dostali a zacinam rozmyslat o aplikovani do realnych alanyz, ktore vytvaram.
Dakujem krasne, velmi inspirativne
@11patron 4 роки тому ⁺³¹
Aplikace v praxi... Mysli si jakekoliv cislo, vynasobime ho mym nahodnym cislem. Kdyz vysledek zacina cifrou 1-3 vyhral jsem, 4-9 vyhravas ty. A takto muzeme hrat nejlepe cely vecer, at nam pravdepodobnost pekne vydelava.
@loskutak777 3 роки тому ⁺¹
no jo, ale kdybych hral o penize, chtel bych znat pravidal. Kdyz budu znat pravidla, nebudu si myslet cisla zacinajici na 1-3
@dusansimunek893 4 роки тому ⁺¹²
Jsem to hned vyzkoušel na souboru čísel účetního deníku naší firmy (cca 110 tis řádků) a na nich Benford funguje :-)
@jannovak2996 4 роки тому ⁺⁴
Myslím si že na to jak se dívat na počty obyvatel může pomoci právě intuice.
1)např. na obec s 900 Obyvateli potřebuji o dost více lidí než na obec se 100 obyvateli.(tzn. obec s 900 je méně pravděpodobná)
2)taky rozdíl mezi 100 a 200 // rozdíl mezi 900-1000 je sice matematicky stejný, ale lidsky intuitivně je daleko větší rozdíl mezi 100 a 200(protože i když člověk řekne rozdíl jeho mysl pracuje poměrově).
3)Když už je ve vesnici 900 lidí tak určitě netrvá tak dlouho průměrně aby přerostla nad 1000. Oproti tomu ze 100 jít na 200 trvá průměrně určitě déle.
Moje nematematické a neúplné výpočty
počítáme pravděpodobnosti pro 10 až 99 obyvatel (jedná se o mou teroii)
a -> (pravděpodobnost že počet obyvatel začíná cifrou 1)
b -> (pravděpodobnost že počet obyvatel začíná cifrou 2)
c -> (...)
...
i -> (...)
a+b+c+...+i=1 (pravděpodobnost)
a=a
b=a29/49 (interval 10-19 ->10+19 -> dvojnásobek průměru daného intervalu, 20+29...) -> je 29/49 krát pravděpodobné aby číslo začalo cifrou 2 oproti cifře 1
c=a29/69 (10+19 -> 30+39...)
...
i=a29/189 (...)
->
a≈0,29864 (pravděpodobnost že počet obyvatel začíná cifrou 1)
b≈0,17674 (pravděpodobnost že počet obyvatel začíná cifrou 2)
c≈0,12551 (...)
...
i≈0,04582 (...)
výsledné pravděpodobnosti jsou celkem blízko pro mě uspokojivě.
Výstup?Moje teorie
Já to chápu tak že tam kde číslo představuje reálnou hodnotu něčeho a zároveň to není omezené(může to přirozeně zvětšovat hodnoty)tam benford funguje.
Protože je těžší nabýt hodnoty například v intervalu 90 až 99.
počet byvatel,v těch transakcích(je těžší dát dohromady 9000kč než 1000kč atd.)
Výška stromů?Intuice říká že ne, že strom roste průměrně do svých rozměrů, není to tak že čím je vyšší tím ještě víc roste.
Vodní toky? asi ano mohou být od velmi malých až po velmi velké.( jsem ale určitě ovlivněn videem)
Rád bych si vyzkoušel svojí teorii na dalších věcech, a následně ji ověřil.
předpověď(kdy Benfordův zákon funguje podle mě)
počet stromů v lese,počet hvězd v galaxii,
Kdo má kolik "lajků" na FB nebo kdekoli jinde.

Kolik má video shlédnutí.

Za jakékoliv reakce budu rád a děkuji za skvělé video.
@eltwarg6388 4 роки тому
No, správne ste to pochopili!
Stačí takáto strohá reakcia? :)
Áno, pointa je v tom, že od 1 po 2 je oveľa ďalej ako od 5 po 6 a to je ďalej ako od 9 po 10... na prirodzrenej logaritmickej škále (nie lineárnej).
A to, aby tá škála bola prirodzená pre daný štatistický set, je vlastne hlavná podmienka toho rozdelenia.
@KOPEBR007 4 роки тому
Výborné video! Náhodou som to našiel a zo zvedavosti som začal pozerať. Spomenul som si na maturitu, lebo som si vytiahol práve integrály a derivácie. Ohromne ma to potešilo, lebo JEDNOTKA bola zaručená.
Budem vás sledovať ďalej!
@jindrakjan 4 роки тому ⁺⁷
Moc děkuji za tuto sérii. Mělo by to být povinné pro základní a střední školy. Opravdu pěkná práce. A přidám jednu myšlenku nebo spíše další otázku. Nejsem matematik a vysokoškolskou matematiku jsem už pozapoměl, ale to, že lze Benfordův soubor čísel vynásobit libovolným číslem, mě přivedlo na myšlenku, že Benfordův soubor čísel lze dostat postupným náhodným násobením souboru obsahujícím původně samé jedničky. A tabulka malé násobilky 1-9 x 1-9 je soubor 81 čísel kde je výskyt první platné číslice 1-22,2% a postupně klesá k 9 s výskytem 3,7%. Zkusil jsem i tabulku násobilky 999x999 -soubor téměr 1 000 000 čísel, ale zde je výskyt 1-24,9% a 9-3,4%. Je možné, že pokud zvětším matici násobilky na "nekonečno" dostanu se k požadovaným 30,1%? Pokud ano, pak Benfordův soubor čísel je každý "náhodný" výběr z této nekonečné matice?
@fraancek1 4 роки тому ⁺²
K tomuto asi jen takový laický nezasvěcený poznatek - nabyl jsem dojmu, že Benfordovský soubor by měl mít možnost obsahovat jakékoliv číslo. Soubor součinů je ale o část čísel ochuzen - nejsou v něm prvočísla, ne?
@MarvinCZ 4 роки тому ⁺²
@@fraancek1 Soubor nemusí mít možnost obsahovat jakékoliv číslo. To není mezi jeho podmínkami ani v jeho definici. Existuje dost příkladů Benfordovských souborů, které toto nesplňují, včetně několika uvedených ve videu: mocniny dvou, faktoriály, Fibonacciho posloupnost.
@itanek Рік тому
Já myslím, že vaše úvaha je naprosto správná! Dle mého Benford vychází z velikostí chlívečku vůdči tomu číslu. Když vezmu Váš příklad s násobilkou. Řekněme, že neumím počítat, ale 2x5 je 10 a mám jedničku, kdybych se spletl, tak vlastně až do necelé 20 to padne do stejného chlívečku. Tedy 10-19,999... - k mému výpočtu 2x5 =10 si můžu dovolit až "+99,9..% navíc chybu". Zatímco když chcete aby vyšla 9tka, tak ta velikost chlívečku je "10x menší", 9x10 = 90 a mohu si dovolit chybu jen do 10% tedy do mého výsledku 99.
Je to stejné jako Benford u počtu obyvatel obcí. Jeslti má městečko 9 tis bude hodně blízko i výsledku 10tis, 11tis obyvatel atd.. Tedy vedle chlívečku 9tis obyvatel je 10 pozic 10+tis.. Všiměte si že 1čka má 30% a 9tka 4,7% (kdyby byla další položka v řadě, tak by měla 3%)
4 роки тому
19:02 A tady se odpojuju, děkuju pánové, bylo to zajmavé :)
@_peterroni 4 роки тому ⁺⁶
Parádne video - videá!👍👏
@marekvalasek7251 4 роки тому ⁺²
Diky :-)
@Anton_cz 4 роки тому ⁺⁸
Tak tohle byl klenot.
@marekvalasek7251 4 роки тому ⁺²
Dekujeme :-)
@mirkorokyta9694 4 роки тому ⁺²
@@marekvalasek7251 Přidávám se s poděkováním. M.R.
@Pavel_III Рік тому
V Octave (Matlabu) to jde krásně nasimulovat. Ale diferenciální počet je na to elegantnější a průkazný. Super videa, rád se k nim vracím. Díky
@petrsedlak9082 4 роки тому ⁺¹
Nevím, zda jsem jediný, koho to napadlo, ale když vezmu staré dobré logáro (pro mladší ročníky: Logaritmické pravítko), tak to je asi přesně ono: začíná to od 1 a končí 10, délka mezi 1 a 2 je cca 30% z celku, mezi 2 a 3 cca 17% atd. Vztaženo k fyzice tedy stačí třeba udělat na celých číslech nějaké "přepážky" a pustit skrze ně nějak rovnoměrně pytlík písku a pak by zřejmě ty jednotlivé hromádky byly taky v Benfordově rozdělení... Ostatně jak bylo řečeno, tak Newcomba to napadlo právě u logaritmických tabulek. A mimochodem některé přírodní (i fyziologické) děje mají fakt nějaký typ logaritmické závislosti (např. akustika - decibely stoupají logaritmicky tak, že hlasitost se zdvojnásobuje při zvýšení o cca 3 dB).
V průběhu let už jsem zapomněl většinu těch definic kolem integrálů a primitivních funkcí, ale Vaše video mi to trochu oživilo a já Vám za ně, jakož i za všechna další, velice děkuji.
@TheElafis 4 роки тому ⁺⁵
Podobně je v tom i Zipův zákon (snad si to pamatuji správně) když se vezme nejčastější slovo třeba v knížce v jakémkoliv jazyku a dá se mu 1, tak druhé nejčastější má četnost 50% oproti tomu prvnímu další 30% atd prostě převrácená hodnota.
@mispanludensprinck5652 4 роки тому
Zipf distribution se to jmenuje, ale platí to jen pro přirozeně vzniklé jazyky.
@mispanludensprinck5652 4 роки тому ⁺¹
Ještě jsem si vzpomněl, že když jsme s milým panem docentem (který tenkrát ještě nebyl docentem :) ) probírali Jakobián, odvozovali jsme vzorec pro objem n-rozměrné koule, což tedy vlastně také vyšlo poněkud neintutivně, jelikož pro konstantní poloměr se objem n-rozměrné koule pro velká n blíží k nule. (Ale ono to je svým způsobem pochopitelné, protože když je taková jednotková koule vepsána do n-rozměrné krychle, tak její tělesová úhlopříčka, tj. vzdálenost bodů {0,0,0,...0} a {1,1,1,...,1}, je sqrt(n), čili to "masíčko" je koncentrováno pro velká n v rozích a na kouli mnoho nezbyde. 🙂) Šťastný a veselý nový rok!!!
@eNtyck 4 роки тому ⁺¹
Už jsem na tohle téma něco v minulosti viděl, ale děkuji za připomenutí. Jak si to vysvětluju já "selským rozumem" je zhruba takhle... Když budu brát třeba čísla popisná domů s tím, že začínám od jedničky a jdu nahoru. Pokud budu mít devět domů, tak každá cifra od 1 do 9 bude zastoupena jednou, následuje pak ale 10-19, což je dalších 10 čísel s číslicí začínající jedničkou. Samozřejmě pokud půjdu dál, tak s dalšími deseti domy číslice 2 tu jedničku dožene, dalších deset domů bude s číslicí 3, ale v reálným světě se nebavíme o nekonečných řadách domů. Takže číslo jedna musí mít logicky větší šanci na výskyt u prvního čísla... Z 19 domů jich má 11 číslo 1 na začátku, ze 199 domů jich bude mít 101 číslo 1 na začátku a ostatní číslice MŮŽOU jedničku vždy jen dohnat, ale nikdy předehnat a spíše se stane, že řada domů skončí a některý čísla budou "tratný". Jedná se o velice konkrétní a zjednodušený koncept, ale myslím si, že se to takhle nějak dá chápat, což? :)
@marekvalasek7251 4 роки тому
Selskym rozumem to vypada dobre, ale nejsem si jisty, jestli by z toho vysel Benford. Chybi tam totiz to, ze jsou data pres mnoho radu. A to se ukazuje jako dulezite. Spis si myslim, ze by z toho vypadlo neco jako hodne jednicek, mene dvojek, par trojek a dal skoro nic. Ale je mozny ze se pletu. Chtelo by to zpracovat data :-)
@eNtyck 4 роки тому
@@marekvalasek7251 To je bezpochyby pravda. Je to spíš takovej mikroskopickej vzorek, na kterym to nemusí být špatné vysvětlit. Je to hodně podobné jako u zmiňovaných bankovních transakcí. Pravděpodobně bude drtivá většina v řádech desítek, stovek a tisíců. O mnoho méně desetitisíců a tak dále... A přehoupnutí řádu vždy začne novou číselnou řadu začínající jedničkou. Pravděpodobnost, že číslo bude začínat jedničkou se tak pohybuje mezi cca 11-56% (1-9, 1-99, 1-999, 1-9999.... vs 1-19, 1-199, 1-1999). Na YT je toho o tomto uděláno mraky videí, ale hledám jedno specifické, myslím že to bylo od VSauce, ale za boha ho nemůžu najít :D Ještě zkusím později pohledat.
@mirkorokyta9694 4 роки тому ⁺²
Dobrý den, tohle k benfordovskému rozdělění nepovede, i kdybyste šel přes mnoho řádů čísel domů. Tomuto přístupu se říká tzv. paradox šatnářky - často se to uvádí jako situace, kdy šatnářka vydává lístky do šatny. To bohužel s Benfordem nijak nesouvisí, je to jen a prostě statistika prvních cifer v deterministické posloupnosti všech přirozených čísel. Chvíli převáží jedničky, pak je doženou dvojky, ty pak doženou čtyřky atd., pak se všechny cifry vyrovnají. A pak to začne nanovo, jedničky se dostanou dopředu atd. Důležité je to, že tento proces se nestabilizuje, bude oscilovat mezi chvilkovou převahou nižších cifer nad vyššími a situací, kdy bude všech rovnoměrně stejně. Benford má jako každý jiný statistický zákon tu důležitou vlastnost, že s větším počtem dat se stabilizuje a moc se nemění. Tohle bude pořád oscilovat a neustálí se to. Ona "logicky větší šance jedničky" je právě ten moment, kdy je člověk veden tím, že ví, co má vyjít a snaží se to nějak zdůvodnit. :) Nic si z toho nedělejte, takto se o vysvětlení Benforda snažili dřív i poměrně erudovaní matematici.
@rastothesuchsoft6546 4 роки тому ⁺¹
Toto by určite nefungovalo, nejde o to, že sú ulice, kde by sme došli len po 27, alebo po 45, ale že celý ten súbor vznikol akoby logaritmicky (prirodzený logaritmus).
Teraz som si uvedomil, že ak by sme použili špeciálnu číselnú sústavu, a to sústavu, ktorá by sa správala logaritmicky, tak by hustoty pravdepodobností mali byť 11.1111 % vo všetkých skupinách.
Verím, že sa dá takáto číselná sústava vytvoriť, ale nemám šajnu ako, a asi by to bolo matematicky dosť náročné. ;)
A najzaujímavejšie by bolo takúto číselnú sústavu použiť na riešenia nevyriešených otázok v matematike.
Z toho mi vyplýva, ak sa také niečo dá, určite sa to už používa. ;)
@igork.1148 4 роки тому
naprosto úžasný pánové :) a to říkám jako absolvent filozofické fakulty, který na gymplu nesnášel matiku... jo, takhle nás to neučili.... mimochodem, minulý týden jsem použil vaše příklady (provázek kolem země a kolejnice) se svými studenty v hodinách angličtiny... (samozřejmě, že jsem jim řekl odkud jsem čerpal a odkázal na vaše videa. )
@venaanek 4 роки тому ⁺⁶
Uff :). Z tabulky Benford - bankovní transakce (8:27) jsem, při pravděpodobnosti 62,9%, právě dopočetl kód banky účtu.
@petrsedlak9082 4 роки тому ⁺²
Přece nebudeš posílat money na 62%, já Ti pošlu svůj 100% účet a pak to spusť...
@peterkrammer8968 4 роки тому
Krasne video. Vela veci mi sice uz bolo znamych a zrejmych, ale dozvedel som sa niekolko detailov, ktore som si doteraz nie uplne uvedomoval, ktore mi dotvorili celok a chapem to teraz komplexnejsie. Na zaklade tohto videa, by sa dalo lahko urobit napr. aj odhady pravdepodobnosti prvych dvojcisli (tusim to niekto spomenul aj v diskusii nizsie), resp. urcovat pravdepodobnosti najvyssieho radu (u rovnakych typov dat ako vo videu), ale v inych ciselnych sustavach. Je to vcelku inspirujuce.
OTAZKA: Viete mi poradit, kde by sa dali stiahnut data ohladne dlzok riek resp. poctu obyvatelov miest/obci v CR/SR ?? ( O dáta z bankovych transakcii p. Rokytu samozrejme neziadam ;) ).
@mirkorokyta9694 4 роки тому
Počty obyvatel českých obcí jsem stáhnul ze stránek Českého statistického úřadu. Délky českých řek: tam jsem našel na wikipedii jen prvních sto českých řek podle délky, ale je pravda, že jsem moc nehledal, byl to první googlovský odkaz.
@potapec333 4 роки тому
Ahoj hned z prvu jsem typoval že 1 bude nejvice to ze se postupne zmensuji k 9 jsem uz neodhadl.
Mě osobně přijde, že to závisí na jedné jediné věci, z které vyplývají všechny ostatní pravidla, které pro tento princip probíráte. Jde jen o princip sčítání náhodných čísel. Nevím jak bych to v krátkosti vysvětlil a navíc jsem si nenašel čas, abych si to prověřil programem na nějakém větším vzorku dat. Jde jen o princip přetečení do dalšího řádu. 1+1, 1+2 ..... 1+8, 2+1,2+2 ... 2+7 .. 7+2, 8 + 1 do dalšího řádu nepřetečou, avšak všechny ostatní možnosti do nového řádu přetečou což je 44.4% z všech možností sčítání. U dvouciferných čísel to je 49.5%, u trojciferných téměř 50%. tedy konverfuje k 50% pro velká císla. Uvaha je jednoduchá pokud náhodné rozdělení je rovnoměrné a stejne tak je rovnomerné náhodné rozdelení poctu scitani techto nahodne vygenerovanych cisel. Pak by podle mne melo platit, že dostaneme císla, která z vetsi casti budou zacinat jednickou nez ostatními ciframi. Uz kdyz se jen opiram o fakt ze vsech moznych souctu jednocifernych cisel k preteceni na 100 a vic dojde ve vice jak 50% pripadu. Je to nedokoncena uvaha a cely jsem to o vypocty neoprel ani o nejaky statisticky pokus, ale az budu mit cas rad si svou uvahu vyvratim ;-)
@itanek Рік тому
Vysvětlení jsem pochopil ono i funkce která se objevila 1/x nám hezky klesá, nemusíme ani odčítat dva logaritmy kde logaritmus jde nahoru ale brzdí takže jsou rozdíly menší a menší.
K překvapení pana Rokyty v 54:00 : Pokud má soubor dat tuhle pravděpodobnost (benfordovsky), tak po přeškálování je jasné že se bude chovat stejně. Přece číslo je jedno zda je to délka řeky nebo počet obyvatel. Tady nerozumím co mu je Rokytovi divný. Když se tam vyskytují čísla s touto relativní četností, nemusím zpětně přemýšlet o počtu lidí a pod číslami si mohu představit jinou interpretaci.
Já tu problematiku pochopil jinak, jinou podstatu. Pokud si napíšu čísla přirozená čísla za sebou, tak vedle chudáka devítky je několik jedniček. Jeslti má obec řekněme Choceň 9 tis bude asi stejně pravděpodobné, jako by měla 10, nebo jako by měla 11 tis. Tedy když se budu trefovat do 9tky, tak mám vedle ní 10 podobných chlívečků začínající jedničkou.. Když se podíváte na posloupnost rozdělení, jednička má 30, devítka má 4 a něco, tedy skoro 10x méně. Pokud si vezmete můj případ s přirozenými čísly, tak devítka bude mít pré od 90-99 tis obyvatel. 10 chlívečků, kam se budu trefovat. Jenže vedle těchto 10 chlívečků je 100 chlívečků začínající jedničkou 100-199 tis. A tedy jednička má zas skoro 10x navrch! Proč skoro ? - je jasné že dál od 9tky už se do ní hůř budu trefovat, tedy zda má choceň 9 tis nebo 10 či 11 - možná 12 obyvatel, asi je velmi nepravděpodobné že by měla 18 tis.)
Základní premisa - je potřeba více rúzných řádů vychazí asi z toho mého popisu viz výše. Tedy čím více přeskoků o řád víc, tím více bude vedle jedniček na úkor devítky (ostatní čísla řekněme analogicky)
@msumbera 4 роки тому
Chlapi dobre, moc zajimave
@jozeffranc1713 4 роки тому ⁺¹⁰
Zaujimava prednaska, len by sommal 2 otazky:
1. Dal by sa Benfordov princip pouyit na generovanie dat? Myslim tym, ze mam neuplny subor dat (dajme tomu 70%) a potrebujem doplnit dalsich 30%.
2. Ak mam subor dat a zistim ze nema Benfordovo rozlozenie, mozem o nom prehlasit, ze je tento subor ovlivneny nejakym umelym zasahom?
@vrbic207 4 роки тому ⁺²
Nejsem přímo matematik, ale fyziky (matematické analýzy jsem prošel). Add 1) Podle mě ano. Prostě zvolíš náhodná čísla (1,10) a vložíš do té funkce co jim vyšla. A pak pronásobíš 10^x kde jsou celá náhodná čísla (0,x) podle toho jak velký řád potřebuješ. Můj názor.
Add 2) Super otázka, ale podle toho co říkali na začátku, že tam je více pravidel i neznámých, tak může být porušené jiné pravidlo než jen umělý zásah. Můj názor.
@eltwarg6388 4 роки тому ⁺³
Ide o štatistické rozdelenie tých dát.
Obvykle sa určí, aké je rozdelenie tých dát, čo sa dá aj zo 70%, ak to nie je nejako umelo, ale náhodne vybraná časť.
Napríklad sa postaví hypotéza, že tá množina dát má normálne rozdelenie s nejakým mediánom/priemerom a rozptylom (disperziou), potom sa to otestuje, či to tak je...
Alebo sa zistí, že to má nejaké viac-menej logaritmické rozdelenie (a potom to bude mať aj vlastnosť toho Benfordovho rozdelenia prvých cifier).
Doplníte to tak, že si náhodne vygenerujete dáta podľa daného rozdelenia.
Ten bod dva neplatí, leda ak by ste predpokladali logaritmické rozdelenie tých dát.
Ak napríklad predpokladáte normálne rozdelenie v úžšom intervale (malý rozptyl), ako napríklad v príklade s výškou ľudí, ktorý tu autori aj uviedli v úvode, teda že viac ako 50% dospelých mužov bude mať výšku medzi 170cm a 190cm, nie je dôvod predpokladať, že tam bude fungovať Benford na prvé cifry...
To dá rozum! ;)
@Krozemc 4 роки тому
Velice moc zajímavé, bohužel jsem neměl čas celé dokoukat. Říkali jste, že se neví, proč to tak je, že je to jen empiricky vypozorováno. Přesto by mě velmi zajímaly všemožné hypotézy, jestli vůbec jsou. Jestli se tím ve videu zabýváte, hoďte, prosím, odkaz na čas.
@jakubchaloupka2960 2 роки тому
Super video! Nicmene nezda se mi tam dostatecne vysvetleno, jak se z intervalu (a, a+1) pro pocatecni cifry a z intervalu {1, 2, 3, 4, 5, 6, 7, 8, 9} najednou preslo k tomu, ze a je libovolne realne cislo. Predpoklad skalovani tvrdi, ze rozlozeni prvnich cifer zustava pri nasobeni konstantou nemenne, ale treba interval (Pi, Pi + 1) at prenasobim jakoukoliv konstantou, vzdy bude existovat nejaka pocatecni cifra takova, ze ve vyslednem intervalu budu mit cislo zacinajici touto cifrou, ale budu mit cislo zacinajici touto cifrou i mimo nej. Nebo ten predpoklad skalovani je ve skutecnosti silnejsi a tvrdi, ze rozlozeni pravdepodovnosti zustava po nasobeni konstantou nemenne pro libovolny podinterval v "normalizovanem" intervalu (1, 10) a ne jenom pro podintervaly (1, 2), (2, 3), (3, 4), atd.? Nebo dokonce z toho zdanlive slabsiho predpokladu vyplyva ten silnejsi? Dekuji.
@DejvDesign 4 роки тому ⁺³
Udělal jsem kód, který mi vygeneruje můj zvolený počet náhodných číslic a následně spočítá, kolik % z nich začíná na cifru 1, 2, ... A jo... tenhle zákon opravdu funguje! :DD
@marekvalasek7251 4 роки тому ⁺²
Tak tohle je opravdu zajimave. Muzes presneji popsat parametry toho nahodneho generatoru? Protoze uplne libovolny nahodny soubor by to splnovat nemel. Nebo spis nemusel...
@DejvDesign 4 роки тому ⁺³
Nejdříve jsem generoval čísla přes funkci, u které to nefungovalo, počáteční cifry čísel byli u všech čísel víceméně rovnoměrně. Když jsem každé takto vygenerované číslo vynásobil jiným náhodně vygenerovaným číslem a následně zase vydělil jiným náhodně vygenerovaným číslem a takto několikrát dokola, tak mi procenta začali vycházet jako říká tenhle zákon.
@marekvalasek7251 4 роки тому ⁺¹
Muzes z tech dat udelat histogram? Zajimalo by me rozlozeni tech cisel. Kdybys je scital, melo by se to blizit normalnimu rozdeleni. Ale nevim co se tam deje kdyz se nasobi...
@jaroslavsevcik3421 4 роки тому ⁺²
@@marekvalasek7251 Ja som si urobil jednoduchu google sheet tabulku a tiez to funguje. Staci vygenerovat 3 stlpce dat A, B, C a vysledok ulozit ako V = A * B / C. Nasledne urobit statistiku vyskytov prvych cifier a je to. Mozem vyzdielat, ak by bol zaujem. Urobil som aj vypocet pre poslednu cifru (okrem 0), ale tam to vyzera na nahodnu distribuciu.
@marekvalasek7251 4 роки тому ⁺¹
Jardo paráda. Díky moc.
@didoonka1523 4 роки тому ⁺⁵
To je tak krásný ❤️
@mirkorokyta9694 4 роки тому ⁺²
To je tak krásný. :)
@berske1226 4 роки тому
Ahoj, uz dlouho mi vrta hlavou jakou vejsku jsi studoval pripadne jaky obor, jestli se muzu optat? Muj tip je matfyz, ale nejsem si tim jisty :D Protoze Tve znalosti matematiky jsou uctyhodne a P.S. take Ti timto moc dekuji za vsechna ta krasna naucna videa, diky kterym jsem letos v pololeti dostal jednicku z matiky! :D
@RadomilBenes 4 роки тому ⁺³
Přiznávám bez mučení, že už jsem z vyšší matematiky hooodně zapomněl, ale docela jsem se kupodivu chytal :-) Díky za super video!
Napadlo mě - což třeba velký soubor náhodně vygenerovaných čísel počítačem? Fungovalo by to na něm? Vyzkouším...
@rastothesuchsoft6546 4 роки тому ⁺¹
Myslím si, že to nebude fungovať, rozloženie bude viac menej rovnomerné, podľa počtu náhodne vygenerovaných čísle. Čím viac čísel, tým rovnomernejšie.
V princípe ide o to, že súbor dát musí vychádzať z prirodzena. Mal by vzniknúť samovoľne, prirodzene, bez zásahu inteligencie. Toť môj názor. A generátor náhodných čísel, vlastne generátor pseudonáhodných čísel nie je prirodzený.
@eltwarg6388 4 роки тому ⁺¹
Ak ten váš generátor bude mať logaritmické rozdelenie, tak to fungovať bude.
Teda bude generovať čosi ako počty obyvateľov, alebo dĺžky riek... ;)
@JardaBar 4 роки тому
To je první co jsem zkusil a odpověď byla ne :-).
@lukasvozak7698 4 роки тому
Dost dobrý a zajímavý :) Jen tedy předešlá videa tohoto typu měla podtext srovnání "intuice s paradoxem", docela mi to tady chybělo :-O Mně totiž Benfordův zákon přijde intuitivní, hned první minuta mě k tomu nakopla, přeci když jdeme přes více řádů, je logické, že bude více čísel začínat "předními ciframi", protože skrze ně "musíme přejít" :) Např. když vezmu hodně zjednodušené příklady jako že půjdu po jedné od 1čky do 4389, tak na prvním místě se víceX objeví číslo 1-4, než ty ostatní, na druhém místě 1-3, etc... Když to rozšíříme na náhodné, ale velké a zhruba rovnoměrně rozložené soubory, mělo by to držet, takže "klame intuice", nebo ne? :-O Maybe I am wrong :D :)...
@rastislavserbin9297 8 місяців тому
No ano, pre vedecke typy, ale chceli intuici povedat ze 90% ludi ktori o tom este nepoculi by na tuto otaku povedali, ze vyskyt cifier je uplne rovnaky bez ohladu o aku cifru ide.....cize asi to mal byt odkaz na chybnu intuiciiu
@MrEasters 4 роки тому
Ahoj, mohl bys udělat video na Grahamovo či Rayovo číslo? :)
@tomas4999 4 роки тому ⁺⁵
Jak říká sheldon. Každý by si mohl myslet, že nejčastější název ulice je První ulice, ale je to Druhá ulice. Benford nefunguje na názvy ulic :D (vtip) :)
@marekvalasek7251 4 роки тому ⁺¹
Good one :-)
@eltwarg6388 4 роки тому
No, za socíku to bolo hlavne 1. mája a 9. mája
@horymirnavratil7701 2 роки тому
Jak to bylo s tím bodem b, ze které ho pak vyplynula funkce c/t a vyřešila se daný integrál?
@mispanludensprinck5652 4 роки тому ⁺³
Kámoš přišel nedávno také s pěkným neintuitivním příkladem "Spider and fly problem". (Zkoušel jsem najít nějaké obecné řešení, kvádr se dá aproximovat jako (x/a)^n+(y/b)^n+(z/c)^n=1 pro n velké sudé, ale rovnice geodetiky se mi nepodařilo vyřešit ani numericky. 😀 Ale je to zajímavý.)
@mispanludensprinck5652 4 роки тому
@pemailv Jj, kvádr ve sférických souřadnicích je možné zhruba parametrizovat takto: (a*cos(u) sin(v), b*sin(u) sin(v),
c*cos(v))/((cos(u) sin(v))^n + (sin(u) sin(v))^n + (cos(v))^n)^(1/n), pro n velká sudá.
@vrbic207 4 роки тому
Dotaz: Lze najít i jinou funkci splňuje danou podmínku škálovatelnosti? Vím nebude to už Brendford, ale jde mi o to splnění té podmínky. Díky za názory.
@danielbriza1279 4 роки тому
Ne
@michaldome8414 4 роки тому ⁺²
O tom už pan Rokyta mluvil v Českém rozhlase. Je skvělé to mít mnohem přesněji a podrobněji zde 😂
@marekvalasek7251 4 роки тому ⁺¹
No.. hehe. My jsme to totiz natocili uz asi pred dvema lety. Spolu s temi prvnimi dily. Ale meli jsme tam chybu. Takze to cekalo na predelani :-).
@mirkorokyta9694 4 роки тому ⁺⁶
Mezi námi, příprava osmi dílů o matematice pro Meteor (v mimopracovní době, samozřejmě...) byl i jeden z důvodů, proč bylo docela těžké najít čas na tato videa...
@mysteri5850 4 роки тому ⁺¹
Bude znovu předpříjímačková série? Jestli ano, kdy?
@vivitatarak4233 4 роки тому ⁺⁵
Nevím jestli se neptám na hloupost, ale fungoval by Benfordův zákon i kdybych používal jinou soustavu než desítkovou? Pokud bych měl například soubor dat ve dvojkové (binární) soustavě, vyskytovala by se třeba 0 jako první o dost častěji než 1?
Jinak děkuji za skvělé video.
@misoslav_ 4 роки тому ⁺⁹
Ve dvojkové je to pro jedničku 100 % a pro nulu 0 %, protože číslo nulou začínat nemůže, ale jinak i pro ostatní soustavy to funguje, například hexadecimální
@vivitatarak4233 4 роки тому
@@misoslav_ Pravda, jsem to trochu nedomyslel :D Ale děkuji za odpověď.
@marekvalasek7251 4 роки тому ⁺⁷
Na konci videa se bavime i o jinych soustavach nez je desitkova. A fungovalo by to stale.
@andrasolivier7185 4 роки тому ⁺³
Jiná soustava je pouze přeškálování, takže ano
@rastothesuchsoft6546 4 роки тому ⁺³
A zrejme by to nefungovalo pri rímskych číslach. :D
@MartinTengler 4 роки тому
Výborné video. Je možné, že by Benford fungoval jinak v jiné soustavě, třeba osmičkové nebo binární? A že by byla soustava, ve které je rozložení rovnoměrné? (Moje intuice říká, že by to mohla být binární soustava) :)
@eltwarg6388 4 роки тому ⁺²
Benford nemôže fungovať v binárnej sústave, lebo tam sú len dve cifry a 0 nie je na začiatku, takže je len jedna 1ka a na tú padá 100%.
Ale aj v binárnej sústave sa to dá previesť na prvé dve cifry:
Viac hodnôt bude začínať na 10, menej na 11, prípadne najviac na 100, menej na 101... najmenej na 111 (pre tri cifry).
Pointa je v tom, že tento číselný systém nám dáta distribuuje lineárne, ale tie dáta sú rozložené viac či menej logaritmicky... takže najviac je ich na "začiatku" a najmenej na "konci".
@MartinTengler 4 роки тому ⁺¹
@@eltwarg6388 díky za odpověď, to dává smysl.
4 роки тому ⁺²
Pánové, vrátili jste mi na chvilku mládí (T - 30) let (mffuk) Díky. Elegantní.
@povijarrro 4 роки тому
Dobrý deň je známa nejaká charakterizácia prirodzenočíselných postupností pre ktoré platí lim_k(#{m;a_m začína cifrou n; m
@vaclavm4647 4 роки тому
Hehe. S provázkem kolem Země mě klamala intuice ale chápal jsem tu primitivní matematiku/geometrii, zde mě intuice neklamala (nevím proč asi odhad, že když je potřeba více řádů, tak čísla, tak nějak přirozeně většinou ,, pro normálního smrtelníka" začínají od 1 nebo 0,1 a pak se navyšují a těch je méně a méně až se eventuálně přehoupnou do dalšího řádu od 1), nicméně faktoriály a derivace funkcí je pro mě opravdu dost podobné jako tradiční staročínština, i tak hezké video rád bych to někdy chápal, každopádně fascinující :D
Čistě pro zajímavost, pokud by se držela rozmanitost řádů od 1 - 100 000 třeba, funguje to na koncová čísla? Je mi to k ničemu a jsem na to krátký, ale tak čistá zvědavost :)
@petrsvec8245 4 роки тому ⁺¹
Před lety jsem narazil na problém Benfordova zákona v knize The Scientist and Engineer's Guide to
Digital Signal Processing (autor S. W. Smith), v závěrečné kapitole je jako zajímavost uvedeno objasnění celého problému. Pro zájemce je kniha dostupná i online: www.dspguide.com/ch34.htm
@danpokorny449 4 роки тому ⁺¹
Ahoj, mohl by jsi prosím udělat video na přípravu na přijímacky? Myslím že dost lidí by to zaujalo
@michaeloakley7486 4 роки тому
Prijimacky udela i dement pokud nemá na základce 5ky 😂
@minefricek 4 роки тому ⁺¹
Dobrý den,
mě by zajímalo ohledně té hustoty pravděpodobnosti f(t), která má podobu funkce. Jak zjistíme, že je derivovatelná a integrovatelná, když ji neznáme. To předpokládáme, že je derivovatelná a integrovatelná a po její následném zjištění ověříme zdali je integrovatelná a derivovatelná?
@marekvalasek7251 4 роки тому ⁺²
Mate pravdu ze to nevime. Proste to predpokladame, abychom se mohli neceho rozumneho dopocitat. Je to samozrejme matematicky prohresek, taky jsme to tam zminili. Ale takove veci se obcas delaji, abychom se dopocitali aspon neceho. Ale matematicky korektni to neni. Na druhou stranu my nedokazujeme Benforduv zakon jako matematickou vetu, takze je to snad omluvitelne :-)
@mirkorokyta9694 4 роки тому ⁺³
Dobrý den, dobrý dotaz, ze kterého má mateamtik radost. :) Derivovatelnost f(t) nicméně při výpočtu nepotřebujeme. Funkci f jako takovou nikde nederivujeme, derivujeme jen její primitivní funkci, F, ale ta má derivaci, protože tak je primitivní funkce definovaná, že její derivace exituje a je to f. :) Potřebujeme ale opravdu integrovatelnost f(t) a tu mlčky předpokládáme -prostě věříme, že to za tohoto předběžného předpokladu "vyjde". Chcete-li, můžete si to odůvodnit takto: předpokládáme, že existuje integrovatelná hustota f(t) a za tohto předpokladu se ji snažíme najít. A vida, opravdu jsme ji našli, takže v množině všech integrovatelných funkcí se ta naše hustota opravdu vyskytovala. Jiná forma této úvahy může znít takto: pokud se chceme dopátrat nějaké pravděpodobnosti, tak musíme mít k dispozici integrovatelnou hustotu, protože pravděpodobnost je (v případě nekonečého množsví jevů) vždy integrálem z hustoty. Kdyby neexistovala integrovatelná hustota, tak nebude ani žádný pravděpodobnostní popis zkoumaného jevu.
@minefricek 4 роки тому
@@mirkorokyta9694 Děkuji za vysvětlení. Také pokud se mohu zeptat uděláte ještě nějaké video o Riemannově hypotéze dost mě toto téma zajímá a velmi bych ho ocenil hlavě co se týká netriviálních nulových kořenů.
předem děkuji za odpověd.
@mirkorokyta9694 4 роки тому ⁺²
@@minefricek Shodou okolností jsem letos na jaře měl o této hypotéze přednášku pro Sysifos: ua-cam.com/video/tHm7MnPkBiI/v-deo.html . I s Markem už jsme tomuto tématu jedno naše povídání věnovali: ua-cam.com/video/9iA5B2BwYtc/v-deo.html Tato dvě videa se v lecčems překrývají, ale snad to nevadí. Zdraví M. Rokyta
@minefricek 4 роки тому
@@mirkorokyta9694 Děkuji
@vaclavtaus6383 4 роки тому ⁺¹⁰
Nejvíc se mi líbilo, že jste dokazali, že i takto, na první pohled, nevyužitelná věc má reálné využití ( odhalení nestandardních transakcí).
Měl bych, ale doplňující otázku. Platí tento zákon jen u počátečních číslic nebo i u těch posledních?
@marekvalasek7251 4 роки тому ⁺⁴
To je zajimava otazka. Nemam paru, ale zeptam se pana docenta.
@tomaskot9278 4 роки тому ⁺²
Určitě ne. Už i z toho laického vysvětlení, kterým já tenhle princip aspoň trochu chápu - je tam nějaký vliv těch čísel s více ciframi (bližší maximální hodnotě v daném souboru), protože ty už nemůžou začínat na všechny cifry, pokud teda naprosto náhodou maximální hodnota není 999 999 apod. Pokud máte rozsah 5 až 4 000 000 (třeba nějaký počet obyvatel něčeho), u čísel se sedmi ciframi můžete začínat pouze 1, 2 nebo 3. A čísel v tomto rozsahu (1 000 000 až 3 999 999) bude v souboru dat poměrně hodně (3/4 všech), takže to výslednou statistiku hodně ovlivní. Když se budete dívat na nejnižší cifru (jednotky), bude to určitě zcela náhodné a rovnoměrné rozložení.
@mirkorokyta9694 4 роки тому ⁺¹⁰
Dobrý den, takto přesně nemůže platit už z toho důvodu, že poslední cifra může mít i hodnotu 0. :) Ale jinak je rozložení posledních cifer opravdu nebenfordovské - dokonce je skutečně takové, jaké bychom čekali, tj. rovnoměrné. Neboli každá z možných cifer se vyskytne zhruba v 10% případů. Škálování souboru dat nezpůsobí "přenos přes desítku", který se odehrává na počátku ciferného zápisu, jen pravidelně promíchává poslední cifry. Tomáš Kot to v tomt ovláknu napsal správně. Co je ale zajímavé je to, že se dá něco více říct o "cifrách zepředu". Ne to, jak se chovají třeba druhé cifry v pořadí, ale to, jak se chovají první dvojice cifer, první trojice cifer v zápisu čísel atd. Je to zase nerovnoměrné (už proto, že následující začátky zápisů čísel: 10..,11..,12.., ....,19.. musí dát dohromady těch cca 30%, které reprezentují to, že "číslo začíná jedničkou".) Možná je to téma na Appendix k tomuto videu. Co na to Marek? :)
@vaclavtaus6383 4 роки тому ⁺¹
Pane docente, děkuji za odpověď a rychle vysvětlení. Rozhodně se přimlouvám za video o dvojicích či trojicích cifer.
@mr.schloopka1124 4 роки тому
@@mirkorokyta9694 díky za vysvětlení, teď už to chápu
@AugustinFary 4 роки тому ⁺²
Pane učiteli můžu jít na záchod?
@gabrielakottova1656 4 роки тому ⁺³
video jsem neviděla celé, protože určitou část té matematiky neznám 😃Ale chtěla zjistit a přišlo mi zajímavé to zkusit na podílech zlomku.
Začla jsem na 2/1 a potom jsem k jmenovateli i čitateli přičetla 1. Takže vznikla řada 2/1, 3/2, 4/3, 5/4 …
Napsala jsem si cyklus který, dokázal v řadě pokračovat a tak jsem si podílů mohla vygenerovat libovolný počet.
Porovnala jsem zastoupení číslic na desetinách až desetitisícinách, když na ono místo přišla 0 přesunula jsem se na další desetinné místo a porovnávala to.
Výsledek:
1……55,4%
2……18,6%
3…….9,3%
4……..5,6%
5……..3,7%
6………2,6%
7………1,98%
8………1,5%
9……..1,2%
Jen tak pro zajímavost celkem jsem měla vygenerovaných skoro deset tisíc čísel (9922) a stejný výsledek vychází i když se začne třeba s 5/1 (tady jsem jich porovnala ale jenom 394).
@mirkorokyta9694 4 роки тому ⁺⁵
Dobrý den, je určitě spousta příkladů posloupností, ve kterých je rozdělení cifer nějakým způsobem nerovnoměrné. Člověk si může brát podíly, může zkoumat odmocniny, může se dívat na hodnoty funkce sinus v celých číslech - možností je nepřeberně mnoho, a pro každou takovou posloupnost je možné zjišťovat, jak jsou v něm zastoupeny jednotivé cifry. Dokud každá taková posloupnost má nějaké svoje rozdělění cifer, tak to vlastně není zas nic tak překvapivého - na jakékoli posloupnosti se dá udělat statistika a něco vyjde. Pokud byste si brala jiné zlomky, třena typu 1/2, 2/3, 3/4 ..., tak ty se všechny blíží k jedničce a jejich výsledky se čím dál více podobají hodnotě 0,9999999..... tam byste asi dostala, že naprosto převažuje cifra 9 nad všemi ostatními. Prostě každá posloupnost má nějakou svoji charakteristiku. To, kdy to začne být zajímavé, nastane tehdy, když se zjistí, že dvě spolu nesouvisející věci mají STEJNÉ rozdělení cifer. To je i případ Benforda a to bylo ono překvapení, když se třeba zjistilo, že něco mají společného délky toků řek, počty obvatel, bankovní transakce a mocniny dvojky. Pak to začne být zajímavé, a pak přijde na řadu ta nejzajímavější otázka: co mají proboha tyto jevy společného, že vedou ke stejné statistice? ... A to je chvíle, kdy začíná výzkum... Ale: tohle moje povídání vás určitě nechce nijak odradit nebo rozesmutnit, naopak, mě velice potěšilo, že vás naše video inspirovalo k tomu, že jste si sama začala dělat numerické experimenty. To je první krok k tomu, aby člověk na něco zajímavého přišel. Jen jsem chtěl tak nějak nastínit, co vlastně se má považovat za "zajímavé". Zdravím, M.R.
@petrpanenka8488 4 роки тому ⁺²
Nevím ale není to náhodou tím že 1) používáme desítkovou soustavu a 2) plusová data?? Jak by to dopadlo kdybychom měli data něčeho co" roste" do záporu?!?! Nebyla by 9 nejčetnější??? :o)
@Rubenqo 4 роки тому
Máte pravdu, myslím si presne to isté. Pokiaľ teda nejde o náhodné cifry tak je pre nejakú hodnotu jednoduchšie keď dosiahne počet (iba príklad - možno obyvatelia malej dedinky) 100-199. Aby sa hodnota dostala až k číslu 900-999 musí prekonať celý rad 100-899,. Preto je pravdepodobnosť, že sa počet zastaví na číslé, ktoré začína 9 iba pár percent.
@wardoom123 4 роки тому ⁺¹
@@Rubenqo Bohužel tak jednoduché to není. Jestli jste dávali dostatečný pozor, tak to sedí například i na délku řek nebo počty obyvatel. Délky řek nemají problém s překonáváním desítkové soustavy. Mohlo by zde klidně být nejvíce řek dlouhých 9km,90km atd. u počtu obyvatel jsou to dokonce vždy celá čísla.
@nyksiss 4 роки тому ⁺²⁰
Konečně někdo říká "ta data" a ne "ty data"
@chatnickcz 4 роки тому ⁺¹
Táty tadá
@rastothesuchsoft6546 4 роки тому
Mám otázku, alebo hádanku:
Čo vyjadruje vzorec 2^(n-k) * (n k) ???
Neviem ako to zapísať tu, (n k) sú myslené kombinácie k-tej triedy z n prvkov bez opakovania.
Teda sa to dá zapísať aj takto: 2^(n-k) * (n! / (n-k)! * k!)
Pred pár rokmi som sa čosi snažil čosi vyjadriť vzorcom, a vyšlo toto. :-)
A bol som veľmi prekvapený, že tak pomerne zložitú vec, je možné vyjadriť takto pomerne jednoduchým vzorčekom. :D
(To, že je to zložité je len môj subjektívny názor, keďže som sa s tým pár hodín potrápil.)
@pitomec1000 4 роки тому
Ahoj Marku natočíš nějaká další videa?
@rastislavserbin9297 8 місяців тому
Este som to nedopozeral, ale mam pocit, ze som prisiel na to pri akych suboroch dat to bude platit. Ak ste to spomunuli dalej ospravedlnujem sa. Suvisi to so vsetkymi pocetnymi datami, ktore nie su vedome generovane, ale popisuju resp vyjadruju pocty, mnozstva atd. cohokolvek, co ma tendenciu v case rast. Rieky najprv pramenili a postupne sa predlzovali. Obce zacinali jednotkou a pocty sa postupne zvysovali. Taktiez platby z uctu suvisia s inflaciou a podobne. A preferencia cisel je potom uz len na zaklade ich prveho vyskytu na cislelnej osi. Zacina sa 1,2,3, atd atd. A kym dobehneme do 9 je viac zaciatkov novych udalosti s 1, menej s 2 atd atd.
@marekpomp664 4 роки тому ⁺¹
Drobný problém. Vyzkoušel jsem, jestli opravdu platí B.Z. pro délky českých řek. Vzal jsem seznam 114 českých řek z Wikipedie a jejich celkovou délku. Výsledné relativní četnosti jsou po zaokrouhlení a převedení na procenta:
1 2 3 4 5 6 7 8 9
14 4 21 20 17 9 2 7 6
Což je od B.Z dost daleko. Samozřejmě na Wiki jsou jen řeky delší 35km takže pokud vezmeme i potoky, narostou četnosti vodních toků jejichž délka začíná číslicí 1, 2 a 3.
Asi je tady problém v terminologii, nemělo by se říkat "řeky" ale "vodní toky" a vzít delší seznam než Wikipedii.
Lépe na tom je rozloha povodí těchto řek, s procentuálním zastoupením prvních číslic:
1 2 3 4 5 6 7 8 9
26 17 18 7 10 6 7 6 4
Což už dokonce projde chisq-testem :-)
@eltwarg6388 4 роки тому
No, ale ak by sa brali až potoky nad 5km, tak najviac bude zasa tokov začínajúcich na 5-ku ;)
@vodouch69 4 роки тому
Zkus udělat rozbor kolik se rovná 2⁰
@Rosi2001 4 роки тому
Zajímavé by bylo vyvrátit tento zákon - že funguje na číslech z praxe nebo mocninách dvojky neni sice intuitivní, ale věřím tomu.
O Benfordově zákoně jsem již slyšel pana Rokytu mluvit v pořadu Meteor na Českém rozhlase letos v červenci a od té doby nad tím přemýšlím. Zde nezabíhali příliš do podrobností, ale získal jsem pocit že platí na všech posloupnostech, a to se mi moc nezdá. Jen na vyvrácení nemám moc času se tomu věnovam. Musel bych si najít úplné znění, abych nevyvracel něco co už je přímo definováno jako vlastnost, atd. ... Na webu oeis.org je sbírka posloupností, a prý je tam jedna bláznivá, anebo bych třeba vymyslel vlastní řady čísel. Doporučuju: ua-cam.com/video/tB_z17TBrNg/v-deo.html :)
@marekvalasek7251 4 роки тому ⁺¹
Bemford rozhodne neplati pro vsechny soubory dat. O tom jsme mluvili. Stejne tak se neda rict, jake podminky musi sobor splnovat aby byl benfordovsky. Teda pokud si jako podmi ku nedate hustotu pravdepodobnosti ktera nam vysla :-) Neni to totiz exaktni veta nebo zakon.
@levyhak6943 4 роки тому ⁺²
Plati to i u sportky ?
@petermikula3349 4 роки тому ⁺¹
Syn rozdelil 80 čísel na intervaly po 10 a zistil, že medzi nimi nie je väčší rozdiel ako 16.
@frejk2 4 роки тому
Moje teorie Benfordova zákona je taková, že tam, kde tento zákon platí, platí i to, že čím nižší hodnoty, tím jich je více (což je teoreticky i definice tohoto zákona, že ....), ale pokud to vezmeme selským rozumem. Jaké částky se pohybují na našich účtech nejčastěji? Vždy nižší než ty vyšší. Čímž je jasné, že nejvíce jich začne jedničkou. Pokud ale třeba platí a lze dohledat nějakou statistiku, že u každého telefonního čísla budeme sledovat POSLEDNÍ číslo, pak jsem v háji. Pokud ale bude pravděpodobnost prostě jen 1/10, pak moje myšlenka se zakládá na pravdě a lze jí definovat takto: pravděpodobnost výskytu je dána určitým logickým stropem, že čím více toho, tím méně pravděpoboné. Například řeky jsou většinou pravděpodobněji kratší než delší, atd. Vždy tam vstupuje jen ten jeden faktor, který za to může, kde je pomyslný strop a že největší skupina hodnot je právě zpočátku. Na grafu by se dalo zakreslit parabolou či podobnou kuželosečkou. Bude to platit u počtu hvězd v hvězdokupách či počtu planet v galaxiích ... jde o to, že vždy ta pravděpodobnost nižších čísel je vyšší než vyšších, právě díky jakémusi stropu. Je prostě dán nějaký rozsah, ve kterém je největší hustota nejmenších hodnot. Jednoduché jak facka.
@rastothesuchsoft6546 4 роки тому
To si nepochopil, o to tu vôbec nejde, veď základná podmienka je, aby súbor hodnôt obsahoval čísla z niekoľkých rádov. To, čo tvrdíš, síce môže nastať, ale s najväčšou pravdepodobnosťou by ti zvýšilo počet čísel začínajúcich jedničkou tak, že pravdepdobnosť by bola nad hodnotu 30.1.
@eltwarg6388 4 роки тому
... a navyše: 90 je menej ako 100, takže viac hodnôt by malo začínať 9-kou, či? ;)
@lubos8319 9 місяців тому
Tohle ale jistě nebude splňovat hodnota bankovních transakcí :)
@michalhodovsky8896 4 роки тому
Ohledně platnosti Benfordova zákona na počet obyvatel města mě hned napadlo, jestli to platí i pro Fibonacciho posloupnost. Ke konci vidaa je zmíněno, že ano. A jelokož lidé se množí jako králíci :-), pak je zřejmé, že počet obyvatl měst bude odpovídat nějaké hodnotě Fibonaccigo poslounosti.
@mirkorokyta9694 4 роки тому
No, to nevím... :) Pokud v počtech obyvatel českých měst spatříte nějakou FIbonacciho posloupnost, dejte mi vědět. :)
@KillerRW 4 роки тому ⁺²
Bylo by velice zajímavé vyzkoušet ještě tuto analýzu nad různými číselnými soustavami a možná by to i vedlo k vysvětlení proč to tak vůbec je.
@mirkorokyta9694 4 роки тому ⁺⁵
Dobrý den, trochu se o tom ve videu zmiňujeme, i když jen krátce a v závěru výpočtu: ano, Benford platí i pro jiné číselné soustavy. Ale protože jde o zcela stejný výpočet (jen s jinými integračními mezemi), tak to žádnou novou informaci o charakteru benfordovskách dat bohužel nepřínáší.
@petrsedlak9082 4 роки тому
To by bylo zajímavé ve dvojkové soustavě, haha.
@pbpitko185 4 роки тому
Platí benfordov zákov aj pre čísla vo všetkých číelných sústavách, nie len v dekadickej sústave, so základfom 10, ale aj napr. v hexadecimálnej sústave so základom 16, či trebats aj s s divokým základon trebars napr. 7 , 13, 33 a pod. ? Asi bz to malo platiť aj keď to vizerá divoko. Malo by to platiť aj pre dvojkovú sústavu.
@martinstejskal1066 4 роки тому
Samozřejmě tam platí, ale musí se trochu upravit. V desítkové soustavě rozdělujeme čísla do devíti skupin. Ve videu bylo řečeno, že v pětkové soustavě je rozdělujeme do čtyř skupin. Přesto součet hustoty pravděpodobnosti (v tomto případě čtyř čísel) musí být roven jedné. No a ve dvojkové soustavě máme jednu skupinu - ejhle, všechna čísla začínají jedničkou a to se stoprocentní pravděpodobností!
@rastothesuchsoft6546 4 роки тому
@@martinstejskal1066 Tak z toho sa dá vyvodiť jeden záver, v dvojkovej sústave platí Benfordov zákon (BZ) bez obmedzenia, teda pokiaľ súbor obsahuje aspoň jednu nenulovú hodnotu. ;)
Ale to mi vnuklo myšlienku, že ak pre daný súbor dát neplatí BZ, čo ak by sme súbor previedli do trojkovej číslenej sústavy. Logicky, súbor dát by presahoval cez viac rádov, z čoho vyplýva, že súbor dát by mohol začať spĺňať podmienky BZ. Čo je ale nevýhodou, výpovedná hodnota by bola nižšia, keďže by tam bolo menej skupín.
Samozrejme naopak, ak máme súbor dát, povedzme aj cez 10 rádov, a spĺňa podmienky BZ, mohli by sme ho dať povedzme do 40-kovej číselnej sústavy a overiť, či spĺňa podmienky BZ, a výpovedná hodnota by bola vyššia. ;)
V každom prípade by bolo zaujímavé toto otestovať. ;)
@izakfunker 4 роки тому
@@rastothesuchsoft6546 pro zajímavost: výskyt číslice 1 v Benfordovi v dvojkové soustavě 100% trojkové 63%, čtyřkové 50%, pětkové 43%, šestkové 39%, sedmičkové 36%, osmičkové 33,33% devítkové 32%, desítkové 30,1% stovkové 15%, tisícové 10%, desetitisícové 7%
@eltwarg6388 4 роки тому
@@izakfunker Prečo nenapíšeš rovno, že to je: logN(2), kde N je báza sústavy? ;)
@oldrichmarek419 4 роки тому ⁺⁴
A co kdyby jsme ty cisla vymocnili? Fungoval by ten benford stale?
@marekvalasek7251 4 роки тому ⁺⁵
Dobra otazka. Vime ze druhe mocniny prirozenych cisel Benforduv zakon splnuji. Talze bych si tipl, ze to bude i tady, ale chtelo by to proverit.
@mirkorokyta9694 4 роки тому ⁺⁷
Tohle je opravdu zajímavá otázka. Projel jsem si to na experimentu a odpověď je, že u mocnin vetších než jedna je to nejspíše pravda. Druhé, třetí, čtvrté, jeden a půlté mocniny dat o počtu obyvatel v ČR splňují Benfordovské rozložení, a to poměrně přesně. To bych taky tipnul, se stejným odůvodněním jaké píše Marek. U odmocnin jsem zaváhal a schválně zatím nedělal experiment, než si tipnu výsledek. Tipnul jsem si, že spiš ne. A opravdu, třeba pro pátou odmocninu vyjde jako nejčastější první cifra čtyřka a pro jiné odmocniny je to jinak. Ale pokaždé zcela nebenfordovsky. Díky za velice podnětný dotaz, M.R.
@oldrichmarek419 4 роки тому ⁺¹
@@mirkorokyta9694 není za co! :-)
@JA-zg1hv 4 роки тому ⁺²
Vy jste youtuber.
@hmmh-qq 4 роки тому
Dá sa to využiť na kontrolu korektnosti generátora pseudonáhodných čísel? Ak vygenerujem obrovský počet čísel a preženiem ich štatistikou, ktorej výsledok sa nebude rovnať s Benfordovým zákonom, tak generátor je chybný?
@mirkorokyta9694 4 роки тому
Mysím, že ne. Náhodný soubor dat nemusí Benforda splňovat. Benforda splňují jen jisté specifické soubory dat.
@hmmh-qq 4 роки тому
@@mirkorokyta9694 - Ja to skúsim a potom napíšem, ako dopadol výsledok. Podstatný rozdiel je medzi skutočným generátorom napríklad vytvorený fyzikálne technicky a pseudo-generátorom, ktorý funguje len matematicky, čiže dosahovaním nejakej nekonečnej iracionálnej rady čísel, ak ovšem je korektný, inak vznikne nejaká perióda i keď nemusí byť hneď zrejmá.
@AP57532 4 роки тому ⁺¹
@@hmmh-qq : rozložení pseudonáhodného generátoru (jako je funkce random() v různých programovacích jazycích) bývá rovnoměrné (to je vlastnost třeba lineárních kongruenčních generátorů). Běžně se nějakou následnou operací transformuje na nějaké jiné, třeba normální nebo jakékoliv chcete, včetně Benfordova. Takže ověřit správnost té transformace na Benfordovo rozložení by mělo smysl, ale spíš jen pro ujištění, že tam nemáte nějakou programátorskou chybu. Samotný generátor (ten s rovnoměrným rozložením) se ověřuje spoustou testů, je kolem toho celá věda a překvapivě spousta důmyslně vyhlížejících generátorů nevyhoví. Najděte si na netu, je to zajímavé počtení.
@eltwarg6388 4 роки тому
Ak chceš generátor s logaritmickou distribúciou hodnôt (taký, čo generuje niečo ako počty obyvateľov miest), tak potom je to dobrý test...
Ale to vlastne testuješ logaritmickosť tej distribúcie.
@golem664 4 роки тому
Mužů se zeptat??? Právě jsem na střední škole v prváku a bereme extrémní kvadratické rovnice. Nikdy jsem nebyl na matematiku exprert a v deváté třídě na základní škole jsem dostal na vysvědčení díky vám 3 a hrozila mi 5. Dále jsem díky vám udělal prijimacky z matematiky. Matematika nikdy nebyla moje silná stránka a vím, že nikdy asi nebude. Je možnost nějaké doucovani od vás. Já bydlím v Praze. Takže jestli ano prosím odpovezte... 🙃🙃🙃
@marekvalasek7251 4 роки тому
Ahoj. Jasne. Jdi na moje stranky. Mathematicator.com. tam je vse o doucku. Napis mi mail.
@golem664 4 роки тому
Aha. Děkuji já jsem váš objevil relativně nedávno takže se tu moc ještě neviznám 🙃🙃🙃
@vaclavvitous1415 4 роки тому ⁺²
Bude Benford platit, když se změní počet dat? Např vynechají Moravská města/řeky. :)
@janmolcik2398 4 роки тому ⁺²
IMHO ano, protože odebráním nějakého počtu výsledků z těchto dat (v tomto případě "náhodného" odebrání) by nemělo narušit tu vlastnost škálovatelnosti. Je to jako bychom vzali počet obyvatel z jiného státu - máme jiný vzorek dat ale měl by pro ně platit stejný předpoklad. Ruku do ohně bych za to ale nedal :-D
@mirkorokyta9694 4 роки тому ⁺³
Nesmíte odebrat data tak nešikovně, aby vám například zbyla data jen jednoho řádu. To by byl příklad umělého ovlivnění struktury dat, musíte ponechat jejích základní charakteristiku: dostatečně velký soubor dat různých řádů. Ale jinak to samozřejmě zůstane platit, dokud jich bude zůstávat dostatečně mnoho a různýcjh řádů. Vždyť i na řeky českých zemí můžete nahlížet tak, že se vzaly všechny světové řeky a odebraly se ty, které neprotékají ČR. :)
@warfery 4 роки тому
Tak mi to nedalo a udělal jsem si v pythonu testovací skript: Náhodně generovaná čísla od 1-999999, 10 milionů opakování. A výsledek? Max. četnost jednoho čísla 11.126%
, min. četnost 11.102%, optimálně by mělo být 11,111% (100/9) a to ten genrátor zcela jsitě není optimální. Mám pocit, že Benfordův zákon má co dočinění s gaussovým rozložením vzorků ("maximum" musí být dostatečně široké a musí probíhat přes dostatečný počet řádů (alespoň 2-3?)). Když vezmu např. ty města, tak je hodně "měst" s počtem stovek a tisíců obyvatel, méně desetisícu a ještě méně stotisícových. Čím větší číslo tím menší počet vzorků. Stejně tak při těch platbách, menších plateb bude určitě více než plateb v řádech desetitisíců a statisíců.
@josefdubisar5115 4 роки тому
Já nevidím důvod, proč by bylo víc měst třeba 1000 než 500 obyvatel. A pak ještě to dělení 2,5 apod. Je v tom něco víc.
@adamfiser7645 3 роки тому
S takto generovanými čísly to nemůže fungovat. Benfordův zákon předpokládá, že každý řád v souboru čísel musí být zastoupen se stejnou pravděpodobností.
@warfery 3 роки тому
@@adamfiser7645 To si nemyslím. Pokud by to bylo zcela náhodně, tak si moc nepomůžete. Vysledek bude stejný. Tam zcela jistě hraje roli klesající četnost vzorků s rostoucí hodnotou.
@libusatomkova7907 2 роки тому
Aj matematika chuti a prináša radost z objavovani.Zaujimave.
@baffiak1902 4 роки тому
jednoducha odpoved - pokial subor splna podmienku log normalneho rozlozenia, tak bude Benfordove. a prave datasety, ktore ste porovnavali, tak vsetky z nich splnaju podmienku log normalneho rozlozenia, ktore zjednodusene je - vela malych cisel a malo velkych cisel
@eltwarg6388 4 роки тому
Tiež sa divím, čo tam stále riešia ;)
Proste od 1 do 2 je v log škále cca 30%, ale od 8 do 9 je holt menej...
@jaroslavreznik7167 3 роки тому
viděl jsem dokument na netlixu, který to považuje sna za jakýsi zázrak a že nikdo pořádně neví proč to tak je...
@ValsorajKeceloh 4 роки тому
S počtem obyvatel se na to můžeme dívat tak, že nepočítáme lidi v ČR, ale počet malíčků v ČR, počet lidských kostí, počet očí, ... čili také můžeme "trochu podivně" změnit jednotku...
@sidlake5954 4 роки тому
Slovo JASNĚ tentokrát padlo 247x! Výhercem se stává Otakar Rambousek z Poděbrad, gratulejeme a poslíme pohled z Chrudimi.
@vikistastny473 4 роки тому
tak to je massakr :-) jen tyto 2 mozky by mohly zásobovat energií celou elektrárnu :-) paráda
@TheOgi22 4 роки тому ⁺²
05:04 - No to je previazané na meranie daných dát.
Ak niečo meriam, stupnica mi začína od 1 a končí pri 9.
A ten príklad s počtom obyvateľov je krásny, lebo je vždy väčšia "pravdepodobnosť" že stovky sa napočítajú viac krát ako 500 kedy k 500 mi dané dáta už nemusia dosiahnuť, lebo proste nemám 500 obyvateľov.
Môžem mať 545 obyvateľov, ale teda od 546 mi už vypadli čísla začínajúce na 5, teda tých bude menej, pričom pre čísla 1 2 3 4 by mala byť rovnaká pravdepodobnosť.
Stavím sa, že ak by sa to skúšalo s náhodne vygenerovanými číslami, tak by tá pravdepodobnosť nefungovala.
Toto teda nie je zázrak len chyba interpretácie a pochopenia.
09:10 - Je väčšia pravdepodobnosť, že budeš platiť niečo za 110€ ako za 910€
10:54 - Je väčšia pravdepodobnosť, že sa v čechách nachádza viac riek dlhých 100 000 km ako riek dlhých 900 000 km.
Môj príklad - Je väčšia pravdepodobnosť, že ľudia budú zarábať 100€ ako 900€.
Je väčšia pravdepodobnosť, že strom vyrastie 10m dlhý ako 90m dlhý.
Je väčšia pravdepodobnosť, že miniem 100l vody za rok ako 900l vody za rok.
18:09 - To označenie "t" so šípkou von z osi je asi chyba, nakoľko je os uzatvorená a nemá pokračovať za 10.
A označovanie f(t) je dosť mätúce, nakoľko "t" sa používa hlavne pre čas.
39:15 - to prehodenie (k*a) na druhú stranu ste mohli znázorniť šípkou.
46:33 - ak niečo vysvetľujete a sú to takéto hardcore veci, prosím nerobte dva kroky naraz.
@albertmlcoch3570 4 роки тому ⁺³
"09:10 - Je väčšia pravdepodobnosť, že budeš platiť niečo za 110€ ako za 910€" a co ceny 90€ až 100€? Bylo několikrát řečeno, že interval hodnot musí jít přes několik řádů, aby toto rozdělení platilo.
@TheOgi22 4 роки тому
@@albertmlcoch3570 To áno, ale vždy hodnoty toho posledného rádu spôsobia tú percentuálnu rozdielnosť.
Teda ak mám najvyšší rád 10^(20), tak tam sa použije tá logika, ktorú som sa snažil popísať.
Napríklad je väčšia pravdepodobnosť, že jestvuje na zemeguli viac ciest dlhých 2,25415458 * 10^(20), než ciest dlhých 5,42879642 * 10^(20) a ešte menej je ciest dlhých 9,62158794 * 10^(20).
@albertmlcoch3570 4 роки тому
@@TheOgi22 jak by ji mohli způsobit, když je to rozdělení tím přesnější, přes čím víc je to řádů? U toho vašeho řešení by to platilo přesně naopak: čím více hodnot jen v posledním řádu, tím víc to platí, což není pravda.
@TheOgi22 4 роки тому
@@albertmlcoch3570 Moje riešenie nič také ako píšete nehovorí.
Moje riešenie je presne o tom, že čím vyšší rád, tým menšia pravdepodobnosť a teda menšie zastúpenie.
@branislavkabat9140 4 роки тому
Je to vlastne veľmi jednoduché, funguje tu jednoduché drobenie. Okolo nás je najviac menších veci a najmenej tých veľkých. Rovnako tak je teda najviac 3,1 a najmenej 3.9. Preto ze medzi 3. A 4. Je znovu 1 až 9 teda malé 1 až veľké 9.
Tak je to aj v kope štrku malých jednotiek je viac ako dvojok a tých je viac ako trojok a nakoniec je tam len jeden veľký kameň čiže deviatka. Je to tak?
@pan_nekdo 4 роки тому
Nevím, jestli se to na mečem takovémto nezakládá, ale jistě to bude složitější, protože zde to závisí na 1. platné cifře nezávisle na velikosti.
@branislavkabat9140 4 роки тому
@@pan_nekdo musím namietať, pretože táto cifra vždy reprezentuje veľkosť. Aj počet opakujúcich sa jednotiek hoci ničoho, je vlastne veľkosť.
@pan_nekdo 4 роки тому
Video jsem nedokoukal, ale myslím si, že to bude souviset s tím, že v slušném souboru dat vychází medián menší než (aritmetický) průměr.
@mirkorokyta9694 4 роки тому
Dobrý den, ne takto jednoduché to bohužel není. Pojmy jako "větší věci a menší věci" by závisely na tom, jaké používáte jednotky míry. Co je "malou věci" v metrech (třeba jeden metr) může být "velkou věcí", když to měříme ve stopách nebo v palcích. Vaše úvaha by nevysvětlovala proč teda třeba délky řek splňují Benfordovo rozložení, ať je měříme v metrech, stopách, mílích nebo v čem chcete.
@branislavkabat9140 4 роки тому
Ja to vidím takto: do jedného mora/9 sa vlievaju veľké rieky/8 tie plnia menšie /7... Nikdy nebude 9 morí a iba jedna mala rieka. A môžeme to merať v čom len chceme. Vzdi je menšieho viac ako veľkého. Mikrosvet aj makro svet. Samozrejme cením si to, ako je to zapísané vo vzorci. Ani milionárov nebude viac ako chudobných.
@carochodxd6984 4 роки тому
Zdravím pane, udělal bys něco jako "reakci" ua-cam.com/video/HhI2v58hQx8/v-deo.html na tohle video? Proti typkovi nic nemám a sleduju ho celkem pravidelně,ale pár příkladů co tady ukazuje mi přijde jako nepravda :D tak by mě zajímal názor skutečného matematika :D
@rastothesuchsoft6546 4 роки тому
Prepáč, ale to je off topic, čo to má spoločné s touto témou?
@romanhanajik3185 4 роки тому ⁺⁴
Je to jednoduché: Ak sú zdrojové data ohraničené zhora, tak to neplatí. Ak začinajú nulou a sú zhora neohraničené, tak to platí. Napíšte prácu "Podmienky platnosti Benfordovho zákonu" a dopíšte ma na prvé miesto. Dík za spoluprácu kolegovia. 😇
@mirkorokyta9694 4 роки тому ⁺²
To je hodně odvážné tvrzení. Asi chápu, proč takový článek nechcete sepsat sám. :)
@romanhanajik3185 4 роки тому
@@mirkorokyta9694 nepovedal som, ze nechcem. Ja som este ani toto video nestihol dokonca dopozerat, tak neviem, ci nemate kontra argument tam dalej, pripadne v dalsom videu. Uz som tuto teoriu zahlasil pred par rokmi vo vlaku cestou do prace pri rozhovore s vyucujucou na VS, ktoru to zaujimalo a vsetky vymenovane serie dat co mala tomu sedeli. Tiez sa jej to zdalo odvazne. 😆
Tak predpokladam, ze ako sa poznam, za par rokov zas niekde splechnem svoju teoriu a mozno sa najde niekto, kto mi ukaze radu, co to popiera. Tych popierajucich je mozno vela, ale mozno nie.
Ja mam teraz inu "zabavu", ale mozno (0,5%) sa na to dam, ked tiez podpichujete. 🤗 Ale mate argument proti?
@mirkorokyta9694 4 роки тому ⁺⁵
@@romanhanajik3185 Pardon, já jsem nechtěl podpichovat, já myslel, že to říkáte jako vtip a tak jsem taky odpověděl "vtipně". :) Takže se omlouvám za nepochopení. Ale pokdu jste to myslel vážně, tak zde je vážná odpověď a není těžká: jakýkoli konečný soubor dat je omezený, a sice svojí největší hodnotou. A přitom pro některé tyto soubory omezených dat Benfordův zákon platí (nepříklad počty obyvatel českých měst) a pro některé ne (například všechna čísla o 90001 do 99999). Pokud byste chtěl příklad na nekonečných souborech dat, tak ten lze vyrobit takto: s oběma zmíněnými soubory provedeme následující úpravu: každý z nich násobme 10, 100, 1000, 10000, .... a postupně je přidávejme k původnímu souboru. Takže například první soubor bude sestávat z počtů obyvatel všech českých měst ke kterým přídáme všechny jejich desetinásobky, stonásobky atd. - vznikne nekonečný soubor neomezených dat, který bude splňovat Bernfordovo rozdělení, protože první cifry se přenásobením 10, 100, atd. nezmění. A podobně když uděláme stejnou operaci se seznamem čísel od 90001 do 99999. Vznikne nekonečný soubor neomezených dat, která nesplňují Benforda, protože všechna začínají cifrou 9. Takže tu máte všechny 4 případy: omezená data, co splňují Benforda, omezená, co nesplňují Benforda, neomezená, co splňují a neomezená, co nesplňují. Mezi omezeností dat a platností Benforda není žádná souvislost.
@romanhanajik3185 4 роки тому
@@mirkorokyta9694, tak ja som to podpichnutie nebral zle, iba mi bolo jasne, teda predpokladal som, ze predpokladate, že to nemyslim Vážne a preto som sa rozpísal. Nie preto, že by som sa urazil.
No a teraz si budem musieť najsť novú definíciu! Pretože som presvedčený, že existuje.
Rada čísel napr. 1000-9999 vynasobena 10-10 000 nebude vyhovovat, lebo nevznikla nahodne, ale su vytrhnute z nahodneho rozdelenia. Vznikli "umelo", aj ked nahodne. Takze minimalne obmedzujem tvrdenie na cely rozsah dat vzniknuty nahodne/prirodzene.
Je niekde daka stranka, kde su rozne subory dat platne a neplatne tomuto rozdeleniu?
@mirkorokyta9694 4 роки тому ⁺³
@@romanhanajik3185 Na anglické wikipedii pod heslem Benford's law jsou nějaké příklady. Ale ono je to opravdu dost složité a myslím, že není žádná jednoduchá charakterizace. Třeba se ví, že náhodně generovaná čísla Benforda nesplňují, tam je rozdělení počátečních cifer rovnoměrné. Ale když se dělají součiny dvou náhodně generovaných čísel, tak už to k Benfordovi konverguje. Každopádně je dobře, že vás to zaujalo. Zdraví M. R.
@Aquarius-CZ 4 роки тому
Tito pánové mají určitě velmi dobrý intelekt a rozumí číslům. Ale očividně netuší, co je to intuice.
@MUDRO30 4 роки тому
Skúsil som frekvencie tónov zo 6 oktáv (Hz), čo nieje úplne ideálny príklad, lebo šlo o rozsah (55-3520Hz) ničmenej výsledok je zaujímavý! Je benfordovský pre prvé 3 čísla a pre 4 až 9 je viacmenej rovnomerný, 72 tónov :
1- 24 /33,3%
2- 14 /18,0%
3- 8 /11,1%
4- 4 / 5,5%
5- 5 / 6,9%
6- 6 / 8,3%
7- 4 / 5,5%
8- 4 / 5,5%
9- 4 / 5,5%
Zaujala ma však databáza čo použil pán docent - počet obyvatelov a myslím, že by bolo zaujímavé zistiť, či by sa táto databáza chovala benfordovsky aj v inej sústave napr. v osmičkovej. :)
@romanhanajik3185 4 роки тому
stranky statistickeho uradu a wikipedia...
@MUDRO30 4 роки тому ⁺¹
@@romanhanajik3185 Prečo ja? Aj ty čosi sprav... a wikipediu nepotrebuješ...
@romanhanajik3185 4 роки тому
@@MUDRO30 ja len, že taká db je hocikde.
@mirkorokyta9694 4 роки тому ⁺²
Ano, použil jsem data, která jsem si stáhl ze stránek Českého statistického úřadu. Benford by měl fungovat v libovolné číselné soustavě, pokud už funguje v nějaké jiné, na závěr našeho videa o tom mluvíme. Ale například v osmičkové soustavě budou trochu jiné procentové hodnoty, budou se odvíjet od logaritmu se základem 8. Zdraví M. R.
@mirkorokyta9694 4 роки тому
Můžete mi ten experiment s frekvencemi tónů popsat podrobněji? Děkuji, M. R.
@Nirman222 3 роки тому
Tabulka sumy vyskytu podle pocatecni cifry zrovna Benforduv zakon nesplnuje :P Cas 6:42, druhy sloupec tabulky.
@danielbriza1279 4 роки тому
Z pozice laika: Možná to není intuitivní, ale přijde mi tento příklad jdoucí proti intuici jako logický.
Není to prvně, co jsem vypozoroval a přemýšlel nad tímto nerovnoměrným rozložením, jen jsem netušil, že už je pro to název "Benfordův zákon". A vysvětlení tohoto jevu podle videa vypadá celkem prostě...
Benfordovké rozložení se tedy podle videa vztahuje na soubory dat přirozeného původu.
Vezměme si například délky řek, ty prostě mají nějakou délku podle okolností v přírodě, tuto délku se rozhodneme nějak kvantifikovat, a to za pomoci nějak jednotkové míry, vyjde číslo. Zvolíme-li jinou jednotku, vyjde jiné číslo (ale stále půjde o snahu délku řeky kvantifikovat, pouze se hodnoty přeškálují).
Jde tedy o pojem "číslo". Číslo jako kvantifikátor jevů v přírodě, přírodou prorostlý - a my jím hodnotíme soubory dat přirozeného původu. Pokud platí, že aby bylo rozložení benfordovské, musí fungovat možnost přeškálování, platí to i naopak. Vyplývá to z definice a grafu funkce na tabuli. A pokud má benfordovské rozdělení platit ve všech řádech současně, tak to bez benfordovského rozdělení nevyjde, aby to šlo donekonečna přeškálovávat. Podle mého názoru to musí být už součástí definice toho, že číslo v dané číselné soustavě lze zapsat ve více možných řádech.
Pokud jde o prvočísla, je pro mě zajímavé, že jsou také rozložena tak, že splňují benfordovské rozdělení (je možnost je donekonečna přeškálovávat).
Rozložení obyvatel do sídlišť a aglomerací asi funguje podle nějakých přírodních zákonů podobně, jako včely instinktivně vytváří úly tak, aby na tvorbu stěn spotřebovaly co nejméně materiálu (za pomoci šestiúhelníků). Náhodné a přitom přirozeně se tvořící bankovní transakce splňují taky nějaký ten přírodní zákon.
Pokud si vezmeme soubor dat nepřirozeného (umělého) původu (toť pak otázka definice, o co se jedná), mohlo by jít skutečně o ty smyšlené bankovní transakce, protože:
- přirozeně se tvořící transakce budou (v rámci možností a splnění náležitostí pro dostatečný soubor dat) začínat nejčastěji jedničkou (a končit devítkou díky Baťovi :D);
- uměle je bude člověk tvořit nejspíš intuitivně, tj. tak, aby částky začínaly každou číslovkou zhruba stejně často, aby to vypadalo pseudo-věrohodně a nenápadně, případně vytvoří nějaké odchylky od rovnoměrnosti, aby ta snaha o nenápadnost nebyla tak okatá;
- počítač částky bude tvořit uměle pomocí tzv. pseudo-náhody, takže od něj nelze čekat benfordovské rozdělení.
Z toho mi vyplývá otázka:
Znamená to, že když člověk znalý Benfordova zákona bude hypoteticky tvořit falešné bankovní transakce podle benfordovského rozdělení, nebudou jeho transakce formálně odhaleny jako falešné? Jedná se pouze o teoretickou otázku, věřím, že analytikové mají k dispozici více nástrojů k odhalování podobných podvodů.
@danielbriza1279 4 роки тому
@pemailv Jasně, ale na to jsem se ani neptal. ;)
@danielbriza1279 4 роки тому
@pemailv Díky za odpověď... Obsah otázky vám uniká, pokud tvrdíte, že jste na ni odpověděl (její jádro je na konci věty, ne na začátku ve vedlejší větě). A vím, na co jsem se chtěl zeptat, díky za starost. Ale odpověď na ni asi ani znát nepotřebuju, byla to jen teoretická otázka (proto jsem psal "hypoteticky"). A samozřejmě na účetnictví (což je taky soubor dat) jsem se ptal, to jste trefil a ostatně o bankovních transakcích byla řeč ve videu, jestliže si to vybavuju správně. Ale v bankovnictví se zřejmě nevyznám tak dobře jako vy, nebudu si přece dělat patent na rozum.
@danielbriza1279 4 роки тому
@pemailv To asi nechytal, pořadí písmen místo číslic závisí na dalších okolnostech, i když je tím dáno konkrétní číslo. Byl by nutný přepis nehledě na číselnou soustavu a možná by Benfordův zákon ani nikdy nebyl objeven.
@mr.schloopka1124 4 роки тому ⁺¹
U těch měst to podle mě bude, protože počet obcí s počtem obyvatel klesá. Měst které mají 100 000 obyvatel bude mnohem víc než těch, které mají 400 000. Stejně tak bude mnohem více měst s 10 000 obyvatel, než s 50 000.
@marekvalasek7251 4 роки тому ⁺¹
To dava smysl.
@oldrichmarek419 4 роки тому ⁺¹
A 900 000 bude vuc nez 1 000 000 hmmm
@mr.schloopka1124 4 роки тому ⁺¹
@@oldrichmarek419 ale já se budu bavit jenom o stejných řádech.
@vaclavtaus6383 4 роки тому ⁺¹
Hned na začátku videa pánové upozorňují, že je potřeba použít data, pokud možno od řádu jednotek po řády desetitisíců i více. Vše vysvětlují na příkladu měření velikosti dospělých osob, kdy můžeš použít nekonečně mnoho hodnot a stále budou hodnoty začínat jedničkou, mizivé procento dvojkou a ostatní číslice prostě první nepouziješ.
@mirkorokyta9694 4 роки тому ⁺⁴
@@mr.schloopka1124 Dobrý den, pokud se omezíme jen na data jednoho konkrétního řádu, tak Benford přestane fungovat. Přímočará statistika ukazuje, že pokud uvažujeme jen obce například "řádu 1", tj. obce s počtem obyvatel mezi 10 a 99, tak v tomto souboru začíná jedničkou jen půl procenta dat a devítkou skoro 20%, naprotitomu v souboru 1000 až 9999 jedničkou začíná 57% dat a devítkou 0,8%. Ani jedno z toho není Benfordovské a obojí se to od sebe dost podstatně liší. Obecně: experimenty ukazují, že Benford funguje až tehdy, když se současně uvažují data alespoň 4 až 5 různých řádů. Tak se lokální rozdíly vykompenzují a ustálí kolem Benfordovského rozdělení. Ruku v ruce se škálovatelností, která je za Benfordem ukryta (jak jsme se snažili ve videu naznačit), je totiž i to, že musí být k dispozici data různých řádů, aby i po přeškálování byla k dispozici "data různých řádů". A ne data jednoho konkrétního řádu a po přeškálování jiného konkreétního. Ten experiment s obcemi 10-99 a obcemi 1000-9999 to ilustruje.
@petermikula3349 4 роки тому
To aplikujem na Marxov zákon hodnoty (t), kde produktivita je nepriamoúmerná. t-> 1/P
@petermikula3349 4 роки тому
Pre nadhodnotu je produktivita P, priama úmera.
@infernal314 4 роки тому
K výsledku benfordofského rozdělení lze dospět i rychleji a obecněji, neboť z podmínky škálování rovnou plyne, že ta funkce musí být homogenní, a musí mít tedy formu f=a x^\alpha, kde \alpha je neznámý exponent (pouze funkce tohoto tvaru zachycují "samopodobnost", tedy nezávislost na škále). Jeho hodnota plyne z normalizace \int_1^10 x^\alpha dx=1, která vede na transcendentní rovnici, ale výsledek (\alpha=-1) lze snadno uhádnout (hodnota horní meze nemá na výsledek vliv, odtud také invariance na číselné soustavě).
@marekkolbaba2217 4 роки тому
Jednoduché vše co se překulí přez řád prostě při sčítání vždy začíná nejprve jedničkou a až poté se dostává na další čísla
@pavelzajic7636 4 роки тому
Benfordův zákon = 1/2 Gaussovy křivky ?
@KaelSvalcembelk 4 роки тому ⁺²
Vůbec ne. To spolu nemá co dělat. Tady mimo jiné pán řekl, jak musí vypadat ta vstupní data. A má to docela dost omezení. Třeba měření výšky lidí tím Benfordem vůbec nezpracuješ. Ale Gaussovu křivku na to jednoduše uplatníš.
@eltwarg6388 4 роки тому ⁺¹
Benfordov zákon platí perfektne na logaritmicky rozložené dáta.
Pre normálne rozdelenie, najmä ak je úzke, nefunguje vôbec (ako napríklad to meranie výšky ľudí, čo už spomenul aj Swewsa)
@rastokocour2335 4 роки тому
Ak by som vzal Benfordovský súbor dát (napr.zmieňovaný súbor dĺžok českých riek) a odstránil z každého čísla prvú číslicu, dostanem Benforda ? Nižšie ste to nakusli a odvolali ste sa na dvojice čísel, mňa však zaujímajú práve druhé číslovky v poradí. Pretože ak by to platilo, tak postupným umazávaním prvých čísloviek čísel súboru s dostatočne veľkým rozptylom rádov, tak by som vždy mal dostať dostal Benforda.
@albertmlcoch3570 4 роки тому
Pokud by jste umazáním první číslice měl získat znova Berforda tzv. "bez ztráty kytičky", musel by jste z tohoto nového Berforda smazáním (další) číslice opět získat Berforda. Co ale s čísly, která by vám tímto postupem "zmizela"? (protože měla např. pouze dvě platné cifry, jako 83, nebo 32 000)
Tím by jste si rychle snižoval jak počet řádů, tak počet samotných vzorků čísel, tedy nemůže být pravda, že po každém odejmutí první číslice zůstane rozložení stejné. (po docela malém počtu iterací dojdete k množině nul, nebo prázdné množině)
Bylo by ale zajímavé zjistit, jestli se Berfordovo rozložení z dat postupně vytratí, jak budou ubývat cifry, nebo jestli zmizí hned při prvním kroku.
@eltwarg6388 4 роки тому ⁺¹
Nie, až tak celkom to nefunguje, ale tak trochu áno.
Prvá platná číslica sa riadi pri viac-menej logaritmickom rozdelení dát Benfordovým zákonom, druhá a ďalšie sú podružné.
Ak by ste ale skúmali prvú dvojicu cifier, prišli by ste na to, že tých hodnôt, čo začínajú 11 je viac, než tých, čo začínajú 12, 13, a postupne až 19.
No ten rozdiel je oveľa menej výrazný, ako v prvom ráde.
V konečnom dôsledku vám vyjde, že rozloženie "nových" prvých cifier bude asi takéto: 1: 12.94%, 2: 12.36%, 3: 11.85%, 4: 11.39%, 5: 10.98%, 6: 10.61%, 7: 10.26%, 8: 9.95%, 9: 9.66%
No a s každým ďalším krokom sa to bude stále viac vyrovnávať (za predpokladu, že máte dosť cifier na odoberanie :)
@StanislavBrabec 4 роки тому
Existuje jedna škála, která vůbec není náhodná, je uměle vytvořená, a přitom také splňuje Benfordův zákon: řady pasivních elektronických součástkek. Ty se vyrábějí tak, aby k libovolné potřebné hodnotě byla k dispozici součástka s odchylkou nejvýše daný počet procent. cs.wikipedia.org/wiki/Vyvolen%C3%A9_%C4%8D%C3%ADslo
@FF-wl1oo 4 роки тому ⁺²
To ja mam jeden matematicky paradox, na ktery je kratky i pan Rokyta... Cim dele lezak lezi, tim vice stoji. A ted rozumujte!
@pavolremis 4 роки тому
nesúhlasím z názorom, že keď všetký hodnoty vynásobím konštantou 3,14, tak dostaneme opäť tie isté údaje 1-30%, 2-17%..., pretože keď vstupné údaje 1,00*3,14=3,14 a 1,99*3,14=6,24 tak 30% výsledkov nebude začínať číslom 1, ale číslom v rozmedzí 3-6. Takže keď vstupné dáta budu skôr nízkych hodnôt 1,00-1,27 (30% výsledkov bude začínať 3), tak konečné hodnoty po prenásobení budú iné ako keď budem mať vysoké čísla 1,92-1,99 (30%=6). Hodnota 1,92 predstavuje napríklad číslo 1925846 a skrátený tvar uvádzam iba pre jednoduchosť výpočtu. A hoci aj ostatné čísla sa budú vynásobovať rovnakou konštantou, tak 1/3 všetkých údajov (1) je už vynásobená a tie ďalšie hodnoty by už nemali, tak moc prehovoriť do výsledkov.
@rastothesuchsoft6546 4 роки тому
Nedalo mi to.
Pri násobení konštantou 3.14, sa dostanú všetky čísla začínajúce platnými číslicami v rozmedzí od 3.184713376 do
6.369426752 na miesto, kde budú začínať číslicou 1. A pravdepodobnosť výskytu v tomto rozsahu by mala byť rovnaká ako v rozsahu 1 - 2, teda tie čísla, ktoré začínajú číslicou 1, takže by mala byť 30.1, dá sa to vypočítať, ale nechce sa mi. ;)
Nech mi všetci prosím prepáčia nie dobré vyjadrovanie sa, nie som matematik. ;)
@rastothesuchsoft6546 4 роки тому
Zasa mi to nedalo:
log10(6.369426752) - log10(3.184713376) = 0,804100348 - 0,503070352 = 0.30103 :-)
@rastothesuchsoft6546 4 роки тому
A ešte poznámka, samozrejme, že nedostaneš tie isté údaje. Iba Benfordov zákon bude platiť. ;)
@pavolremis 4 роки тому
@@rastothesuchsoft6546 práveže nebude platiť lebo tam nebude jednotka na prvom mieste s 30%
takže nebude platiť ani to že je jedno v akých jednotkách meriaš, či v palcoch alebo cm,
a prekvapuje ma že sa nikto nad tým nepozastavil
@petrsedlak9082 4 роки тому ⁺¹
@@pavolremis Asi proto, že se do nových dat začínajících 1 dostane mnohem víc těch původních z většího rozsahu cca 3.2-6.36 (3x4=12, 3x5=15, 3x6=18), zatímco ty původní hodnoty mezi 1 a 2 se v nových datech zase rozdělí do čísel začínajících 3-6...
@alespaclt2121 4 роки тому
LOGICKÉ VYSVĚTLENÍ - když budeme brát třeba 4 mísná čísla počtu obyvatel u obcí v ČR - 1.XXX , 2.XXX až...9.XXX tak je přirozené, že vesnic s počtem obyvatel 1.000 až1.999 bude mnohem více než již menších měst s počtem obyvatel 9.000 až 9.999.
@marekvalasek7251 4 роки тому
Souhlas. To co je pozoruhodne je, ze to klesani cetnosti s poctem obyvatel je jako 1/n.
@mirkorokyta9694 4 роки тому ⁺¹
Tady bych byl trochu opatrný. Už ve videu ukazujeme, že data o počtu obyvatel splňují Benfordovské rozdělění i tehdy, když je všechna vynásobíme či vydělíme stejným číslem. Váš argument by nevysvětlil, proč tomu tak je. Také by nebyl schopen vysvětlit, proč se i délky řek chovají Benfordovsky. Benforda nemůžeme vysvětlovat pomocí speciální vlastnosti jednoho konkrétního souboru dat (počty lidí) a zcela jasně také selhává na souboru dat, u kterého se omezíme pouze na data jednoho pevného řádu (například jen desetitisíce). Jinak je správné, že si děláte vlastní hypotézy, ale také je dobré si je ověřit na datech: měla by vaše úvaha fungovat např. i na obce s počtem obyvatel mezi 10 a 99? V tomto souboru ovšem začíná jedničkou jen půl procenta dat a devítkou skoro 20%, naprotitomu v souboru 1000 až 9999 jedničkou začíná 57% dat a devítkou 0,8% dat. Nic z toho není benfordovské a je to obojí od sebe dosti vzdálené.
@alespaclt2121 4 роки тому
Omlouvám se, byl to jen právě projev mé intuice (nejsem matematik ale právě díky tématu INTUICE o kterou se zajímám, se mi ukázalo toto zajímavé video). Doplním ještě můj intuitivní názor na ty řeky a Benforda obecně. Tedy opět pouze Intuitivně jsem vytušil, že třeba u řek bude asi 1 ROZHODUJÍCÍ kritérium od 100 do 999 km ve kterém bude naprostá většina údajů. A opět říček od 100 do 199 km bude mnohem více než těch od 900 do 999 km a pokud vezmeme řeky nad 1000 km a nebo říčky pod 99 km - tak těch bude v součtu minimum a ať tam je již struktura jakákoliv - nenaruší to DOMINANTNÍ VLIV VŽDY JEDNÉ KLÍČOVÉ ŘADY. Na závěr se ještě jednou omlouvám protože matematika je pro mě obor který obdivuji - ale nemám k němu žádné skutečné nadání. Každopádně PŘEJI VÁM - SKUTEČNÝM MATEMATIKŮM HODNĚ ZDARU ve Vaší prospěšné činnosti při její popularizaci. Ing. Aleš Paclt
@mirkorokyta9694 4 роки тому ⁺¹
@@alespaclt2121 Dobrý večer, to je moc fajn, že se o to zajímáte. Ono na té úvaze částečně něco je, je to úvaha typu "proč se u některých počátečních cifer zdržíme déle". Ale napsal jsem, že se s tím musí opatrně. Podle mého názoru se nemůže zůstat jen u čísel jednoho řádu. U těch řek třeba je divné tvrdit, že těch s délkou 100-199 km je více než těch s délkou 900-999 km, protože kdybychom tytéž řeky měřili v mílích, tak by to znamenalo, že tvrdíme, že řek s délkou 62-124 mil je více než řek s délkou 562-624 mil. To je sice možné, ale problém rozložení prvních cifer to nijak nezdůvodňuje.
@milanlesko8737 4 роки тому ⁺¹
Mám taký myšlienkový pochod. Ten „Benfordův zákon“ nefunguje preto, lebo to vyplýva z usporiadania „arabského“ zápisu čísla? Ak použijeme binárnu sústavu, tak samozrejme jednička bude mať zastúpenie na začiatku čísla 100%. Keď čísla (údaje) rozpíšeme v osmičkovej, potom v desiatkovej a nakoniec v šestnáckovej sústave, tak počítam, že sa pravdepodobnosť použitia čísel zasa pekne rozostúpi podľa podobného grafu ako ste prezentovali. Vlastne ta pravdepodobnosť použitia konkrétneho čísla na začiatku súvisí so zápisom, nie so samotnými udajmi. Rozmýšľam, ak by ste čísla zapísali napr. „rímskym“ spôsobom (MDCLXVI), trafila by sa štatistika do tej istej krivky? A ešte jedna vec, skúšal niekto urobiť štatistiku použitia číslice, ktoré je v číslach na druhom, prípadne inom mieste? Ako by to dopadlo?
@icinko92 4 роки тому
Absolutne suhlasim Toto je podla mna iba o sposobe zapisu cisiel
@albertmlcoch3570 4 роки тому ⁺¹
S římskými číslicemi vám toto nemůže vyjít, protože u nich záleží na řádu, s kterým počítáte. U souboru hodnot 1 až 10 000 vám tedy zákonitě musí vyjít jiné rozložení prvních písmen, než u souboru třeba 100 až 1 000 000. (Neplatí podmínka přeškálování)
K teorii, že jde jen o způsob zápisu: to by ale nijak nevysvětlilo, proč to na některé druhy dat pasuje a na některé ne, když by šlo jen o zápis.
@rastothesuchsoft6546 4 роки тому
Myslím si, že to so spôsobom zápisu čísiel vôbec nesúvisí. Jednoducho to v realite funguje tak, že vo všeobecne prirodzene sa vyskytujúcich hodnotách, ak ich v súbore dát zoradíme podľa poradia, zrejme zistíme, že hodnoty v takto zoradenom súbore nenarastajú nejakým "pričítaným" prírastkom, ale skôr podielovým prírastkom. Chcem tým povedať, že "realita" nepričítava, ale násobí. To spôsobuje, že čím vyššie číslo, tým vyšší prírastok pre nasledujúce číslo. Samozrejme priemerný prírastok.
Tu je zaujímavé, že ak si vytvorím súbor dát umelo, napr. násobením číslom 1.1, tak to pekne vidieť, ako sa prírastky zvyšujú.
Niekde tuto bude zakopaná pointa tohto zaujímavého javu. :-)
@milanlesko8737 4 роки тому
@@rastothesuchsoft6546 Písal som si s p. Docentom a áno, súvisí to aj so zápisom (preto sa to volá pozičný zápis)
@milanlesko8737 4 роки тому ⁺¹
@@rastothesuchsoft6546 Odpoveď p. Docenta:
Dobrý den,
Benfordův zákon opravdu souvisí s tzv. pozičním zápisem čísel. To
znamená, že záleží nejen na použitých symbolech, 1,2,3... ale také na
jejich pozici v rámci zápisu čísla. Je-li některý symbol (cifra) na
pozici stovek, hraje jinou roli než tatáž cifra na pozici desítek. Není
tolik důležité v jaké číselné soustavě pracujeme, jestli v trojkové,
osmičkové nebo desítkové. Charakter Benfordova zákonva zůstane stejný,
mění se jenom konkrétní procentuální zastoupení. Tím charakterem myslím
to, že ať už zapisujeme v desítkové nebo v osmičkové soustavě, tak na
první pozici bude vždy nejčastější cifrou jednička, jen to budou jiná
procenta v jiné číselné soustavě. Konkrétně, při zápisu v desítkové
soustavě to bude procentuálně v 100*log10(2) případech, v osmičkové
soustavě by to bylo v 100*log8(2) případech atd. Pod log10 myslím
logaritmus o základu 10, log8 znamená logaritmus o základu 8. Atd.
Vidíte, že to funguje: ve dovujkové soustavě je jednička skutečně a
první pozici v 100*log2(2) = 100% případů.
V případě zápisu římskými číslicemi takový zákon neplatí. Římská čísla
nejsou poziční v tom smyslu, že písmeno M bude vždy tisíc, tedy MM
budou dva tisíce, CC dvě sta atd. Druhá pozice toho druhého M nebo
druhého C nemění jeho hodnotu.
Ještě bych chtěl podotknout, že data, která splňují Benfordův zákon,
nejsou náhodná data. Pokud budete generovat zcela náhodný soubor dat,
nebude jejich první cifra splňovat Benfordovo rozložení. Ta data musí v
sobě mít něco, co bychom mohli nazvat "multiplikativní charakter" (tj.
musí tam být nějak skryto násobení). Jedním z těch případů je např. ono
škálování, o kterém jsme mluvili ve videu (škálování je vlastně
násobení), další možnost jsou například mocniny dvojky (násobení mnoha
dvojek), faktoriály atd. (o těch taky byla řeč). To nejsou náhodná data,
jejich vznik je nějakým způsobem spjat s procesem násobení.
Ptáte se na to, jestli je známo, jak se chovají například druhé cifry u
souboru Benfordovských dat. Ano, to je známo: i na druhém místě
převažuje jednička, ale už ne tak výrazně. Existuje i vzorec, který
říká, v kolika procentech asi můžeme čekat jedničku, dvojku, atd. na
druhém místě v pozičním zápisu. Při zkoumání, jaké rozložení mají další
cifry (třetí, čtvrtá, atd...) zjišťujeme, že se stále více blížíme
rovnoměrnému rozdělení.
Ohledně tohoto posledního odstavce zvažujeme s Markem, že natočíme ještě
Benfordkovský sequel, ve kterém se touto problematikou budeme zabývat.
Zdraví M. Rokyta
@soichironguyen9933 3 роки тому
SLEDUJEM TO UZ ASI 6 MESIACOV. ZOZACIATKU TO NESEDELO. POSTUPNE SA PORADIE UPRAVOVALO............
@petervansan1054 4 роки тому
Proc to 4x opakujete?
@rastothesuchsoft6546 4 роки тому
Toto patrí sem...
To je dôkaz, že hudba a matematika spolu súvisia. :D
ua-cam.com/video/tNYfqklRehM/v-deo.html
@lubos8319 9 місяців тому
Matematika nesouvisí s ničím. Spíš bych ji přirovnal k jazyku. Matematika je jen prostředek k vyjádření skutečnosti. Sama o sobě je ale pouze abstraktní, podobně, jako jazyk.
@daliborvanek5639 4 роки тому
Proč mne to nepřekvapuje
@BigJuris 4 роки тому
Vim proc to tak je 😉

Наступне

Автоматичне відтворення