If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание

Закон на Бенфорд (с Ви Харт, 2 от 2)

Ви Харт посещава Кан Академия и разговаря със Сал за загадката на закона на Бенфорд (наричан още закон на Нюкомб—Бенфорд, закон на аномалните числа или закон на първата цифра. Той се отнася за разпределението на старшата цифра в много реални набори от цифрови данни. В естествените колекции от числа старшата цифра най-често е малка. С единица започват около 30% от числовите данни, докато с 9 започват по-малко от 5% от данните. Ако цифрите бяха разпределени равномерно, всяка от тях щеше да се появява като начална в около 11,1% от случаите.). Създадено от Сал Кан.

Искаш ли да се присъединиш към разговора?

Все още няма публикации.
Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.

Видео транскрипция

САЛ: В последното видео приключихме там, където Ви и аз ти показахме една мистерия. Говорихме за Закона на Бенфорд. ВИ: И попитахме какво се случва при закона на Бенфорд? САЛ: Тази идея, че ако вземеш случайни държави и техните населения, и вземеш най-значимата цифра в населенията им и ги поставиш на графика, най-значимата цифра е 1, а не 2, нито 3, много по-вероятно е това да е 1. Ако вземеш физическите константи на Вселената, най-вероятно е да имат 1 за най-значима цифра. ВИ: Иска ми се да имахме повече графики, понеже графиките са забавни. САЛ: Да. ВИ: Но ако погледнеш информацията от стоковия пазар или нещо друго, какво се случва там? САЛ: Да. Изглежда всички следват тази крива. И това беше изключително мистериозно – и тук приключихме в последното видео – че ако погледнеш някой първичен случай, като например редицата на Фибоначи или степени на 2, това точно съвпада с разпределението на Бенфорд. Точно съвпада с това. Ако вземеш всички степени на 2, малко над 30% от тези степени на 2, всички степени на 2 имат 1 за най-значима цифра. Какво е това? 17? Приблизително 17% от всички тези имат 2 за най-значима цифра. ВИ: Да. Въпреки че в този случай има безкраен брой във всяко множество, така че е по-трудно да се направи графика. САЛ: Но ако искаш да изпробваш това, можеш да вземеш първите милион степени на 2 и после да намериш процента. И това вероятно ще ти даде доста добра приблизителна стойност за нещата. ВИ: Да. За мен това е по-малко мистериозно. От една страна, това точно съвпада с математиката. Но също така ти дава доста добра представа, понеже осъзнаваш, че тук има нещо, което мога реално да разгледам. САЛ: Можеш да разгледаш това и то става нещо, което можеш да разровиш по-надълбоко. И в последното видео казахме, че искаме да спреш и да помислиш защо се случва това, понеже, честно казано, трябваше да направим същото нещо. И една голяма насока за нас беше, когато разгледахме една логаритмична скала. И гледаме една такава ето тук. Да поясним, тук при тази логаритмична скала виждаш равни пространства и те са степени на 10. На една линейна скала, това би било 1. Може би това би било 2, а после това 3. Или, ако искахме да кажем, че това е 2, тогава щеше да кажеш, че това е 1, това е 10, това щеше да е 20, после това щеше да е 30 и така нататък. Но при логаритмична скала равните разстояния са по 10 или, в този случай, взимаме степени на 10. Това е 1:10, после 10:100, после 100:1000. Виждаш как числата помежду им изпадат, че разстоянието между 1 и 2 е доста голямо. После между 2 и 3 също е доста голямо, но малко по-малко. После между 3 и 4 става по-малко и по-малко, и по-малко, докато не стигнеш до 10. Това е доста добра насока за това, което се случва при закона на Бенфорд. ВИ: Да. Изглежда някак съвпада. Така че има връзка. САЛ: Всъщност се оказва – и това всъщност е доста голяма насока – че това, ако вземеш тази площ тук като процент от тази цялата площ, това е точно този процент. Това е точно този процент тук. Ако вземеш тази площ като процент от цялата площ, тя е точно този процент, тези приблизително 17%, или каквото е това число ето тук. Така че това е голяма подсказка. ВИ: Да, или поне за степени на 2, или за редицата на Фибоначи – за степени, определено е логична. САЛ: Да, за всички степени. Така че логиката е – и това сега е най-голямата ни насока – да направим графика на степените на 2 на една такава логаритмична скала. ВИ: Добре, нека видим къде попадат. САЛ: Добре, нека се пробваме. 2 на степен 0 е 1. 2 на степен 1 е 2. После стигаш до 4. После стигаш до 8. После стигаш до 16, което ще е някъде тук. После стигаш до 32, което ще е някъде тук. Това е 30, следователно това е 32. После стигаш до 64. Това е 40, 50, 60. 64 ще е ето тук. Когато поставиш степените на 2 на тази логаритмична скала, виждаш, че са на равно разстояние. Продължаваш по това. Ако ги поставиш на линейната скала, те се отдалечават повече и повече. ВИ: Да. САЛ: Всъщност всеки път са двойно по-далеч. Но на тази скала ето тук са на равно разстояние. Тук имаш нещо, което е на равно намаляващо разстояние. Можеш да си представиш, че е все едно вървим по това. И ако тротоарът е с формата на тази логаритмична скала, вероятността при всяко дадено стъпало, докато правиш много, много стъпки или докато броиш всички стъпки, тогава ще имаш много, много повече стъпки, които попадат в частта, която е между 1 и 2, или между 10 и 20, отколкото ще имаш при, например, частта между 9 и 10. ВИ: Да, ако вземеш една случайна точка, по-вероятно е да попаднеш в област, започваща с 1. САЛ: Да, една от тези области. Точно, започваща с 1, тоест, между 1 и 2 или 10 и 20. Или 100 и – и това е точно – ВИ: Правенето на равни стъпки ще ти даде това разпределение, освен ако стъпките не са – понеже има специални случаи. Ако имаш – САЛ: Или хората вървят логаритмично. [СМЯХ] ВИ: Да, ако вървиш от 1 до 10, ако стъпките ти са дълги по 10 – САЛ: Да. В специални случаи. ВИ: Това се случва тук. САЛ: Ако стъпките ти са дълги по 10 – ВИ – Стигаш точно... САЛ: Точно така. Но ако си – всяко малко отклонение от това нещо и тогава ще получиш разпределението. ВИ: Да. САЛ: Разпределението на Бенфорд. ВИ: Разпределението на Бенфорд. САЛ: Въпреки че мисля, че сега разбираме защо, все пак е удивително. ВИ: Да. Това ни обяснява нещата за тези числови редици. САЛ: Да. ВИ: Сега някак трябва да открием как да свържем това с информацията от реалния свят. САЛ: Основната идея... за населенията. И прочетохме малко за това. Разпределението на Бенфорд работи за неща, които нарастват експоненциално. ВИ: Да. САЛ: Като степени на 2. ВИ: Като степени на 2. САЛ: Като степени на 2. Населенията също нарастват експоненциално. ВИ: Да. И във финансите много неща нарастват експоненциално. САЛ: Да. Или намаляват експоненциално. И двата случая. [СМЯХ] САЛ: Но това работи експоненциално. Продължаваш да нарастваш с 10% всяка година. Това е експоненциален път. Удивителното нещо са физическите константи. И не сме на 100% сигурни защо се случва това. ВИ: Не. За мен това все още е лудост. САЛ: Имаме само теории. Цялостната идея – понеже, знаеш, физическите константи са зависими от мерните единици, с които работиш. Те са зависими от множество неща. Всъщност имам няколко много широки теории. Но ще те оставя да помислиш повече върху това. ВИ: Добре. САЛ: Добре. И се надявам, че това ти беше интересно.