If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание

Закон на Бенфорд (с Ви Харт, 1 от 2)

Ви Харт посещава Кан Академия и разговаря със Сал за загадката на закона на Бенфорд (наричан още закон на Нюкомб—Бенфорд, закон на аномалните числа или закон на първата цифра. Той се отнася за разпределението на старшата цифра в много реални набори от цифрови данни. В естествените колекции от числа старшата цифра най-често е малка. С единица започват около 30% от числовите данни, докато с 9 започват по-малко от 5% от данните. Ако цифрите бяха разпределени равномерно, всяка от тях щеше да се появява като начална в около 11,1% от случаите.). Създадено от Сал Кан.

Искаш ли да се присъединиш към разговора?

Все още няма публикации.
Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.

Видео транскрипция

САЛ КАН: Много съм развълнуван, че днес ме посещава Ви Харт. И малко по-рано днес имахме много математически разговор. Тя спомена нещо, което е удивително. ВИ ХАРТ: Да, разказвах на Сал за едно готино нещо, наречено Закон на Бенфорд. САЛ КАН: Закон на Бенфорд. Какво е закон на Бенфорд? Ви ХАРТ: Това е този странен явление, което се получава, когато гледаш числа в реалния свят. Например тук имаме няколко графики. Ако вземем населението на всички страни и се запитаме: "Каква е тази първа цифра на населението на страната?" Дали е 1 милион или 1000, или 100 000, казваме, че започва с 1. Преброяваме всички страни, които започват с 1. Предполагам, че тук имаме 27 такива. САЛ КАН: Да, около 27. Така че буквално всичко, което започва с 1 тук. Може да е страна, която има население 1 или население 17, или население 1 милиард и 300 милиона и така нататък. Всички те попадат в тази група ето тук. ВИ ХАРТ: Точно така. После ако започнеш с 2, попадаш във втората категория и така нататък. САЛ КАН: По-добър цвят. Давай нататък. ВИ ХАРТ: Да, определено по-добър цвят. САЛ КАН: По-добър цвят. ВИ ХАРТ: О, да, това е страхотно. САЛ КАН: Да, това е синьо, по-добър контраст. ВИ ХАРТ: Така че въпросът е... човек би помислил, че тук ще има случайни числа. САЛ КАН: ДА. За тази първа цифра, това е случайно. ВИ ХАРТ: Да. Имам предвид, има големи разлики в населенията на страните. Някои имат милиарди и някои имат – не знам колко е най-малката популация. САЛ КАН: Да. Тази на Черна гора или нещо такова. ВИ ХАРТ: Да. Така – САЛ КАН: Май не си мислех за Черна гора... Май си мисля за една страна на Френската Ривиера, коя беше тя? Както и да е, можем да редактираме това. [СМЯХ] ВИ ХАРТ: Не знам. Интересно ще ми е да видя населението на щатите. САЛ КАН: Смятам, че най-малката страна е Ватикана. ВИ ХАРТ: Да, така е. Брои ли се това? Предполагам – САЛ КАН: Мисля, че Ватиканът се брои. Имат собствено – да. ВИ ХАРТ: Не знам точно какви са били изискванията САЛ КАН: Но ще се включи и Ватикана, което мисля, че ще е някъде в хилядните. ВИ ХАРТ: Да. Защо би се случило това? Защо ще виждаш повече единици, отколкото двойки? Какво става? САЛ КАН: Да. Това не е малка вероятност. Имам предвид, говорихме също за идеята, че е по-вероятно да има адреси с нечетни числа, отколкото с четни числа. Говорихме за това по-рано. ВИ ХАРТ: Да, наскоро научих за това. И е логично. САЛ КАН: Това е логично, понеже всяка къща ще има номер 1 или 10. ВИ ХАРТ: Да, ако улицата ти започва с къща номер 1, къща номер 2, къща номер 3, ако имаш нечетен брой къщи, тогава улицата ти има повече нечетни числа, отколкото четни. САЛ КАН: Точно така. И ако имаш четно число, имаш еднакво количество. ВИ ХАРТ: Точно така. САЛ КАН: Да. ВИ ХАРТ: Но това започва с 1, което е нечетно число. Докато тук населенията не започват с 1. САЛ КАН: Точно така. И феноменът, за който говорим при уличните номера не е изключително явление. Той е някъде около 50 цяло и няколко – имаш малко по-висока вероятност да имаш къща с нечетен номер, или предполагам 1 къща, отколкото нещо друго. ВИ ХАРТ: Да, това е точно нещото, което можеш да очакваш. САЛ КАН: Точно това, което очакваш. Но тук това е значително по-висока вероятност за населението на случайна страна, че първата цифра е 1, а не 8 или 9. Имам предвид, изглежда малко странно. ВИ ХАРТ: Да. И това не е само при страните. Виждаш това, ако гледаш голямо количество финансова информация. Като например колко пари изкарва една компания. САЛ КАН: Да. Единиците се появяват много по-често като първи цифри. ВИ ХАРТ: Да, много по-често. И тук имаме друга впечатляваща графика, която е супер интересна. Тя е първата цифра на физическите константи. Какви например са някои физически константи? САЛ КАН: Приемам, че – и не успяхме да открием какво точно са приложили тук – но приемам, че това са неща като гравитационната константа, константата на Планк. И това ми изглежда доста странно, понеже зависи от мерните единици, които използваме, зависи от множество неща, които трябва да предположим. Но дори когато използваш тези произволни физически константи, което приемам, че правят тук, най-значимата цифра в тези физически константи все още е по-вероятно да бъде 1. Това следва почти точно Закона на Бенфорд. Побиват те тръпки малко! ВИ ХАРТ: Да. Предизвикателството тук е да – и между другото, Бенфорд е човекът с очилата. САЛ КАН: О, да. Да, може би се чудеше за това. Това не са – да. Това са – ВИ ХАРТ: Не са и двамата Бенфорд. САЛ КАН: Това не са Бенфорд преди и след бръснене. Не. Това ето тук е Бенфорд. Очевидно това е било наречено на него – закон на Бенфорд. Но поставихме този мъж, който не се е обръснал – ВИ ХАРТ: Да, готиният мъж с брадата е Саймън Нюкомб. САЛ КАН: Саймън Нюкомб. ВИ ХАРД: Не Дюк Нюкем. САЛ КАН: Не Дюк Нюкем. И го сложихме тук, понеже той е първият човек, който е определил Закона на Бенфорд. Очевидно не го е нарекъл Закона на Бенфорд. ВИ ХАРТ: И е имал по-добрата брада. САЛ КАН: И е имал, да, най – като цяло е по-внушителен. Поне за мен. Този мъж изглежда малко като Хари Трюман. Може би това е Хари. Не знам. Да, може би имам грешната снимка. Както и да е, нека просто – ВИ ХАРТ: Въпросът е каква е чистата ситуация за това? Имам предвид, когато имаш тези случайни данни, виждаш някои колебания. Като при една страна има повече – САЛ КАН: Но е доста близо. Доста близо е до тази крива. ВИ ХАРТ: Да и размерът на извадката ни е доста нисък. САЛ КАН: Да. ВИ ХАРТ: – когато имаш само – САЛ КАН: Има около 200 страни или нещо такова. ВИ ХАРТ: Да. САЛ КАН: Продължава нагоре с около 50 – ВИ ХАРТ: Не го следва перфектно. САЛ КАН: – след като Съветският съюз се разпадна и така нататък. Но да, това не е голям брой страни. И дори физическите константи, не знам на колко физически константи са направили извадка, но това е шокиращо близо до кривата на Закона на Бенфорд. Но има по-чист начин за проява на това. ВИ ХАРТ: Да. Когато погледнем тази друга графика, това е донякъде като чистия закон на Бенфорд. САЛ КАН: Чистият закон на Бенфорд. Това е тази крива, която наместваме в тези други, по-груби данни. И удивителното тук е, че ако вземем чисти математически конструкции, като степените от 2 или – ВИ ХАРТ: Или числата на Фибоначи. Човек би предположил, че при числата на Фибоначи събираш всички тези неща и защо – САЛ КАН: И после просто взимаш първата цифра – ВИ ХАРТ: Единствено първата цифра. САЛ КАН: – и ги поставяш в тези групи, това точно ще съвпадне със Закона на Бенфорд. Няма отклонения. Това е точно – ВИ ХАРТ: Точно така, математически. САЛ КАН: Математически. Нека се изясним, понеже това е удивително. Ако вземеш степените на 2, получаваш 1, 2, 4, 8, 16, 32, 64. Искам да продължа доста нататък, за да започнеш да виждаш как правим това. 128, 256, 512. И продължава, и продължава вечно с всяка степен на 2. И се питаш колко от тези започват с 1. И можеш да кажеш, че това започва с 1, това започва с – или най-значимата цифра е 1. Това започва с 1, това започва с 1. И ще намериш процента, който започва с 1. И ще го поставиш – ще оцениш единиците за този процент. После си казваш: "Добре, тези, които започват с 2." После си казваш: "Това започва с 2, това започва с 2." Но искаме да продължим. И можем вероятно да го направим с компютърна програма или нещо такова, при което ще стигнем доста високи степени на 2. И после можеш да кажеш: "Какъв процент от всички тези степени на 2 започват с 2?" Получаваш този процент ето тук. Числата, които започват с 9, получаваш това. И перфектно ще съвпадне със Закона на Бенфорд. Това изглежда магическо. ВИ ХАРТ: Това изглежда доста магическо. САЛ КАН: Това не е просто за степени на 2. Това е за степени на всяко число. ВИ ХАРТ: Почти всяко число. Има специални случаи. САЛ КАН: Вярвам, че може да е всяко число. О, да. ВИ ХАРТ: Е, степени на 1. САЛ КАН: 1 не върши работа. ВИ ХАРТ: И после, например, степени на 10. САЛ КАН: Да, и при степени на 10 няма да върши работа. Но всички други числа, които донякъде объркват тези неща. ВИ ХАРТ: Степени на 0. САЛ КАН: Да. Права си. Всяко число, което би "разбъркало" тези неща. ВИ ХАРТ: Да. Донякъде. САЛ КАН: Да, точно така. Но всяко друго число ще прояви разпределението на Бенфорд. И искаме да те предизвикаме да мислиш защо се случва това. Може би дори можеш да добавиш свои собствени обяснения в коментарите към Ютюб видеото или на страницата ни, ако ти е любопитно. Предизвикваме те да помислиш защо това е така. После ще предложим поне приличен опит за обяснение. Може би ще имаме други обяснения. ВИ ХАРТ: Да. САЛ КАН: С това видео ще приключим дотук. И в следващото видео ще обясним какво ние мислим – ще дадем логична причина защо това върши работа.