If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание

Закон за големите числа

Сал представя "магията", която стои зад закона за големите числа. Създадено от Сал Кан.

Искаш ли да се присъединиш към разговора?

Все още няма публикации.
Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.

Видео транскрипция

Нека научим малко за Закона за големите числа, който на много нива е един от най-логичните закони в математиката и в теорията на вероятностите. Но понеже е толкова приложим в различни области, понякога се прилага погрешно, като е леко неразбран. За да бъдем малко формални в нашата математика, нека просто най-напред да го дефинирам и след това ще говорим малко за логиката. Та да кажем, че имам една случайна променлива Х. И знаем нейната очаквана стойност или средната стойност на генералната съвкупност. Законът за големите числа казва, че ако вземем дадена извадка с n на брой наблюдения на нашата случайна променлива, и ако намерим средната стойност от всички тези наблюдения... тук ще дефинирам още една променлива. Нека я наречем х с индекс n с черта над нея. Това представлява средната стойност за n наблюдения на нашата случайна променлива. Така че буквално това е първото ми наблюдение. И може някак да си представиш, че веднъж провеждам експеримента, получавам наблюдаваното, и пак го провеждам, и пак е налице това наблюдение. Продължавам да го провеждам n на брой пъти, след което разделям на броя наблюдения. Така че това е моята извадкова средна стойност. Това е средната стойност на всички направени от мен наблюдения. Законът на големите числа ни казва, че моята извадкова средна стойност ще достигне очакваната стойност на случайната променлива... Или бих могъл да го напиша и така: извадковата средна стойност ще достигне средната стойност на генералната съвкупност при n, клонящо към безкрайност. Ще използвам малко по-обикновен език относно това какво значи клонящ или приближаване. Но мисля, че схващаш логически това, че ако тук взема достатъчно голяма извадка, то накрая ще получа очакваната стойност на генералната съвкупност. И мисля, че за много от нас това е един вид логично. Че ако направя достатъчно опити с големи извадки, тези опити биха ми дали числата, които ще покажат очакваната стойност и вероятността и подобните на тях. Но мисля, че често не се разбира причината, поради която се случва. Преди да премина по-нататък, ще дам един конкретен пример. Законът за големите числа ще ни каже, че... да кажем, че имам една случайна променлива – Х е равно на броя ези-та след 100 подхвърляния на една балансирана монета - подхвърляния или хвърляния на една симетрична монета. Най-напред, знаем каква е очакваната стойност на тази случайна променлива. Тя представлява броя подхвърляния, броя опити, умножен по вероятността за успех при всеки опит. А това е равно на 50. Законът за големите числа гласи, че ако взема една извадка или ако взема средната стойност от извадката на всички тези опити, тогава получавам... първият ми път, в който провеждам този опит аз подхвърлям 100 монети или разполагам със 100 монети в една кутия за обувки, разтърсвам кутията и преброявам броя на ези-тата, като получавам 55. Това ще е Х1. След това отново разтърсвам кутията и получавам 65. Тогава пак разтърсвам кутията и получавам 45. Така правя това n пъти, след което го разделям на броя пъти, които съм го направил. Законът за големите числа ни казва, че тази средна стойност от всички мои наблюдения, ще доближи 50 при n, клонящо към безкрайност. Или при n, клонящо към 50. Извинявам се, при n, клонящо към безкрайност. Сега искам да обсъдим причината това да се случва или да покажа логически защо е така. Много хора някак си чувстват, че, това означава, че ако след 100 опита аз съм над средната стойност, и законите на вероятностите ще ми осигурят повече ези-та или по-малко ези-та, за да се компенсира разликата. Това не е точно така. Често го наричаме заблудата на комарджията. Нека разгранича нещата. И ще използвам този пример. Тук ще начертая една графика. И ще сменя цветовете. Нека това да е... Това е n, моята абсцисна ос е n. Това е броят опити, които правя. На ординатна ос е извадковата средна стойност. Знаем какво представлява очакваната стойност, знаем и това, че за тази случайна променлива тя е 50. Ще начертая това тук. Така, 50. Сега се връщаме на разглеждания пример. Когато n е равно на... При първия си опит получих 55 ези и това беше моята средна стойност. Имах само една точка за данните. После след два опита, да видим... тук резултатът е 65. И моята средна стойност ще е равна на 65 плюс 55, делено на 2. Което е 60. Така моята средна стойност малко се покачва. При следващия опит имахме 45, което леко ще намали средната стойност. Тук няма да нанасям 45. Сега трябва да намерим средната стойност на всичко. Колко е 45 плюс 65? Ще сметна числото, за да схванеш основното. Имаме 55 плюс 65. Това е 120 плюс 45, което дава 165. Делено на 3. 3 се съдържа в 165... 5 по 3 е 15. Това е 53. Не, не, не. 55. Така че средната стойност слиза на 55. И можем да продължим да правим тези опити. Може да кажеш, че законът за големите числа е причина за това. Значи след 3 опита нашата средна стойност е това. И много хора мислят, че някак си властелините на вероятността ще я направят по-голяма, така че в бъдеще да получим по-малко на брой ези-та. Че някак си следващите два опита ще трябва да са тук долу, за да може нашата средна стойност да намалее. Но това не е задължително така. При продължаването нататък вероятностите си остават същите. Вероятността винаги е 50% да получим ези. Не е все едно да имам определен брой езита в началото или ако получа повече на брой езита, отколкото съм очаквал за началото, и после изведнъж нещата ще се компенсират и ще получа повече тура. Това представлява заблудата на комарджията. Ако имаме една голяма поредица от ези-та или непропорционален брой ези-та, на определен етап ще получим... има по-голяма вероятност да получим диспропорционален брой тура. А това не е вярно. Основното в закона за големите числа е, че той не се интересува... Да кажем, че след определен брой опити средната стойност всъщност... има малка вероятност това да се случи, но да кажем, че средната стойност е тук горе. Тя всъщност е на 70. Олеле, наистина сме се отклонили от очакваната стойност. Но това, което ни казва законът за големите числа, е, че не ни интересува колко опити са направени. Остатъкът от опити, които имаме е безкраен. А очакваната стойност при този безкрайно голям брой опити, особено в този вид ситуация, ще е следната. И когато намираме средната стойност на крайно число към някакво по-голямо число, а след това периодична дроб, която ще се приближи към стойността на това, с течение на времето ще се приближим до очакваната стойност. Този начин на описание беше малко неформален, но така гласи законът за големите числа. И това е нещо важно. Не е казано, че ако са имаме няколко ези-та, тогава вероятността да получим тура някак си ще се увеличи за сметка на ези-тата. Това, което се казва тук, е, че без значение какво се е случило, за определен брой опити, без значение каква е средната стойност след този определен брой опити, останали са ни неопределен брой опити. И ако човек направи достатъчно от тях, това ще се приближи до нашата очаквана стойност. И това е много важно. Но това не се използва в ежедневната практика при лотарията и в казината, защото там знаят, че ако човек направи достатъчно голям брой опити, а можем дори да изчислим дали правим достатъчен брой опити, каква е вероятността тогава нещата значително да се отклонят? Но казината и лотарията ежедневно прилагат този принцип , така че ако вземем достатъчно хора – естествено в кратък срок – или с няколко опита, двама ще ударят джакпота. Но през повечето от времето казиното винаги ще печели, поради параметрите на игрите, които то предлага на играчите. Както и да е, това е нещо важно при вероятностите и мисля, че е сравнително разбираемо. Въпреки че понякога, когато го виждаме обяснено подробно, като в случая със случайните променливи, а това е малко объркващо. Всичко, което се казва е, че като правим повече и повече опити, средната стойност на тези извадки ще приближава истинската средна стойност. Или трябва да съм малко по-конкретен. Средната стойност на извадката ще се доближи до истинската средна стойност на генералната съвкупност или до очакваната стойност на случайната променлива. Както и да е, ще се видим следващия път.