Основно съдържание
Текущ час:0:00Обща продължителност:9:57

Видео транскрипция

Имам машина за дъвки. В нея има жълти, зелени, розови и сини дъвки. Слагам няколко сини тук. В това видео ще се занимаваме с жълтите топчета. Да кажем, че знаем, че дялът на жълтите топчета е P. И това тук е параметърът на генералната съвкупност. За да направим нещата по-конкретни, нека приемем, че 60% от топчетата са жълти, или 0,6 от всички топчета са жълти. Сега нека преговорим нещо от преди. Ще задам случайната променлива на Бернули. Да го кръстим главно Y, което да е равно на 1. Когато вземем едно произволно топче от тази машина, ако то е жълто топче, това е едно, а ако изберем топче, което не е жълто, пишем нула. От предишни видеа знаем интересни неща за случайната променлива на Бернули. Знаем средната стойност. Знаем средната стойност на нашата случайна променлива на Бернули. Тя е равна на дяла на жълти топчета в нашата генерална съвкупност – това е P и в нашия случай P=0,6. И знаем, че стандартното отклонение на Бернулиевата случайна променлива е равно на P(1 – P), всъщност това е дисперсията, от която корен квадратен е стандартното отклонение. В този конкретен случай то ще бъде корен квадратен от 0,6 по 0,4. Добре. Дотук всичко е преговор. Но сега нека определим още една случайна променлива Х, която е сборът на 10 независими опита на У. Виждали сме подобни случайни променливи. Това е биномна случайна променлива. Какво знаем за нейната средна стойност и за стандартното ѝ отклононие? От предишни видеа знаем, че средната стойност на тази биномна случайна променлива ще бъде n пъти по средната стойност от всеки от Бернулиевите опити, тоест n по P, което в нашия случай е: n е 10, правим 10 опита и P е 0,6, което прави 6. И това е логично. Ако 60% от топките тук са жълти и ако направим извадка или ако направим 10 опита, тоест ако вземем десет топки по една наведнъж, те трябва да бъдат независими, значи продължаваме да ги гледаме и да ги заместваме, но ако вземем 10 наведнъж, тогава очакваме шест от тях да са жълти. Те не винаги ще бъдат шест жълти, но това очакваме. Добре, сега какво е стандартното отклонение? Стандартното ни отклонение е равно на корен квадратен от n по P, умножено по 1 – P, т.е. n*P(1 – P). Забележи как слагаме n тук под радикала И това ни поставя в тази специфична ситуация, 10 по 0,6 по 0,4 и това всичко под корен. Всичко дотук е преговор. Ако това ти е непознато, съветвам те да разгледаш видеата за Бернулиева случайна променлива (случайна величина) и за биномни случайни величини Това, което ще направим в това видео, е да помислим за извадково разпределение, или за извадковата статистика, позната като извадков дял, или за извадковата статистика, позната като извадков дял, за което говорехме, когато се запознавахме с извадковото разпределение за което говорехме, когато се запознавахме с извадковото разпределение Ще оставим това на заден план за малко. Ще оставим това на заден план за малко. Нека правим извадки с по 10 елемента. Това не си го избрах случайно. Искам да го съгласувам с нещата, които правим, с нашата случайна променлива тук. Нека направим извадка от 10 топчета и да изчислим дяла на жълти топчета. Ще наречем това нашия извадков дял и ще го направя в жълто. Искаме да изчислим извадковия дял на жълтите. На какво е равно това? Бихме могли да кажем, че това е равно на случайната ни величина X. Искам да преброя броя жълти топчета и тогава ще разделя на извадковия размер. Тоест делим на n. В нашия случай това е Х, разделено на 10. Знам, че може би си мислиш: "Почакай малко, "Почакай малко, Х е сумата на 10 независими изтегляния на топчета. За да са независими, не може просто да извадиш 10 топчета, трябва да ги извадиш едно по едно и да ги връщаш обратно, за да може да бъдат наистина независими." Но спомни си, имаме нашето правило за 10%, което казва, че ако извадка е по-малка или равна на 10% от генералната съвкупност, тогава можем да разглеждаме всяко изтеглено топче в тази ситуация като независимо теглене. Нека приемем, че тук има 10 000 топчета. И можем да сме сигурни, че в тези извадки всеки един елемент е независим от останалите според нашето правило за 10%. Така че всяко една от тези 10 топчета, които виждаме, ще са независими. Ще сложа в кавички "според правилото за 10%". Така в тази ситуация можем да твърдим, че това е вярно. Да кажем, че за първата ни извадка извадковият ни дял е 0,3, тоест три от тези 10 топчета са жълти. тоест три от тези 10 топчета са жълти. Сега повтаряме; правим нова извадка. Изчисляваме извадковия ни дял, отново тази статистика – спомни си, ние се опитваме да изчислим параметъра на генералната съвкупност и да кажем, че този път е 7 от 10. И продължаваме да повтаряме. И ако продължим така, можем да направим таблица (диаграма) или по-точно точково разпределение, където възможните изходи могат да бъдат 0 от 10, 1 от 10 или 2, 3, 4, 5 (тоест половината), 6, 7, 8, 9, 10 (тоест всички) и можем да кажем:"ОК, 0,3 е едно, две, три и това е вариантът, където получих извадковия дял, равен на 0,3". После 0,7 - това е ситуация, в която получих 0,7. И да кажем, че правим още една извадка от 10 и ако получа 0,7, мога да го означа ето тук. Ако продължим да правим извадки и да изчисляваме тези извадкови дялове, които изобразяваме на диаграмата, бихме получавали все по-добри и по-добри приблизителни изчисления за извадковото разпределение на дяла в извадката. Но как бихме могли да характеризираме истинското извадково разпределение на извадковия дял? Каква би била средната стойност на извадковото разпределение и какво ще бъде стандартното отклонение? Можем да изведем това от нещата, които виждаме тук. Средната стойност на нашето извадково разпределение на нашият извадков дял ще бъде равно на средната стойност на нашата случайна променлива Х, разделено на n. То просто ще бъде средната стойност на Х, разделена на n, което е равно на колко? Средната стойност на Х е равна на n по Р. n, умножено по Р. Разделяме на n и получаваме Р. Логично е. Ако се замислиш, очакваната стойност за нашия извадков дял е дялът на топчетата, които виждаш. Така че това е добър индикатор, че това ще бъде сравнително точно. Така че това е добър индикатор, че това ще бъде сравнително точно. Да помислим за стандартното отклонение за нашето извадково разпределение. Да помислим за стандартното отклонение за нашето извадково разпределение. Можем да гледаме на това като на стандартното отклонение на на биномната случайна величина Х, разделена на n, което е равно на квадратния корен от ((n*P)*(1 – Р))/n, което е същото като да вземем това и да делим на n вътре под корена. Би било същото като корен квадратен от ((n*P)*(1 – P))/n^2 Делим числителя и знаменателя на n, получаваме корен от P*(1 – P), цялото върху n. Така в тази ситуация, където параметърът ни е 0,6, дялът в генералната съвкупност е 0,6. това е истинския дял в генералната съвкупност. А колко ще бъде стандартното отклонение за дела в извадката? Ще бъде равно на корен от (0,6*0,4)/10. Изваждам калкулатора. 0,6 по 0,4, делено на 10... и след това корен квадратен... Това е приблизително 0,15. Това е приблизително 0,15.