If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание

Статистика и вероятности

Курс: Статистика и вероятности > Раздел 10

Урок 2: Извадково разпределение на средна стойност на извадка

Пример: Вероятността средната стойност на извадката да превишава дадена стойност

Изчисляване на вероятността средната стойност на извадката да превишава дадена стойност в извадковото разпределение на средната стойност на извадката. Създадено от Сал Кан.

Видео транскрипция

Средностатистическият мъж изпива 2 литра вода при активност на открито, със стандартно отклонение от 0,7 литра. Ти планираш целодневен излет сред природата за 50 мъже и ще вземеш 110 литра вода. Каква е вероятността да свърши водата? Нека помислим какво се случва тук. Има някакво разпределение на броя литри, от които един средностатистически мъж се нуждае при активност навън. Нека ти покажа пример. Може да изглежда ето така. Т.е. всички ще се нуждаят от поне повече от 0 литра, така че това тук ще са 0 литра. Средностатистическият мъж, т.е. средната стойност на количеството вода, от която един мъж се нуждае при физическа активност на открито, е два литра. Така че тук ще имаме 2 литра. Един вид средната стойност е равна на 2 литра. Тя има стандартно отклонение 0,7 литра или 0,7 литра. Така че стандартното отклонение... може би ще го начертая така. И това разпределение, още веднъж, не знаем дали е нормално разпределение или не. Това може да е някакво ненормално разпределение. Може би някои хора се нуждаят от почти... всеки има нужда от поне малко вода, но може би някои хора се нуждаят от много, много малко вода. Тогава са налице много хора, които имат такава нужда, може би при някои тя е по-голяма, и никой не може да изпие повече от може би, това са 4 литра вода. Вероятно това е действителното разпределение. Тогава едно стандартно отклонение е 0,7 литра. Така това е 1; 0,7 литра е... това ще е 1 литър, 2 литра, 3 литра. И едно стандартно отклонение ще е на около това разстояние от средната стойност. Ако отидем над него, разстоянието би било такава, и такова, ако отидем под него. Нека покажа. Това е стандартното отклонение. Това там е стандартното отклонение надясно, а това – стандартното отклонение наляво. И знаем, че стандартното отклонение е равно на... ще напиша 0 отпред тук, 0,7 литра. Това е действителното разпределение на количеството вода, от което се нуждае един мъж при активност. Сега, това, което е интересно при тази задача, планираме един пълен ден сред природата за 50 мъже, като ще вземем 110 литра вода. Каква е вероятността тя да свърши? Вероятността водата да свърши – ще запиша това. Вероятността моята или твоята вода да свърши е равна или е същата, като вероятността да използваме повече от 110 литра по време на нашия ден сред природата, каквото и да правим. Което е точно равно на вероятността, ако използваме повече от 110 литра, това означава, че на средно ниво, понеже имаме 50 мъже, тогава 110, разделено на 50 дава колко? Дава 2. Нека сега взема калкулатора, за да не правим грешки тук. Така това ще е равно на... изваждаме калкулатора. Средно, ако имаме 110 литра, които ще бъдат изпити от 50 мъже, включително и нас, предполагам, това означава, че имаме... че ще свърши водата, ако средно повече от 2,2 литра са употребени от един човек. Това е точно равно на вероятността средно или може би трябва да кажем извадковата средна стойност... или нека го напиша така, че средното употребено количество вода за един мъж от общия брой мъже, 50, е по-голямо от, или можем да кажем по-голямо или равно на, по-голямо... ще кажа по-голямо,защото ако сме добре с парите, тогава няма да ни свърши водата... така, по-голямо от 2,2 литра на човек. Нека помислим за това. По същество разглеждаме 50 мъже в нашата универсална извадка (пример). Получихме тези данни... кой знае откъде сме ги получили, че средностатистическият мъж изпива 2 литра, и че стандартното отклонение е това. Може би има някакво голямо изследване и това е полученият най-добър резултат за това какви може да са параметрите на генералната съвкупност. Така че това е средната стойност, а това е стандартното отклонение. Сега имаме извадка от 50 мъже. И това, което е нужно да направим, е да намерим каква по същество е вероятността средната стойност на извадката, извадковата средна стойност да е по-голяма от 2,2 литра. За да направим това, трябва да намерим разпределението на извадковата средна стойност. Знаем как се нарича това. Това е извадково разпределение на извадковата средна стойност. А знаем, че това ще е едно нормално разпределение. Знаем и няколко от свойствата на това нормално разпределение. Разпределението е за всички мъже. И ако вземем извадки от, да кажем 50 мъже, тогава ще имаме... нека напиша това. Тук долу ще начертая извадковото разпределение на извадковата средна стойност, когато n, когато извадката ни е с размер, който е равен на 50. Това по същество ни казва вероятността за различните средни стойности, когато имаме 50 мъже от тази генерална съвкупност и тяхното средно потребление на вода. Нека начертая това. Да кажем, че това е честотата, а тук са различните стойности. Средната стойност на това... нека я напиша... средната стойност на извадковото разпределение на тази извадкова средна стойност, този х стълб, това е самата извадкова средна стойност, е равна на... ако правим това милиони и милиони пъти. Ако трябваше да отбележим всички средни стойности, като правим извадки от по 50, и разглеждаме всяка една от тях, това би показало, че тази средна стойност на разпределението всъщност ще е средната стойност на нашата генерална съвкупност. Т.е. ще имаме същата стойност... ще използвам същото синьо за оцветяване. Ще имаме същата стойност като при тази генерална съвкупност тук. И това ще са 2 литра. Все още в центъра са 2 литра. Но хубавото тук е, че извадковото разпределение на извадковата средна стойност... вземаме 50 души, намираме тяхната средна стойност, отбелязваме честотата. Всъщност тук ще има нормално разпределение, без да се взема предвид... това тук си има добре определена средна стойност на стандартното отклонение. Което не е нормално. Макар и това да не е нормално, това тук ще е, това го видяхме вече в доста от миналите клипове. Това ще си е едно нормално разпределение. А стандартното отклонение – това го видяхме миналия път, и надявам се, че схвана поне малко логиката относно верността на това. Стандартното отклонение... всъщност нека го формулирам по-добре. Дисперсията на извадковата средна стойност ще е общата дисперсия. Така че запомни, това ще е... това е стандартното отклонение, което ще представлява дисперсията на генералната съвкупност, разделена на n. И ако искаме стандартното отклонение на това разпределение да е тук, коренуваме двете страни. Ако коренуваме двете страни, ще получим, че стандартното отклонение на извадковата средна стойност ще е равно на корен квадратен от тази страна тук, ще е равно на стандартното отклонение на генералната съвкупност, разделено на корен квадратен от n. Какво ще даде това в нашия случай? Знаем колко е стандартното отклонение на генералната съвкупност. То е 0,7. А колко е n? Имаме 50 мъже. Така това, което имаме тук е 0,7 върху квадратен корен от 50. Да пресметнем това с помощта на калкулатора. Имаме 0,7, разделено на квадратен корен от 50. И получаваме 0,09... ще кажа 0,098... което е доста близо до 0,99. Така че ще го запиша. Това е равно на 0,099. Това е стандартното отклонение тук. Ще е по-ниско стандартно отклонение. И разпределението ще е нормално, ще изглежда по този начин. Така това тук е 3 литра, това е 1 литър. Стандартното отклонение е почти една десета, така че ще имаме доста по-тясно разпределение. То ще изглежда някак... опитвам се да го начертая... ще изглежда по този начин. Схаващаш идеята. Където сега стандартното отклонение е почти 0,1, и имаме 0,09, почти една десета. Така че ще имаме нещо... едно стандартно отклонение ще изглежда по този начин. Така имаме нашето разпределение. То е нормално разпределение. А сега нека се върнем на въпроса, който задаваме. Искаме да знаем вероятността нашата извадка да има средна стойност, по-голяма от 2,2. Това е разпределението на всички възможни извадки. Средните стойности на всички възможни извадки. И за да има стойност, по-голяма от 2,2, 2,2 ще се намира точно тук. А по същество питаме дали ще има недостиг, ако нашата извадкова средна стойност попадне в този участък тук. И всъщност трябва да намерим...можем дори да го разглеждаме като площта, която се намира под тази извивка там. И за да я намерим, трябва да намерим на колко стандартни отклонения над средната стойност сме, което ще е нашият Z-резултат. И след това можем да използваме Z-таблица, за да намерим каква е тази област тук. Искаме да знаем кога сме над 2,2 литра, т.е. 2,2 литра... дори можем да го направим наум – интересуват ни 2,2 литра. Това се намира тук. Нашата средна стойност е 2, така че сме на разстояние 0,2 над средната стойност. И ако искаме да знаем това, изразено като стандартни отклонения, само разделяме това на стандартното отклонение на разпределението тук. Намерихме колко е това. Стандартното отклонение на това разпределение е 0,099. Така че, ако вземем... и ще видим една формула, в която вземаме тази стойност минус средната стойност и разделяме полученото на стандартното отклонение – това е всичко, което правим. Просто намираме на колко стандартни отклонения над средната стойност сме. Така че вземаме това число тук, разделено на стандартното отклонение, 0,099, и тогава получаваме- нека използваме калкулатора. И всъщност тук получихме точното число. Така че можем да вземем 0,2; да вземем това 0,2, разделено на тази стойност тук. При този калкулатор, когато натисна втори отговор, това означава окончателен отговор. Така че вземам 0,2 разделено на тази стойност тук, и получавам 2,020. Което означава, че тази стойност, или трябва да напиша тази вероятност, е същата вероятност да сме на 2,02 стандартни отклонения, или може би по-добре да го напиша така: повече от... нека го напиша тук долу, където имам повече място. И всичко това ни отвежда до верояността да свърши водата, и това е вероятността извадковата средна стойност да е повече от... 50, което избрахме – да не забравяме, че ако вземем един набор от 50 извадки, и разпределим всички тях, ще получим това цялото разпределение. Но за тези 50, групата от 50, която се случи да изберем, вероятността да свърши водата е точно равна на вероятността средната стойност за тези хора да е по-голяма от 2,020 стандартни отклонения над средната стойност за това разпределение, което показва, че те представляват същото разпределение. И колко ще е това? Тук просто трябва да погледнем нашата Z-таблица. Да не забравяме, че това 2,02 е точно тази стойност тук. 0,2 разделяме на 0,09. Трябва да спра малко клипа, защото някакъв изтребител или нещо подобно бръмчи отвън. Както и да е, вероятно няма да се върне. Така, трябва да намерим вероятността средната стойност да е на повече от 2,02 стандартни отклонения над средната стойност. А за да намерим това, отиваме на Z-таблицата, и можем това да го намерим къде ли не. По принцип го има във всяка статистическа книга, или в интернет, навсякъде. И по същество искаме да знаем вероятността... Z-таблицата ще ни каже на какво разстояние сме под тази стойност. И ако отидем на z при 2,02, това е стойността, с която се занимавахме, така. Имаме 2,02, това е.... т.е. търсим първата цифра. Отиваме на 2,0, а това беше 2,02. 2,02 е точно там. Така имаме 2,0, а за следващата цифра отиваме тук горе. И 2,02 се намира там. Тук получаваме 0,9783... ще го напиша долу. 0,9783 – искам да внимавам повече. 0,9783, тази Z-таблица, това не е тази стойност тук. Това 0,9783 от Z-таблицата ни дава цялата тази област тук. Така има вероятност да сме под тази стойност. Да сме на по-малко от 2,02 стандартни отклонения над средната стойност. Така имаме тази стойност тук. А за да отговорим на нашия въпрос, относно тази вероятност, трябва само да извадим това от 1, защото всички тези стойности ще се прибавят към 1. Така че пак вземаме калкулатора и смятаме 1 минус 0,9783, което дава 0,0217. Така че това тук е 0,0217. Или другият начин, по който можем да го кажем, това е 2,17% вероятност водата ни да свърши. И сме готови. Нека се уверя, че получих правилно число. Така, това число беше... да, 0,0217, правилно. Така имаме 2,17% възможност водата ни да свърши.