Ако виждаш това съобщение, значи уебсайтът ни има проблем със зареждането на външни ресурси.

If you're behind a web filter, please make sure that the domains *.kastatic.org and *.kasandbox.org are unblocked.

Основно съдържание

Курс: Статистика и вероятности > Раздел 11

Урок 1: Приблизително намиране на съотношенията (частите, на които се дели) в генералната съвкупност

Определяне на размера на извадката на база на доверителността и ограниченията за грешката

Определяне на размера на извадката на база на доверителността и марж на грешката.

Искаш ли да се присъединиш към разговора?

Все още няма публикации.
Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.

Видео транскрипция

Казано ни е, че Дела иска да изчисли z интервал на една извадка, за да види каква част от нейните съграждани подкрепят увеличение на данъците, за да има повече средства за местните училища. Иска допустимата грешка да бъде не по-голяма от ±2% при 95% ниво на значимост. Kакъв е най-малкият размер на извадка, нужен за да се постигне допустимата грешка? Нека си припомним как изглежа доверителен интервал и каква част от него е допустимата грешка. Можем да помислим какъв е размерът на извадката, която ще ѝ е нужна. Тя иска да изчисли какъв е действителният дял от генералната съвкупност, който подкрепя увеличаване на данъците. Тя не знае какъв е той, затова тя прави извадка с размер n. Всъщност въпросът е от какво n се нуждае тя, за да има търсената допустима грешка. Каквато и извадка да направи Дела, тя ще изчисли дял на извадката. Тогава доверителният интервал, който тя ще конструира, ще бъде за този дял но изводката, плюс или минус критична стойност и тази критична стойност е базирана на нивото на значимост. Ще говорим за това след малко. Каква z звезда, каква критична стойност би отговаряла на 95% ниво на значимост, умножена по стандартната грешка на статистиката ѝ. В такъв случай корен квадратен ще бъде стандартната грешка на нейния дял на извадката, което е дяла на извадката по 1 минус дяла на извадката, върху размера на извадката. Тя иска допустимата грешка да е не по-голяма от 2%. Допустимата грешка е тази част тук. Тази част тук, Дела иска тя да не е повече от 2%; тя трябва да е по-малка от или равна на 2. Това зелено е твърде бледо, малко е неприятно, ОК? (смях) По-малко от или равно на 2% тук. Как решаваме това? Първо нека не забравим да включим 95% ниво на значимост. Можем да погледнем z таблицата. Помни, че 95% ниво на значимост означава, че ако имаме нормално разпределение, ако имаме нормално разпределение тук, ниво на значимост, равно на 95%, означава, че броят на стандартни отклонения трябва да е по-голям, за да може да обхване 95% от тази площ. Това са 2,5%, които не са щриховани горе, ето тук, това са 2,5% Точно тук. Можем да погледнем в z таблица и ако погледнем там, няма да гледаме за 95%, ще гледаме за процент, който ще остави 2,5% нещриховани там горе. Тоест ще гледаме за 97,5% Добре е да се знае, че при 95% ниво на значимост имаме критична стойност 1,96 Добре е да се знае. Разбира се, можем да погледнем в z таблица. Това е 1,96 И това тук ще бъде 1,96 Ами p-къщичка? Не знаем какво е p-къщичка, докато не направим извадката, но въпросът е колко голяма извадка ще ни бъде нужна, колко голяма извадка да направим? Търсим тези неща тук, които в момента ограждам с по-видим цвят, с това синьо. Искаме това да е по-малко или равно на 2%. Това е допустимата ни грешка. Можем да изберем извадков дял. Можем да изберем извадков дял. Не знаем дали ще е това, което дава максимална стойност за това тук. Ако максимизираме това, знаем, че ще намерим най-голямата стойност, която може да бъде. Тогава сме в безопасност. За p-къщичка, най-голямото p-къщичка, ако искаме да максимизираме p-къщичка по 1 – p-къщичка, можем да го направим с проба и грешка. Това е сравнително просто квадратно уравнение. p-къщичка е равно на 0,5 но не сме сигурни, защото тя все още не е направила извадката. Тя дори не е направила случайна извадка и не е изчислила извадковия дял. Но искаме да разберем какво n да вземем. За да е сигурна, тя казва: "ОК, какъв дял на извадката ще ни е нужен, за да максимизирам допустимата грешка?" Нека предположим това и нека изчислим n. Нека предположим това и нека изчислим n. Нека сложа знак за неравенство тук. Искаме 1,96, това е критичната ни стойност, умножено по корен от да предположим, че това е 0,5 за извадковия ни дял, въпреки че все още не сме сигурни, докато не направим извадката. Това е извадковият ни дял. Това е едно минус извадковия дял. Цялото това върху n трябва да е по-малко от или равно на 2% Не искаме допустимата ни грешка да е повече от 2% Нека го напиша като десетична дроб, като 0,02. Сега трябва да използвам малко алгебра, за да го изчислим. Нека видим как бихме могли да направим това. Това може да го преработим; можем да разделим двете страни на 1,96. 1/1,96 Това е равно на... вляво ще имаме корен от това вляво ще имаме корен от това но това е същото като корен от 0,5 по 0,5 , значи това ще е 0,5 върху корен от n... трябва да е по-малко или равно на, всъщност нека го напиша така. Това е същото като 2/100 Значи 2/100 по 1/1,96 трябва да бъде по-малко или равно на 2/196 Нека превъртя надолу. Това е по-специфична алгебра от тази, която правим обичайно в статистиката, или поне на началния етап. Можем да вземем реципрочното на двете страни Можем да кажем корен квадратен от n върху 0,5 и 196/2 Колко е 196/2? 98 Това е 98 Ако вземем реципрочните на двете страни, трябва да обърнем знака за неравенство. Ще бъде по-голямо или равно на Мога да умножа двете страни по 0,5. Значи 0,5. Казах 0,5, но пръстите бързат. 0,5 Получаваме, че корен от n трябва да бъде по-голям от или равен на 49, или n трябва да е по-голямо или равно на 49 на квадрат. 49^2=? 50 на квадрат е 2500, следователно това ще е близо. Можем да направим сравнително добро предположение, че верният отговор е D. Но нека все пак умножим 49 по 49. 9 по 9 е 81. 9 по 4 е 36, плюс 8 е 44 4 по 9 е 36. 4 по 4 е 16, плюс 3 е 19. 4 по 4 е 16, плюс 3 е 19. Събираме всичко това и получаваме... това е 10, това е 14, получаваме 2401. Това е минималният размер на извадката, който е нужен на Дела, ако тя иска допустимата грешка да е не по-голяма от 2. Може да се окаже, че допустимата грешка при извадков размер 2401, ако извадковият дял е 0,5 или повече от 0,5... Тогава би била в ситуация, при която допустимата грешка може да е по-малко от тази. Но тя иска просто да е не повече от това. Нека оценим, че сметките излязоха добри – n излезе цяло число. Но ако бяхме получили 2401,5, тогава щях да закръгля до най близкото цяло число, защото не може размерът на извадката винаги да бъде цяло число. Оставям те тук.