If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание

Курс: Статистика и вероятности > Раздел 11

Урок 2: Намиране на приблизителна стойност на средно аритметичното за генерална съвкупност

Размер на извадката за даден марж на грешката за средно аритметично

Изчисли приблизителния размер на извадката, необходима за постигане на необходимия марж на грешката в доверителния интервал за средно аритметично.

Искаш ли да се присъединиш към разговора?

Все още няма публикации.
Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.

Видео транскрипция

"Надя иска да създаде доверителен интервал, за да изчисли средната стойност на обхвата на шофиране на новото електрическо возило на компанията ѝ. Тя иска рискът за грешка да не е по-голям от 10 километра при 90 процента ниво на значимост. Пилотно проучване предполага, че обхватът на шофиране на този вид превозни средства има стандартно отклонение от 15 километра. Кое от тези е най-малкият приблизителен размер извадка, необходим за получаване на допустимата грешка?" Спри видеото и виж дали можеш да помислиш за това самостоятелно. Традиционният начин, по който бихме определили допустимата грешка в доверителен интервал е да вземем извадка и от тази извадка определяме средната стойност и после добавяме или изваждаме допустимата грешка около това, за да построим доверителният интервал. И начинът, по който правим това, откакто работим със средни стойности, е да кажем: "Ако не знаем стандартното отклонение на генералната съвкупност, тогава е подходящо да използваме t-критерий (критерий на Стюдънт)." Критичната си стойност отбелязваме като t* и ще умножиш това по стандартното отклонение на извадката, делено на корен квадратен от размера на извадката. Този въпрос е за това кое е подходящо като размер извадка, при положение, че искаме да имаме 90% ниво на значимост. И трудното, когато използваш t-таблица тук, е че не само трябва да знаеш 90%-овото ниво на значимост, но също трябва да знаеш степените на свобода. Степените на свобода са n - 1. Но не знаем колко е това, без да знаем n, така че как ще определим n? Подобно, не знаеш какво е стандартното отклонение на извадката, докато не вземеш няколко извадки. Вместо това можем да помислим за това, че знаем друг легитимен начин да определим доверителен интервал и риска за грешка и това е да кажем, че можем да вземем средната стойност на извадката и да добавим или извадим z-стойност, критична стойност този път, като използваме z-табица, където умножавам това по реалното стандартно отклонение на генералната съвкупност и деля това на корен квадратен от n. Може да си кажеш, че не знаем реалното стандартно отклонение на генералната съвкупност. Но те ни казват, че едно пилотно проучване предполага, че обхватът на шофиране за този вид превозни средства има стандартно отклонение от 15 километра. Така че можем да използваме това като оценка на реалното стандартно отклонение на генералната съвкупност. Това тук е 15 километра. И хубавото нещо на z-таблицата е че не трябва да мислиш за степени на свобода. Можеш просто да потърсиш доверителния интервал. И после можем просто да кажем, че z* по 15 километра върху корен квадратен от n – това тук е рискът от грешка. Това тук е рискът от грешка, който трябва да не е по-голям от 10 километра. Така че това трябва да е по-малко от или равно на 10. И можем да намерим колко трябва да е z* за 90% ниво на значимост и после просто намираме n. Нека направим това. За да намерим z* мога да използвам z-таблицата, но просто за разнообразие на метода на решаване нека използваме калкулатор. За да намерим каква z-стойност ще ни даде 90%-ен доверителен интервал, мога да използвам функция, наречена "inv norm". И виждаш, че тук това е избор 3. Нека избера това. И това ще направи... даваш ѝ площта, която искаш под нормална крива, можеш дори да уточниш средната стойност и стандартното отклонение... Въпреки че искаш средната стойност да е 0 и стандартното отклонение да е 1, ако наистина искаш да намериш z-стойност. И това ще ти даде z-стойността, която ще ти даде съответната площ. И искам – това вече е избрано – централната площ да е 90%. Така че тук мога да кажа 0,9. Ако използвам лявата опашка, тогава това означава, че имам 90% от центъра, което ще означава, че ще имам 5% във всеки край. Вместо да го правя 0,9 в центъра, можеш да напиша 0,05 и да използвам лявата опашка или 0,05 и да използвам дясната опашка. Но това е точно каквото искам. Нека да поставя това. Това трябва да ми даде подходящата z-стойност. Готово. Ако искам тези средни 90%, централните 90%, трябва да премина приблизително 1,645 стандартни отклонения под средната стойност и същото това разстояние над средната стойност. Това е приблизително критичната ни стойност тук – приблизително 1,6...да кажем, 1,645. Имаме 1,645 по 15, върху корен квадратен от n и това ще е по-малко от или равно на 10. Има два начина да направиш това. Можем да направим малко алгебрични изчисления, за да опростим това неравенство и те окуражавам да направиш това или дори можеш да изпробваш някои стойности тук, и да видиш кое ще направи това вярно, и искаме най-малката възможна стойност. Ще го направя алгебрично, понеже ако правиш това в реалния живот, то Надя нямаше да има множество отговори. Тя трябваше да намери размера на извадката, за да проведе проучването си. Нека направим това. Да видим. Ако разделя двете страни на 1,645 и 15, колко ще получа? Ще получа 1 върху корен квадратен от n е по-малко от или равно на 10/1,645 върху 15. И ако взема реципрочното на двете страни, получавам корен квадратен от n е по-голямо от или равно на... ако взема реципрочното на двете страни, това ще е 1,645 по 15. И всичко това върху 10. Всичко това върху 10. Да видим, 15/10 е просто 1,5 така че нека напиша това като 1,5 тук. И после ако повдигна двете страни на квадрат, получавам, че n трябва да е по-голямо от или равно на 1,645 по... По 1,5. И всичко това на квадрат. Просто повдигнах двете страни на квадрат. Всичко това на квадрат. И нека извадя отново калкулатора си. Ще имаме 1,645 по 1,5 и после искаме да го повдигнем на квадрат и получаваме 6. Приблизително 6... 6,09. Така че n трябва да е по-голямо от или равно на 6,09. И, разбира се, размерът на извадката ни трябва да е цяло число. Кое е най-малкото цяло число, което е по-голямо от 6,09? Това е 7. Това ще е тази подточка тук. Това е най-малкият приблизителен размер извадка, необходима за получаване на желания риск от грешка. И, разбира се, няма наистина да знаем, докато не проведем проучването. Очевидно тук използваме приблизително изчисление на стандартното отклонение на генералната съвкупност. И използвахме z-таблица, но все пак ще е интересно, когато Надя проведе проучването, да видим дали нейният риск за грешка наистина не е повече от 10 километра с 90% ниво на значимост.