If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание
Текущ час:0:00Обща продължителност:4:51

Тест за средното на генералната съвкупност

Видео транскрипция

В това видео мисля да говорим за това кога да използваме z-статистика вместо t-статистика, когато извършваме тестове за значимост. Има два основни сценария, които ще видим в началния клас по статистика. Единият е, когато работим с части, така че ще запиша това в лявата страна тук. А другият е, когато имаме работа със средни стойности. В случая с частите, когато провеждаме нашия тест за значимост, поставяме някаква нулева хипотеза, която обикновено се отнася до частта на генералната съвкупност, и може да кажем, че е равна на някаква стойност, нека просто я наречем р с индекс 1. И после може би ще имаш алтернативна хипотеза, че частта на генералната съвкупност е по-голяма от или по-малка от това или просто не е равна на това, така че нека избера този вариант, не е равна на р1. И после, когато всъщност проведем теста, за да извършим теста за значимост, взимаме извадка от генералната съвкупност, това ще е n-размерна извадка, трябва да сме уверени в правилността на заключението. Говорихме за условията, необходими за да направим заключение много пъти в предишни видеа, за това, че изчисляваме частта на извадката и после изчисляваме р-стойността, и за начина, по който изчисляваме р-стойността... Помни, че р-стойността е вероятността да получим поне толкова голяма част на извадката и ако тя е под даден праг, отхвърляме нулевата хипотеза и приемаме алтернативната. А тук можем да направим това, като намерим свързаната z-стойност за това р, за тази част на извадката. И начинът, по който я пресмятаме, е да кажем, че z ще е колко стандартни отклонения на извадковите разпределения сме отдалечени от средната стойност и, помни, средната стойност на извадковото разпределение ще е частта на генералната съвкупност, така че тук получаваме тази статистическа характеристика на извадката, тази част на извадката, разликата между това и приетата част. Помни, когато извършваме тези тестове за значимост, опитваме да намерим вероятността, приемайки, че нулевата хипотеза е вярна, и когато видим това р с индекс 0, това е приетата част от нулевата хипотеза, така че това е разликата между тези двете, частта на извадката и приетата част. И после ще делиш това на това, което често е познато като стандартна грешка на характеристиката, което е просто стандартното отклонение на извадковото разпределение на частта на извадката и това работи добре за части, понеже при частите мога да намеря колко е това. Това ще е равно на корен квадратен от предполагаемата част на генералната съвкупност по (1 минус предполагаемата част на генералната съвкупност), всичко от това върху n, а после ще използвам тази z-характеристика, за да намеря р-стойността и в този случай гледам двете опашки на разпределението, понеже ме интересува колко надалеч съм над или под приетата част на генералната съвкупност. Със средните стойности определено има някои подобни неща, ще направиш нулева хипотеза, може би ще приемем, че средната стойност на генералната съвкупност е равна на мю1, а после ще има алтернативна хипотеза. Която ще е, може би, че средната стойност на генералната съвкупност не е равна на мю1. И ще направиш нещо много лесно. Взимаш генералната съвкупност, взимаш n-размерна извадка и вместо да изчисляваш частта на извадката, изчисляваш средната стойност на извадката и можеш да изчислиш други неща, като стандартно отклонение на извадката, но сега имаш проблем. Казваш си, че в идеалния случай ще използваш z-характеристика и можеш... можеш да вземеш разликата между средната стойност на извадката и приетата средна стойност в нулевата хипотеза, така че това ще е това ето тук, това означава тази нула, приетата средна стойност от нулевата хипотеза. И после ще разделя на стандартната грешка на средната стойност, което е друг начин да кажем стандартното отклонение на извадковото разпределение на средната стойност на извадката, но това не е толкова лесно да се намери. За да намерим това, това ще е стандартното отклонение на основната генерална съвкупност, делена на корен квадратен от n. Знаем колко ще е n, ако направим извадка, но не знаем колко е стандартното отклонение, така че вместо това изчисляваме това и ще вземем средната стойност на извадката, изваждаме от това приетата средна стойност на генералната съвкупност от нулевата хипотеза и делим на оценката на това, което ще е стандартното отклонение на извадката, делено на корен квадратен от n. Но понеже това е приблизително изчисление, получаваме по-добър резултат, ако вместо да кажем, че това е приблизително изчисление на нашата z-характеристика, можем да наречем това t-характеристика и, както ще видим, после ще потърсим това в t-таблица и това ще ни даде по-добра представа за вероятността.