If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание
Текущ час:0:00Обща продължителност:6:39

Видео транскрипция

Искам да използвам този клип, за да се уверя, че логически разбираме разликата между Z-статистика... нещо, което трудно казвам – и t-статистика. До голяма степен това, което правим в дедуктивната статистика, е да се опитваме да разберем каква е вероятността да получим определена средна стойност на извадката. Та какво правихме досега – особено когато имаме извадка с голям размер – ще начертая едно извадково разпределение. Да кажем, че имаме извадково разпределение на извадковата средна стойност тук. Имаме някаква предполагаема средна стойност и някакво стандартно отклонение. Искаме за всеки резултат, който получаваме... да кажем, че получаваме някаква средна стойност на извадката тук. Искаме да намерим вероятността да получим резултат, поне толкова отдалечен колкото този резултат. Така че можем или да намерим вероятността за получаване на резултат под този и да извадим това от 1, или само да намерим тази област тук. И за да направим това, пресмятахме колко стандартни отклонения над средната стойност всъщност имаме. Начинът, по който определяхме това, е да вземем средната стойност на извадката и да извадим от нея самата средна стойност, или това, което допускаме, че е средната стойност, не знаем колко е, но предполагаме, че това трябва да е средната стойност. После разделяме полученото на стандартното отклонение на извадковото разпределение. Това е колко стандартни отклонения сме над средната стойност. Това е това разстояние, което виждаме там. Обикновено ние не знаем колко е това. По принцип не знаем и това колко е. И централната гранична теорема ни казва, че ако предположим, че имаме един достатъчен размер на извадката, това нещо тук, това нещо ще е равно на стандартното отклонение на нашата генерална съвкупност, разделено на корен квадратен от размера на нашата извадка. Така че това нещо тук можем да го препишем като средната стойност на извадката минус средната стойност на извадковото разпределение на извадковата средна стойност, разделено на това нещо тук – разделено на средната стойност на генералната съвкупност, която пък разделяме на корен квадратен от размера на извадката. И това е най-добрата оценка на колко стандартни отклонения от настоящата средна стойност се намираме. А това нещо тук, научихме го наскоро, е една Z-оценка. Или когато се занимаваме с действителна статистика, когато го получаваме от статистиката за средна стойност на извадката, тогава го наричаме Z-статистика. Тогава можем да го погледнем в Z- таблица или в някоя таблица за нормално разпределение, за да кажем каква е вероятността да намерим стойност с това Z или по-голяма. И така ще получим тази вероятност. И каква е вероятността да получим толкова отдалечен резултат? Обикновено, когато правихме това в миналите няколко клипа, също така не знаехме колко е стандартното отклонение на генералната съвкупност. Така че за да получим приблизително тази стойност, казваме че Z-оценката е приблизително, или Z-статистиката приблизително ще бъде... нека само пак напиша числителя – пресмятаме това с помощта на нашето стандартно отклонение – ще използвам нов цвят – и използваме стандартното отклонение на извадката. Което е добре, ако размерът на извадката е по-голям от 30. Друг начин да разгледаме това е, че ще имаме нормално разпределение, ако размерът на извадката е по-голям от 30. Дори и това приближение ще е приблизително нормално разпределено. Ако размерът на извадката е по-малък от 30, особено ако е много по-малко от 30, тогава вече този израз няма да е нормално разпределен. Нека препиша израза тук. Средна стойност на извадката минус средната стойност на извадковото разпределение на извадковата средна стойност, разделена на извадковото стандартно отклонение върху корен квадратен от размера на извадката. Преди малко казахме, че ако това е със стойност над 30 или поне 30, тогава тази стойност тук, тази статистика, ще е нормално разпределена. Ако не е така, ако извадката е малка, тогава ще имаме t-разпределение. И тогава ще направим същото, което направихме тук, но този път ще допуснем, че тази камбановидна крива вече не представлява нормално разпределение, така че в този пример е било нормално.. Всички Z-ове са нормално разпределени. Тук t-разпределението всъщност ще е едно нормализирано t-разпределение, защото извадихме средната стойност. Така в едно нормализирано t-разпределение, ще имаме средна стойност, равна на 0. И сега искаме да намерим вероятността да получим t-стойност, която е поне толкова отдалечена. Това е нашата t-стойност, която ще получим, след което всъщност намираш областта, която е под кривата тук. Ето едно много лесно правило: Пресмятаме тази стойност по един от двата начина. Ако имаме повече от 30 елемента в извадката, ако размерът на извадката е повече от 30, тогава стандартно отклонение на извадката ще е много добра оценка за стандартното отклонение на генералната съвкупност. Така че цялото това ще е приблизително нормално разпределено, и можем да използваме една Z-таблица, за да намерим вероятността за получаване на поне толкова отдалечен резултат. Ако размерът на извадката е малък, тогава тази статистика, тази стойност ще има t-разпределение, и тогава ще трябва да използваме t-таблица, за да намерим вероятността да се получи дадена t-стойност поне толкова отдалечена. Ще видим това в един пример, който ще представя в следващите два клипа. Надявам се, че този урок ти е помогнал да си изясниш някои неща относно това кога се използва Z-статистика и кога – t-статистика.