If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание

Курс: Статистика и вероятности > Раздел 12

Урок 3: Тестове за проверка на съотношенията в генералната съвкупност

Условия при z-тест за съотношенията в генералната съвкупност

Примери, които показват как да се провери дали са изпълнени условията за провеждане на z-тест за съотношенията в генералната съвкупност.

Искаш ли да се присъединиш към разговора?

Все още няма публикации.
Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.

Видео транскрипция

Джулс работи в малък екип от 40 служители. Всеки служител получава годишна оценка, като най-високата оценка е "надвишава очакванията". Ръководството твърди, че 10% от служителите получават тази оценка, но Джулс предполага, че всъщност тя не е толкова често срещана. Тя направила анонимна случайна извадка от 10 оценки на служители в нейния екип. Тя иска да използва данните от извадката, за да тества нулевата хипотеза, че действителният дял е 10%, срещу алтернативната хипотеза, че действителният дял е по-малък от 10%, като р е делът на всички служители от нейния екип, които надвишават очакванията. На кои условия за провеждане на такъв тип проверка на хипотеза отгаваря извадката на Джулс? Когато ни питат на кои условия отговаря, тук имат предвид трите условия: условието за случайност, условието за нормалност, вече сме говорили за това преди, и условието за независимост. Спри видеото на пауза и опитай да намериш отговора самостоятелно, а после ще разгледаме всяко от тези условия и ще помислим дали извадката на Джулс отговаря на условията, които гарантират, че проверката за значимост е добра. Хайде сега да продължим заедно. Да си припомним какво правим в една проверка за значимост. Имаме нулева хипотеза и алтернативна хипотеза. Първо да видим генералната съвкупност. Размерът ѝ е от 40 служители на компанията. Правим извадка, в случая Джулс прави извадка от 10, и после изчисляваме параметъра на извадката, в този случай това е делът, който е равен на... нека да го означим като р с индекс едно. И после изчисляваме р-стойността. Само да припомня, р-стойността е вероятността да получим резултат, който е поне такъв, какъвто би бил, когато допускаме, че нулевата хипотеза е вярна. В този конкретен случай, тъй като тя предполага, че няма 10% оценки "надвишава очакванията", това ще е вероятността параметърът за нашата извадка да е по-малко или равно на едно, колкото можеш да изчислиш, когато размерът на извадката n е равно на 10, ако нашата нулева хипотеза е вярна. И ако тази р-стойност е по-малка от предварително определеното ниво на значимост, може би това е 5% или 10%, но това трябва да се определи предварително, тогава можеш да отхвърлиш нулевата хипотеза, защото вероятността да получиш този резултат изглежда твърде малка, то тогава това потвърждава алтернативната хипотеза. Тогава, ако р-стойността не е по-малка от това, това означава, че можеш да отхвърлиш нулевата хипотеза. Но ключовото нещо, и това е смисълът на въпроса, за да сме уверени в тези изчисления, трябва да направим някои предположения относно разпределението на извадката. Трябва да допуснем, че то е относително нормално, че може да се използва за изчисляването на тази вероятност, и точно тук се появяват тези условия. Първото е условието за случайност, според което данните в тази извадка трябва да са подбрани наистина случайно. Сега спри видеото. Изпълнено ли е условието за случайност? Казват ни, че тя е направила случайна анонимна извадка от оценките на служители в екипа. Не ни казват как я е направила, но ще приемем за вярно казаното, че това е случайна анонимна извадка, така че условието за случайност е изпълнено. Какво да кажем за условието за нормалност? Съгласно него очакваният брой положителни резултати, което е равно на размера на извадката по действителният дял, и броят на отрицателните резултати, размера на извадката по едно минус р, трябва да е равно най-малко на 10. Значи трябва да е по-голямо или равно на 10. Какво имаме при този конкретен случай? n е равно на 10, действителният дял, спомни си, че когато правим проверка за значимост, приемаме, че е вярна нулевата хипотеза, а нулевата хипотеза ни казва, че действителният дял е 0,1. Значи това е 0,1, а това е 1 – 0,1, което е равно на 0,9. 10 по 0,1 е едно, което не е по-голямо или равно на 10. Следователно условието за нормалност не е изпълнено. Даже и при второто имаме 10 по 0,9, което е девет. Което също не е равно или по-голямо от 10, така че условието за нормалност не е изпълнено. Не можем да сме сигурни, че разпределението на извадката е приблизително нормално, което обикновено приемаме, когато правим този вид изчисления. И накрая, но не по важност, е условието за независимост. Независимост означава да сме сигурни, че отделните данни в извадката са независими. Независимо дали резултатите са успех или неуспех, те трябва да са независими помежду си. Ако тя правеше проучване със заместване, ако всеки резултат беше със заместване, тогава определено щеше да е спазено условието за независимост. Но тя не го е направила със заместване. Има и друг начин за постигане на независимост. Можеш да използваш 10%-ното правило. Ако размерът на извадката е по-малък от 10% от генералната съвкупност, тогава всичко е ОК, можем да считаме, че е приблизително независимо, въпреки че няма заместване. Но размерът на извадката тук е 25%, което е очевидно по-голямо от 10%, така че тя не е спазила и условието за независимост. Така че ако се опитаме да изчислим това, като допуснем, че разпределението на извадката е приблизително нормално, не можем да сме уверени в резултатите, защото не са изпълнени две от тези три условия.