If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание

P-стойности и тестове за значимост

Виж как може да се сравнява P-стойност и ниво на значимост, за да се направи извод при тест за значимост.

Когато нулевата хипотеза е вярна, p-стойността е вероятността да получим резултат, който е по-отдалечен от резултата за извадката, отколкото при случаен избор. Когато p-стойността е по-ниска от нивото на значимост, тогава отхвърляме нулевата хипотеза. Когато не е , не можем да отхвърлим нулевата хипотеза.

Създаден от Сал Кан.

Искаш ли да се присъединиш към разговора?

Все още няма публикации.
Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.

Видео транскрипция

Да кажем, че ръководя уебсайт, фонът на който е този бял цвят и знам средната стойност на количеството време, което хората прекарват в уебсайта ми, да кажем, че е 20 минути, и искам да направя промяна, която ще накара хората да прекарват повече време на уебсайта ми. Идеята ми е да направя фона на уебсайта си жълт. Но след като направя тази промяна, как да съм сигурен, че това ще има замислените последици? Тук в играта влизат тестовете за значимост. Първо ще съставя някакви хипотези, нулева хипотеза и алтернативна хипотеза. Нулевата хипотеза по принцип е твърдение че: "Хей, промяната ти нямаше ефект, няма нищо ново тук" и това ще е че средната стойност все още е равна на 20 минути след промяната на фона, в този случай, в жълто. И ще имаме и алтернативна хипотеза. Алтернативната ни хипотеза е че нашата средна стойност сега е по-голяма заради промяната, че хората прекарват повече време в сайта ми. Средната ни стойност е по-голяма от 20 минути след промяната. Следващото нещо е да поставим граница, позната като ниво на значимост. И след малко ще видиш как това влиза в играта. Нивото ти на значимост обикновено се отбелязва с гръцката буква алфа и обикновено се срещат нива на значимост като 1/100 или 5/100, или 1/10, или 1%, 5% или 10%. Може да видиш и други, но ще поставим ниво на значимост за този случай в частност... Да кажем, че ще е 0,05. И сега ще вземем извадка от хората, посещаващи този сайт с новия жълт фон и ще пресметнем някои статистически характеристики. Средната стойност на извадката, стандартното отклонение на извадката и ще кажем: "Ако приемем, че нулевата хипотеза е вярна, каква е вероятността да имаме извадка със статистическите характеристики, които получихме?" И ако вероятността е по-ниска от нашето ниво на значимост, ако тази вероятност е по-малка от 5/100, ако това е по-малко от 5%, тогава ще отхвърлим нулевата хипотеза и ще кажем, че имаме доказателство за алтернативната. Но ако вероятността да получим статистическите характеристики за тази извадка е нивото на значимост или по-висока, тогава ще кажем, че не можем да отхвърлим нулевата хипотеза и нямаме доказателство за алтернативната. Ще нарека това стъпка 3. В стъпка 3 ще вземем извадка. Да кажем, че взимаме извадка с размер... да кажем, че взимаме 100 души, които са посетили новия ни уебсайт, уебсайта с жълт фон, и измерваме същите статистически характеристики за извадката. Измерваме средната стойност на извадката тук, да кажем, че за тази извадка средната стойност е 25 минути. И също е вероятно да... ако не знаем реалното стандартно отклонение на генералната съвкупност, което обикновено не знаем, също ще пресметнем стандартното отклонение на извадката. После следващата ни стъпка е да пресметнем р-стойността. р-стойността, което означава вероятностна стойност, това е вероятността да получим една характеристика поне толкова далеч от средната стойност, ако приемем, че нулевата хипотеза е вярна. Един начин да помислим за това е, че това е условна вероятност. Това е вероятността средната стойност на извадката ни, когато вземем извадка с размер n=100, е по-голяма от или равна на 25 минути, при положение, че нулевата ни хипотеза е вярно. В други видеа сме говорили как да направим това. Ако приемем, че извадковото разпределение на средните стойности на извадката е приблизително нормално, можем да използваме средната стойност на извадката, можем да използваме размера на извадката, можем да използваме стандартното отклонение на извадката, вероятно използваме t-критерий (критерий на Стюдънт), за да намерим колко ще е тази вероятност. И после решаваме дали можем да отхвърлим нулевата хипотеза. Нека нарека това стъпка 5. Стъпка 5, има две ситуации. Ако моята р-стойност, ако е по-малка от алфа, тогава мога да отхвърля нулевата хипотеза и да кажа, че имам доказателство за алтернативната си хипотеза. Ако имаме другата ситуация, ако р-стойността ми е по-голяма от или равна на, в този случай 0,05, ако е по-голяма от или равна на нивото ми на значимост, тогава не мога да отхвърля нулевата хипотеза. Няма да кажа, че приемам нулевата хипотеза, просто ще кажа, че не отхвърляме нулевата хипотеза. Да кажем, че когато извърша всички тези пресмятания, получавам р-стойност, която ще ме постави в този сценарий ето тук. Да кажем, че получа р-стойност от 0,03. 0,03 наистина е по-малко от 0,05 и затова ще отхвърля нулевата хипотеза и ще кажа, че имам доказателство за алтернативната хипотеза. И това трябва да има логика, понеже казваме, че взехме извадка и ако приемем нулевата хипотеза, вероятността да получим тази извадка е 3%, тя е 3/100, и след като тази вероятност е по-малка от прага ни на вероятност тук, тогава ще я отхвърлим и ще кажем, че имаме доказателство за алтернативната хипотеза. От друга страна, може да има сценарий, при който извършваме всички изчисления тук и р-стойността, която получаваме, е равна на 0,5 което можеш да интерпретираш като кажеш, че ако приемем, че нулевата хипотеза е вярна, тогава правенето на фона жълт не води до никаква промяна, ще имам 50% шанс да получа този резултат. И в тази ситуация, след като е по-висок от нивото ми на значимост, няма да отхвърля нулевата хипотеза. В случай, че нулевата хипотеза е вярна и получа този резултат, това изглежда логично и вероятно. Това е основата за тестовете за значимост като цяло и, както ще видиш, може да се приложи в почти всяка област, в която се озовеш. Има едно последно пояснение, което искам да направя много, много, много ясно. Нашата р-стойност, това, което използваме, за да решим дали да отхвърлим нулевата хипотеза или не, това е вероятността да получиш статистическите характеристики на извадката, при положение, че нулевата хипотеза е вярна. Понякога хората объркват това и казват: "Това ли е вероятността нулевата хипотеза да е вярна, според статистическите характеристики, които получаваме?" И аз ще кажа, че това изобщо не е така. Не се опитваме да измерим вероятността нулевата хипотеза да е вярна или грешна. Опитваме се да кажем, че ако приемем нулевата хипотеза за вярна, каква е вероятността да получим резултата, който получихме за извадката си. И ако тази вероятност е ниска, ако е под някакъв праг, който предварително сме поставили, тогава решаваме да отхвърлим нулевата хипотеза и да кажем, че имаме доказателство за алтернативната.