If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание
Текущ час:0:00Обща продължителност:9:45

Видео транскрипция

В това видео ще говорим за идеята за сила, когато работим с тестове за значимост. И сила е понятието, която може да срещнеш в първата си година в курса по статистика. Оказва се, че това е доста трудно за изчисляване, но е интересно да знаем какво означава и кои са нивата, които може да увеличат силата или да намалят силата на теста на значимост. За да не протакаме повече, силата е вероятност. Можеш да гледаш на това като на вероятността да правиш правилното нещо, когато нулевата хипотеза не е вярна, а правилното нещо е, че трябва да отхвърлиш нулевата хипотеза, ако тя не е вярна. Така че това е вероятността да отхвърлиш... да отхвърлиш нулевата хипотеза, при положение, че нулевата хипотеза е грешна. Можеш да гледаш на това като на условна вероятност. Но има и други начини да схванем тази концепция. Можем да я свържем с грешки Тип II. Например можеш да кажеш, че това е равно на 1 минус вероятността да не отхвърлиш... 1 минус вероятността да не отхвърлиш нулевата хипотеза, при положение, че нулевата хипотеза е грешна. И това, което току-що описах, неотхвърлянето на нулевата хипотеза, при положение, че нулевата хипотеза е грешна, това е определението на грешка Тип II. Можеш да гледаш на това като на вероятността да не направиш грешка Тип II, или 1 минус вероятността да направиш грешка Тип II. Надявам се това да не е объркващо. Нека го запиша по друг начин. Можеш да кажеш, че това е вероятността да не направиш грешка Тип II. Кои са нещата, които имат отношение към силата? За да си помогнем с концептуализирането, ще начертая две извадкови разпределения, едно, ако приемем, че нулевата хипотеза е вярна, и едно, където приемаме, че нулевата хипотеза е грешна и истинският показател на генералната съвкупност е различен от това, което нулевата хипотеза ни казва. Например да кажем, че имаме нулева хипотеза, че средната стойност на генералната съвкупност е равна на – нека просто я наричаме му1 – и имаме алтернативна хипотеза, Н с долен индекс 'а', която казва, че средната стойност на генералната съвкупност не е равна на му1. И ако приемеш, че нулевата хипотеза е вярна – ще направя това в синьо – ако приемем, че нулевата хипотеза е вярна, какво ще е извадковото ни разпределение? Помни, при тестовете за значимост имаме някакъв вид генерална съвкупност. Нека начертая това. Тук имаш една генерална съвкупност. И хипотезите ни правят някакво твърдение за даден параметър на тази генерална съвкупност. И за да ги проверим, взимаме извадка с определен размер. Изчисляваме една статистическа характеристика, която в този случай ще е средната стойност на извадката, и казваме, че ако приемем, че нулевата хипотеза е вярна, каква е вероятността да получим тази характеристика на извадката. И ако това е под определен праг, който наричаме ниво на значимост, тогава отхвърляме нулевата хипотеза. И в такава ситуация... Един начин да помислим за това... При положение, че приемаш, че нулевата хипотеза е вярна, може да имаш извадково разпределение, което изглежда като това. Ако нулевата хипотеза е вярна, тогава центърът на извадковото ти разпределение ще е ето тук при му1, и при дадения ти размер извадка ще получиш определено извадково разпределение на средните стойности на извадката. Ако размерът на извадката се увеличи, това ще е по-тясно. Ако намалее, това ще е по-широко. И поставяш ниво на значимост, което е вероятността да отхвърлиш нулевата хипотеза, въпреки че е вярна. Можеш да гледаш на това като – и сме говорили за това – можеш да гледаш на нивото на значимост като вероятността да извършиш грешка Тип I. Нивото ти на значимост е определена площ. И да кажем, че това е площта, която защриховам в оранжево ето тук. Това ще е нивото на значимост. Ако вземеш извадка ето тук и изчислиш средната стойност на извадката, и попаднеш в тази площ, тази площ или тази площ тук, тогава ще отхвърлиш нулевата хипотеза. Ако нулевата хипотеза е била вярна, тогава ще извършваш грешка Тип I, без да знаеш за това. Но за силата ни интересува грешка Тип II. Това е условна вероятност нулевата ни хипотеза да е грешна. И нека построим друго извадково разпределение в случая, когато нулевата ни хипотеза е грешна. Нека продължа тази права ето тук и ще направя това. Нека си представим, че нулевата ни хипотеза е грешна и това е случаят, при който средната ни стойност е му2, и нека кажем, че му2 е ето тук. И в този случай извадковото ни разпределение може да изглежда ето така. Отново, това ще е за даден размер извадка. Колкото по-голям е размерът на извадката, толкова по-тясна ще е тази камбановидна крива. И може да изглежда като това. В тази ситуация трябва да отхвърлим нулевата хипотеза. Но какви са извадките, при които не отхвърляме нулевата хипотеза, въпреки че трябва? Няма да отхвърлим нулевата хипотеза, ако вземем извадка от тук или извадка оттук, или извадка оттук, извадка, при която ако приемеш, че нулевата хипотеза е вярна, вероятността не е толкова невъзможна. И вероятността да направим грешка Тип II, когато трябва да отхвърлим нулевата хипотеза, но не го правим, е тази площ ето тук. И силата, вероятността да отхвърлим нулевата хипотеза, при положение че тя е грешна, ще е това червено разпределение, което ще е останалата част от тази площ тук. Как можем да увеличим силата? Един начин е да увеличим алфа, да увеличим нивото на значимост. Ако увеличим нивото на значимост, да кажем от това, нивото на значимост е определена площ. Ако искаме да го увеличим, ако увеличим площта, и изглежда като това, сега като увеличим тази площ на значимост, имаме увеличение в силата, понеже сега тази жълта площ е по-голяма. Избутахме тази граница наляво от нея. И може да си кажеш: "Ако искаме да увеличим силата, сила изглежда хубаво нещо, защо не увеличаваме алфа всеки път?" Проблемът е че ако увеличиш алфа – нека запиша това – ако вземеш алфа, нивото ти на значимост, и я увеличиш, това ще увеличи силата. Това ще увеличи силата, но също ще увеличи вероятността от грешка Тип I, понеже, помни, това е един начин да концептуализираме алфа, какво е нивото на значимост. Това е вероятността за грешка Тип I. Кои са другите начини да увеличим силата? Ако увеличиш размера на извадката, тогава и двете от тези разпределения... тези извадкови разпределения ще станат по-тесни. И ако тези извадкови разпределения, ако и двете от тези извадкови разпределения станат по-тесни, тогава тази ситуация, при която не отхвърляш нулевата хипотеза, въпреки че трябва, ще има много по-малко площ. Ще има – един начин да помислим за това – ще има много по-малко припокриване между тези две извадкови разпределения. Нека запиша това. Друг начин е да се увеличи n, размера на извадката, това ще увеличи силата. И като цяло това винаги е добре да се направи, ако е възможно. Други неща, които може да са под твой контрол, а може и да не са – колкото по-малко променливост има в базата данни, това също ще направи извадковите разпределения по-тесни и също ще увеличи силата. По-малко променливост – и можеш да измериш това като дисперсия или стандартно отклонение на подлежащото множество данни – това ще увеличи силата. Друго нещо, което ще увеличи силата, е ако истинският показател е по-надалеч отколкото казва нулевата хипотеза. Ако кажеш, че истинският показател е далеч от нулевата хипотеза, това също ще увеличи силата. Тези две неща обикновено не са под твой контрол, но размерът на извадката и нивото на значимост са. Нивото на значимост... но всъщност има баланс тук. Ако увеличиш силата чрез това, също увеличаваш вероятността от грешка Тип I. Много изследователи може да кажат, че ако грешка Тип II е по-лошото нещо, тогава са съгласни с това и ще увеличат нивото на значимост. Но ако се страхуват от грешка Тип II, тогава няма да искат да използват това ниво. Но във всеки случай увеличаването на размера на извадката, ако можеш да направиш това, е добър вариант.