If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание

Изчисляване на t-статистиката (t-критерий) за наклона на линия на регресия

Изчислявай t-статистика в тест за наклона на линия на регресия.

Искаш ли да се присъединиш към разговора?

Все още няма публикации.
Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.

Видео транскрипция

"Джиан взел случайна извадка от данни за това колко време е било нужно на 24 ученици да завършат игра за реакции с ограничено време и игра за памет с ограничено време. Той забелязал положително линейна зависимост между времената на всяка задача. Това са данните, изведени от компютър, за данните от извадката." Имаме няколко изчислени статистически стойности за времето за реакция, за времето на играта на паметта. И после компютърът е направил регресия за данните, които е събирал. И ни казват да приемем, че всички условия за извод са били изпълнени. "Изчисли тестовата статистика, която трябва да бъде използвана за проверка на нулева хипотеза, че ъгловият коефициент на генералната съвкупност всъщност е 0." Спри видеото и опитай. Нека се уверим, че разбираме какво става. Нека първо да помислим за генералната съвкупност. Ще направя това ето тук. В генералната съвкупност може да има реални линейни зависимости. На теория, на оста х имаме времето на реакция, а на оста у имаме времето от играта за памет. Ако можеш да поставиш всяка възможна точка информация, може дори да са безкрайно много или близко до безкрайност, така че ще е много трудно да направиш това. Но ако във Вселената имаше някаква истина, ако казва, че има положителна линейна зависимост и изглежда така... И можеш да опишеш правата на регресия като у с шапка. Това е права на регресия. И е равно на някакъв реален показател от генералната съвкупност, което ще е тази пресечна точка с оста у. Ще наречем това алфа плюс някакъв реален показател от генералната съвкупност, това ще е ъгловият коефициент на тази права на регресия – ще наречем това бета. По х. Не знаем каква е тази истина на Вселената за линейната зависимост между времето на реакция и времето на играта на паметта. Но можем да опитаме да го изчислим. Това се опитва да направи Джиан. Той взима извадка от 24 точки информация. И тогава е много по-лесно, можеш дори да го визуализираш на точкова диаграма като тази. Ще имаш 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24. Въвеждаш тези точки информация в компютър и той създава права на регресия и се опитва да минимизира повдигнатото на квадрат разстояние до всички тези точки. И да кажем, че получим права на регресия, която прилича на нещо такова, където тази права на регресия може да бъде описана като приблизително изчисление на реалната пресечна точка с оста у. Това тук ще е една статистическа стойност. Това изчислява приблизително този показател. Плюс някакво изчисление за реалния ъглов коефициент на правата на регресия. Това е статистическа стойност, това b, опитва да изчисли реалния показател, бета. Когато въведохме тези точки информация в компютър, получихме стойности за а и b. а е равно на това, коефициента на константата. И коефициентът на реакция... той ни казва с колко очакваме да се увеличи времето от играта за паметта за всяко увеличение в реакцията. Или каква промяна в у очакваме за всяка промяна в х. Това е приблизително изчисление на ъгловия коефициент на правата на регресия. Можеш да си представиш, че всеки път, когато вземеш различна извадка, може да получиш различно изчисление за тези неща. И когато работим с дедуктивна статистика, издигаме хипотези. Издигаш нулева и алтернативна хипотеза. И нулевата хипотеза винаги е, че няма нищо ново. И да няма нищо ново, когато работиш с регресии, е че въпреки че може да подозираш, че има положителна линейна зависимост, въпреки че може да го видиш в данните си, за нулевата си хипотеза искаш да приемеш, че няма линейна зависимост. Тоест нулевата хипотеза тук ще е, че реалният ъглов коефициент на реалната права на регресия, този показател тук, е равен на 0. Тоест бета е равна на 0. Нулевата хипотеза може да е, че реалната ни права на регресия може да изглежда ето така. Тоест че у е донякъде независимо от х. И ако подозираш, че има положителна линейна зависимост, можеш да кажеш, че алтернативната хипотеза е, че бета е по-голямо от 0. Или ако подозираш, че просто има линейна зависимост, не знаеш дали е положителна, или отрицателна, тогава може да кажеш, че бета не е равна на 0. Но тук казват, че той забелязал, или заподозрял, положителна линейна зависимост. Така че това ще е алтернативната му хипотеза. Но после искаш да провериш нулевата си хипотеза, което сме правели много, много пъти, и затова искаш да намериш тестова статистическа стойност, която е свързана със статистическата стойност за b, която реално получи. Идеално ще вземеш b и от това ще извадиш ъгловия коефициент, който предположи в нулевата хипотеза – тоест ъгловият коефициент на правата на регресия, която получи, минус ъгловия коефициент, който предположи от нулевата хипотеза. И после делиш по стандартното отклонение на извадковото разпределение на ъгловия коефициент на правата на регресия. И ако направиш това, ще получиш... би било подходящо да използваш z статистическа стойност. Проблемът е, че не знаем точно какво е стандартното отклонение на извадковото разпределение. Но можем да го изчислим приблизително. Можем да изчислим ъгловия коефициент, който получихме за правата на регресия от извадката, минус ъгловия коефициент, който приемаме от нулевата хипотеза, който ще е равен на 0 – така че знаем какво предполагаме. И можем да изчислим стандартната грешка на извадковото разпределение. Всъщност компютърът ни вече е направил това за нас. И това е приблизителното му изчисление. И знаем какво е това число. Знаем какви са всички тези числа, но ако използваш приблизително изчисление на стандартното отклонение на извадковото разпределение – виждали сме това преди, когато сме решавали дедуктивна статистика за средни стойности – подходящо е да използваме t статистическа стойност. Но, като казах това, спри видеото. На колко ще е равно това? Това ще е равно на ъгловия коефициент за правата на регресия на извадката – знаем, че е 14,686 – минус приетия реален показател на генералната съвкупност, ъгловият коефициент на реалната права на регресия – приемаме, че това е 0. Тоест минус 0. И после делим това на стандартната грешка, която ще е – можем да използваме това като стандартна грешка за b. И това е делено на 13,329. Това ще е 14,686 делено на 13,329. И ако приемем, ако направим едностранен тест, тогава ще вземем тази t статистическа стойност и ще помислим за степените на свобода. И после изчисляваме една р стойност. Каква е вероятността да получим резултат поне толкова над t = 0, или каква е вероятността да получим t статистическа стойност, която е толкова висока или по-висока, и това ще е нашата р стойност. И ако тя е под някакъв праг, това означава, че е доста слабо вероятно. Тогава ще отхвърлим нулевата хипотеза и това ще предположи алтернативната. Но не искат от нас да направим това. Просто ни казват да изчислим подходяща тестова статистическа стойност, което току-що направихме.