If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание
Текущ час:0:00Обща продължителност:6:25

Видео транскрипция

"Алисия взела случайна извадка от мобилни телефони и открила положителна линейна зависимост между скоростите на процесорите им и цените им. Това са изходящи данни от компютър от анализа на регресията на извадката ѝ по метода на най-малките квадрати." Нека си изясним какво става – тя взела извадка от телефони, не ни казват колко точно, но тя взела някакъв брой телефони и открила линейна зависимост между скоростта на процесора и цената. Това тук е цената, това тук е скоростта на процесора. И после представила данните от извадката си графично. Всеки телефон ще е една точка информация и после въвела тези точки информация в компютъра и той успял да изведе права на регресия за нейната извадка. И правата на регресия за извадката ѝ, ако кажем, че това ще е у, или у с шапка, и то ще е а плюс bx, за нейната извадка а ще е 127,083. Това ето тук е ето това. И за извадката ѝ ъгловият коефициент на нейната права на регресия ще е коефициентът на скоростта. Друг начин да разглеждаме това – тази променлива х тук е скорост, коефициентът на това е ъгловият коефициент. Но трябва да си припомним, че това са приблизителни изчисления на, някаква вероятна истина във Вселената. Ако тя е можела да направи извадка от всеки телефон на пазара, тогава тя би получила реалните параметри на генералната съвкупност, но след като това е извадка, това е просто приблизително изчисление. И понеже тя вижда тази положителна линейна зависимост в извадката си, това не означава наистина, че това е нака за цялата генерална съвкупност. Може просто да се е случило така, че нещата от извадката да са имали такава положителна линейна зависимост. И затова тя прави проверка на хипотеза. При тест на хипотеза приемаш, че няма зависимост между скоростта на процесора и цената. Бета тук ще е реалният показател на генералната съвкупност за регресията на генералната съвкупност. Ако това тук е генералната съвкупност, където цената е на вертикалната ос, а скоростта на процесора е на хоризонталната ос, и ако можеш да погледнеш цялата генерална съвкупност – не знам колко телефона има, но може да са милиарди телефони – и после направиш права на регресия, тогава нулевата хипотеза е, че ъгловият коефициент на правата на регресия ще е 0. Правата на регресията може да изглежда така, като уравнението на правата на регресия за генералната съвкупност, у с шапка, ще е алфа плюс бета по х. И нулевата хипотеза е, че бета е равно на 0, а алтернативната хипотеза, което е нейното подозрение, е, че ъгловият коефициент на правата на регресия всъщност е по-голям от 0. "Приеми, че всички условия за извод са били изпълнени. При алфа е равно на 0,01 ниво на значимост има ли достатъчно доказателства, за да заключим, че има положителна линейна зависимост между тези променливи за всички мобилни телефони? Защо?" Спри видеото и виж дали можеш да решиш това. За да направим тази задача, трябва да кажем: "Като приемем, че нулевата хипотеза е вярна, като приемем, че това е реалният ъглов коефициент на правата на регресия не генералната съвкупност" – предполагам, че можеш да помислиш за това – "каква е вероятността да получим този резултат тук?" И можем да използваме тази информация и приблизителното ни изчисление на ъгловия коефициент на правата на регресия на извадковото разпределение на извадката, и можем да намерим t-стойност. И за тази ситуация, при която алтернативната ни хипотеза е, че реалният ъглов коефициент на регресията на генералната съвкупност е по-голям от 0, можем да гледаме на р-стойността като на вероятността да получим t-стойност, по-голяма от или равна на тази. Тоест, да получим t-стойност, по-голяма от или равна на 2,999. Може да ти се иска да кажеш, че има колонка, която ни дава р-стойност, и можеш би са намерили вместо нас, че вероятността тук е 0,004. Но трябва много, много да внимаваш, понеже тук всъщност ни дават – предполагам можеш да кажеш така – двустранна р-стойност. Ако помислиш за едно t-разпределение – и те биха го направили за подходящите степени на свобода – това казва каква е вероятността да получим резултат, при който абсолютната стойност е 2,999 или по-висока. Ако това е t = 0 ето тук в средата, и това е 2,999, интересува ни тази област, интересува ни тази дясна опашка. Тази р-стойност ни дава не само дясната опашка, но и ни казва каква е вероятността да получим нещо по-малко от –2,999, или включително –2,999. Това ни дава и двете от тези области, така че ако искаш р-стойността за този сценарий, тогава ще разгледаме ето това. И, както можеш да видиш, понеже това разпределение е симетрично, t-разпределението ще е симетрично, взимаш половината от това. Това ще е равно на 0,002. И при всеки тест за значимост после ще сравниш р-стойността с нивото си на значимост. И ако разгледаш 0,002 и го сравниш с 0,01, кое от тези е по-голямо? Първо може да кажеш, че 2 е по-голямо от 1, но това са две хилядни срещу една стотна. Това тук са 10 хилядни. Тоест в тази ситуация р-стойността ни е по-малка от нивото на значимост и казваме: "Вероятността да получим такъв или по-екстремен резултат е толкова ниска, ако приемем нулевата хипотеза, че в тази ситуация ще решим да отхвърлим нулевата хипотеза, което ще предположи алтернативната." "Има ли достатъчно доказателство, за да заключим, че има положителна линейна зависимост между тези променливи за всички мобилни телефони?" Да. "Защо?" Понеже р-стойността е по-ниска от нивото ни на значимост и ще отхвърлим нулевата хипотеза, което предполага алтернативната.