If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание
Текущ час:0:00Обща продължителност:11:26

Видео транскрипция

Един невролог изпробва ефекта на дадено лекарство, като отчита времето за реакция, инжектирайки единична доза от лекарството на 100 плъха, и подлага всеки от тях на неврологичен стимул и записва времето за реакция. Неврологът знае, че средното време за реакция при плъховете, неинжектирани с лекарството, е 1,2 секунди. Средната стойност на времето за реакция на стоте инжектирани плъха е 1,05 секунди със стандартно отклонение на извадката 0,5 секунди. Смятате ли, че лекарството има някакво влияние върху времето за реакция? За да установим това, ще направим две хипотези. Ще кажем, едно, първата хипотеза ще я наречем нулева, и тя е, че лекарството не повлиява на времето за реакция. И нашата нулева хипотеза винаги ще бъде... можем да я считаме за обичайното състояние. Приема се, че, независимо какво изследваме, то не оказва ефект. Така че лекарството няма ефект. Или друг начин, по който да го изразим, е, че средната стойност за плъховете, поели лекарството, би трябвало да е равна на средната стойност със лекарството... ще го напиша по този начин – средната стойност ще си е 1,2 секунди дори със лекарството. И по същество това означава, че то няма ефект, защото знаем, че ако не дадем лекарството, тогава средната стойност на времето за реакция е 1,2 секунди. И сега търсим някаква алтернативна хипотеза. Хипотезата е следната: "Считаме, че лекарството в действителност прави нещо. Така че алтернативната хипотеза е, че лекарството има някакъв ефект. Или друг начин, по който да го формулираме, е, че средната стойност не е равна на 1,2 секунди, когато е дадено лекарството. И как мислим за това? Как можем да знаем дали трябва да приемем алтернативната хипотеза или дали просто да приемем по подразбиране нулевата хипотеза, защото данните не са убедителни? И в този клип ще направим това, реално това е начинът, по който се постъпва в много случаи в науката, казваме: "Да предположим, че нулевата хипотеза е вярна. Ако нулевата хипотеза е вярна, каква е вероятността да получим тези резултати в извадката?" И ако тази вероятност е наистина много малка, тогава нулевата хипотеза вероятно не е вярна. Бихме могли да отхвърлим нулевата хипотеза и да кажем, че имаме някаква увереност в алтернативната хипотеза. Та нека помислим по нея. Нека приемем, че нулевата хипотеза е вярна. Ако приемем, че нулевата хипотеза е вярна, нека се опитаме да намерим вероятността да сме получили всъщност този резултат, да сме получили средна стойност за извадката 0,5 секунди със стандартно отклонение от 0,5 секунди. И искам да видя дали ако приемем нулевата хипотеза за вярна, искам да намерим вероятността... и всъщност това, което ще направим, е не само да намерим вероятността тук, вероятността да получим нещо такова, или дори нещо много по-крайно от това. И така, колко вероятно е да се случи едно такова събитие? За да разгледаме това, нека само помислим за извадковото разпределение, когато приемаме нулевата хипотеза. Извадковото разпределение изглежда така. Това ще е едно нормално разпределение. Имаме един добър брой елементи на извадката, тук имаме 100 от тях. Така че това е извадковото разпределение. То ще има някаква средна стойност. Ако приемем нулевата хипотеза, това, че лекарството няма ефект, средната стойност на извадковото разпределение ще бъде равна на средната стойност на разпределението за генералната съвкупност, която е равна на 1,2 секунди. Какво е стандартното отклонение на извадковото разпределение? Стандартното отклонение на нашето извадково разпределение ще е равно на стандартното отклонение на генералната съвкупност разделено на квадратен корен от размера на извадката. И така, делено на корен квадратен от 100. Не знаем какво е стандартното отклонение на генералната съвкупност. И това, което ще направим, е, че ще го пресметнем с извадковото стандартно отклонение. Това е разумно да се направи, най-вече поради факта, че имаме добър размер на извадката. Размерът на извадката е по-голям от 100. И ще получим доста добра приблизителна стойност. Ще имаме доста добра приблизителна стойност за това тук. Така че можем да кажем, че това ще е приблизително равно на нашето извадково стандартно отклонение, разделено на корен квадратен от 100, което ще е равно на нашето извадково стандартно отклонение, което е 0,5 секунди, и ще го разделим на квадратен корен от 100, което е 10. 0,5, разделено на 10 дава 0,05. Така стандартното отклонение на нашето извадково разпределение ще бъде... ще сложим една малка шапчица над него, за да покажем, че сме се доближили... доближили сме до стандартното отклонение на генералната съвкупност с извадковото стандартно отклонение. И това ще е равно на 0,5, разделено на 10. Така, 0,05. А каква е вероятността... нека помислим за това така. Каква е вероятността да получим 1,05 секунди? Или друг начин да помислим за това е на колко стандартни отклонения от тази средна стойност се намират 1,05 секунди, и каква е вероятността да получим резултат, който е поне с толкова стандартни отклонения отдалечен от средната стойност. И нека намерим на колко стандартни отклонения от средната стойност е отдалечено това. Сега по същество ще намерим един Z-резултат, Z-резултат, съответстващ на този резултат тук. Нека избера един хубав цвят – още не съм ползвал оранжево. Така, нашият Z-резултат... можем дори да си направим Z-статистиката. Тя се извлича от другите статистики на извадката. Нашата Z-статистика, на какво разстояние сме от средната стойност? Средната стойност е 1,2. Ние сме на 1,05 разстояние, така че ще поставя това по-малко разстояние, за да имаме положително такова. Това е разстоянието, на което се намираме. Ако търсехме резултата изразен като стандартните отклонения, сега ще трябва да разделим това на най-добрата оценка на стандартното отклонение на извадковото разпределение, която е това 0,05. Така, това тук е 0,05, а това на какво ще е равно? Този резултат тук, 1,05 секунди. 1,2 минус 1,05 дава 0,15. Тук в числителя имаме 0,15, разделено на 0,05 в знаменателя, и това ще е равно на 3. Този резултат тук е 3 стандартни отклонения отдалечен от средната стойност. Нека го начертая. Това е средната стойност. Ако взема 1 стандартно отклонение, 2 стандартни отклонения, 3 стандартни отколонения – това е в положителна посока. Всъщност нека го начертая по един малко по-различен начин. Това не е хубава крива, но ще включа 1 стандартно отклонение, 2 стандартни отклонения, и после 3 стандартни отклонения в положителна посока. След това имаме 1 стандартно отклонение, 2 стандартни отклонения, и 3 стандартни отклонения в отрицателна посока. И този резултат тук, 1,05 секунди, които получихме в нашия пример със стоте плъха, е точно тук. 3 стандартни отклонения под среданата стойност. Каква е вероятността да получим резултат, толкова отдалечен просто по случайност? И когато казвам толкова отдалечен, резултатът може да е или по-малък от този, или да е резултат толкова отдалечен в положителната посока. Повече от 3 стандартни отклонения. Така по същество тук, ако мислим за вероятността да получим резултат, по-отдалечен от този резултат тук, ние имаме предвид тази област под кривата, както в отрицателната, така и в положителната посока. Каква е вероятността за това? Тръгваме от емпиричното правило, че 99,7% от вероятността е в рамките на 3 стандартни отклонения. И това тук – можем да го погледнем и в една Z-таблица, но 3 стандартни отклонения е едно хубаво число, което лесно се помни. Значи знаем, че тази област тук, която съм оцветил в червеникаво-оранжево, тази област тук е 99,7%. И какво остава за тези две области, лилавата и розовата? Ако тези тук са 99,7%, две от тези общо са 0,3%. Двете тези общо са 0,3... трябва да го напиша точно по този начин... са 0,3%. Или ако запишем това като десетична дроб, ще е 0,003 от цялата област под кривата. И за да отговорим на нашия въпрос, ако приемем, че лекарството няма ефект, вероятността да получим резултат, толкова отдалечен, или дори по-отдалечен от този, е само 0,3%. По-малко от 1 в 300. Ако нулевата хипотеза е вярна, има само 1 на 300 вероятност да получим толкова отдалечен резултат или по-отдалечен. Така че поне от моя гледна точка тези резултати изглежда потвърждават алернативната хипотеза. Ще отхвърля нулевата хипотеза. Не съм 100% убеден. Но ако нулевата хипотеза е вярна, има САМО 1 на 300 вероятност да получим този резултат. Така че ще приемем алтернативната хипотеза. И просто за да те запозная с някои от термините или обозначенията, които може да видиш в някои статистически или научни изследвания, тази стойност, вероятността да получим резултат, който е по-отдалечен от този, който предлага нулевата хипотеза, се нарича P-стойност. И P-стойността тук – под това всъщност се има предвид стойност на вероятността, P-стойността тук е 0,003. И има доста, доста малка вероятност да получим този резултат, ако нулевата хипотеза е вярна, така че ще отхвърлим нулевата хипотеза. По принцип повечето хора приемат това като един вид праг. Ако имаме P-стойност, по-малка от 5%, което означава по-малко от 1 в общ брой 20, тогава те отхвърлят нулевата хипотеза. Има по-малка от 1 в 20 вероятност да получим този резултат. Тук получихме много по-малко от 1 в 20. Един вид това е много силен показател, че нулевата хипотеза е грешна и лекарството определено има някакъв ефект.