Основно съдържание
Курс: Статистика и вероятности > Раздел 12
Урок 1: Какво представлява теста за значимост- Просто тестване на хипотеза
- Смисълът от тестване на хипотезата
- Просто тестване на хипотеза
- Примери за нулева хипотеза и алтернативна хипотеза
- Съставяне на нулева и алтернативна хипотеза
- P-стойности и тестове за значимост
- Сравняване на P-стойности и различни нива на значимост
- Определяне на Р-стойност от симулация
- Определяне на Р-стойност от симулация
- Използване на Р-стойности за извеждане на заключения
© 2024 Khan AcademyУсловия за ползванеДекларация за поверителностПолитика за Бисквитки
Определяне на Р-стойност от симулация
Пример за определяне на Р-стойност на база симулация за приблизително определяне на извадковото разпределение, при положение, че нулевата хипотеза е вярна.
Искаш ли да се присъединиш към разговора?
Все още няма публикации.
Видео транскрипция
Тук имаме въпрос за р-стойностите. "Ейви прочела статия, която казвала, че 6% от тийнейджърите са вегетарианци, но тя мисли, че процентът е по-висок
при учениците в нейното училище. За да провери теорията си,
Ейви направила случайна извадка от 25 ученика от нейното училище и 20% от тях били вегетарианци." Просто в този първи параграф са казани някои интересни неща. Казва се, че реалната част
от генералната съвкупност, ако вярваме на тази статия, от тийнейджърите, които са вегетарианци, можем да кажем, че е 6%. За нейното училище има
нулева хипотеза, че частта от учениците в училището ѝ, които са вегетарианци –
това е в нейното училище, това е реалната част,
нулевата хипотеза ще е същата като частта от тийнейджърите
като цяло. Това ще е нулевата хипотеза. И можеш да видиш, че тя генерира алтернативна хипотеза, защото тя мисли, че процентът е по-висок
за учениците в нейното голямо училище. Нейната алтернативна хипотеза
ще е, че частта, показателят на реалната генерална
съвкупност за нейното училище е по-голям от 6%. И за да видиш дали можеш
да отхвърлиш нулевата хипотеза, или не,
взимаш извадка и именно това е направила Ейви. Тя е взела случайна извадка
от 25 ученика и пресметнала частта от извадката. И после ще откриеш каква е
вероятността да получиш толкова висока
или по-голяма част от извадката. Ако е по-ниска от даден праг, тогава ще отхвърлиш
нулевата хипотеза. И тази вероятност
наричаме р-стойност. р-стойността е равна на вероятността частта на извадката ти, както тя прави за учениците
в нейното училище, да е по-голяма от или равна на 20%, ако приемеш, че нулевата хипотеза
е вярна. Ако приемем, че реалната част в училището е 6% вегетарианци, но вземеш извадка от 25 ученика и получиш 20%, каква е вероятността да получиш 20% или повече
за извадка от 25? Има много начини да подходиш към това,
но изглежда тя използва симулация. "За да види колко е вероятно
такава извадка да се получи само по случайност, Ейви извършила симулация. Тя симулирала 40 извадки
от n=25 ученици от голяма генерална съвкупност,
където 6% от учениците били вегетарианци. Тя записала частта вегетарианци
във всяка извадка. Ето частите от всяка извадка
от нейните 40 извадки." Тук при симулацията това е приблизително изчисление
на извадковото разпределение на частите от всяка извадка,
ако приемеш, че нулевата хипотеза е вярна. И по-долу се казва: "Ейви иска да провери
нулевата си хипотеза" която е, че реалната част
в нейното училище е 6%, срещу алтернативната хипотеза, че реалната част в училището ѝ
е по-голяма от 6%, "където р е реалната част от учениците в нейното училище, които са
вегетарианци." И после ни питат: "Въз основа на тези резултати
от симулацията, каква е приблизителната
р-стойност на теста?" И казват: "Резултатът от извадката" – частта от извадката тук
– "е бил 20%." Видяхме това ето тук. Ако приемем, че това е сравнително добро
приблизително изчисление за извадковото разпределение на
частите от всяка от извадките ни, тук има 40 точки информация, и при колко от тези извадки
получаваме част от извадката, която е по-голяма от или равна на 20%? Можеш да видиш, че това тук е 20%, 20/100, и виждаш, че имаме 3 тук, които изпълняват условието ни. И това е 3 от 40. Ако мислим, че това е сравнително
добро приблизително изчисление, тогава ще кажем, че р-стойността ни ще бъде приблизително 3/40 в случай, че реалната част от генералната съвкупност
за училището е 6%, при условие, че нулевата хипотеза е вярна. Тогава приблизително 3 от всеки 40 пъти( ще очакваш да получиш извадка с 20% или повече вегетарианци. И колко е 3/40? Да видим, ако умножа и числителя, и знаменателя по 2,5, това е приблизително равно на... казвам 2,5 за да преминем от 40 до 100 – и после 2,5*3 ще е 7,5. Ще кажем, че това е приблизително 7,5% и това е въпрос с множество отговори, и ако превъртим надолу, наистина виждаме
приблизително 7,5% ето тук.