Основно съдържание
Статистика и вероятности
Курс: Статистика и вероятности > Раздел 14
Урок 1: Хи-квадрат тестове (съвместимост)- Хи-квадрат разпределение въведение
- Хи-квадрат тест на Пирсън (съгласуваност)
- Хи-квадрат статистика за проверка на хипотези
- Пример за хи-квадрат съвместимост
- Очакван брой в тест за съвместимост
- Условия за тест за съвместимост
- Критерий за значимост и Р-стойност в тест за съвместимост
- Заключения в тест за съвместимост
© 2023 Khan AcademyУсловия за ползванеДекларация за поверителностПолитика за Бисквитки
Пример за хи-квадрат съвместимост
Пример за хи-квадрат съвместимост.
Искаш ли да се присъединиш към разговора?
Все още няма публикации.
Видео транскрипция
"В игра на камък-ножица-хартия Кени очаква да печели, да завършва
наравно и да губи с равна честота. Кени често играе камък-ножица-хартия, но подозира, че игрите му
не следват този модел. Затова взел случайна извадка от 24 игри и записал резултатите им. Това са резултатите." От 24-те игри спечелил 4, изгубил 13 и бил наравно 7 пъти. "Той иска да използва
тези резултати, за да провери посредством критерия ХИ-квадрат дали разпределението
на резултатите му не съвпада с равномерно разпределение. Какви са стойностите на тестовата
статистическа характеристика" – статистическата характеристика ХИ-квадрат – "и р-стойността за теста на Кени?" Спри видеото и виж дали можеш
да определиш това. Добре, той всъщност прави
проверка на хипотеза, като използва статистическа
характеристика ХИ-квадрат. Понеже е хипотеза, тук мислим за множество категории. Каква ще е нулевата му хипотеза? Тази нулева хипотеза ще е, че всички резултати са с еднаква вероятност. Резултатите са с равна вероятност. А алтернативната му хипотеза ще е, че резултатите нямат еднаква вероятност. Помни, приемаме, че нулевата
хипотеза е вярна. И после, като приемем, че нулевата
хипотеза е вярна, ако вероятността да получим поне толкова
екстремен резултат е достатъчно ниска, тогава ще отхвърлим нулевата си хипотеза. Друг начин да помислим за това е, че ако нашата р-стойност
е под някакъв праг, тогава ще отхвърлим нулевата хипотеза. Той взел извадка от 24 игри, така че n = 24. И това са данните, които е получил. Преди да изчислим своята статистическа
характеристика ХИ-квадрат и да намерим каква е вероятността да получим толкова или по-голяма
статистическа характеристика ХИ-квадрат, нека се уверим, че изпълняваме условията за тест за степен на съвпадение на ХИ-квадрат. Виждали сме някои от тях, но някои са малко по-различни. Едно е условието за случайност. Ще ги запиша тук. Условието за случайност. И то гласи, че това е напълно случайна извадка от игри. И тук ни казват, че е взел
случайна извадка от 24 игри. Така че изпълняваме това условие. Второто условие, когато говорим за ХИ-квадрат тест на хипотеза, е голям брой. Условието за голям брой. И това е важно. То е, че очакваният брой от всяка
категория резултати е поне равен на 5. И може да си кажеш, че имаш
само 4 победи. Или Кени имал 4 победи
от извадката си от 24. Но това не нарушава
условието за голям брой. Помни, какъв е очакваният брой
победи, загуби и равенства? Ако приемаш нулевата хипотеза, където резултатите имат еднаква вероятност, очакваният брой – мога да го запиша ето тук... Това е 1/3, 1/3, 1/3. 1/3 от 24 е 8, 8 и 8. Това ще очаква Кени. И след като всички от тези са
поне равни на 5, изпълняваме условието за голям брой. Последното условие е
условието за независимост. Ако не правим извадка със заместване, трябва да сме уверени, че размерът на извадката е не повече
от 10% от генералната съвкупност. И той определено може да изиграе
повече от 240 игри в живота си, така че ще приемем, че изпълняваме
и това условие. Като изяснихме това, можем да изчислим статистическата
характеристика ХИ-квадрат и да опитаме да направим
някакви изводи въз основа на това. Да видим, статистическата ни
характеристика ХИ-квадрат ще е равна на – за всяка категория тя ще е разликата между прогнозираната стойност и това,
което получихме в извадката, на квадрат, делена на очакваната стойност. Първата категория е победи. Това ще е 4 – 8, на квадрат, върху очаквания брой победи, 8, плюс загуби, това е 13 – 8. 13 е броят загубени игри, минус 8 очаквани, на квадрат,
върху броя очаквани. Плюс... получил е 7 равенства, би очаквал 8, на квадрат, върху 8. Да видим колко е това. 4 – 8 е –4, повдигаш това на квадрат, получаваш 16. 13 – 8 е 5, повдигаш това на квадрат, получаваш 25. 7 – 8 е –1, повдигаш това на квадрат, получаваш 1. И 16 делено на 8 ще е 2. 25 делено на 8 ще е, да видим,
това е 3 и цяло и 1/8, тоест това е 3,125, а 1/8 е 0,125. Събираш ги – да видим, това ще е 2 + 3,125, 5,125, плюс още 0,125, това ще е 5,25. Нашата статистическа характеристика
ХИ-квадрат е 5,25. И за да намерим нашата р-стойност, р-стойността ще е равна на вероятността да получим статистическа
характеристика ХИ-квадрат по-голяма от или равна на 5,25. И можеш да използваш таблица
на ХИ-квадрат за това. И винаги трябва да мислим
за степените на свобода. Имаме 1, 2, 3 категории. Така че степените на свобода
ще са с една по-малко, или 3 – 1, което е 2. Степените ни на свобода
ще са равни на 2. И това е логично, понеже за определен брой игри, ако знаеш броя победи и знаеш, че има определен брой загуби, можеш да намериш броя равенства. Или, ако знаеш които и да е две от тези категории, винаги можеш да намериш третата. Затова имаш две степени на свобода. Нека извадим таблицата си за ХИ-квадрат. Имаме две степени на свобода, така че сме в този ред. И къде е 5,25? 5,25 е ето тук. И вероятността ни ще е между 0,10 и 0,05. Р-стойността ни ще е по-голяма
от 0,05 и по-малка от 0,10. Например ако предварително – и той е трябвало да направи това предварително – той е поставил ниво на значимост от 5% и Р-стойността ни тук е по-голяма
от 5%, което току-що видяхме, той в тази ситуация няма да успее
да отхвърли нулевата хипотеза. Но тук не ни питат това. Питат ни каква е стойността
на ХИ-квадрат и в какъв диапазон е нашата р-стойност. Да видим, 5,25 са и двете
от тези стойности и видяхме, че получихме
Р-стойност между 5% и 10%. Тоест верният отговор е А.