If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание

Пример за хи-квадрат съвместимост

Пример за хи-квадрат съвместимост.

Искаш ли да се присъединиш към разговора?

Все още няма публикации.
Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.

Видео транскрипция

"В игра на камък-ножица-хартия Кени очаква да печели, да завършва наравно и да губи с равна честота. Кени често играе камък-ножица-хартия, но подозира, че игрите му не следват този модел. Затова взел случайна извадка от 24 игри и записал резултатите им. Това са резултатите." От 24-те игри спечелил 4, изгубил 13 и бил наравно 7 пъти. "Той иска да използва тези резултати, за да провери посредством критерия ХИ-квадрат дали разпределението на резултатите му не съвпада с равномерно разпределение. Какви са стойностите на тестовата статистическа характеристика" – статистическата характеристика ХИ-квадрат – "и р-стойността за теста на Кени?" Спри видеото и виж дали можеш да определиш това. Добре, той всъщност прави проверка на хипотеза, като използва статистическа характеристика ХИ-квадрат. Понеже е хипотеза, тук мислим за множество категории. Каква ще е нулевата му хипотеза? Тази нулева хипотеза ще е, че всички резултати са с еднаква вероятност. Резултатите са с равна вероятност. А алтернативната му хипотеза ще е, че резултатите нямат еднаква вероятност. Помни, приемаме, че нулевата хипотеза е вярна. И после, като приемем, че нулевата хипотеза е вярна, ако вероятността да получим поне толкова екстремен резултат е достатъчно ниска, тогава ще отхвърлим нулевата си хипотеза. Друг начин да помислим за това е, че ако нашата р-стойност е под някакъв праг, тогава ще отхвърлим нулевата хипотеза. Той взел извадка от 24 игри, така че n = 24. И това са данните, които е получил. Преди да изчислим своята статистическа характеристика ХИ-квадрат и да намерим каква е вероятността да получим толкова или по-голяма статистическа характеристика ХИ-квадрат, нека се уверим, че изпълняваме условията за тест за степен на съвпадение на ХИ-квадрат. Виждали сме някои от тях, но някои са малко по-различни. Едно е условието за случайност. Ще ги запиша тук. Условието за случайност. И то гласи, че това е напълно случайна извадка от игри. И тук ни казват, че е взел случайна извадка от 24 игри. Така че изпълняваме това условие. Второто условие, когато говорим за ХИ-квадрат тест на хипотеза, е голям брой. Условието за голям брой. И това е важно. То е, че очакваният брой от всяка категория резултати е поне равен на 5. И може да си кажеш, че имаш само 4 победи. Или Кени имал 4 победи от извадката си от 24. Но това не нарушава условието за голям брой. Помни, какъв е очакваният брой победи, загуби и равенства? Ако приемаш нулевата хипотеза, където резултатите имат еднаква вероятност, очакваният брой – мога да го запиша ето тук... Това е 1/3, 1/3, 1/3. 1/3 от 24 е 8, 8 и 8. Това ще очаква Кени. И след като всички от тези са поне равни на 5, изпълняваме условието за голям брой. Последното условие е условието за независимост. Ако не правим извадка със заместване, трябва да сме уверени, че размерът на извадката е не повече от 10% от генералната съвкупност. И той определено може да изиграе повече от 240 игри в живота си, така че ще приемем, че изпълняваме и това условие. Като изяснихме това, можем да изчислим статистическата характеристика ХИ-квадрат и да опитаме да направим някакви изводи въз основа на това. Да видим, статистическата ни характеристика ХИ-квадрат ще е равна на – за всяка категория тя ще е разликата между прогнозираната стойност и това, което получихме в извадката, на квадрат, делена на очакваната стойност. Първата категория е победи. Това ще е 4 – 8, на квадрат, върху очаквания брой победи, 8, плюс загуби, това е 13 – 8. 13 е броят загубени игри, минус 8 очаквани, на квадрат, върху броя очаквани. Плюс... получил е 7 равенства, би очаквал 8, на квадрат, върху 8. Да видим колко е това. 4 – 8 е –4, повдигаш това на квадрат, получаваш 16. 13 – 8 е 5, повдигаш това на квадрат, получаваш 25. 7 – 8 е –1, повдигаш това на квадрат, получаваш 1. И 16 делено на 8 ще е 2. 25 делено на 8 ще е, да видим, това е 3 и цяло и 1/8, тоест това е 3,125, а 1/8 е 0,125. Събираш ги – да видим, това ще е 2 + 3,125, 5,125, плюс още 0,125, това ще е 5,25. Нашата статистическа характеристика ХИ-квадрат е 5,25. И за да намерим нашата р-стойност, р-стойността ще е равна на вероятността да получим статистическа характеристика ХИ-квадрат по-голяма от или равна на 5,25. И можеш да използваш таблица на ХИ-квадрат за това. И винаги трябва да мислим за степените на свобода. Имаме 1, 2, 3 категории. Така че степените на свобода ще са с една по-малко, или 3 – 1, което е 2. Степените ни на свобода ще са равни на 2. И това е логично, понеже за определен брой игри, ако знаеш броя победи и знаеш, че има определен брой загуби, можеш да намериш броя равенства. Или, ако знаеш които и да е две от тези категории, винаги можеш да намериш третата. Затова имаш две степени на свобода. Нека извадим таблицата си за ХИ-квадрат. Имаме две степени на свобода, така че сме в този ред. И къде е 5,25? 5,25 е ето тук. И вероятността ни ще е между 0,10 и 0,05. Р-стойността ни ще е по-голяма от 0,05 и по-малка от 0,10. Например ако предварително – и той е трябвало да направи това предварително – той е поставил ниво на значимост от 5% и Р-стойността ни тук е по-голяма от 5%, което току-що видяхме, той в тази ситуация няма да успее да отхвърли нулевата хипотеза. Но тук не ни питат това. Питат ни каква е стойността на ХИ-квадрат и в какъв диапазон е нашата р-стойност. Да видим, 5,25 са и двете от тези стойности и видяхме, че получихме Р-стойност между 5% и 10%. Тоест верният отговор е А.