If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание

Запознаване с хи-тест за хомогенност

Запознаване с хи-тест за хомогенност.

Искаш ли да се присъединиш към разговора?

Все още няма публикации.
Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.

Видео транскрипция

Вече се запознахме с критерия ХИ-квадрат в други видеа. Сега ще го използваме за проверка за еднородност. Еднородност в ежедневието означава колко са подобни нещата и именно това ще проверим тук. Ще разгледаме две различни групи и ще видим дали разпределенията на тези групи за определена променлива са подобни, или не. Въпросът, върху който ще помисля, или върху който ще помислим заедно, е, да кажем, че мислим за левичари и десничари и се чудим дали имат същите предпочитания за дефиниционни множества предмети? Дали са еднакво предразположени към наука, технология, инженерство, математика, хуманитарни науки, или към нито едното? И можем да издигнем нулева и алтернативна хипотеза. Нулевата ни хипотеза е, че няма разлика в разпределението между левичари и десничари, що се отнася до предпочитания за учебни предмети. Няма разлика в предпочитанията за предмети. И алтернативната хипотеза е, че има разлика. Има разлика. Как подхождаме към проверяването на това? Правили сме проверка на хипотеза много пъти в много видеа. Но тук ще взимаме извадки от две различни групи. Да кажем, че това е генералната съвкупност от десничари, а това е генералната съвкупност от левичари. Да кажем, че от тази извадка от десничари аз ще взема извадка от 60, а после ще направя същото нещо за левичарите. Размерите на извадките може да не са еднакви. Да кажем, че взема извадка от 40 души от левичарите. И това са данните, които събирам. От тези 60 души 30 предпочитат предметите наука, технология, инженерство, математика, 15 предпочитат хуманитарни науки и 15 харесват всички поравно. А от 40-те левичари 10 предпочитат математика, технологии, икономика, математика, 25 предпочитат хуманитарни науки, а 5 ги харесват поравно. Виждаш общия брой десничари, общия брой левичари, а после имаш общия брой за двете групи, които предпочитат наука, технология, математика, икономика, общия брой от двете групи, които предпочитат хуманитарни науки, общия брой от двете групи, които нямат предпочитания. Нека започнем да мислим какви ще са очакваните данни, ако приемем, че нулевата хипотеза е вярна, че няма разлика в предпочитанията между десничарите и левичарите. Това е колоната десничари. Това е колоната левичари. Ако приемем, че нулевата хипотеза е вярна, че няма разлика между десничари и левичари, що се отнася до предпочитания, най-доброто ни предположение за това какво ще е разпределението на предпочитанията в генералната съвкупност ще дойде от тази обща колона. След като приемаме, че няма разлика, ще приемем, че във всяка група 40 от 100 предпочитат наука, математика, технологии, икономика, или това са 40%. 40% ще предпочитат хуманитарни науки и 20% няма да имат предпочитания. И очакванията ни ще са, че 40% от 60-те десничари ще предпочитат наука, технологии, икономика и математика. Колко е 40% от 60? 0,4*60 е 24. И, подобно, ще очакваме, че 40% ще предпочитат хуманитарни науки. 40% по 60 отново е 24. И ще очакваме 20% от десничарите да нямат предпочитания. 20% от 60 е 12. И тези, отново, дават сбор от 60. За левичарите ще преминем през същия процес. Ще очакваме 40% да предпочитат наука, технологии, икономика, математика. 40% от 40 е 16. При хуманитарните науки, отново, 40% от 40 е 16. И 20% от 40 е 8. И после всички тези дават сбор от 40. След като изчислиш тези очаквани стойности, сега е добър момент да се увериш, че изпълняваш условията за извършване на проверка с критерия ХИ-квадрат. Първото е условието за случайност. Това трябва да са наистина случайни извадки. Надяваме се, че сме изпълнили това условие. Второто е, че очакваната стойност за всяка от тези точки информация трябва да е поне равна на 5. Изпълнили сме това условие. Всички тези са равни поне на 5. И последното условие е условието за независимост – то е че или правим извадка със заместване, или, ако не правим извадка със заместване, трябва да сме уверени, че извадките ни са не повече от 10% от генералната съвкупност. Да приемем, че това е така. И сме готови да изчислим стойността на критерия ХИ-квадрат. Ще получим, че стойността на критерия ХИ-квадрат е равна на разликата между това, което получихме, и очакваната стойност, повдигната на квадрат. 30 - 24, на квадрат, делено на очакваната стойност, делено на 24. И ще направим това за всички тези 6 точки информация. Ще продължа към следващата. Това ще е – плюс, и ако погледна това и това тук, ще имам 10 – 16, на квадрат, върху очаквана стойност от 16. И после ще погледна тази точка информация и тази очаквана стойност и ще получа 15 – 24, на квадрат, върху очакваната стойност, върху 24. Свършват ми цветовете. И после ще погледна тези две числа – плюс (25 – 16)^2, делено на очакваната стойност. И после ще погледнем тези две – плюс (15 – 12)^2, върху очакваната стойност, върху 12. И последно, но не и по важност – нека намеря цвят, който не съм използвал. Ще разгледаме това и това – плюс (5 – 8)^2, върху очакваната стойност, върху 8. След като получиш тази стойност за критерия ХИ-квадрат, следващият въпрос е колко са степените ни на свобода. Просто правило е просто да погледнеш данните и да помислиш за броя редове и броя колони. Имаме три реда и две колони. И степените ни на свобода ще са броят редове минус едно, 3 – 1, по броя колони минус едно, 2 – 1. И това ще е равно на 2*1, което е равно на 2. Причината това да е логично е, че ако знаеш две от тези точки информация и ако знаеш общите суми, тогава можеш да намериш другата точка информация. Ако знаеше тези две точки информация, можеш да намериш тази. Ако знаеш тази точка информация и знаеш общия брой, можеш да намериш тази. Ако знаеш тази точка информация и знаеш общия брой, можеш да намериш тази. И ако знаеше това и това, тогава можеш да намериш това тук. Ето защо това правило работи. Броят редове минус 1 по броя колони минус 1 ти дава степените ти на свобода. Като имаме стойността на критерия ХИ-квадрат, която не съм изчислил, но можеш да използваш калкулатор и да я изчислиш, и тези степени на свобода, можем да намерим р-стойността. Можем да намерим вероятността да получим толкова екстремна или по-екстремна стойност за критерия ХИ-квадрат. И ако това е по-малко от нивото ни на значимост, което трябва да сме определили предварително, тогава ще отхвърлим нулевата хипотеза и това ще предположи алтернативната. Ако това не е по-малко от нивото ни на значимост, това не ни позволява да отхвърлим нулевата хипотеза.