If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание
Текущ час:0:00Обща продължителност:10:23

Видео транскрипция

В това видео ще поговорим за това какво е разпределение ХИ-квадрат, понякога наричано ХИ-квадратно разпределение. После, в следващите няколко видеа ще го използваме, за да проверим колко добре теоретичните разпределения обясняват наблюденията, или колко добре съвпадат наблюдаваните резултати с теоретичните разпределения. Нека помислим малко за това. Да кажем, че имам някакви случайни променливи. Всички те са независими, стандартно нормално разпределени случайни променливи. Нека ти припомня какво означава това. Да кажем, че имам случайната променлива Х. Ако Х е нормално разпределена, можем да запишем, че Х е нормална случайна променлива със средна стойност от 0 и дисперсия от 1. Можем да кажем, че очакваната стойност на Х е равна на 0 или, че дисперсията на случайната ни променлива Х е равна на 1. За да визуализираме това, когато вземем един отделен пример на тази променлива, взимаме извадка от едно нормално разпределение, стандартно нормално разпределение, което изглежда като това. Средна стойност 0 и дисперсия 1, което също ще означава, разбира се, стандартно отклонение 1. Това може да е стандартното отклонение или дисперсията, или стандартното отклонение, което ще е равно на 1. При ХИ-квадратно разпределение, ако вземеш една от тези случайни променливи – нека го дефинирам така. Нека дефинирам нова случайна променлива. Нека дефинирам една нова случайна променлива Q, която е равна на – взимаш извадка от това стандартно нормално разпределение и после повдигаш на квадрат числото, което получиш. Това е равно на тази случайна променлива Х на квадрат. Разпределението за тази случайна променлива тук ще е пример за ХИ-квадратно разпределение. Всъщност, в това видео ще видим, че ХИ-квадрат или ХИ-квадратното разпределение е група от разпределения, в зависимост от това колко сборове имаш. Сега имаме само една случайна променлива, която повдигаме на квадрат. Това е само един от примерите. Ще говорим повече за тях след малко. Ето тук можем да запишем, че Q е ХИ-квадратно разпределена случайна променлива. Или можем да използваме това отбелязване тук. Q е – можем да го запишем така. Това вече не е Х. Това е гръцката буква χ (хи), въпреки че изглежда като накъдрено Х. Това е член на ХИ-квадрат. След като тук взимаме само един сбор – взимаме само сборът на една независима нормално разпределена променлива, казваме, че това има само 1 степен на свобода. Записваме това тук. Това тук е степента ни на свобода. Имаме 1 степен на свобода тук. Нека наречем това Q1. Да кажем, че имам друга случайна променлива. Нека наречем това Q – нека го направя в различен цвят. Нека направя Q2 в синьо. Да кажем, че имам друга случайна променлива, Q2, която е дефинирана като – да кажем, че имам една независима, стандартна, нормално разпределена променлива. Ще нарека това Х1. И я повдигам на квадрат. Сега имам друга независима, стандартна, нормално разпределена променлива, Х2. И я повдигам на квадрат. Можеш да си представиш, че и двете от тези имат такива разпределения. Те са независими. За да направим извадка на Q2, правим извадка Х1 от това разпределение, повдигаме тази стойност на квадрат, правим извадка Х2 от същото разпределение, повдигаме тази стойност на квадрат, а после събираме двете. Така ще получиш Q2. Това тук е Q1. Q2 ще запишем като ХИ-квадратно разпределена случайна променлива с 2 степени на свобода. Ето тук. 2 степени на свобода. За да визуализираме групата от ХИ-квадратни разпределения, нека погледнем това тук. Това го взех от Уикипедия. Това ни показва някои от функциите на вероятностната плътност за някои от ХИ-квадратните разпределения. Първото тук, за k = 1, това са степени на свобода. Това е нашето Q1. Това е функцията на вероятностната плътност за Q1. Забележи, че доста се затваря близо до 0. И това е логично. Понеже, ако взимаш извадка само веднъж от това стандартно нормално разпределение, има много висока вероятност да получиш нещо доста близо до 0. После, ако повдигнеш нещо, което е близко до 0 – помни, това са десетични дроби, те ще са по-малки от 1, доста близки до 0 – то ще е още по-малко. Имаш висока вероятност да получиш много малка стойност. Имаш висока вероятност да получиш стойности по-малки от определен праг, този тук, по-малки от... предполагам, това тук е 1. Тоест, по-малки от 1/2. Имаш много ниска вероятности да получиш голямо число. Имам предвид, за да получиш 4, ще трябва да направиш 2 извадки от това разпределение. Знаем, че 2 е – това всъщност са 2 дисперсии или 2 стандартни отклонения от средната стойност. Тоест, това е по-малко вероятно. Това е, за да получим 4. Още по-малко вероятно е да получим още по-големи числа. Ето затова виждаш тази форма тук. Когато имаш 2 степени на свобода, това донякъде го смекчава. Това е формата, тази синя линия тук е формата на Q2. Забележи, че е малко по-малко вероятно да получиш стойности, близки до 0 и малко повече вероятно да получиш по-отдалечени числа. Но това все още е доста натежало към малки числа. После, ако имахме друга случайна променлива, друга ХИ-квадратно разпределена стандартна променлива – да кажем, че имаме Q3. Нека я дефинираме като сбора на 3 от тези независими стойности, всяка от която има стандартно нормално разпределение. Тоест, Х1, Х2 на квадрат плюс Х3 на квадрат. После, изведнъж, Q3 – това тук е Q2 – има ХИ-квадратно разпределение с 3 степени свобода. Това тук – това ще е тази зелена линия. Може би трябваше да направя това в зелено. Това тук ще е тази зелена линия. После, забележи, започва да става малко повече вероятно да получиш стойности в този диапазон тук, понеже взимаш сбора. Всички те ще са доста малки стойности, но взимаш сбора. Така че това започва да се премества малко надясно. Колкото повече степени на свобода имаш, толкова по-надалеч това издуване започва да се мести надясно и, до определена степен, толкова по-симетрично става. Интересното нещо за това, което предполагам, е различно от почти всяко друго разпределение, което сме разгледали досега, въпреки че разгледахме и други, които също имат това свойство, е, че не можеш да имаш стойност под 0, понеже винаги повдигаш на квадрат тези стойности. Всяко от това може да има стойности под 0. Те са нормално разпределени. Те могат да имат отрицателни стойности. Но, след като ги повдигаме на квадрат и взимаме сбора от квадратите, това винаги ще е положително. Това ще бъде полезно, ще видим това в следващите няколко видеа, за измерването на грешката на една очаквана стойност. Ако вземеш тази обща грешка, можеш да откриеш вероятността да получиш тази обща грешка, ако вземеш предвид някои параметри. Ще говорим повече за това в следващото видео. Като казахме това, искам да ти покажа как да разчетеш таблица на ХИ-квадратно разпределение. Ако те попитам дали това е нашето разпределение – нека избера синьото. Тук имаме 2 степени на свобода, понеже събираме 2 от тези. Ако те попитам каква е вероятността Q2 да е по-голяма от – нека го кажа така. Каква е вероятността Q2 да е по-голямо от 2,41? Избирам това нарочно. Искам да намеря вероятността Q2 да е по-голямо от 2,41. Искам да погледна една таблица на ХИ-квадрат като тази. Q2 е версия на ХИ-квадрат с 2 степени на свобода. Поглеждам този ред ето тук, под 2 степени на свобода. Искам да намеря вероятността да получа стойност над 2,41. Избрах 2,41, понеже се намира в тази таблица. Повечето от тези ХИ-квадрат – причината да имаме тези странни числа като тези, вместо цели числа или лесни за разчитане дроби, идва от "р" стойността. Идва от вероятността да получим нещо по-голямо от тази стойност. Обикновено ще го разглеждаш по обратния начин. Ще се търсиш коя стойност на ХИ-квадрат за 2 степени на свобода има 30% шанс да получи по-голяма стойност от това. После ще погледна 2,41. Но го правя по обратния начин, просто заради това видео. Ако искам да намеря вероятността тази случайна променлива тук да е по-голяма от 2,41 или "р" стойността, можем да я прочетем тук. Тя е 30%. За да визуализираме това на тази диаграма, това ХИ-квадратно разпределение – това беше Q2, синьото – 2,41 ще стои – да видим. Това е 3. Това е 2,5. 2,41 ще е някъде тук. Тази таблица ни дава колко е цялата тази площ под тази синя линия. Това тук ще е 30% от – това ще е 0,3. Или можеш да си го представиш като 30% от цялата площ под тази крива, понеже, очевидно, всички вероятности трябва да дадат сбор от 1. Това е въведението ни в ХИ-квадратното разпределение. В следващото видео ще го използваме, за да направим някои заключения.