If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание
Текущ час:0:00Обща продължителност:7:39

Видео транскрипция

В това видео и в следващите няколко видеа ще направим няколко изчисления за този набор данни тук. И се надявам, че като преминем през тези изчисления, това ще ти покаже логиката на дисперсионния анализ . Първото нещо, което искам да направя в това видео, е да изчисля общия сбор на квадратите. Ще наричам това вариация (SST). Вариация – общ сбор на квадратите (SST). Можеш да гледаш на това като на числителя, когато изчисляваш дисперсията. Ще вземеш разстоянието между всяка от тези точки информация и средната стойност на всички тези точки информация, ще ги повдигнеш на квадрат и ще вземеш този сбор. Няма да делим на степента на свобода, което обикновено бихме направили, ако изчислявахме дисперсията на извадката. Колко ще е това? Първо трябва да намерим средната стойност на всички тези неща. Ще наричам това обща средна стойност. И след малко ще ти покажа, че това е същото нещо като средната стойност на средните стойности на всеки от тези набори данни. Нека изчислим голямата средна стойност. Тя ще е 3 + 2 + 1 + 5 + 3 + 4 + + 5 + 6 + 7. Имаме 9 точки информация, така че ще делим на 9. На колко ще е равно това? 3 + 2 + 1 е 6. 6 плюс... нека събера. Това са 6. 5 + 3 + 4 е 12. И накрая 5 + 6 + 7 е 18. 6 плюс 12 е 18; плюс 18 е 36; делено на 9 е равно на 4. Нека ти покажа, че това е точно същото нещо като средната стойност на средните стойности на групите. Средната стойност на група 1 – нека направя това в същия зелен цвят – средната стойност на група 1 тук е 3 + 2 + 1. Това е 6, делено на 3 точки информац ия – това ще е равно на 2. Средната стойност на група 2...сборът тук е 12. Видяхме това ето тук. 5 + 3 + 4 е 12, делено на 3, е 4 – понеже имаме 3 точки информация. Средната стойност на група 3 – 5 + 6 + 7 е 18, делено на 3, е 6. Ако вземеш средната стойност на средните стойности на групите, което е друг начин да гледаш на тази обща средна стойност, ще имаш 2 + 4 + 6, което е 12, делено на трите средни стойности. И отново получаваш 4. Можеш да гледаш на това като средната стойност на всички точки информация във всички групи или като средната стойност на средните стойности на всяка от тези групи. Но както и да си го представиш, сега, когато го изчислихме, можем да открием общия сбор на квадратите. Нека направим това. Това ще е равно на (3 минус 4) – четворката е това четири тук – на квадрат, плюс (2 минус 4) на квадрат, плюс (1 минус 4) на квадрат. Сега ще включа тези, които са в лилаво. Плюс (5 минус 4) на квадрат, плюс (3 минус 4) на квадрат, плюс (4 минус 4) на квадрат. Нека скролна малко надолу. Сега имаме само три останали, плюс (5 минус 4) на квадрат, плюс (6 минус 4) на квадрат, плюс (7 минус 4) на квадрат. Колко ни дава това? Тук горе това ще е равно на 3 минус 4. Разликата е 1. Повдигаш на квадрат. Всъщност е -1, но повдигаш на квадрат и получаваш 1, плюс – -2 на квадрат е 4 – плюс -3 на квадрат. -3 на квадрат е 9. После тук в цикламено имаме 5 минус 4, което е 1, на квадрат пак е 1. (3 минус 4) на квадрат е 1. Повдигаш на квадрат и отново е 1. После 4 минус 4 е просто 0. Просто ще напишем 0 тук, за да ти покажа, че пресметнахме това. После имаме тези последни три точки информация. (5 минус 4) на квадрат. Това е 1. (6 минус 4) на квадрат. Това е 4. Това е 2 на квадрат. След това плюс...7 минус 4 е 3, на квадрат, е 9. На колко ще е равно това? Имам 1 + 4 + 9. Това е 5 + 9. Това тук е 14. 5 плюс... Да, 14. После имаме още веднъж 14 ето тук, понеже имаме 1 + 4 + 9. Тоест това тук също е 14. После тук имаме 2. Това ще е 28 – 14 по 2; 14 плюс 14 е 28 – плюс 2 е 30. Това е равно на 30. Общият сбор на квадратите (вариацията) – ако искахме дисперсията, щяхме да разделим това на степените на свобода. Много пъти учихме за степените на свобода, така че, да кажем, че имаме – знаем, че имаме m групи тук. Нека запиша това като m и... Няма да доказвам стриктно това тук, но искам да ти покажа откъде идват някои от тези странни формули, които се появяват в книгите по статистика, без да го доказвам подробно. По-скоро, за да ти покажа логиката. Тук имаме m групи. Всяка група има n членове. Колко общо члена имаме? Имаме m по n или 9. 3 по 3 общо членове. Степените ни на свобода – и, помни – колкото точки информация имаш, толкова минус 1 степени на свобода имаш. Понеже ако приемеш, че знаеш средната стойност на средните стойности, тогава само 9 минус 1, само 8 от тези ще ти дадат нова информация. Понеже ако знаеш това, можеш да пресметнеш последното. Или дори не трябва да е последното. Ако имаш другите осем, можеш да пресметнеш това. Ако имаш осем от тях, винаги можеш да пресметнеш деветото, като използваш средната стойност на средните стойности. Един начин да мислиш за това е, че има само 8 независими измервания тук. Или ако искаме да говорим принципно , има m по n – това ни дава общия брой извадки – минус 1 степени на свобода. Ако изчислявахме дисперсията тук, просто щяхме да разделим 30 на m по n минус 1 или това е друг начин да кажем 8 степени на свобода за този пример. Ще вземем 30 делено на 8 и ще имаме дисперсията за цялата група – за групата от 9, когато ги комбинираш. Ще приключим тук с това видео. В следващото видео ще опитаме да намерим колко от тази обща вариация – колко от този общ сбор на квадратите, идва от вариацията във всяка от тези групи, в сравнение с вариацията между групите. Мисля, че разбра откъде идва целият този дисперсионен анализ. Това е в смисъл, че има вариация за цялата тази извадка от девет елемента, но част от тази вариация, ако тези групи са различни по някакъв начин. може да дойде от факта, че са в различни групи (междугрупова вариация), вместо от вариацията вътре в самите групи (вътрешногрупова вариация). Ще пресметнем тези две неща и ще видим, че те ще имат сбор, равен на общата вариация, на общия сбор на квадратите.