If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание
Текущ час:0:00Обща продължителност:8:21

Определяне на отдалечените стойности в множество от данни

Начини за представяне на статистически данни (2)

Видео транскрипция

Тук имаме списък от 15 числа и искам да помислим кои са отдалечените стойности. За да си помогнем, нека визуализираме разпределението на числата. Нека направим това. Тук, на числовата ос, имаме всички числа от едно до 19. Да видим, имаме две единици. Мога да кажа, че това е едната единица, а това е втората единица. Имаме една шестица. Нека сложим тази шестица тук. Имаме 13... или имаме два пъти числото 13. Ще дойдем ето тук, едното 13 и второто 13. Да видим, имаме три пъти 14. 14, 14 и 14. Имаме два пъти 15. 15, 15. Имаме 16 веднъж. Това е нашето число 16. Имаме три пъти 18. Едно, две, три. Едно, две и после три. После имаме веднъж 19. После имаме 19. Когато погледнеш визуалната дистрибуция на числата, изглежда сякаш сърцевината на разпределението, така да кажем, е в тази област ето тук. Някои хора може да кажат: "Имаме три отдалечени стойности. Това са двете единици и шестицата." Някои хора може да кажат: "Шестицата е достатъчно близо. Може би само двете единици са отдалечени стойности." И двете становища са разумни. Сега, за да дойдем на една и съща вълна, статистиците понякога използват едно правило. Казваме, че всичко, което е повече от един и половина пъти интерквартилния обхват от под Q1 или над Q3, това ще са отдалечените стойности. За какво говоря? Всъщност, нека определим медианата, Q1 и Q3 тук. После можем да определим интерквартилния размах. И можем да определим кои са отдалечените стойности според определението. Ако всичко това е имало смисъл за теб до тук, окуражавам те да поставиш видеото на пауза и да опиташ самостоятелно да го решиш или сега ще го направя вместо теб. Каква е медианата тук? Медианата е средното число. Имаме 15 числа, така че средното число ще е това число, което има по седем други от всяка страна. Това ще е осмото число. Едно, две, три, четири, пет, шест, седем. Правилно ли е това? Да, шест, седем, така че това е медианата. После имаш едно, две, три, четири, пет, шест, седем числа и от дясната страна. Това е медианата, понякога наричана Q2. Това е нашата медиана. Кое е Q1? Q1 ще е средното число в тази първа група. Първата група има седем числа. Средното от тях ще е четвъртото число. Има три и три, три отляво и три отдясно. Това е Q1. После, Q3 ще е средата на тази горна група. Тя също има седем числа. Средното от тях ще е ето тук. Има по три други от всяка страна. Това е Q3. Какъв ще е интерквартилният размах? Интерквартилният размах ще е равен на Q3 минус Q1, разликата между 18 и 13. Между 18 и 13, това ще е 18 минус 13, което е равно на пет. За да намерим отдалечените стойности, те ще са всичко под това. Отдалечените стойности ще са по-малки от Q1 минус 1,5 пъти интерквартилния размах. Отново, това не е някакво вселенско правило. Това е нещо, за което статистиците са казали: "Ако искаме да имаме по-добро определение за отдалечените стойности, нека се съгласим, че това е нещо, което е повече от един и половина пъти интерквартилния размах под Q1. Или отдалечените стойности може да са по-големи от Q3 плюс един и половина пъти интерквартилния размах. Отново, това просто хората са сметнали за подходящо. Някой може да спори, че трябва да е 1,6. Или някой може да каже, че трябва да е едно, две или нещо такова. Но с това хората са съгласни. Нека помислим какви са тези числа. Вече знаем Q1. Това ще е 13 минус 1,5 пъти интерквартилния размах. Нашият интерквартилен размах тук е пет. Тоест, 1,5 пъти по пет, което е 7,5. Това е 7,5. Колко е 13 минус 7,5? 13 минус седем е шест, а после изваждаш още 0,5 и това е 5,5. Така, имаме отдалечените стойности. Отдалечените стойности ще са по-малко от 5,5. Или, Q3 е 18, това е, отново, 7,5. 18 плюс 7,5 е 25,5. Или отдалечени са и стойностите, по-големи от 25,5. Въз основа на това имаме един вид цифрово определение за отдалечените стойности. Не казваме просто субективно: "Това изглежда добре или това изглежда добре." Въз основа на това имаме само две отдалечени стойности, като само тези двете са по-малки от 5,5. Само тези две единици са по-малки от 5,5. Това е границата, ето тук. Това е точката. Нямаме отдалечени стойности от високата страна. Друго нещо, за което да се замислим, е създаването на диаграма тип "кутия с мустаци", базирана на Q1, медианата ни, размаха ни, целия диапазон числа. Можеш да го направиш или като вземеш предвид отдалечените стойности, или без да взимаш предвид отдалечените стойности. Има два начина, по които можем да го направим. Нека изчистя всичко това. Вече намерихме всичко това. Нека го изчистя. Нека нарисуваме диаграма тип "кутия с мустаци". Ще сложа още една, нека направя две тук. Това е една и нека поставя още една тук долу. Това е още една. Сега, ако нарисуваме класическа диаграма тип "кутия с мустаци" тук, бихме казали, че медианата ни е на 14. Ще го направя и по двата начина. Медианата ни е на 14. Медианата е на 14. Q1 е на 13. Q1 е на 13 и Q1 е на 13. Q3 е на 18. Q3 e на 18. Q3 е 18. Това е частта с кутията. Нека го нарисувам като истинска кутия. Ето го най-добрия ми опит. Това е кутията. Това също е кутия. Правя същото нещо. Ако не искаме да вземем предвид отдалечените стойности, бихме се запитали какъв е целият размах тук. Имаме неща, които са от едно чак до 19. Един начин да направим това е да започнем от едно. Това е целият ни размах, нека го нарисувам малко по-добре от това. Преминаваме цялото това разстояние, цялото разстояние от едно до 19. При това включваме всичко. Включваме дори тези две отдалечени стойности. Но ако не искаме да включим тези отдалечени стойности, искаме да поясним, че те са отдалечени стойности, нека не ги включваме. Вместо това можем да включим тези, които не са отдалечени стойности, като ще започнем от шест, понеже казахме, че шест е в набора ни данни, то те не е отдалечена стойност. Нека направим това да изглежда по-добре. Ние ще започнем от шест и ще продължим до 19. После, за да кажем, че имаме тези отдалечени стойности, ще поставим това, тук имаме отдалечени стойности. Отново, това е диаграма тип "кутия с мустаци" за същия набор данни, без отдалечените стойности. При това тук поясняваме къде точно са отдалечените стойности.
Кан Академия – на български благодарение на сдружение "Образование без раници".