If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание
Текущ час:0:00Обща продължителност:8:54

Въведение в статистиката: Средна стойност, медиана и мода

Видео транскрипция

Сега ще започнем пътешествие в света на статистиката, което е всъщност начин да се запознаем с данните. И така, статистиката е всичко, свързано с данни. И тъй като започваме пътешествие в света на статистиката, ние ще правим много от така наречената описателна (дескриптивна) статистика. Ако имаме един куп данни и искаме да кажем нещо за всички тези данни, без да предоставяме всичките данни, можем ли по някакъв начин да ги изобразим с по-малък набор от числа? Сега ще се съсредоточим върху това. И щом се екипираме с инструментариума за описателната статистика, след това можем да започнем да правим изводи за тези данни – ще започнем да правим заключения, ще започнем да правим преценки. Тоест ще започнем да работим с изходната (инференциална) статистика – Като имаме предвид всичко това, нека помислим как можем да опишем данните. Нека кажем, че имаме множество от числа. Можем да приемем, че това ще бъдат данните. Може би измерваме височината на растенията в нашата градина. И нека кажем, че имаме 6 растения. И височините им са 4 см, 3 см, 1 см, 6 см и имаме още едно от 1 см, и друго от 7 см. И нека кажем, че някой в другата стая, без да гледа растенията, те попита: "Колко са високи твоите растения?" И този някой иска да чуе едно число. Иска да чуе едно число, което представя всички различни височини на растенията. Какво ще направиш? Може би ще си помислиш, че трябва да намериш нещо, някакво символично число, което някак изобразява средата. Може би най-често срещаното число? Може би числото, което по някакъв начин изобразява центъра на всичките тези числа? И ако си помислиш някое от тези неща, ти всъщност ще правиш същото като хората, измислили описателната статистика. Те са си казали: "Добре, как да направим това?" Да започнем от идеята за средата. В ежедневния език думата "средно" има много специфично значение, както ще видим. Когато казват средно, много хора имат предвид средно аритметично, ще разгледаме това след малко. Но в статистиката средна стойност означава нещо по-общо. Означава "представително число", или "средно число", или... И това са опити да се намери дадена мярка на централната тенденция. Централна тенденция. Още веднъж – имаме множество числа. Опитваме се по някакъв начин да ги изобразим с едно число, което ще наречем средно, което е представително, средно или централно на тези числа. И както ще видим, има много видове средни величини. Първата вероятно я познаваш. Често се казва "средна оценка на изпита" или "среден ръст". И това е средното аритметично. Нека го напиша с... Ще го напиша с жълто, средно аритметично. Съществителното е аритметика. Прилагателното става "аритметично". Средно аритметично. И това е просто сумата от всичките числа, разделена на... Това е дефиниция, дадена от нас, хората, която е полезна. Сумата от всички числа, делена на броя на дадените числа. Знаейки това, колко ще е средното аритметично на този набор от данни? Добре, нека просто да го изчислим. Това ще бъде 4 плюс 3, плюс 1, плюс 6, плюс 1, плюс 7, върху броя на точките с данни, които имаме. И така, ние имаме шест точки с данни. Така че, ще разделим на 6. И получаваме, 4 плюс 3 е 7, плюс 1 е 8, плюс 6 е 14, плюс 1 е 15, плюс 7. 15 плюс 7 е 22. Нека го направя още веднъж. Имаме 7, 8, 14, 15, 22, всичкото това върху 6. Можем да го запишем като смесено число. 6 се съдържа в 22 три пъти с остатък от 4. Така че това е 3 цяло и 4/6, което е същото нещо като 3 цяло и 2/3. Можем да го запишем и като десетично число: 3 цяло и 6 в период. Така че това е също 3,6 в период. Бихме могли да го напишем по всеки един от тези начини. Но това е един вид представително число. То се опитва да ни покаже основната тенденция. Още веднъж, това е измислено от хората. Не е като някой да е намерил религиозни документи, в които да пише: "средната стойност трябва да бъде определена по този начин". Това не е чисто пресмятане, като, да кажем, намирането на обиколката на окръжност, Което наистина е факт, на който сме попаднали при изучаването на вселената. А това тук е дефиниция, измислена от хората, която сме намерили за полезна. Сега, има други начини да измерим средното, да намерим типичната, средната стойност. Другият много типичен начин е медианата. И аз ще напиша медиана. Свършват ми цветовете. Ще напиша медиана в розово. И така, ето я медианата. И медианата е буквално средното число. Ако подредиш всичките числа във възходящ ред, това в средата ще бъде твоята медиана. Та колко ще бъде медианата на дадения ни набор от числа? Нека се опитаме да я намерим. Нека ги подредим. И така, имаме 1. След това имаме друго 1. След това имаме 3. След това имаме 4, 6 и 7. Просто ги пренаредих. И така, кое е средното число? Тъй като имаме четен брой числа, в случая 6 числа, няма едно средно число. В действителност има две средни числа тук. Имаме две средни числа тук. Имаме 3 и 4. И в този случай, когато имаме две средни числа, всъщност ни трябва средата между тези две числа. По същество вземаме средното аритметично тези две числа, за да намерим медианата. Така че медианата ще бъде по средата между 3 и 4, което е 3,5. Така че медианата в този случай е 3,5. И така, ако имаме четен брой числа, медианата е средното аритметично на двете в средата, или половината между двете средни числа... Ако имаме нечетен брой числа, е малко по-лесно да се изчисли. Ще дам друг набор от данни. Даден ни е набор от данни, и ще ти го подредя. Нека кажем, че числата ни са е 0, 7, 50, 10 000 и 1 милион. Нека кажем, че това е наборът от данни. Малко странен набор от данни. Но в тази ситуация колко е медианата? Тук имаме пет числа. Имаме нечетен брой числа. Така че е по-лесно да изберем средата. Средата е числото, което е по-голямо от две от числата и е по-малко от две от числата. То е точно в средата. Така че в този случай медианата е 50. Сега, третата мярка на основната тенденция, която вероятно се използва най-рядко в живота, е модата. Хората често забравят за нея. Звучи като нещо много сложно. Но ще видим, че всъщност е много просто понятие. И в известен смисъл, то е най-простото понятие. Модата е най-повтарящото се число в набора от данни, ако има такова. Ако всички числа са представени поравно и няма нито едно най-повтарящо се число, тогава нямаме мода. Но предвид тази дефиниция за модата, кое е най-повтарящото се число в нашия първоначален набор от данни, в този набор от данни ето тук? Имаме само едно 4. Имаме само едно 3. Но имаме две единици. Имаме едно 6 и едно 7. Така че числото, което се явява най-повтарящо се тук, е 1. Така че модата, най-типичното число, най-повтарящото се число, тук е 1. И така, виждаш, че всичко това са различни начини при опитите ни да получим типична, средна, основна тенденция. Но начините са много различни. И когато учим все повече статистика, ще видим, че те са подходящи за различни неща. Средното аритметично се използва много често. Медианата е подходяща, ако имаш някакво странно число, което би изкривило средното аритметично. Модата може също да бъде полезна в ситуации като тази, особено ако имаме едно число, което се показва много по-често. Както и да е, ще приключим дотук. И в следващите няколко клипа ще изучаваме статистиката дори по-подробно.