If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание
Текущ час:0:00Обща продължителност:7:18

Как параметрите се променят при изместване и мащабиране на данните

Видео транскрипция

Имам малко данни тук в електронната таблица – можеш да използваш Майкрософт Ексел или можеш да използваш Електронната таблица на Гугъл – и ще използваме електронната таблица, за да пресметнем набързо някои параметри. Да кажем, че това е една генерална съвкупност. Да кажем, че разглеждаме генерална съвкупност от ученици и искаме да пресметнем някои параметри и това е тяхната възраст, и искаме да пресметнем някои параметри относно това. Първо ще ги пресметна с електронната таблица, а после ще помислим върху това как тези параметри се променят, като правим някакви неща с данните. Ако променим данните чрез събиране или изваждане, или ако умножим всички точки по някаква стойност, какво ще отрази това върху параметрите? Първият параметър, който ще пресметна, е средната стойност. После ще пресметна стандартното отклонение. После ще пресметна медианата, а после искам да пресметна, да кажем, интерквартилния размах. Ще го наричам IQR (ИКР). Нека направим това. Първо да погледнем мерките за централните тенденции. Функцията за средната стойност на повечето електронни таблици е "average" (средна стойност), а после мога да използвам мишката си и да избера всички тези или да натисна Shift с бутона и да избера всички тези данни. Добре, това е средната стойност на тези данни. Нека сега помислим какво се случва, ако взема всички тези данни и добавя фиксирана стойност към тях. Ако взема всички тези данни и добавя пет към тях. Лесен начин да направим това в електронна таблица е като изберем това, добавим пет и после мога да скролна надолу. Забележи, за всяка точка информация, която имах преди, сега имам пет повече от нея. Това е новият ми набор данни или, както го наричам, Data+5 (данни+5). Нека видим каква е средната стойност на това. Средната стойност на това, забележи, е точно с пет повече и същото щеше да е вярно, ако добавех или извадех което и да е число. Средната стойност щеше да се промени със стойността, която добавя или извадя. Това не трябва да те изненадва, понеже когато пресмяташ средната стойност, събираш всички числа и после делиш на броя числа, които имаш. Ако всички числа са увеличени с пет, тогава ще добавиш пет. Колко числа имаме в този случай? Едно, две, три, четири, пет, шест, седем, осем, девет, 10, 11, 12. Ще добавиш 12 петици и после ще разделиш на 12, така че има смисъл, че средната стойност става с пет повече. Нека помислим как се променя средната стойност, ако умножаваш. Какво ще се случи, ако вземеш данните и ги умножиш по пет? Това е равно на това по пет. Всички тези точки сега са пет пъти по-големи. Какво се случва със средната стойност? Забележи, че средната стойност сега е пет пъти по-голяма. Така че мярката за централната тенденция, ако добавя или извадя от данните, ще добавя или извадя това количество от средната стойност и, ако умножа с пет данните, или ако разделя с пет данните, средната стойност ще се увеличи или намали толкова пъти и, ако гледаш в числа как пресмяташ средната стойност, това математически ще има смисъл. Нека погледнем другата типично мярка на централна тенденция и това е медианата. Да видим дали тя има същите свойства. Нека пресметнем медианата тук. Отново подреждаш тези числа и просто намираш средното число. Което не е много трудно, но компютърът може да го направи ужасно бързо. Това е медианата за този набор данни. Каква мислиш ще е медианата, ако вземеш всички тези данни плюс пет? Е, средното число, ако подредиш всички тези числа и ги направиш с пет повече, можеш да си представиш, че е в същия ред, но сега стойността в средата ще е с пет повече. Това трябва да е 10,5 и, да, то е 10,5. А какво ще се случи, ако умножиш всичко по пет? Отново, пак ще имаш същия ред. Просто това трябва да се умножи по пет. Средното число сега ще е пет пъти по-голямо. И при двете от тези мерки на централна тенденция, ако промениш всички елементи, или ако ги мащабираш ще получиш подобна промяна или мащабиране на тези мерки за централната тенденция. Нека помислим за мерките за разсейването. Да видим дали това е така и при тези мерки за разсейването. Стандартно отклонение, Функция "STDEV" (стандартно отклонение). Ще намеря стандартното отклонение на генералната съвкупност. Нека това е цялата генерална съвкупност. Нека анализирам това. Нека се уверя, че правя... Стандартното отклонение на всичко това е 2,99. Нека видим какво се случва, когато променя всичко с пет. Всъщност, спри видеото. Какво мислиш, че ще се случи? Това е измерване на разпределението. Ще ти кажа какво мисля. Ако променя всичко със същата стойност, средната стойност се променя, но разстоянието от средната стойност не трябва да се промени. Стандартното отклонение не трябва да се промени в този пример и наистина не се променя. Нека променим набора данни. В този случай го увеличаваме с пет, или ако го направим с едно по-малко, мярката за разсейването, в този случай стандартното отклонение, не се променя, стандартното отклонение не се променя, но ако го мащабираме, мисля, че трябва да се промени, понеже можеш да си представиш много малък набор данни, при които нещата, които са били на определено разстояние от средната стойност, сега ще са пет пъти по-далеч от средната стойност. Мисля, че трябва да умножим по пет тук и изглежда познах. Умножавам това по пет. Мащабирането на набора данни ще мащабира стандартното отклонение по същия начин. А интерквартилния размах? При който всъщност взимаме третия квартил и изваждаме от него първия квартил, за да намерим какъв е размахът на средните 50% от данните. Нека направим това. Имаме функция "quartile" (квартил). Поглеждаме данните си и искаме третия квартил. Това ще изчисли третия квартил. Минус функцията "quartile", същия набор данни. Сега искаме да го изберем отново. Същият набор данни, но това ще е първият квартил. Това ще ни даде интерквартилния размах. Това пресмята третия квартил в този набор данни, а това пресмята първия квартил в този набор данни. И получаваме 2,75. Нека помислим дали интерквартилният размах трябва да се промени. Не мисля, че ще го направи. Понеже, помни, всичко се променя и дори първият квартил да е с пет повече, третият квартил също ще е с пет повече. Разликата не трябва да се промени. И това е вярно, виж, разстоянието не се променя или разликата не се променя. Но, подобно, ако умножим с дадено число всичко, ако умножим първия квартил и третия квартил с пет, тяхната разлика трябва да се умножи с пет и виждаме това ето тук. Важното нещо да запомниш тук. Просто използвах пример с променяне с пет повече и умножаване на всичко с пет, но можеш да извадиш което и да е число и можеш да разделиш на което и да е число. Типичните мерки за централната тенденция, средна стойност и медиана, ще се увеличат или нараснат, когато променяш данните, но типичните мерки за разсейването, стандартното отклонение и интерквартилен размах, няма да се променят, ако добавиш или извадиш от данните, но ще се променят, ако умножиш или разделиш данните.