If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание

Качествено тълкуване на нормални разпределения

Обсъждане на това колко "нормално" може да бъде едно разпределение. Създадено от Сал Кан.

Искаш ли да се присъединиш към разговора?

Все още няма публикации.
Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.

Видео транскрипция

Никога не можеш да прекалиш с упражненията с нормалното разпределение, защото то наистина е един от онези супер важни крайъгълни камъни за останалата част от статистиката и наистина за голяма част от живота ти. Взех няколко задачи с извадки. Това е взето от ck12.org Open Source flex book, и техния учебник AP Statistics flex book. Като съм взел задачите от главата за нормално разпределение. Можеш да посетиш сайта им и в действителност да видиш същите тези задачи. Първата задача е: Кое от следните множества с данни е най-вероятно да бъде с нормално разпределение? За другите отговори обясни защо смяташ, че няма да имат нормално разпределение. Това е отговор а. Тук влизат в сила моите вярвания. Това е необичайно за математическия контекст. По-скоро е, какво си мисля? Това е някакъв вид въпрос за съчинение. Нека видим какво имаме тук. Отговор а – педята... измерена от върха на палеца до върха на разпънатото кутре. Мисля, че говорят за това... нека видим мога ли да нарисувам ръка. Това е показалецът. След това имаме средния пръст. След това безименния. И накрая имаме кутрето. Като ръката ще изглежда по подобен начин. Мисля, че става въпрос за това разстояние. От върха на палеца до върха на разпънатия пети пръст, което е просто модерен начин да наречем кутрето. Става въпрос за това разстояние ето там. Като е казано, че ако трябваше да го измерим на случайна извадка от гимназиални второкурсници, как щеше да изглежда това? Знаеш от какво зависи това. То е комбинация от гени и фактори от външната среда, може би зависи от това колко мляко си пил или колко си висял на кутрето си, докато си растял. Така че бих сметнал, че това е сбор от огромен брой случайни процеси. Така че бих предположил, че това има горе-долу нормално разпределение. Ако погледна моята собствена ръка, като не мисля, че е пораснала много, откакто бях втори курс в гимназията. Тя изглежда грубо около 9 инча или нещо такова. Свиря на китара. Може би това ми е помогнало да разпъна ръката си. Но това наистина е въпрос за съчинение, така че просто трябва да кажа това, което смятам. Бих предположил, че разпределението ще изглежда по подобен начин. Не знам. Никога не съм правил това. Но може би има средно аритметична стойност 8 или 9 инча и е разпределено по следния начин. Разпределено е по следния начин. Може би вероятно ще изглежда като нормално разпределение. Но вероятно няма да е идеално, всъщност мога да ти гарантирам, че няма да бъде идеално нормално разпределение. Защото никой не може да има отрицателна дължина на педята. Това разстояние никога не може да е отрицателно. Така че ще имаме, предполагам може да нямаш ръка, така че това ще бъде счетено като 0. Но разпределението няма да има отрицателно дефиниционно множество. Така че няма да бъде идеално нормално разпределение от лявата страна. То всъщност ще свърши тук при 0. И дори от дясната страна там има някои физически невъзможни дължини на ръката. Никой не може да има ръка, която е по-голяма от височината на атмосферата или на някоя астрономична единица. Тогава щеше да можеш да докоснеш Слънцето. Има някоя точка, която е физически невъзможно да достигнеш. Като при едно истинско нормално разпределение, ако трябваше да хвърля множество монети, има някаква много, много малка вероятност да се падне милион пъти ези подред. Тя е почти 0. Но има някаква вероятност. Но в този случай с педята на човек няма начин тук вероятността човек, който е второкурсник от гимназията, да има дължина на педята една миля, това е 0. Така че това няма да бъде идеално нормално разпределение на отдалечените точки или когато се отдалечаваме все повече от средно аритметичната стойност. Но мисля, че това ще е много добре в нашия всекидневен живот, толкова добре, че ще направим закръгляне. Нормалното разпределение ще бъде доста добро приблизително изчисление на разпределението, което виждаме. Предполагам нещото, което със сигурност знаеш – това е забавно. Това са второкурсници от гимназията, когато го начертах, това беше един вид моята гледна точка като момче. Като мога да поспоря, че момчетата второкурсници от гимназията вероятно имат по-големи ръце от момичетата. Така че е възможно да имаш всъщност бимодално разпределение. Така че вместо да имаме това, е възможно разпределението да изглежда по този начин. Да имаш един връх за момчетата, може би 8 инча. И след това може би връх за момичетата при 7 инча. И тогава разпределението ще бъде по следния начин. Така че е възможно също това да бъде бимодално. Но като цяло едно нормално разпределение ще бъде доста добро приближение за част (а) от тази задача. Нека видим какво се иска от нас да опишем в част (b). Годишните заплати на всички работници в една голяма фирма за доставки. Ако говорим за годишни заплати, имаме минимална заплата, така че можеш да предположиш, че всяка корпорация, ако говорим поне за работници на пълен работен ден, ще има някаква минимална заплата, която дава на хората. Бих казал, че вероятно повечето хора ще получават тази минимална заплата, защото вероятно това ще бъдат най-заетите позиции, вероятно ще имаш повече хора тук долу в края на скалата. И след това имаш различни средни нива на мениджъри и подобни позиции. След това вероятно ще имаш тази дупка. И след това вероятно ще имаш истинските изпълнителни директори, може би главния изпълнителен директор. Ако тази средна стойност тук е може би 40 000 долара на година, а това е вероятно 80 000 долара, където се намират някои от мениджърите от средното ниво. Но това тук ще бъде вероятно... Всъщност ако трябваше да го начертая реално, начинът, по който го разграфявам сега, това ще бъде около 200 000 долара, което е всъщност една приемлива заплата за главен изпълнителен директор. Но реалността е, че това всъщност може да излезе от там. Може да изглежда по този начин. Може да бъде извън графиката. Нека кажем, че главния изпълнителен директор взема 5 милиона долара годишно, защото изпълнява много задачи или нещо такова. Тогава той ще се намира някъде тук. И може би това са главният изпълнителен директор и няколко от другите служители, главният директор на учредителите. Предположението ми е, че това определено няма да бъде нормално разпределение. И то ще бъде бимодално. Ще имаш връх ето тук за средния мениджмънт. Ако се намираме може би в Европа, това щеше да бъде по-близо наляво. Но няма да бъде идеално нормално разпределение. И няма да имаш никакви стойности под определен праг, под това ниво на минималната заплата. Така че ще нарека това, когато имаш опашка, която отива по-надясно отколкото наляво, дясно изтеглено разпределение. Тъй като то има две гърбици тук, едната тук и другата там, можем също да кажем, че е бимодално. Искам да кажа, че зависи от това какъв вид компания е това. Но по мои предположения това ще бъдат заплатите на много голяма компания за доставки. Нека разгледаме подточка (с) или частта от задачата с буква "с". Годишните заплати на произволна извадка от 50 главни изпълнителни директори на големи компании, 25 жени и 25 мъже. Всъщност след като са го написали така, мисля че може би загатват, че мъжете и жените, че разликата между половете не е напълно премахната, и има някакво различие. Ако бяха само 50 изпълнителни директори на големи компании, щях да кажа, че вероятно това е близо до нормално разпределение. Вероятно ще имаме нещо подобно, отново ще имаме някакво ниво отдолу, на което никой изпълнителен директор няма да иска да работи, въпреки че си чувал за случаи, при които те работят безвъзмездно. Но всъщност на тях им се плаща по други начини. Ако включиш всички тези неща, вероятно ще има някаква основна заплата, която всички изпълнителни директори ще вземат. И след това тя ще отива нагоре до някаква стойност, най-високата вероятна стойност. И след това вероятно ще има дълга опашка надясно. И това е, ако няма разлика между половете. Ще имаме ясно дясно изтеглено разпределение, при което имаш дълга опашка надясно. Ако приемем, че има някаква разлика между заплащането при половете, тогава може да имаш две гърбици тук, което ще бъде бимодално разпределение. Така че ако приемем, че има някаква разлика при половете, тази част (с) от въпроса тук, тогава ще има една издутина за жените. И ако приемем, че жените изкарват по-малко от мъжете, тогава ще имаме друга издутина за мъжете. И има по 25 от всеки пол, така че няма непременно да има повече мъже от жени. И тогава графиката ще бъде изтеглена до края надясно. Всъщност мисля, че вероятно може да има шанс да имаш други длъжности, когато имаш супер изпълнителни директори или мега изпълнителни директори, които взимат милиони, докато повечето изпълнителни директори вероятно просто изкарват, ще го поставя в кавички, "няколко стотин хиляди долара", докато има малка група, която е на голямо разстояние от масовото стандартно разпределение надясно. Така че това тук може дори да е тримодално разпределение. Това беше точка (с). До сега точка (а) изглеждаше като най-добрия кандидат за чисто или най-близо до нормално разпределение. Нека видим сега точка (d). Датата на 100 пенита, взети от касата на местния магазин. 100 пенита. Това всъщност е интересен експеримент. Но бих предположил, като отново това е наистина въпрос, при който трябва да изразя усещанията ми за тези неща. Стига отговорите ти да са логични, бих казал, че това е вярно. Повечето пенита са по-нови, защото са пуснати в обръщение. Те биват извадени от обръщение, извадени от употреба, когато са стари. Губят се или се смачкват от малка част туристи в тези малки машинки за сувенири. Дори не знам дали това е законно, дали можеш да правиш това законно с парите. Предполагам, че ако ги нанесеш на графика, ще получиш тонове пенита, които са в рамките на последните няколко години, така че датата на 100 пенита, а не тяхната възраст, ако е 2010 година, бих предположил, че няма да намериш никакви пенита от 2010 година. Но вероятно ще откриеш много от 2009 година. И вероятно слизаш надолу от там. Разбира се, няма да намериш пенита които са по-стари от Съединените щати или преди да започнат да ги емитират. Така че очевидно тази опашка няма да отива наляво завинаги. Но предположението ми е, че ще имаш ляво изтеглено разпределение. ляво изтеглено разпределение. Където имаш по-голяма част от разпределението вдясно, но опашката отива наляво. Ето защо това се нарича ляво изтеглено разпределение. Понякога го наричат отрицателно изтеглено разпределение. Подобно, това дясно изтеглено разпределение понякога се нарича положително изтеглено. Ако имаш само една гърбица. Няма да имаш мултимодално разпределение като това, при ляво изтеглено разпределение средната стойност ще бъде наляво от медианата. Така че в този случай може би медианата ще се намира някъде тук. Но тъй като имаш тази дълга опашка наляво, средната стойност може да бъде някъде тук. И както обикновено при това разпределение медианата, стойността в средата, може да се намира някъде тук. Но защото това е дясно изтеглено и по-голямата част има само един голям връх, този връх няма да промени твърде много нещата, защото е малък, средната стойност ще бъде надясно от него. Така че това е друга причина, поради която се нарича дясно изтеглено или положително изтеглено разпределение. Да отговорим на въпроса, като знаеш, че това е моето виждане върху нещата. Но бих казал – при другите отговори трябва да обясниш защо смяташ, че те няма да следват... Или е казано, кое от следните множества от данни е най-вероятно да е с нормално разпределение. Аз бих избрал отговор (а). Но това наистина е въпрос на мнение, поне при този въпрос.