If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание
Текущ час:0:00Обща продължителност:7:18

Разпределение на данните по честоти, честотен полигон и хистограма (2)

Видео транскрипция

В това видео ще започнем да сравняваме разпределения. Тук например имаме две разпределения, които показват различните температури в различни градове през месец януари. Това е разпределението за Портланд. Например те имат осем дни между един и четири градуса по Целзий. Имат 12 дни между четири и седем градуса по Целзий и така нататък, а това е разпределението за Минеаполис. Когато правим тези сравнения, ние ще се фокусираме върху центъра на разпределенията, за да сравним това, и после върху разсейването. Понякога хората ще говорят за дисперсията на разпределението. Това са нещата, които ще сравняваме. Ние всъщност ще направим сравнението на око. Няма да опитаме да изберем мярка за централните тенденции – да кажем, медианата – и после да пресметнем точно какви са числата за тези. Може да искаме да ги намерим, ако са близки. Но ако можем да ги преценим на око, това ще е още по-добре. Подобно стоят нещата и за разсейването и дисперсията. И в двата случая, това са множествени измервания в комплекта ни статистически инструменти. Средната стойност, медианата е ценна за центъра. За разсейването/дисперсията, размаха, интерквартилния размах, средната стойност, абсолютното отклонение, стандартното отклонение. Всички тези са мерки. Но понякога можеш да измериш това, просто като го погледнеш. В това първо сравнение, кое разпределение има по-голям център или сравними ли са те? Ако погледнеш разпределението за Портланд, центърът на това разпределение, да кажем, ако трябваше да мислим само за средната стойност, въпреки че мисля, че средната стойност и медианата щяха да са доста близки тук... Изглежда това ще е някъде тук, щеше да е около седем или, може би, малко по-малко от седем. Щеше да е... Щеше да е някъде в този интервал. Може би централната ни тенденция ще е между пет и седем. Това щеше да е или средната ни стойност, или медианата ни, докато за Минеаполис, изглежда, нашият център е много по-близо до, може би, –2 или –3 градуса по Целзий. Тук, въпреки че не знаем точно каква е средната стойност или медианата за всяко от тези разпределения, можем да кажем, че разпределението за Портланд има по-голям център. Има по-висок център. Искаш да измериш или средната стойност, или медианата. А какво ще кажем за разсейването или дисперсията? Ако просто помислиш за размаха, виждаш, че тук няма нищо под един градус по Целзий и нищо над 13. Така че имаш около 13-градусов размах, най-много. Всъщност какво може да допринася за тази първа колонка? Може да има много неща на три градуса или дори 3,9 градуса и, подобно, за тази последна колонка може да допринасят множество неща при 10,1 градуса. Но, най-много, тук имаш 12-градусов интервал, докато тук изглежда имаш – изглежда се доближава до 27-градусов интервал. Въз основа на това, дори ако просто го прецениш на око, тук просто използваме същите скали за хоризонталните ни оси, осите на температурата, и това е много по-широко разпределение, отколкото това, което виждаш тук. Също можеш да кажеш, че разпределението за Минеаполис има повече разсейване или по-голямо разсейване, или повече дисперсия. Тук има по-голямо разсейване. Нека направим друг пример. Ще използваме друго представяне за тези данни тук. Казват ни, че: "На Олимпийските игри много събития имат няколко състезателни кръга. Едно от тези събития е 100 метра плуване по гръб за мъже. Горната точкова диаграма показва времената в секунди на завършилите на осемте първи места в последния кръг на Олимпийските игри през 2012." Това зеленото тук е финалният кръг. "Долната диаграма показва времената на същите осем плувци, но в полуфиналния кръг." Кое от тези дадени разпределения има по-голям център? Отново, тук можеш всъщност да... малко по-лесно е да прецениш на око каква може да е медианата. За средната стойност вероятно ще трябва да направя малко повече изчисления. Но, да кажем, медианата... Да видим. Има една, две, три, четири, пет, шест, седем, осем точки информация. Медианата ще стои между долните четири и горните четири. Централната тенденция ето тук е за финалния кръг и изглежда е около 57,1 секунди, докато, особено ако мислим за медианата, докато централната тенденция за полуфиналния кръг – да видим. Една, две, три, четири, пет, шест, седем, осем. Изглежда е някъде тук. Това е около 57, повече от 57,3 секунди. Изглежда полуфиналният кръг има по-голяма централна тенденция, което е малко нелогично. Ще очакваш финалистите да са средно по-бързи, отколкото полуфиналистите, но данните не ни показват това. Полуфиналният кръг има по-голям център. По-голям център. И просто прецених медианата на око. Подозирам, че средната стойност също ще е по-голяма в това второ разпределение. А какво да кажем за дисперсията? Отново, ако просто погледнеш интервала, и двете са на същата скала. Ако просто визуално погледнеш дисперсията, размахът за финалния кръг е по-голям от размаха за полуфиналния кръг. Ще кажеш, че финалният кръг има по-голяма дисперсия. Дисперсия. Има по-голям размах. Преценяваме го на око и изглежда има по-голямо разсейване и, разбира се, има моменти, при които едното разпределение може да има по-голям размах, но може да има по-малко стандартно отклонение. Например можеш да имаш данни, които са две точки информация, които са много отдалечени, но после всички тези други данни стоят много, много близо едни до други. Например такова разпределение... Ще нарисувам тук хоризонталната ос, просто, за да можеш да си представиш това като разпределение. Такова разпределение може да има по-голям размах, но по-малко стандартно отклонение, отколкото такова разпределение. Нека просто... Рисувам много приблизителен пример. Такова разпределение има по-малък размах, но може да има по-голямо стандартно отклонение. Може да има по-голямо стандартно отклонение, отколкото това над него. Всъщност мога да направя това още по-добре. Такова разпределение ще има по-голям размах, но също ще има и по-голямо стандартно отклонение. Не можеш просто да гледаш... Не винаги, когато просто погледнеш едно от тези измервания, размаха на стандартното отклонение, ще знаеш със сигурност, но в такива случаи е безопасно да кажеш, когато го гледаш, че изглежда това зеленото, данните за финалния кръг изглежда имат по-голям размах, по-голяма дисперсия, така че съм сигурен в това. Това е сравнение на много високо ниво.
Кан Академия – на български благодарение на сдружение "Образование без раници".