If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание
Текущ час:0:00Обща продължителност:6:05

Разпределение на данните по честоти, честотен полигон и хистограма (2)

Видео транскрипция

В други видеа се запознахме с идеята за крива на плътността на случайната величина, която е обобщение на едно разпределение на данни, и в бъдеще ще разгледаме неща като вероятностна плътност. Но в това видео искам да помислим какво можем да извлечем от тези характеристики, как можем да опишем кривите на плътността и разпределенията, които те представляват. Имаме четири такива ето тук и първото нещо, за което искам да говоря, е дали можем приблизително да изчислим каква стойност ще е средното число или медианата за този набор данни, описан от тези криви на плътността. Просто да ни припомня, ако имаме един набор данни и ги подредим от най-малкото до най-голямото число, медианата ще е средната стойност, точката по средата между средните две стойности. В такъв случай искаме да открием стойността, за която половината от стойностите са над тази стойност, а половината от стойностите са под. Когато гледаш една крива на плътността, трябва да гледаш тази област, а после ще попиташ: "При коя стойност имаме равни области над и под тази стойност?". За тази крива, просто на пръв поглед, тази стойност ето тук ще е медианата. Като цяло, ако имаш симетрично разпределение като това, медианата ще е точно по тази ос на симетрия. Тук имаме малко по-необичайно разпределение, това би било наречено бимодално разпределение, при което имаш два главни върха ето тук, но е симетрично. Точката на симетрия е ето тук, така че тази стойност, отново, ще е медианата. Друг начин да си представим това е, че областта вляво от тази стойност е равна на областта вдясно на тази стойност, което я прави медиана. Но какво ще стане, ако работим върху несиметрични разпределения? Бихме искали да приложим същия принцип. Искаме да помислим при коя стойност областта отдясно и областта отляво са равни? Отново, това няма да е супер точно, но ще опитам да го направя приблизително. Може да ти се иска да отидеш точно на върха на това издигане ето тук, но ако направя това, пределно ясно е, дори на пръв поглед, че дясната област ето тук е по-голяма от лявата област. Така че това няма да е медианата. Ако преместя медианата малко надясно, може би някъде тук, това изглежда доста по-близо. Отново, изчислявам това приблизително, но можем да кажем, че тази област тук изглежда доста близо до областта ето тук. Ако това е така, тогава тя ще е медианата. Подобно, при тази тук, може би ето тук и, отново, изчислявам приблизително, но изглежда логично, че тази област тук е равна на тази, въпреки че тази е по-дълга и по-ниска, а тази част от кривата е много по-висока, въпреки че намалява надясно. Това е медианата за непрекъснати разпределения като това, това ще е стойността, при която областта вляво и областта вдясно са равни. Но какво да кажем за средната стойност? За средната стойност взимаш всяка възможна стойност и ги изчисляваш спрямо честотите им, изчисляваш спрямо честотите и събираш всичко това. При симетричните разпределения средната стойност и медианата ще са еднакви. Това ще бъде също и средната стойност, това ще бъде също и средната стойност. Ако искаш да си представиш това от гледна точка на физиката, средната точка ще е балансиращата точка, точката, при която ще поставиш малка опорна точка и ще балансираш разпределението. Можеш да поставиш малка опорна точка тук и можеш да си представиш, че това нещо ще я балансира. Всичко това е извлечено от тази идея за средно претеглената стойност за всички тези възможни стойности. А какво да кажем за тези по-малко симетрични разпределения? Нека помислим върху това тук. Къде бих поставил опорната точка и какво казва логическото ни мислене за балансирането на това? Имаме равни области и от двете страни, но когато имаш тази дълга опашка надясно, тя ще издърпа средната стойност надясно от медианата в този случай. Така че балансиращата ни точка вероятно ще е някъде по-близо до това. Отново, просто приблизително изчислявам, но това ще е грубо средната ни стойност. В този случай ще е вдясно от медианата. Нека поясня, медианата се отнася до това, средната стойност се отнася до това. В този случай, понеже имам тази дълга опашка наляво, вероятно ще трябва да балансирам това ето тук. Средната стойност ще е тази стойност ето тук. Всъщност има термин за тези несиметрични разпределения, при които средната стойност се различава от медианата. Разпределения като тези се наричат асиметрични. При това разпределение, когато средната стойност е вдясно от медианата, когато тази дълга опашка е надясно, това се нарича разпределение с дясно изтеглено рамо. Техническата идея за изтеглянето може да стане доста объркана, но като цяло, можеш да го забележиш, когато имаш дълга опашка в една посока, това е посоката на изтеглянето или средната стойност ще е в тази посока, спрямо медианата. Така че средната стойност е отдясно на медианата, така че, като цяло, това ще е разпределение с дясно изтеглено рамо. Противоположно на това, тук средната стойност е отляво на медианата и имаме тази дълга опашка отляво, така че ще опишем това като разпределение с ляво изтеглено рамо.
Кан Академия – на български благодарение на сдружение "Образование без раници".