If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание

Медиана, средна стойност и изкривяване при криви на плътността

Анализ на високо ниво на криви на плътността. Фокус върху медиана, средна стойност, изкривяване наляво и изкривяване надясно.

Искаш ли да се присъединиш към разговора?

Все още няма публикации.
Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.

Видео транскрипция

В други видеа се запознахме с идеята за крива на плътност на случайна величина, която е обобщение на едно разпределение на данни, и в бъдеще ще разгледаме неща като плътност на вероятността. Но в това видео искам да помислим какво можем да извлечем от тези характеристики, как можем да опишем кривите на плътността и разпределенията, които те представляват. Имаме четири такива ето тук и първото нещо, за което искам да говоря, е дали можем приблизително да изчислим каква стойност ще е средното число или медианата за този набор данни, описан от тези криви на плътността. Просто да ни припомня, ако имаме един набор данни и ги подредим от най-малкото до най-голямото число, медианата ще е средната стойност, точката по средата между средните две стойности. В такъв случай искаме да открием стойността, за която половината от стойностите са над тази стойност, а половината от стойностите са под нея. Когато гледаш една крива на плътността, трябва да гледаш тази площ, която е под кривата а после ще попиташ: "При коя стойност имаме равни площи над и под тази стойност?". За тази крива, просто на пръв поглед, тази стойност ето тук ще е медианата. Като цяло, ако имаш симетрично разпределение като това, медианата ще е точно по тази ос на симетрия. Тук имаме малко по-необичайно разпределение, това би било наречено бимодално разпределение, при което имаш два главни върха ето тук, но е симетрично. Точката на симетрия е ето тук, така че тази стойност, отново, ще е медианата. Друг начин да си представим това е, че площта вляво от тази стойност е равна на площта вдясно на тази стойност, което я прави медиана. Но какво ще стане, ако работим върху несиметрични разпределения? Бихме искали да приложим същия принцип. Искаме да помислим при коя стойност площта отдясно и площта отляво са равни? Отново, това няма да е супер точно, но ще опитам да го направя приблизително. Може да ти се иска да отидеш точно на върха на това издигане ето тук, но ако направя това, пределно ясно е, дори на пръв поглед, че дясната площ, ето тук е по-голяма от лявата площ. Така че това няма да е медианата. Ако преместя медианата малко надясно, може би някъде тук, това изглежда доста по-близо. Отново, изчислявам това приблизително, но можем да кажем, че тази площ тук изглежда доста близо до площта ето тук. Ако това е така, тогава тя ще е медианата. Подобно, при тази тук, може би ето тук и, отново, изчислявам приблизително, но изглежда логично, че тази площ тук е равна на тази, въпреки че тази е по-дълга и по-ниска, а тази част от кривата е много по-висока, въпреки че намалява надясно. Това е медианата за непрекъснати разпределения като това, това ще е стойността, при която площта вляво и площта вдясно са равни. Но какво да кажем за средната стойност? За средната стойност взимаш всяка възможна стойност и ги изчисляваш спрямо честотите им, изчисляваш спрямо честотите и събираш всичко това. При симетричните разпределения средната стойност и медианата ще са еднакви. Това ще бъде също и средната стойност, това ще бъде също и средната стойност. Ако искаш да си представиш това от гледна точка на физиката, средната точка ще е балансиращата точка, точката, при която ще поставиш малка опорна точка и ще балансираш разпределението. Можеш да поставиш малка опорна точка тук и можеш да си представиш, че това нещо ще я балансира. Всичко това е извлечено от тази идея за средно претеглената стойност за всички тези възможни стойности. А какво да кажем за тези по-малко симетрични разпределения? Нека помислим върху това тук. Къде бих поставил опорната точка и какво казва логическото ни мислене за балансирането на това? Имаме равни площи и от двете страни, но когато имаш тази дълга опашка надясно, тя ще издърпа средната стойност надясно от медианата в този случай. Така че балансиращата ни точка вероятно ще е някъде по-близо до това. Отново, просто приблизително изчислявам, но това ще е грубо средната ни стойност. В този случай ще е вдясно от медианата. Нека поясня, медианата се отнася до това, средната стойност се отнася до това. В този случай, понеже имам тази дълга опашка наляво, вероятно ще трябва да балансирам това ето тук. Средната стойност ще е тази стойност ето тук. Всъщност има термин за тези несиметрични разпределения, при които средната стойност се различава от медианата. Разпределения като тези се наричат асиметрични. При това разпределение, когато средната стойност е вдясно от медианата, когато тази дълга опашка е надясно, това се нарича разпределение с дясно изтеглено рамо. Техническата идея за изтеглянето може да стане доста объркана, но като цяло, можеш да го забележиш, когато имаш дълга опашка в една посока, това е посоката на изтеглянето или средната стойност ще е в тази посока, спрямо медианата. Така че средната стойност е отдясно на медианата, така че, като цяло, това ще е разпределение с дясно изтеглено рамо. Противоположно на това, тук средната стойност е отляво на медианата и имаме тази дълга опашка отляво, така че ще опишем това като разпределение с ляво изтеглено рамо.