If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание

Пример: Анализ на разликата на разпределения

Намиране на вероятността случайно избрана жена да е по-висока от случайно избран мъж чрез анализиране на разпределението на разликата на нормално разпределени величини.

Искаш ли да се присъединиш към разговора?

Все още няма публикации.
Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.

Видео транскрипция

"Да допуснем, че средната стойност на височината на мъжете е 178 сантиметра със стандартно отклонение от 8 сантиметра. Средната стойност на височината на жените е 170 сантиметра със стандартно отклонение от 6 сантиметра. Височината на мъжете и жените е с нормално разпределение. Независимо и случайно избираме един мъж и една жена. Каква е вероятността жената да е по-висока от мъжа?" Окуражавам те да спреш видеото и да помислиш върху това, като ще ти дам насока. Какво ще стане, ако дефинираме случайната променлива М като равна на височината на случайно избран мъж? Височината на случайно избран мъж. Какво ще стане, ако дефинираме случайната променлива W като равна на височината на случайно избрана жена? И ако дефинираме трета случайна променлива, въз основа на първите две? Нека нарека това D, като разлика (difference). Това е равно на разликата във височините на случайно избран мъж и случайно избрана жена. Тоест случайната променлива D е равна на случайната променлива М минус случайната променлива W. Първите две очевидно са нормално разпределени. Това ни го казват тук. "Височините на мъжете и на жените са нормално разпределени." Също така знаем или сме на път да узнаем, че разликата на случайни променливи, които са с нормално разпределение, също е нормално разпределена. Като знаеш това, можеш ли да се сетиш как да се справиш с този въпрос? Вероятността жената да е по-висока от мъжа. Добре, нека го направим заедно. За да ни помогне да визуализираме това, ще начертая кривите на нормалното разпределение за тези три случайни променливи. Първата е за променливата М и тук в средата е средната стойност на М. Знаем, че това ще е равно на 178 сантиметра. Ще приемем, че всичко е в сантиметри. Също знаем, че има стандартно отклонение от 8 сантиметра. Например, ако това е едно стандартно отклонение над, това е едно стандартно отклонение под, тази точка ще е с 8 сантиметра по-нависоко от 178, така че ще е 186. А това ще е 8 сантиметра под това, така че ще е 170 сантиметра. Това е за случайната променлива М. Нека помислим за случайната променлива W. Случайната променлива W... Казват ни, че средната стойност на W е 170. Едно стандартно отклонение над средната стойност ще е 6 сантиметра над средната стойност. Стандартното отклонение е 6 сантиметра, така че едно стандартно отклонение под средната стойност ще е това минус 6. Нека помислим за разликата между двете. Случайната променлива D. Нека помисля върху това. Случайната променлива D. Средната стойност на D ще е равна на разликите в средните стойности на тези случайни променливи. Ще е равна на средната стойност на М минус средната стойност на W. Знаем и двете, така че това ще е 178 минус 170... нека запиша това. Това е равно на 178 сантиметра минус 170 сантиметра. И това ще е равно на – ще го направя в този цвят – това ще е равно на 8 сантиметра. Това тук е 8. А стандартното отклонение? Като приемем, че тези две случайни променливи са независими, а те ни казват, че са независими – независимо и случайно избираме един мъж и една жена. височината на мъжа не влияе върху височината на жената и обратно. Като приемем, че тези двете са независими променливи, ако вземеш сбора или разликата от тези величини, тогава разпиляността, размахът на данните ще се увеличи. Но няма просто да събереш стандартните отклонения. Всъщност дисперсията на разликата ще е сбор на тези две дисперсии. Нека запиша това. Мога да запиша дисперсията с VAR или мога да я запиша като стандартното отклонение на квадрат. Нека го запиша. Стандартното отклонение на D (от разлика), на квадрат, което е дисперсията, ще е равно на дисперсията на променливата ни М плюс дисперсията на променливата ни W. Това може да изглежда противно на логиката. Може би щеше да ти се струва логично, ако това тук беше плюс. Но няма значение дали събираме или изваждаме, това са наистина независими променливи. Тогава, без значение дали събираме или изваждаме, ще събереш дисперсиите. Сега можем да намерим това. Това ще е равно на...стандартното отклонение на променливата М е 8. 8 на квадрат е 64. После имаме 6 на квадрат. Това тук е 6. 6 на квадрат е 36. Ако събереш тези двете, това ще е равно на 100. Дисперсията на това разпределение тук ще е равна на 100. Какво е стандартното отклонение на това разпределение? То ще е равно на корен квадратен от дисперсията. Тоест на корен квадратен от 100, което е равно на 10. Например едно стандартно отклонение над средната стойност ще е 18. Едно стандартно отклонение под средната стойност ще е равно на -2. Сега, като използваме това разпределение, можем да отговорим на въпроса. "Каква е вероятността жената да е по-висока от мъжа?" Можем да перифразираме този въпрос като: "Каква е вероятността случайната променлива D да е... какво трябва да е условието?" Спри видеото и помисли. Ситуацията, при която жената е по-висока от мъжа... ако жената е по-висока от мъжа... тогава това D ще е с отрицателна стойност. Тогава D ще е по-малко от нула. Тогава искаме да намерим вероятността D да е по-малко от нула. Ако кажем, че нула е точно... Ако кажем, че нула в разпределението ни е тук, тоест D е равно на нула, искаме да намерим каква е площта под кривата, която е по-малко от това. Искаме да намерим цялата тази площ. Има два начина да го направим. Можем да намерим Z стойността за D равно на нула и това е доста лесно. Можеш да кажеш, че Z е равно на нула минус нашата средна стойност от 8, делено на стандартното ни отклонение от 10. Това е -8 върху 10, което е равно на минус осем десети. Можеш да погледнеш Z таблицата и да кажеш каква обща площ под кривата под Z е равна на -0,8. Друг начин да направим това е с използването на графичен калкулатор. Имам един TI-84 тук. При него имаш функция за нормално кумулативно разпределение. Ще натисна второто VARS, като то ще ме доведе до разпределение. Имам тези различни функции. Искам функцията за нормално кумулативно разпределение, която е опция 2. После долната граница. Искам да достигна до минус безкрайност. Калкулаторите нямат бутон за минус безкрайност, но можеш да вкараш много, много, много, много отрицателно число, което, за нашите цели, е еквивалент на минус безкрайност. Можем да кажем -1 по 10 на 99 степен. Това правим с второто... тези две главни Е-та ни дават по 10 на, ще кажа 99-та степен. Това е много, много, много отрицателно число. При горната граница искам да изтрия това. Горната граница ще е нула. Намираме площта от минус безкрайност до нула. Средната стойност...вече намерихме това. Средната стойност е осем. После тук е стандартното отклонение, а ние намерихме и него, то е равно на 10. Когато изберем това, се връщаме към главния екран, сега enter. Можехме просто да запишем това директно на главния екран. Това ни казва, че гледаме нормално разпределение и искаме да намерим площта между двете граници. В този случай – от минус безкрайност до нула. От минус безкрайност до нула, като средната стойност е 8, а стандартното отклонение е 10. Натискаме enter и получаваме приблизително 0,212. Приблизително 0,212. "Каква е вероятността жената да е по-висока от мъжа?" Отговорът е 0,212 или приблизително 21,2% шанс за това. Малко по-добър шанс от едно на пет.