If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание

Сравняване на съотношенията (частите, на които се дели) в генералната съвкупност 2

Сал използва отново примера от политическите избори за да прави сравнения между дялове от генералната съвкупност. Създадено от Сал Кан.

Искаш ли да се присъединиш към разговора?

Все още няма публикации.
Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.

Видео транскрипция

В края на миналия клип се опитвахме да намерим дали има значителна разлика между частта от мъжете, които гласуват за даден кандидат, и частта от жените. Анкетирахме 1000 мъже, 1000 жени, и получихме частите от извадката за всяка от тези групи. Получихме 0,642 за мъжете и 0,591 за жените. Но целта ни е да намерим 95%-ен доверителен интервал. Само на база нашата извадка получихме – нека го напиша тук – получихме частта от извадката за мъжете минус – тук ще използвам неутрален цвят. Получихме частта от извадката за мъжете минус частта от извадката за жените, т.е. 0,642 минус 0,591, което дава 0,051. Само извадих това от това. И това, което търсим при един доверителен интервал, е да бъдем уверени... Винаги ще твърдя това, защото няма да имаме свръхточност. Искаме да сме уверени, че има 95% вероятност това тук – спомни си, че когато взехме двете части от извадките и разликата им, това е нещо подобно на взимане на образец от извадковото разпределение на статистиката. И търсим 95% вероятност действителната средна стойност или истинската стойност на това Р1 минус Р2 да е в рамките на даден интервал, да кажем в рамките на d, под d имаме предвид разстояние, действителната разлика, която получихме от извадките. В рамките на d =0,051. Записвам това много пъти, но винаги го записвам по този начин. Аз не просто ти давам формулата, която обикновено виждаме в учебниците. Лесно е да се запомни, ако имаш добра памет, но по този начин всъщност виждаме какъв е смисълът на този доверителен интервал. Ако имаме 95%-на вероятност Р1 минус Р2, действителните, истинските части, разликата от действителните части е в рамките на d от разликата между частите от извадките, това твърдение тук означава същото: че има 95%-на вероятност 0,051 да е в рамките на d от този реален параметър Р1 минус Р2, който е равен на средната стойност. И трябва да намерим някакво разстояние около тази средна стойност, където ако вземем един произволен образец от това, ако това е произволен образец от разпределението, имаме 95%-на вероятност да сме в рамките на d от тази средна стойност, защото ако е в рамките на d от средната стойност, тогава също има 95%-на вероятност средната стойност да е в рамките на d от образеца, и от там ще получим доверителния интервал. Доверителният интервал ще е тази стойност плюс d и тази стойност минус d. А тези елементи какви са? Какво е разстоянието d? В едно нормализирано разпределение... имам една Z-таблица тук... можем да допуснем, че всичко е нормално, особено извадковите разпределения, защото нашето n е толкова голямо, както и нашата част не е близо до 0 или до 1. Хубаво е и е близо до средата и затова не ни интересуват всички тези странни случаи в близост до краищата. Казваме, добре, къде се съдържа центъра на 95%? На колко стандартни отклонения в дадено нормално разпределение се отдалечаваме от средната стойност, за да се съдържат 95% от вероятността? Z-таблиците, с които сме работили много пъти, представят едно кумулативно разпределение. Търсим тази Z-величина тук. Ако тя съдържа 95%, тук ще имаме 2,5%, и тук ще имаме 2,5%. Т.е. от гледна точка на Z-таблицата, таблицата ни дава сумарната вероятност до тази Z-стойност. И това, което търсим, всъщност е 97,5%. Търсим нещо, което съдържа всичко до тук. 97,5% Ако вземем Z-стойността, след което я приложим на двете страни, тогава ще разполагаме с нещо, което съдържа 95%. Така че нека погледнем към 97,5. 97,5 е там, а това е 1,96 стандартни отклонения. Т.е. имаме 1,96 за нормализирано стандартно отклонение, или Z-резултат 1,96. И ако погледнем това нормално разпределение тук, разстоянието, което ни интересува, ще е равно на 1,96, умножено по стандартното отклонение на това разпределение, т.е. ще е равно на 1,96 умножено по цялата тази стойност. 1,96 пъти по стандартното отклонение на това разпределение. И остана само да пресметнем това и да го умножим по 1,96. Но се появи проблем. Не знаем реалните параметри Р1 и Р2. Не знаем реалните параметри на генералната съвкупност. Не знаем Р1 и Р2. Това е част от задачата. Опитваме се да разберем дали има някаква съществена разлика между Р1 и Р2. Но това сме го виждали много пъти. Щом размерът на извадката е голям, можем да изчислим приблизително Р1 и Р2 чрез частите в извадките. И можем да променим това ще използвам различен цвят... можем да променим това и да използваме частите от извадките. Знаем какви са тези стойности. И всъщност това n тук беше 1000. Нека да намерим това. Взимаме пак калкулатора. Тук сметката ще е голяма. Имаме квадратен корен, след което в кръгли скоби, частта от извадката за мъжете е 0,642, след което ще умножим това по 1 минус 0,642, затваряме кръглите скоби. Това делим на 1000. Събираме това, плюс – прилагаме същото нещо за жените. Частта от извадката е 0,591 по 1 минус 0,591. А това е този множител тук, разделен на 1000. Още веднъж, трябва да се убедим, че пресметнатото в кръглите скоби е вярно. След това затваряме скобите, тези оригинални кръгли скоби, защото търсим корен квадратен от всичко това. И получаваме 0,021, или може би ще кажем 0,022. И тази стойност тук е приблизително равна на 0,022. И така, връщаме се на нашия въпрос или на това разстояние, което ни интересува, тази стойност ще бъде приблизително, най-добрата ни оценка, т.е. 0,022. Умножаваме това. 0,022 умножено по 1,96 дава 0,043. Закръгляме го. Така че това тук е равно на 0,043. И получихме нашия доверителен интервал. Знаем че съществува 95%-на вероятност истинската разлика на между дяловете да е в рамките на 0,043 от действителната разлика в дяловете в извадките, които получихме. Или ако реално искаме да получим един интервал, вземаме тази стойност минус 0,043. Нека го направим. Така, имаме 0,051 минус 0,043, което дава 0,008. И ако го прибавим, имаме 0,051 плюс 0,043, получаваме 0,094. Така че 95%-ният доверителен интервал за дела на мъжете и дела на жените, които ще гласуват за кандидата, 95%-ният доверителен интервал за Р1 – Р2 е от 0,008 до 0,094. Имам го тук на калкулатора. И сме готови. Наистина изглежда, че сме уверени в това, че има 95% вероятност мъжете да са по-склонни да гласуват за кандидата, отколкото са жените.