If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание
Текущ час:0:00Обща продължителност:4:54

Приблизително намиране на съотношенията (частите, на които се дели) в генералната съвкупност

Видео транскрипция

Али отговаря за менюто за вечеря на абитуриентския си бал и иска да използва z-интервал с една извадка, за да прецени каква част от абитуриентите ще изберат вегетарианската опция. Той избира на случаен принцип 30 от 150-те абитуриенти и открива, че седем от анкетираните ще изберат вегетарианското меню. Кои условия за създаване на този доверителен интервал изпълнява извадката на Али? Спри видеото и можеш да избереш повече от един отговор. Сега да го направим заедно. Може би се чудиш какво е z-интервал с една извадка? Представи си, че той ще направи една извадка и после на мазата на нея ще създаде доверителен интервал. Причината да се нарича z-интервал е, начинът на построяване на доверителните интервали - избира се някакъв брой стандартни отклонения над и под истинския параметър, който се опитваме да определим приблизително и това после се използва, за да се направят някакви изводи. Един начин да разсъждаваме за броя стандартни отклонения, наричано z-стойност, е, че z често се използва като променлива за броя стандартни отклонения над или под нещо. Реално той се опитва да построи доверителен интервал, но не забравяй, че за да създадеш доверителен интервал, трябва да се направят някои допускания. Той казва, че има 150 ученици ето тук. Той е решил, че не е практично да анкетира всички 150, за да открие действителния дял от генералната съвкупност. Вместо това той прави извадка от 30 абитуриенти. Значи n е равно на 30. Оттам той изчислява дела от извадката. Изглежда, че седем от тези 30 са избрали вегетарианско меню. И той създава някакъв доверителен интервал. Но не забравяй за условията, за които вече говорихме в предишните видеа. Първото нещо е, че трябва да бъдем уверени, че това е случайна извадка. Това ще бъде условието за случайност и това е изборът в подточка А. Данните са случайна извадка от генералната съвкупност, която ни интересува. Това знаем ли го? Казано е в абзаца тук горе, че той е избрал на случаен принцип 30 абитуриенти. Предполагам, че ще го приемем за чиста монета. Не знаем неговата методология за това, което счита за случайно, но ще приемем написаното за вярно. Значи да, това условие е спазено. Данните са случайна извадка. Ако пишеше, че е анкетирал отбора по футбол, тогава със сигурност нямаше да е случайна извадка. Следващото условие изглежда изцяло математическо, но всъщност е условието за нормалност. И идеята на това условие е, че за да създадем тези доверителни интервали, допускаме, че извадковото разпределение на дела от извадката е приблизително нормално. Т.е. не е изкривено отдясно или отляво ето така. И така, ето тук пише: размерът на извадката, умножен по дела от извадката трябва да е по-голямо или равно на 10. Също така размерът на извадката умножен по едно минус дела от извадката трябва да бъде по-голямо или равно на 10. Погледнато по друг начин, това означава, че успехите в извадката трябва да бъдат повече от или равни на 10 и провалите трябва да бъдат повече от или равни на 10. Е, колко успеха има? Има седем. Можеш да кажеш, ето, размерът n е 30, делът от извадката е 7/30, което ни дава седем. Значи успехите са по-малко от 10, което означава, че сме нарушили условието за нормалност. Да повторим, това е общо правило, но то ни казва, че реалното извадково разпределение може да бъде изкривено. Помни, че това е базирано само на една извадка, или по-точно нашето предположение е. Това е z-интервал с една извадка. Може и да грешим, но нямаме потвърждение, че е изпълнено условието за нормалност, затова ще зачеркна тази подточка. Индивидуалните наблюдения може да се считат за независими. Е, ако той беше избирал случайно хора със заместване, то наистина щяха да бъдат независими. Или ако броят на хората, които е анкетирал, тоест размерът на извадката е по-малък от 10% от цялата генерална съвкупност, то ще може да се считат за независими, дори и всъщност да не са идеално независими. Но тук виждаме, че той е анкетирал 30 души от 150. Значи размерът на извадката е 30 от 150, което е същото като 1/5 от генералната съвкупност, което е същото като 20%. И понеже това е повече от 10% се нарушава условието за независимост. Можеше да удовлетворим условието за независимост, ако той беше правил извадка със заместване, което изглежда не е така, или ако това нещо тук беше по-малко от 10%. Но това не е спазено, значи не можем да сме уверени за това ограничение. И понеже не изпълняваме две от тези три условия за, бих казал, валидни доверителни интервали или доверителни интервали, на които можем да се доверим, така че този анализ на Али не е особено добър.