If you're seeing this message, it means we're having trouble loading external resources on our website.

Ако си зад уеб филтър, моля, увери се, че домейните *. kastatic.org и *. kasandbox.org са разрешени.

Основно съдържание

Курс: Статистика и вероятности > Раздел 11

Урок 2: Намиране на приблизителна стойност на средно аритметичното за генерална съвкупност

Условия за определяне на валидни t-интервали

Примери как може да се оцени дали са спазени условията за определяне на интервал за приблизително намиране на средно аритметичното.

Искаш ли да се присъединиш към разговора?

Все още няма публикации.
Разбираш ли английски? Натисни тук, за да видиш още дискусии в английския сайт на Кан Академия.

Видео транскрипция

"Флавиа искала да изчисли средната стойност на възрастта на преподавателите в големия ѝ университет. Тя взела SRS" – или единична случайна извадка. "...анкетирани са 20 от приблизително 700 преподаватели и всеки преподавател в извадката казал на Флавиа възрастта си. Данните били изкривени надясно със средна стойност на извадката от 38,75. Тя обмисля да използва данните си, за да направи доверителен интервал и да изчисли средната стойност на възрастта на преподавателите в университета. Кои условия за построяване на доверителен интервал са били изпълнени?" Спри видеото и виж дали можеш да отговориш на това самостоятелно. Нека опитаме да отговорим заедно. Тук има 700 преподаватели. Тя опитва да изчисли средната стойност на възрастта за генералната съвкупност. Тя не може да говори с всички 700, така че прави извадка, единична случайна извадка от 20, така че тук n = 20. От тези 20 тя пресмята средна стойност за извадката от 38,25. Теоретически, тя иска да построи t интервал, доверителен интервал, използвайки t-критерий (критерий на Стюдънт), и този интервал ще изглежда подобно на това. Той ще е средната стойност на извадката плюс или минус критичната стойност по стандартното отклонение на извадката делено на корен квадратен от n. Ще използваме подобен t-критерий и t-таблица, и t-разпределение (разпределение на Стюдент), когато опитваме да създадем доверителни интервали за средни стойности, при които нямаме достъп до стандартното отклонение на извадковото разпределение, но можем да изчислим стандартното отклонение на извадката. За да бъде това вярно, има три условия като тези, които видяхме, когато говорихме за z интервали. Първото е извадката ни да е случайна. Тук ни казват, че е "взела единична случайна извадка от 20" и знаем, че изпълняваме това ограничение, като това всъщност е подточка А – "Данните са случайна извадка от интересуващата ни генерална съвкупност." Така че можем да оградим това. Следващото условие е разпределението да е нормално. Това условие, когато правим t-интервал има малко повече влияние, понеже трябва да приемем, че извадковото разпределение е приблизително нормално. Има два начина да стигнем дотук. Или размерът на извадката ни е по-голям от или равен на 30. Централната гранична теорема ни казва, че тогава извадковото ни разпределение, без значение от разпределението в генералната съвкупност, извадковото разпределение тогава ще е приблизително нормално. Тя не е изпълнила това условие ето тук. Тук размерът на извадката е само 20, така че дотук нещата не изглеждат добре. Това не е единственият начин да изпълним условието за нормалност. Друг начин да изпълним условието за нормалност – ако имаме извадка с размер по-малък от 30, ако първоначалното разпределение на възрастта е нормално – нормално първоначално разпределение – или дори ако е приблизително симетрично около средната стойност – приблизително симетрично – но като погледнем това, казват ни, че има изкривяване надясно. Казват, че "данните са били изкривени надясно със средна стойност на извадката от 38,75." Това ни казва, че наборът данни, които ще получим в извадката си, не е симетричен и не е вероятно първоначалното разпределение да е нормално. Помисли си. Вероятно ще имаш хора, които са... може да имаш преподаватели, които са с 30 години по-възрастни от това, 68 цяло и 3/4, но не е вероятно да имаш преподаватели, които са с 30 години по-млади от това, и това причинява изкривяването надясно. Така че това не изпълнява условието за нормалност. Не можем да сме сигурни, че разпределението на извадката ще е нормално, така че няма да избера това. Подточка С: "Индивидуалните наблюдения могат да бъдат приети за независими." Има два начина да изпълним това условие. Едното е ако направим извадка с връщане. Всеки преподавател, след като го попитаме за възрастта, ще върнем обратно в общото множество и може да го изберем отново, докато не получим извадката си от 20. Изглежда тя не е направила това. Изглежда тя не е направила извадка с връщане, и дори ако правиш извадка без връщане, 10-процентното правило казва, че "Докато това е по-малко или равно на 10% от генералната съвкупност, тогава всичко е наред." И 10-те процента от тази генерална съвкупност е 70; 70 е 10% от 700, така че това определено е по-малко от или равно на 10%, така че това може да се приеме за независимо, тоест можем да изпълним също и това условие. Главният проблем, заради който t-интервалът може да не е толкова добър, е че не сме много сигурни, че разпределението на извадката ще нормално.